Coordinate parallele

Classificazione di un insieme di auto con grafico a coordinate parallele.

Le coordinate parallele sono un sistema comunemente utilizzato per visualizzare spazi n-dimensionali e analizzare dati multivariati. Per mostrare un insieme di punti in uno spazio a n dimensioni, vengono disegnate n linee parallele, solitamente verticali e poste a uguale distanza l'una dall'altra. Un punto nello spazio n-dimensionale è rappresentato come una linea spezzata con i vertici sugli assi paralleli. La posizione del vertice sull'i-esimo asse corrisponde all'i-esima coordinata del punto.

Storia

Le coordinate parallele furono inventate da Maurice d'Ocagne nel 1885 [1] e successivamente riscoperte e diffuse da Al Inselberg [2] nel 1959. Successivamente vennero sistematicamente sviluppate e utilizzate come sistema di coordinate a partire dal 1977. Alcune importanti applicazioni sono, ad esempio, negli algoritmi di Collision Avoidance per il traffico aereo, nel Data Mining e più recentemente in sistemi di Intrusion Detection. È importante ricordare come molte di queste applicazioni delle coordinate parallele e il loro successo sono dovute all'articolo "Hyperdimensional Data Analysis Using Parallel Coordinates"[3].

Considerazioni Statistiche

Nei casi in cui le coordinate parallele siano usate per la visualizzazione di dati statistici, particolare importanza va posta a tre fattori: l'ordine degli assi, la loro rotazione e la scala utilizzata.

L'ordine degli assi è fondamentale per identificare le caratteristiche principali dei dati, e solitamente, nell'analisi dei dati, vengono provate più soluzioni prima di raggiungere un risultato ottimale. Alcuni autori hanno descritto delle euristiche per l'ordinamento degli assi, in grado di svolgere questo compito [4].

La necessità di ridimensionare gli assi nasce dal fatto che il grafico è basato sull'interpolazione (combinazione lineare) di coppie consecutive di variabili[5]. Perciò le variabili devono essere in una scala comune ed esistono molti approcci diversi per trovare la rappresentazione ideale, che sono considerati come parte del processo di preparazione dei dati e possono rivelare diverse visualizzazioni informative.

Generalizzazione delle Coordinate Parallele

Una generalizzazione delle Coordinate Parallele (GPCP) è stata proposta da (Moustafa e Wegman 2002) [6]. Seguendo questo approccio, i dati vengono trasformati prima di essere rappresentati sul grafico. Se la funzione di interpolazione è una Lagrangiana definita per casi, si ottiene un grafico a Coordinate Parallele tradizionale, altrimenti, se vengono usate delle splines come funzione di interpolazione si ottiene lo smooth parallel coordinates plot (SPCP). In questo grafico ogni osservazione è rappresentata come una curva parametrica, continua e ortogonale ad ogni asse parallelo[5].

Note

  1. ^ d'Ocagne, Maurice, Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles, Paris: Gauthier-Villars, 1885.
  2. ^ Alfred Inselberg, The Plane with Parallel Coordinates, in Visual Computer, vol. 1, n. 4, 1985, pp. 69–91, DOI:10.1007/BF01898350.
  3. ^ Wegman, 1990
  4. ^ Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets, pp. 3-4
  5. ^ a b . R. Moustafa e E. Wegman, Multivariate continuous data - Parallel Coordinates, in A. Unwin, M. Theus e H. Hofmann (a cura di), Graphics of Large Datasets: Visualizing a Million, Springer, 2006, pp. 143–156.
  6. ^ R. Moustafa e E. Wegman, On Some Generalization to Parallel Coordinate Plot, in Seeing a million, A Data Visualization Workshop, Rain am Lech, 2002.

Collegamenti esterni

  • Alfred Inselberg's Homepage, with Visual Tutorial, History, Selected Publications and Applications
  • Parallel Coordinates: Visual Multidimensional Geometry and Its Applications[collegamento interrotto] by Alfred Inselberg, Springer, 2009.
  • An Investigation of Methods for Visualising Highly Multivariate Datasets by C.Brunsdon, A.S.Fotheringham & M.E.Charlton, University of Newcastle, Regno Unito
  • Parallel coordinates plot in GGobi, su ggobi.org. URL consultato il 26 gennaio 2011 (archiviato dall'url originale il 24 dicembre 2013).
  • Using Curves to Enhance Parallel Coordinate Visualisations by Martin Graham & Jessie Kennedy, Napier University, Edimburgo, Regno Unito
  • On Some Generalization of Parallel Coordinate Plots by Rida E. Moustafa and Edward J. Wegman (2002), George Mason University, Fairfax, VA
  • picviz — the graphviz of parallel coordinates Archiviato il 10 febbraio 2011 in Internet Archive. disponibile sotto GNU GPL v3 - implementato in C, con Python binding usati per la GUI.
  • Clustergram: A graph for visualizing cluster analyses based on the Parallel Coordinates of each observations cluster mean over the number of potential clusters (implemented in R).
  • XDAT - a free GPL JAVA-based software for plotting parallel coordinate.