Diagramma di dispersione

diagramma dispersioneIl diagramma di dispersione (scatter diagram) è utilizzato per studiare e identificare la possibile relazione tra due variabili.

Viene anche utilizzato come strumento per convalidare la relazione tra cause ed effetti nell’analisi di un problema.

Si tratta quindi di un grafico in cui i valori di due variabili sono riportati su due assi cartesiani e l’aggregazione dei punti risultanti indica il livello di correlazione o meno tra tali variabili.

Analoga valutazione può essere fatta portando in conto anche il tempo di ciascuna rilevazione.

In tal senso, il diagramma di dispersione è anche utilizzato nell’ambito delle strategie di gestione della qualità di prodotto o processo e nella fase di analisi della metodologia Six Sigma. Oppure nelle analisi di marketing e nella costruzione di scenari previsionali.

In generale, l’utilizzo dello strumento risulta determinante in tutte quelle situazioni in cui occorre verificare alcune ipotesi che mettono in relazione alcune variabili oggetto di investigazione per individuare la presenza di legami.

Particolarmente interessante è la capacità di far emergere l’effetto di relazioni non lineari tra variabili.

Come disegnare un grafico di dispersione

Occorre procedere attraverso le seguenti fasi:

  1. Raccolta dati. Vengono effettuate più misurazioni contemporanee a campione delle due variabili prescelte.
  2. Definizione variabile indipendente/dipendente. La variabile dipendente viene di solito tracciata sull’asse Y o verticale. La variabile indipendente viene tracciata sull’asse X orizzontale.
  3. Costruzione del grafico. Consiste appunto nel mostrare i punti che rappresentano le coppie di valori corrispondenti a ciascuna misurazione.
  4. Interpretazione del grafico. Possono esistere diversi di correlazione tra le due variabili. Ad esempio, Forte, Moderata, Debole o Nessuna Relazione. Questo ultimo caso indica che la variabile indipendente non influisce sulla variabile dipendente. Inoltre, quando è presente una correlazione, questa può essere positiva se i valori delle variabili crescono insieme e il grafico è quindi ascendente oppure negativa se questi diminuiscono insieme e il grafico è quindi discendente. L’andamento rilevato può essere lineare o non lineare.

Vantaggi e limiti del diagramma di dispersione

Il principale vantaggio è la semplicità di costruzione e lettura del grafico.

Inoltre, nel caso in cui vogliamo vedere quanto i due set di dati sono correlati, può essere disegnata come riferimento una linea d’identità (identity line) come una linea x=y oppure una linea 1:1. Più i data set corrispondono, più i punti tendono a concentrarsi a ridosso della linea d’identità.

Un limite del diagramma di dispersione può essere costituito dal fatto che consente di esaminare solo due variabili per volta sul piano bidimensionale. Si può comunque aggiungere un terso asse z per tracciare una terza variabile in modo tridimensionale.

Il grafico comunque non mostra la relazione quantitativa tra variabili.