350 likes | 547 Views
RELAZIONI TRA 2 FENOMENI QUANTITATIVI. STATISTICA A – K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it. RELAZIONI TRA 2 FENOMENI QUANTITATIVI. Vi è una relazione tra le variabili oggetto di studio? Di quanto variano i valori d’una variabile quando cambiano i valori dell’altra?
E N D
RELAZIONI TRA 2 FENOMENI QUANTITATIVI STATISTICA A – K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it
RELAZIONI TRA 2 FENOMENI QUANTITATIVI • Vi è una relazione tra le variabili oggetto di studio? • Di quanto variano i valori d’una variabile quando cambiano i valori dell’altra? • CORRELAZIONE • REGRESSIONE
X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0
E (30 6,2) G (14 2,3) DIAGRAMMA DI DISPERSIONE (SCATTER) M(Y) = 3,0 M(X) = 16
DIAGRAMMA DI DISPERSIONE (SCATTER) • I quadranti in cui compare la maggioranza dei punti indicano il tipo di relazione • Punti in I e III relazione diretta • Punti in II e IV relazione inversa • Punti si distribuiscono casualmente in tutti i quadranti all’incirca nella stessa proporzione nessuna relazione lineare tra le due variabili • L’osservazione della “nuvola” di punti nel diagramma di dispersione fornisce una prima idea sulla relazione eventualmente esistente tra i due fenomeni.
X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0
COVARIANZA • = MEDIA ARITMETICA DEI PRODOTTI DEGLI SCOSTAMENTI • COV(X,Y) >0 RELAZIONE DIRETTA • COV(X,Y) <0 RELAZIONE INVERSA • COV(X,Y) =0 X, Y INCORRELATE
X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0 COV(X,Y)=66,6/7=9,514
Osservazione: per ottenere la covarianza è sufficiente calcolare solo gli scostamenti di una variabile, moltiplicandoli per i valori dell'altra variabile (p. 153)
X = NUMERO DI DIPENDENTIY = FATTURATO (in milioni di euro) M(X) = 16 M(Y) = 3,0 COV(X,Y)=66,6/7=9,514
Osservazione: può essere ottenuta anche in funzione dei dati originari (p.154) M(X) = 16 M(Y) = 3,0 COV(X,Y) = 402,6/7-16*3=9,514
Proprietà della covarianza • E’ ESPRESSA NEL PRODOTTO DELLE UNITA’ DI MISURA DI X E DI Y • COV(X,X)=VAR(X) • E’ scale equivariant
Proprietà della covarianza • max | COV (X, Y) | = = [VAR(X) VAR(Y)]1/2= = σ(X) σ(Y)
Dimostrazione • var(tX-Y)>0 • t2 var(X) -2t cov(X,Y) + var(Y) >0 • h(t) è una funzione quadratica in t. Se h(t)>0 le radici non sono reali • Δ<0 implica che • 4 [cov(X,Y)]2 -4 var(X) var(Y) <0 • [cov(X,Y)]2 < var(X) var(Y) • |cov(X,Y)| < σ(X) σ(Y)
Come ovviare ai difetti della COV? • La covarianza ha il difetto di risentire dell'unità di misura e dell'ordine di grandezza dei due fenomeni originari essendo espressa in termini del prodotto delle unità di misura di X e Y • I valori che essa può assumere non sono compresi in un intervallo di interpretazione immediata,
RICHIAMO SCOSTAMENTI STANDARDIZZATI(p. 125) • Proprietà: • Mz = 0 • z = 1 • puri numeri confronto tra fenomeni diversi
COEFFICIENTE DI CORRELAZIONE rxy • (media dei prodotti degli scostamenti standardizzati è un numero puro)
rxy=6,73/7 =0,961
Interpretazione di r • rxy = -1 perfetta relazione lineare inversa tra X ed Y (cioè quando yi = a + bxi, con b < 0 e a numero qualsiasi) • rxy = 0 X ed Y sono incorrelate (non vi è tra loro un legame lineare; non si esclude però l’eventuale esistenza d’una relazione non lineare, ad esempio parabolica o sinusoidale) rxy = +1 perfetta relazione lineare diretta tra X ed Y (cioè quando yi = a + bxi, con b > 0 e a numero qualsiasi)
Esemplificazione di dati con diverso valore del coefficiente di correlazione lineare
|rxy |= 1 se e solo c’è perfetta relazione lineare tra X ed Y • Se Y = a+|b| X
Esempio: 7 supermercati COV(X,Y) = 66,6/7=9,514 VAR(X) = 336/7 = 48 VAR(Y) = 14,28/7 =2,04
Esempio: 7 supermercati (continua) COV(X,Y) = 66,6/7=9,514 VAR(X) = 336/7 = 48 VAR(Y) = 14,28/7=2,04
Caratteristiche di r • Dato che rxy = ryx, il coefficiente di correlazione è una misura simmetrica in X ed Y interdipendenza tra le due variabili. • In esso non si assume una variabile come antecedente e l’altra come conseguente, ma si valuta semplicemente il legame vicendevole tra X ed Y.
Proprietàdirxy(p. 160) • è invariante in senso forte (cioè presenta lo stesso valore numerico) per trasformazioni lineari crescenti di una o di entrambe le variabili
Proprietà di rxy • Proprietà di invarianza per trasformazioni lineari: il coefficiente di correlazione lineare rimane invariato effettuando una trasformazione lineare crescente di una o di entrambe le variabili. • se si cambia l’origine del sistema di misurazione e/o l’unità di misura in cui sono espresse le variabili, il valore del coefficiente di correlazione non varia.
Applicazione della precedente proprietà • Si ottiene il medesimo valore di rxy anche effettuando il calcolo sui n.i. a base fissa
Esemplificazione di dati con diverso valore del coefficiente di correlazione lineare, in presenza di dati contaminati indicati con il simbolo * (p. 162)
Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo consumo: latte fresco e biscotti. • (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione? M(x)= 132.5 M(y)=119.2
CORRELAZIONE FRA DUE S.S. • Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount • Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile