990 likes | 1.14k Views
RELAZIONI TRA 2 FENOMENI QUANTITATIVI. Es : 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo consumo: latte fresco e biscotti.
E N D
Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo consumo: latte fresco e biscotti. • (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione? M(x)= 132.5 M(y)=119.2
Diagramma di dispersione in termini di scostamenti dalla media
Analisi del diagramma di dispersione • Il punto C è un valore anomalo bivariato • Se cancelliamo il punto C ci attendiamo che il valore di rxy aumenti • rxy senza il punto C è uguale a 0.963
CORRELAZIONE FRA DUE S.S. • Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount • Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile
CORRELAZIONE FRA DUE S.S. • Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount • Calcolare e rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile Correlazione spuria relazione tra i livelli
Numero di discount (Y) Numero di extracomunitari iscritti al collocamento (X) Esempio di correlazione spuria
Numero di discount (Y) Numero di extracomunitari iscritti al collocamento (X) Esempio di correlazione spuria • Correlazione tra le variazioni annue?
Numero di extracomunitari iscritti al collocamento (X) Numero di discount (Y) Esempio di correlazione spuria • Correlazione tra le variazioni annue?
NI base mobile X (numero di extracomunitari) e Y (numero di discount rxy(tra n. i. a base mobile) =-0,000496/(0,0217*0,1758)½ = -0,008
Scatter sugli scostamenti NI base mobile o var. percentuali II I III IV
Osservazioni finali • Non esiste relazione lineare tra le variazioni annue di X e Y • Si ottiene rxy = -0,008 anche effettuando il calcolo sulle variazioni % rispetto all’anno precedente (proprietà di invarianza per trasformazioni lineari crescenti)
Cenni alle analisi multivariate • p fenomeni quantitativi • Possiamo calcolare il coefficiente di correlazione lineare e/o la covarianza per ogni coppia di fenomeni
MATRICE DI COVARIANZA (p.169) • p variabili: X1, X2, X3,…, Xs, …, Xp
ESEMPIO MATRICE DI COVARIANZA • X = età • Y = anzianità di servizio • Z = stipendio mensile (in euro)
Es. X=tasso di indebitamento delle famiglie, inpercentuale, (X) e del fabbisogno di energia elettrica, in migliaia di megawatt, (Y) in Italia nel periodo 1998– 2002
LA REGRESSIONE LINEARE • Esiste una relazione (lineare) tra X e Y? • In caso affermativo: • Come varia una variabile (dipendente) in funzione dell’altra (esplicativa)? • Per convenzione: Y = variabile dipendente X = variabile esplicativa
Esempi • Relazione tra comportamenti di acquisto e caratteristiche dei consumatori • Relazione tra numero di esami sostenuti nei primi due anni di corso e voto alla maturità • Relazione tra prezzo di vendita e quantità venduta di un bene
Motivi che spingono ad adottare modelli di regressione lineare • Semplicità facilità di interpretazione dei parametri • yi = a + bxi + eii = 1, …, n dove: • a + bxi rappresenta una retta: • a = ordinata all’origine intercetta • b = coeff. angolare coeff. di regressione • ei è un termine di errore (accidentale)
Motivi che spingono ad adottare modelli di regressione lineare • Effettiva linearità molte relazioni sono molto vicine alla linearità • Trasformazioni la relazione è lineare dopo aver trasformato opportunamente la dipendente e/o l’esplicativa • Es. y = a bx • log y = log a + (log b) x • y’ = a’ + b’ x
Motivi che spingono ad adottare modelli di regressione lineare • Limitatezza dell’intervallo
Motivi che spingono ad adottare modelli di regressione lineare • Ragioni di teoria statistica: lo studio delle funzioni lineari nei parametri ha una trattazione più agevole
Diagramma di dispersione • Come variano le vendite in funzione del numero di dipendenti?
MODELLO DI REGRESSIONE • yi = a + bxi + eii = 1, …, n dove: • a + bxi rappresenta una retta: • a = ordinata all’origine intercetta • b = coeff. angolare coeff. di regressione • ei è un termine di errore (accidentale)
= valore teorico (valore stimato) di yi funzione lineare di i = 1, …, n Residui RETTA DI REGRESSIONE • i = 1, …, n
Come si calcolano i parametri a e b? • METODO DEI MINIMI QUADRATI Le incognite sono i parametri della retta
Come si calcolano i parametri a e b? • METODO DEI MINIMI QUADRATI
Come si calcolano i parametri a e b? • METODO DEI MINIMI QUADRATI
Come si calcolano i parametri a e b? • METODO DEI MINIMI QUADRATI
Sistema di equazioni normali 2 equazioni e 2 incognite (a e b)
Interpretazione dei parametriESEMPIO (7 supermercati) • a = –0,17 fatturato teorico quando N. di dipendenti = 0 • b = 0,198 incremento medio nel fatturato quando il numero di dipendenti aumenta di 1 unità
Interpretazione di b • b= indica l’entità della variazione teorica della variabile dipendente in corrispondenza di un incremento unitario della variabile esplicativa
Interpretazione di b • a+bx • a+b(x+1) • Qual è la differenza tra i due precedenti valori teorici(prima e dopo l’incremento unitario)? • a+b(x+1)-(a+bx)=b
Sistema di equazioni normali Analizziamo le implicazioni dei due precedenti vincoli
Proprietà delle stime dei minimi quadrati • Proprietà 1: • Proprietà 2 • La retta di regressione passa sempre per il punto di coordinate