200 likes | 404 Views
Approfondimenti sulla Regressione semplice e multipla in forma matriciale. Matrici standardizzate Matrici di correlazione Sommatorie dei quadrati in Z R quadro in Z R quadro tra variabili indipendenti Errore standard dei beta in Z. Matrici standardizzate.
E N D
Approfondimenti sulla Regressione semplice e multipla in forma matriciale • Matrici standardizzate • Matrici di correlazione • Sommatorie dei quadrati in Z • R quadro in Z • R quadro tra variabili indipendenti • Errore standard dei beta in Z
Matrici standardizzate La matrice X e la matrice y possono essere convertite in un punteggio standardizzato dividendo la deviazione di ciascun elemento dalla media per l’appropriata deviazione standard.
Matrici standardizzate Nel nostro esempio avremo:
Matrici standardizzate Con variabili standardizzate non è necessario inserire nella matrice Z la componente unitaria 1 poiché il parametro b0 è uguale a 0.
Matrici standardizzate I coefficienti b standardizzati possono essere ottenuti a partire da quelli non standardizzati impiegando la formula: L’equazione della retta di regressione diventa:
Matrici standardizzate Nel nostro esempio avremo:
Matrici standardizzate Utilizzare matrici standardizzate permette di porre il parametro b0=0. Infatti, se le variabili sono standardizzate il valore di intercetta per Y è 0, poiché tutte le medie sono uguali a 0; Inoltre, essendo la correlazione tra due qualsiasi variabili standardizzate è: con i,j compresi tra 1 e k.
Matrice di correlazione Se moltiplichiamo la matrice (Z’Z) per lo scalare [1/(n-1)] otteniamo la matrice di correlazione R tra le variabili indipendenti
Matrice di correlazione Nel nostro esempio avremo:
Correlazione Y con singoli predittori Allo stesso modo se la variabile Y è anch’essa standardizzatae moltiplichiamo il prodotto Z’Yzper lo scalare [1/(n-1)] otteniamo la matrice di correlazione ryidella variabile Y con i suoi predittori Xi.
Correlazione Y con singoli predittori La soluzione del sistema di equazioni normali della retta porta alla seguente uguaglianza: I valori stimati potranno essere ottenuti impiegando l’equazione:
Sommatorie dei quadrati Poiché con le variabili standardizzate abbiamo che: Partendo dalle formule generali è possibile avere le seguenti formule semplificate:
Calcolo di R2y.123 Avendo scomposto la varianza nella componente dovuta alla regressione e nella componente dovuta ai residui, è immediato calcolare:
Correlazione multipla tra le Xi.yz Se in generale la correlazione multipla al quadrato di una variabile indipendente Xicon le altre è: essa, in presenza di variabili standardizzate, diviene: dove l’elemento aii appartiene alla diagonale della matrice R-1.
Correlazione multipla tra le Xi.yz Ad esempio la correlazione multipla al quadrato tra la prima variabile X1 e le altre due può essere calcolata nel seguente modo: Volendo adesso calcolare gli altri due coefficienti si dovrà procedere nel modo seguente:
Errore standard dei bz L’errore standard dei parametri standardizzati è ottenibile dalla formula generale:
Errore standard dei bz Si hanno ora a disposizione tutti gli elementi per testare la diversità dei singoli predittori da 0, ottenendo i medesimi risultati ottenuti con le variabili non standardizzate.