1 / 21

Cap. 13 Regressione

Cap. 13 Regressione. Modelli teorici. Modello statistico. Un modello statistico è una formula che interpreta e sintetizza matematicamente il comportamento congiunto di X e Y .

sidone
Download Presentation

Cap. 13 Regressione

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Cap. 13 Regressione

  2. Modelli teorici Modello statistico • Un modello statistico è una formula che interpreta e sintetizza matematicamente il comportamento congiunto di X e Y. • In particolare è una FUNZIONE matematica semplice, liscia e regolare in grado di ben approssimare la realtà osservata cioè di cogliere l’andamento di fondo (in inglese trend) del comportamento congiunto di X e Y, smussando le irregolarità e le spigolosità tipiche dell’osservazione empirica • Costruire un modello statistico significa utilizzare i dati (quelli della tabella osservata) per individuare questa formula che esprime Y in funzione di X. 2) Scegliere il modello 1) Valutare la realtà empirica e le informazioni a priori • Ragioni teoriche • Osservazione empirica X : reddito Y: consumo 3) Stimare (o adattare) il modello 4) Misurare la bontà dell’adattamento Quello che “passa” più vicino alle osservazioni empiriche

  3. Modello statistico Parametri del modello Variabile indipendente (esplicativa) Variabile dipendente (risposta) Funzione o modello di regressione Se si è sicuri che X sia causa di Y il modello rappresenta la “forma” matematica della relazione (legge) di causa-effetto Da scegliere in modo che l’adattamento sia “ottimale” Stima dei parametri

  4. Osservazione: medie condizionate e modello di regressione Spezzata di regressione Costante che rende minima la perdita di informazione all’interno del gruppo Costante che si avvicina il più possibile alla perdita minima, ma al tempo stesso rende la “spezzata” più liscia, regolare e interpretabile dal punto di vista matematico Perdita che si subisce quando si sostituisce al posto delle y un valore costante per ogni gruppo i

  5. Valore teorico “estrapolato” Valore teorico “estrapolato” Valore teorico “interpolato” Modello di regressione come approssimazione della spezzata Il modello di regressione è un modello matematico che cerca di approssimare il più possibile le medie condizionate (la loro spezzata di regressione), che rende minima la perdita di informazione per ogni gruppo, derivante dalla sostituzione e sintesi dei dati con un sol numero costante per ogni gruppo. Al tempo stesso consente di lisciare, e regolarizzare la forma della spezzata di regressione rendendola meglio interpretabile dal punto di vista matematico e consentendo ad esempio operazioni come la derivazione e il calcolo di valori teorici al di fuori del campo di osservazione della X

  6. Il modello di regressione LINEARE Quali sono i valori di a e b che fanno passare la funzione il più vicina possibile ai punti osservati? Distanza totale (devianza residua) Condizione dei minimi quadrati Si scelgono in modo tale che la distanza tra valori teorici ed osservati sia minima

  7. Modello lineare: condizione dei minimi quadrati Nel caso di una successione doppia il concetto non cambia Soluzione

  8. Esempio: sia data una successione doppia (X=PESO, Y=STATURA) di una popolazione di N=10 unità statistiche. Si richiede a) scatterplot b) retta di regressione e commento sulla derivata rispetto al peso c) valori teorici di Y dato X. d) medie della statura condizionate al peso (senza passare per la distribuzione doppia) e) si tracci sia la spezzata di regressione che la retta.

  9. All’aumentare del peso di un Kg la statura aumenta di 1.297cm per qualsiasi livello del peso

  10. Dal modello lineare ai modelli lineari nei parametri Modello lineare nei parametri

  11. X = variazione nel numero di ore di sonno notturno Y = livelli di stress Calcolare il rapporto di correlazione Y|X Stimare la retta di regressione Stimare la funzione logaritmica di regressione tramite la trasformazione che diventa lineare

  12. 3.01 Calcolare valori teorici per x = -0.5 e 2.5 3.36

  13. Misura di bontà di adattamento Funzione delle Perdita complessiva che si subisce sostituendo i valori teorici a quelli osservati Devianza residua

  14. Misura di bontà di adattamento Tanto più vicino a zero e tanto migliore l’adattamento Tuttavia andrebbe “normalizzato” Si può dimostrare che (sotto certe condizioni (1)) date le quantità Devianza totale Devianza spiegata La funzione di regressione si riduce a Adattamento perfetto Tutti i punti si collocano sulla funzione di regressione La variabilità di Y è tutta spiegata dalla X attraverso la funzione di regressione La X non spiega nessuna parte di variabilità

  15. Misura di bontà di adattamento La funzione di regressione si riduce a Adattamento perfetto Tutti i punti si collocano sulla funzione di regressione La variabilità di Y è tutta spiegata dalla X attraverso la funzione di regressione La X non spiega nessuna parte di variabilità Indice di determinazione La X non spiega nessuna parte di variabilità attraverso il modello f(x) prescelto Adattamento perfetto, tutti i punti stanno sulla funzione f(x) prescelta

  16. Modello di regressione lineare Per un modello lineare, l’indice di determinazione coincide con il quadrato del coefficiente di correlazione

  17. Ancora sua devianze e indici di bontà di adattamento

  18. Regressione: condizioni affinché valga non dipendono da parametri Funzione lineare nei parametri

More Related