1 / 25

DATA MINING PER IL MARKETING

DATA MINING PER IL MARKETING. Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso. ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA Maggiore flessibilità per applicazioni aziendali (Capitoli 5 – 6 del libro).

joshua-cruz
Download Presentation

DATA MINING PER IL MARKETING

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA Maggiore flessibilità per applicazioni aziendali (Capitoli 5 – 6 del libro)

  2. Regressione con variabiliesplicative qualitative(categoriali) • caratteristiche socio-demografiche dei consumatori (sesso, professione, …) • tipologia e area geografica dei punti vendita • categoria merceologica dei prodotti • brand • … • in generale: gruppi diversi di osservazioni

  3. Esempio: consumo e reddito USA (miliardi di $): p. 222 Consumo Reddito Negli anni 1942-1945 il modello sembra diverso: c’è una variabile importante esclusa dal modello

  4. Aggiunta di unavariabiledummy (variabileindicatrice con valori 0-1) Il modello di regressione diventa multiplo: Consumo = f(Reddito, dummy)

  5. Risultati del modello di regressionemultipla X1 = Reddito X2= Dummy Interpretazione coefficienti: significato di β2?

  6. Ricordando la definizione di X2 (dummy):a parità di reddito (X1), la stimadell’ammontaredeiconsumi(y cappello) diminuiscedi un ammontarepari a -55.46 (miliardi di $) neglianni in cui dummy=1 (cioèpassando da un periodo di pace a uno di guerra) se X2 = 0 (pace) se X2 = 1 (guerra)

  7. Rappresentazionegraficadell’effettodellavariabile dummy (β2=-55.46): due rette con diversa intercetta e uguale pendenza Consumo Reddito L’adattamento ai dati migliora sensibilmente con la variabile dummy: v. p. 224

  8. Generalizzazione al caso di variabili qualitative con più di due modalità Esempio: destagionalizzazione di una serie storica

  9. Seriestoricadellevendite di un bene(§5.2) v. file: Esempio dati vendite stagionali

  10. Modello:vendite stimate = f(trend + stagionalità + componente erratica) In questo esempio è presente solo la serie storica Y: le uniche variabili esplicative sono definite in funzione del tempo (trend, stagionalità e eventualmente ciclo) Il modello può essere generalizzato includendo anche altre variabili esplicative (variabili esogene) se disponibili

  11. Come possiamo rappresentare X? La prima osservazione fa riferimento al primo trimestre (primavera); La seconda osservazione fa riferimento al secondo trimestre (estate); Ecc. • Perché manca la dummy per l’inverno? • formulazione alternativa (4 dummy; no intercetta): p. 227 • La scelta della dummy da eliminare (o della formulazione del modello) non cambia l’adattamento né le previsioni

  12. Stima dei parametri • I coefficienti delle dummy stagionali rappresentano l’effetto della stagione considerata relativo alla stagione esclusa, a parità di trend • Su tali stime si possono applicare tutte le procedure della regressione multipla (intervalli, test …): v. libro

  13. Destagionalizzazione (p. 229-230) La serie destagionalizzata non risente più delle ciclicità stagionali

  14. Detrendizzazione (p. 229-230) La serie detrendizzata non mostra più un andamento di lungo periodo (è stazionaria)

  15. La serie detrendizzata e destagionalizzata non risente più né delle ciclicità stagionali né dell’andamento di lungo periodo: dovrebbe essere assimilabile alla componente erratica (in realtà ciò è vero solo in parte: perché?)

  16. Esercitazioni con variabili dummy • Seminar sulla previsione delle vendite per il budgeting • Previsione del consumo di gas (Esercizio 6.1, pp. 243-252) • Indagine sull’ascolto radiofonico (Esercizio 6.2, pp. 253-258) • Analisi delle retribuzioni aziendali (Esercizio 6.4, pp. 264-271) • Vendita di fusti di birra (Esercizio 6.5, pp. 272-277)

  17. Eteroschedasticità • Assunzione del modello: • Var(i) = Var(yi) = 2 costante (omoschedasticità) • In pratica, l’ipotesi è spesso violata  tipicamente: Var(yi) varia in funzione del livello di una o più esplicative

  18. Esempio: dati trade La variabilità della spesa aumenta con il numero di visite Implicazioni di marketing

  19. Esempio: dati trade Anche la variabilità dei residui aumenta con il numero di visite

  20. Trasformazioni di Y Trasformare Y può aiutare a rendere Var(yi) approx costante (cioè a eliminare l’eteroschedasticità) Trasformazioni più comuni: log(yi) se i  E(yi) (yi)1/2 se yi è un conteggio Classe generale: Box-Cox (v. Zani-Cerioli, pp. 203-212) Le trasformazioni dei dati possono aiutare anche a rendere migliore l’approx della distribuzione di Y a una Normale rendere migliore l’approx di una funzione lineare

  21. Esempio dati trade – log(Y) La trasformazione logaritmica non sembra del tutto soddisfacente

  22. Esempio dati trade – sqrt(Y)

  23. Esempio dati trade – normalità Y Sqrt(Y) Y log(Y): la trasformazione logaritmica può essere preferibile dal punto di vista dell’approx della distribuzione di Y con una Normale

  24. Esempio dati trade – log(Y) – log(X) Interpretazione coefficienti Analisi per esercizio

  25. Autocorrelazione • Assunzione del modello: • I disturbi i, e quindi le osservazioni yi, sono tra loro incorrelati (indipendenti) • In pratica, l’ipotesi è spesso violata quando Y è una serie storica tipicamente il valore di Y al tempo t è influenzato dai valori di Y ai tempi precedenti: autocorrelazione (correlazione seriale) • Dettagli: §5.4

More Related