1 / 40

Un’applicazione della segmentazione a priori: l’algoritmo CHAID

Un’applicazione della segmentazione a priori: l’algoritmo CHAID. Di: Laura Croccia Daniele Medri Claudio Quevedo Romina Raimondi. OBIETTIVO:effettuare un’analisi di segmentazione a priori tramite l’algoritmo Chaid

Download Presentation

Un’applicazione della segmentazione a priori: l’algoritmo CHAID

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Un’applicazione della segmentazione a priori:l’algoritmo CHAID Di: Laura Croccia Daniele Medri Claudio Quevedo Romina Raimondi

  2. OBIETTIVO:effettuare un’analisi di segmentazione a priori tramite l’algoritmo Chaid • Prima segmentazione effettuata utilizzando la variabile target “essere socio Coop” (50% del campione sono “soci”) • Seconda segmentazione effettuata solo sui soci Coop utilizzando la variabile target “canale ipermercato o non ipermercato” (55 % del campione non usa il canale ipermercato)

  3. Dataset “Coop” • 7200 unità • 42 variabili riguardanti: - soddisfazione degli intervistati - variazione della soddisfazione degli intervistati - informazioni socio-demografiche - informazioni su variabili “Coop”

  4. Opzioni utilizzate • Nodo Tree del software Enterprise Miner • Numero massimo di split in ogni nodo: 3 ( scelta effettuata in base al numero di modalità delle variabili categoriche prese in considerazione) • Minimo numero di osservazioni in una foglia: 20 ( per non avere foglie con poca numerosità)

  5. Fase 1 Analisi di segmentazione su tutti le unità del dataset

  6. Segmentazione con variabile target “Socio” • Costruiti 4 diversi alberi utilizzando: - tutte le variabili - le variabili socio-demografiche - le variabili sulla soddisfazione - le variabili “Coop” • Dataset diviso in: - training set (70% del campione,5040 u.s.) - validation set (30% del campione,2160 u.s.)

  7. Soddisfazione-Variazione • Problema di dipendenza tra soddisfazione e variazione • Scarsa utilità dell’informazione apportata dalle variabili riguardanti la variazione perché manca un termina di confronto • Test 2 per testare l’indipendenza tra soddisfazione e variazione della soddisfazione per i diversi aspetti del servizio • Per tutti i confronti l’ipotesi nulla di indipendenza risulta rifiutata le variabili rappresentanti la variazione della soddisfazione sono state escluse dall’analisi

  8. Albero con 3 livelli di profondità e 5 nodi terminali Tasso di corretta classificazione=87% Le variabili ritenute significative per gli split sono “insegna” e “primo punto vendita” Segmentazione con tutte le variabili

  9. Albero

  10. Segmenti individuati • Segmento1: soci Coop che scelgono Coop sia come insegna che come primo punto vendita (58% circa del campione). • Segmento2: non soci Coop che scelgono Coop come insegna ma non come primo punto vendita (3% circa) • Segmento3:esclusivamente non soci Coop che scelgono altre insegne e Coop come primo punto vendita (10%circa) • Segmento4:esclusivamente soci Coop che scelgono altre insegne e non scelgono Coop come primo punto vendita (2% circa) • Segmento5:coloro che presentano un valore mancante per la variabile insegna (26% circa)

  11. Segmentazione con le variabili Socio-Demografiche • L’utilizzo delle suddette variabili non ha portato ad alcuna segmentazione. Si ritengono quindi ininfluenti queste variabili ai fini degli obiettivi anteposti.

  12. Albero con 4 livelli di profondità, 11 nodi terminali dei quali 4 relativi ai valori mancanti; Tasso di corretta classificazione=74% Le variabili ritenute significative per gli split sono “soddisfazione generale”, “soddisfazione verso promozioni” e “soddisfazione verso prodotti non alimentari”. Segmentazione con le sole variabili di soddisfazione

  13. Albero

  14. Segmentazione con le sole variabili di soddisfazione • Segmento1: soci che hanno dimostrato una soddisfazione alta a livello generale e per le promozioni (23% circa del campione); • Segmento2: non soci che hanno dimostrato una soddisfazione alta a livello generale e in misura medio bassa verso le promozioni (32% circa); • Segmento3: in maggioranza non soci che hanno rivelato soddisfazione generale alta ma non hanno dato giudizio di preferenza per le promozioni (1% circa); • Segmento4: persone che hanno indicato una bassa soddisfazione generale, alta o bassa per le promozioni e media per i prodotti non alimentari; sono sia soci che non soci (12% circa); • Segmento5: non soci che hanno indicato una bassa soddisfazione generale ma un’elevata soddisfazione per i prodotti non alimentari (1%); • Segmento 6: non soci che hanno indicato una bassa soddisfazione generale alta o bassa soddisfazione per le promozioni e non hanno espresso opinioni sui prodotti non alimentari (2%); • Segmento 7: non soci con bassa soddisfazione generale, soddisfazione media verso le promozioni e alta soddisfazione per i prodotti non alimentari (1%);

  15. Segmentazione con le sole variabili di soddisfazione • Segmento8: soci con bassa soddisfazione generale, media soddisfazione verso le promozioni e i prodotti non alimentari (2% del campione) • Segmento9: soci con bassa soddisfazione generale,media soddisfazione verso le promozioni e bassa soddisfazione verso i prodotti non alimentari (2%); • Segmento10: non soci con bassa soddisfazione generale che non hanno espresso opinione nei confronti delle promozioni (1%); • Segmento11: non soci che non ha espresso alcun giudizio di soddisfazione generale (24%).

  16. Albero con 3 livelli di profondità, 5 nodi terminali dei quali 1 relativo ai valori mancanti; Tasso di corretta classificazione=87% Le variabili ritenute significative per gli split sono “insegna” e “primo punto vendita”. Segmentazione con le sole variabili “Coop”

  17. Albero

  18. Segmentazione con le sole “Coop” • Segmento1: soci che scelgono l’insegna Coop e quest’ultima rappresenta il primo punto vendita (59% circa); • Segmento2: non soci che scelgono l’insegna Coop ma per i quali non rappresenta il primo punto vendita (3% circa); • Segmento3: esclusivamente non soci che scelgono altre insegne ma scelgono Coop come primo punto vendita (10% circa); • Segmento4: esclusivamente soci Coop che scelgono altre insegne ma non Coop come primo punto vendita (2% circa); • Segmento5: non soci Coop che non hanno dato giudizio di preferenza sull’insegna (26% circa).

  19. Osservazione • Utilizzando tutte le variabili e le sole variabili “Coop” si ottiene la medesima segmentazione, quindi deduciamo che queste variabili sono molto rilevanti per i nostri scopi.

  20. Confronto tra gli alberi • La segmentazione migliore risulta essere quella che utilizza tutte le variabili, mentre quelle socio-demografiche risultano inutili.

  21. Fase 2 Analisi di segmentazione sui soci “Coop”

  22. Segmentazione con variabile target “Canale” • 3600 unità • Costruiti 4 diversi alberi, utilizzando: - tutte le variabili - le variabili socio-demografiche - le variabili sulla soddisfazione - le variabili “Coop” • Il Dataset “solo sui soci coop” è statodiviso in: - training set (70% del campione,2520 u.s.) - validation set (30% del campione, 1080 u.s.)

  23. Albero con 4 livelli di profondità e 11 nodi terminali Tasso di corretta classificazione=71 % Le variabili ritenute significative per la segmentazione sono la “zona geografica di appartenenza”, la soddisfazione sull’”assortimento”, il “pesce” e i “prezzi” Segmentazione con tutte le variabili

  24. Albero

  25. Segmentazione con tutte le variabili • Segmento1: Soci Coop il cui canale di vendita è ipermercato, residenti a Bologna con una bassa soddisfazione rispetto al pesce e all’assortimento(circa il 5%). • Segmento2: Soci che comprano in ipermercato, residenti a Bologna che hanno una soddisfazione bassa per il pesce e media per l’assortimento (circa il 4%). • Segmento3: Soci che comprano in ipermercato, residenti a Bologna con una bassa soddisfazione del pesce e alta per l’assortimento (circa il 3%). • Segmento4: Soci che comprano in ipermercato, residenti a Bologna, hanno una soddisfazione del pesce alta o media (circa il 27%). • Segmento5: Soci che NON comprano in ipermercato, residenti a Bologna, che non hanno dichiarato sulla soddisfazione del pesce e che hanno una soddisfazione dell’assortimento bassa (circa il 4%). • Segmento6: Soci che NON comprano in ipermercato, residenti a Bologna, che non hanno dichiarato punteggi di soddisfazione per il pesce e con una media soddisfazione per l’assortimento (circa il 3%).

  26. Segmentazione con tutte le variabili • Segmento7: Soci che comprano in ipermercato, residenti a Bologna, non dichiarano la soddisfazione sul pesce e che segnalano un’alta soddisfazione per l’assortimento(circa il 4%). • Segmento8: Soci che NON comprano in ipermercato, residenti in Romagna-Marche con un’alta soddisfazione del pesce e dei prezzi (circa il 13%). • Segmento9: Soci che NON comprano in ipermercato, residenti in Romagna-Marche con una soddisfazione alta del pesce e bassa dei prezzi (circa il 6%). • Segmento10: Soci che NON comprano in ipermercato residenti nella zona Romagna-Marche che presentano valori missing per la soddisfazione riguardo al pesce (circa il 12%). • Segmento 11: Soci che NON comprano in ipermercato e abitano nella Regione del Veneto (circa il 18%).

  27. Albero con 4 livelli di profondità e 6 nodi terminali Tasso di corretta classificazione= 68% Le variabili che risultano significative per la segmentazione sono la “zona di appartenenza geografica”, il “numero di familiari riceventi reddito” e “il numero di auto possedute” Segmentazione con le variabili Socio-Demografiche

  28. Albero

  29. Segmentazione con le variabili demografiche • Segmento 1: Soci che comprano in ipermercato,residenti a Bologna che hanno un auto (21% circa). • Segmento 2: Soci che comprano in ipermercato, residenti a Bologna con più di un auto (23% circa). • Segmento 3: Soci che comprano in ipermercato, residenti a Bologna, non hanno risposto sul numero delle auto che hanno più di una persona con reddito (2% circa). • Segmento 4: Soci che NON comprano in ipermercato residenti a Bologna, non presentano un valore per il numero auto e hanno una persona con reddito (3% circa). • Segmento 5: Soci che NON comprano in ipermercato che abitano nella zona Romagna-Marche (32% circa). • Segmento 6: Soci che NON comprano in ipermercato che abitano in Veneto (18% circa).

  30. Albero con 4 livelli di profondità e 11 nodi terminali Tasso di corretta classificazione=68% Le variabili che risultano significative per la segmentazione sono la soddisfazione per “l’assortimento”, “il pesce”, “il personale”, “la carne” e “i prezzi” Segmentazione con le variabili “Soddisfazione”

  31. Albero

  32. Segmentazione con le variabili soddisfazione • Segmento 1: Soci che comprano in ipermercato con una soddisfazione del pesce e dei prezzi alta (24% circa). • Segmento 2: Soci che NON comprano in ipermercato con una soddisfazione alta per il pesce, media per i prezzi e alta per la carne (6% circa). • Segmento 3: Soci che usano il canale ipermercato, hanno un soddisfazione alta per il pesce, media per i prezzi e per la carne (11% circa). • Segmento 4: Soci che comprano in ipermercato, hanno un soddisfazione alta per il pesce, media per i prezzi e bassa per la carne (6% circa). • Segmento 5: Soci che NON comprano in ipermercato, molto soddisfatti del pesce poco soddisfatti dell’assortimento e dei prezzi (9% circa).

  33. Segmentazione con le variabili soddisfazione • Segmento 6: Soci che NON comprano in ipermercato, con una soddisfazione alta per il pesce dell’assortimento media, bassa per i prezzi e media per l’assortimento (6% circa). • Segmento 7: Soci che comprano in ipermercato, con una soddisfazione alta per il pesce, bassa per i prezzi e alta per l’assortimento (3% circa). • Segmento 8: Soci che NON comprano in ipermercato, non dichiarano la soddisfazione per il pesce, con una bassa soddisfazione dell’assortimento (12% circa). • Segmento 9: Soci che NON comprano in ipermercato che non dichiarano la soddisfazione rispetto al pesce e con una soddisfazione media per l’assortimento e (10% circa). • Segmento 10: Soci che NON comprano in ipermercato che non dichiarano la soddisfazione rispetto al pesce, con un’alta soddisfazione per il personale e per l’assortimento (8% circa). • Segmento 11: Soci che comprano in ipermercato, che non dichiarano sulla soddisfazione rispetto al pesce con una alta soddisfazione per l’assortimento e bassa o media per il personale(3% circa).

  34. Albero con 4 livelli di profondità e 4 nodi terminali Tasso di corretta classificazione=68% Le variabili che risultano significative sono “la zona di residenza” e “il primo punto vendita” Segmentazione con le variabili “Coop”

  35. Albero

  36. Segmentazione con le variabili coop • Segmento 1: Soci che NON comprano in ipermercato,risiedono a Bologna e che non usano Coop come primo punto vendita (2% circa). • Segmento 2: Soci che comprano in ipermercato, residenti a Bologna per i quali Coop è primo punto di vendita (48% circa). • Segmento 3: Soci che NON comprano in ipermercato e presentano come zona di residenza Romagna-Marche (32% circa). • Segmento 4: Soci che NON comprano in ipermercato e risiedono in Veneto (18% circa).

  37. Confronto tra gli alberi • La segmentazione migliore risulta essere quella che utilizza tutte le variabili

  38. Osservazione: la questione “Pesce” • La variabile “soddisfazione per il pesce” risulta molto significativa nella segmentazione • Per questo motivo si è ritenuto interessante andare ad osservare le caratteristiche socio-demografiche di coloro che rispondono alla soddisfazione riguardo al pesce e di coloro che non rispondono. • Le distribuzioni di frequenza delle variabili socio-demografiche sono simili sia per coloro che rispondono sia per coloro che non rispondono. L’unica variabile che non si comporta nella stessa maniera è la “zona di residenza”. A Bologna sono presenti soprattutto coloro che consumano pesce, mentre in Veneto sono più presenti coloro che non lo consumano.

  39. Fine

  40. Test 2di indipendenza

More Related