1.09k likes | 1.65k Views
Statistica Aziendale. L’informazione statistica per le decisioni aziendali. 1. Informazione già esistente ( dati secondari ) Statistiche ufficiali e non. 2. Informazione creata attraverso indagini ad hoc ( dati primari ) Tecniche di campionamento.
E N D
Statistica Aziendale L’informazione statistica per le decisioni aziendali 1. Informazione già esistente (dati secondari) Statistiche ufficiali e non 2. Informazione creata attraverso indagini ad hoc (dati primari) Tecniche di campionamento 3.La matrice dei dati e le analisi preliminari Indici di distanza tra unità (e di associazione tra variabili) Metodi statistici per l’analisi dei dati aziendali 4.Relazioni causali tra variabili Regressione multivariata 5.Segmentazione per omogeneità delle unità Metodi di analisi dei gruppi 6. Produttività ed efficienza aziendale Numeri Indici
Le indagini campionarie • Le fasi di un’indagine campionaria • Il campionamento: schemi e stima dei parametri • Gli errori campionari e non campionari • Tipologie di quesiti, scale di valutazione, classificazione dei caratteri statistici Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Indagini censuarie e campionarie Un’indagine conoscitiva può essere condotta secondo due approcci distinti: indagine totale o censuaria indagine parziale o campionaria È esaminata solo una parte del collettivo - un campione - anziché la sua totalità Il collettivo di unità su cui deve essere effettuata l’indagine è esaminato in maniera completa Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Confronto tra indagine censuariae indagine campionaria Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il campionamento - prime definizioni Inferenzastatistica:si desumono le caratteristiche di una popolazione attraverso lo studio di una parte di essa detta campione Popolazione o universo:un insieme di unità che soddisfano in maniera esaustiva uno o più criteri Indaginecampionaria: metodologia perconoscere le caratteristiche della popolazione tramite un campione Il campionamento può essere: - probabilistico: scelta delle unità affidata al caso - non probabilistico: scelta delle unità dipendente dalla soggettività di chi raccoglie le informazioni Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Confronto tra campionamento probabilistico e non probabilistico Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le fasi di un’indagine campionaria 1. Formulazione degli obiettivi dell’indagine - Si decide quali informazioni rilevare - informazioni prioritarie (relative agli obiettivi principali dell’indagine) - informazioni complementari (relative agli obiettivi secondari) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le fasi di un’indagine campionaria 2. Individuazione della popolazione obiettivo - E’ l’insieme delle unità sulle quali si intende ottenere le informazioni obiettivo dell’indagine - definito in base ad alcuni criteri (in particolare criteri spazio-temporali) - Lista di campionamento: elenco esaustivo delle unità appartenenti alla popolazione obiettivo Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le fasi di un’indagine campionaria 3. Individuazione tecnica di campionamento - Metodo di selezione del campione - prima distinzione: metodi probabilistici e non probabilistici - Scelta dipendente da: - livello di attendibilità desiderato - vincoli sui costi dell’indagine Diversi schemi di campionamento probabilistico e non probabilistico Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le fasi di un’indagine campionaria 4. Individuazione modalità di raccolta dati - Osservazione diretta (es.: rilevazione prezzi) - In genere intervista, con diverse modalità: - postale (con autocompilazione del questionario) - telefonica (compilazione assistita) - diretta o faccia a faccia (compilazione assistita) - via interneto email (con autocompilazione) Scelta modalità: compromesso tra diversi obiettivi spesso contrastanti: partecipazione; qualità dei dati; costi Par. 2.4 per i dettagli sulle tecniche di rilevazione dei dati (vantaggi e svantaggi delle diverse tecniche) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le fasi di un’indagine campionaria 5. Progettazione del questionario - Strumento per la rilevazione dei dati - Caratteristiche (lunghezza, complessità dei quesiti, istruzioni) dipendenti dalla modalità di rilevazione: - con autocompilazione (breve e semplice; istruzioni per l’intervistato) - intervista telefonica (breve e semplice; istruzioni per l’intervistatore) - intervista diretta (anche più complesso) - Test (indagini pilota) e revisioni Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le fasi di un’indagine campionaria 6. Rilevazione dei dati - Determinazione del periodo più appropriato per la raccolta dei dati - Evitare i periodi non idonei - Concentrazione in un breve periodo 7. Codifica e archiviazione dei dati - Codifica numerica delle variabili qualitative (in particolare, in caso di domande a risposte aperte) - Inserimento delle informazioni in un supporto informatico Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le fasi di un’indagine campionaria 8. Analisi dei dati - Produzione delle stime campionarie dei valori ignoti relativi alla popolazione 9. Redazione di un rapporto di ricerca - Descrizione delle caratteristiche dell’indagine - Descrizione dei principali risultati ottenuti Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il processo di stima– concetti di base Processo di stima:procedimento per ricavare, tramite una funzione delle osservazioni campionarie, il valore incognito di una caratteristica della popolazione • Il parametro da stimare:la caratteristica della popolazione che costituisce l’obiettivo dell’indagine • Lo stimatore: una formula analitica atta a stimare il valore incognito della caratteristica della popolazione sulla base dei dati campionari • Il valore della stima o stima: il risultato dell’applicazione dello stimatore ai dati campionari Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il processo di stima– un esempio Il parametro da stimare è la media aritmetica del fatturato delle aziende di un paese, le quali costituiscono la popolazione di riferimento (composta daNunità): Dalla popolazione si estrae un campione casuale di n unità sulle quali si rileva il fatturato. La stima del parametro della popolazione si ottiene applicando ai dati campionari lo stimatore media aritmetica: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il processo di stima Altri parametri da stimare (oltre la media): - Il totale: - La varianza: Stima del totale: ? No Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il processo di stima Caso di variabile binaria o dicotomica Codifica: Y = 1 (presenza attributo); Y = 0 (assenza attributo) - Totale: - Frequenza (proporzione): Stima di una frequenza: Stima del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Gli stimatori Lostimatoredi un parametroθdella popolazione: una funzione dei dati campionari per assegnare un valore a θ sulla base del campione Stimatore corretto (o non distorto): se nell’insieme dei campioni casuali estraibili il valore medio delle stime è pari al valore del parametro nella popolazione: Altrimenti, stimatore non corretto Distorsione: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Gli stimatori - Esempio Campionamento casuale semplice senza ripetizione Popolazione di N = 4 unità; campioni di n = 2 unità Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Gli stimatori Uno stimatore corretto è sempre da preferire a uno distorto? No se è caratterizzato da una molto maggiore dispersione delle stime intorno al valore del parametro da stimare Errore statistico: differenza tra la stima e il parametro da stimare: Errore quadratico medio: valore medio, nell’insieme dei campioni estraibili, dell’errore statistico al quadrato Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Gli stimatori - Esempio Campionamento casuale semplice senza ripetizione Popolazione di N = 4 unità; campioni di n = 2 unità MSE = 83.3 Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Gli stimatori Scomposizione dell’errore quadratico medio: Stimatore piùefficiente: dati due stimatori di uno stesso parametro si definisce stimatore più efficiente quello con minore MSE Se lo stimatore è corretto: • Se lo stimatore è corretto, lo stimatore più efficiente è quello a varianza minima Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Lo stimatore fondamentale nel campionamento probabilistico Nel campionamento probabilistico la probabilità di inclusione nel campione è nota e diversa da zero per ogni unità della popolazione Probabilità di inclusione: probabilità che una unità appartenga al campione. Non necessariamente uguale per ogni unità Esempio: Campionamento casuale semplice senza ripetizione Popolazione di N = 4 unità:1; 2; 3; 4 Insieme dei possibili campioni di n= 2 unità (1,2); (1,3); (1,4); (2,3); (2,4); (3,4) Probabilità di inclusione dell’unità 1: 3/6= ½ (= n/N) (idem per 2, 3, 4) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Lo stimatore fondamentale Stimatore corretto per il campionamento probabilistico senza ripetizione - Notazioni: Probabilità di inclusione: Coefficienti di espansione: Stimatore fondamentale (di Horvitz-Thompson) della media: e del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Stimatore fondamentale - Esempio Popolazione di N = 4 unità: Y1= 110; Y2 = 120; Y3 = 80; Y4 = 90; Campione estratto di n= 2 unità: (1,3) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le tecniche di campionamento probabilistico Principali tecniche di campionamento probabilistico: • casuale semplice (CCS) • sistematico (CSI) • stratificato (CST) • a grappoli (CGRA) • a più stadi (CSTA) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il campionamento casuale semplice • Tecnica di campionamento più elementare tra i metodi probabilistici • Rappresenta il naturale punto di partenza per lo studio di tutti gli altri metodi di campionamento • La probabilità di inclusione nel campione è la stessa per ogni unità della popolazione - pari alla frazione di campionamento - data da: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
La tecnica di estrazione del CCS- illustrazione Dato N=50, le unità della popolazione sono numerate da 1 a 50 Per estrarre un CCS di 10 unità (f = 1/5) si genera una sequenza di numeri casuali {3, 6, 11, 12, 25, 28, 31, 37, 44, 46} Le unità corrispondenti a tali numeri d’ordine costituiscono il campione Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Pro e contro del CCS • La semplicità concettualeè il suo principale punto di forza Il CCS presenta tuttavia anche alcuni possibili svantaggi: • Il campione potrebbe presentarsi sparso sul territorio con conseguenti costi elevati di organizzazione • Poiché tutti i possibili campioni hanno uguale probabilità di essere estratti, è possibile estrarre un ‘‘cattivo’’ campione (poco rappresentativo della popolazione) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il campionamento sistematico Tecnica alternativa assimilabile a quella per l’estrazione di un CCS Consiste nella selezione di una unità ogni kpresenti nella lista k è il passo di campionamento: la parte intera del reciproco della frazione di campionamento k = N/n Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
La tecnica di estrazione del CSI- illustrazione Dato N = 50 e fissata la dimensione campionaria n = 10, si determina il passo di campionamento, dato dak = N/n= 50/10 = 5 Si estrae un numero casuale compreso tra 1 e k(5) per esempio 2 e si seleziona l’unità corrispondente Si procede selezionando le unità corrispondenti ai seguenti n. d’ordine: 2+k= 7, 2+2k = 12, 2+3k= 17, … fino ad esaurimento della lista Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Pro e contro del CSI Pro: Per formare il campione è sufficiente una sola estrazione casuale Teoricamente si potrebbe prescindere dalla lista di campionamento Contro: Se la lista presenta particolari ordinamenti il CSI produce un ‘‘cattivo’’campione:esclude a priori alcuni segmenti di popolazione legati alla periodicità della lista Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le stime con il CCS Media: Lo stimatore corretto della media della popolazione è la media campionaria Totale: Varianza(stima della varianza di Y nella pop.): Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Stima di una frequenza Popolazione:Yi = 1 se l’attributo è presente; Yi = 0 se assente Stimatore fondamentale della frequenza: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Varianza degli stimatori Varianza teorica della media campionaria: Stima della varianza della media campionaria: Varianza della stima del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Varianza degli stimatori - Esempio Varianza teorica: Stima – campione (1; 2): Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Intervalli di confidenza per le stime Per n sufficientemente elevato la distribuzione campionaria della media può essere approssimata con una normale Intervallo di confidenza per la media campionaria: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Intervalli di confidenza per le stime Intervallo di confidenza per il totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il campionamento stratificato L’obiettivo è estrarre un campione più efficiente rispetto al CCS: stime più precise (o numerosità campionaria inferiore) Esempio: Popolazione di N = 12 imprese Media ROI popolazione: 3.75 Campioni CS: (4; 6; 9; 10) media ROI: (3+2+3+2)/4 = 2.5 (2; 3; 7; 12) media ROI: (4+6+4+6)/4 = 5 Risultato: stime poco precise e a forte variabilità Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il campionamento stratificato Disponibilità informazione aggiuntiva: settore di attività Riorganizzazione informazioni: Popolazione: Campione: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Il campionamento stratificato • La popolazione obiettivo è classificata in sottopopolazioni - esaustive e mutuamente esclusive - dette strati • Gli strati devono essere possibilmente omogenei al loro interno ed eterogenei tra di loro • Da ogni strato si estrae un campione casuale semplice • Infine l’aggregazione di tali campioni produce il campione stratificato NB: E’ necessario disporre di informazioni aggiuntive - variabili ausiliarie - per ogni unità della popolazione Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
La tecnica di estrazione del CST Schema di campionamento stratificato: In blu le unità campionate in ciascuno dei tre strati Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Campionamento stratificato Schema di popolazione di dimensione N ripartita in H strati Parametri di strato: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Campionamento stratificato Schema di campione di dimensione n estratto dagli Hstrati Media e varianza campionaria di strato: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Stime con CST • In caso di CCS negli strati, la probabilità di inclusione per l’unità i dello strato h è: • Lo stimatore dellamedia: : peso di strato • Lo stimatore deltotale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Esempio stima con CST Popolazione: Campione: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le stime con il CST Varianza della media campionaria: Varianza del totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Le stime con il CST Intervalli di confidenza media campionaria: totale: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
L’allocazione della numerosità campionaria tra gli strati Allocazioneproporzionale: La numerosità campionaria n viene ripartita tra gli strati in proporzione al peso di ogni strato nella popolazione: Pesi di strato nel campione = pesi di strato nella popolazione: Frazione di campionamento uguale in ogni strato (pari alla frazione di campionamento globale f) (campione autoponderante) Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill
Campionamento stratificato -Schema con allocazione proporzionale h=1 h=2 h=3 Dato N=50 e fissata la dimensione campionaria n=10, si determina la frazione di campionamento f = 1/5 Nella popolazione sono stati individuati 3 strati: N1=10; N2=25; N3=15 Applicando f = 1/5 ad ogni strato si ottengono le numerosità campionarie di strato: Bracalente, Cossignani, Mulas, Statistica aziendale, 2009, McGraw-Hill