1.11k likes | 1.35k Views
Università degli Studi di Verona. Master in Direzione delle Aziende Pubbliche. Statistica 10 novembre 2006. Dario Olivieri Ordinario di Statistica nell’Università di Verona. Schema dell’intervento. La Statistica I principali indicatori e la loro efficacia Le fonti dei dati statistici
E N D
Università degli Studi di Verona Master in Direzione delle Aziende Pubbliche Statistica 10 novembre 2006 Dario Olivieri Ordinario di Statistica nell’Università di Verona
Schema dell’intervento • La Statistica • I principali indicatori e la loro efficacia • Le fonti dei dati statistici • Le indagini campionarie • Le relazioni fra fenomeni • Le previsioni demografiche • Le tavole input-output 1
La Statistica • La definizione di Statistica conta almeno 150 diverse versioni che, storicamente, ricalcano l'evoluzione avvenuta nei contenuti della disciplina: • da disciplina relegata quasi esclusivamente all'analisi delle cose dello Stato, • alla concezione moderna che la vede come metodologia tipica per l'analisi dello stato delle cose. • Si tratta dunque di un insieme di metodi scientifici finalizzati alla conoscenza quantitativa dei fenomeni collettivi mediante la raccolta, l'ordinamento, la sintesi e l'analisi dei dati. • Obiettivi: • Descrivere i fenomeni collettivi • Investigare sulle relazioni fra fenomeni 2
Le fasi dell’indagine statistica • la formulazione del problema • la rilevazione dei dati • lo spoglio e la classificazione dei dati • l’elaborazione • la presentazione dei risultati 3
La rilevazione dei dati • Le fonti ufficiali • SISTAN sistema statistico nazionale • Istat • Ministeri • Aziende Autonome • Regioni • Province • Comuni • ULSS • Camere di Commercio • Banche dati ed altri sistemi informativi • Le indagini ad hoc: • Totali • Campionarie 4
Le fonti dei dati Le informazioni sul fenomeno collettivo oggetto dell’indagine possono essere già state rilevate e poste in apposite pubblicazioni o siti internet quali: SISTAN sistema statistico nazionale Istat Ministeri Aziende Autonome Regioni Province Comuni ULSS Camere di Commercio 5
ISTAT • La sede centrale dell'Istat è a Roma. Una rete di uffici regionali rappresenta l'Istituto su tutto il territorio nazionale. In ogni regione e provincia autonoma è presente infatti una struttura che opera a stretto contatto con gli enti locali. Organi dell’Istituto sono il Presidente, il Consiglio, il Comitato di indirizzo e coordinamento dell’informazione statistica e il Collegio dei revisori dei conti. I primi due esplicano funzioni di governo; il Comstat esercita le funzioni direttive dell’Istat nei confronti degli uffici di statistica del Sistan; il Collegio dei revisori accerta la regolare tenuta della contabilità. Inoltre presso la Presidenza del Consiglio dei ministri opera la Commissione per la garanzia dell’informazione statistica con il compito di vigilare sull’imparzialità e sulla completezza dell’informazione prodotta. • WWW.ISTAT.IT 6
Banche dati e sistemi informativi Le banche dati e gli altri sistemi informativi statistici sono a carattere tematico e forniscono una visione globale e accurata del fenomeno indagato. L'accesso è di norma libero e gratuito.Le banche dati sono magazzini in cui l'utente può scegliere in base alle proprie esigenze il tipo di dati e il loro livello di dettaglio e costruire le proprie tabelle in maniera personalizzata.I sistemi informativi contengono informazioni e dati strutturati in tavole preconfezionate e scaricabili su foglio elettronico.Ogni banca o collezione di dati è corredata di metainformazioni (metodologie, classificazioni, definizioni) relative all'argomento trattato.Oltre alle banche dati e ai sistemi informativi, sono disponibili anche collezioni di dati presentati in forma di tabella.Censimento popolazione 2001Popolazione residente, stranieri, famiglie, persone che vivono in convivenze, grado di istruzione e condizione professionale dei cittadini; consistenza numerica e caratteristiche strutturali di edifici e abitazioni. Il dettaglio è fino al livello comunaleCensimento industria e servizi 2001Imprese, istituzioni pubbliche e non profit, unità locali e addetti, suddivisi per attività economica, classe di addetti e forma giuridica. Sono disponibili confronti con i censimenti dal 1951 in poi. Il dettaglio è fino al livello comunaleCensimento Agricoltura 2000Aziende agricole, nuove attività (colture biologiche, agriturismo, artigianato), nuove tecnologie, utilizzazione dei terreni, irrigazione, allevamenti, mezzi meccanici, forza lavoro e approcci al mercatoDemo: demografia in cifrePopolazione residente per età, sesso e stato civile. Sono disponibili anche informazioni sui principali fenomeni demografici: nascite, permessi di soggiorno, indice di vecchiaia, età media, mortalità, previsioni della popolazione residente 8
Banche dati e sistemi informativi Sistema di indicatori territorialiIndicatori di tipo demografico, sociale, ambientale ed economico riferito a ripartizioni, regioni, province e capoluoghi. Il sistema è articolato in 15 aree informativeCoeweb: statistiche del commercio esteroMerci importate ed esportate da e nei Paesi che commerciano con l’Italia. I dati, aggiornati mensilmente, sono disponibili dal 1991 ad oggiConIstat: statistiche congiunturaliPiù di 11 mila serie storiche su prezzi, attività delle imprese, occupazione, retribuzioni, commercio estero e conti economici. L’interrogazione è possibile in base a settore di attività economica, gruppo di prodotto, voce del Sistema europeo dei contiDisabilità in cifreNumero di disabili, istruzione e integrazione scolastica, turismo accessibile, sindrome di Down e altri aspetti della disabilità. Il sistema è utilizzabile anche dalle persone diversamente abiliIndicatori socio-sanitari regionaliSistema sanitario e salute nelle regioni italiane: salute, stili di vita e fattori di rischio; risorse impegnate dal SSN, domanda di assistenza sanitaria; indicatori di contesto demografico, sociale ed economico; stato di salute dell’ambienteHealth for All - ItaliaOltre 4.000 indicatori su sanità e salute: contesto socio-demografico, mortalità per causa, malattie croniche e infettive, condizioni di salute e speranza di vita, disabilità, assistenza sanitaria, attività ospedaliera, risorse sanitarieDati congiunturali sull'agricoltura e zootecniaColtivazioni, macellazione carni rosse e bianche, import-export bestiame, mezzi di produzione, pesca, caccia, floricoltura, forestali, lattiero caseario, agriturismo, consistenza del bestiameStatistiche per le politiche di sviluppoInformazioni e indicatori territoriali prodotti a supporto dell'attività di valutazione e programmazione prevista nell'ambito dei Fondi strutturali 2000-2006 9
Banche dati e sistemi informativi FMI - National Summary Data PagePagina riassuntiva contenente i dati più aggiornati e significativi prodotti da Istat, Banca d’Italia, Ministero dell’Economia e delle Finanze, Ufficio Italiano dei Cambi secondo gli standards richiesti dal DSBB del Fondo Monetario InternazionaleCultura in cifrePrincipali istituzioni culturali, pubbliche e private e servizi erogati con riferimento al settore dell’editoria, biblioteche, archivi, musei, gallerie, monumenti e scavi, sport, spettacoli, cinema, radio e televisioneSIA: sistema di indagini sulle acqueStatistiche sulle acque prodotte dall’Istat e, in particolare, dati ricavati dal Sistema di indagini sulle acque 1999. Il riferimento minimo territoriale è rappresentato da comuni e bacini idrograficiSistema Informativo Territoriale sulla GiustiziaTutte le statistiche sulla giustizia prodotte dall’Istat. Sono presenti le principali pubblicazioni, schede informative sulle indagini, glossario dei termini statistici utilizzati, normativa di riferimentoRivalutazioni monetarieIndici dei prezzi al consumo per le famiglie di operai e impiegati (FOI) al netto dei consumi di tabacchi: coefficienti di rivalutazione monetaria e variazioni percentualiDati congiunturaliSi rendono disponibili i principali indicatori statistici diffusi dall'Istituto in corrispondenza della emissione dei comunicati stampa sulla congiutura economica 10
www.ministerosalute.it “ANNUARIO STATISTICO del Servizio Sanitario Nazionale”(Attività gestionali ed economiche delle ASL e Aziende Ospedaliere) Annuario 2004 Annuario 2003 Annuario 2002 Annuario 2001 Annuario 2000 Annuario 1999 Annuario 1998 Annuario 1997 "Personale delle ASL e degli Istituti di Cura Pubblici" Anno 2004 Anno 2003 Anno 2002 Anno 2001 Anno 2000 Anno 1999 Anno 1998 Anno 1997 11
www.ministerosalute.it "Compendio del Servizio Sanitario Nazionale" Compendio 2001-2003 Compendio 1998-2001 Compendio 1996-1997 Compendio 1991-1995 "ICD 10 - Classificazione Statistica Internazionale delle Malattie e dei Problemi Sanitari Correlati " Studi monografici Certificato di assistenza al parto (CeDAP). Analisi dell'evento nascita - anno 2003 (formato pdf) Certificato di assistenza al parto (CeDAP). Analisi dell'evento nascita - anno 2002 (formato pdf) Rapporto di riabilitazione - 2003 (formato pdf) Attività di rilevazione nel settore tossicodipendenze - anno 2002 Stato di salute e prestazioni sanitarie nella popolazione anziana - 2000 (formato pdf) Indagine sui servizi di diagnostica per immagini presenti nelle strutture di ricovero e cura pubbliche e private accreditate -2000 (formato doc) Il ricovero ospedaliero degli stranieri in Italia nell'anno 2000 (formato pdf) 12
www.ministerosalute.it Un esempio • Personale delle ASL e degli Istituti di Cura Pubblici - anno 2004 • La presente pubblicazione monografica costituisce una fotografia, per l’anno 2004, della disponibilità del personale operante nelle strutture pubbliche del Servizio Sanitario Nazionale - Aziende Sanitarie Locali, strutture di ricovero pubbliche ed equiparate. Lo studio è stato realizzato dall’ufficio di statistica attraverso l’elaborazione dei dati del Sistema Informativo Sanitario, trasmessi attraverso la rete di collegamento dati fra Aziende Sanitarie, Regioni e Ministero della Salute. Il volume fornisce dati statistici aggregati per tipologia di istituto.Questi, in particolare, gli argomenti in essa raccolti: • Premessa • Personale dipendente del Servizio Sanitario Nazionale • Personale dipendente delle Aziende Sanitarie Locali • Personale delle strutture di ricovero e cura pubbliche • Personale delle Aziende Ospedaliere • Personale degli Istituti di ricovero e cura gestiti direttamente dalle A.S.L. • Personale delle Strutture di ricovero equiparate alle pubbliche • Personale dei Policlinici universitari • Personale degli Istituti di ricovero e cura a carattere scientifico • Personale degli Ospedali classificati • Personale degli Istituti di cura privati qualificati presidio delle A.S.L. • Personale degli Enti di ricerca • La pubblicazione Personale delle A.S.L. e degli Istituti di Cura Pubblici - anno 2004 è disponibile in formato "PDF" (544 KB) ed è possibile visualizzarla oppure trasferirla sul proprio disco rigido. 13
www.regione.veneto.it Statistica News Rapporto Statistico 2006: Presentazione 25 luglio 2006 in Venezia presso la Scuola S. Giovanni Evangelista Verso gli obiettivi di Lisbona: statistiche flash giugno 2006 e slides Pubblicazione: Atlante di mortalità regionale - Anni 1981-2000 __________________ Home > Temi Istituzionali > Statistica > Statistica Home > Temi Istituzionali > Statistica > Statistica 14
www.regione.veneto.it • Ultimi aggiornamenti dati settoriali: • commercio estero al primo semestre 2006 • movimento anagrafico a tutto il 2005 • imprese, unità locali e addetti - dati censuari • turismo a tutto il 2005 • popolazione residente nel Veneto per sesso, età e stato civile al 31/12/2004 15
www.provincia.verona.it Servizi Socio-Culturali Iniziative di politiche giovanili 2006 Contiene documenti inerenti interventi e iniziative di politiche giovanili Affidamento servizio attività didattico-integrativa per ipovedenti e audiolesi Contiene documenti afferenti il servizio di attività didattico-integrativa per ipovedenti e audiolesi affidato alla ATI tra le società cooperative Servizi Socio Culturali di Marghera e L'Alba di Vicenza. Determinazioni anno 2006 Contiene tutte le determinazioni dei Servizi Socio-Culturali numerate nell'anno 2006 Politiche per la Famiglia Contiene documenti relativi alle politiche familiari per l'anno 2006 U.O. Istruzione 16
statistica@comune.verona.it Competenze L'Ufficio comunale di Statistica fa parte del Sistema Statistico Nazionale (SISTAN). Attua le rilevazioni comprese nel Programma Statistico Nazionale (PSN) e le rilevazioni promosse dall'Amministrazione comunale per proprie esigenze conoscitive, curandone la pubblicazione sul sito e in forma cartacea disponibile per l'acquisto. In primo pianoCalendario diffusione Indice Provvisorio Intera Collettivita' (NIC) ====>> NOTIZIE FLASH<<====Indice Famiglie Operai ed Impiegati (FOI)CENSIMENTI 2001Indagine sui tempi della famiglia: il percorso casa/scuola dei bambiniIndagine sugli orari del Commercio 17
statistica@comune.verona.it » CensimentiAnalisi dati censuari delle abitazioni, edifici, popolazione per zone territoriali omogene » Collana Prezzi Rilevazione Prezzi al Consumo » Collana Annuari ISSN 1825-0440Analisi della popolazione residente. aspetti socio-demografici ed altro » Collana Popolazione e comportamenti sociali ISSN 1824-8675 Indagini e sondaggi effettuati per l'Amministrazione Comunale e/o altri richiedenti 18
www.ulss20.verona.it Relazioni sanitarie Anno 2001 (581Kb) Anno 2002 (860Kb) Anno 2003 (831Kb) Anno 2004 (1,00Mb) Anno 2005 (1,25Mb) 20
www.verona.camcom.it Presentazione del Servizio Studi e Ricerca Sportello per l’informazione economico-statistica E’ organo del Sistema Statistico Nazionale (SISTAN) e collabora con l’Istat e con il Ministero delle Attività Produttive nella realizzazione di indagini statistiche sul territorio provinciale e comunale (opere pubbliche ed attività edilizia, forze di lavoro, pesca, consumi delle famiglie, grande distribuzione). Funziona da centro di diffusione di informazioni statistiche, tra le quali si segnalano: l’indice Istat dei prezzi al consumo e l’indice dei prezzi di costruzione di un fabbricato.In occasione dei censimenti generali svolge il compito di Ufficio Provinciale del Censimento e coordina l’attività censuaria dei comuni della provincia. Collabora con Unioncamere per l’effettuazione di varie indagini, tra cui la rilevazione a livello provinciale dei dati sulla domanda di lavoro e di figure professionali nell’ambito del Progetto Excelsior. E’ impegnato, assieme all’Unione regionale delle Camere di Commercio del Veneto, nella predisposizione dell’indagine trimestrale sull’andamento della congiuntura nelle industrie manifatturiere della provincia veronese. Redige, con cadenza semestrale, il Bollettino di Statistica della Provincia di Verona, un utile e ricco strumento informativo della realtà economica della provincia, distribuito gratuitamente in oltre 1.000 copie. Grazie al collegamento con banche-dati interne delle Camere di Commercio, è in grado di soddisfare le richieste di dati ed elaborazioni statistiche sulla demografia delle imprese e sulla struttura produttiva della realtà provinciale, ai fini di ricerca o di studio. 21
www.verona.camcom.it Centro Studi Si pone l’obiettivo di promuovere la conoscenza delle dinamiche socio-economiche del territorio veronese attraverso la realizzazione di studi ed indagini su tutti gli aspetti dell’economia locale.Svolge una intensa attività di raccolta di dati, informazioni al fine di diffondere tra gli operatori locali sia pubblici che privati un patrimonio di conoscenze che siano un efficace strumento di azione per sostenere e sviluppare l’interesse generale delle imprese e della collettività.Nel corso dell’anno, vengono organizzati - presso la sede camerale - numerosi convegni ed incontri di presentazione dei risultati delle ricerche realizzate. Per informazioni rivolgersi a: Servizio Studi e Ricerca – CCIAA di Verona: tel. 045-8085855/854/796/725 Comunicazione Indice dei prezzi al consumo:Indirizzo: Corso Porta Nuova, 96 – IV° pianotel.045-8085851, fax: 045-8085881E-mail: statistica@vr.camcom.it Orari: dal lunedì al venerdì dalle 8.45 alle 12.30; lunedì e giovedì anche dalle 15.00 alle 16.30. 22
www.verona.camcom.it Dati e statistiche Indice Istat dei prezzi al consumo Il bollettino semestrale Banche dati statistiche Studi e ricerche 2006 Studi e ricerche ante 2006 Statistiche news Istat - Ateco 2002 23
www.un.org For 228 countries or areas, regions and the world, the wall chart presents comparable indicators including absolute and relative numbers of the older population, proportions currently married, living alone and in the labour force among both older men and women, the sex ratio of populations aged 60 and over and 80 and over, the potential support ratio, the statutory retirement age for men and women and life expectancy at age 60 for men and women. The new chart updates the wall chart Population Ageing 2002 and adds information on the percentage of older persons who live alone. 24
Qualora non esistano fonti da cui attingere le informazioni sul fenomeno collettivo(o qualora tali fonti siano incomplete o insufficienti)è necessario programmare un’indagine ad hoc che si articola nelle fasiprecedentemente richiamate • la formulazione del problema • la rilevazione dei dati • lo spoglio e la classificazione dei dati • l’elaborazione • la presentazione dei risultati e sulle quali, in specie su quella che prevede l’elaborazione dei dati, pare opportuno qualche richiamo 25
Indici di localizzazione o valori medi Indici di variabilità Indici di simmetria Indici di appiattimento I fondamentali indici statistici descrittivi e la loro adeguatezza 26
Le medieLa media aritmetica Ciascun componente di un gruppo di n persone percepisce un reddito mensile di € xi ( € 1.000 al primo; € 2.000 al secondo; € 3.000 al terzo) In totale dunque il reddito complessivo sarà la somma dei redditi individuali (€ 6.000) La media aritmetica divide in parti uguali il totale. (m = € 2.000) Dunque assegnando a ciascuno la stessa quota del totale (€ 2.000) la somma dei redditi permane inalterata. L’adozione generalizzata di questa tecnica di sintesi è adeguata a rappresentare correttamente le diverse situazioni operative ? 27
L’adeguatezza delle medie Qual è il miglior rendimento per un investimento triennale che prevede il ritiro del montante alla fine del periodo in presenza delle seguenti 3 proposte che indicano i tassi a cui capitalizzare annualmente gli interessi maturati ? a) 10% nel 1° anno; 20% nel 2° anno; 30% nel 3° anno b) 30% nel 1° anno; 20% nel 2° anno; 10% nel 3° anno c) 20% nel 1° anno; 20% nel 2° anno; 20% nel 3° anno Ovvia appare l’equivalenza fra le 3 proposte seguendo l’indicazione della media aritmetica. Ma esaminando il risultato (montante) alla fine del periodo, supponendo di investire il capitale C … Dovendo sintetizzare grandezze moltiplicative la media adatta risulta la media geometrica 28
28a L’adeguatezza delle medie L’applicazione della legge sull’equo canone prevedeva che il tasso anno medio di crescita della popolazione residente nell’ultimo quinquennio superasse un certo livello (8,5%). La situazione di un dato Comune era quella presentata nella tabella • Il tasso annuo medio di variazione • - secondo il locatore risultava dell’8,477% (m. geometrica) • secondo il locatario risultava dell’8,697% (m. aritmetica) • Chi aveva ragione ? • Si osservi anzitutto che: • 4.000 x 1,10 = 4.400 4.400 x 1,045= 4.600 • 4.600 x 0,978 = 4.500 4.500 x 1,111= 5.000 • 5.000 x 1,20 = 6.000 • La verifica dell’adeguatezza di ciascuna proposta richiede che la sintesi media rifletta la • situazione reale che vede una popolazione iniziale di 4.000 unità diventare di 6.000 in 5 anni • Proposta del locatore: • Proposta del locatario: Conclusione: dovendo sintetizzare grandezze moltiplicative la media adatta risulta la media geometrica
L’adeguatezza delle medie Un ciclista percorre un km alla velocità di 20 km/h ed un secondo km alla velocità di 30 km/h. Qual è la velocità media tenuta nei 2 km? Un primo approccio (superficiale) potrebbe indurre all’applicazione della media aritmetica sui due valori 20 e 30, col risultato di una velocità media di 25 km/h. Risultato contraddetto dalla realtà dei fatti che, con tale scelta, verrebbero travisati. Infatti, per percorrere: n. 1 km. alla velocità di 20 km/h si impiegano 3 minuti n. 1 km. alla velocità di 30 km/h si impiegano 2 minuti In totale dunque 5 minuti per percorrere 2 km. Questa situazione reale, riportata in termini di media oraria, conduce a 24 km/h ! 2 km : 5 min = x km : 60 min x= 24 km/h In altri termini pedalando a 25 km/h per 2 chilometri non si impiegano 5 minuti ma un tempo inferiore Dovendo sintetizzare grandezze inversamente proporzionali la media adatta risulta la media armonica 29
30 L’adeguatezza delle medie I comuni A, B, C, D e E si collocano lungo un’autostrada al km. indicato nella colonna xi della tabella. Dove si potrebbe collocare la stazione di accesso per rendere minima la distanza da percorrere per fruire dell’autostrada ? (si supponga che i Comuni abbiano la stessa popolazione) La distanza complessiva da percorrere se la stazione fosse nel punto: • A (km.0) sarebbe 200 km; • E (km.100) sarebbe 300 km; • Media aritmetica (40km) sarebbe 160 km; • C (km.30) sarebbe 150 km; • al km. 29 sarebbe 151 km; al km. 31 sarebbe 151 km La soluzione non rientra fra le medie esaminate in precedenza ma richiede di ordinare i valori e di scegliere il termine che occupa la posizione centrale: tale valore è definito come mediana (nel caso in esame risulta 30 e riduce al minimo -150- le distanze)
Come appare dalle argomentazioni precedenti la scelta della media adatta a rappresentare un insieme di valori o adeguata per assumere decisioni coerenti richiede l’applicazione di tecniche specifiche.Ma anche di fronte a scelte corrette la media, da sola, risulta del tutto insufficiente a descrivere compiutamente i fenomeni collettivi se non viene, quanto meno, associata ad un opportuno indicatore capace di esprimerne la capacità informativa. Quest’ultima caratteristica sarà tanto più elevata quanto più vicini alla media saranno i valori assunti dal fenomeno e tanto più scarsa quanto più i dati risultano dispersi e distanti rispetto al valore medio.Queste considerazioni evidenziano la necessità di associare alla media adottata per sintetizzare la localizzazione di una variabile un opportuno indice di variabilità che descriva l’errore medio implicito nella media. Il più usato fra questi indici è loscarto quadratico medio (deviazione standard) che esprime, usando la stessa unità di misura dei dati, di quanto oscillano i valori attorno alla media 31
Calcolo dello scarto quadratico medio (deviazione standard) esprime, con la stessa unità di misura dei dati, di quanto oscillano i valori attorno alla media 31a
Da quanto precede emerge che la descrizione minima di un fenomeno quantitativo richiede di conoscere almeno: - la media - lo scarto quadratico medioMa questa sintesi minima diventa completa (nel senso che consente di conoscere tutte le caratteristiche del fenomeno) in presenza di distribuzioni normali ovvero in una grande varietà di situazioni operative (anche se non sempre) 32
Le relazioni tra fenomeni Qualitativi o misti: analisi della connessioneQuantitativi:analisi della correlazione 33
Le relazioni tra fenomeni qualitativiAnalisi della connessione fra due caratteri qualitativi Per analizzare gli eventuali effetti che un carattere qualitativo A, che assume r modalità A1, A2, …, Ar può esercitare su di un secondo fenomeno B, che, a sua volta, può assumere c modalità B1, B2, …, Bc si può procedere attraverso le seguenti fasi: 1) la rilevazione congiunta delle frequenze dei due caratteri;2) la costruzione di un modello teorico di indipendenza;3) il confronto fra l'osservazione e l'ipotesi di indipendenza; 4) nel caso di relazione non accidentale, la determinazione di un opportuno indice di connessione. 34
Le relazioni tra fenomeni qualitativiEsempio di Analisi della connessione Ai fini della programmazione edilizia universitaria si analizzare l’eventuale connessione fra la scuola di provenienza e la facoltà scelta. 1) la rilevazione congiunta delle frequenze dei due caratteri; 2) la costruzione di un modello teorico di indipendenza;3) il confronto fra l'osservazione e l'ipotesi di indipendenza; 4) nel caso di relazione non accidentale, la determinazione di un opportuno indice di connessione. 35
Le relazioni tra fenomeni quantitativiAnalisi della correlazione fra due o più variabili Quando la rilevazione statistica determina su una stessa unità elementare due o più caratteri quantitativi, l’interesse di determinare le relazioni fra le quantità osservate può trovare una sua soluzione analitica nella proposta di un modello funzionale nel quale si ipotizzi che la variabile y dipenda da una serie di variabili indipendenti o esplicative o predittive x1 , x2 , ..., xr . Nel caso più semplice, l’analisi multivariata si riduce alla considerazione di due sole variabili il cui modello teorico postula la grandezza y in funzione di una sola variabile esplicativa x, secondo la relazioneLe fasi della rappresentazione analiticaLa costruzione di un modello teorico che ponga una variabile dipendente y in funzione di una o più variabili esplicative o esogene o predittive si articola in diverse fasi che richiedono:1) la rilevazione congiunta dei valori osservati;2) la scelta del tipo di funzione;3) il calcolo dei parametri incogniti;4) l’utilizzo del modello (dopo la verifica della bontà di adattamento) 36
Le relazioni tra fenomeni quantitativiAnalisi della correlazione fra due o più variabili Esempio: Previsione (sintetica) dell’ammontare della popolazione residente nel Comune di Verona (P) in funzione del tempo ( t )La costruzione del modello teorico richiede:1) la rilevazione congiunta dei valori osservati; 2) la scelta del tipo di funzione; 3) il calcolo dei parametri incogniti;4) l’utilizzo del modello a scopo previsivo 37
Quando non esistono o sono inadeguate le fonti da cui attingere le informazioni è necessario rilevare i dati con un’indagine totale o, più spesso, mediante un’indagine campionaria 38
Schema • Indagini totali e campionarie • I campioni rappresentativi • I problemi delle indagini campionarie • I piani per Attributi: • Premesse metodologiche • I criteri di scelta delle unità campionarie • Il miglioramento delle stime • L’errore campionario • La dimensione campionaria • Cenni sui piani per variabili 39
Indagini totali e campionarieIl dato statistico • Nella fase di rilevazione dei dati, svolta mediante la raccolta delle informazioni secondo le modalità definite nella fase preparatoria in modo da ottenere, su ogni unità statistica, quelle caratteristiche che costituiscono l'oggetto dell'indagine, si possono raccogliere: • A) Caratteri qualitativi o Attributi, individuabili mediante aggettivi indicanti il possesso di certe proprietà o di determinate caratteristiche qualitative presenti nell'elemento a cui si riferiscono (maschio, femmina, stato civile, titolo di studio, professione, ecc.). • B) Caratteri quantitativi o Variabili. Molti fenomeni si possono cogliere misurandone l'intensità per mezzo di una opportuna unità di misura. Il dato statistico che scaturisce da questa operazione sarà dunque un valore (altezza, età, peso, reddito, saldo del c/c, importo fatturato, ecc.) 40
Indagini totali e campionarie % • La fase di rilevazione dei dati può essere: • Totale, ovvero cogliere tutte le unità che costituiscono la popolazione (insieme sotto osservazione costituite da elementi omogenei rispetto ad uno o più caratteri); • Parziale o Campionaria quando raccoglie solo una parte della popolazione. • Riguardo alla dimensione della popolazione (in senso statistico) si considera: • Popolazione infinita quella costituita da un numero talmente grande di unità da non essere precisabile nel suo ammontare, o quella virtuale; comunque ai fini operativi si considera infinita quando supera le 10.000 unità (per alcuni sopra le 100.000); • Popolazione finita se costituita da meno di 10.00 unità (per alcuni meno di 100.000). 41
I campioni rappresentativi Le indagini campionarie trovarono un formidabile impulso negli Stati Uniti ancora a partire dai primi decenni del secolo scorso, grazie all’impegno di alcuni pionieri che applicarono le prime tecniche delle ricerche di mercato ai sondaggi d’opinione, ottenendo risultati che allora apparivano incredibili. Al riguardo si pensi che un’agenzia di ricerca divenuta famosa, la Gallup, riuscì a prevedere nel 1936 la vittoria di Roosevelt su Landon nelle elezioni presidenziali con un sondaggio statistico rigoroso basato su circa 1.000 interviste. Il risultato apparve tanto più strabiliante per il fatto che una rivista allora in voga, la LiteraryDigest, aveva spedito un questionario sull’esito elettorale a 10 milioni di persone, selezionate dagli elenchi telefonici e dagli elenchi dei possessori di automobili. Il 57% dei 2,4 milioni di risposte assegnarono la vittoria a Landon che poi ebbe le preferenze del 38,5% degli elettori. La ragione del risultato fallimentare, che da allora rappresenta un classico su come non si debba progettare un’indagine campionaria, va ricercata nella non rappresentatività dei destinatari del questionario postale, la cui composizione era troppo sbilanciato a favore delle classi sociali più agiate. 42
I campioni rappresentativi % Criteri che orientano la scelta delle unità campionarie: • Campioni a scelta ragionata. La selezione delle unità campionarie viene affidata al giudizio del rilevatore o di un esperto del fenomeno su cui si indaga. Proprio per la mancanza di una rigorosa definizione dei criteri di scelta, dipendenti di volta in volta dalla valutazione personale, sull’affidabilità delle stime ricavabili con questi tipi di campioni, denominati anche non probabilistici, risulta impossibile esprimere un qualunque giudizio: non sono dunque campioni rappresentativi. • Campioni probabilistici. Si tratta di campioni nei quali ogni unità della popolazione viene selezionata in modo che presenti la stessa probabilità (o comunque una probabilità nota) di apparire nel campione. Il fatto che non sussistano criteri preferenzialinellascelta e che la numerosità campionaria sia adeguata, conferisce ai campioni probabilistici il carattere della rappresentatività statistica. Ne consegue la possibilità di affrontare i temi inferenziali mediante l’ausilio del calcolo delle probabilità sia nella fase della progettazione del piano, sia nella elaborazione delle informazioni, sia nell’estensione dei risultati alla popolazione. 43
Principali tipi di campioni probabilistici: • Campionamento casuale semplice. Ogni unità appartenente alla popolazione ha la stessa probabilità di presentarsi nel campione. L’estrazione casuale è il criterio base adottato, sia pure con modalità diverse, anche in tutti gli altri campioni probabilistici. • Campionamento stratificato. Scompone la popolazione in gruppi (strati) omogenei secondo un opportuno criterio di selezione (per genere, per classe d’età, per luogo di residenza, per titolo di studio, ecc.) estraendo poi tanti campioni casuali quanti sono gli strati. • Campionamento sistematico. La tecnica di selezione prevede l’estrazione casuale solamente della prima unità mentre le altre vengono determinate in modo automatico secondo una legge ricorrente. • Campionamento a grappoli. Suddivide la popolazione in gruppi (grappoli) estraendo prima il grappolo e successivamente ispezionando le unità in esso contenute (prima si estrae a caso la confezione con più prodotti; poi si esaminano le unità contenute nella confezione scelta). • Campionamento a più stadi. La popolazione e divisa in unità primarie (regioni), secondarie (province), terziarie (Comuni). Si estrae a caso dal 1° stadio, poi dal 2°, poi dai successivi fino all’ultimo ove si trovano le unità elementari. • Campionamento sequenziale • Campionamento a risposta casualizzata … 44
I problemi delle indagini campionarie • Come scegliere le unità • Quante unità inserire nel campione • Definire i margini di errore delle stime 45
I problemi delle indagini campionarie Nel seguito si tratterà: • di campioni puramente casuali (con cenni a quelli sistematici e stratificati) • di Piani di campionamento per Attributi (con cenni a quelli per variabili). Le risposte ai 3 problemi posti in precedenza (criteri di scelta, dimensione ed errore campionario) richiedono una premessa di ordine metodologico. 46
Aspetti metodologici Definizione dello scenario di riferimento • Popolazione costituita da N unità (tot. famiglie) • di cui C con un certo carattere (fam. con minori) Se fosse possibile l’indagine totale la composizione della popolazione sarebbe descritta dalla proporzione in cui è presente il carattere costruita come rapporto fra: • il numero C di unità aventi il carattere di interesse • ed il totale N (con 0 p 1) q = 1 – p = probabilità contraria (fam. senza minori) 47
Aspetti metodologici Definizione dello scenario di riferimento • Popolazione costituita da N unità (tot. Famiglie = t.F) • di cui C con un certo carattere (famiglie con minori = f.c.) Non potendo (o non volendo) effettuare l’indagine totale si opta per: • l’estrazione casuale di un campione esaustivo di n unità; • la determinazione del numero x di elementi camp. con il carattere; • la stima della composizione della popolazione (p) mediante il rapporto (frazione di f.c su t.F nel campione) Questi risultati sono equiprobabili ? Se non lo sono quali regole seguono ? Quale errore di stima implicano? 48