430 likes | 1.12k Views
Liceo Classico Linguistico “D. Crespi” Corso di preparazione ai test universitari. Elementi di STATISTICA DESCRITTIVA. Lezione 1. ______________ anno scolastico 2001/2002. Che cos’è la statistica. Nata per descrivere le caratteristiche demografiche, economiche, … degli stati, è
E N D
Liceo Classico Linguistico “D. Crespi” Corso di preparazione ai test universitari Elementi di STATISTICA DESCRITTIVA Lezione 1 ______________ anno scolastico 2001/2002
Che cos’è la statistica Nata per descrivere le caratteristiche demografiche, economiche, … degli stati, è l'insieme delle tecniche utilizzate per raccogliere, elaborare e interpretare i dati che riguardano collettività, al fine di studiare un fenomeno e poterne prevedere gli sviluppi.
Statistica descrittiva • la ricerca statistica viene fatta sull’intera “popolazione” • censimento della popolazione italiana • rilevazione del gradimento della scuola Statistica • Statistica inferenziale • la ricerca viene fatta su un “campione casuale” della popolazione con lo scopo di ottenere informazioni relative all’intera popolazione • verifica della durata delle batterie prodotte da una ditta • proiezioni sull’esito delle elezioni politiche
Il primo passo da fare in un’indagine statistica è individuare il gruppo di persone o oggetti che dobbiamo studiare, cioè • La “Popolazione”: insieme degli “individui” o “unità statistiche” che presentano caratteristiche comuni: • appartengono alla stessa nazione, • frequentano la stessa scuola, • sono bovini allevati nella stessa stalla, • batterie prodotte dalla stessa ditta…… Chiaramente la scelta della popolazione dipende dagli obiettivi dell’indagine. La rilevazione ed elaborazione statistica riguarda i “caratteri” o “argomenti” comuni agli individui della popolazione.
Qualitativi - “modalità” • colore degli occhi • religione Caratteri o tipi di dati • Quantitativi - “valori”(espressi mediante numeri) • statura, peso, • durata delle batterie
un carattere che assume valori diversi lo chiameremo variabile • esempi • 1. Il peso degli studenti di una classe varia (in generale) da soggetto a soggetto • Il carattere “peso” è una variabile (quantitativa) • 2. La temperatura esterna varia durante il giorno • la “temperatura” è una variabile (quantitativa) • 3. Il colore degli occhi varia da persona a persona • il carattere “colore degli occhi” è una variabile (qualitativa)
Livelli di misurazione delle variabili • Le variabili differiscono anche per il tipo di misurazione che può essere fatta (tipi di scale). • 1. La variabile “colore occhi” può assume le modalità: celeste, verde, marrone, nero …. • 2. La variabile “titolo di studio” può assumere i valori: nessuno, lic. elementare, lic. media, lic. scuola superiore, laurea. • 3. La variabile QI può assumere i valori: 100, 120, 150, 89, …… • 4. La variabile stipendio può assumere i valori: 1 milione, 2 milioni, 40 milioni, ….
Si distinguono 4 livelli o scale di misurazione: • 1.Scala nominale • es. Colore degli occhi; sesso; nazionalità • è il livello più basso della misurazione, i dati non hanno alcun ordine precostituito • consente la comparazione in termini di uguale o diverso • femmina = femmina, femmina maschio Scale di misurazione • 2.Scala ordinale • es. Titolo di studio • i valori possono esser ordinati secondo il criterio di “inferiore”, “superiore”, “migliore”;c’è un ordine logico nei dati. • lic elementare < lic media < ….< laurea
livelli o scale di misurazione: • 3.Scala a intervalli • es. QI, Temperatura Celsius, Fahrenheit. • è il primo livello propriamente quantitativo • consente il calcolo della distanza (o differenza) tra due valori, ma non il loro rapporto • QI = 125– 100 =25 Scale di misurazione • 4.Scala di rapporti • es. Stipendio percepito, peso, età…..sono caratterizzati dall’avere uno Zero non convenzionale. • i valori possono esser rapportati tra loro nel senso che si può dire che un valore è doppio o triplo di un altro • 4 milioni = 4 • 1milione = 2 • 2 milioni
Livello moda mediana media Nominale SI NO NO Ordinale SI SI NO Intervalli SI SI SI Rapporti SI SI SI • Le differenti scale di misurazione delle variabili determinano il tipo di indice statistico calcolabile.
Le fasi di una ricerca statistica • 1. Studio del problema e impostazione della ricerca statistica: • scopo della ricerca, definizione del fenomeno che vogliamo studiare, ipotesi che si vogliono provare • individuazione della popolazione. • 2. Rilevamento, classificazione e tabulazione dei dati: • i dati raccolti vengono raggruppati in classi omogenee e riportati in tabelle • 3. Rappresentazione grafica e analisi dei dati • Diagrammi: la rappresentazione grafica dei dati consente di rilevare più facilmente le loro caratteristiche, ma manca di precisione.
Le fasi di una ricerca statistica • 3. _________ • Elaborazione: consiste nell’esaminare i dati mediante metodi matematici al fine di determinare alcuni indici rappresentativi del fenomeno • 4. Conclusioni dell’indagine: • relazione conclusiva in cui viene riportato quanto rilevato in relazione al fenomeno studiato: • il prodotto interno lordo è aumentato del 5% negli ultimi 10 anni • si è osservato un aumento della piovosità media nel mese di gennaio
Rappresentazioni numeriche di distribuzioni statistiche In generale, le indagini statistiche portano alla raccolta di una grande quantità di dati. Per poterli studiare e individuare le caratteristiche di un fenomeno statistico è necessario raggruppare opportunamente i dati. • Il raggruppamento viene fatto in classi e rappresentato mediante tabelle in cui vengono riportate le frequenze assolute o relative o percentuali dei dati. • Solitamente il numero delle classi è compreso tra 5 e 20 a seconda del numero dei dati. • e le ampiezze delle classi devono essere possibilmente uguali.
Rappresentazioni numeriche di distribuzioni statistiche La frequenza assoluta f di una modalità o di un valore è uguale al numero di volte che il valore compare nella distribuzione. La frequenza relativa r o fr è uguale al rapporto tra la frequenza assoluta del dato e il numero totale di dati La frequenza percentuale è la frequenza relativa che viene espressa in percentuale (cioè la frequenza riferita a 100 elementi):
Rappresentazioni numeriche di distribuzioni statistiche Sistemati i dati in un certo ordine delle volte è necessario sapere la frequenza dei valori che sono minori o maggiori di una data modalità La frequenza cumulata corrispondente alla modalità Xi è la somma della frequenza di Xi e di tutte le modalità che precedono Xi secondo l’ordine fissato. Le frequenze cumulate possono essere: cumulate assolute, cumulate relative, cumulate percentuali.
Rappresentazioni numeriche di distribuzioni statistiche EsempioIn un circuito elettrico sono stati misurati i seguenti valori di tensione che sono stati raggruppati in 10 classi, chiuse a destra, di ampiezza 0,05 Volt
Rappresentazioni numeriche di distribuzioni statistiche Nella tabella seguente sono riportate anche la freq relative. +
Rappresentazioni grafiche di distribuzioni univariate Le rappresentazioni grafiche hanno lo scopo di rappresentare in modo semplice le caratteristiche di una distribuzione di frequenza. Consentono di avere una visione immediata e complessiva di un fenomeno statistico. Hanno l’inconveniente di mancare di precisione e di prestarsi a letture soggettive Sono di diverso tipo e vanno scelte in relazione al tipo di dati da rappresentare.
Rappresentazioni grafiche di distribuzioni univariate Vediamo alcuni esempi di rappresentazioni grafiche e utilizziamo come dati quelli della seguente tabella:
Rappresentazioni grafiche di distribuzioni univariate ISTOGRAMMI: sono grafici a barre verticali. Sull’asse orizzontale vengono riportati i valori della variabile, mentre sull’asse verticale le frequenze assolute, o relative, o percentuali con cui le variabili compaiono. Un istogramma è una rappresentazione areale, cioè l’area dei rettangoli, e non la loro altezza, è proporzionale alla frequenza del dato.
Rappresentazioni grafiche di distribuzioni univariate DIAGRAMMI a BARRE:i dati vengono rappresentati mediante linee continue più o meno spesse.L’altezza o lunghezza delle barre è proporzionale alla frequenza del dato. Negli Ortogrammi o grafici a nastri gli assi sono scambiati per consentire una lettura più facile: sull’asse x sono riportate le frequenze, sull’asse y i valori delle variabili
Rappresentazioni grafiche di distribuzioni univariate AEROGRAMMI:le frequenze di una variabile qualitativa vengono rappresentate mediante superfici di figure piane: quadrati rettangoli, cerchi..Le frequenze dei dati sono proporzionale all’area delle superfici. del dato. Nei DIAGRAMMI CIRCOLARI o a TORTA si divide il cerchio in settori proporzionali alla frequenza del dato
Rappresentazioni grafiche di distribuzioni univariate DIAGRAMMA POLARE:viene utilizzato principalmente per rappresentare caratteri relativi a fenomeni ciclici (mensili, settimanali, giornalieri)Le frequenze dei dati sono proporzionale alla distanza dal centro
Rappresentazioni grafiche di distribuzioni univariate CARTOGRAMMI:vengono utilizzati per rappresentare dati relativi a distribuzioni geografiche: densità di popolazione per regione, produzione agricola per regione, nazione ecc…