140 likes | 344 Views
Rappresentazione tabellare dei dati. Elaborazione dei dati.
E N D
Elaborazione dei dati Quando si raccolgono informazioni su un determinato fenomeno (v. anche matrice dei dati) ci si trova ad avere un gran mole di informazioni; quindi il problema diventa “sintetizzare la massa di dati grezzi” in pochi numeri o indici utilizzando metodi di sintesi che descrivano i dati.
Elaborazione dei dati • La distribuzione di un determinato collettivo secondo alcuni caratteri contiene tutte le informazioni sul collettivo che, spesso però sono troppe e quindi diventa difficile acquisirle tutte insieme o utilizzarle per fare confronti, ma occorrono delle sintesi (o elaborazioni). • Le “sintesi” dei dati facilitano la mente nell’acquisizione delle informazioni ma fanno anche perdere parte dell’informazione. • Le elaborazioni che si possono fare dipendono dal tipo di carattere (qualitativo o quantitativo)
5 6 3 4 7 2 3 2 3 2 6 4 3 9 3 2 0 3 3 4 6 5 4 2 3 6 7 3 4 2 5 1 3 4 3 7 0 2 1 3 1 5 0 4 5 Sistemazione dei dati in tabella: spoglio
Sistemazione dei dati in tabella: spoglio Dato un certo numero di unità statistiche la prima operazione di sintesi è “contare” quante volte si presenta un determinato carattere sul collettivo di riferimento • 5 6 3 4 7 2 3 2 3 2 6 4 3 9 3 2 0 3 3 4 6 5 4 2 3 6 7 3 4 2 5 1 3 4 3 7 0 2 1 3 1 5 0 4 5 • Frequenza assoluta:è il numero di volte con cui si presenta una data modalità
Distribuzione di frequenza: è la tabella che associa ad ogni modalità la sua frequenza
Frequenze Frequenza relativa: si ottiene rapportando la frequenza assoluta al numero totale delle osservazioni La Frequenza percentuale si calcola moltiplicando ogni frequenza relativa per 100
Frequenze cumulate e retrocumulate • La frequenza cumulata di una modalità corrisponde al numero (o alla percentuale) di casi che presentano quella modalità o una modalità precedente • La frequenza retrocumulata di una modalità corrisponde al numero (o alla percentuale) di casi che presentano quella modalità o una modalità successiva • La frequenza cumulata si può calcolare solo se la variabile è ordinale o quantitativa. Essa è data dalla somma della frequenza assoluta, relativa o percentuale, della modalità i-esima con tutte le frequenze (assolute, relative o percentuali) precedenti: Cumulata assoluta: Ni= n1 + n2 + ……….ni Cumulata relativa: Fi= f1 + f2 + ……….fi
Distribuzione statistica di due caratteri: tabella di contingenza DISTRIBUZIONI PARZIALI PER CLASSI DI ETA’ DISTRIBUZIONI MARGINALI DISTRIBUZIONI PARZIALI PER CAUSA DI DECESSO
Distribuzione statistica di quantità • Distribuzione di quantità:è la tabella che associa ad ogni modalità l’ammontare del carattere che è imputabile a quella data modalità.
Esempio di distribuzione di frequenza e di quantità La serie geografica è la tavola statistica che descrive la distribuzione di un carattere nello spazio Distribuzione di frequenza Distribuzione di quantità
seriazioni, se si contano le unità che presentano gli stessi valori di un carattere quantitativo SERIAZIONE Carattere quantitativo serie, se si contano le unità che presentano le stesse modalità di un carattere qualitativo (geografico, alfabetico, cromatico ecc Carattere qualitativo SERIE La Serie storica è la tavola statistica che descrive l’andamento di un carattere nel tempo