200 likes | 621 Views
Variables qualitatives. Taules de freqüències: freq. absolutes , percentatges i freq.relatives Gràfiques: barres , sectors , de Pareto , i altres Descriptius : la moda , per a totes les qualitatives la mediana i els percentils , per a les qualitatives ordinals
E N D
Variables qualitatives Taules de freqüències: freq.absolutes, percentatges i freq.relatives Gràfiques: barres, sectors, de Pareto, i altres Descriptius: la moda, per a totes les qualitatives la mediana i els percentils, per a les qualitatives ordinals Un exemple de variable nominal: estudi complert Un exemple de variable ordinal: estudi complert
Taules de freqüències per a variables qualitatives • Consisteixen en un resum dels valors o modalitats diferents que pren la variable qualitativa, amb el recompte del nombre d’aparicions per a cada valor. Exemple: Variable religió majoritària. Casos: països. Pag. 18 Sense valors perduts Valors o modalitats (27/109)x100 (27/108)x100
Exemple: Variable regió econòmica. Casos: països. Pag. 19 Sense ponderar: tots els països el mateix pes Ponderant segons la població: cada país té un pes proporcional a la seva població
Taules de freq. per a variables qualitatives: resum • S’utilitzen per resumir la informació delskvalors o modalitats d’una variable qualitativa, en un total dencasos:k ≤ n • Les freq. absolutes o recomptes indiquen, per a cada valor,xi, el nombre de vegades que es repeteix:ni • Les freq. relatives o tants per ú indiquen, per a cada valor,xi, la proporció de vegades que es repeteix:fi • Els percentatges o tants per cent indiquen, per a cada valor,xi , el % • de vegades que es repeteix:pi=
Gràfiques per a variables qualitatives: barres • Per a cada valor o modalitat, s’aixeca una barra d’altura igual (o proporcional) a la seva freqüència o percentatge. Pag. 26 Exemple: Variable religió majoritària. Casos: països. Pag. 27
Aparentment, les religions cristianes semblen molt més majoritàries, del que en realitat són Exemple: Variable religió majoritària: tipologies. Casos: països. Pag. 27 L’eix no comença al 0
Gràfiques per a variables qualitatives: sectors • Per a cada valor o modalitat, es considera un sector d’angle proporcional a la seva freqüència o percentatge. Pag. 27 Exemple: Variable religió majoritària: tipologies. Pag. 28 Els països no estan ponderats: per a cada modalitat, es veu el % de països Els països estan ponderats per població: per a cada modalitat, es veu el % de població
Gràfiques per a variables qualitatives: barres de Pareto • Diagrama de barres per als valors o modalitats ordenats de més a menys freqüent. Doble eix vertical: a l’eix principal de l’esquerra freqüències (o %), corresponents a les barres; a l’eix secundari de la dreta, % acumulats, corresponents a la línia poligonal creixent. Pag. 29 Exemple:Variable religió majoritària: països sense ponderar Entre catòlica, musulmana i protestant hi ha gairebé el 80% dels països
Descriptius per a variables qualitatives: la moda • La moda (Mo) és el valor o modalitat més freqüent de la variable. Li corresponen màxima freqüència absoluta, relativa i percentatge. Pag. 42 Exemple: La moda de la taula 1.1, és la religió catòlica, atès que té el % més elevat de països: 38% • Equivalentment, li corresponen la barra més alta i el sector d’angle més gran. Exemples: La moda de les modalitats de religió dels països sense ponderar, és la modalitat de religions cristianes, atès que té el sector més gran: 60.19% de països. La moda de les modalitats de religió dels països ponderats per població, és la modalitat d’altres religions, atès que té el sector més gran: 48.47% de població.
Remarques i propietats importants de la moda • És fàcil de calcular. És una característica de posició central. • La moda és més significativa, si té una freqüència sensiblement superior a les dels altres valors. • Pot no ser única, si la màxima freqüència correspon a dos o més valors. Es parla de distribucions unimodals, bimodals, etc. Exemple: La distribució de països (sense ponderar per població) segons regions econò-miques, té dues modes: OCDE i Amèrica Llatina, amb un 19.3% de països.
Per contra: La distribució de regions econòmiques, per països ponderats per població, és unimodal: Moda=Àsia/Pacífic, amb un 58.5% de la població.
Descriptius per a variables qualitatives ordinals: la moda, mediana, els quartils i els percentils • La mediana (Md) és el valor que ocupa la posició central quan tenim totes les observacions ordenades: la meitat d’observacions (50%) són menors o iguals que la mediana i l’altra meitat són majors o iguals. Pags. 39,.. Exemples, amb poques dades: n senar La mediana de3, 27, 30, 51 i 100és30, és la que està al mig:Md = 30 La mediana de3, 3, 3, 5 i 7és3, és la que està al mig:Md = 3 Exemples, amb poques dades: n parell La mediana de 3, 27, 51i100 és la mitjana de les dues que estan al mig: Md = (27+51)/2 = 39 La mediana de 3, 3, 3i 5 és 3, és la mitjana de les dues que estan al mig: Md = (3+3)/2 = 3
Càlcul de la mediana per a les dades resumides en una taula de freqüències • Els valors han d’estar ordenats • Localitzarem el primer percentatge acumulat que supera el 50%, el valor corresponent és la mediana. • Cas que hi hagi un percentatge acumulat igual al 50%, farem la mitjana entre el valor corresponent i el següent (només pot ocórrer si n és parell) Exemple, a partir d’una taula de freqüencies: n senar Md = 4
Exemples, a partir d’una taula de freqüencies: n parell a) Cap percentatge acumulat coincideix amb el 50% Md = 5 b) Un percentatge acumulat coincideix amb el 50% Md =(5+7)/2 = 6
Distribució d’una variable de tipus numèric, mesurada en escalaordinal: l’últim interval és obert!
Els percentils: quartils i decils (casos particulars):Pgs. 44,... • El percentil o centil d’ordre r(Cr) és el valor tal que un (r x 100 %) de les observacions són menors o iguals que Cr i el (100-r) x 100 % són majors o iguals. Es localitzen a partir dels percen-tatges acumulats. Per exemple, C60és tal que el 60% d’observacions són menors o iguals i el 40% són majors o iguals, etc. Es localitza a partir del primer percentatge acumulat que supera el 60%, el valor corresponent és el centil 60. A la taula pag. anterior, veiem que: C60correspon a l’interval 25000$ a 29999$, que podem representar pel seu punt mitjà: 27500$ C90correspon a l’interval 60000$ a 74999$, que podem representar pel seu punt mitjà: 67500$ [25000, 30000)
La mediana és el centil 50: parteix la distribució en dues parts, cadascuna amb un 50% d’observacions
Hi ha tres quartilsQ1= C25 , Q2= C50 = Md , Q3= C75 que parteixen la distribució en quatre parts, cadascuna amb un 25% d’observacions (una quarta part de l’àrea)