290 likes | 429 Views
Interpretarea datelor statistice prin parametrii de pozitie. Proiect realizat de alexandru corici , traian plosca si alexandru lutic.
E N D
Interpretareadatelorstatisticeprinparametrii de pozitie Proiectrealizat de alexandrucorici, traianploscasialexandrulutic
Analizasiinterpretareadatelorstatistice legate de un studiu statistic s-a realizatpana la acest moment cu ajutorulfrecventelorsi a graficelorstatistice. Cu ajutorulacestorcaracteristici se poateobserva cu usurintavariabilitateamarimilor care se obtin ca rezultat al unormasuratori.Desiexistaaceastavariabilitate se observa o tendinta a datelorstatistice de a se grupa in juruluneianumitevalori(tendintacentrala). • Pentru o seriestatisticaesteinteresant de gasitaceamarime care survinecelmai des, aceamarime care esteceamaireprezentativapentrutoataseria.Oastfel de marime se numeste indicator sauparametru de pozitiedeoarecearatapozitiaelementelorprincipale ale seriei in cadrulacesteia. • Reprezentativitateaunorastfel de marimieste data de gradul de concentrare a datelorstatistice in jurullor.
Valoareamedie a uneiseriistatistice • Se numestevaloreamediesau media variabileistatisticeX,mediaaritmetica a tuturorvalorilorvariabileistatisticecalculatapentrutoateunitatilepopulatieistatistice. • Valoareamediex¯reprezinta media aritmeticaponderata a valorilor x1….xp ale variabileistatistice cu ponderile n1…np
Exemplu: • Sa calculam media variabileistatistice a serieistatistice din urmatorultabel: • Avem: • Asadar, concentrareanotelor la teza se realizeaza in jurulnumarului 7,86
Dacavariabilastatistica X estecantitativa de tip continuu,atunci in loculvalorilor xi din formula se vorluamediilearitmetice ale extremitatilorclaselor de valori(valorilecentrale ale claselor de valori). • Exemplu: Sa consideramseriastatistica data de urmatorultabel:
Pentrucalculareavaloriimedii a variabileicantitative de tip continuu,vomscriemaiintaiseriastatistica ,i=1.6 undeestevaloareacentrala a clasei • Valoareamedie a variabileistatisticeeste: • Se obtine ca: • Asadar,tendintavalorilorvariabileistatisticeesteaceea de grupare in jurulvalorii 169,32. • Diferentareprezintaabatarea de la medie a valorii .Suma abaterilor de la medie a valorilorvariabileieste 0.
Medianaserieistatistice • Fie seriastatistica , ,ordonatasi N efectivul total al populatieistatistice. • Medianaundeiseriistatisticeordonateestevaloarea Me care impartesirulordonat al valorilorvariabilei in douaparti,fiecare parte continandacelasinumar de valori.
Exemplu: • 1.Daca o caracteristicaiaurmatoarele 11 valoriasezate in ordine crescatoare:1,3,3,3,4,5,6,6,7,8,8 atunci Me=5, deoareceexista 5 valorimaimicidecat 5, si 5 valorimaimari. • 2.Fie sirulcrescator de valori ale uneicaracteristicinumerice distincte:1,3,3,3,4,6,7,8,8,9.Sirul valorilor are 10 elemente.Inacestcaz se alegedreptmediana a serieinumarul Me= . Uneori se iacamedianaoricare din numerele 4 sau 6.
Medianauneiseriistatistice cu variabilacantitativadiscreta se obtineastfel: • -se aseazacele N valori ale variabilei in ordinecrescatoaresaudescrescatoare; • -daca N estenumarimparatunci , iardaca N estenumar par(N=2k) atunci
Observatie! • Dacavalorilevariabileisuntnumeroase ,se recomandadeterminareafrecventelor absolute cumulate, apoi se cautavaloareavariabilei care corespundeunitatiistatisticesituata la mijloculseriei,sauintervalul care cuprindeaceaunitatestatistica. • Efectivulnotal al populatieieste 94.Pozitia centrala a siruluiordonat al valorilorvariabileieste 94/2=47.Unitatea statisticasituatapepozitia 47 corespundecelei de-a treiasecvente cumulate crescatoare.Asadar Me=7.
Sa determinamacummedianauneiseriistatistice cu variabilacantitativa de tip continuu.Pentruaceasta,saconsideramdistributiaunui lot de piesedupadiametrullormasurat in mm. • Jumatate din efectivul total al populatieieste 60/2=30. • Clasa de valori din seriafrecventelor absolute cumulate careia ii corespundecelputinjumatate din efectivul total al populatiei se numesteclasamediana. • In cazulseriei date clasamedianaeste [30,40).Presupunand ca pentruaceastaseriecrestereaefectivuluiesteproportionala cu crestereavalorilorvariabilei,avem: • La crestereaefectivului cu (37-25) piese,corespundecrestereavalorilotvariabilei cu (40-30)=10 mm; • La crestereaefectivului cu (30-25) de piese ,cecrestere a valorilorvariabileicorespunde? • Aplicandregula de treisimpla, se obtine: (30-25)*(40-30)/(37-25)=25/6=4,17 mm • Rezultacamedianaserieistatisticeeste Me=30+4,17=34,17 mm.
Medianauneiseriistatistice cu variabilacantitativa de tip continuu se calculeaza cu formula: ,unde: • L=limitainferioara a claseimediane; • =cotamedianei (daca N estepar,atunci =N/2,iar daca N esteimpar,atunci • Ni-1=frecventaabsolutacumulatacrescatoarepana la clasamediana; • =frecventaabsolutacorespunzatoareclaseimediane; • k=amplitudineaclaseimediane:
Me=30+[(30-25)/12]*10=34,17 • Se poatecalculasi cu regula de treisimpla: • (37-25)…………….(40-30)mm • (30-25)…………....X mm • X=(30-25)*(40-30)/(37-25)=25/6=4,17 mm→Me=30+4,17=34,17mm. • Concluzie:Medianaserieistatisticeeste un indicator al pozitionariivalorilor xi ale acesteia.Aceastaesteutila in realizareaierarhizariivalorilor.
Modululuneiseriistatistice • In multeactivitatieconomico-socialeprezintainteresaceleaspecte care survincelmaifrecvent in derularealor. • De exemplu,comparareanumarului de apeluritelefonicepeintervalemici de timpdaposibilitateadeterminariiperioadei din zicand o centralatelefonicaestecelmaimultsolicitatasi, in consecinta,daposibilitateadeterminariicapacitatiioptime a centralei. • Astfel de probleme se rezolvafolosindparametrul statistic de pozitienumitmodulsaudominanta.
Modululsaudominantauneiseriistatistice ,reprezintavaloareasauclasa de valori a variabilei care corespundeceluimai mare efectivsi se noteaza Mo. Asadar,modululsaudominantaesteparametrulceevidentiazavaloareavariabilei care aparecelmaifrecvent in multimeadatelor. Exemplu: 1.Fie distributiaunuigrup de tineridupainaltimeamasurata in cm: Clasamondialaeste[175,180) careia ii corespundeceamai mare frecventa.Modululsrieipoatefiexprimatprinvaloareacentrala a claseimondiale: .
Pentrudeterminareauneivalorimaiexacte a modululuiuneiseriistatistice cu date grupate in clase de valori,saconsideram o secventa a diagrameistructurale a acesteia care sacontinasivalorile din clasamodala [1,L). • Notam: =diferentadintrefrecventaclaseimodalesiaceea a claseianterioareei. =diferentadintrefrecventaclaseimodalesiaceea a claseiurmatoare. k=amplitudineaclaseimodale,k=L-1 Conform graficului se obtineurmatoarearelatie de proportionalitate: ,relatie din care se obtine Dacaintervalul anterior claseimodale are frecventamai mare decat a intervaluluiurmatorclaseimodale , atunci : Pentruseriastatistica din exemplu de maisus se aplica formula a 2 –a si se obtine:
Observatii: • 1. In cazulformulei a 2a Mo estemaiestemaiapropiatde 1. In cazulprimeiformule Mo estemaiapropiat de L. • 2. Mo coincide cu o valoare a variabileistatistice,reprezentandceamaifrecventavaloare a repartitiei. • 3. Mo nu e influentat de valorilefoartemicisaufoartemari ale variabilei. • 4. O seriestatisticapoateaveamaimultemodule.Modululprezintainteresdacaesteunic.
Dispersia.Abatereamediepatratica • Sa consideramurmatoareleseturi de date: • {1,2,3,3,4,5} si {2,40;2,50;2,60;2,70;2,80;5} • Se constata ca ambelesiruri de date au valoareamedieegala cu 3,sunt disticte ,iardateleprimului sir suntmairaspandite in raport cu media fata de cele ale setului al 2 lea. • Pentru a masuragradul de imprastiere a dateloruneiseriistatisticefata de medie se folosescurmatoriiparametri de pozitie: dispersiasiabatereamediepatratica.
Fiind data seriastatistica ,dispersiavaloriloreste media aritmeticaponderata a patratelorabaterilor de la medie ale valorilorvariabilei. • Se noteaza: • In cazuldatelorgrupate in clase de valori,seconsideraabaterilecentrelorclaselor de valori de la medie. • Comparareadispersiilor a 2 seriistatisticecapatasemnificatie in cazulcandsirurile de date suntexprimate in aceeasiunitate de masura. • Fiind data seriastatistica , se numesteabateremediepatratica a valorilorvariabileinumarului , undeestedispersiaseriei. • Asadar, .
Abatereamediepatraticadaposibilitateacaracterizariidispersieivalorilorvariabileistatistice.Astefel,oserie care esteputindispersata,adicaprezintavaloricesuntstransgrupate in jurulvaloriimedii, conduce la o abateremediepatratica mica. • Problemarezolvata: • Distributiaunui lot de autoturismenoi,dupaconsumul de carburant la 100km parcursi,seprezintaastfel: • Sa se caracterizezeseriastatisticafolosinddispersiesiabatereamediepatratica. • Fie valoareacentrala a clasei de valori,i≥1
Pentruconcentrareacalculelorvomatasa la tabelul de date de maisusurmatoarelerubrici: • Cu ajutorulcalculelor din acesttabel, avem:
Se observa ca pentruesantionul de 400 de autoturismeconsumulmediu la 100 km este de aproximativ 8 litri. • Dispersiavalorilorconsumului de carburant in jurulvaloriimedii 8 este de 0,3596 litri.Valoarea mica a acesteiasugereazafaptul ca valorileconsumului de carburant suntdestul de stranse in jurulmediei. • Dispersiavalorilorconsumului de carburant in jurulvaloriimedii,masurataprinabatareamediepatraticaeste de 0,5997 litri.Aceastaarata ca valorileconsumului de carburant se abate in medie cu aprozimativ 0,6 litri(in plus sau in minus) de la consumulmediu. • Definitie: Raportuldintreabatereamediepatraticasivaloareamedie a uneiseriistatistice se numestecoeficient de variatie.Senoteaza: • Acest indicator daposibilitateaaprecieriigradului de omogenitate a uneiseriistatistice.Uncoeficient de variatie sub 15% indica o omogenitatebuna a repartitieiunuifenomensi ca valoareamedieestereprezentativa.
Exemplu: • Pentruseriastatistica din tabelul anterior se obtine: • Interpretare: Coeficientul de variatie 7,5% indica o omogenitate a consumului de carburant. Asadar, lotul de masini are un ritm de consum bun (niciprea mare, niciprea mic).
THE END Vamultumimpentruatentie!