590 likes | 1k Views
sportska statistika. Klasifikacija varijabli i uređivanje podataka. U svakodnevnom životu prikupljamo mnoštvo podataka. Statistika nam daje metode za njihovo organiziranje i sažeto prikazivanje, te izvlačenje zaključaka na osnovu informacija sadržanih u tim podacima.
E N D
sportska statistika VJEŽBE 1 Klasifikacija varijabli i uređivanje podataka
U svakodnevnom životu prikupljamo mnoštvo podataka. Statistika nam daje metode za njihovo organiziranje i sažeto prikazivanje, te izvlačenje zaključaka na osnovu informacija sadržanih u tim podacima. Ime 'statistika' dolazi od latinskog status - stanje, situacija.
OSNOVNI STATISTIČKI POJMOVI Populacija - dobro definiran skup objekata koji nas zanimaju radi mjerenja/ispitivanja jednog ili više obilježja/svojstava. Populacija može biti konačna ili beskonačna, realna ili hipotetska. Primjeri: Svi stanovnici Republike Hrvatske na dan 12.03.2012. Svi sportaši u nekom gradu na dan 31.12.2011. Sve utakmice Lige Prvaka sezone 2011/2012. Svi automobili koji će se proizvesti na osnovu 5 prototipova. Svi mogući rezultati nekog mjerenja (npr. svi mogući ishodi bacanja novčića, kocke; svi mogući rezultati određene utakmice...)
Uzorak - podskup populacije koji uzimamo na unaprijed određen način. Primjeri: Iz populacije svih hrvatskih sportaša odaberemo samo njih 100 slučajnim izborom. U skladištu sportskih dresova odaberemo jednu kutiju ili od svakog modela po 2 primjerka. Od automobila neke marke uzmemo samo one prodane u Splitu 2011. Potrebno je pažljivo i oprezno odabrati uzorak da bi on bio reprezentativan.
Statistiku dijelimo na: deskriptivnu (opisnu) inferencijalnu (statističko zaključivanje). Deskriptivna statistika (opisna) Istraživač je prikupio podatke i želi ih organizirati, te sažeto opisati njihova važna svojstva. Pritom se koristi nekim grafičkim metodama (histogrami, krivulje, kružni dijagrami,..) i računa određene numeričke vrijednosti, tzv. parametre (prosjek, standardnu devijaciju, korelacijski koeficijent,...) Inferencijalna statistika (statističko zaključivanje) Istraživač je proučio uzorak i iz njegovih svojstava želi izvesti zaključke o cijeloj populaciji. Ti zaključci predstavljaju procjenu parametra s određenom vjerojatnošću.
Na odabranoj populaciji mogu se mjeriti ili ispitivati različita obilježja (svojstva). Tako npr. na populaciji sportaša možemo ispitivati visinu, težinu, kojem klubu pripada, novčanaprimanja, kategoriju... Svaku funkciju sa skupa populacije u skup obilježja nazivamo statističkom varijablom. Na populaciji koja se sastoji od svih utakmica koje je odigrao određeni košarkaš u jednoj sezoni, možemo mjeriti npr. broj šuteva iz igre za 2 i 3, broj slobodnih bacanja, broj zgoditaka za svaku vrstu šuteva, broj asistencija, osvojenih lopti po utakmici itd.. Kod ispitivanja visine sportaša, populacija je određeni skup sportaša, a obilježje je realan broj (tj. skup obilježja je skup realnih brojeva) a statistička varijabla „visina” je preslikavanje iz skupa sportaša u skup realnih brojeva. DESKRIPTIVNA STATISTIKA
Više različitih varijabli koje djeluju na istoj populaciji možemo promatrati kao jednu višedimenzionalnu varijablu. Nju je najprikladnije prikazati matrično (tablično), gdje vrijednost na mjestu (i,j) predstavlja vrijednost j-te varijable na i-tom populacijskom članu. Na sljedećem primjeru prikazani su statistički podaci jednog hrvatskog košarkaša za sva natjecanja sezone 2010/2011. Slika je preuzeta sa www.kosarka.org uz prethodnu dozvolu. VJEŽBE 1
KLASIFIKACIJA VARIJABLI VJEŽBE 1
KVALITATIVNE VARIJABLE Kvalitativne varijable dijelimo na nominalne i ordinalne. Kod nominalnih varijabli svakom članu populacije je pridruženo neko obilježje na način da ta obilježja nisu uređena čak i ako su brojčana. Na primjer, • mjesto rođenja, boja očiju • OIB, JMBG • političko opredjeljenje na referendumu (za-1; protiv-0) Kod ordinalnih varijabli članovima populacije je pridružen simbol ili broj pri čemu je određen njihov redosljed. Na primjer, • stupanj stručne spreme, • ocjene iz nekog kolegija... VJEŽBE 1
UREĐIVANJE KVALITATIVNIH PODATAKA VJEŽBE 1
TABLICA - DISTRIBUCIJA FREKVENCIJAnajjednostavniji način zadavanja kvalitativne varijablePRIMJER: Kategorizirani vaterpolisti po odabranim županijama, izvor www.hoo.hr VJEŽBE 1
STUPČASTI GRAFIKON (DIJAGRAM)Prikazuje distribuciju frekvencija po županijama (obilježjima) za prethodni pimjer VJEŽBE 1
STRUKTURNI KRUGPrikazuje razdiobu relativnih frekvencija za prethodni primjer VJEŽBE 1
Zadatak 1. Neka statistička varijabla X označava ocjenu iz matematike koja je izražena brojevima 1, 2, 3, 4, 5. Na kraju školske godine podaci iz jednog razreda su: 1, 4, 2, 3, 1, 1, 2, 4, 2, 3, 4, 5, 3, 2, 2, 2, 5, 3, 2, 2, 3, 3, 4, 2, 3, 2, 3, 3, 3, 2 Načinite tablicu frekvencija i prikažite podatke stupčastim dijagramom.
Zadatak 2. Rezultat prodaje štucni određenog sportskog kluba tijekom veljače 2012. u jednoj trgovini dan je sljedećom tablicom frekvencija Prikažite podatke stupčastim dijagramom i strukturnim krugom.
Paretov dijagram prikazuje istovremeno i frekvencije (poredane od veće prema manjoj) i kumulativne frekvencije. Sljedeći primjer se odnosi na ispitivanje kvarova tipkovnica jednog proizvođača u jamstvenom roku. PARETOV DIJAGRAM
VJEŽBE 1 Tako se lakše uočava ako manji broj obilježja (u ovom slučaju kvarova) daje veći dio ukupne distribucije.
KVANTITATIVNE ILI NUMERIČKE VARIJABLE Dijelimo ih na intervalne i omjerne. Intervalna varijabla pridružuje svakom članu populacije realan broj. Uređaj brojeva definira i redosljed obilježja, a definirana je i mjerna jedinica i dogovorna nula. Npr, varijabla koja svakom danu pridružuje temperaturu zraka u isto vrijeme na istom mjestu je intervalna. Omjerna varijabla je numerička varijabla koja ima iste karakteristike kao i intervalna samo što nula nije dogovorno utvrđena, već znači nepostojanje svojstva na promatranom elementu. Na primjer, varijabla koja njeri visinu neke ljudske populacije je omjerna. Tu ima smisla upotrebljavati omjere vrijednosti. VJEŽBE 1
Druga podjela numeričkih (kvantitativnih) statističkih varijabli, prema gustoći skupa obilježja populacije X(S) je na diskretne i kontinuirane. Diskretne Diskretna numerička varijabla može poprimiti samo konačno ili prebrojivo elemenata iz skupa obilježja ( a to je kod numeričkih varijabli skup realnih brojeva) • Broj zgoditaka • Vrijeme ostvareno utrkom • Broj noćenja u hotelima • Težine i visine konačnog broja ljudi Kontinuirane Kontinuirana numerička varijabla poprima sve vrijednosti iz nekog intervala skupa realnih brojeva • Temperatura zraka • Cijene • Prihod • Težine i visine svih ljudi • moguća je samo ako je populacija beskonačna ili se je smatra beskonačnom!!! VJEŽBE 1
STEM AND LEAF PLOT (S-L) (stabljika i list) Primjer. Na 141 američkom koledžu provedena je anketa o 'tulum-pijancima'. Kao tulum-pijanac opisan je onaj student koji u nizu popije 4 ili više alkoholnih pića. Postotak tulum-pijanaca na koledžima dan je u sljedećem popisu:
Da bismo iz ove nepregledne gomile brojeva stekli dojam o rasprostranjenosti pojave, izradimo S-L dijagram: • odaberemo jednu ili više početnih znamenki za 'stabljiku' • u stupac popišemo sve moguće stabljike • desno od svake stabljike popišemo sve pripadajuće 'listove'
DIJAGRAM TOČAKA • Nacrtamo dio brojevnog pravca koji obuhvaća sve moguće podatke • Svako opažanje prikažemo točkom iznad odgovarajućeg položaja • Za podatke iz gornjeg primjera točkasti prikaz izgleda ovako:
POVRŠINSKI GRAFIKON: HISTOGRAM frekvencije odgovaraju površini pravokutnika (ilivisini pravokutnika), ako je baza jedinična Crtanje histograma za diskretnu raspodjelu: • odredimo frekvencije ili relativne frekvencije • na apscisi označimo sve moguće vrijednosti varijable X ili sve moguće grupe tj. razrede • nacrtamo pravokutnik visine fi ili fri.
Primjer.Bilježena je starost djece i omladine koja se igra loptom u parku. VarijablaX=starost igrača. Rezultati ankete za 48 igrača (starost u godinama):
Moguće vrijednosti varijable X su 1,2,3,... Dakle, radi se o diskretnoj varijabli. U našem primjeru raspodjela frekvencija dana je tablicom: U našem primjeru je N = 48 pa je raspodjela relativnih frekvencija dana tablicom:
Zadatak 3. Kontrolor uzima uzorke od 30 proizvoda i svaki put zapiše broj defektnih proizvoda u uzorku. Nakon 20 pregledanih uzoraka dobiveni su sljedeći podaci. Prikažite podatke stupčastim dijagramom i histogramom.
DISTRIBUCIJA FREKVENCIJA Kontinuirane varijable Konstruiranje distribucije frekvencija: • intervali moraju biti nepreklapajući, • treba odrediti broj razreda (k) po obrascu k = 1+3.3logN, gdje je N broj vrijednosti num. varijable. VJEŽBE 1
Zadatak. Mjeri se vrijeme izvođenja jedne radne operacije. Nezavisnim mjerenjima dobiveno je sljedećih 20 podataka (u sekundama): 24, 27, 30, 24, 28, 26, 26, 26, 22, 25, 29, 25, 26, 26, 25, 24, 24, 23, 27, 27. Predočite ih histogramom.
Dakle, Podijelimo apscisu na prikladan broj razreda (ekvidistantno ili neekvidistantno) odredimo frekvencije crtamo pravokutnike za ekvidistantne razrede visina = fri za neekvidistantne razrede visina = fri/širina
Konstrukcija histograma za kontinuiranu varijablu Primjer. Potrošnja benzina (u litrama na 100 km):
Napravite tablicu i nacrtajte histogram ako su podaci iz prethodnog primjera podjeljeni u neekvidistantne razrede: [4, 5), [5, 5.5), [5.5, 6), [6, 6.3), [6.3, 6.6), [6.6, 7), [7, 7.5), [7.5, 8), [8, 9], [9, 10] Primjer neekvidistantnih razreda:
Za jediničnu duljinu uzimamo razred duljine 0.1. Sve veće razrede dijelimo s faktorom za koliko je taj razred veći od jediničnog.
Primjer neekvidistantnih razreda: Osobe prijavljene zavodima za zapošljavanje u Hrvatskoj1990: