680 likes | 930 Views
Gazdasági informatika II. 2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat. Statisztikai számítások Excellel. Minta vizsgálata – LEÍRÓ STATISZTIKA
E N D
Gazdasági informatika II. 2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat
Statisztikai számítások Excellel Minta vizsgálata – LEÍRÓ STATISZTIKA Megjegyzés: a statisztikai függvények zömének paramétere az adathalmaz, ezért nem részletezzük az egyes függvények paraméterezését!
EMLÉKEZTETŐ - Alapfogalmak • Statisztika tárgya: SOKASÁG – meghatározott tulajdonságok szerint egyformák, más tulajdonságok szerint viszont különbözőek • Ismérv: sokaság egységeire vonatkozó jellemzők • Közös ismérvek – egységek ez alapján egyformák • Megkülönböztető ismérvek – ezek alapján különböznek egymástól az egységek
Sokaság típusok • Álló sokaság – valamely időpontra vonatkozik • Mozgó sokaság – valamely időtartamra vonatkozik
Ismérvek típusai • Területi – földrajzi jellegű • Időbeli – valamilyen időpontra vagy időtartamra utalnak • Minőségi – nem számszerűsíthető - kvalitatív • Mennyiségi – számmal kifejezhető – kvantitatív Az ismérv lehetséges kimenetei az ismérvértékek!
Statisztikai adatok • Mérhető adatok (Kvantitatív): olyan adatok, melyek mérésből származnak. • Megállapítható adat: Nem számadat, kategória – „kategorizált adat” (Kvalitatív): Pl. nem(férfi, nő); igen-nem válaszlehetőségek; 2 gyereke van – ebben az esetben az a fontos, hogy a kétgyermekes kategóriába tartozik.
Adattípusok fajtái Adattípusok fajtái a rendezhetőség és a köztük értelmezhető távolságfüggvény alapján: • Nominális • Ordinális • Intervallum típusú • Numerikus
Nominális adatok • A mérés legalacsonyabb szintjét jelöli, amikor minden megfigyelt egyedet olyan adattal írunk le, melyek egymással nagyság szerint nem összehasonlíthatók • Példa: dolgozó neve, születési helye, neme…stb. akkor is nominális, ha számban kódolt: pl. a dolgozó törzsszáma.
Ordinális adatok • Bármely két adat összehasonlítható • Példa: dolgozók iskolai végzettsége. • Jellemző: • Nincs távolság értelmezve az adatok között.(Pl. Nem lehet megmondani, hogy mennyivel értékesebb az érettségi a 8 általánosnál. ) • Egyetlen művelet: adatok rendezése – olyan rangstatisztika alkalmazható, amely csak az adatok egymáshoz képesti rendezettségét használják. (Pl. átlagnak nincs értelme, de mediánnak és módusznak igen – ezekről a későbbiekben lesz szó).
Intervallum típusú adatok • Sorba rendezhetőség mellett az egymástól való távolság is megadható. • Példa: hőmérsékleti adatok • Értelmetlen az egymáshoz viszonyított arányról beszélni: 20 C° kétszer olyan meleg, mint a 10C°.(A hőmérséklet a Kelvin skálán nem intervallum típusú!)
Numerikus adatok • Valós számokkal jellemezhető adatok. • Minden olyan műveletet végrehajthatunk ezekkel, amelyeket a valós számokkal.
Számított középértékek • Matematikai összefüggés alapján számíthatók ki: • Számtani (Aritmetikai) átlag • Egyszerű • Súlyozott • Harmonikus átlag • Egyszerű • Súlyozott • Mértani (Geometriai) átlag • Egyszerű • Súlyozott • Négyzetes (Kvadratikus) átlag • Egyszerű • Súlyozott
Számtani átlag • Számítsuk ki az adott osztály átlagát matematikából a megadott eredmények alapján! =ÁTLAG( )- AVERAGE()
Mértani átlag • Egy vállalat nyereségét tartalmazza az alábbi táblázat az 1982 – 92 években: =MÉRTANI.KÖZÉP– GEOMEAN() Feladat: Határozzuk meg az adott időszakra a nyereség növekedésének átlagos ütemét!
További átlagok megfelelő függvényei • Harmonikus átlag – HARM.KÖZÉP() – HARMEAN()
Helyzeti középértékek • A sokaságban elfoglalt helyzetüknél fogva jellemzik a sokaságot • Valamilyen szabály szerint rendezni kell az adatokat Rangsor Előnye: Függetlenek a sokaság más tagjainak értékeitől – Heterogén sokaságok esetén jellemzőbbek, mint az átlagok
Helyzeti középértékek • Kvantilis értékek – A sokaság mennyiségi ismérv szerinti eloszlásának tömör leírását adják meg
X db Mediánnál kisebb MEDIÁN Y db Mediánnál nagyobb X=Y Feladat • Tegyük fel, hogy egy üzem dolgozóinak elmúlt havi teljesítményszázalékai az alábbiak: - Határozzuk meg a mediánt!
Excel függvényei • MEDIÁN() – MEDIAN() • KVARTILIS() – QUARTILE() • PERCENTILIS() – PERCENTILE(): k-dik percentilis • SZÁZALÉKRANG() – PERCENTRANK(): egy értéknek egy adathalmazon vett százalékos rangját adja • MAX • MIN • KICSI() – SMALL():Egy adathalmaz k-dik legkisebb elemét adja értékül! • NAGY() – LARGE(): Egy adathalmaz k-dik legnagyobb elemét adja értékül! • SORSZÁM()- RANK(): Egy szám sorszámát adja, meg ha az adatokat sorba rendezzük
Módusz • Leggyakrabban előforduló ismérvérték =MÓDUSZ() – MODE() Figyelem! Több azonos gyakoriságú adat esetén a sorrendben az elsőt adja móduszként! – Próbálja ki! Rendezze át az adatokat!
Feladat • Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! ={GYAKORISÁG(tartomány; csoportosítási tömb)} TÖMBKÉPLET! Képlet beírás befejezése: [CTRL + SHIFT + ENTER]
Gyakoriság • =Gyakoriság() – FREQUENCY() • Adott adathalmazban melyik érték hányszor szerepel
Átlag Kvantitatív Medián Ordinális Módusz Nominális Összefoglalás - Középértékek Az egyes adatfajtáknál milyen középértékeket alkalmazunk?
Mérőszámok • Terjedelem • Interkvartilis félterjedelem • Átlagos abszolút eltérés • Szórás – Szórásnégyzet (Variancia) • Relatív szórás(Variációs koefficiens)
Függvények az Excelben • = SQ()- átlagtól való eltérések négyzetének összegét adja eredményül • =SZÓRÁSP() –STDEVP()- szórás • =VARP() – variancia (szórásnégyzet)=ÁTL.ELTÉRÉS – átlagos abszolút eltérés – AVEDEV()
Ferdeség mérése • =FERDESÉG() – SKEW() • A ferdeség az eloszlás középérték körüli aszimmetriájának mértékét jelzi. A pozitív ferdeség a pozitív értékek irányába nyúló aszimmetrikus eloszlást jelez, míg a negatív ferdeség a negatív értékek irányában torzított. • =CSÚCSOSSÁG() – KURT() • Egy adathalmaz csúcsosságát számítja ki. A függvény a normális eloszláshoz viszonyítva egy eloszlás csúcsosságát vagy laposságát adja meg. A pozitív értékek viszonylag csúcsos, a negatív értékek viszonylag lapos eloszlást jelentenek.
Adatok kezelése Számláló - keresőfüggvények
Függvények • DARAB () - COUNT() • a megadott tartomány számmal kitöltött celláinak a számát adja • DARAB2() – COUNTA() • a megadott tartomány értékkel kitöltött celláinak (nem üres) a számát adja • DARABTELI () – COUNTIF () • a megadott tartományban megszámolja, hogy hány darab cella felel meg a megadott kritériumnak • DARABÜRES () – COUNTBLANK () • A megadott tartományban megszámolja hány db cella üres
Feladat • A megadott adathalmaz egy osztály matematika eredményeit tartalmazza. Határozzuk meg, hogy hány db elégtelen lett! • Vizsgáljuk meg, hogy van-e olyan tanuló, akinek nincs beírva az érdemjegy – még nem zárták le? =DARABTELI(tartomány; kritérium) =DARABÜRES(tartomány)
Feladat • Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! • Hány cellában van adat – azaz hány tanuló kapott már érdemjegyet? =DARABTELI(tartomány; kritérium) =DARAB(tartomány)
Trendszámítás - elmélet • Trend: Az időben változó jelenségek alakulásában mindig megfigyelhetünk alapvető tendenciákat (növekedés, csökkenés…stb) • Szezonális ingadozás: Rendszeresen visszatérő hullámzás • Ciklushatás: fel-le mozgás hatása (konjunktúra - dekonjunktúra) • Véletlen hatás: előre nem látható események befolyása
Trendszámítás formái • Analitikus trendszámítás • Mozgóátlagolású trendszámítás
Analitikus trendszámítás • Megfigyelt jelenségek tapasztalatai alapján felírunk egy olyan függvényt, mely az időbeli változás alapirányzatát fejezi ki. • Függvénytípusok: • Lineáris • Exponenciális • Parabola • Logisztikus (S-alakú)
Lineáris függvény felírása • Egy vállalat dolgozóinak létszámváltozását tükröző lineáris függvény felírása, ábrázolása! Függvény egyenlete: Y:létszám – függő változó! X:év – független változó! Y=20,4*x+198,3 LIN.ILL függvényről ={LIN.ILL(létszám;évek;;;)}
LIN.ILL függvény • Paraméterei: • Y értékek • X értékek • Konstans: Igaz (b számítása normál módon történik) vagy Hamis (b értéke 0 lesz – ez az alapértelmezett érték) • Nulla: IGAZ (kiegészítő elemzések készülnek) vagy HAMIS (nem készülnek kiegészítő elemzések – alapértelmezett érték)
LIN.ILL függvény használata • Tömbképletként – Ha csak két adathalmazról van szó X és Y, akkor kettő cellát kijelölve a képlet beírása után CTRL+SHIFT+ENTER leütéssel képezzük a tömbképletet – LÁSD: példa! • Ha nem alkalmazunk tömbképletet, akkor a kapott érték az egyenes meredeksége lesz – következő dia! • 2 adatsor esetén alkalmazhatjuk a következőképpen is: • Meredekség meghatározása: =INDEX(LIN.ILL(y;x);1); • Y metszéspont meghatározása: =INDEX(LIN.ILL(y;x);2); • Lásd! Következő dia!
LIN.ILL alkalmazása, ha a nulla értéke IGAZ • Kiegészítő statisztikákat számol ki az EXCEl, ha a nulla értékét IGAZ-ra állítjuk • A statisztikákat tömbként adja meg a következő elrendezésben lásd! Következő dia! • Ha a tömb elemeinek nagyobb tartományt jelölünk ki a statisztikák számán kívül, akkor a felesleges cellákban a #HIÁNYZIK üzenetet kapjuk!
LIN.ILL kiegészítő statisztikái Az egyenes egyenlete: Y=m1x1+m2x2+…+b vagy y=mx+b
LIN.ILL kiegészítő statisztikái ∑℮2 = 43.9 Megjegyzés: ezen érték alapján lehet például eldönteni, hogy az exponenciális vagy a lineáris függvény a jobb! R2=1, azaz a lineáris függvény jól leírja az adatok tendenciáját! Szabadságfok: 5
Grafikon rajzolása – trendegyenesek • Rajzoltassunk ki egy grafikont a közölt adatokból! (BeszúrásDiagram) • Jelöljük ki a grafikont • DiagramTrendvonal felvétele • Típus lap: Tetszőleges függvény kiválasztása • Egyebek lap: Beállíthatjuk, hogy az egyenlet látszódjon • R négyzet értékét is megjeleníthetjük
Lineáris egyenes meredekségének és y tengelymetszetének meghatározása • Külön függvényekkel (természetesen a LIN.ILL is ugyanezt adja eredményül) • Meredekség: MEREDEKSÉG(y;x) = m • Y tengelymetszet: METSZ(y;x) = b
Exponenciális függvény felírása • Egy vállalat dolgozóinak létszámváltozását tükröző exponenciális függvény felírása, ábrázolása! LOG.ILL függvényről ={LOG.ILL(létszám;évek;;;)}
LOG. ILL függvény • Ugyanazok az alkalmazások igazak erre a függvényre, mint a LIN.ILL-re! • Paraméterezésük is azonos