1 / 68

Gazdasági informatika II.

Gazdasági informatika II. 2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat. Statisztikai számítások Excellel. Minta vizsgálata – LEÍRÓ STATISZTIKA

jin
Download Presentation

Gazdasági informatika II.

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Gazdasági informatika II. 2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat

  2. Statisztikai számítások Excellel Minta vizsgálata – LEÍRÓ STATISZTIKA Megjegyzés: a statisztikai függvények zömének paramétere az adathalmaz, ezért nem részletezzük az egyes függvények paraméterezését!

  3. EMLÉKEZTETŐ - Alapfogalmak • Statisztika tárgya: SOKASÁG – meghatározott tulajdonságok szerint egyformák, más tulajdonságok szerint viszont különbözőek • Ismérv: sokaság egységeire vonatkozó jellemzők • Közös ismérvek – egységek ez alapján egyformák • Megkülönböztető ismérvek – ezek alapján különböznek egymástól az egységek

  4. Sokaság típusok • Álló sokaság – valamely időpontra vonatkozik • Mozgó sokaság – valamely időtartamra vonatkozik

  5. Ismérvek típusai • Területi – földrajzi jellegű • Időbeli – valamilyen időpontra vagy időtartamra utalnak • Minőségi – nem számszerűsíthető - kvalitatív • Mennyiségi – számmal kifejezhető – kvantitatív Az ismérv lehetséges kimenetei az ismérvértékek!

  6. Statisztikai adatok • Mérhető adatok (Kvantitatív): olyan adatok, melyek mérésből származnak. • Megállapítható adat: Nem számadat, kategória – „kategorizált adat” (Kvalitatív): Pl. nem(férfi, nő); igen-nem válaszlehetőségek; 2 gyereke van – ebben az esetben az a fontos, hogy a kétgyermekes kategóriába tartozik.

  7. Adattípusok fajtái Adattípusok fajtái a rendezhetőség és a köztük értelmezhető távolságfüggvény alapján: • Nominális • Ordinális • Intervallum típusú • Numerikus

  8. Nominális adatok • A mérés legalacsonyabb szintjét jelöli, amikor minden megfigyelt egyedet olyan adattal írunk le, melyek egymással nagyság szerint nem összehasonlíthatók • Példa: dolgozó neve, születési helye, neme…stb. akkor is nominális, ha számban kódolt: pl. a dolgozó törzsszáma.

  9. Ordinális adatok • Bármely két adat összehasonlítható • Példa: dolgozók iskolai végzettsége. • Jellemző: • Nincs távolság értelmezve az adatok között.(Pl. Nem lehet megmondani, hogy mennyivel értékesebb az érettségi a 8 általánosnál. ) • Egyetlen művelet: adatok rendezése – olyan rangstatisztika alkalmazható, amely csak az adatok egymáshoz képesti rendezettségét használják. (Pl. átlagnak nincs értelme, de mediánnak és módusznak igen – ezekről a későbbiekben lesz szó).

  10. Intervallum típusú adatok • Sorba rendezhetőség mellett az egymástól való távolság is megadható. • Példa: hőmérsékleti adatok • Értelmetlen az egymáshoz viszonyított arányról beszélni: 20 C° kétszer olyan meleg, mint a 10C°.(A hőmérséklet a Kelvin skálán nem intervallum típusú!)

  11. Numerikus adatok • Valós számokkal jellemezhető adatok. • Minden olyan műveletet végrehajthatunk ezekkel, amelyeket a valós számokkal.

  12. Középértékek

  13. Számított középértékek • Matematikai összefüggés alapján számíthatók ki: • Számtani (Aritmetikai) átlag • Egyszerű • Súlyozott • Harmonikus átlag • Egyszerű • Súlyozott • Mértani (Geometriai) átlag • Egyszerű • Súlyozott • Négyzetes (Kvadratikus) átlag • Egyszerű • Súlyozott

  14. Számtani átlag • Számítsuk ki az adott osztály átlagát matematikából a megadott eredmények alapján! =ÁTLAG( )- AVERAGE()

  15. Mértani átlag • Egy vállalat nyereségét tartalmazza az alábbi táblázat az 1982 – 92 években: =MÉRTANI.KÖZÉP– GEOMEAN() Feladat: Határozzuk meg az adott időszakra a nyereség növekedésének átlagos ütemét!

  16. További átlagok megfelelő függvényei • Harmonikus átlag – HARM.KÖZÉP() – HARMEAN()

  17. Helyzeti középértékek • A sokaságban elfoglalt helyzetüknél fogva jellemzik a sokaságot • Valamilyen szabály szerint rendezni kell az adatokat  Rangsor Előnye: Függetlenek a sokaság más tagjainak értékeitől – Heterogén sokaságok esetén jellemzőbbek, mint az átlagok

  18. Helyzeti középértékek • Kvantilis értékek – A sokaság mennyiségi ismérv szerinti eloszlásának tömör leírását adják meg

  19. X db Mediánnál kisebb MEDIÁN Y db Mediánnál nagyobb X=Y Feladat • Tegyük fel, hogy egy üzem dolgozóinak elmúlt havi teljesítményszázalékai az alábbiak: - Határozzuk meg a mediánt!

  20. Excel függvényei • MEDIÁN() – MEDIAN() • KVARTILIS() – QUARTILE() • PERCENTILIS() – PERCENTILE(): k-dik percentilis • SZÁZALÉKRANG() – PERCENTRANK(): egy értéknek egy adathalmazon vett százalékos rangját adja • MAX • MIN • KICSI() – SMALL():Egy adathalmaz k-dik legkisebb elemét adja értékül! • NAGY() – LARGE(): Egy adathalmaz k-dik legnagyobb elemét adja értékül! • SORSZÁM()- RANK(): Egy szám sorszámát adja, meg ha az adatokat sorba rendezzük

  21. Módusz • Leggyakrabban előforduló ismérvérték =MÓDUSZ() – MODE() Figyelem! Több azonos gyakoriságú adat esetén a sorrendben az elsőt adja móduszként! – Próbálja ki! Rendezze át az adatokat!

  22. Feladat • Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! ={GYAKORISÁG(tartomány; csoportosítási tömb)} TÖMBKÉPLET! Képlet beírás befejezése: [CTRL + SHIFT + ENTER]

  23. Gyakoriság • =Gyakoriság() – FREQUENCY() • Adott adathalmazban melyik érték hányszor szerepel

  24. Átlag Kvantitatív Medián Ordinális Módusz Nominális Összefoglalás - Középértékek Az egyes adatfajtáknál milyen középértékeket alkalmazunk?

  25. Szóródás és mérése

  26. Mérőszámok • Terjedelem • Interkvartilis félterjedelem • Átlagos abszolút eltérés • Szórás – Szórásnégyzet (Variancia) • Relatív szórás(Variációs koefficiens)

  27. Függvények az Excelben • = SQ()- átlagtól való eltérések négyzetének összegét adja eredményül • =SZÓRÁSP() –STDEVP()- szórás • =VARP() – variancia (szórásnégyzet)=ÁTL.ELTÉRÉS – átlagos abszolút eltérés – AVEDEV()

  28. Asszimmetria mérése

  29. Ferdeség mérése • =FERDESÉG() – SKEW() • A ferdeség az eloszlás középérték körüli aszimmetriájának mértékét jelzi. A pozitív ferdeség a pozitív értékek irányába nyúló aszimmetrikus eloszlást jelez, míg a negatív ferdeség a negatív értékek irányában torzított. • =CSÚCSOSSÁG() – KURT() • Egy adathalmaz csúcsosságát számítja ki. A függvény a normális eloszláshoz viszonyítva egy eloszlás csúcsosságát vagy laposságát adja meg. A pozitív értékek viszonylag csúcsos, a negatív értékek viszonylag lapos eloszlást jelentenek.

  30. Adatok kezelése Számláló - keresőfüggvények

  31. Függvények • DARAB () - COUNT() • a megadott tartomány számmal kitöltött celláinak a számát adja • DARAB2() – COUNTA() • a megadott tartomány értékkel kitöltött celláinak (nem üres) a számát adja • DARABTELI () – COUNTIF () • a megadott tartományban megszámolja, hogy hány darab cella felel meg a megadott kritériumnak • DARABÜRES () – COUNTBLANK () • A megadott tartományban megszámolja hány db cella üres

  32. Feladat • A megadott adathalmaz egy osztály matematika eredményeit tartalmazza. Határozzuk meg, hogy hány db elégtelen lett! • Vizsgáljuk meg, hogy van-e olyan tanuló, akinek nincs beírva az érdemjegy – még nem zárták le? =DARABTELI(tartomány; kritérium) =DARABÜRES(tartomány)

  33. Feladat • Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! • Hány cellában van adat – azaz hány tanuló kapott már érdemjegyet? =DARABTELI(tartomány; kritérium) =DARAB(tartomány)

  34. Idősorok elemzése

  35. Trendszámítás - elmélet • Trend: Az időben változó jelenségek alakulásában mindig megfigyelhetünk alapvető tendenciákat (növekedés, csökkenés…stb) • Szezonális ingadozás: Rendszeresen visszatérő hullámzás • Ciklushatás: fel-le mozgás hatása (konjunktúra - dekonjunktúra) • Véletlen hatás: előre nem látható események befolyása

  36. Trendszámítás formái • Analitikus trendszámítás • Mozgóátlagolású trendszámítás

  37. Analitikus trendszámítás • Megfigyelt jelenségek tapasztalatai alapján felírunk egy olyan függvényt, mely az időbeli változás alapirányzatát fejezi ki. • Függvénytípusok: • Lineáris • Exponenciális • Parabola • Logisztikus (S-alakú)

  38. Lineáris függvény felírása • Egy vállalat dolgozóinak létszámváltozását tükröző lineáris függvény felírása, ábrázolása! Függvény egyenlete: Y:létszám – függő változó! X:év – független változó! Y=20,4*x+198,3 LIN.ILL függvényről ={LIN.ILL(létszám;évek;;;)}

  39. LIN.ILL függvény • Paraméterei: • Y értékek • X értékek • Konstans: Igaz (b számítása normál módon történik) vagy Hamis (b értéke 0 lesz – ez az alapértelmezett érték) • Nulla: IGAZ (kiegészítő elemzések készülnek) vagy HAMIS (nem készülnek kiegészítő elemzések – alapértelmezett érték)

  40. LIN.ILL függvény használata • Tömbképletként – Ha csak két adathalmazról van szó X és Y, akkor kettő cellát kijelölve a képlet beírása után CTRL+SHIFT+ENTER leütéssel képezzük a tömbképletet – LÁSD: példa! • Ha nem alkalmazunk tömbképletet, akkor a kapott érték az egyenes meredeksége lesz – következő dia! • 2 adatsor esetén alkalmazhatjuk a következőképpen is: • Meredekség meghatározása: =INDEX(LIN.ILL(y;x);1); • Y metszéspont meghatározása: =INDEX(LIN.ILL(y;x);2); • Lásd! Következő dia!

  41. Példák a LIN.ILL függvény alkalmazására

  42. LIN.ILL alkalmazása, ha a nulla értéke IGAZ • Kiegészítő statisztikákat számol ki az EXCEl, ha a nulla értékét IGAZ-ra állítjuk • A statisztikákat tömbként adja meg a következő elrendezésben lásd! Következő dia! • Ha a tömb elemeinek nagyobb tartományt jelölünk ki a statisztikák számán kívül, akkor a felesleges cellákban a #HIÁNYZIK üzenetet kapjuk!

  43. LIN.ILL kiegészítő statisztikái Az egyenes egyenlete: Y=m1x1+m2x2+…+b vagy y=mx+b

  44. LIN.ILL kiegészítő statisztikái ∑℮2 = 43.9 Megjegyzés: ezen érték alapján lehet például eldönteni, hogy az exponenciális vagy a lineáris függvény a jobb! R2=1, azaz a lineáris függvény jól leírja az adatok tendenciáját! Szabadságfok: 5

  45. Grafikon rajzolása – trendegyenesek • Rajzoltassunk ki egy grafikont a közölt adatokból! (BeszúrásDiagram) • Jelöljük ki a grafikont • DiagramTrendvonal felvétele • Típus lap: Tetszőleges függvény kiválasztása • Egyebek lap: Beállíthatjuk, hogy az egyenlet látszódjon • R négyzet értékét is megjeleníthetjük

  46. Példa – Trendegyenes kirajzoltatása

  47. Lineáris egyenes meredekségének és y tengelymetszetének meghatározása • Külön függvényekkel (természetesen a LIN.ILL is ugyanezt adja eredményül) • Meredekség: MEREDEKSÉG(y;x) = m • Y tengelymetszet: METSZ(y;x) = b

  48. Exponenciális függvény felírása • Egy vállalat dolgozóinak létszámváltozását tükröző exponenciális függvény felírása, ábrázolása! LOG.ILL függvényről ={LOG.ILL(létszám;évek;;;)}

  49. LOG. ILL függvény • Ugyanazok az alkalmazások igazak erre a függvényre, mint a LIN.ILL-re! • Paraméterezésük is azonos

More Related