820 likes | 990 Views
S TATISTICS. Essentials of. Statistiek voor Informatiekunde. docent: Frits de Vries assistent: Andreas Slot. M ARIO F . T RIOLA. E DITION. 3rd. Programma vandaag. Organisatie en opzet van de cursus Waarom Statistiek? Vooruitblik op de stof hoofdstukken 1,2 en 3. Website cursus:.
E N D
STATISTICS Essentials of Statistiek voor Informatiekunde docent: Frits de Vries assistent: Andreas Slot MARIO F. TRIOLA EDITION 3rd
Programma vandaag • Organisatie en opzet van de cursus • Waarom Statistiek? • Vooruitblik op de stof hoofdstukken 1,2 en 3
Boek • Literatuur: Mario Triola: Essentials of Statistics, 3rd edition Addison-Wesley Higher Education, 2008
Organisatie en opzet (1) • Kijk zelf op website naar: • Introductie • Beoordeling en deadlines • Ziekteregeling • Rooster • Etc.
Organisatie en opzet (2) • Uitdelen en inleveren: • Week 1: Opdrachten hoofdstuk 1, 2 en 3 • Week 2: uitwerkingen hoofdstuk 1,2 en 3 en maak een kopie voor de zelfbeoordeling bij de bespreking
Organisatie en opzet (3) • Werkcolleges verplicht? • Succes garantie?
Waarom Statistiek? • Lezen en schrijven artikelen vakgebied IK • Voorbeeld artikel MIS Quarterly • Lezen en schrijven in het dagelijks leven • Voorbeeld: tabel actiecommitee in de buurt • Baisvoorwaarde: logisch denken en redeneren • Voorbeeld: het Monty Hall-probleem
Intuïtie is onbetrouwbaar • Monty Hall probleem • Quiz: er zijn 3 gesloten deuren, • Achter één deur staat een auto, achter beide andere deuren is niets, • Jij mag een deur kiezen.. • Welke kans op de hoofdprijs?
Maar dan … • De quizmaster opent NA UW KEUZE een van de twee overgebleven deuren en laat zien dat daar niets achter zit. • Probleem: U mag nu nog van deur wisselen. • Doet U dit?
1 2 3 Analyse Stel de hoofdprijs zit achter deur 1: • U koos deur 1 (auto). De quizmaster opent een andere deur waarachter niets staat. Ruilen levert verlies op… • U koos deur 2 (leeg). De quizmaster opent deur 3 waarachter niets staat. Ruilen levert hoofdprijs! • U koos deur 3 (leeg). De quizmaster opent deur 2 waarachter niets staat. Ruilen levert hoofdprijs!
Aanpak hoorcolleges • Geen uitgebreide bespreking • Wel vooruitblik op de stof en bespreking van mogelijke knelpunten • Nu: hoofdstuk 1, 2 en 3
1.1 Overzicht 1.2 Datatypen 1.3 Kritisch denken 1.4 Ontwerp experimenten 2.1 Overzicht 2.2 Frequentieverdeling 2.3 Histogrammen 2.4 Grafische weergave 3.1 Overzicht 3.2 Centrummaten 3.3 Variatiematen 3.4 Relatieve afwijking 3.5 Exploratieve data-analyse Sekties hfst 1, 2 en 3
Triola, hoofdstuk 1 Belangrijke definities voor gebruik bij de statistiek
Sektie 1.1Belangrijke definities • Data • Statistiek • Populatie • Census • Steekproef
Definitie Statistiek a collection of methods for- planning studies and experiments,- obtaining data, - and then organizing, summarizing, presenting, analyzing, interpreting, - and drawing conclusions based on the data
Chapter Key Concepts • Sample data must be collected in an appropriate way, such as through a process of random selection. • If sample data are not collected in an appropriate way, the data may be so completely useless that no amount of statistical torturing can salvage them.
Sektie 1.2Data typen • Definities: • Populatie parameter versus steekproef statistic • Kwantitatieve versus kwalitatieve data • Discrete versus continue data • Meetnivo’s: nominaal, ordinaal, interval, ratio
Levels of Measurement • Nominal- categories only • Ordinal- categories with some order • Interval- differences but no natural starting point • Ratio- differences and a natural starting point
Sektie 1.3Kritisch denken • Misbruik, ondeskundig gebruik, verkeerd gebruik van de statistiek
Misuse # 1- Bad Samples • Voluntary response sample (or self-selected sample)- one in which the respondents themselves decide whether to be included. In this case, valid conclusions can be made only about the specific group of people who agree to participate.
Misuse # 3- Graphs To correctly interpret a graph, you must analyze the numerical information given in the graph, so as not to be misled by the graph’s shape.
Loaded Questions Order of Questions Refusals Correlation & Causality Self Interest Study Precise Numbers Partial Pictures Deliberate Distortions Other Misuses of Statistics
Sektie 1.4Ontwerp van het onderzoek • Soorten studies • Observationeel • Experimenteel • Retrospectief • Prospectief (longitudinaal, cohort)
Definition • Confounding • occurs in an experiment when the experimenter is not able to distinguish between the effects of different factors
Controlling Effects of Variables • Blinding • subject does not know he or she is receiving a treatment or placebo • Rigorously Controlled Design • subjects are very carefully chosen • Blocks • groups of subjects with similar characteristics • Completely Randomized Exp. Design • subjects are put into blocks through a process of random selection
Definitions • Random Sample • members of the population are selected in such a way that each individual member has an equal chance of being selected • Simple Random Sample (of size n) • subjects selected in such a way that every possible sample of the same size n has the same chance of being chosen
Methods of Sampling • Random • Systematic • Convenience • Stratified • Cluster
Triola, hoofdstuk 2 Statistiek voor het samenvatten en weergeven van data
Sektie 2.1 Overview Important Characteristics of DataCVDOT 1. Center: A representative or average value that indicates where the middle of the data set is located.2. Variation: A measure of the amount that the values vary among themselves. 3. Distribution: The nature or shape of the distribution of data (such as bell-shaped, uniform, or skewed).4. Outliers: Sample values that lie very far away from the vast majority of other sample values.5. Time: Changing characteristics of the data over time.
Sektie 2.2 Frequentieverdelingen • Gewone (rechte) telling van waarden in een tabel • Samenvoegen van waarden in categorieën (classes)
Frequency Distribution Ages of Best Actresses Frequency Distribution Original Data
Samenhangende definities • Lower class limits • Upper class limits • Class boundaries • Class midpoints • Class width • Relatieve frequenties • Cumulatieve frequenties • (cumulatieve percentages)
Sektie 2.3 Histogrammen • Grafische weergave van verdelingen
Histogram A bar graph in which the horizontal scale represents the classes of data values and the vertical scale represents the frequencies
Relative Frequency Histogram Has the same shape and horizontal scale as a histogram, but the vertical scale is marked with relative frequencies instead of actual frequencies
Critical ThinkingInterpreting Histograms One key characteristic of a normal distribution is that it has a “bell” shape. The histogram below illustrates this.
Sektie 2.4 Statistical graphics • Andere vormen van visuele weergave • Polygon • Ogive • Dot plot • Stemplot • Pareto chart • Pie chart • Scatter plot • Time series
Ogive A line graph that depicts cumulative frequencies Insert figure 2-6 from page 58
Dot Plot Consists of a graph in which each data value is plotted as a point (or dot) along a scale of values