1 / 47

LA STATISTIQUE

LA STATISTIQUE. SON HISTOIRE ET SES APPLICATIONS. LA STATISTIQUE QUELLE EST CETTE DISCIPLINE ?. Petit Robert

alta
Download Presentation

LA STATISTIQUE

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. LA STATISTIQUE SON HISTOIRE ET SES APPLICATIONS

  2. LA STATISTIQUEQUELLE EST CETTE DISCIPLINE ? Petit Robert • Etude méthodique des faits sociaux par des procédés numériques (classements, dénombrements, inventaires chiffrés, recensements) destinée à renseigner et à aider les gouvernements. • Ensemble de techniques d’interprétation mathématique appliquées à des phénomènes pour lesquels une étude exhaustive de tous les facteurs est impossible, à cause de leur grand nombre et de leur complexité.

  3. LA STATISTIQUE BIBLIOGRAPHIE • J. J. DROESBEKE et P. TASSI, Histoire de la statistique, Que sais-je ? n°2527, PUF, 1997. • Faut-il se fier aux statistiques ? Tangente, n°77 (octobre - novembre 2000). • G. BRONNER, Coïncidences, Vuibert, 2007.

  4. « Statistique » : du latin statisticum(ce qui se rapporte à l’Etat) Gottfried Achenwall (1746) : premier enseignement de la statistique (Allemagne) En fait, origine plus ancienne : mot déjà utilisé dans un texte administratif de Colbert (vers 1666)

  5. Chefs d’Etats : • connaître leur puissance : population, richesses, • potentiel militaire… •  idée de recensement • Premiers recensements : • * Sumériens : 5000 à 2000 av J.-C. • * Egyptiens : recensements systématiques de la population • Etats forts avec un système administratif fort

  6. Au début, • la statistique a consisté à observer des faits • Statistique descriptive • XIVe siècle : début des enregistrements des actes civils • (naissances, mariages, décès)

  7. Nombre de morts dans les hôpitaux militaires britanniques (guerre de Crimée)Florence Nightingale (1820-1910)gris: maladies évitablesbrun : blessures mortellesrose : autres causes

  8. XVIIe siècle : Probabilités  estimations, prévisions • Extrapolation à partir d’une partie de la population • (W. Petty: estimation de la population londonienne, 1686) • Juger d’après un échantillon: • (problème de la représentativité) • Statistique inférentielle

  9. XXe siècle : développement des sondages (U.S.A.) • * 1885 : création de l’Institut International de la Statistique (IIS) • * 1895 – 1925 : débat sur la représentativité (IIS) • A. Kiaer (Norvège) : « une partie pour le tout » •  réactions violentes • * Après 1925 : « Comment tirer l’échantillon ? »

  10. Date cruciale : 3 novembre 1936 • Election présidentielle américaine • F. Roosevelt versus G. Landon • Magazine Literary Digest : 2000 000 personnes (téléphone) •  Landon • G. Gallup : 3 000 personnes •  Roosevelt • Principe de la validité d’un sondage accepté

  11. 1885: IIS Recensements, sondages 1936: Roosevelt vs Landon 1666: Colbert 1746: Achenwall 1938: IFOP 1946: INSEE 1600 1700 1800 1900 -5000 -2900 2000 1722: moy. pond. Roger Cotes 1602: moy. arith. Tycho Brahé 1805: variance Legendre, Gauss Valeurs typiques 1874: moy. géom. moy. Harm. W.S. Jevons 1757: médiane Boscovich Graphiques 1637: Descartes 1874: Pyram. des âges Surf. de corrélation 1786: diag. en barres diag. en secteurs W. Playfair 1855: diag. pol. F. Nightingale 1707: nombre indice Fleetwood 1865: Laspeyres 1875: Paasche Indices 1738: indice des prix Dutot 1904: K. Pearson, Khi-deux 1904 Spearmann, rho Ajustement, corrélation, régression 1888 et 1896: Galton et K. Pearson Coef. de Corrélation. 1805-1806 Legendre-Gauss Moindres carrés 1938: Kendall Tau

  12. La statistique fait partie de la culture ANGLO-SAXONNE • Culture probabiliste indispensable • Enorme retard en France

  13. • Causes : • Statistique: parent pauvre des probabilités et des mathématiques • Forte imprégnation cartésienne • L’«incertain» est antipédagogique (déstabilisant …) • Nette préférence pour l’enseignement de certitudes • - Association obligatoire avec une autre discipline (bio., gestion,...) • (l’approche pluridisciplinaire est encore mal acceptée)

  14. • Conséquences : * Bon sens statistique insuffisamment développé * La présentation de données statistiques : un exercice « difficile » * « Un chiffre ne peut être qu’exact , exempt de toute indétermination » Risque de manipuler l’opinion

  15. Exemples : • moyenne, médiane • cote de popularité des hommes politiques • classement des hôpitaux, des lycées… • rapports d’«experts» …

  16. Connaître, c’est mesurer (Brunschvicg) • La statistique nous dit: *Comment effectuer les mesures *Comment extraire l’information des mesures

  17. INFORMATION Principale matière première du XXIe siècle Sa production et son exploitation statisticiens

  18. LA VARIABILITE • En général, dans une population, la variabilité est un critère de qualité , voire une nécessité (pour la survie) Exception : l’industrie • Le statisticien doit savoir : - appréhender - analyser - « gérer » la variabilité • La variabilité est une entrave à l’inférence statistique Qualité  de la variabilité

  19. Population Echantillon ( x1 , x2 , ...., xn ) moyenne  variance 2 proportion  Moyenne x variance s2 proportion x/n tirage inconnues Inférence statistique

  20. LA STATISTIQUE DESCRIPTIVELA STATISTIQUE INFERENTIELLE • Série statistique univariée • Série statistique bivariée • La modélisation • Les plans d’expériences • Les sondages • L’estimation • Les tests statistiques • Les séries chronologiques • L’analyse des données  Le data mining

  21. LA MODELISATION • En général, une observation dépend d’un grand nombre de facteurs • cause multifactorielle • les effets des facteurs ne sont pas simplement additifs (présence d’interactions)

  22. LA MODELISATION (suite)  Le statisticien va tenter : • d’identifier les facteurs prépondérants • évaluer leur importance relative • expliciter le lien de ces facteurs « causaux » avec le caractère étudié, à l’aide d’un modèle mathématique

  23. Exemple : variable expliquée : prix d’une voiture variables explicatives : cylindrée, puissance, vitesse, largeur, longueur, poids … prix = 1775 + 103,8 puissance + 9,8 poids (CV DIN) (kg)

  24. Exemple: biométrie foetale Log10 EPF = 1,6961 + 0,02253 PC + 0,01645 PA + 0,06439 LF (Weiner et al., 1985) EPF: estimation poids fœtal (en g) PC: périmètre crânien (mm) PA: périmètre abdominal (mm) LF: longueur fémur (mm)

  25. StatisticiensInterlocuteurs privilégiés des décideurs • dans tous les secteurs d’activité : ( politique, économique, scientifique, industriel … ) et • à tous les niveaux : (collecte de données, conception des systèmes d’information, contrôle de la production, analyse et restitution des données, etc.)

  26. Diversification des métiers de la statistique Discipline transversale par excellence

  27. DOMAINES D’ UTILISATION DE LA STATISTIQUE • STATISTIQUES OFFICIELLES (I.N.S.E.E.) • PRESSE – MEDIAS • BANQUES – ASSURANCES • SCIENCES DE LA VIE • ENVIRONNEMENT ( Foresterie, pêche …) • SANTE • SCIENCES HUMAINES • ENTREPRISES – INDUSTRIE ( R&D, contrôle de qualité, études de marché, management … ) • FINANCE • RECHERCHE FONDAMENTALE ET APPLIQUEE etc …

  28. et même … LA POESIE !

  29. BANQUES Probabilité qu’un client rembourse son crédit ? • Cette probabilité peut être exprimée en fonction : - du montant moyen de son compte courant - de la durée du crédit - du montant du crédit - du sexe - de la situation familiale etc …

  30. ASSURANCES (calcul des primes) • Assurance décès - Taux d’intérêt - Tables de mortalité - Frais de gestion • Assurance-auto Tarif unique ou différencié ?

  31. • Le risque dépend de nombreux facteurs : * Assuré : - Age - Sexe - Profession - Résidence - Expérience, etc … * Véhicule : - Modèle - Puissance, etc …

  32. • Etude du « risque ou coût » (actuariat) par des méthodes de régression « juste tarif » mieux résister à la concurrence problèmes de déontologie et d’éthique

  33. SCIENCES DE L’ENVIRONNEMENT • Surveillance d’un milieu (qualité d’une eau,…) • Estimation de l’effectif d’une population • Toxicologie de l’environnement, analyse du risque • Epidémiologie environnementale • Prévision des effets du réchauffement climatique • Phénomènes extrêmes (vagues, cyclones, …) • Prévision des épisodes de pollution (ozone) • etc.

  34. Estimation du nombre de jours/an avec des températures > 35°CPériode 2090-2099 (Météo-France, 2007)

  35. SANTE – BIOLOGIE • Biométrie • Imagerie médicale • Génétique (trouver les gènes « coupables ») • Epidémiologie • Statistique de la preuve en sciences forensiques • Diagnostic médical (aide au diagnostic) • Essais cliniques • etc.

  36. Comparaison de deux traitements contre le VIH(Essai Trianon-ANRS81, INSERM U738)

  37. PharmacocinétiqueConcentration de théophylline (médicament contre l’asthme) chez 12 individus pendant 24 heures (IUT de Paris, département STID)

  38. LES ESSAIS CLINIQUES Comparaison de plusieurs traitements Essais cliniques randomisés en double-aveugle Abstraction des aspects psychologiques : médecin et malade • Introduction du hasard dans l’expérience médicale

  39. Exemple : un nouveau médicament a-t-il des effets secondaires ? Effectifs observés Nausées Oui Non Traitement 15 35 Placebo 4 46

  40. Exemple : un nouveau médicament a-t-il des effets secondaires ? Effectifs observés - Effectifs Théoriques Nausées Oui Non Traitement 15 9,5 35 40,5 Placebo 4 9,5 46 40,5 2 = 7,86  Probabilité critique : 1%

  41. Les risques d’erreur Décision du statisticien Pas d’effets secondaires Effets secondaires Situation réelle Pas d’effets secondaires Décision erronée Perte d’un bon médicament Décision Correcte Décision erronée Promotion d’un mauvais médicament DécisionCorrecte Effetssecondaires

  42. Poème de 429 mots découvert en 1985 • Question : Shakespeare en est-il l’auteur ? •  Le vocabulaire du poème s’écarte-t-il de façon statistiquement significative du vocabulaire shakespearien connu ? • * Méthode basée sur l’étude comparative : • - de la fréquence des répétitions • et • - de l’ étendue du vocabulaire •  échantillons successifs de 429 mots dans l’œuvre complète

  43. • L’œuvre complète comprend 31 534 mots distincts sur un total de 884 647 mots, • répartis de la manière suivante : • • 14 376 mots apparaissent une fois • • 4 343 mots deux fois • • 2 292 mots trois fois • etc … • • 846 mots apparaissent plus de cent fois. • La structure des répétitions est comparée à celle des œuvres de Marlowe, Ben Jonson …

  44. L’hypothèse : « Shakespeare est l’auteur du sonnet » • est remplacée par • l’hypothèse : « La structure des répétitions est comparable à celle • de l’œuvre de Shakespeare » • Conclusion : le sonnet a bien été écrit par Shakespeare ; • la probabilité d’erreur est faible

  45. DEBOUCHES • Banques • Sociétés de placement collectif • Compagnies d’assurance • Services de marketing • Sociétés de sondage • Environnement • Industrie pharmaceutique, santé (biostatistique) • Industrie agroalimentaire • Services de contrôle de la qualité de la production (automobile, eau, etc.) • ...

  46. à méditer … • Le hasard est la somme de nos ignorances (Laplace) • Le hasard, cet hôte indésirable de la pensée humaine … (Gérard Bronner)

More Related