STATISTIQUE INFERENTIELLE

STATISTIQUE INFERENTIELLE STAGE ACADEMIQUE LA REUNION Isabelle ABOU Professeure Formatrice

PLAN DE L’EXPOSE • 1ière PARTIE: GÉNÉRALITÉS • I. INTRODUCTION • II. SITUATIONS PROBLEMES • III. LA STATISTIQUE INFERENTIELLE • IV. LE PROGRAMME DE SECONDE • 2ième PARTIE: LA THÉORIE • I. LOI NORMALE • II. THEORIE DE L’ECHANTILLONNAGE • III. PRISE DE DECISION • IV. THEORIE DE L’ESTIMATION • V. ESTIMATION D’UNE PROPORTION • VI. EVALUATION DE TRAVAUX AVEC TIC • 3ième PARTIE: APPROFONDISSEMENT • I. TESTS STATISTIQUES • II. COMPLEMENTS Isabelle ABOU

3ième PARTIEAPPROFONDISSEMENT Isabelle ABOU

I.TESTS STATISTIQUES TESTS DE VALIDITE D’HYPOTHESE Isabelle ABOU

PREAMBULE • Nous donnons ci-après un aperçu des tests d’hypothèse pour la cohérence de l’exposé car c’est un domaine important de la statistique inférentielle. • La notion de test ne figure pas au programme de Seconde de façon explicite, mais les tests de validité d’hypothèse sont au programme des classes de BTS. • Nous commencerons par des généralités sur les tests statistiques pour aborder ensuite les test d’hypothèse qui nous occupent. Isabelle ABOU

TESTS STATISTIQUES • Un test est un mécanisme qui permet de trancher entre deux hypothèses sur la population mère, au vu des résultats d’un échantillon (ou plusieurs) . • On veut valider ou pas une hypothèse que l’on suppose sur la population, appelée hypothèse nulle H0. • On essaie de choisir H0 ne manière à ne pas la rejeter trop souvent. • L’hypothèse alternative est notée H1. Isabelle ABOU

DIFFERENTS TYPES DE RISQUES • Soit H0 l’hypothèse nulle et H1 l’hypothèse alternative, dont une et une seule est vraie. • La décision aboutira à choisir l’une ou l’autre. • Il y a donc 4 cas possibles avec leurs probabilités: • Choisir H0 alors que H0 est vraie • Choisir H0 alors que H1 est vraie • Choisir H1 alors que H1 est vraie • Choisir H1 alors que H0 est vraie. • On notera α le niveau de risque accepté sur le test, c’est la probabilité de choisir H1 alors que H0 est vraie • Les valeurs courantes sont 0,01; 0,05; 0,1. Isabelle ABOU

α s’appelle le risque de 1ière espèce, c’est la probabilité de choisir H1 alors que H0 est vraie. • β s’appelle le risque de 2ième espèce, c’est la probabilité de conserver H0 alors que H1 est vraie. • α étant fixé, β sera déterminé comme résultat d’un calcul. • β varie en sens contraire de α. • 1-α est la probabilité d’opter pour H0 en ayant raison. • 1-β est la probabilité d’opter pour H1 en ayant raison. • 1-β s’appelle « puissance du test ». Isabelle ABOU

LA REGION CRITIQUE • La variable de décision est celle qui doit apporter le maximum d’informations sur le problème posé et dont la loi sera différente selon que H0 ou H1 est vraie. • La région critique W est l’ensemble des valeurs de la variable de décision qui conduise à écarter H0 au profit de H1. • Elle est définie par: . • La région d’acceptation est son complémentaire et on a donc: • et . • La construction d’un test n’est rien d’autre que la détermination de région critique. Isabelle ABOU

RESUMEDEMARCHE D’UN TEST • Choix de H0 et H1 • Détermination de la variable de décision • Allure de la région critique en fonction de H1. • Calcul de la région critique en fonction de α. • Calcul éventuel de la puissance du test 1-β. • Calcul de la valeur expérimentale de la variable de décision. • Conclusion: rejet ou acceptation de H0. Isabelle ABOU

LES GRANDES CATEGORIES DE TESTS • - Test paramétrique, son objet est de tester une certaine hypothèse relative à un ou plusieurs paramètres d’une v.a de loi spécifiée ou non (tests sur la moyenne, la fréquence, l’écart type). • Ils sont souvent basés sur la considération de la loi normale, ils supposent l’existence d’une v.a de référence X normale. • Si les résultats restent valables quand X n’est pas normale, on dit que le test est robuste. • - Test non paramétrique, par exemple le test d’ajustement qui a pour but de vérifier qu’un échantillon provient ou non d’une v.a de distribution connue (test du , test de Kolmogorov). • Dans le programme de Terminale ES, on en a un exemple: le test d’adéquation à la loi équirépartie. • Une catégorie de tests robustes est la classe des tests libres: ils sont valables quelle que soit le loi de la v.a étudiée, en particulier quand on ignore tout de cette loi (souvent le cas dans la pratique). Isabelle ABOU

TESTS DE VALIDITE D’HYPOTHESE • On veut comparer la moyenne (ou la fréquence) inconnue d’une population à une norme fixée à l’avance. • On introduit la notion de test d’hypothèse. • 1ier type de comparaison: test bilatéral. • L’hypothèse nulle H0 consiste à dire que la moyenne de la population est égale à la norme fixée à l’avance. • Pour un test bilatéral H0: m=m0 • L’hypothèse alternative est H1: m<>m0. • 2ième type de comparaison: test unilatéral. • Pour un test unilatéral, il s’agit de savoir si la moyenne de la population mère a été modifiée de façon significative. • L’hypothèse nulle est donc H0: m=m0 c.ad l’échantillon est conforme • L’hypothèse alternative est H1: m>m0 ou H1: m<m0 suivant le problème posé. Isabelle ABOU

REGION CRITIQUE • La nature de H0 détermine la façon de formuler H1 et par conséquent la nature unilatérale ou bilatérale du test. • On aboutit à une région critique qui correspond à une région de rejet de l’hypothèse nulle, calculée à l’aide le l’intervalle de confiance à un seuil donné. Isabelle ABOU

Test bilatéral Si H0 consiste à dire que la population estudiantine qui a une fréquence de fumeurs égale à « p », est représentative de la population totale qui, elle, a une fréquence de fumeurs « p0 », on posera : H0 : p = p0 et H1 : p ≠ p0 Le test sera bilatéral car on considère que la fréquence p peut être supérieure ou inférieure à la fréquence p0 . La région critique α en vert correspond à une Probabilité α/2 de part et d’autre de la courbe. TEST BILATERALREGION CRITIQUE Isabelle ABOU

Test unilatéral Si l’on fait l’hypothèse que la fréquence de fumeurs dans la population estudiantine p est supérieure à la fréquence de fumeurs dans la population p0, on posera: H0 : p = p0 et H1 : p > p0 Le test sera unilatéral car on considère que la fréquence p ne peut être que supérieure à la fréquence p0 . La région critique α en vert correspond à une probabilité α d’un coté de la courbe. Ce raisonnement peut être formulé avec l’hypothèse inverse : H0 : p = p0 et H1 : p < p0 TEST UNILATERALREGION CRITIQUE Isabelle ABOU

COMPARAISON D’UNE MOYENNE A UN NOMBRE • C’est un test bilatéral. • H0: m=m0 • H1: m<>m0 • On détermine l’intervalle d’acceptation de H0 au seuil de risque α: I=[m0-tσ/√n; m0+tσ/√n]. • t vérifie Π(t)=1-α/2. • On prélève un échantillon de taille n (n>=30), de moyenne xe, et on calcule e=(xe-m0)/(σ/√n) appelé « écart réduit ». • Règle de décision: • Si e є [-t ; t] , on accepte H0: l’échantillon est conforme ou représentatif • Sinon, on refuse H0: l’échantillon n’est pas conforme . Isabelle ABOU

COMPARAISON D’UNE FREQUENCE Á UNE FRÉQUENCE THÉORIQUE • C’est un test bilatéral. • On note p la fréquence théorique et f la fréquence de l’échantillon. • H0: f=p • H1: f<>p • Par un raisonnement analogue: • t est obtenu avec Π(t)=1-α/2. • L’écart réduit est: e=(f-p)/σ avec σ= √(p(1-p)/n). • Règle de décision: • Si e є [-t ; t] , on accepte H0: l’échantillon est conforme ou représentatif • Sinon, on refuse H0: l’échantillon n’est pas conforme . Isabelle ABOU

COMPARAISON DE 2 POPULATIONS • Comme autre application de ces tests d’hypothèse, on peut également comparer deux populations: • -comparaison des moyennes • - comparaison des fréquences. • On considèrera dans ce cas là la variable aléatoire différence . • C’est un test bilatéral dont le principe est le même que précédemment. Isabelle ABOU

COMPARAISON DE 2 MOYENNES • On considère deux échantillons prélevés sur deux populations P1 et P2. • Le but est de déterminer s’il y a une différence significative entre les moyennes des deux populations. • Pour un test bilatéral, et avec ces notations, on a : • H0: m1=m2 • H1: m1<>m2 Isabelle ABOU

TEST BILATERAL • Au risque α:Π(t)=1-α/2. • L’écart réduit vaut: e=(x1-x2)/σ. • Règle de décision: • Si e є [-t ; t] , on accepte H0: m1=m2 • Sinon, on refuse H0, on retient l’hypothèse alternative m1<>m2. Isabelle ABOU

COMPARAISON D’UNE MOYENNE DE FAÇON UNILATERALE • Test unilatéral. • H0: l’échantillon est conforme • Au risque α on calcule t tel que Π(t)=1-α. • Ecart réduit: e=(xe-m0)/(σ/√n). • 1ier cas: H1: m>m0 • Règle de décision : • si e > t , alors on rejette H0, la moyenne a augmenté de façon significative. • 2ième cas: H1: m<m0 • Règle de décision : • si e < -t , alors on rejette H0, la moyenne a diminué de façon significative. Isabelle ABOU

INJECTEURS • Un équipementier commande un lot d’injecteurs dont l’entreprise annonce que la moyenne des diamètres intérieurs est de 0,65 mm. • Afin de vérifier cette affirmation, il prélève un échantillon de 100 injecteurs dans un lot, et obtient une moyenne xe =0,644 mm, et un écart type σ =0,018. • En supposant que l’écart type de l’échantillon est une bonne approximation de celui du lot, répondre à la question: • L’équipementier peut-il accepter au risque de 5% l’affirmation du fournisseur? Isabelle ABOU

RESOLUTION • On construit un test: • H0: le diamètre moyen m0 = 0,65. • H1: le diamètre moyen m0 <> 0,65. • On calcule e=(xe-m0)/(σ/√n) • Pour α=0,05 on a t=1,96 • Règle de décision: si e є[-1,96;1,96], on accepte H0, sinon on refuse H0. • Ici e=(0,644-0,65)/(0,018/√100) ce qui donne environ -3,33. • Donc e n’appartient pas à [-1,96;1,96] et on refuse H0 au risque de 5%. • Au risque de 5%, l’équipementier ne peut accepter l’affirmation du fournisseur. Isabelle ABOU

PLACES DE CINEMA • Le nombre de places de cinéma vendues pendant une journée ouvrable suit la loi normale de moyenne 2250 et d’écart type 600. • A la suite d’une campagne publicitaire, une étude statistique sur 23 jours a donné une moyenne de 2439. • L’amélioration des ventes est-elle significative au seuil de 5%? Isabelle ABOU

RESOLUTION • On est dans le cas d’un test unilatéral: • Hypothèse nulle H0: m=2250. • Hypothèse alternative H1: m> 2250. • Dans ce cas pour α=0,05, • Π(t)=1-0,05=0,95 donc t=1,645. • e=(2439-2250)/((√23)/600)= 1,51. • Comme e< 1,645, on accepte H0 au seuil de 5%. • La différence n’est donc pas significative. Isabelle ABOU

PROBLEME DE BTS • Le problème qui suit est un sujet de BTS posé en 2002 pour le groupement B. • Il est intéressant car il regroupe différents problèmes soulevés dans ce stage et utilise différentes lois. • A la fin, il y a une estimation ponctuelle, et une par intervalle de confiance qui permet de conclure à un risque donné. • On peut trouver des sujets de BTS, avec parfois les corrections sur le site de l’APMEP à l’adresse: • http://www.apmep.asso.fr/-Annales-Bac-Brevet-BTS- Isabelle ABOU

ASSURANCE D’UNE FLOTTE DE VEHICULES • Dans un groupe d’assurances on s’intéresse aux sinistres susceptibles de survenir, une année donnée, aux véhicules de • la flotte d’une importante entreprise de maintenance de chauffage collectif. • 1. Etude du nombre de sinistres par véhicule • Soit X la variable aléatoire qui, à tout véhicule tiré au hasard dans un des parcs de la flotte, associe le nombre de sinistres survenant pendant l’année considérée. • On admet que X suit la loi de Poisson de paramètre 0,28. • a) Calculer la probabilité de l’événement A : un véhicule tiré au hasard dans le parc n’a aucun sinistre pendant • l’année considérée. • b) Calculer la probabilité de l’événement B : un véhicule tiré au hasard dans le parc a, au plus, deux sinistres pendant l’année considérée Isabelle ABOU

2. Etude du nombre de sinistres dans une équipe de 15 conducteurs • On note E l’événement : un conducteur tiré au hasard dans l’ensemble des conducteurs de l’entreprise n’a pas de • sinistre pendant l’année considérée. • On suppose que la probabilité de l’événement E est 0,6. • On tire au hasard 15 conducteurs dans l’effectif des conducteurs de l’entreprise. Cet effectif est assez important pour que l’on puisse assimiler ce prélèvement à un tirage avec remise de 15 conducteurs. • On considère la variable aléatoire Y qui, à tout prélèvement de 15 conducteurs, associe le nombre de conducteurs • n’ayant pas de sinistre pendant l’année considérée. • a) Justifier que la variable aléatoire Y suit une loi binomiale et déterminer ses paramètres. • b) Calculer la probabilité que, dans un tel prélèvement, 10 conducteurs n’aient pas de sinistre pendant l’année • considérée. Isabelle ABOU

3. Etude du coût des sinistres • Dans ce qui suit, on s’intéresse au coût d’une certaine catégorie de sinistres survenus dans l’entreprise pendant l’année considérée. • On considère la variable aléatoire C qui, à chaque sinistre tiré au hasard parmi les sinistres de cette catégorie, associe son coût en euros. • On suppose que C suit la loi normale de moyenne 1 200 et d’écart type 200. • Calculer la probabilité qu’un sinistre tiré au hasard parmi les sinistres de ce type coûte entre 1 000 euros et 1 500 euros. • 4. On considère un échantillon de 100 véhicules prélevés au hasard dans le parc de véhicules mis en service depuis 6 mois. Ce parc contient suffisamment de véhicules pour qu’on puisse assimiler ce tirage à un tirage avec remise. • On constate que 91 véhicules de cet échantillon n’ont pas eu de sinistre. • a) Donner une estimation ponctuelle du pourcentage p de véhicules de ce parc qui n’ont pas eu de sinistre 6 mois après leur mise en service. • b) Soit F la variable aléatoire qui à tout échantillon de 100 véhicules prélevés au hasard et avec remise dans ce parc, associe le pourcentage de véhicules qui n’ont pas eu de sinistre 6 mois après leur mise en service. • On suppose que F suit la loi normale n(p;√(p(1-p)/100)) où p est le pourcentage inconnu de véhicules du parc qui n’ont pas eu de sinistre 6 mois après leur mise en service. • Déterminer un intervalle de confiance du pourcentage p avec le coefficient de confiance 95%. • c) On considère l’affirmation suivante : le pourcentage p est obligatoirement dans l’intervalle de confiance obtenu à la question b) Est-elle vraie ? Isabelle ABOU

II. COMPLEMENTSTHEORIQUES Isabelle ABOU

PREAMBULE • Nous exposerons ci-après les divers modes de convergence utilisés en théorie des Probabilités. • Nous énoncerons ensuite, de manière un peu plus rigoureuse, mathématiquement parlant, les grands théorèmes utilisés dans cet exposé. Isabelle ABOU

LES DIFFERENTS TYPES DE CONVERGENCE D’UNE SUITE DE VARIABLES ALEATOIRES • Convergence en moyenne quadratique • Convergence presque sûre • Convergence en probabilité • Convergence en loi Isabelle ABOU

CONVERGENCE EN LOI Isabelle ABOU

CONVERGENCE EN PROBABILITE Isabelle ABOU

CONVERGENCE EN MOYENNE QUADRATIQUE Isabelle ABOU

CONVERGENCE PRESQUE SURE Isabelle ABOU

Convergence en moyenne quadratique Convergence presque sûre Convergence en probabilité Convergence en loi COMPARAISON DES DIFFERENTS TYPES DE CONVERGENCE Isabelle ABOU

Théorème central-limite Isabelle ABOU

Loi faible des grands nombres Isabelle ABOU

Loi forte des grands nombres Isabelle ABOU

BIBLIOGRAPHIE et SITOGRAPHIE Isabelle ABOU

BIBLIOGRAPHIE • Pour la théorie, un excellent livre: Probabilités, analyse des données et statistiques. G.Saporta. Ed TECHNIP. • Itinéraires en statistiques et probabilités. H.Carnec, R.Seroux, JM.Dagoury, M.Thomas.Ed ellipses. • Statistique.T H.Wonnacott. R J. Wonnacott. Ed Economica. • Le rôle de la loi normale en statistique. H Rouanet. B.Leclerc. • Excellent livre où sont détaillées les méthodes de sondages: Méthodes des sciences sociales. Madeleine Grawitz. Isabelle ABOU

REFERENCES • Document ressources pour la classe de seconde -Probabilités et statistiques-. • http://media.education.gouv.fr/file/Programmes/17/9/Doc_ressource_proba-stats_109179.pdf • Document ressources pour le lycée, enseignement général de la voie professionnelle. • http://mslp.ac-dijon.fr/spip.php?article202 • http://www.ac-grenoble.fr/maths/docresseconde/Proba_stat_LP.doc • Mathématiques BTS. P.Taquet, P. Tirel, J. Bance. Ed Hachette. • La loi normale. Wikipedia • http://www.math.univ-brest.fr/perso/catherine.rainer/polystat.pdf • http://www.apmep.asso.fr/-Annales-Bac-Brevet-BTS- Isabelle ABOU

STATISTIQUE INFERENTIELLE

STATISTIQUE INFERENTIELLE

Presentation Transcript

Y - 7102 STATISTIQUE

Statistique, licence

Statistique générale

Statistique descriptive

Statistique

La Statistique Descriptive

CARTO GRAPHIE STATISTIQUE

Statistique descriptive

STATISTIQUE INFERENTIELLE

Inférence statistique

La statistique

Statistique générale

Statistique I

Statistique

La génétique statistique

BULLETIN STATISTIQUE

LA STATISTIQUE

ANALYSE STATISTIQUE

Loi statistique

Risques d’erreur statistique et test statistique

La statistique

L’OUTIL STATISTIQUE