810 likes | 1.33k Views
C - Lois de probabilités . Préambule Quelques rappels sur les probabilités Définition ; 2 cas à considérer Exemples Loi binomiale Loi de Poisson Calcul de probabilités dans le cas des lois continues Loi normale Passage d’une loi binomiale à une loi normale .
E N D
C - Lois de probabilités • Préambule • Quelques rappels sur les probabilités • Définition ; 2 cas à considérer • Exemples • Loi binomiale • Loi de Poisson • Calcul de probabilités dans le cas des lois continues • Loi normale • Passage d’une loi binomiale à une loi normale
C - Lois de probabilités1. Préambule Loi de probabilité élément central de la statistique Avant tout, il faut bien définir la VA d’étude La détermination de la loi de probabilité suivie par une variable va servir : - aux calculs de probabilité de réalisation d'évènements, - à la déduction - à l'inférence statistique
C - Lois de probabilités1. Préambule Déduction : prédire, à partir d'une population connue ou supposée connue, les caractéristiques des échantillons qui en seront prélevés Induction (inférence) : prédire les caractéristiques d'une population inconnue à partir des statistiques déterminées dans un échantillon représentatif de cette population. Extrapolation des observations réalisées dans un échantillon à l'ensemble de la population
m ? ENCADREMENT DE m m1 <m< m2 • Echantillon • taille : n (n_échantillon) • représentatif • : observée • Population • taille ? • Inaccessible • m : caractéristique théorique ou attendue Intéressons nous, par exemple, à l’information “moyenne” On étudie les populations à partir d’échantillons (représentatifs) On part des seules informations disponibles : et n Un tel échantillon va-t-il nous permettre de préciser la population dont il pourrait être issu ? Risque seuil a Risques ao et b
C - Lois de probabilités1. Préambule Epreuve: expérience - qui peut être reproduite dans les mêmes conditions autant de fois que l'on veut, - dont le résultat n'est pas prévisible - et pour laquelle on peut définir l'ensemble des résultats possibles. L'événement : est un sous ensemble des résultats possibles de l'épreuve.
C - Lois de probabilités • Préambule • Quelques rappels sur les probabilités séance libre sur internet • Définition ; 2 cas à considérer • Exemples • Loi binomiale • Loi de Poisson • Calcul de probabilités dans le cas des lois continues • Loi normale • Passage d’une loi binomiale à une loi normale
C - Lois de probabilités2. Quelques rappels sur les probabilités P(A) = lim nA/N Ng Loi des grands nombres(Jacques Bernoulli) P(A) = fAe e : incertitude/erreur sur l'estimation de la probabilité à partir des données d'un échantillon eg0 Ng
C - Lois de probabilités2. Quelques rappels sur les probabilités
C - Lois de probabilités2. Quelques rappels sur les probabilités
C - Lois de probabilités2. Quelques rappels sur les probabilités Exercice"L'examen de TP" On fait passer l'examen de TP de biochimie aux étudiants de master d'une grande université (250 inscrits). L'examen consiste en 2 manips, M1 et M2, notées chacune sur 10. Un étudiant "réussit" une manip s'il obtient au moins la note de 5/10 à cette manip. Un étudiant est reçu à l’examen de TP s’il a réussi les deux manips. On constate que la probabilité de réussir la manip M1 est de 0,5. La probabilité de réussir la manip M2 est, quant à elle, de 0,6. Enfin, la probabilité qu'un étudiant réussisse la manip M2 alors qu’il a réussit la manip M1 est de 0,8. Q1 : Réussir M1et M2 sont-ils deux évènements indépendants ? Reponse : non car P(M2/M1) P(M2) Q2 : Quelle est la probabilité d’être reçu à l’examen de TP de biochimie ? Réponse : P(M1M2) = P(M2/M1).P(M1) P(M1M2) = 0.8.0.5 = 0.4
C - Lois de probabilités3. Définition ; 2 cas à considérer Une définition très simple … Une loi de probabilité est entièrement définie par l’ensemble des valeurs possibles prises par la variable aléatoire et les probabilités d’apparition de chacune de ces valeurs. … qui demande un peu de précision Dans le cas d’une variable aléatoireX discrète, une loi de probabilité est entièrement définie l ’ensemble des couples (k, p[X=k]) (k Entier, en général) p[X=k] a un sens! Dans cas d’une Variable Aléatoire X continue, une loi de probabilité est définie l’ensemble des valeurs (e , p[X> e]) (eRéel) p[X= e] = 0 ! Prendre p[X< e] dans la définition reviendrait au même
C - Lois de probabilités3. Définition ; 2 cas à considérer Espérance ou moyenne théorique d’une loi de distribution Barycentre de la distribution (valeur pas toujours prise par la variable!)
Solution Soit J : « les fleurs sont jaunes » et H : « la plante est hétérozygote » La probabilité recherchée est P(H/J) (« fleur jaune » est le caractère établit) En se servant de la loi de probabilité établie auparavant : P(H/J) = P(HJ )/P(J) P(J) = 3 / 4 (A dominant) HJ = {Aa, aA}= H P(HJ ) = 2 / 4 P(H/J) = P(HJ )/P(J) = 2/3 Génotype [AA] [Aa] [aa] Probabilité 1/4 1/2 1/4 C - Lois de probabilités3. Définition ; 2 cas à considérer Exercice « les pois de Mendel » Soit le croisement de pois à fleurs jaunes (A, caractère dominant) et vertes (a). Calculer la probabilité qu’une plante à fleurs jaunes de la deuxième génération (c’est-à-dire obtenue par croisement de deux hétérozygotes) soit hétérozygote.
C - Lois de probabilités3. Définition ; 2 cas à considérer Commentaire Les évènements (génotypes) ont été pris ici également probables. Ce modèle ne convient pas aux primevères pour le caractère des feuilles plates (A) ou ondulées (a) : la fréquence expérimentale du nombre de feuilles plates est voisine de 4/5 (les plantes à feuilles ondulées sont moins viables que celles à feuille plates). • Seule l’expérience permet de décider si les valeurs attribuées aux probabilités sont ou non satisfaisantes pour la description du phénomène étudié. • Le modèle statistique doit tenir compte des données biologiques
C - Lois de probabilités4. Exemples • Avec cet exemple nous visualisons : • variable aléatoire = fonction • la loi de probabilité • Calcul de probabilités possible à partir de la distribution • Nous pouvons calculer la moyenne de la distribution
C - Lois de probabilités5. Loi Binomiale La solution du problème des épreuves répétées conduit à la loi binomiale. On jette 5 fois de suite une pièce de monnaie non truquée. Quelle est la probabilité d’obtenir 2 fois "face" à l'issue des 5 jets ? - Quelle est l’épreuve associée ? - Variable de Bernouilli : pour chaque lancé de la pièce, Y=0 si le résultat est ‘Pile’ (échec/absence caractéristique) ; Y=1 si le résultat est face ’Face’ (réussite/présence caractère) -Echantillon ou population ? - Variable aléatoire associée ? - Ensemble des résultats possibles ? - Quelle est la loi de distribution ? - Quels sont la moyenne et l'écart-type de la distribution ? - Représentation graphique
C - Lois de probabilités5. Loi Binomiale Vers le calcul d’une probabilité : P(X=2) • - Variable aléatoire associée ? • Résultats possibles • Généralisation du processus
C - Lois de probabilités5. Loi Binomiale Loi Binomiale X, V. A. discrète, "nombre de réalisations d'un certain événement E lors des n répétitions d'une même épreuve" XB (n, P) Espérance (moyenne théorique) : n P (valeur pas toujours prise par la variable!) variance : n P (1-P) • Cependant cette loi est peu pratique à utiliser lorsque n est grand (calculs fastidieux!) • Tablesde la loi binomiale… • Approche par d'autres loislorsque c'est possible…
C - Lois de probabilités5. Loi Binomiale Soit la variable Po = X/N , avec X : VA binomiale. (proportion d’individus satisfaisant à la définition de la VA X) Quelle est la loi de probabilité suivie par Po? Quels sont la moyenne et la variance de Po ? Espérance : P
C - Lois de probabilités5. Loi Binomiale Loi Binomiale Po, V. A. discrète, "proportion de réalisations d'un certain événement E lors des n répétitions d'une même épreuve" PoB (n, P) Espérance (moyenne théorique) : P (valeur pas toujours prise par la variable!) variance : P (1-P) / n Les distributions de X et Po sont toutes deux des lois binomiales de paramètres n et P mais elles n'ont pas la même moyenne ni la même variance
C - Lois de probabilités5. Loi Binomiale Exercice « Le technicien expérimenté » Le technicien d’un laboratoire pilote réalise une manipulation très délicate qu’il ne rate que dans 30 % des cas : l’injection d’un fragment d’ADN contenant un gène humain dans le noyau d’un oeuf de souris (étape cruciale pour obtenir des souris transgéniques). Il procède par série de 5 manipulations. Grâce à son expérience, il répète un assez grand nombre de fois ses séries de manipulations dans des conditions pratiquement identiques. La V.A. d’étude est X = « nombre de manipulations réussies par série de 5 » Quel est le type de la V.A. X ? Représentez graphiquement la distribution de X Quels sont l’espérance et l’écart-type de cette distribution ? Hypothèse : on supposera sans le démontrer que les manipulations sont toutes indépendantes les unes des autres (effet de la fatigue, impact d’un échec ou d’une réussite sur la manip suivante non pris en compte)
C - Lois de probabilités5. Loi Binomiale Espérance : 3.50 Ecart-type : 1.02
C - Lois de probabilités5. Loi Binomiale • Exercice"sachets de graines" • Un producteur de graines vient de lancer une superbe variété de fleur. Il garantit (sur 1 an) que seules 2 graines sur 10 ne germent pas. Chaque sachet mis en vente contient 200 graines. • / Indiquez combien de fleurs peut donner en moyenne un sachet de graines. b/ Quel est l'écart type associé ? c/ Pour obtenir un massif de 500 fleurs, combien de sachets faut-il acheter en moyenne ? (Indiquez votre raisonnement). • Vous n'oublierez pas de bien définir la VA sous jacente et d'indiquer sa nature (qualitative, quantitative discrète ou quantitative continue).
C - Lois de probabilités5. Loi Binomiale Exercice"sachets de graines " X = « Nombre de graines donnant à une fleur sur un échantillon de 200 graines » P=1-2/10=0,8 N=200 m=NP=200x0,8=160 Variance=NP(1-P)=200x0,8x0,2=32 s=5,7 En moyenne un sachet permet d’obtenir 160 fleurs. Dans ces conditions, il faut 4 sachets pour atteindre au moins l’effectif de 500 fleurs (3x160=480, insuffisant et 4x160=640, OK!). Rq : On pourra préciser l’incertitude en approchant la loi par une distribution normale Avec 3 paquets, seulement 12% de chances (environ) d’obtenir plus de 500 graines
C - Lois de probabilités5. Loi Binomiale Exercice « Séquence Random » On considère une chaîne polypeptidique de n acides aminés générée de façon aléatoire. Soit n=50, taille de la séquence Hypothèse de départ : on considèrera les 20 acides aminés essentiels - Q1 - Quelle est la probabilité de trouver plus de 50% de résidus proline dans cette séquence aléatoire ? - Q2 - Quelle est la probabilité de trouver le tripeptide ‘LLL’ dans cette séquence polypeptidique ? - Q3 - Un poly L , c’est à dire une séquence polypeptidique constituée uniquement du résidu leucine ?
Correction de l' exercice « Séquence Random » - Q1 - P ( Po > 0.5) = P ( X > 25) Po suit une B (50, 0,05) Variable de Bernouilli associée Présence Proline associée à X=1 ; P(X=1)=1/20 Absence Proline (présence de tout autre aa) associée à X=0 ; P(X=0)=19/20=0,95 P ( Po > 0.5) = 0 Application numérique : utiliser table de la loi binomiale ou ordinateur! Exemple : en saisissant LOI.BINOMIALE(25;50;0,05;VRAI) dans Excel, le résultat recherché est le complémentaire à 1 de cette valeur, donc 0
Correction de l' exercice « Séquence Random » - Q2 - Soit n : nombre de résidus dans la séquence polypeptidique ; Soit Nt : nombre de tripeptides dans une séquence de n résidus d'acides aminés Nt = n – 3 +1 Ici : Nt = 50 – 3 +1 = 48 Variable de Bernouilli / Probabilité élémentaire : Pour chaque tripeptide considéré dans la séquence Présence de LLL , W=1 P(W=1)=(1/20)3=0.000125 Absence de LLL , W=0 P(W=0)=1-0.000125=0.999875 Soit la V.A. Y : "nombre de tripeptides LLL dans la séquence aléatoire de 50 résidus d'aa" Y suit une loi binomiale B (48, 0.000125) {Présence de LLL dans la séquence} = (Y> 0) P (Y> 0) = 1 – P(Y=0) P(Y=0) = 1x1x(0.999875)48 = 0.99402 P (Y> 0) = 1 – P(Y=0) = 1-0.9940 = 0.006 (ordre de grandeur : 1%) - Q3 - La probabilité recherchée est : (1/20)50 , pratiquement nulle! On peut également dans ce cas utiliser l'approximation par la loi de Poisson de paramètre l=48x0.000125 ; P(0.006) Saisir sous Excel : =LOI.POISSON(0;0,006;FAUX)
C - Lois de probabilités5. Loi Binomiale Quelques cas où l'on rencontre de la LOI BINOMIALE :
C - Lois de probabilités6. Loi de Poisson Exemple introductif Dans des tests labos faits sur des rats, l’étalement sur la peau d’une crème de soin du commerce peut provoquer une rougeur dans 20 cas sur 1000. Soit X la variable aléatoire "Nombre de rats présentant une rougeur après dépôt du produit sur N individus" A/ Quelle loi de probabilité suit X ? B/ Quelle est la probabilité d'observer moins de 3 cas de réaction sur 100 étalements ? En déduire la probabilité d'observer au moins 3 cas de réaction sur 100 étalements. Que constatons-nous dans cet exemple ? X suit une loi binomiale dont la moyenne est très proche de la variance Et P petite pour N plutôt grand évènement rare Moyenne : nP = 0.02*100 = 2 Variance : nP(1-P) = 100*0.02*0.98 = 1.96
C - Lois de probabilités6. Loi de Poisson Cas d'application (Siméon Denis Poisson 1781-1840) Lorsque le nombre d'épreuves n est grand et P très petit (proche de 0), la loi Binomiale B (n, P) tend vers une loi de PoissonP(l) de seul paramètre l (espérance et variance de la loi binomiale approchée par la loi de Poisson). La loi de Poisson est une distribution discrète. Elle est tabulée P(X=k) = e-llk / k! Côté pratique On vérifiera d'abord que les calculs ne peuvent être approchés par une distribution normale, plus pratique à utiliser
C - Lois de probabilités6. Loi de Poisson Nous sommes maintenant armés pour résoudre notre exemple introductif Dans une expérience faite sur des rats, l’étalement sur la peau d’une crème de soin du commerce peut provoquer une rougeur dans 20 cas sur 1000. Soit X la variable aléatoire "Nombre de rats présentant une rougeur après dépôt du produit sur N individus" A/ Quelle loi de probabilité suit X ? B/ Quelle est la probabilité d'observer moins de 3 cas de réaction sur 100 étalements ? En déduire la probabilité d'observer au moins 3 cas de réaction sur 100 étalements. On va utiliser une loi de Poisson de paramètre : l=2 Et si on le faisait avec R ?.... Fonction : dpois
C - Lois de probabilités6. Loi de Poisson Réels domaines d’utilisation d’une loi de Poisson Nombre d’évènements par unité de volume, de surface, de temps • Nombre de poissons par mètres cube d’eau • Passages d’un ours dans un site des Pyrénées sur une semaine • Concentration de bactéries (hématimètre) dans un lac (homogénéité) • Nombre d’insectes d’une certaine espèce capturés sur un filet en une nuit en forêt amazonienne • Nombre de désintégration d’un radio-isotope par minute • Nombre d’appels enregistrés par un standard téléphonique dans une courte période de temps • Nombre de skieurs empruntant un télésiège en l’espace d’une heure dans une petite station alpine • Etc…
C - Lois de probabilités6. Loi de Poisson Exercice « les ours des Pyrénées » Un écologiste étudie le passage des ours (récemment introduits) en un point précis d’une rivière séparant un champ d’une petite forêt des Pyrénées. A l’issue d’un travail long (plusieurs semaines) et rigoureux, il observe en moyenne 4 individus par jour. a/ Quelle est la probabilité qu’il détecte précisément 3 ours en l’espace de 12 h ? b/ Quelle est la probabilité qu’il détecte entre 1 et 3 ours en 6 heures ? a/ l = 4 individus / j uniformité sur une courte période de temps : l = 2 ind. / 12 h calcul de P(X=3) avec X suit une loi de Poisson de paramètre l=2 (voir table) P(X=3) =0.18 b/ calcul de P(1 Y 3) avec Y suit une loi de Poisson de paramètre l=1 Loi discrète donc P(1 Y 3) = P(Y=1)+P(Y=2)+P(Y=3) (voir table) P(1 Y 3) = 0.3679+0.1839+0.0613 = 0.6131 (0.61 est suffisamment précis)
Taux d’une hormone en mg/ml Taux d’une hormone en mg/ml C - Lois de probabilités7. Calcul de probabilités dans le cas des lois de distribution continues Avec la densité de fréquence relative on a facilement accès aux probabilités, associées aux surfacesdu diagramme.