1 / 28

Rappels

Rappels. Variables nominales : Oui / Non Bleu / Brun / Roux / Noir Pour déterminer s’il y a un lien, on utilise le  2 Variables quantitatives : Notes sur 20 Performances sportives

Download Presentation

Rappels

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Rappels • Variables nominales : • Oui / Non • Bleu / Brun / Roux / Noir • Pour déterminer s’il y a un lien, on utilise le 2 • Variablesquantitatives : • Notes sur 20 • Performances sportives • Pour comparer des moyennes, on utilise les intervalles de confiances (loi normale ou T de student, selon les cas) • Pour déterminer s’il y a un lien, on utilise la corrélation

  2. Problème Y a-t-il un lien entre : • Note de français et note de math ? • Temps de préparation et performance ? • Poids et taille ? • Taille et note de math ?

  3. Exemple 1 • Note de français et note de math : y a-t-il un lien ?

  4. Exemple 2 • Taille et note de math : y a-t-il un lien ?

  5. Exemple 3 • Note de techno et note de français : y a-t-il un lien ?

  6. Lien ou pas ? Non : Taille et note sont indépendants Oui, lien positif bonne note de math = bonne note de français Oui, lien négatif bonne note de math = mauvaise note de techno

  7. Intuitivement Lien négatif Lien positif Lien positif Lien négatif Négatif Positif

  8. En pratique Donc est négatif Donc est positif Donc est négatif Donc est positif

  9. En pratique • La covariance précise le lien : Cov(X,Y)= • Si Cov(X,Y) est grand (en valeur absolu), il y a un lien • Si Cov(X,Y) est négative, le lien est négatif • Si Cov(X,Y) est positif, le lien est positif

  10. Exemple 5 x 5 = 25 ↓ ← 2 x 3 = 6 - 2 x 2 = - 4 → - 2 x - 3 = 6 → ↑ 3 x - 2 = - 6 ↑ - 6 x - 5 = 30 30+6+6+25-4-6=57 Cov(X,Y) = 9,5

  11. Problème • La covariance dépend de la taille des données : Contrôle noté sur 20 Même contrôle, noté sur 100 Cov = 9,5 Cov=237,5 … • Elle dépend aussi de l’unité : poids vs taille ↔ Kg vs cm

  12. Solution • Coefficient de corrélation : • C’est une covariance « normé » • Varie entre -1 et 1 • Pas d’unité (ni Kg, ni note sur 20,…) Rappel : EX est l’écart type de la variable X

  13. Propriétés • r varie entre -1 et 1 • Si |r|=1, le lien entre les variables est parfait • Si r>0, le lien est positif • Si r<0, le lien est négatif • Si r=0, on ne peut rien dire. Exemple :

  14. Exemple Note sur 20 Note sur 100 Cov = 9,5 Cov=237,5 EX=4,05 EY=3,90 EX=20,25 EY=19,49 rXY=0,601 rXY=0,601

  15. Régression linéaire : problème • On a les notes math et français suivantes : • Un élève a 10 en math, on voudrait estimer sa note probable de français

  16. Solution graphique • Si on connaît la « droite moyenne » : on peut « lire » la note probable • Ici, 10 en math donne 11,2 en français

  17. Solution arithmétique • Equation d’une droite : y=ax+b. • On cherche a et b • Plusieurs solutions possibles

  18. Solution arithmétique • On considère les écarts entre la droite et les vrais points : on veut LA droite qui minimise ces écarts au carré :

  19. Calcul (optionnel) • L’écart entre un point (xi,yi) et la droite est : yi-y ou encore yi-axi-b • L’écart au carré est donc (yi-axi-b)2 • On cherche a et b tel que la somme des écarts au carré soit minimun, c’est-à-dire tel que : soit minimum • Pour cela, on dérive G, on trouve son minimum ce qui nous donne la valeur de a et de b

  20. Equation de la droite • y=ax+b avec MX moyenne et EX écart type de la variable X

  21. Symétriquement • Si on veut les math en fonction du français :

  22. Equation de la 2ieme droite • y=ax+b avec MX moyenne et EX écart type de la variable X

  23. Régressions non linéaires

  24. Comment tricher ?(ou quelques erreurs communes) 3 a-t-il deux fois mieux réussi que 2 ?

  25. Pourcentage… • Lycée 1 • Garçons : 20% de réussite 2 sur 10 • Filles : 30% de réussite 60 sur 200 • Lycée 2 • Garçons : 60% de réussite 120 sur 200 • Filles : 70% de réussite 7 sur 10 • Lycée 1+2 • Garçons : 58% de réussite 122 sur 210 • Filles : 32% de réussite 67 sur 210

  26. De quoi parle t on ? • Le taux de croissance de la criminalité est en constante diminution sur les trois derniers mois ! • Mars 100 • Avril 120 (augmentation 20%) • Mai 140 (augmentation 17%) • Juin 160 (augmentation 14%) JAMAIS de pourcentage SANS l’effectif

  27. Le mieux est l’ennemie du bien…

  28. Risque 5% • Risque 5% : 20 patients = 1 erreur • 20 expériences = une expérience fausse…

More Related