1 / 42

Chapitre 8: La gestion des données

Chapitre 8: La gestion des données. Consulte les pages 366 et 367 pour les concepts et vocabulaire clés. Chapitre 8: Prépare-toi. Avant de commencer le chapitre 8, il faut réviser ces concepts: Représenter des données Les diagrammes à boîte et à moustaches Les mesures de tendance centrale

wilhelmina
Download Presentation

Chapitre 8: La gestion des données

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Chapitre 8: La gestion des données Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

  2. Chapitre 8: Prépare-toi • Avant de commencer le chapitre 8, il faut réviser ces concepts: • Représenter des données • Les diagrammes à boîte et à moustaches • Les mesures de tendance centrale • Interpoler et Extrapoler des valeurs

  3. 8.1: Les diagrammes de dispersion • Statistique Canada collectionne et organise des données pour aider les Canadiens à mieux comprendre leur pays: sa population, ses ressources, son économie, sa société et sa culture.

  4. Les diagrammes de dispersion • Un diagramme de dispersion est un diagramme qui permet de représenter graphiquement des couples de données numériques. • Il sert à voir des relations entre deux variables.

  5. La droite la mieux ajustée • La droite la mieux ajustée est la droite qui passe par les points représentés dans un diagramme de dispersion ou qui passe le plus près possible de ces points.

  6. Une valeur aberrante • Une valeur aberrante est une donnée qui ne suit pas la régularité qui se dégage des autres données. • Cette donnée semble très à l’écart de la plupart des données.

  7. Interpoler des valeurs • Interpoler des valeurs veut dire l’estimer des valeurs qui se trouvent entre des données connues.

  8. Extrapoler des valeurs • Extrapoler des valeurs veut dire l’estimer des valeurs qui se trouvent à l’extérieur des données connues.

  9. Les variables indépendantes • Dans une relation, la variable indépendante est la variable qui détermine la valeur de la variable dépendante. • Par exemple, avec la vitesse, distance/temps, le temps est la variable indépendante parce que la distance le dépend. • D’habitude, la variable indépendante est x

  10. Les variables dépendantes • Dans une relation, la variable dépendante est la variable dont la valeur est déterminée par la variable indépendante • Par exemple, avec la vitesse, distance/temps, la distance est la variable dépendante parce que la distance dépend sur le temps pour sa valeur. • D’habitude, la variable dépendante est y

  11. Il y a deux types: des données continus des données discrètes Les types des données

  12. Des données continues • Si une variable peut représenter n’importe quel nombre réel, les données sont des données continus. • Quand les données sont rattachées ensemble pour former une droite, cela représente des données continues. • Un exemple des données continus est la température.

  13. Des données discrètes • Si la variable ne peut pas être n’importe quel nombre réel (i.e. un nombre décimal), les données sont des données discrètes. • Quand les données ne sont pas rattachées ensemble, cela représente des données discrètes. • Un exemple des données discrètes sont comme le nombre des pages dans un livre.

  14. Une corrélation #1 • Pour mieux comprendre et mieux organiser les données, Statistique Canada trace des diagrammes de dispersion pour déterminer une corrélation entre deux variables.

  15. Une corrélation #2 • Une corrélation est la mesure de la dispersion des points autour d’une droite dans un diagramme de dispersion (le degré de relation entre deux variables)

  16. La corrélation entre 2 variables peuvent être: Forte Faible Positive Négative N’est pas apparente Les adjectifs d’une corrélation

  17. Une corrélation forte • Si la plupart des points sont groupés autour d’une droite, la corrélation est forte.

  18. Une corrélation faible • Si les points sont dispersés, mais montrent une tendance générale, la corrélation est faible.

  19. La corrélation positive • Une corrélation positive veut dire que la relation entre les variables est positive. • Par exemple, quand la variable indépendante augmente, la variable dépendante augmente alors la pente est positive (elle monte de gauche à droite)

  20. La corrélation négative • Une corrélation négative veut dire que la relation entre les variables est négative. • Par exemple, quand la variable indépendante augmente, la variable dépendante diminue alors la pente est négative (elle descend de gauche à droite)

  21. Une corrélation n’est pas apparente • Si les points sont dispersés et ils ne montrent pas de tendance générale, il n’y a pas de corrélation ou la corrélation n’est pas apparente.

  22. Une relation • Une relation est une régularité entre deux ensembles de nombres. • Une relation = « a relationship »

  23. Avec la gestion des données, il y a 2 types de relations: Une relation linéaire (elle forme une ligne droite) Une relation non linéaire (elle ne forme pas de ligne droite) Les types des relations

  24. 8.2: Analyser des données et faire des prévisions • Pour analyser les données, il est utile à représenter les données à l’aide d’un diagramme de dispersion. • Puis, trace, à vue, la droite la mieux ajustée.

  25. La qualité de l’ajustement de la droite • Une grille de corrélation est un guide pour indiquer de la qualité de l’ajustement de ta droite.

  26. Une grille de corrélation

  27. Voici 6 types de représenter des données: (9ième année) Un diagramme de dispersion Un histogramme Un diagramme circulaire Un diagramme à tiges et à feuilles Un diagramme à boîte et à moustaches Un diagrammes à bandes 8.3: Représenter des données

  28. Un diagramme à bandes • Un diagramme à bandes est un diagramme qui représente des données à l’aide de bandes horizontales ou verticales. • Il sert à comparer des catégories.

  29. Un diagramme circulaire • Un diagramme circulaire est un diagramme qui représente un ensemble de données par un cercle divisé en secteurs. • Il sert à comparer des catégories entre elles et à comparer chaque catégorie à l’ensemble complet.

  30. Un diagramme à tiges et à feuilles • Un diagramme à tiges et à feuilles est une façon d’organiser des données numériques qui représente une partie de chaque nombre par une tige et l’autre partie par une feuille.

  31. Un histogramme • Un histogramme est un diagramme à bandes juxtaposés qui représente des données groupées par intervalles.

  32. Un diagramme à boîte et à moustaches • Un diagramme à boîte et à moustaches est un diagramme qui indique la médiane et l’étendue d’un ensemble de données numériques.

  33. Le fonction des diagrammes à boîte et à moustaches • Un diagramme à boîte et à moustaches illustre la dispersion des données autour de la médiane d’un ensemble de données.

  34. Le vocabulaire des diagrammes à boîtes et à moustaches • La boîte contient ou représente au moins 50% des données. • La plus petite valeur et la plus grande se nomment la valeur minimum et la valeur maximum respectivement. • Le quartile inférieur est la médiane de la moitié inférieure des données. • Le quartile supérieur est la médiane de la moitié supérieure des données.

  35. Comment choisir la représentation la plus appropriée • Le diagramme le plus approprié dépend du type de données que tu veux communiquer.

  36. Les indices pour choisir la représentation correcte #1 • Les diagrammes à ligne brisée et les diagrammes de dispersion servent à analyser des tendances. • Les histogrammes, les diagrammes à boîte et à moustaches et les diagrammes à tiges et à feuilles servent à analyser l’étendue des données.

  37. Les indices pour choisir la représentation correcte #2 • Les diagrammes à bandes et les diagrammes circulaire servent à comparer des catégories.

  38. Les mesures de tendance centrale • Le mesure de tendance centrale est la valeur qui représente le centre d’un ensemble de données.

  39. Il y a trois types de mesure de tendance centrale: La moyenne La médiane Le mode Les types de mesure de tendance centrale

  40. La moyenne • La moyenne est la somme des valeurs d’un ensemble divisé par le nombre de valeurs dans l’ensemble. • L’avantage de la moyenne: elle donne des renseignements sur la somme des valeurs. • Le désavantage de la moyenne: les valeur aberrantes ont une incidence sur elle.

  41. Le médiane • La médiane est la valeur du milieu quand les données d’un ensemble sont placées par ordre croissant. • L’avantage de la médiane: les valeurs aberrantes ont peu d’incidence sur elle. • Le désavantage de la médiane: elle ne fournit aucun renseignements sur la somme des valeurs.

  42. Le mode • Le mode est la valeur la plus courante dans un ensemble de données. • L’avantage du mode: il est facile à trouver dans des tableaux de fréquence, des diagrammes, des diagrammes à bandes ou des histogrammes. • Le désavantage du mode: il peut changer énormément quand il y a ajout de nouvelles données.

More Related