110 likes | 210 Views
Spécificité : le croisement de trois compétences. Infographie : L’Antisèche du Parisien magazine. Dataviz : la page DataMatch de Paris-Match. Journalisme de données ou journalisme statistique ?. Journalisme de données : Analyser des jeux de données pour produire de l’information.
E N D
Journalisme de données ou journalisme statistique ? • Journalisme de données : • Analyser des jeux de données pour produire de l’information. • Statistique descriptive : • Ensemble de techniques pour décrire un jeu de données. • Statistique inférentielle : • Utiliser les données pour apprendre quelque chose sur un paramètre auquel on s’intéresse. • En général, le data-journalisme reste dans une démarche descriptive. • Journalisme statistique : • utiliser la statistique inférentielle pour répondre à des questions journalistiques.
EuroMillions : Quels numéros faut-il jouer ? Question : Une chance sur 116 millions de remporter la cagnotte mais a-t-on toujours la même probabilité de partager les gains ? Réponse : • Si tous les joueurs jouent parfaitement au hasard : pas de stratégie gagnante • Si certains joueurs ont des numéros fétiches, alors il faut jouer les numéros les moins souvent joués. Problème : Comment savoir si certains numéros sont plus joués que d'autres ?
Problème et intuition Données disponibles : • Pas de données sur ce que jouent les joueurs • Pour chaque tirage, on a les numéros et les étoiles tirés ainsi que le nombre de vainqueurs à chaque rang. • Exemple : date : 09 mars 2014, boules : 2-20-27-33-45, étoiles : 6-10, vainqueurs au rang 1,2,3 : 28, etc Intuition : • Utiliser le nombre moyen de vainqueurs quand un numéro est tiré pour estimer ce que jouent les joueurs. • Le nombre de vainqueurs à chaque tirage est un sondage sur les stratégies des joueurs.
Résultats Numéros les plus souvent joués : • 21: joué dans 13% des grilles • 37 : joué dans 8,5% des grilles Combinaisons les plus souvent jouées : • 21-11-13-12-35 1-9 : 1 fois sur 40 millions • 37-48-1-36-25 4-11 : 1 fois sur 300 millions
Quelle est la probabilité de partager le gain ? Si la probabilité qu'une grille soit jouée suit une loi de Bernouilli de paramètre p, le nombre de vainqueurs sachant que N grilles sont jouées suit une loi de Poisson de paramètres N * p. Résultat : • Combinaison la plus souvent jouée : 40% de chances qu'il y ait au moins un autre vainqueur. • Combinaison la moins souvent jouée : 6,5% de chances qu'il y ait au moins un autre vainqueur. • En jouant les nombres les moins souvent joués, j'ai 6 fois moins de chances de partager le gain.
Pour en savoir plus Notre Site : www.askmedia.fr Notre Blog : www.askmedia.fr/blog Notre Twitter : @askmedia_