Retour aux actualités

27 juin 2016

Des données percutantes avec la dataviz

Thomas Fournaise, chef de projet innovation au sein du Groupe La Poste est venu parler des modèles, des biais et des liens entre les différentes données avec quelques tuyaux pour les rendre compréhensibles grâce à la datavisualisation. 

Thomas Fournaise

Thomas Fournaise rappelle que les données permettent de produire de l’information pour arriver à de la connaissance et enfin aboutir à des décisions.

« La finalité d’une dataviz est d’amener le lecteur sur une prise de décision et de conscience »

Premièrement, pour faire du datastorytelling, soit raconter une histoire avec des données : toujours garder en tête l’objectif, la cible et la structure (comment présenter les données).

Voici donc les 7 étapes de réalisation d’une dataviz :

1) Acquérir les données

2) Transformer (par exemple si on se retrouve face un document PDF scanné)

3) Filtrer les données (éliminer les données incohérentes ou inutiles)

4) Explorer (en tirer des formules statistiques pour se faire une première idée de leur comportement)

5) Représenter

6) Affiner (on repart sur un cycle de filtrage)

7) Interagir (à la fin seulement on peut rajouter la couche d’interaction)

Comme disait Mark Twain,  « il y a 3 sortes de mensonges : les mensonges, les sacrés mensonges et les statistiques. » Thomas Fournaise nous a montré quelques biais pour mentir avec les données et maquiller les chiffres. Il est notamment possible de mentir avec les proportions (le lecteur ne va pas forcément regarder le chiffre mais juste l’aire ou la surface), les points de départ des axes et des échelles, les liens faits entre corrélations et causalité qui ne signifient pourtant pas la même chose…

Thomas nous met aussi en garde contre les biais et les préjugés. Exemple : pendant la récession, les ventes d’alcool ont augmenté (préjugé : les gens ont voulu boire pour oublier) VS les ventes ont diminué (préjugé : les gens n’avaient pas d’argent). Attention également à faire la différence entre variation en pourcentage et en points de pourcentage. Dernière réserve émise sur les camemberts en 3D qui changent la perspective sur les données. Choisir un type de graphe dépend surtout de ce que l’on veut montrer : une comparaison, une relation, une distribution, une composition…

Enfin, pour la représentation graphique, Edward Tufte conseille de retirer le décorum, d’effacer ce qui est redondant et qui n’est pas de la donnée. La règle d’or peut paraître évidente mais elle est essentielle : il faut montrer la donnée. La maximisation « data-ink » revient à se poser la question : quel est le volume d’encre qui me sert à montrer de la donnée sur mon graphique ?

L’info en plus :  Thomas développe actuellement une appli qu’il est venu présenter en janvier dernier lors d’un apéro StoryCode Grand Ouest. Ma carto permet de générer des cartes de France interactive en important un simple fichier CSV.

http://www.storycodegrandouest.org/storycode-12-retour-sur-les-5-projets-de-dataviz-presentes/

Pour aller plus loin : Ouest Médialab organise depuis 4 ans des formations professionnelles au traitement, à la visualisation et à la narration des données à l’attention des journalistes et des communicants. Inscrivez-vous si vous êtes intéressé(e) par les prochaines sessions.

Le cluster organise par ailleurs des ateliers transdisciplinaires dédiés à la datavisualisation et au datajournalisme : les ateliers HybLab.

 

À lire aussi dans Chantiers numériques #23, la veille collaborative du cluster : 

La suite de notre sélection Web2day 2016 : 

6 retours d’expérience :