Retour aux actualités

23 mars 2016

Vers l’automatisation du fact-checking ? Le cas des Décodeurs (Le Monde)

Alors que le travail de fact-checking relève encore de l'artisanal dans la plupart des rédactions, des chercheurs tentent de mettre sur pied des algorithmes pour automatiser cette mission journalistique Ô combien nécessaire mais terriblement chronophage. 

Ioana Manolescu, directrice de recherche chez Inria au centre de Saclay et Samuel Laurent, responsable des Décodeurs (lemonde.fr) sont venu nous parler des outils de gestion de contenu pour la vérification de faits. Partie d'un blog, la rubrique des Décodeurs compte aujourd’hui une équipe de 10 personnes en charge du fact checking, du datajournalisme et du journalisme explicatif (articles de pédagogie et de mise en perspective de l’actualité). Comme Samuel Laurent ne manque pas de le rappeler : 
« Le factchecking, c’est un peu plus compliqué que de dire c’est vrai ou c’est faux, il faut contextualiser l’information. »
Depuis 2 ans, la rubrique du Monde collabore avec des chercheurs pour mettre en place un projet de mise en contexte automatisée de l’information (notamment des propos tenus par les politiques).  Avec le numérique, le spectre des données disponibles est beaucoup plus large. De nouveaux contenus (rapports d’administrations, blogs…) et de nouvelles bases de données de référence apparaissent (ex : DBpedia), parfois très spécifiques. La question de départ du projet est donc la suivante : que peut-on faire du point de vue de la gestion des données et de la connaissance pour aider les journalistes à vérifier l’information, l’analyser et expliquer la complexité du réel ? En étroite collaboration avec l’équipe de recherche OAK (menée par Ioana Manolescu), les journalistes du Monde ont travaillé sur une solution qui permettra d’apporter un contexte à un chiffre ou un propos avancé lors d'un débat politique. Le projet, baptisé “ContentCheck”, regroupe au total 5 institutions d’enseignement supérieur et de recherche et 4 labos. L’agence nationale de la recherche (ANR) financera le projet pendant 4 ans. Ce partenariat avec la recherche est un pas vers le journalisme “augmenté”, dans lequel la technologie ne remplace pas le journaliste, mais vient au contraire l'accompagner et, dans l'idéal, lui permettre de gagner en efficacité. À lire sur le même sujet : Robots et journalistes : vers le grand remplacement ? Ioana Manolescu nous a présenté 2 autres outils en cours de développement.  Le premier, FactMinder, est une extension pour navigateur qui se divise en deux parties. À gauche, la page web est reliée à un système d’extraction d’entités nommées (personnes, organisations…). À droite, un tableau de bord permet de visualiser les informations clés. fact checking Ce navigateur enrichi d’une base de connaissances et d’annotations, permet ainsi d’identifier les personnes, les organisations, les lieux mentionnés dans le texte parcouru et d’obtenir simultanément les principales informations les concernant (citations, histoires connexes…).
  L’autre outil, Tatooine, propose quant à lui une architecture d’intégration de données hétérogènes qui vise à exploiter et à combiner les sources de données entre elles afin d’y trouver des connexions.
« Nous sommes confrontés à des jeux de données construits par des entités différentes. Il est nécessaire de trouver des connexions entre les sources, d’observer ce que différentes personnes disent à propos d’un sujet ou ce qu’une seule dit à différentes occasions. »
Selon Ioana Manolescu, les outils de gestion de données sont absolument nécessaires pour combiner et croiser les sources de données différentes.
« Au sein des Décodeurs, on commence à avoir des approches de données structurées » déclare Samuel Laurent, même si « c’est assez nouveau dans les rédac’ et que l’on est encore dans une culture très littéraire. »
Image : Vecteur de Banner conçu par Freepik  

À lire aussi dans chantiers numériques #20, la veille collaborative du cluster :

3 autres articles sur des projets de recherche (réservés aux adhérents) 2 articles à partager sans modération :