Mot-clé - Stats Monkey

Fil des billets

mardi 22 mai 2012

Robot-journalisme: y a-t-il un humain derrière cet article ?

METROPOLIS--robot-008.jpg

Des prévisions de résultats de plusieurs sociétés, sur l'actualité boursière d'Abercrombie & Fitch, Limited Brands ou encore Saks, publiés sur Forbes.com, dans un style très factuel, que n'auraient pas dénié les agences AP ou Reuters, signés... par un certain Narrative Science. Et écrits par un robot, ou plus exactement par un algorithme complexe. Bienvenue dans l'ère du journalisme du futur ?

En tous cas, ces prémisses en ont fait frémir plus d'un, alors que l'annonce, la semaine dernière, a fait bruisser la Toile, bien plus que les médias traditionnels - pas vraiment surprenant, on y reviendra. Car oh Gosh, le vénérable Forbes a lancé une petite bombe en recourant le premier à cette étrange signature, comme le relevait le Guardian. Narrative Science, c'est donc le nom d'une start-up basée au nord de Chicago, fondée en 2010 par Larry Barnbaum et Kris Hammond, spécialistes en intelligence artificielle ET journalistes - leur double spécialité n'a absolument rien d'anodin.

Forbes.jpg

Concrètement, cet algorithme met en forme des données - puisées dans des résultats sportifs, rapports financiers de sociétés... - "enrobées" avec un corpus de mots, de tournures de phrases et d'expressions fréquemment employés par des journalistes. En clair, ce logiciel "transforme des données en article, de telle sorte que le résultat soit indiscernable d'un article écrit par un journaliste", résume la société sur son site Internet.

Certes, l'activité de Narrative Science n'est pas tout à fait nouvelle : la start-up, née en 2010, commencé ses activités sous le nom Stat Monkeys, avec un robot qui reprend les scores de matchs sportifs pour en faire des dépêches, de manière très élaborée, comme le décrivait alors Le Monde:

Pour déclencher Stats Monkey, il suffit qu'un humain lui indique quel match il doit couvrir. Une fois lancé, il travaille automatiquement de A à Z. Il commence par télécharger les tableaux chiffrés publiés par les sites Web des ligues de base-ball, et collecte les données brutes : score minute par minute, actions individuelles, stratégies collectives, incidents... Puis il classe cette masse d'informations et reconstruit le déroulé du match en langage informatique. Ensuite, il va puiser son vocabulaire dans une base de données contenant une liste de phrases, d'expressions toutes faites, de figures de style et de mots-clés revenant fréquemment dans la presse sportive. Il va alors rédiger un article.

Les choses ont évolué depuis. D'après le New York Times, Narrative Science compterait une vingtaine de clients, mais dont peu osent encore révéler leur identité, exceptée, par exemple, la chaîne de télévision sportive américaine The Big Ten Network, qui y recourt pour couvrir davantage de compétitions locales.Elle compte aussi une grand société de fast food, pour "réadapter" en rapports mensuels les résultats des franchises.

Et ce n'est pas fini: d'après cette passionnante enquête de Wired, la start-up, qui compte une trentaine de salariés, a son appli iPhone, GameChanger, qui convertit automatiquement sur l'iPhone du client les résultats d'un jeu sportif en article. Mieux, Narrative Science permet à ses clients de personnaliser le ton, l'angle de leurs articles. Brrr...

Journalisme Web

Rien de bien surprenant que ce soit l'univers du Web et des media sociaux qui se soient intéressés le plus près, la semaine dernière, à cette initiative de Forbes. Car après tout, le journalisme Web est le premier concerné par cette mutation potentielle. Dans les rédactions Web, on apprend déjà (Google dispense des formations en la matière..) comment écrire des articles adaptés au référencement par les moteurs de recherche (et une bonne audience) : placement des mots-clés en tête d'article, utilisation d'outils tels que Insights for search pour voir quels mots-clés ressortent le plus dans les moteurs de recherches par périodes, de Keyworld Tool pour mesurer l'impact potentiel d'une thématique...

Dans la foulée, un peu comme les data journalistes, de nouveaux métiers émergent, les "meta writers", des "journalistes confirmés qui ont conçu un ensemble de templates, et travaillent avec des ingénieurs pour identifier des "angles" variés à partir des data", d'après Wired.

Assurément, l'utilisation au grand jour de Narrative Science par Forbes vaut caution. Et ouvre une brèche. On imagine les perspectives vertigineuses... Déjà, parce que Narrative Science entend s'intéresser à d'autres secteurs, qui reposent sur de solides bases statistiques: le sport, mais aussi la finance, l'immobilier... Ensuite, cet algorithme est d'une efficacité diabolique: il lui faut moins de deux minutes pour produire - j'écris bien produire - un article. Sans compter bien sûr, le coût modique (10 $ les 500 mots dans les chiffres cités). Bref, les robots travaillent beaucoup plus vite, moins cher... et sans revendications, forcément.

D'autres start-ups proposent des services similaires: MarketBrief convertit automatiquement des données boursières en articles, Stat Sheets, rebaptisée Automated Insights, est aussi spécialisée dans le sport. En France, la société Opta , spécialiste des statistiques sportives, a conçu pour RTL un "générateur" de flux automatiques de commentaires pour suivre les matchs de Ligue 1, comme le dévoilait Stratégies en début d'année dans cet article, sous la plume de ma collègue Delphine Soulas.

Tout cela au détriment, évidemment, de certaines bases journalistiques: vérification et recoupement de l'information, caractère exclusif de celle-ci, mise en scène attractive du sujet...

Bien sûr, on joue en quelque sorte à se faire peur. Ce sera un peu compliqué pour ces algorithmes de générer des interviews, mais Frankel prétend déjà que Narrative Science peut produire 20% du contenu des journaux, alors que "de plus en plus de data sont disponibles. S'il y a des data, on peut raconter une histoire", affirmait-il à Wired. Il compte d'ailleurs sur les communautés de fans - geeks pour enrichir ces bases de statistiques. Et pourquoi pas décrocher un jour le Pulitzer, provoque-t-il.

Mais peut-être que cela ouvre d'autant plus la voie à une scission entre un journalisme à deux voies, entre d'une part une offre abondante et gratuite d'articles très factuels, et d'autre part une offre premium, voire luxueuse, de reportages et d'enquêtes fouillés, très écrits, dans la lignée du journalisme à l'état sauvage que revendiquent les héritiers de Hunter S. Thompson.