Google Viz "Elections 2012": data journalism sans journalistes
Par Alain Joannes le mercredi 14 décembre 2011, 18:41 - DEFIS ACTUELS - Lien permanent
Le concours de visualisation de données organisé par Google a détecté six
applications en ligne susceptibles d'améliorer l'assimilation par les
internautes des enjeux de la campagne électorale de 2012.

Un jury indépendant composé d'ingénieurs, d'un architecte de l'information,
d'un spécialiste de l'opinion publique, d'un expert en marketing web et de deux
journalistes a désigné Mediarena
comme la meilleure des applications finalistes.
Les cinq autres réalisations récompensées sont:
En tant que membre du jury, j'analyserai toutes les applications finalistes
dans le blog Data
Journalism qui prolonge mon ouvrage publié aux
éditions du CFPJ..
Un tout petit sondage très édifiant
Lors de la soirée de proclamation des résultats, j'ai demandé aux lauréats qui
venaient de s'expliquer sur leur travail s'ils avaient fait appel à des
journalistes politiques.
Réponses: non.
Donc, la réflexion, la mise au point et la validation d'outils de traitement
d'une l'actualité électorale passionnante et complexe se sont effectuées sans
qu'aucun journaliste politique ne soit consulté.
Aucun de ceux et celles qui ont signé ces très belles applications n'a pensé
aux journalistes. Un des gagnants a même laissé entendre, poliment, qu'il avait
préféré éviter les journalistes.
Trois hypothèses consternantes pour la profession
J'espérais, quand les membres du jury ont commencé à évaluer les applications,
reconnaître des questionnements, des "angles" spécifiquement
journalistiques.
Après tout, l'appropriation de nouvelles manières de faire son métier a
toujours été source de créativité. C'est ce qui s'est passé pour le
journalisme, jadis, quand le téléphone s'est ajouté au porte-plume - le scoop
d'Alex Virot sur l'Anschluss - puis quand la radio s'est ajoutée à la machine à
écrire, puis la télévision...Chaque implémentation technique a régénéré le
journalisme sans le réinventer totalement. Internet apporte, avec les
webdocumentaires, twitter et le crowdsourcing, une timide contribution
à cette régénération. Mais, là, dans le journalisme de données appliqué à une
actualité aussi importante que la période électorale en période de crise, rien.
Pas de journalistes.
Le fait que des non-journalistes réussissent à construire des outils
d'exploration de l'actualité aussi performants conduit à trois hypothèses
consternantes pour ceux dont le métier est de détecter, de comprendre,
d'expliquer l'actualité:
1 - Les journalistes politiques actuellement en
fonction sont incapables de maîtriser les outils de leur époque. Ils
s'abaissent à la même capitulation que celle de leurs ainés qui, dans les
années soixante-dix, ont abandonné aux "directeurs des études" des "instituts"
de sondages le soin d'analyser les enquêtes d'opinion. Aujourd'hui encore, je
ne connais pas un journaliste politique l'audiovisuel capable de "parler" des
sondages avec un minimum de discernement.
(Raison pour laquelle, j'avais été amené à créer en 1997 sur LCI - après
une algarade en conférence de rédaction avec David Pujadas - un magazine
hebdomadaire: le Club de l'Opinion. On y traitait déjà de données sous formes
de statistiques.)
Remarque: après avoir comblé les insuffisances des journalistes "spécialisés"
dans l'analyse des sondages, les directeurs d'études les ont carrément remplacé
dans le commentaire hors sondages.
2 - Les contenus à forte valeur ajoutée ne seront plus
produits par des journalistes. Cela signifie que "les professionnels
de la profession" ne comprennent pas qu'entre les platitudes dispensées sur
l'audiovisuel et des outils simples, ludiques, intelligents, les internautes
les plus intéressants pour l'avenir de l'industrie de l' information choisirons
forcément les riches applications du web. La platitude du journalisme politique
crispé sur ses pauvres métaphores guerrières - "Machin monte au créneau,
Duschmoll mobilise ses troupes" - ne s'applique pas aux contenus des grandes
marques média de la presse écrite. Mais les sites web de cette presse-là ne
proposent guère d'outils interactifs qui permettraient aux internautes
d'explorer l'actualité complexe.
En tous cas, une profession qui ne sait pas produire des contenus à
forte valeur ajoutée se dévalorise.
3 - Le fait que des non-journalistes produisent des
contenus informatifs nouveaux et passionnants est plutôt réjouissant.
Cela signifie que les programmeurs, les designers qui ont signé, par exemple,
les six applications récompensées par Google ont à la fois le sens de
l'actualité et une bonne connaissance de ce que les internautes
attendent.
En plus,ces non-journalistes savent repérer les bonnes données, les organiser.
Et surtout, ils savent raconter la complexité, la rendre accessible avec des
graphismes interactifs agréables et pertinents.
Ce qui est grave pour les futurs journalistes et pour les jeunes qui ne peuvent
pas encore se faire entendre dans les rédactions, c'est que les journalistes
politiques en vue n'ont pas encore compris, eux, qu'en plus de leur manque de
savoir-faire, ils sont victimes de leurs connivences avec la caste
politicienne.
Anecdote: un développeur dont l'application n'a malheureusement pas
été sélectionnée avait pris en compte la candidature de Dominique de Villepin
au moins trois semaines avant la déclaration de l'ancien premier ministre à la
télévision. Ce n'est peut-être pas un scoop. Mais çà donne une idée de la
fraîcheur de l'actualité politique observée par des non journalistes. Comparée
à cette stimulante vision de l'actualité, la logorrhée audiovisuelle dégage une
odeur de naphtaline.
Le palmarès du concours Google Dataviz Elections 2012
Analyse
de l'application gagnante
Analyse
de l'application "Partie2Campagne".
Analyse
de l'application Retwhit 2012
Analyse e l'application
Bubble-Tweets
Analyse
de l'application Thema Tweets

Commentaires
J'entends que certains journalistes (les "data-journalistes") savent explorer les données.
Mais de nombreux autres métiers le font aussi et souvent depuis plus longtemps en utilisant des outils et méthodes rodés depuis des décennies. Ainsi j'évoquerai les analystes (marketing ou marché financier), les statisticiens et les contrôleurs de gestion...
Dans le monde économique, nous avons l'habitude depuis fort longtemps d'explorer quotidiennement les données et ce à une très grande échelle au point que des bases de données sont créées spécifiquement pour nos demandes d'analyse (ex.: entrepôts de données multidimensionnels... qui peuvent s'apparenter à de gigantesques tableaux croisés dynamiques mutualisés entre différents utilisateurs).
Pour être plus précis, quand je lis ce que certains "data-journalistes"synthétisent comme conseils (http://datadrivenjournalism.net/res...), l'analyste de données en entreprise que je suis est atterré par le niveau basique des préconisations d'usage. C'est à croire que certains data-journalistes viennent de découvrir Excel... et encore sans avoir la curiosité de venir voir l'usage qu'en font les "data crunchers" en entreprise, surtout dans le domaine du décisionnel (ex.: détection des tendances, exceptions et patterns, analyse de benchmark, dépollution des effets exogènes dans la mesure de la performance, data mining basé sur des entrepôts de données dédiés à la découverte d'information...).
En conclusion il me semble que certains récents "data scientists" auraient plus vite fait de copier ce qui existe déjà plutôt que d'essayer de réinventer les basiques de l'analyse. Bref il serait sain que les usages et pratiques de professionnels spécialistes de l'exploration de données soient rapidement connus et récupérés par les data-journalistes, quitte à les adapter à leurs besoins spécifiques.
PS : Ayant acheté et lu votre livre publié il y a douze mois, je sais que vous maîtrisez votre sujet. Donc ce commentaire n'est absolument pas une attaque de votre savoir-faire.
Cordialement,
un des finalistes du concours.
Je ne suis pas paranoïaque au point de considérer toute critique de mes réflexions de blogueur, de mon travail de journaliste et de mes livres comme une attaque personnelle. La critique est bienvenue quand elle enrichit le travail d'élucidation de certaines problématiques.
Vos remarques, en l'occurrence, éclairent partiellement les motifs de mon courroux.
Vous avez remarqué que je m'en prends prioritairement aux journalistes politiques. D'abord parce que le sujet est politique. Ensuite parce que les journalistes économiques sont moins incompétents, en général, dans le domaine des statistiques.
Mais, surtout, il n'est pas question, selon moi, que les journalistes puissent rivaliser avec les statisticiens, les contrôleurs de gestion ou les analystes financiers. Il y a des expertises qu'un professionnel de l'information, même spécialisé en politique, ne peut pas et ne doit pas chercher à acquérir.
Ainsi, il vaut mieux confier la programmation aux développeurs et la visualisation interactive aux designers et aux infographistes. Ce qui n'empêche pas les journalistes d'acquérir une compétence minimale dans ces domaines: savoir au moins ce que les experts - programmeurs, designers, infographistes - peuvent faire pour compléter leur travail de journaliste au service des lecteurs et internautes.
Et c'est bien là que réside la cause principale de mon mépris pour la caste particulièrement inepte et technophobe des journalistes politiques.
Je ne m'attendais pas à ce qu'ils réalisent eux-mêmes une application (j'en suis encore incapable, mais c'est provisoire). Mais j'espérais que, pour concevoir des outils d'information hautement politiques, les développeurs et designers qui ont participé au concours Google Viz Elections 2012 auraient au moins consulté des journalistes politiques. Que des journalistes spécialisés dans le traitement de l'information politique auraient été associés à la conception ou à la validation des applications. Non, rien. Pire: une pointe de défiance à l'égard des professionnels de l'information politique...
Vos remarques m'incitent à apporter une précision: si par manque de formation (autre problème de la corporation: des escrocs vendent très cher des cours de data journalism qui n'atteignent pas le niveau d'Excel pour les nuls), si par manque de temps les rédactions ne peuvent pas concevoir, à l'instar du Guardian, du New Yok Times, du Washington Post , du Wall Street Journal, des visualisations de données interactives, ils peuvent externaliser, faire appel à de petites entreprises comme Dataveyes. A condition, évidemment, de savoir au moins ce que ces expertises extérieures peuvent apporter à l'industrie de l'information.
j'ai aussi une application dans les finalistes. je précise aussi que ma coéquipière a été journaliste même si elle ne l'est plus en ce moment.
maintenant pourquoi les applications ont été conçues sans journalistes?
c'est surtout du au format et aux contraintes du concours. il ne s'agissait pas de construire la meilleure visualisation, la plus pertinente ou la plus utile, mais une visualisation utilisant l'API de twitter ou de google. Les problèmes auxquels j'étais confronté pour concevoir l'application étaient d'abord techniques: à quelles données vais-je avoir accès? comment les récupérer? comment automatiser ce processus? ce sont ces contingences techniques et des considérations comme les limites de l'API de twitter qui ont défini le champ des possibles. dans ce contexte se poser la question de quoi représenter en faisant abstraction des contraintes techniques, une question à laquelle un journaliste aurait pourtant pu apporter une réponse pertinente, était inutile.
maintenant je veux aussi dire que par ce concours on n'a pas abordé la question de la visualisation en politique. je veux dire par là qu'aucun d'entre nous n'a représenté quelque chose d'intéressant ou de substantiel. Qu'est ce qui est intéressant? de savoir ce que les candidats proposent. Sur le fond. Par exemple, les différences attendues entre la France de 2013 version UMP, PS, ou autre. évidemment, pour l'instant c'est impossible à montrer parce que les programmes ne sont pas connus, et encore une fois cette contrainte de se focaliser sur une information en temps réel nous force à nous concentrer sur l'accessoire, sur la trace, sur le contenant. Le nombre de tweets sur eva joly, le nombre de mentions de Sarkozy dans le Figaro, rien de tout ça n'aura un impact sur le résultat final. Et pour l'instant, rien n'est décrypté parce qu'il n'y a pas encore de débat d'idées.
donc, la visualisation politique n'a pas encore commencé. elle sera peut-être le fait des journalistes ou d'autres intermédiaires. Ce que j'espère c'est que les partis et les candidats eux-mêmes s'en saisiront pour argumenter.
Vous avez évidemment raison sur les contraintes spécifiques de ce concours. Raison pour laquelle, je ne m'attendais pas à avoir à utiliser, comme membre du jury, des applications réalisées par des journalistes.
Nous divergeons cependant sur les réponses à apporter aux questions auxquelles vous avez dû répondre dans le cadre de ces contraintes. "A quelles données vais-je avoir accès ?, "comment vais-je récupérer ?", à quoi j'ajouterai "Comment les vérifier ?", "Comment évaluer leur pertinence ?". Ce sont des questions pas exclusivement mais typiquement journalistiques.
Au coeur de mon indignation réside l'absence de créativité proprement journalistique dans les applications récompensées. Même en tenant compte des contraintes que vous soulignez d'emblée et à juste titre, il y avait de la place pour un regard journalistique sur les données à récupérer. Il y avait de la place pour de la créativité.
Une créativité dont font preuve les journalistes du Guardian et surtout ceux du New York Times qui, chaque semaine ou presque, inventent une nouvelle manière d'explorer les contenus des débats internes au Parti Républicain dans la perspective des primaires.
Une des ces applications (exemple parmi d'autres, nombreux), essaie de trouver une corrélation entre les tweets émis à l'occasion des grands débats télévisés et les fluctuations des sondages. Les résultats ne sont pas prédictifs mais ils sont passionnants et inédits.
Cet "angle" était envisageable dans le cadre des contraintes de Google Viz. Le New York Times, autre exemple, vient de réaliser une application - certes pas très interactive - qui permet aux électeurs américains de constater visuellement et avec des données fiables et pertinentes que les candidats à la primaire républicaine passent plus de temps à se dénigrer qu'à mettre en cause l'activité de leur principal adversaire, Barack Obama. Une application de ce genre était envisageable en France dans le cadre des contraintes de Google Viz Elections 2012. Elle aurait permis de mesurer les inconvénients des primaires en faisant intervenir l'analyse sémantique, des comparaisons avec certains sondages.
Ma déception vient de ce que je n'ai trouvé aucun regard, aucune approche journalistique, dans les dix-huit applications proposées au jury.
Je ne suis pas d'accord avec vous sur" la question de la visualisation en politique". Une application web n'a pas, selon moi, à montrer ce que les candidats proposent. La presse écrite, la radio et la télévision font cela assez bien. (Preuve soit dit en passant que le web ne fera pas disparaître les moyens d'information antérieurs).
La spécificité du web, avec ses contenus modulaires, est de permettre l'exploration de ce que disent les politiques, les médias et les citoyens. A part la presse écrite qui est un peu modulaire à travers la mise en page, les autres médias traditionnels (radio et télévision) sont linéaires. Aucun des médias traditionnels n'est interactif. Le web est interactif.
L'interactivité comme moteur d'exploration des discours, des articles, constitue l'apport spécifique du web. Cette exploration des contenus grâce à la dimension interactive des applications stimule le discernement des internautes. C'est une énorme contribution à la qualité de la démocratie. L'internaute peut comparer ce que disent les candidats, ce que dit la presse, ce que disent d'autres internautes, il peut questionner, interpeller. Se comportant ainsi, il a la possibilité de devenir un citoyen plus avisé.
Mais je suis stupéfait - et consterné - de voir que personne, en France, n'a encore proposé une application qui permettraient aux internautes de juger rationnellement le discours politique. Les candidats créent la confusion sur toutes sortes de thèmes émotionnels et aucun journaliste - en France - ne se dresse pour dire aux citoyens internautes:" cette affirmation est exacte", "celle-ci est inexacte", "nous vérifions le contenu de telle autre affirmation"...Cela s'appelle le "fact checking" et plusieurs applications de ce type fonctionnent aux Etats-Unis.
Face aux politiques - qui ne sont pas forcément tous des menteurs mais qui n'ont aucun scrupule pour manipuler l'opinion - le journaliste devrait être un vérificateur de faits.
Les applications web opérant à partir de visualisations interactives de données devraient lui permettre d'assumer une tâche qui revaloriserait la profession.
Je constate que les journalistes politiques préfèrent gloser en périphrases onctueuses et fades.
Impressionnant. Je ne m'attendais pas à générer une telle réponse. Il s'agit visiblement d'un thème qui est important pour vous. Sachez que j'ai toujours le plus grand respect pour les gens qui étayent leur opinion de manière aussi précise.
Mon propos portait uniquement sur le fait que de nombreuses professions s'enferment dans de fausses spécificités ou de faibles innovations... telles dans des tours d'ivoire.
Ainsi l'exploration de données est une analyse de découverte que mènent différents corps de métier sans vraiment chercher à comprendre comment s'y prennent les autres.
A titre d'exemple, je regrette que les cartographes (tel Jacques Bertin) qui sont les premiers à avoir tenté de présenter un grand nombre d'informations sur une surface plane, tout en restant compréhensibles... n'ont pas essayé de diffuser leurs savoirs ni d'échanger de connaissances.
Pire entre les deux grands actuels du domaine que sont ESRI et MapInfo, la guerre des experts est tellement stérile que personne n'a le droit de leur poser des questions quant à l'écart des approches de ces deux solutions, sans être blacklisté.
Donc il serait souhaitable que nous partagions nos différentes méthodes d'analyse et d'investigation (vers le "fact checking" par exemple). Car j'ai l'intime conviction qu'elles reposent sur des fondamentaux communs.
Exemple de bases forcement communes : les critères « Quand / Qui / Quoi » issus du célèbre hexamètre de Quintilien écrit il y a 2000 ans par ce célèbre rhéteur romain et encore utilisé aujourd’hui par tous ceux qui mènent des investigations (journalistes, inspecteurs de police… et que les anglais appellent le « 5W2H »).
Un criminologue français connu (un autre type d'investigateur) dit même que "ce qui est nouveau n'est qu'une chose qui avait été oubliée". Ne serait-ce pas le cas pour les méthodes d'analyse que doit connaitre tout bon "data-journaliste" ?
Croyant me faire de la peine, quelqu'un a un jour écrit ceci: "Ce qu'il y a de plus intéressant, dans ce blog, ce ne sont pas les billets, ce sont les commentaires." Rien ne pouvait me faire davantage plaisir car cela signifie que j'ai la chance de m'adresser à des gens intéressants avec lesquels je partage une éthique de la discussion.
Sur le fond. Je connais mal le cloisonnement des expertises auquel vous faites référence. Votre remarque sur Jacques Bertin me peine un peu car j'ai une grande admiration pour son travail mais vous avez évidemment raison. Il appartient à la caste des bâtisseurs de systèmes et son système à lui est une forteresse . Il s'y est cloîtré et son livre est à investir comme on assiège une forteresse.
Je ne peux que vous suivre sur les critères du "facts checking" auquel je crois énormément dans le travail journalistique. Une approche rationnelle de l'actualité, notamment l'actualité complexe, abordée dans un esprit "scientifique" ferait le plus grand bien à une profession dévalorisée.
Pourtant, au-delà des cinq critères et du 5W2H, je me demande s'il est possible que différentes expertises professionnelles partagent leurs méthodes d'analyse sans passer à un moment ou à un autre par une normalisation de ces méthodes. Or, l'investigation en data journalism peut difficilement , me semble-t-il, fonctionner sur les mêmes normes que celles de l'analyste financier. Nous, journalistes, devons détecter, vérifier, comprendre, collecter, extraire, trier et raconter la complexité des phénomènes et des évènements. Bien que nous devrions, selon moi, chercher à nous inspirer des démarches scientifiques, nous ne pouvons pas prétendre, au prétexte que nous manipulons des données, produire des contenus scientifiques. Nous sommes victimes de nos biais, d'autant plus nocifs qu'ils sont sous-estimés. De nos insuffisances. De nos contraintes en temps et en volumes.
Je conçois le data journalism comme une pratique professionnelle qui s'ajoute à toutes les autres et qui exploite des outils nouveaux sans, effectivement, rien réinventer.
Vous avez raison de souligner à quel point ce que les journalistes croient "nouveau" est le plus souvent non pas "oublié" mais enfoui. Le travail sur les données et sur les relations entre les données devraient nous permettre de trouver ce qui est enfoui dans une actualité confuse et fluctuante. Cette conviction m'habite depuis que j'ai visité en 1997 le SAS Institute en Caroline du Nord. Les ingénieurs de cette entreprise avaient retrouvé dans l'historique des données électorales de Miami, des données qui ont établi l'existence d'une fraude électorale. C'était déjà du data journalism sans journalistes.