Une des visualisations de données les plus intéressantes dans le contexte français a été réalisée pour LeMonde.fr par David Castello-Lopes, journaliste et Pierre Bance, développeur.
Il s’agit d’une cartographie interactive qui raconte et explique l’évolution du chômage, département par département, région par région depuis 1982.
Outre sa valeur intrinsèque, ce travail porte témoignage d’une action de pionniers tout en abordant trois problématiques sensibles liées à l’émergence du ''data journalism'' :

1 – Un journaliste-programmeur ou un journaliste et un programmeur

David Castello-Lopes a découvert l’exploitation journalistique et graphique des bases de données en 2008 à la faveur d’un séjour comme "journaliste invité" à l’université de Berkeley : ''C’était une carte de l’immigration par nationalités, état par état, comté par comté depuis 1880.
La fameuse carte de la criminalité proposée par le New York Times a achevé de convaincre le jeune journaliste.
Durée de la vidéo: 1'28"


David n’a, dans l’univers du langage Flash, que des connaissances, disons une compétence. Il ne possède pas l'expertise nécessaire pour se lancer, seul, dans une œuvre d’infovisualisation.
Il se souvient alors des longues conversations qu’il a eues, naguère, sur les bases de données avec un copain de lycée, Pierre Bance, qui, lui, s’est lancé dans la programmation.



David Costello-Lopes, à gauche et Pierre Bance.

Reprise de contacts, échanges de courriels. Pierre connaît bien l’outil d’animation vectorielle qu’il pratique depuis Flash 4 (1999).
Aujourd'hui, avec l'émergence du HTML5 et de Silver Light notamment, le flashmaster est au coeur d'une polémique sur le recours aux langages propriétaires dans le développement d'applications pour les tablettes électroniques; schématiquement, Apple contre Adobe pour des problèmes liés à la consommation d'énergie des terminaux nomades.
Mais la question des savoir-faire pratiques comme ceux de Pierre Bance est, aussi et surtout, au centre d'une réflexion sur la formation des futurs journalistes. Certaines universités américaines leur enseignent la programmation. Les "professionnels de la profession" objectent que les cours de programmation s'instaurent nécessairement au détriment d'autres qualifications sur le traitement des contenus.
Le point de vue de Pierre Bance sur cette question (Vidéo: 1'30"):

Commentaire 1 : à la question de savoir si les écoles de journalistes doivent enseigner la programmation, la réponse de Pierre Bance corrobore les principes de la polyvalence exposés dans mon ouvrage « Communiquer en rich media »: seule l'expertise peut être tenue pour responsable de la bonne réalisation d'un projet; l'idéal est que les détenteurs de l'expertise dans un domaine précis soient entourés de quelques journalistes ayant des compétences dans ce même domaine - capables, par exemple, de coder des choses simples - et surtout des connaissances suffisantes en programmation pour savoir ce qui peut être demandé à l'expert.

2 – Collecter et trier les données pertinentes

Juillet 2009. Les deux jeunes gens réfléchissent au mode de fonctionnement d'un binôme "développeur-journaliste multimédia". Ayant mis au point une manière de travailler ensemble, chacun avec ses expertises et ses compétences, ils se lancent fin novembre 2009 dans la création d’une carte de France du chômage. Projet accepté le 15 décembre suivant par Boris Razon, rédacteur en chef du Monde.fr. Le département est choisi comme critère central des données à sélectionner et, donc, à solliciter auprès de l’INSEE.

L’Institut est non seulement un prodigieux gisement d’informations en puissance - voir le classeur Excel en annexe à la fin de ce billet - mais aussi un outil didactique qui guide les novices en extraction dans les arcanes des formats de fichiers et des variables qui peuvent fausser les comparaisons, établir de fausses relations entre les données.

Carte_chomage_INSEE_caracteristiques_des_fichiers.jpg

L’INSEE a également fourni aux deux jeunes pionniers une assistance plus que précieuse avec les conseils de l'un de ses responsables nationaux, Etienne Debauche, et avec les analyses qualitatives fournies, département par département, par tous les responsables régionaux.Carte_chomage_wiretap.png Il a fallu, en effet, éclairer la masse de chiffres départementaux par une description contextuelle au niveau des régions. D’où la nécessité de procéder à 22 entretiens téléphoniques à l’aide de Skype et de l’enregistreur Wiretap.

Avec, évidemment, l’obligation de vérifier la cohérence entre les données départementales et les données régionales.

L’INSEE offrant la matière première, il ne restait plus qu’à lisser les chiffres trimestriels de chaque département pour les faire entrer dans la carte vectorielle de l’Hexagone en respectant les principes de navigation les plus intuitifs.

Carte_chomage_premiere_maquette_presentee_a_Boris_Razor.png
La première maquette de la carte du chômage, telle qu'elle a été présentée au rédacteur en chef du Monde.fr

Ce qui conduit, entre autres tâches, à l’élaboration de 96 calques différents, un par département ; à la définition de 29 classes pour la représentation visuelle.
Au total, une application interactive qui "pèse" 3089 lignes de codes.

Commentaire 2 : l’engouement pour le data journalism inspire, ces temps-ci et sans doute temporairement, des exercices de style qui s’éloignent de l’information utile aux audiences, ou tout simplement de l'information intéressante. Les travers qui ont marqué l’infographie et la typographie – surenchères de chefs d’œuvre abscons pour initiés – présentent l’inconvénient d’éloigner le data journalism de son axe de développement : l’investigation.

3 – Création unique ou ustensile réutilisable

A ce stade, David et Pierre rencontrent une problématique que les rédactions ne peuvent éluder: construire des infovisualisations interactives uniques, une par thème d’investigation, ou (faire) réaliser des outils réutilisables pour d’autres données, sur d'autres thèmes…

Carte_chomage_Le_generateur_de_cartes.jpg
Un générateur de cartes, application réutilisables par les rédactions qui peuvent y injecter successivement des données de natures différentes.

Pierre Bance: "Un générateur automatique s’exécute rapidement mais il s’adapte moins bien aux différents types de données. Pour obtenir une parfaite adaptation de la visualisation aux données, il faut du temps.»

Sur ce sujet, extrait d'une discussion entre David Castello-Lopes et Pierre Bance (2 minutes 15")

Commentaire 3 : La solution au dilemme des créations uniques ou des templates dépend du niveau d’engagement des rédactions dans la migration numérique des contenus. Ou bien les rédactions se dotent d’une équipe de programmation suffisamment étoffée pour créer des produits uniques en liaison avec la rédaction. Ou bien des journalistes s’impliquent dans l’exploitation de générateurs de cartes pré-formatées. Ou bien la création de graphiques interactifs est externalisée auprès d'experts extérieurs comme Pierre Bance.

Carte_chomage_Structure_humaine_du_San_Jose_Mercury_News.jpgPour avoir réalisé une superbe présentation sur « L’excellence dans le journalisme multimédia » - qui comporte, notamment, une analyse inédite de l’organisation du travail au San Jose Mercury News – David Castello-Lopes va enseigner le journalisme multimédia au Studec.

Pierre Bance continue à explorer les langages vectoriels.