Quand le journaliste pressé (pléonasme) doit sélectionner des documents sur
le web afin d'en extraire des données, il peut lire chaque page à priori
intéressante, sélectionner les plus pertinentes pour son travail immédiat et
classer les autres pour une exploitation ultérieure.
Extension gratuite du navigateur Firefox, Gnosis
accomplit cette tâche plus rapidement et mieux.
Une fois installé, très
facilement, le plug in peut rester invisible ou déployer son tableau
de bord, à gauche de la page à inspecter, quand on a choisi cette option dans
le menu "affichage".
Ce panneau revêt l'apparence d'une superposition de bandes horizontales
colorées; ce sont autant de menus déroulants; ils désignent les seize critères
à partir desquels Gnosis radiographie la page web soumise à sa curiosité.
Sur la barre supérieure du tableau de bord, s'alignent les fonctionnalités
de cet formidable petit extracteur de données pré-sélectionnées.

A l'extrême-gauche, le signe "+" dans son carré vert déploie le détail de
toutes les données détectées selon les seize critères d'analyse. Juste à côté,
le signe "-" dans son petit carré orange referme les tiroirs de Gnosis.
Même fonctionnement pour les deux petits crayons: surligner toutes les données
repérées dans la page, surligner les seules données relevant d'un critère
repérable dans les code de couleurs,n'en surligner aucune.
Les deux flèches voisines résument le potentiel de productivité de
l'application.

Soit
une page du New York Times relatant les déclarations
raisonnablement optimistes du principal conseiller économique de Barak Obama.
(Ces déclarations m'intéressent car, contrastant avec le pessimisme
ambiant, elles esquissent la possibilité d'une sortie de crise et constituent
donc une singularité (1).
En deux ou trois
secondes, le cerveau d'un journaliste moyen, pas forcément expert en économie,
saisit l'univers dans lequel baigne l'article.
Le cerveau reconnait deux catégories sémantiques: l'une, politique, avec les
noms "Bush" et "Obama"; l'autre, économique avec les noms "Summers" et
"Krugman", prix Nobel d'économie.
Pour valider cette perception spontanée, la rubrique médias mentionne une
référence au Financial Time...

En sélectionnant, le critère bleu "organisation" et en sollicitant la flèche
orientée vers la droite, Gnosis me promène dans le texte sur les seuls termes
associés à des organisations.
Productivité accrue par le fait qu'en passant sur le nom d'une organisation -
la "Brookings Institution", par exemple - le pointeur fait apparaître une
infobulle qui propose trois sources d'approfondissement.

Un clic sur la suggestion
Wikipedia révèle que ce très influent think tank a
inspiré les politiques libérales de dérégulation financière tout en étant
parfois considéré comme centriste parce que des collaborateurs de Bill Clinton
y ont travaillé.
Si le journaliste se méfie de Wikipedia, il doit prendre le temps d'aller faire
un tour sur le site du think
tank.

Si le journaliste, évidemment curieux, veut en savoir plus sur le rôle des
think tanks anglo-saxons dans la conduite des économies dominantes et, donc,
dans les causes de la crise actuelle
il peut se procurer le récent - 12 février 2009
- et tout à fait passionnant petit
livre de Stephen Boucher et Martine Royo, aux éditions Le
Félin.
Première remarque: la découverte de l'existence d'un tel gisement de
données, d'informations et de réflexions aurait été peu probable, voire
impossible, par les canaux de la presse traditionnelle, imprimée ou
audiovisuelle. C'est la preuve qu'internet ne tue pas le papier (2) mais peut y
conduire.
Deuxième remarque: partir d'une extraction de données sur une page
web pour aboutir à un gisement de connaissances après avoir collecté
l'information du New-York Times est une manifestation de la sérendipité,
providence de la recherche sur le web (3).
Grâce à Gnosis, le journaliste qui cherche à capter des signaux
conjoncturels sur l'évolution de la crise économique découvre, en quelques
secondes, que le principal conseiller économique de Barak Obama choisi le
think tank le plus influent du monde anglo-saxon pour proposer un
indicateur de sortie de crise.
Le cerveau du journaliste aurait peut-être trouvé cette "configuration" (ce
n'est pas sûr), mais certainement pas de manière aussi fulgurante.
Extraction, approfondissement, élargissement
Outre les noms de personnes citées dans la page, ceux des entreprises et des
lieux, l'extension de Firefox capte les adresses électroniques des sites
mentionnés ainsi que celles des courriers électroniques.
Autrement dit, dans un délai très bref, le journaliste dispose d'une vision
quasiment "anatomique" de la page web. Il peut en approfondir le sens global ou
seulement celui de certaines données. Il peut utiliser la collecte de Gnosis
pour caractériser un document à conserver, pour en transformer une partie en
tags (étiquetage).
Petite réserve: dans son zèle, Gnosis ramasse des données au-delà
de l'article sur l'ensemble de la page; c'est ce qu'on appelle du "bruit" mais
ces données non pertinentes ne perturbent guère le "signal" que constitue
l'ensemble des données pertinentes.
Gros regret: Gnosis ne s'intéresse pas aux pages web rédigées en
français. Normal et triste pour l'innovation dans notre pays: Gnosis est le
tout petit produit d'une recherche sur le web sémantique menée par
la firme Clearforest
filiale du groupe Thomson
Reuters. Mais l'hégémonie anglo-saxonne sur les contenus étant ce
qu'elle est, la perte de sens n'est peut-être pas très grave pour un
journaliste curieux.
1) Une singularité est un phénomène à priori important mais qui n'a pas
d'explication connue. Les singularités précèdent parfois, pas toujours, les
phénomènes émergents qui, eux, peuvent modifier radicalement le cours des
choses. Les premières faillites d'établissements de crédits immobiliers, au
printemps 2007, ont été des singularités. Ces singularités annonçaient la crise
des subprimes, puis la crise du crédit, laquelle a déclenché la récession qui
va amener des réformes du système financier international, donc une
modification radicale du cours des choses.
2) Un pitoyable journaliste, qui a eu sa petite notoriété à la radio au
milieu des années soixante-dix, a récemment utilisé dans le quotidien "Le
Monde", ex-journal de référence, l'expression "internet über alles". Le recours
à une telle terminologie signifie que ce piètre confrère, aussi inculte
qu'obsolète, assimile internet au régime nazi avec toutes les connotations que
cette allusion véhicule. La stupidité du propos n'est relevée ici que dans la
mesure où elle reflète l'état d'esprit d'un très grand nombre de professionnels
de la profession.
3) La sérendipité est l'art de trouver sans cherchant mais en créant quand
même les conditions de la trouvaille. La curiosité journalistique devrait
comporter une grande part de sérendipité, pratique particulièrement jubilatoire
dans ce métier.

Pour chaque citation qui se propage
amplement sur le web, l'outil permet d'en trouver l'origine. Il mesure la
décroissance de sa propagation virale.
- "Les
fondamentaux de notre économie sont bons" - retombe bien vite en nombre de
reprises parce que, dans l'actualité de la crise financière radiographiée à
travers les traînes de réplications, une citation chasse l'autre.






Le monitorage électronique a été développé
à l'intention des responsables et des spécialistes travaillant sur les médias
au sein des différents organismes de l'Union européenne. Utilisé de cette
manière, il peut inciter favoriser le conformisme en incitant les journalistes
à s'intéresser en priorité aux évènements qui sont déjà très
médiatisés.
Il n'existe pas de logiciel d'aide
au discernement. Tant mieux dans la mesure où cette lacune oblige le(s)
cerveau(x) (1) à élaborer une méthode susceptible de prémunir
les journalistes contre la bêtise, l'irrationalisme, la fourberie mentale, la
propagande, la manipulation.




Démonstration avec la lettre de Fidel
Castro qui, fait historique, a été publiée d'abord sur le site web du journal
Gramma.( Ce qui apprendra peut-être aux technohophes que le web est une
source d'information)

les phrases qui forment la texture
des univers qu'elles symbolisent. Le logiciel va plus loin en fournissant des
indications de style qui peuvent être très utiles par la suite. On découvre, en
effet, que le style de cette lettre de départ à la retraite est plutôt
narratif: le président cubain raconte sa décision. Peut-être un troisième
angle.
Pour vérifier que les deux précédents
logiciels n'égarent pas trop l'évaluation journalistique, recours aux
Conçu pour le marketing et la publicité,
le moteur 



Le principal défi à relever vient
des différences de capacités d'assimilation au sein du lectorat. Chaque jour,
l'équipe de Matthew Ericson doit sélectionner les contenus qui demandent un
complément visuel, le type de visualisation à proposer (statique, interactive)
avec, pour les informations à traiter en urgence, quelques heures seulement
pour prendre les décisions les plus adaptées aux attentes et aux aptitudes des
audiences.


J'ai testé cette application sur un
document de 30 feuillets Word, soit 1294 lignes et 81228 mots.Il s'agit de
l'enquête sur la crise boursière publiée dans "The Economist" du 18 octobre.
Moins de 2 minutes après l'ouverture du corpus par un clic droit sur son
intitulé de fichier, une arborescence horizontale proposait 5 thèmes
structurants:"banques centrales", "marchés financiers","crédit", "inflation" et
"prix". Si les thèmes "inflation" et "prix" peuvent relever du pléonasme, il
n'y a pas lieu de suspecter une grosse erreur d'analyse dans cette vision
d'ensemble.
elle s'est faite en quelques dizaines de
secondes. Ce gain de temps devient encore plus décisif quand il s'agit
d'accéder à une fine compréhension de l'enquête. Dans le traitement
conventionnel, il faut la relire plusieurs fois, au moins partiellement, et
prendre des notes; ce qui demande encore plusieurs heures. Avec Theme Reader,
la lecture des fragments significatifs et d'éventuels commentaires demandent
moins de 10 minutes. Il s'agit donc bien, pour le journaliste, de relever le
défi de l'urgence sans renoncer à l'approfondissement. Il s'agit aussi et
surtout de faire face de manière efficiente à la surcharge d'informations.