Quand le journaliste pressé (pléonasme) doit sélectionner des documents sur le web afin d'en extraire des données, il peut lire chaque page à priori intéressante, sélectionner les plus pertinentes pour son travail immédiat et classer les autres pour une exploitation ultérieure.

Extension gratuite du navigateur Firefox, Gnosis accomplit cette tâche plus rapidement et mieux.

Gnosis_panneau_colore_lateral.jpgUne fois installé, très facilement, le plug in peut rester invisible ou déployer son tableau de bord, à gauche de la page à inspecter, quand on a choisi cette option dans le menu "affichage".

Ce panneau revêt l'apparence d'une superposition de bandes horizontales colorées; ce sont autant de menus déroulants; ils désignent les seize critères à partir desquels Gnosis radiographie la page web soumise à sa curiosité.

Sur la barre supérieure du tableau de bord, s'alignent les fonctionnalités de cet formidable petit extracteur de données pré-sélectionnées.

Gnosis_barre_de_controle_superieure.jpg

A l'extrême-gauche, le signe "+" dans son carré vert déploie le détail de toutes les données détectées selon les seize critères d'analyse. Juste à côté, le signe "-" dans son petit carré orange referme les tiroirs de Gnosis.
Même fonctionnement pour les deux petits crayons: surligner toutes les données repérées dans la page, surligner les seules données relevant d'un critère repérable dans les code de couleurs,n'en surligner aucune.
Les deux flèches voisines résument le potentiel de productivité de l'application.

Gnosis_titre_de_la_rubrique_du_NYT.jpg
Soit une page du New York Times relatant les déclarations raisonnablement optimistes du principal conseiller économique de Barak Obama. (Ces déclarations m'intéressent car, contrastant avec le pessimisme ambiant, elles esquissent la possibilité d'une sortie de crise et constituent donc une singularité (1).

Gnosis_noms_univers_economique.jpgEn deux ou trois secondes, le cerveau d'un journaliste moyen, pas forcément expert en économie, saisit l'univers dans lequel baigne l'article.

Le cerveau reconnait deux catégories sémantiques: l'une, politique, avec les noms "Bush" et "Obama"; l'autre, économique avec les noms "Summers" et "Krugman", prix Nobel d'économie.

Pour valider cette perception spontanée, la rubrique médias mentionne une référence au Financial Time...

Gnosis_critere_medias_Financial_times.jpg

En sélectionnant, le critère bleu "organisation" et en sollicitant la flèche orientée vers la droite, Gnosis me promène dans le texte sur les seuls termes associés à des organisations.
Productivité accrue par le fait qu'en passant sur le nom d'une organisation - la "Brookings Institution", par exemple - le pointeur fait apparaître une infobulle qui propose trois sources d'approfondissement.

Gnosis_Brookings_Institution.jpg
Un clic sur la suggestion Wikipedia révèle que ce très influent think tank a inspiré les politiques libérales de dérégulation financière tout en étant parfois considéré comme centriste parce que des collaborateurs de Bill Clinton y ont travaillé.

Si le journaliste se méfie de Wikipedia, il doit prendre le temps d'aller faire un tour sur le site du think tank.

Gnosis_page_accueil_de_la_Brookings_institution.jpg

Si le journaliste, évidemment curieux, veut en savoir plus sur le rôle des think tanks anglo-saxons dans la conduite des économies dominantes et, donc, dans les causes de la crise actuelleGnosis_livre.jpg il peut se procurer le récent - 12 février 2009 - et tout à fait passionnant petit livre de Stephen Boucher et Martine Royo, aux éditions Le Félin.

Première remarque: la découverte de l'existence d'un tel gisement de données, d'informations et de réflexions aurait été peu probable, voire impossible, par les canaux de la presse traditionnelle, imprimée ou audiovisuelle. C'est la preuve qu'internet ne tue pas le papier (2) mais peut y conduire.
Deuxième remarque: partir d'une extraction de données sur une page web pour aboutir à un gisement de connaissances après avoir collecté l'information du New-York Times est une manifestation de la sérendipité, providence de la recherche sur le web (3).

Grâce à Gnosis, le journaliste qui cherche à capter des signaux conjoncturels sur l'évolution de la crise économique découvre, en quelques secondes, que le principal conseiller économique de Barak Obama choisi le think tank le plus influent du monde anglo-saxon pour proposer un indicateur de sortie de crise.
Le cerveau du journaliste aurait peut-être trouvé cette "configuration" (ce n'est pas sûr), mais certainement pas de manière aussi fulgurante.

Extraction, approfondissement, élargissement

Outre les noms de personnes citées dans la page, ceux des entreprises et des lieux, l'extension de Firefox capte les adresses électroniques des sites mentionnés ainsi que celles des courriers électroniques.
Autrement dit, dans un délai très bref, le journaliste dispose d'une vision quasiment "anatomique" de la page web. Il peut en approfondir le sens global ou seulement celui de certaines données. Il peut utiliser la collecte de Gnosis pour caractériser un document à conserver, pour en transformer une partie en tags (étiquetage).

Petite réserve: dans son zèle, Gnosis ramasse des données au-delà de l'article sur l'ensemble de la page; c'est ce qu'on appelle du "bruit" mais ces données non pertinentes ne perturbent guère le "signal" que constitue l'ensemble des données pertinentes.

Gros regret: Gnosis ne s'intéresse pas aux pages web rédigées en français. Normal et triste pour l'innovation dans notre pays: Gnosis est le tout petit produit d'une recherche sur le web sémantique menée par la firme Clearforest filiale du groupe Thomson Reuters. Mais l'hégémonie anglo-saxonne sur les contenus étant ce qu'elle est, la perte de sens n'est peut-être pas très grave pour un journaliste curieux.

1) Une singularité est un phénomène à priori important mais qui n'a pas d'explication connue. Les singularités précèdent parfois, pas toujours, les phénomènes émergents qui, eux, peuvent modifier radicalement le cours des choses. Les premières faillites d'établissements de crédits immobiliers, au printemps 2007, ont été des singularités. Ces singularités annonçaient la crise des subprimes, puis la crise du crédit, laquelle a déclenché la récession qui va amener des réformes du système financier international, donc une modification radicale du cours des choses.

2) Un pitoyable journaliste, qui a eu sa petite notoriété à la radio au milieu des années soixante-dix, a récemment utilisé dans le quotidien "Le Monde", ex-journal de référence, l'expression "internet über alles". Le recours à une telle terminologie signifie que ce piètre confrère, aussi inculte qu'obsolète, assimile internet au régime nazi avec toutes les connotations que cette allusion véhicule. La stupidité du propos n'est relevée ici que dans la mesure où elle reflète l'état d'esprit d'un très grand nombre de professionnels de la profession.

3) La sérendipité est l'art de trouver sans cherchant mais en créant quand même les conditions de la trouvaille. La curiosité journalistique devrait comporter une grande part de sérendipité, pratique particulièrement jubilatoire dans ce métier.