L'innovation s'intensifie dans la détection, l'exploration et l'exploitation des gisements de contenus. Voici cinq applications susceptibles d'enrichir la recherche d'informations et la validation des sources en complétant Google.

Je les propose dans l'ordre séquentiel des quatre opérations auquel tout journaliste opérant sur le web devrait se consacrer s'il est soucieux de préserver sa crédibilité. En attendant que les organes de presse hexagonaux veuillent bien créer la fonction de recherchiste-vérificateur qui est enseignée depuis pas mal de temps au Québec.

Ce qui suit peut être considéré comme l'ébauche d'un dispositif à enrichir avec d'autres applications.

I - Recherches étendues

Cleeki_logo.jpgCleeki est un collecteur de mots-clés. Il considère chaque mot sélectionné sur une page web comme un élément d'une requête. Il suffit de proposer ce mot à un moteur, un annuaire ou une base de données comme Wikipedia pour déclencher une recherche sur une de ces ressources.

Cleeki_icones_barre.jpg

Cleeki est capable de ratisser plusieurs mots-clés et de les lancer dans une requête dans plusieurs directions simultanées. Il propose enfin des mots-clés qui ne sont pas présents dans la page examinée mais qui peuvent, selon lui, suggérer une extension de la recherche.

II - Recherches approfondies

Exploredge m'a été signalé par Mohamed Chelbi lors d'une récente formation sur la recherche et la veille au CAPJC de Tunis. Cet outil de recherche experte, métamoteur intelligent à vocation encyclopédique, est tout simplement fantastique et il est français.

Exploredge.jpg

Exploredge mobilise une vingtaine de moteurs dont les résultats pour une requête sont soumis aux technologies de traitement sémantique des contenus. Des interventions humaines en mode collaboratif améliorent grandement la pertinence et la précision des résultats.

Exploredge_veille_panneau_lateral.jpgConcrètement, l'approche sémantique fait émerger les mots, les notions, les associations d'idées, les suggestions avec une puissance dont le cerveau humain est incapable sur des laps de temps très courts.
Les interventions humaines vérifient, valident, classent et hiérarchisent les réponses des moteurs, ce dont les algorithmes ne sont pas capables avec une telle intelligence (= compréhension) de la requête.
Les suggestions d'approfondissements et d'affinements apparaissent dans un volet latéral gauche. Elles sont classées dans une arborescence logique. A la date de mise en ligne de cette note, dix domaines étaient structurés - dont l'intelligence économique et la veille - et onze autres étaient en cours de validation. A la fin de l'année, Exploredge proposera une centaine de centres d'intérêt comprenant chacun entre 500 et 1000 termes.

Sous le métamoteur, une encyclopédie est donc en expansion, alimentée par des contributeurs volontaires Les journalistes qui auront la sagacité d'inclure Exploredge dans leur panoplie d'investigations sur le web n'ont qu'à s'inscrire afin de recevoir la lettre d'information, sans omettre de s'abonner au blog dédié.

III - Vérification des faits

Wolfram alpha s'annonce comme un outil journalistique assez révolutionnaire dans la mesure où il semble vouloir combiner la puissance de Google et l'exhaustivité de Wikipedia.

Wolfram_Alpha.jpg

Son ambition n'est rien moins que de rendre toute connaissance immédiatement consultable par ordinateur. C'est un projet à long terme mais il suffit de tester les premières catégories proposées - par exemple, celle de la culture et des médias - pour comprendre qu'une technologie puissante est au service d'objectifs originaux, avec des résultats "non substituables", d'ores et déjà sans concurrence possible.

True knowledge ressemble à Exploredge, en moins puissant et en moins précis. Mieux vaut l'utiliser comme vérificateur factuel que comme moteur.

True_Knowledge_logo.jpg

Plus que jamais nécessaire au sein des rédactions, la fonction de facts checker associée à une expertise de recherche et de veille a besoin de bases de données "interrogeables" comme True Knowledge pour éviter ce qui vient d'arriver à plusieurs quotidiens britanniques: reprise aveugle d'une fausse citation glissée dans Wikipedia par un étudiant en sociologie qui étudie la fiabilité journalistique.

IV - Validation des sources

Touchgraph_logo.jpgTouchgraph est la providence du journaliste ou du documentaliste chargé de valider les sources d'information. Cette opération consiste notamment à mesurer l'écart entre ce qu'un site, ou un blog, prétend être et ce qu'il est réellement. Si l'écart est nul, le gisement d'informations mérite d'être validé. Si l'écart est significatif, la rédaction doit être avertie de son manque de fiabilité, voire de sa nocivité.

Plusieurs outils, dont certaines fonctionnalités de Google, permettent de confronter les contenus avec leur environnement matérialisé par les liens entrants: un blog qui se prétend juridique mais vers lequel pointent des liens sans rapport avec le droit doit être exclu, à priori, des ressources rédactionnelles.

Touchgraph_plan_large.jpg

Comme outil de validation, Touchgraph est une merveille. L'alliance de la sémantique et de la visualisation de données dévoile, dans le cas de ce blog, différents univers agrégés en constellations.

Touchgraph_plan_serre_corrige.jpg

En "zoomant" sur une de ces constellations de sites ou de blog, un coup d'oeil suffit pour vérifier le voisinage du blog correspond bien à sa ligne éditoriale: l'information, le journalisme à l'ère électronique.

Touchgraph_panneau_lateral.jpgDans un volet latéral, à gauche de la remarquable interface graphique, apparait la liste des sites qui, à un moment, ou à un autre, ont pointé vers le blog "journalistiques".

Un aperçu de ces sites ou blogs permet de se faire une idée de la raison pour laquelle ils se sont intéressés à tel ou tel billet. Il suffit de cliquer sur l'adresse du visiteur pour en savoir davantage.


Cette maquette de dispositif de recherche-vérification-validation peut accueillir bien d'autres moteurs, ainsi que des applications greffées sur les navigateurs comme Gnosis ou Surf Canyon.

Voir aussi: "Comment j'évalue l'actualité"