Journalistiques

Aller au contenu | Aller au menu | Aller à la recherche

METHODES DE COLLECTE

Fil des billets - Fil des commentaires

mercredi 21 novembre 2007

Surf Canyon aiguise la curiosité et approfondit la recherche

Entre le moteur qui maintient la collecte à la surface des océans d'informations et le métamoteur qui fait perdre du temps en déversant trop de résultats peu pertinents, Surf Canyon inaugure une approche prometteuse de la recherche. Il s'agit d'un outil en ligne qui interprète la curiosité du journaliste en temps réel et de manière évolutive.

Schématiquement: plus le journaliste manifeste son intérêt pour un des premiers résultats, plus l'application "comprend" ce que cherche l'utilisateur et plus elle lui propose de résultats allant dans le sens de ce que le journaliste essaie de trouver. Inversement, si le journaliste ne s'attarde pas sur un des résultats, l'application "comprend" que cette thématique n'intéresse pas l'utlisateur et elle évite de lui proposer des pistes en rapport avec cette thématique. L'utilisateur peut évidemment manifester son intérêt pour tous les résultats du premier niveau et il peut même utiliser successivement cinq moteurs différents pour la même requête.

Surf_Canyon_sch_ma_explicatif_2.jpg

Soit dans l'exemple ci-dessus, les six premiers résultats, de A à F. Si je manifeste un intérêt pour le résultat N° 3 (C), Surf Canyon "comprend" que certains mots dans ce résultat retiennent mon attention et va chercher au niveau -1, dans l'immense collecte des moteurs qui lui sont associés, six autres résultats, de G à L. Mon intérêt se porte sur certains mots, ou sur une source particulièrement crédible à priori, du résultat N° 4 (J). L'application rassemble les "symptômes" sémantiques de mon intérêt pour le résultat J. Elle va ensuite, à partir des singularités de J, fouiller plus loin, plus profondément, pour "ramener" du niveau - 2 les résultats M, N et 0. Et ainsi de suite jusqu'à - dans cet exemple simplifié - la source P , extraite du niveau -3. Une source rare et précieuse entre toutes.

Premier avantage, je n'ai pas perdu de temps avec 13 résultats A, B, D, E, F,G, H, K, L, M, O, Q.

Deuxième avantage: ma recherche bénéficie au niveau de la qualité, c'est à dire de la pertinence, d'un pilotage assisté par une forme embryonnaire d'intelligence artificielle.

Troisième avantage, cette forme rudimentaire d'intelligence sémantique ne m'empêche pas, au contraire, de rester constamment maître des différentes orientations de ma curiosité: il me suffit d'abandonner un gisement et de passer à un autre pour creuser ailleurs, pas très loin du précédent filon, mais dans une zone peut-être plus riche.

J'ai testé Surf Canyon sur la même hypothèse que le 8 ctobre dernier avec Quintura: "Que faut-il penser de l'idée selon laquelle les Etats-Unis pourraient lancer une opération militaire contre des installations nucléaires iraniennes ? "

SurfCanyon_requ_te_US_Iran_1.jpg

Surf Canyon a "compris" qu'un des treize premiers résultats m'intriguait et est allé cherché des résulats voisins: SurfCanyon_Requ_te_US_Iran_2.jpg

Outre l'approfondissement et la diversification des sources, "l'intelligence" de Surf Canyon m'apporte une aide discrète au discernement. Ci-dessus dans l'offre de résultats complémentaires, le mot "possibilité" est remplacé par le mot "chance". Ce glissement sémantique m'intrigue. Je clique et découvre le point de vue des Gardiens de la Révolution, donnée intéressante pour mon évaluation.

Dans cet exercice de vérification d'une hypothèse, Surf Canyon m' a apporté:

- Trois sources extrêmement précieuses, valables pour d'autres recherches géopolitiques.

- Une étonnante reconstitution chronologique de l'hyopthèse "Les Etats Unis attaquent l'Iran", avec toutes les variantes.

Si un jour cette hypothèse se vérifie, je dispose d'ores et déjà d'une énorme documentation remplie de passionnants éclairages. Si elle ne se vérifie pas, je possède déjà la matière d'une analyse sur l'origine, la propagation et les déformations de ce qui aura été un phantasme géopolitique.

A mon avis, Surf Canyon donne le meilleur de son potentiel dans la recherche préventive, quand le journaliste a le temps de collecter des données pour le cas où l'évènement qu'il envisage se produisait soudainement.

A la pemière occasion, je testera Surf Canyon dans une situation d'urgence journalistique.

Lien permanent

lundi 8 octobre 2007

Recherche préventive sur des nuages de mots

Quintura.jpgQuintura est un métamoteur visuel particulièrement adapté à la recherche de données quand le journaliste ne sait pas si elles existent et, si elles existent, où elles se trouvent.

C'est un métamoteur: il mobilise successivement une vingtaine de moteurs. "Successivement" signifie que le journaliste peut comparer les performances de plusieurs moteurs sur un même sujet.
Le journaliste soucieux de productivité a même intérêt à consacrer du temps à la mise à l'épreuve de plusieurs moteurs. Ce temps n'est pas perdu pour deux raisons. D'abord il diversifie les sources. Ensuite, il repère les caractéristiques de certains moteurs dans des univers précis et cela lui fera gagner un temps précieux quand il aura une requête urgente à formuler dans un de ces univers.

Quintura est visuel. Les résultats prennent l'apparence de nuages de mots gravitant autour des mots clefs de la requête. Un clic sur chaque mot clé déclenche une variation apparente du nuage initial. Un clic sur les autres mots fait apparaïtre une volute de mots dans le nuage initial.

Quintura_2.jpg

Soit l'hypothèse intellectuellement, politiquement et idéologiquement plausible selon laquelle George Bush profiterait des derniers mois de son mandat non renouvelable pour bombarder quelques unes des trois mille centrifugeuses nucléaires dispersées en Iran. Requête en trois mots - "US", "bombing", "Iran" - qui structurent les variations du nuage sémantique.

Quintura propose beaucoup de sources américaines et britanniques mais un de ses moteurs, "Rambler" fait apparaître des sites et des blogs russes. Collecte doublement intéressante en raison du comportement de Vladimir Poutine sur la scène internationale et en raison des relations particulières qui existent entre la Russie et l'Iran dans le domaine des armes et du pétrole.
Les résultats nettoyés des requêtes sont sauvegardées en vue d'une actualisation ultérieure de la problématique "Etats-Unis bombardent l'Iran" et aussi pour le cas où George Bush passerait à l'acte. Si l"hypothèse se vérifie, ce ne peut être qu'entre novembre 2007 et l'été 2008 avant le début de la campagne pour l'élection présidentielle américaine.

Lien permanent

vendredi 22 juin 2007

Recherches profilées

Solutions de collecte semi-automatiques

Lire la suite...

jeudi 21 juin 2007

Bases et banques de données

Quelques répertoires de bases et de banques de données

Lire la suite...

page 2 de 2 -