Une actualité multi sources hiérarchisée par des algorithmes
Par Alain Joannes le vendredi 16 octobre 2009, 18:41 - EDITION, PUBLICATION - Lien permanent
Orange propose depuis quelques mois
un agrégateur
d'informations qui fait appel à de nombreuses sources
d'informations de la presse écrite, de la radio et de la télévision.
Agréable et ergonomique, la page d'accueil produit une impression de sérieux et
de profusion.

Dès son arrivée sur la "une", le visiteur a une vue d'ensemble de l'actualité
structurée selon une hiérarchie ternaire de discernement: les principaux
évènements, les évènements intéressants et les autres. Entre les deux premiers
niveaux, les dépêches défilent.
Quiconque s'intéresse particulièrement à un évènement ou à un dossier, peut
entrer dans les sélections de reportages en vidéo, de séquences audio et
d'articles sur le thème choisi grâce à une technologie de
clustering.

Selon Laurent Frisch, chef de produit, deux algorithmes spéciaux justifient
le caractère novateur de ce service hybride, à la fois agrégateur et moteur de
recherche.
Les algorithmes de 2424 actu (01'08)
Il s'agirait même d'une première mondiale. Affirmation en cours de
vérification, enregistrée dans cette courte séquence vidéo:
Voici un aperçu de ce que les algorithmes de clustering proposaient
dès le premier clic sur le dossier de l'offensive lancée par l'armée
pakistanaise contre certaines tribus:

Neuf reportages provenant des chaînes de télévision - c'était le dimanche 18
octobre au début de l'offensive - , des liens vers cinquante articles de presse
écrite et une rubrique intitulée "En savoir plus" contenant d'autres reportages
sur différents aspects de l'actualité pakistanaise récente.
Laurent Frisch se fait une certaine idée de l'infonaute idéal:
Le visiteur rêvé de 2424 actu (00'22)
Les équipes qui travaillent sur l'agrégateur d'Orange ne produisent aucun
contenu. Sa substance éditoriale étant délivrée par des organes de presse, la
première question qui vient à l'esprit concerne le risque de cannibalisation:
si les infonautes trouvent leur bonheur sur 2424 actu, pourquoi iraient-ils
visiter des sites media des fournisseurs d'Orange...La réponse de Laurent
Frisch:
Un contenu complémentaire à ceux des sites médias
(00'45)
France Télévision rejoint d'ailleurs l'agrégateur. D'autres fournisseurs
francophones viendront plus tard. Ce sera la profusion réjouissante du web. On
pourra parler de diversité et le chef de produit de 2424 actu prend même le
risque de placer le pluralisme comme valeur suprême de l'agrégateur.
D'accord sur la profusion, doute sur le pluralisme
Il peut y avoir de la diversité dans la profusion, mais ce n'est pas certain.
En tous cas, c'est sous-estimer gravement le conformisme des journalistes
français que de croire que le pluralisme - c'est à dire les manières
différentes de choisir, de hiérarchiser et de traiter l'actualité - découle
naturellement de la profusion des sources.
Bien avant que le web et Google soient accusés de "tuer l'information'
(voir
les woltonneries et autres joffrinades récemment stigmatisées par mes
soins) , la presse française dépérissait lentement, inexorablement, au
point d'être désormais la moins lue parmi celles des nations développées, et de
moins en moins crédible selon le baromètre annuel "La Croix / Sofres).
Le conformisme des journalistes français a réduit la diversité qui prévalait
aux lendemains de la Libération à quelques monopoles naturels qui disent tous
la même chose sur les mêmes évènements de la même manière, c'est à dire le
contraire du pluralisme. Lequel est un effet de la liberté dont les
journalistes français usent bien peu.
La preuve avec cette offre de diversité non pluraliste vue sur 2424 actu:

Personne n'a évidemment envie de "profiter" d'une diversité aussi
monotone (1) , typique du copier-coller de dépêches, c'est à dire
du journalisme low cost. Tellement bas de gamme qu'il peut s'effectuer
sans journalistes, vieux rêve des patrons de presse.
Ce journalisme low cost n'est pas le fait de 2424 actu (qui n'emploie
pas de journalistes) mais bien celui d'une presse française dont l'offre de
contenus apparait cruellement répétitive et conformiste dans les pages de
l'agrégateur.
Les algorithmes de l'agrégateur ne font que capter les causes de l'ennui qui
tue l'information à la française beaucoup plus sûrement que Google.
On demande des journalistes capables de hiérarchiser
l'information
Autre conséquence des multiples renoncements journalistique, l'éminente
responsabilité qui consistait à structurer l'actualité en sélectionnant et
en hiérarchisant
les évènements risque d'être confiée à des algorithmes, c'est à
dire à des séquences informatiques qui évalueront le poids et l'importance des
contenus, à la place des "cerveaux" de journalistes.
La réponse de Laurent Frisch est intéressante:
Hiérarchisation algorithmique journalistiquement assistée
(01'25)
(ACTUALISATION LE 22 OCTOBRE: voir le commentaire N°7 signé Laurent
Frisch: il contient des précisions très intéressantes).

Compte tenu de tout ce qui précède, l'excellent outil d'information 2424actu se
destine à trois types d'internautes:
- les enseignants qui auraient la bonne idée de proposer des exercices de
discernement médiatique aux futurs citoyens.
- les jeunes citoyens qui souhaitent s'informer à partir de sources
sérieusement sélectionnées, parmi lesquelles de vraies "marques médias".
- les infonautes boulimiques qui bénéficient de l'une des plus belle revue de
presse jamais offerte par le web.
C'est d'ailleurs sur cet axe qu'Orange diffuse la vidéo de lancement de 2424
actu.
(1) Un petit oxymoron fait du bien de temps en temps.

Commentaires
Curieusement, pour un média ou un lieu d'information conçu pour être exploré, ce qui m'importe le moins, c'est la technologie. Je veux avoir sans trop tripatouiller. A mon avis l'angle "techno" est un bien mauvais outil de communication : quand le Washington Post fait réaliser une infographie multimédia dynamique, explique-t-il ce qui se passe derrière ? Non.
Voilà bien la culture ingénieur d'Orange, face à la culture marketing américaine.
Les premiers parlent invention et prouesse technique, les seconds parlent innovation et bénéfice d'usage.
Deux remarques:
1 - en tant qu'utilisateur de 2424 actu.fr, vous n'avez rien à "tripatouiller"sur ce site.
2 - c'est moi qui ai posé à Laurent Frisch la question de savoir comment fonctionne cet agrégateur, comment les informations sont sélectionnées et surtout qui les hiérarchise ? Il m'a répondu: "Des algorithmes". Si vous ne trouvez pas cette réponse intéressante, voire troublante, c'est que quelque chose vous échappe peut-être dans l'évolution actuelle de l'information.
Je vous invite à relire lentement et attentivement ce billet. Vous constaterez qu'il comporte trois parties:
1 - Première partie: une description de l'agrégateur. C'est du factuel, sans allusion à la technologie. Juste un petit mode d'emploi à l'intention des visiteurs qui n'aiment pas la technologie.
2 - Deuxième partie: comment ça marche ? Qu'est-ce qu'il y a derrière cette page d'accueil ? Pourquoi les informations sont-elles organisées de cette manière ? Comment font-ils pour réunir dans une même collecte sélective des contenus textuels, visuels et audio ? Cela s'appelle la curiosité, faculté journalistique assez peu répandue, j'en conviens. Pour satisfaire ma curiosité de journaliste, j'ai pris le métro, ligne 12 jusqu'à Issy-les-Moulineaux, avec mon magnétophone, ma "pocket caméra" et mes questions.
(Cette précision est destinée aux demeurés qui "pensent" que les journalistes qui travaillent sur le web ne vont jamais sur le terrain: hé ! les neuneus...on peut travailler sur le web et aller au contact des gens.)
(Autre précision: je ne fais pas partie de ces "journalistes" décérébrés qui interviewent un réalisateur de film sans avoir vu son film, ou qui signent des articles purement et simplement copiés sur les communiqués de presse. )
3 - Troisième partie: après avoir décrit l'agrégateur, interrogé un de ses responsables, j'émets deux réflexions personnelles, une sur le thème "profusion ne signifie pas pluralisme", l'autre sur la possibilité que l'actualité soit un jour hiérarchisée par des algorithmes. Pour moi, l'actualité, c'est l'Histoire en train de se faire et les journalistes sont les humbles auxiliaires des historiens du futur. Si idée que l'Histoire puisse être écrite un jour par des algorithmes plus performants que les "cerveaux" de journalistes ne vous tracasse pas, nous avons un problème.
Enfin, je ne suis pas d'accord avec votre vision de l'american web behavior. Les Américains (ainsi que les Japonais et les Chinois) font d'abord de la techno et ensuite du marketing. Les Français font de la techno mais oublient le marketing.
Derrière l'emprise de Google, ou d'Amazon, il y a des algorithmes et ensuite seulement du marketing. Si les industries de contenus s'étaient intéressées à temps aux algorithmes, elles ne seraient pas en train de pleurnicher contre Google ou contre le Kindle d'Amazon. Une grande maison d'édition américaine prépare - avec des algorithmes - son propre lecteur électronique. En France, les organes de presse "indépendants" préfèrent quémander des subventions au pouvoir politique - c'est plus facile que de construire des algorithmes - tandis que les maisons françaises d'édition commence à "joffriner" d ans "Le Monde" sur le mode habituel du dolorisme franchouillard.
Au fait, si j'avais interrogé Laurent Frisch sur le terrain du marketing, vous n'auriez pas manqué de fustiger le discours marketing du représentant d'Orange.
Vous devriez vous demander si votre commentaire ne constitue pas un symptôme de technophobie, mal français plus répandu et plus grave que le virus H1N1 mais contre lequel il n'est point de vaccin.
Merci Alain pour ce très intéressant billet, avec une très pertinente utilisation du son et de la vidéo !
Le succès de cet agrégateur ne dépendra-t-il pas également du nombre de sources indexées? Ce qui donne - encore - une avance à google actu...
On peut, en effet, espérer que l'accroissement du nombre de partenaires d'Orange fournisseurs de contenus - il ne s'agit pas de "sources indexées" comme dans un moteur classique mais de partenariats - favorise une diversité réellement pluraliste. Il y aura peut-être moins de conformisme dans la presse francophone: belge, suisse, ou du Québec...
J'attire votre attention sur le fait que 2424 actu n'est pas un concurrent de Google actu qui ne propose que des citations et des liens. Google actu ne regroupe pas, sur un évènement donné, des contenus de sources et surtout de natures différentes: textes, sons, vidéos. C'est sur ce dernier point que l'agrégateur d'Orange est innovant.
Bonjour Alain,
Sur l'éventualité de donner une carte de presse à des algorithmes (clins d'oeil au CFJ Lab de jeudi 22), il faut savoir que des journalistes ont participé à l'élaboration du projet.
Sur la cannibalisation, il faut évaluer la réactivité de l'outil.A première vue, c'est du H + 1 voire 2 ou 3 par rapport aux diffuseurs originaux. Cela laisse de la place pour développer la primo diffusion voire une offre d'information continue pour un média comme FTV. Je dirais même que pour France Info , par exemple, il s'agit plus d'une opportunité de ré-exposition que d'une concurrence.
Enfin, une information qui me semble importante: Orange rétribue les éditeurs associés. Je ne suis pas dans le secret des dieux et je ne sais pas si les montants sont significatifs, mais, il me semble que, pour quelques purs players comme Rue 89, c'est un apport intéressant.
Vous complétez ce billet sur trois points importants:
1 - Je ne savais pas que des journalistes avaient participé à l'élaboration du projet. Si c'est le cas, l'approche était salutaire: l'intervention de bons journalistes aux côtés d'algorithmes performants produit un résultat convaincant.
2 - Sur la cannibalisation, vous avez évidemment raison. Les précisions que vous apportez militent en faveur d'un tel outil comme amplificateur de véritables "marques média" sur le web. Pour prolonger votre remarque, ce serait bien si 2424 actu servait aussi à faire émerger les sources d'informations les plus fiables, les plus originales et les plus riches en contenus. Ce n'est pas impossible.
3 - Laurent Frisch m'a effectivement parlé de ce partage de ressources publicitaires au pro-rata de l'audience recueillie par chaque séquence vidéo.
Trouvant mon billet trop long, je n'ai pas mis cette information en ligne. J'ai eu tort mais vous réparez cette lacune.
Aucun montant n'a été cité lors de cet entretien, même en "off", et j'ai cru comprendre que la rétribution des partenaires d'Orange était dans la nature et la vocation de l'agrégateur mais pas encore effective.
Merci d'avoir enrichi ce billet sans l'alourdir.
@Aurélien: oui, vous avez raison, il nous faudrait plus de sources. Avec un bémol : nous cherchons la qualité avant l'exhaustivité. Cela signifie 2 choses pour moi. D'une part trouver les sources pertinentes, fiables, reconnues. D'autre part, améliorer la présentation face à une abondance de contenus. Je suis conscient que nous avons encore des progrès à faire (d'ailleurs, nos partenaires nous aident dans cette réflexion-là).
@miltrist: comme vous le dites, 2424actu ne joue pas sur le même tableau que les médias eux-mêmes. Notre valeur est de proposer un regard nouveau sur l'actu récente en juxtaposant leurs traitements... et en donnant une nouvelle fenêtre d'exposition à leurs contenus. Ce principe même implique que nous ne sommes pas en compétition avec les offres d'actu en quasi temps réel.
@Alain: effectivement, un journaliste nous a aidé. Notamment pour comparer notre algorithme de clustering à ce qu'un journaliste aurait fait. Nos tests ont montré qu'il n'y avait pas plus de différences entre la machine et l'humain qu'entre deux humains. Nous savons qu'elle peut ponctuellement faire des erreurs qu'un humain n'aurait pas faites ; mais nous savons aussi qu'elle est plutôt fiable.
Merci pour cette réponse à une question que j'avais oublié de vous poser. Les précisions que vous apportez ouvrent de passionnants champs de réflexion sur :
- pourquoi un seul journaliste et pas un "panel" de journalistes qui eut été davantage pluraliste ?
- quel type de journaliste, quel niveau, quelle expérience, quelle culture ? Vous savez peut-être qu'il y a de mauvais journalistes. Je ne parle pas ici de celui que vous avez consulté puisque je ne le connais pas mais à votre place, j'aurais essayé de constituer un échantillon représentatif du journalisme à la française avec un mauvais, un moyen, un bon et un très bon.
- s'il n' y a pas plus de différences entre la machine et l'humain qu'entre deux humains, c'est que l'un des deux humains (journaliste) n'a pas plus de neurones que le meilleur de vos algorithmes.
- un journaliste peut faire des erreurs d'appréciation qu'un bon algorithme ne ferait pas. Je me souviens d'un brillant journaliste - un des meilleurs de sa génération dans les années quatre-vingt - qui s'entêtait à vouloir faire dépenser une fortune à son entreprise de presse pour acheter les "carnets d'Hitler", qui étaient des faux.
Une grande partie de la presse, assistée par des historiens patentés, a cru à l'authenticité de ce "journal intime".
Des algorithmes opérant dans les champs lexicologiques et sémantiques auraient immédiatement décelé la supercherie dans laquelle de très nombreux journalistes allemands et français se sont vautrés.
J'aurais pu être plus explicite : plusieurs personnes ont fait ce travail de regroupement à la main. Pas seulement 1 journaliste, mais différents profils, 6 différents (journaliste, marketeur, ingénieur...). Il y avait certainement mieux à faire : soit plus représentatif d'une cible d'internautes infovores ; soit plus journalistique en faisant appel à un panel. L'idée n'était de toute façon pas de reproduire ce qu'aurait fait un seul journaliste, mais d'évaluer si la machine avait tout faux... ou pas. Heureusement pour 2424actu, la machine s'en tire plutôt bien. Je sais néanmoins qu'on peut l'améliorer, et nous y réfléchissons.
Je prends avec humour votre remarque sur les neurones de la machine. Considérant (1) que je n'ai jamais réussi à battre mon PC aux échecs (niveau facile) et (2) que mon PC est pourtant tout sauf un foudre de guerre, que dois-je en déduire ? ;)
La "machine", comme vous l'écrivez, fonctionne plutôt bien, en effet.
Je ne suis pas qualifié pour apprécier la valeur d'un panel dans ce genre de test; mais le fait qu'il y ait eu six personnes différentes dans le groupe d'évaluation des algorithmes est plus satisfaisant que l'hypothèse d'un seul journaliste.
Des internautes infovores (merci pour ce néologisme que je réutiliserai, avec votre autorisation) auront sans doute l'occasion de s'exprimer sur l'agrégateur au fil des développements que vous avez évoqué lors de l'entretien et dans votre précédent commentaire (le N°7).
Dans l'immédiat, 2424 actu me semble probant dans sa vocation de réunir des contenus de natures différentes et prometteur dans sa structuration de l'actualité.
En tous cas, il n'est pas responsable du conformisme de la presse française. Laquelle donne, avec le traitement du "renoncement" du fils machin, un nouvel exemple de sa nature grégaire, bêlante tendance moutonnière. Vos algorithmes font leur boulot d'algorithmes et ne peuvent rien contre la veulerie journalistique.
Cette tirade n'était pas de l'humour. Ou alors, c'était sardonique.
Mon allusion aux "neurones de la machine" était de l'humour sans acidité et vous avez eu raison de le prendre comme un clin d'oeil. Je tiens de Muhammad al-Khwarezmi, inventeur ouzbek des algorithmes, que ceux-ci ne comportent ni cellules nerveuses, ni synapses - quoi que... - et encore moins de protéines. Quant à mes propres neurones, de moins en moins nombreux à cause de mon âge avancé, il leur arrive parfois et à mon grand étonnement de faire fonctionner quelques algorithmes rudimentaires.
Quelques réglages me semblent encore nécessaires: j'ai trouvé ce soir (29 novembre) 2 infos "France" dans la rubrique "international", mais dans l'ensemble ça fonctionne. En tout cas, même si le mélange texte, son et vidéo est sympathique, je ne vois guère de différence (algorithme contre algorithme) au niveau du choix des sujets et de leur hiérarchisation avec ce que fait Google Actualités France. Bref, le saut qualitatif ne me semble pas énorme (si ce n'est la rémunération des sites producteurs de contenu!), en tout cas pas suffisamment important pour faire la différence.
Plus important: l'outil me semble d'ores et déjà "daté": la "ligne de front" de l'information s'est déplacée vers ce que l'on pourrait appeler l'info immédiate produite par les réseaux sociaux (twitter, facebook et autres). Or je ne vois pas sur 2424actu d'outils d'analyse, de sélection, de hiérarchisation et d'agrégation de toute cette information produite par les réseaux sociaux.
Vos remarques intéresseront sans doute les concepteurs de l'outil. Ils peuvent y répondre ici.
Quant au "déplacement" de "la ligne de front" de l'information et "l'info immédiate des réseaux sociaux", je préconise un peu de recul et davantage de réflexion dans un pays où des écoles de journalisme - reconnues par la profession - ne proposent aucune formation aux ressources et outils du web.