La machine Google archive les journaux

Par où passe la machine Google, le territoire de la recherche n’est plus le même. http://news.google.com/archivesearch

Leur projet de numérisation s’accompagne toujours d’une avancée technologique dans le développement d’applications conviviales et participatives. La recherche dans Google Images a donné le logiciel de publication Internet Picasa, comme toujours simple, efficace, performant, évolutif: à chaque mois, il doit y avoir une nouvelle fonctionnalité. Google Scholar et Google Livres ont donné l’application qui permet de créer en quelques minutes une bibliothèque personnelle, annotée, indexée, mise en ligne et partagée.

Mais Google Archives est vraiment étonnant. L’affichage des résultats avec la « Timeline » qui présente un tableau chronologique des résultats fait rêver: trouver toutes les occurences d’une date précise, 4 mai 1832, et les distribuer dans une chronologie fondée sur la date de parution des ouvrages où elle est mentionnée! Par exemple, ce n’est pas tout à fait possible en ce moment, mais on pourrait de la sorte suivre la mention de « 14 juillet 1789 » dans tous les ouvrages postérieurs avec une précision incroyable. Par exemple, voici un résultat pour « Bastille » ou New France (les journaux indexés sont presque tous anglais, malheureusement). Il faut faire glisser la souris sur la chronologie pour s’apercevoir de la puissance de leur indexation, ainsi que sur les mots-hyperliens qui apparaissent dans la courte description de chaque résultat.

C’est une application qui montre la recherche/développement que Google poursuit continuellement. Le moteur de recherche, dans ce cas=ci, enrichit la requête simple-simpliste de l’usager: à partir d’une seule expression, d’un seul mot, on obtient le début de l’histoire de ce mot dans l’imprimé occidental! Les mots-clés montre aussi une sorte de pré-indexation, probablement d’une sorte de thésaurus de mots importants, déjà reliés à un certain nombre de pages web. Sachant que tout cela n’a pas été fait à la main par des armées de lecteurs, il faut penser alors que la production d’une telle chronologie « indexée » suppose des requêtes complexes en arrière-plan pour enrichir une type de requête qui donne habituellement que le nombre d’occurrences dans X documents, et rien de plus. Dans tous les cas, c’est une application très stimulante.

C’est une manière de présenter les résultats qui suscitent la découverte, qui surprend, qui éveille la curiosité. Imaginer une telle Chronologie pour l’étude d’un grand corpus et d’un thésaurus de sujets rationnel pourrait faire appraître des connaissances nouvelles, impossibles précédemment.

Trouver un petit corpus de mots/expressions pour en explorer les possibilités.

Journaux et journalistes

Qui va mettre en valeur les milliers de périodiques que l’on numérise? Les présenter, les situer dans leur époque, offrir un choix des meilleurs textes? Qui va parler des journalistes, des éditeurs, des imprimeurs, des lecteurs de tous ces journaux?

La Fédération des journalistes du Québec pourrait/devrait jouer un rôle important pour mettre ce corpus en valeur en créant, par exemple, un répertoire des journalistes du Québec, et pourquoi pas à l’intérieur d’un site genre FaceBook, un FacedeJournaliste. Manière de réunir anciens et nouveaux journalistes, anciens et nouveaux médias. Et puis, dans une application vraiment bien conçue, on pourrait trouver certainement plusieurs vieux journalistes qui pourraient commenter, présenter, relire les vieux journaux pour le public d’aujourd’hui. Projet semblable que l’on pourrait concevoir pour les Archives de Radio-Canada.

Le retour du Boréal nouveau express

Conçu en 1999, cela est un peu surprenant. Il y avait donc une bonne perspective fondamentale puisque aujourd’hui les ressources du web 2.0 le rendent presque facile à réaliser.
Faudrait cependant trouver une manière plus visuelle, plus internet de le présenter. Le discours, ça séduit les historiens, les éditeurs, les profs.
C’est l’intérêt pour d’éventuels partenaires financiers privés qu’il faut trouver.
Avec les millions et les millions investis dans la numérisation des vieux périodiques dans le monde, il y certainement un marché très lucratif au-delà du simple balayage numérique pour la réédition des vieux périodiques.

Ce n’est quand même pas possible que dans 5-10 ans, on soit encore devant des fichier pdf qui s’ouvrent dans des fenêtres trop petites, peu malléables, sans aucune des applications autour pour annoter, sélectionner, transcrire, regrouper des articles, indexer, cataloguer… C’est -à-dire toutes les applications qui sont déjà disponibles dans des sites web 2.0, qui eux, seront rendu au web 4.0 sans doute. C’est sûr que nous sommes dans la préhistoire de la réédition de périodiques anciens. C’est sûr, en autant que des gens se mettent à penser à ce que ce serait.

[Trouver une manière d’attacher le doc du Boréal nouveau au blogue]

Mes journaux virtuels

Et si les anciens périodiques obtenaient le même traitement que les journaux actuels dans le logiciel MyVirtualPaper dont ce sert Le Devoir virtuel? Une manière de les republier, pas entièrement, page à page, comme dans leur édition originale, mais dans des sortes de florilèges quotidiens d’articles, de chroniques, même de pub (il y a même un marché pour les anciennes pub qui sont très populaires sur Ebay).

Ça rejoint le projet du Boréal nouveau express qui pourrait être une sorte de prototype dans la ré-actualisation des anciens périodiques. Une projet expérimental intéressant aussi pour des entreprises privées, comme MyVirtualPaper (entreprise québécoise semble-t-il). Si la culture numérisée ne réussit pas à convaincre la business des NTIC qu’elle peut être un domaine de RD « riche, prometteur et rentable », ça n’ira pas très loin.
Y a des partenariats privés-publics dans de nombreuses facultés: médecine, génie, biologie, chimie, etc. Dans le domaine culturel et dans les sciences humaines beaucoup moins. Il pourrait certainement y avoir des projets où les gens aux affaires y trouveraient leur compte.
La collection des vieux journaux du Colorado étaient aussi pas mal impressionnante. Il doit y avoir de nombreux French Canadians là-dedans aussi.
L’idée s’est toujours de lire les anciens documents sur support papier (en croirait qu’on parle du Moyen-Âge en disant ça!) comme s’ils étaient des publications récentes.
Y a une sorte d’hésitation à bousculer l’écrit, le texte, l’imprimé… Peut-être cette volonté de conserver d’une façon ou d’une autre un rappel de l’écrit (tel que formaté en pdf, par exemple) est un des obstacles principaux à la diffusion des anciens imprimés.
Si on pense aux modifications qu’ont dû subir les vrais manuscrits du Moyen-âge pour passer dans la culture d’aujourd’hui, on voit qu’on n’a pas à se gêner. L’édition en livre de poche des aventures de Lancelot ou de Merlin n’a plus rien à voir avec la présentation matérielle des manuscrits originaux, même le texte n’a presque plus rien avoir avec celui d’un seul manuscrit, puisque les éditions contemporaines sont toutes des reconstitutions d’une texte linéaire à partir de nombreuses versions dispersées dans des dizaines de manuscrits différents.

Peut-être faudra-t-il faire la même chose avec les vieux imprimés, surtout dans le cas des vieux périodiques qui, à l’exception de quelques raretés ou pour les besoins d’une recherche pointue, ne seront jamais relus, re-consultés comme leurs premiers lecteurs l’ont fait.

Cela prendrait une entreprise esthétique radicale, une refonte sauvage de la typographie et de la mise en page par des infographes « irrespectueux » du patrimoine imprimé, et en même temps entièrement dévoués à le faire revivre. Ferron, disait que « l’histoire doit vivre comme un roman », l’imprimé doit vivre comme le numérique???
En même temps, faudrait bien qu’on laisse place, qu’on rende au moins visible au besoin les belles grandes pages, à colonnes serrées, sans image ni illustration, qui tapissaient littéralement toutes les pages des journaux du XIXe siècle.