Le Titanic et l’iceberg du real time

La visibilité du Titanic dans les médias ces jours-ci me donnerait le goût de pirater le Web… si j’avais les compétences d’un super-méga geek. 

Cela m’a inspiré cette divagation historique sur le thème poétique du jour: le naufrage de l’arrogance technologique dans l’océan incertain du futur!
Depuis hier, aujourd’hui, pour quelques jours encore, la célébrité de l’accident maritime du Titanic fait en sorte que le cours normal de l’actualité est légèrement dévié vers les eaux glacées de l’Atlantique Nord en 1912. Des nouvelles du jour sont maintenant celles des jours vieux de 100 ans parce que des informations  titanisques [sic] sont diffusées puis reprises des centaines, des milliers et des milliers de fois dans les médias sociaux et officiels. 
Une hypothèse qui divague

Si 1 000 faits historiques, 100 000 ou même 1 000 000 de faits anciens étaient ainsi re-diffusés dans le Web avec la même amplitude, fréquence et duplication, avec la même frénésie de remixage et de re-twitts, est-ce qu’on pourrait fléchir, détourner de l’actualité 10, 15, 25% des contenus mis en ligne? À la limite, pourrait-on faire croire un moment à des gens qui ouvrent leur plate-forme d’aggrégation de nouvelles qu’elles ont voyagé dans le temps durant leur sommeil et qu’elles reçoivent maintenant, en avril 2012, des nouvelles vieilles de 100, 200 ans?
De quelle manière serait-il possible de construire, secrètement, un gigantesque iceberg de données historiques? Ce pourrait être une sorte de réincarnation pôlenordesque de Moby Dick, l’agglomération de toutes les données imprimées dans l’ère pré-web. Gavé de krill d’informations oubliées, on le ferait dériver lentement dans le fil des réseaux sociaux, en real time de 2012, pour que le cours de l’actualité soit dévié de sa course, pour qu’il se défile à l’envers, à rebours de sa direction normale.
Orson Welles a fait croire aux New-Yorkais que les extraterrestres les envahissaient. Pourquoi ne pourrait-on pas (nous) faire croire que nous sommes à une autre époque? 
J’imagine des armées de chevaux de Troie installés sur des milliers et des milliers d’appareils numériques, sur des blogues, des comptes Twitter, Flickr, Gmail, Facebook, Youtube, Itunes (imaginons des comptes « amis » préprogrammés, synchronisés et interconnectés, clandestins, pour écouter et visionner telle ou telle oeuvre ancienne!) qui, au moment prévu, diffusent des millions de données historiques.
Un complot pour faire couler le Titanic du real time dans les abysses de l’Histoire
(c’est un élément poétique de la divagation!).
Je perds le Nord, et le présent, c’est sûr. Mais l’idée m’est venue en pensant aux énormes trous noirs qui auraient une force gravitationnelle si grande qu’ils pourraient faire dévier, fléchir le trajet de la lumière. 
Toutes les informations, documents et données anciennes que l’on met aujourd’hui en ligne sont comme des trous noirs au milieu Web. C’est la matière sombre de l’univers numérique. Déposée dans les bases de données du web invisible, hors de la chronologie du Web née à peine voilà 25 ans, la mémoire des sociétés et des cultures passées reste dans les oubliettes. On ne sent pas ni sa présence ni son poids: la dématérialisation numérique a plombé la continuité entre hier et maintenant.

Comment donner aux archives de la mémoire humaine une présence réelle, en real time, pour qu’elle apparaisse autrement qu’à l’occasion de la recherche de quelqu’un dans une base de données, ou lors de la consultation d’un site?

Facebook, Google+ et l’environnement Apple, on ne peut pas y échapper: ils sont toujours et tout le temps là.

Pourtant, si on pense au nombre et à la valeur des énoncés qu’il contient, l’univers total des livres et des imprimés (avant 1990) représente un réseau socio-culturel aussi important que les réseaux actuels. On pourrait discuter de la taille de chacun d’eux, mais celui de la mémoire historique est des milliers de fois plus riche et complexe que ce qu’on peut en voir aujourd’hui dans le Web. 

Comme le fatidique iceberg du Titanic s’était formé par l’accumulation de minuscules cristaux de glace, jusqu’à pouvoir couler le plus gros paquebot de l’époque, pourquoi ne pas concevoir un iceberg de données pour déchirer la surface de l’infini présent et nous montrer que nous voguons au-dessus des fosses, des heurs et malheurs de l’Histoire.
C’était mon petit iceberg à la mer, numérique.
Bon voyage!
Et joyeux naufrage!

Publier des bases de données

Les bases de données, terme réservé jusqu’à récemment aux professionnels de l’informatique, est devenu une expression courante, et si le gens n’en sont pas toujours conscients, une part de plus en grande de l’information dans Internet, sinon la plus grande partie, se trouve, d’une façon ou d’une autre, dans une base de données. Les pages html statiques sont de plus en plus rares. À mesure que s’étend les applications où on peut ajouter des infos en ligne, les réviser, les compléter, les supprimer, plus cela sous-entend une « base de données » ou un système de gestion de contenu organisé d’une façon similaire à une base de données relationnelles. Les profils d’usagers, les blogues, les intranets où le personnel ajoute du contenu et le modifie, s’appuient plus ou moins sur des bases de données. (Techniquement, ce n’est peut-être pas le bon terme, mais l’esprit et les possibilités sont les mêmes).

Mais, voilà, il y a, pourrait-on dire, deux modalités pour présenter le contenu d’une base de données:

-1) une base de données « statique » qui attend les requêtes de l’usager dans un moteur de recherche pour afficher une partie du contenu.

– 2) une base de données dynamique et active ou plutôt « activée » par les responsables qui affichent plusieurs contenus de la base de données dans des gabarits, des modules de publication et des formats pré-établis.

Par exemple, sur les sites des journaux et des médias d’informations, on trouve sur toutes les pages des informations de la base de données déjà « affichées » pour l’usager: chroniques, manchettes, blogues, sections, etc. Chaque page contient en fait tout un ensemble de « requêtes », simples ou complexes », pré-définies, qui affichent l’ensemble des résultats dans une structure infographique donnée dès que l’usager fait afficher la page dans son navigateur. En fait, la page d’accueil de CyberPresse ou de Radio-Canada est comme une multi-requêtes qui affiche les résultats sous le titre de chaque rubrique et section.

Par opposition, on pourrait imaginer une sorte de portail absurde où plutôt que d’affiche immédiatement les dernières nouvelles sportives, culturelles, politiques, économique, il y aura sous chaque rubrique une ptit moteur de recher où l’usager trouverait autant de petit moteur de recherche où il devrait entre une recherche pour que sa page se remplissent d’informations!!! Ce média ne survivrait pas longtemps.

Cela est absurde, et pourtant les sites des bibliothèques institutionnelles et surtout de plusieurs grandes collections de fichiers numériques sont construits souvent dans cette esprit-là ou presque. C’est-à-dire que l’information affichée est sous la responsabilité de l’usager, c’est lui qui doit travailler à faire apparaître des informations et des contenus, sinon il ne voit rien. L’usager est devant une base de données statique qui attend d’être activée.

Sur les sites commerciaux, les gestionnaires ont déjà cherché de l’information avant même qu’un usager arrive dans leur site. Ce qui s’affiche dans la fenêtre du navigateur, ce sont les données de la base pré-activée par les responsables.

Le site de Google Archives pour la recherche dans les journaux numérisés, c’est un peu, beaucoup ça. L’étonnante Timeline qui s’affiche en haut de chaque résultat s’appuie nécessairement sur une méta-requête, sur une pré-indexation intelligente de toutes les dates dans les millions de page du corpus. Google a dû chercher et indexer les 365 dates de toutes les années (2 mars 1652, 3 avril 1876, etc, pour chaque date, pour chaque année!!!) que couvre leur corpus pour pouvoir créer automatiquement une Timeline aussi performante.

À la requête simple de l’usager, comme chercher l’expression « New France », s’ajoute une requête extrêmement complexe de la recherche des occurrences de ce terme, croisées avec la multitude des dates que l’on trouve à une certaine « proximité » sémantique de « New France ». En fait, il est difficile de savoir comment Google a procédé, mais une chose est sûr: la requête simple de l’usager y est multipliée par le travail de formalisation et d’indexation réalisés avant qu’il la fasse.

Une fois liée à la méga-requête de la Timeline de Google, l’usager n’a plus à faire d’autres requêtes pour préciser la période historique qu’il veut couvrir, puisque Google y a déjà pensé. Mieux que ça, on peut imaginer une équipe d’historien construire des thésaurus thématique sur des grands événements ou des plus petits pour que la Timeline fasse apparaître non pas les seuls occurrences d’une expression à travers les années et les siècles, mais tout un réseau de mots-expresssions distribués sur des durées longues et courtes.