Le Titanic et l’iceberg du real time

La visibilité du Titanic dans les médias ces jours-ci me donnerait le goût de pirater le Web… si j’avais les compétences d’un super-méga geek. 

Cela m’a inspiré cette divagation historique sur le thème poétique du jour: le naufrage de l’arrogance technologique dans l’océan incertain du futur!
Depuis hier, aujourd’hui, pour quelques jours encore, la célébrité de l’accident maritime du Titanic fait en sorte que le cours normal de l’actualité est légèrement dévié vers les eaux glacées de l’Atlantique Nord en 1912. Des nouvelles du jour sont maintenant celles des jours vieux de 100 ans parce que des informations  titanisques [sic] sont diffusées puis reprises des centaines, des milliers et des milliers de fois dans les médias sociaux et officiels. 
Une hypothèse qui divague

Si 1 000 faits historiques, 100 000 ou même 1 000 000 de faits anciens étaient ainsi re-diffusés dans le Web avec la même amplitude, fréquence et duplication, avec la même frénésie de remixage et de re-twitts, est-ce qu’on pourrait fléchir, détourner de l’actualité 10, 15, 25% des contenus mis en ligne? À la limite, pourrait-on faire croire un moment à des gens qui ouvrent leur plate-forme d’aggrégation de nouvelles qu’elles ont voyagé dans le temps durant leur sommeil et qu’elles reçoivent maintenant, en avril 2012, des nouvelles vieilles de 100, 200 ans?
De quelle manière serait-il possible de construire, secrètement, un gigantesque iceberg de données historiques? Ce pourrait être une sorte de réincarnation pôlenordesque de Moby Dick, l’agglomération de toutes les données imprimées dans l’ère pré-web. Gavé de krill d’informations oubliées, on le ferait dériver lentement dans le fil des réseaux sociaux, en real time de 2012, pour que le cours de l’actualité soit dévié de sa course, pour qu’il se défile à l’envers, à rebours de sa direction normale.
Orson Welles a fait croire aux New-Yorkais que les extraterrestres les envahissaient. Pourquoi ne pourrait-on pas (nous) faire croire que nous sommes à une autre époque? 
J’imagine des armées de chevaux de Troie installés sur des milliers et des milliers d’appareils numériques, sur des blogues, des comptes Twitter, Flickr, Gmail, Facebook, Youtube, Itunes (imaginons des comptes « amis » préprogrammés, synchronisés et interconnectés, clandestins, pour écouter et visionner telle ou telle oeuvre ancienne!) qui, au moment prévu, diffusent des millions de données historiques.
Un complot pour faire couler le Titanic du real time dans les abysses de l’Histoire
(c’est un élément poétique de la divagation!).
Je perds le Nord, et le présent, c’est sûr. Mais l’idée m’est venue en pensant aux énormes trous noirs qui auraient une force gravitationnelle si grande qu’ils pourraient faire dévier, fléchir le trajet de la lumière. 
Toutes les informations, documents et données anciennes que l’on met aujourd’hui en ligne sont comme des trous noirs au milieu Web. C’est la matière sombre de l’univers numérique. Déposée dans les bases de données du web invisible, hors de la chronologie du Web née à peine voilà 25 ans, la mémoire des sociétés et des cultures passées reste dans les oubliettes. On ne sent pas ni sa présence ni son poids: la dématérialisation numérique a plombé la continuité entre hier et maintenant.

Comment donner aux archives de la mémoire humaine une présence réelle, en real time, pour qu’elle apparaisse autrement qu’à l’occasion de la recherche de quelqu’un dans une base de données, ou lors de la consultation d’un site?

Facebook, Google+ et l’environnement Apple, on ne peut pas y échapper: ils sont toujours et tout le temps là.

Pourtant, si on pense au nombre et à la valeur des énoncés qu’il contient, l’univers total des livres et des imprimés (avant 1990) représente un réseau socio-culturel aussi important que les réseaux actuels. On pourrait discuter de la taille de chacun d’eux, mais celui de la mémoire historique est des milliers de fois plus riche et complexe que ce qu’on peut en voir aujourd’hui dans le Web. 

Comme le fatidique iceberg du Titanic s’était formé par l’accumulation de minuscules cristaux de glace, jusqu’à pouvoir couler le plus gros paquebot de l’époque, pourquoi ne pas concevoir un iceberg de données pour déchirer la surface de l’infini présent et nous montrer que nous voguons au-dessus des fosses, des heurs et malheurs de l’Histoire.
C’était mon petit iceberg à la mer, numérique.
Bon voyage!
Et joyeux naufrage!

Direction générale des travaux….

Dans le domaine de l’histoire, il y a maintenant une accessibilité à une quantité gigantesque de documents imprimés, iconographiques, audio-visuels, statistiques, inimaginable voilà à peine quelques années. La connaissance historique que l’on peut faire jaillir de ces vertigineuses données représente un monde possible, un univers à faire advenir, le seul qui soit vraiment et authentiquement virtuel, c’est-à-dire « qui ne l’est qu’en puissance, qui est à l’état de simple possibilité ». Le Robert petit continue et ajoute que les « particules virtuelles sont des particules fictives permettant d’expliquer l’interaction entre les quantons ».

Cette documentation-monde contient donc une connaissance en puissance, une connaissance fictive, alors que les fichiers numériques, eux, sont réels et non virtuels, comme on le dit souvent incorrectement. C’est une connaissance qui n’existe pas encore, elle est seulement une possibilité de connaître, une possibilité de connaissances nouvelles pas encore tombées de l’univers fictif-virtuel créé par la masse documentaire pour prendre forme dans des résultats tangibles: oeuvres, discours, encyclopédie, paroles, sites.
D’où peuvent venir ces objets de connaissances nouvelles?

Sinon de l’acte de connaître lui-même qui consiste d’abord dans l’interrogation des bases de données numériques qui forment aujourd’hui des sortes de réserves culturelles de connaissances, des couches sédimentaires intellectuelles accumulées au cours des siècles dont il convient d’explorer la richesse pour agrandir le domaine du connu, les sortir de l’univers des virtualités cognitives pour en faire du connu.
Mais que voulons savoir, connaître? C’est la question!
Le fait est connu: une majorité de gens cherchent souvent leur propre nom ou quelque chose d’autre qu’ils connaissent déjà très bien dans Internet! Quelle est la motivation, la volonté de connaître dans ces recherches? Quelque chose de nouveau sur eux-mêmes qu’ils ne connaîtraient pas? Ou plutôt connaître « ceux » qui connaissent quelque chose sur eux ou ont « parlé » d’eux? Vanité, peut-être, mais surtout la situation de quelqu’un qui ne sait pas ce qu’il veut chercher ni ce qu’il veut savoir ne sachant pas exactement ce qu’il peut trouver.
Où placer la curiosité dans tout ça, à l’intérieur d’une théorie de la connaissance qui ne s’intéresserait pas seulement à comment nous connaissons mais aussi à pourquoi voulons connaître?
Comment rendre ces connaissances virtuelles réelles? D’où vient tout simplement la connaissance? pourrait demander le philosophe.

Pour s’en tenir à un corpus textuel, quelle lecture nouvelle la numérisation rend-elle possible qui n’existait pas auparavant? Éliminons la lecture continue à l’écran du fichier pdf d’un document papier: c’est une lecture traditionnelle qui continuera malgré toutes les évolutions technologiques pour bien longtemps encore. On parle souvent de lecture discontinue, fragmentaire, aléatoire. Certains la célèbrent; d’autres la dénoncent: ce nouveau mode de lecture est aussi là pour rester, et il étend d’ailleurs, à des proportions inattendues, le très vieux mode du feuilletage, du saut de passages ennuyants, des lectures en diagonales. Une différence inédite pourtant est qu’un lecteur peut feuilleter-sauter instantanément entre plusieurs documents.
C’est encore mettre l’accent sur la lecture individuelle et non pas sur un projet de lecture systématique d’un assez large corpus dans le cadre d’une recherche précise, même si elle peut très bien être celle d’un seul lecteur, poursuivie pour son seul plaisir. Même si ce n’est pas une « vraie » recherche, avec un plan et des objectifs précis, la question demeure: comment lire une grande masse textuelle?
Pour lire, ul faut d’abord une intention, un projet de lecture. On se lasse vite de parcourir des dizaines de documents numériques trouvés au hasard: ou on arrête tout, ou on en choisit un, et on le creuse, on le lit à l’ancienne, en continu.
C’est paradoxal: on dirait que le projet de lire un grand corpus empêche en fait la lecture de ce corpus dans un format nouveau. On ne peut pas tout lire les textes à la manière traditionnelle, alors on n’en lit aucun, ou seulement quelques-uns. De retour à la case de départ. Il y a donc à trouver des modes d’appréhension de la matière textuelle qui soit autre chose qu’une lecture continue d’un document après l’autre, suivie de notes de lectures, de résumé, d’analyse.

Le nombre de textes à lire, souvent impressionnant, apparaît suite à une requête simple dans le moteur de recherche: cette opération ne sert qu’à créer une sous collection du corpus général. La petite fenêtre du formulaire aussi simpliste qu’elle soit demeure la seule voie pour commencer à « lire-chercher » dans un grand corpus. Pour lire mieux, il faut donc multiplier le nombre de requêtes, accroître leur niveau de complexité, prévoir de longue liste de mots à chercher simultanément, avoir des outils d’analyses des résultats, des séries de requêtes combinatoires, des analyseurs sémantiques, etc.

Dans cette perspective, l’acte de « lecture » consiste dans un montage raisonnée de questions, un parcours de curiosité pour chercher un sujet, construit à partir d’un ensemble de mots, d’expressions, éventuellement de catégories linguistiques (verbes, pronoms, adjectifs), de structure syntaxique ou morphologique. « Lecture » entre guillemets puisqu’à cette étape, c’est toujours le moteur de recherche qui ne repère que les chaînes de caractères que l’on donne à chercher.

Le projet de recherche prospective sur l’Amérique conquérante de l’Europe ou sur l’Amérique française dans l’imprimé mondial seraient de bons exemples. On peut bien étendre le concept de lecture à cette étape, mais il s’agit plutôt de sélectionner un corpus thématique à partir duquel des lectures seront possibles. Difficile d’employer le mot « lecture » dans une opération qui consiste essentiellement à entrer quelques mots à la fois dans un formulaire de recherche. C’est plutôt se donner des conditions de lecture dont il s’agit, de sortir le corpus numérisé de sa pure virtualité pour s’approcher de sa lecture réel et de ses lecteurs réels.
Pas une lecture, mais un acte intellectuel par lequel on donne sens à un ensemble de documents par leur réunion dans une bibliothèque particulière de la bibliothèque universelle. De simples données dans un catalogue numérique, les documents s’intègrent dans un ensemble signifiant.

Questions:

– comment exploiter la richesse de la masse documentaire mis à la portée de tous et des chercheurs?
– comment transformer la matière textuelle en informations, en savoirs, en significations, en théorie, en culture, en sagesse…