Direction générale des travaux….

Dans le domaine de l’histoire, il y a maintenant une accessibilité à une quantité gigantesque de documents imprimés, iconographiques, audio-visuels, statistiques, inimaginable voilà à peine quelques années. La connaissance historique que l’on peut faire jaillir de ces vertigineuses données représente un monde possible, un univers à faire advenir, le seul qui soit vraiment et authentiquement virtuel, c’est-à-dire « qui ne l’est qu’en puissance, qui est à l’état de simple possibilité ». Le Robert petit continue et ajoute que les « particules virtuelles sont des particules fictives permettant d’expliquer l’interaction entre les quantons ».

Cette documentation-monde contient donc une connaissance en puissance, une connaissance fictive, alors que les fichiers numériques, eux, sont réels et non virtuels, comme on le dit souvent incorrectement. C’est une connaissance qui n’existe pas encore, elle est seulement une possibilité de connaître, une possibilité de connaissances nouvelles pas encore tombées de l’univers fictif-virtuel créé par la masse documentaire pour prendre forme dans des résultats tangibles: oeuvres, discours, encyclopédie, paroles, sites.
D’où peuvent venir ces objets de connaissances nouvelles?

Sinon de l’acte de connaître lui-même qui consiste d’abord dans l’interrogation des bases de données numériques qui forment aujourd’hui des sortes de réserves culturelles de connaissances, des couches sédimentaires intellectuelles accumulées au cours des siècles dont il convient d’explorer la richesse pour agrandir le domaine du connu, les sortir de l’univers des virtualités cognitives pour en faire du connu.
Mais que voulons savoir, connaître? C’est la question!
Le fait est connu: une majorité de gens cherchent souvent leur propre nom ou quelque chose d’autre qu’ils connaissent déjà très bien dans Internet! Quelle est la motivation, la volonté de connaître dans ces recherches? Quelque chose de nouveau sur eux-mêmes qu’ils ne connaîtraient pas? Ou plutôt connaître « ceux » qui connaissent quelque chose sur eux ou ont « parlé » d’eux? Vanité, peut-être, mais surtout la situation de quelqu’un qui ne sait pas ce qu’il veut chercher ni ce qu’il veut savoir ne sachant pas exactement ce qu’il peut trouver.
Où placer la curiosité dans tout ça, à l’intérieur d’une théorie de la connaissance qui ne s’intéresserait pas seulement à comment nous connaissons mais aussi à pourquoi voulons connaître?
Comment rendre ces connaissances virtuelles réelles? D’où vient tout simplement la connaissance? pourrait demander le philosophe.

Pour s’en tenir à un corpus textuel, quelle lecture nouvelle la numérisation rend-elle possible qui n’existait pas auparavant? Éliminons la lecture continue à l’écran du fichier pdf d’un document papier: c’est une lecture traditionnelle qui continuera malgré toutes les évolutions technologiques pour bien longtemps encore. On parle souvent de lecture discontinue, fragmentaire, aléatoire. Certains la célèbrent; d’autres la dénoncent: ce nouveau mode de lecture est aussi là pour rester, et il étend d’ailleurs, à des proportions inattendues, le très vieux mode du feuilletage, du saut de passages ennuyants, des lectures en diagonales. Une différence inédite pourtant est qu’un lecteur peut feuilleter-sauter instantanément entre plusieurs documents.
C’est encore mettre l’accent sur la lecture individuelle et non pas sur un projet de lecture systématique d’un assez large corpus dans le cadre d’une recherche précise, même si elle peut très bien être celle d’un seul lecteur, poursuivie pour son seul plaisir. Même si ce n’est pas une « vraie » recherche, avec un plan et des objectifs précis, la question demeure: comment lire une grande masse textuelle?
Pour lire, ul faut d’abord une intention, un projet de lecture. On se lasse vite de parcourir des dizaines de documents numériques trouvés au hasard: ou on arrête tout, ou on en choisit un, et on le creuse, on le lit à l’ancienne, en continu.
C’est paradoxal: on dirait que le projet de lire un grand corpus empêche en fait la lecture de ce corpus dans un format nouveau. On ne peut pas tout lire les textes à la manière traditionnelle, alors on n’en lit aucun, ou seulement quelques-uns. De retour à la case de départ. Il y a donc à trouver des modes d’appréhension de la matière textuelle qui soit autre chose qu’une lecture continue d’un document après l’autre, suivie de notes de lectures, de résumé, d’analyse.

Le nombre de textes à lire, souvent impressionnant, apparaît suite à une requête simple dans le moteur de recherche: cette opération ne sert qu’à créer une sous collection du corpus général. La petite fenêtre du formulaire aussi simpliste qu’elle soit demeure la seule voie pour commencer à « lire-chercher » dans un grand corpus. Pour lire mieux, il faut donc multiplier le nombre de requêtes, accroître leur niveau de complexité, prévoir de longue liste de mots à chercher simultanément, avoir des outils d’analyses des résultats, des séries de requêtes combinatoires, des analyseurs sémantiques, etc.

Dans cette perspective, l’acte de « lecture » consiste dans un montage raisonnée de questions, un parcours de curiosité pour chercher un sujet, construit à partir d’un ensemble de mots, d’expressions, éventuellement de catégories linguistiques (verbes, pronoms, adjectifs), de structure syntaxique ou morphologique. « Lecture » entre guillemets puisqu’à cette étape, c’est toujours le moteur de recherche qui ne repère que les chaînes de caractères que l’on donne à chercher.

Le projet de recherche prospective sur l’Amérique conquérante de l’Europe ou sur l’Amérique française dans l’imprimé mondial seraient de bons exemples. On peut bien étendre le concept de lecture à cette étape, mais il s’agit plutôt de sélectionner un corpus thématique à partir duquel des lectures seront possibles. Difficile d’employer le mot « lecture » dans une opération qui consiste essentiellement à entrer quelques mots à la fois dans un formulaire de recherche. C’est plutôt se donner des conditions de lecture dont il s’agit, de sortir le corpus numérisé de sa pure virtualité pour s’approcher de sa lecture réel et de ses lecteurs réels.
Pas une lecture, mais un acte intellectuel par lequel on donne sens à un ensemble de documents par leur réunion dans une bibliothèque particulière de la bibliothèque universelle. De simples données dans un catalogue numérique, les documents s’intègrent dans un ensemble signifiant.

Questions:

– comment exploiter la richesse de la masse documentaire mis à la portée de tous et des chercheurs?
– comment transformer la matière textuelle en informations, en savoirs, en significations, en théorie, en culture, en sagesse…