Après les systèmes Dewey et Congress II

Les grands sites commerciaux, ceux qui gèrent des millions de documents, d’informations et de documents, comme Ebay, Amazon, Facebook, Youtube, etc, ont développé d’autres systèmes de classement, non-standardisés, plus intuitifs, où les usagers jouent un rôle central dans l’indexation des dizaines de millions documents multimédias qu’ils décrivent. En ce domaine, c’est sans doute l’expérience de Ebay qui est la plus riche et originale. Le site regroupe des millions d’acheteurs et de vendeurs qui font des millions de transaction par jour pour vendre-acheter de tout: livres, bébelles, voitures, maisons (!), billets de spectacle, vêtements, « weird stuff », etc. La variété des choses décrites est absolument phénoménale: elle recoupe tous les produits et choses possibles. Et pourtant, les acheteurs trouvent rapidement ce que des milliers de vendeurs sans aucune formation en bibliothéconomie ou en indexation décrivent spontanément, sans trop rigueur, d’une manières souvent incomplète et même souvent (involontairement) fausse. Et ça marche! Moins rigoureux que ceux des bibliothèque mais plus souple, ce système est très performant parce qu’il évolue tout le temps selon les ressources nouvelles des NTIC. Celui des bibliothèques ne bouge pas, n’évolue pas. Si de nombreuses discussions portent sur la manière d’introduire la folksonomie dans les bibliothèques web 2.0, faut noter que les exemples sont encore rares et plutôt prudents et craintifs.

Mais comment le sytème d’Ebay réussit-il? Il y a deux systèmes d’identification complémentaire: un thésaurus de catégories structuré, hiérarchique et la recherche plein texte dans le titre (par défaut) et/ou dans le texte de la description rédigée par les vendeurs. Ça peut ressembler à un système Dewey, moins détaillé à l’intérieur de chaque grande classe d’objets (par exemple, le classement des livres y est infiniment moins développé quand dans le Dewey bien sûr), mais avec un spectre, un champ d’application plus large, du dé à coudre pour collectionneur aux photos anciennes, du calendrier aux souliers de contrefaçons.

Autre idée: Youtube permet de découvrir et tous les moteurs de recherche commerciaux sont axés sur la découverte: offrir aux clients plus qu’ils en demandent, leur proposer ce qu’ils ne cherchent pas, les faire cliquer plus et plus, ne jamais les mettre devant « pas de résultats »: ces sites nous inondent d’informations qu’on ne cherche pas, et ça marche: souvent, on oublie un peu ce qu’on est venu chercher et on clique sur ce qu’on nous propose. D’ailleurs, les gens utilisent très souvent l’expression « T’as pas vu ce que j’ai découvert… » ou « Tu sais pas ce que j’ai trouvé… », mais employée dans le sens de « découvrir », verbe qui exprime l’étonnement, la surprise… En un certain sens, les moteurs de recherche de ces sites sont plutôt des moteurs de découverte plus que de recherche.

Dans les sites des institutions publiques, c’est comme si à l’entrée d’une musée il y avait un portier qui demandait l’air un peu bête: que cherchez-vous? Si vous ne le savez pas, attendez de le trouver avant d’entrer. On sait tous que souvent la première motivation, comme dans une librairie, est la curiosité même l’ignorance: « Je ne sais pas trop, je m’en viens voir ce que vous avez… » Et c’est au musée et à la librairie de concevoir un aménagement qui m’en mette plein la vue. C’est ce que font les sites commerciaux qui, autre paradoxe, ne produisent aucun contenu! Ils ne doivent pas classer ce qu’ils produisent, mais ce que les usagers et les abonnés ajoutent à leur base de données. Ce sont des sites qui investissent rien dans le contenu, ou presque, et tout dans des applications pour rendre facile l’ajout du contenu, sa consultation, son échange, etc.
À l’inverse, les bibliothèques et les institutions nationales investissent tout dans le contenu numérisé et rien ou presque dans les applications pour le consulter, le commenter, l’échanger. La popularité des premiers est-elle que tout le monde les connaît – même ceux les non-branchés ont entendu parler de Ebay, Amazon, Facebook – alors que le contenu des seconds est à peine connu et consulté par le public branché.

Après les systèmes Dewey et Congress I

Le système de classement des livres de Dewey et celui de la Library of Congress jouent deux rôles: classer les livres et les documents par leur contenu dans le cadre d’une description standardisées des savoirs, ET à classer les livres sur les rayons des bibliothèques. Pourtant, en théorie, les cotes pour décrire les contenus des livres et leur localisation dans les bibliothèques pourraient être disctincts. Par exemple, touts les documents ont un « call number » ou un numéro de système unique qui sert à les identifier dans la base de données, souvent selon leur date d’acquisition. Ce numéro ne décrit aucun contenu et est attribué arbitrairement, automatiquement. On pourrait classer les livres par ce numéro d’identification, mais ce serait un vrai bordel que de chercher des livres dans une telle bibliothèque: les livres seraient sur le plan des contenus dans un désordre absolu.
Le double usage de la cote Dewey ou Congress vient du choix, apparemment logique et pratique, qu’on a fait de mettre côte à côte les livres qui ont le même sujet, des contenus similaires. Il y a aussi la nécessité d’avoir un seul système qui fait les deux (décrire les contenus et localiser): c’est économique pour la gestion des documents et facile à utiliser par les usagers et le personnel.

Curieusement, dans les moteurs de recherche, les usagers cherchent peu avec la cote ou par sujet. Ils cherchent par titre, par auteur, surtout, et les résultats sont classés par ordre alphabétique ou par date, quand il y a la possibilité de trier les documents trouvés selon différents champs. La chronologie et l’ordre alphabétique sont déjà deux autres systèmes de classement différents de Dewey et du Congress. Même s’ils demeurent élementaires, ce sont les plus utilisés par les usagers, probablement. Même s’ils en ont la possibilité, les usagers parcourent rarement (c’est à vérifier) les résultats des moteurs de recherche par la cote, alors que c’est la pratique la plus courante dans la bibliothèque elle-même.

Un système de classement unique a de multiples avantages, entre d’autres de permettent la standardisation de la description, l’échange des notices, le pré-cataloguage, etc. Cela ne fait pas de doute et qui va proposer d’abandonner ces systèmes? Y aurait-il seulement deux manières de classer les livres, les imprimés et tous les documents produits par l’humanité? Évidemment non. Et la tâche d’inventer un système qui se propose de permettre de tout classer est immensément difficile. Y en a-t-il des meilleurs que d’autres? Certainement. Mais c’est Dewey et Congress qui se soient imposés, comme les thesaurus de mots-clés internationaux qui sont les complètes.

La cote officielle est un compromis. Parce qu’il ne peut y en avoir plus qu’une, elle fait abstraction des différents contenus dont peut parler un document pour en retenir un seul, le plus important, du moins tel que définit à l’intérieur de ces deux systèmes. Les mots-clés complètent ce système et permettent d’ajouter à ce contenu principal d’autres sujets, d’autres contenus. C’est possible de le faire, parce que les livres ne sont pas classés physiquement en se basant sur les mots-clés. Il faudrait alors plusieurs exemplaires d’un même document lié à autant de localisation où il serait placé à côté des autres documents avec le même mot-clé. En fait, dans un tel système, il faudrait avoir autant d’exemplaires d’un document que de mots-clés ayant servi à en décrire le contenu. Peu économique pour la bibliothèque, mais cela pourrait être utile pour l’usager. C’est d’ailleurs ce que les résultats de recherche en ligne permettent, d’afficher une liste de documents par mot-clé. Quand on veut trouver ces ouvrages, au lieu de les trouver côte à côte, on doit se déplacer sur plusieurs rayonnages pour les regrouper tous.
Tout ça pour dire que les classements Dewey et Congress sont des systèmes de description des contenus mais qui remplissent un autre rôle beaucoup plus pragmatique, celui de localiser les documents. C’est cette contrainte matérielle qui empêchent fondamentalement qu’il puisse exister plusieurs systèmes pour décrire les documents des collections.

La question demeure pourtant: pourquoi sont-ils les seuls à être utiliser pour classer la bibliothèque? Pour en intégrer un autre dans une bibliothèque réelle avec de vrais livres sur les rayons, il faudrait que ce soit un système qui ne sert qu’à décrire le contenu. On ne peut pas avoir deux cotes différentes pour localiser un document unique! Pour ouvrir la possibilité d’autres systèmes, il faut donc d’abord distinguer le classement des contenus du classement physique du document. C’est ce que montre la prolifération des modules qui permettent d’ajouter des mots-clés personnels (tag) aux documents consultés.

Ce qu’on appelle la « folksonomie » (classement par le « peuple-folk ») est en voie de se généraliser. Leur caractère spontané et le peu de document que ces taxonomies décrivent n’en font pas des systèmes de classement proprement dits: ces mots-clés s’ajoutent à ceux attribués par les responsables de l’indexation. En fait, ils identifient le contenu plus qu’ils le classent dans une hiérarchie, dans un thésaurus.
D’ailleurs, c’est une des limites des folksonomies actuelles que de ne pas permettre, semble-t-il, la création de véritable thésaurus pour représenter un réseau de relations sémantiques entre les termes utilisés pour décrire les contenus. Sans hiérarchie et relations sémantiques pas de système, que des « nuages » de mots-clés. Du moins, c’est ainsi qu’on représente parfois ces nouveaux mots-clés.

C’est déjà le cas pour les archives où la cote des documents ne désignent que le numéro du fonds, de la boîte et du dossier, rien de plus.