Montréal ouvert: culture et histoire

Dans le cadre de la Journée internationale des données ouvertes du 23 février 2013

Quelles données ouvrir à Montréal, sur Montréal?
Quelles informations sur Montréal rendre publiques?

Perspective générale pour les données montréalaises et urbaines

concevoir une ontologie sémantique de la ville contemporaine, un plan de classification hiérarchique des données, une sorte de tableau périodique des données urbaines
– pour identifier les données à recueillir, à trouver.
Ce serait une sorte de plan optimal des données qu’on peut réunir sur la réalité complexe d’une ville moderne.

élargir l’éventail des fournisseurs de données: ouvrir toutes les données, pas seulement les données et les informations de l’administration municipale et sur les services de proximité, mais les données SUR Montréal. Voici une liste (incomplète) des principaux fournisseurs de ces données:

  1. les gouvernements fédéral et provincial, leurs ministères: santé, transport, éducation, économie, justice, culture, environnement, etc.
  2. les organismes publiques: Observatoire de la culture, Conseils des Arts, Hydro-Québec, commissions scolaires, universités, groupes de recherche, organismes culturels, registraire des entreprises
  3. les entreprises ou organismes privés: chambres de commerce, associations professionnelles, sociétés d’histoire, festivals, Radio-Canada 
  4. dans les collections de documents numérisés (BAnQ, McCord, MBA)
  5. archives des associations et des groupes communautaire

À ces archives collectives, il faut trouver lier les archives personnelles des citoyens. Ce sont des ressources documentaires immenses, uniques, irremplaçables. Avec le numérique, les citoyens font bien plus que consulter des archives: ils peuvent maintenant en créer, en diffuser, participer à leur description et à leur mise en valeur. Les archives documentaires doivent maintenant trouver les moyens d’intégrer cette richesse dans leur pratique et leur collection.

– développer des outils de référence

  • répertoire et inventaires des bases de données que possèdent les administrations municipales, les gouvernements
  • fichiers autorités pour les entitées de référence: noms, toponymes, raisons sociales, organismes, etc. 
  • dépôt de documents et de textes numériques (voir les publications officielles à BAnQ): ouvert aux outils d’analyse sémantique, d’extraction de données

Données et informations culturelles

  • priorité: ouverture des données bibliographiques de Bibliothèque et Archives nationales du Québec: 90 000 documents avec le sujet = Montréal
  • 15 900 ressources en ligne + celles des Archives dans Pistard: + de 100 000 documents
  • données du réseau des centres d’archives de Montréal: universités, musées, institutions, etc.
  • données des activités culturelles des maisons de la culture, bibliothèques (à MTL déjà ouvertes), musées, etc.
  • Commission de la toponymie du Québec (nom de lieux dans Topos)
  • base de données des collections des musées 
  • base de données des groupes universitaires
Suggestion d’utilisation des données historiques
Que les applications pour les données contemporaines soient ouvertes à l’ajout de données historiques (par l’importation en format csv ou autres) pour tous les citoyens, pour des projets plus modestes ou personnels. Le site des Maires de France peut être un excellent modèle http://www.francegenweb.org/mairesgenweb/

Pour d’autres réflexions sur ce sujet, consulter la version préliminaire de mon invitation à organiser les Premières Journées de la culture ouverte au mois de septembre 2013.

Commentaires bienvenus,
Luc Gauvreau

[Une première version de ce texte a paru en mars 2012]

Bibliothécaire en DJ, oui! Mais avec quelle musique?

Le bibliothécaire comme DJ, c’est la proposition (ou la question!) de Martin Lessard à propos du rôle des professionnels des lieux culturels centraux que sont les bibliothèques.  Dans le cadre des débats entourant le  livre numérique, sa réflexion a le premier avantage de nous emmener un peu plus haut et plus loin que la question des formats, des modèles d’affaires, des plate-formes de diffusion et des droits d’auteur. Les bibliothèques sont avant tout des lieux culturels dont la vie est plus longue que les informations en real time. Tout le monde le sait, mais il est bon de le rappeler de temps en temps.
Comme le dit Martin Lessard, son texte veut ouvrir des pistes de réflexion. Voilà qui est réussi. Une bonne piste, c’est fait pour aller ailleurs, ça fait réfléchir et fonctionner les neurones.  J’en emprunterai une que je considère essentielle dans le cadre des réflexions sur l’évolution des bibliothèques et sur le rôle des bibliothécaires: la neutralité. Un des fondements de ces dernières, de leurs principes historiques – sans lesquels elles ne peuvent pas remplir adéquatement leur mission sociale et politique-, c’est leur neutralité idéologique. Acquise parfois après de longues luttes, cette neutralité exige des bibliothèques qu’elles conservent les documents produits par une société et les rendent accessibles à la consultation, sans censure ni Enfer pour les obscénités, sans filtre contre le mauvais goût ni les bêtises, et même sans exclusion de la littérature haineuse et des discours extrêmes, réactionnaires, anti-scientifiques.

Dans une bonne bibliothèque, on doit trouver la bonne musique autant que la musique « plate ». Mais comment définir ce qu’est de la bonne ou de la mauvaise musique? Les bibliothécaires laissent les auditeurs en décider.  Leur position démocratique dans la diffusion de la connaissance est là: constituer des collections représentatives de la vie sociale, artistique, intellectuelle, avec ses chefs-d’oeuvres et ses niaiseries, ses beautés et ses quétaineries, ses vérités, ses faussetés et ses mensonges. Il a fallu un très long combat avant que les bibliothèques cessent de porter des jugements sur le contenu de ce qu’elles conservaient. Cette « neutralité » me semble être leur plus importante contribution démocratique.

Dans le contexte numérique, il m’apparaît que cette neutralité essentielle est « menacée » (par le droit et l’économie aussi) mais, surtout, quelque peu oubliée. C’est en suivant cette piste de la neutralité que je me retrouverai tantôt sur la scène avec les bibliothécaires DJ de Martin, mais avec une équipe composée un peu différemment de la sienne…

La réédition de pamphlets antisémites de Louis-Ferdinand Céline par les Éditions Huit (Québec, 2012) peut et doit soulever des débats. Ce n’est pas un acte éditorial neutre, loin de là. Dans une telle situation, le rôle des bibliothécaires est de se taire. Comme citoyens, ils ne participent pas au débat dans le cadre de leur profession. Une fois le livre édité, la bibliothèque le conserve et le rendre disponible, sans en faire la promotion, sans l’inclure dans un remix de la littérature raciste non plus. Voici un autre exemple, plus cool. Devenu DJ en résidence, si un bibliothécaire se mettait à publier son Billboard, sa Curation numérique ou son Best of du rock, il risquerait de se retrouver attaqué par les partisans des Beatles et ceux des Rolling Stones! Pas sûr que la direction apprécierait devoir répéter, une fois de plus, que: « les choix et listes de recommandations de nos bibliothécaires ne représentent en aucun cas les préférences de la Bibliothèque… »

La bibliothèque n’est pas un tribunal d’arbitrage de la culture, des idées et de la morale. Le bibliothécaire n’est ni le procureur de la poursuite ni l’avocat de la défense: il fournit la documentation aux deux parties. Il se tient loin de tout procès, et surtout des procès d’intention qui pourraient l’accuser de ceci, de cela.

Deux exemples ne forment pas un échantillon bien convaincant, mais il me semble que transformer les bibliothécaires en DJ les ferait sortir de leur neutralité. Ils quitteraient le silence nécessaire à l’exercice de leur tâche consistant à conserver-décrire la documentation humaine d’une manière rigoureusement « neutre ».

Mais!

Oui, oui, oui!  La bibliothèque doit être remixée, objet de multiples re-classements, de pratiques inédites de « curation », cela ne fait aucun doute. Mais par qui? Qui peuvent être les DJ de ces nouvelles pratiques bibliothéconomiques? Les bibliothécaires ou les citoyens?

Le rôle des bibliothécaires, à mes yeux, est de donner les moyens aux citoyens, aux éditeurs, aux professeurs, aux auteurs, aux créateurs, aux lecteurs et lectrices, aux enfants et aux adultes de venir jouer dans les collections collectives, mises en commun, pour les re-programmer, les re-diffuser.

Un DJ est un éditeur-diffuseur de contenus. Si les bibliothécaires deviennent comme eux, ils deviendront eux aussi des éditeurs et leur production va, nécessairement, entrer alors dans le champ de la critique. Or, à mes yeux, ils ne doivent pas s’aventurer dans cette sphère de la vie sociale. La bibliothèque nourrit l’esprit critique, les bibliothécaires rendent la critique possible, mais ils n’ent sont pas les producteurs. 

Pour rendre possible le remixage social de la bibliothèque, la contribution des bibliothécaires est pourtant essentielle. Comment? Par la création des « informations sur les informations » contenues dans les collections  documentaires déjà conservées et aussi, idéalement, dans toutes celles maintenant à l’extérieur, dans Internet. Ce que les professionnels des bibliothèques doivent remixer, ce sont leurs pratiques, leurs métadonnées: remixer le système Dewey, la classification de la Bibliothèque du Congrès ou encore les vedettes-matières de l’Université Laval, compléter les notices abrégées, achever le dépouillement, enrichir d’une manière encyclopédique et rigoureuse leurs fichiers d’autorités. Le matériel des bibliothécaires devenus DJ, ce sont les notes et les tounes de la bibliothéconomie.
Internet et les moteurs de recherche nous ont montré comment les descriptions des contenus par Dewey et LOC étaient, somme toute, pauvres, inachevées. Ce sont des classifications rigoureuses, standardisées, oui, mais combien limitées et contraignantes! Fermées à la participation-contribution des usagers, conçues dans le cadre taxonomique des savoirs du XIXe siècle occidental (malgré les modifications mineures qu’on leur a apportées), ce sont ces cadres cognitifs que les bibliothécaires doivent brasser, bousculer, ouvrir, faire danser… 
Ce travail de description des productions humaines est (était?) au coeur de la contribution intellectuelle des bibliothèques. Oui, elles peuvent devenir de grands juke-box, des pistes de danses animées par de renversants DJ, mais les bibliothécaires, je les vois dans l’arrière-scène produisant des millions de nouvelles micro métadonnées pour que les DJ vedettes sur la scène publique puissent avoir accès en deux ou trois clics à toute la documentation humaine.

Des bibliothécaires en DJ, je veux bien. Mais DJ de méta-données, de classifications « sauvages », aberrantes, dépoussiérées, enrichies, concepteurs de rayonnages provocants. Les bibliothécaires vont permettre d' »augmenter » la connaissance de la réalité, s’ils augmentent la richesse de leur contribution intellectuelle à la consignation et l’archivage des réalisations humaines.

Mais les DJ ont besoin de piste de danse et de foules de danseurs. Pour les satisfaire, les bibliothèques doivent développer aussi des scénographies, des aménagements, des ressources et des outils technologiques pour rendre cela possible.

Et alors… on lit!

Habitat Yolande Simard – Pierre Perrault

Lieu – maison – bibliothèque: habitat culturel, étagement, ordre et désordre: la vie et la curiosité relient, rassemblent.

Échographie / écographie: écriture et graphie de l’écho des lieux originaires des objets et souvenirs dans leurs lieux d’adoption nouveaux.

Comme dans les emprunts linguistiques, les mots et les expressions continuent d’appartenir à leur langue d’origine (hazard a été emprunté à l’arabe).

Emprunter un objet pour l’apporter chez soi, c’est en partager la signification avec son lieu d’origine.  Comme les dents de narval continuent toujours à appartenir au règne animal, même dans un bungalow urbain. Comme la mosaïque romaine continue à appartenir à Rome, à la cathédrale et à la 2e Guerre, à la vie d’un jeune avocat Canadien-français en visite en Europe…

Dresser une seule liste de tous les objects et artéfacts donnerait un pur chaos; les extraire serait les dé-vitaliser, défaire ce que 50 ans de vie commune a engendré.

Lieu où l’observateur-visiteur se métamorphose en habitant autochtone.

L’hospitalité de YSP comme lieu de cohabitation, augmentée et transformée par la présence de JB: le dialogue devient triple.

De l’entrée à la sortie par la dédicace du premier livre, Portulan de Perrault, à sa femme: Par qui tout commence.

Construction d’un lieu familier et vaste.

Horloge, céramiques, gravures, peintures, vaisselles, photos, livres, meubles, pierres, documents, livres, écrits, non écrits…

Échanges, voyages, sédentaires, chasse, aller-retour, cueillir, chasseur-cueilleur, semeur… Partir revenir, butin, collection, dé-classement, ordre-désordre.

Émigration – immigration

La maison initiatique, entrer et ne plus en re-sortir le même.

Masque, l’épreuve, les maîtres de la connaissance… géo-thèque, strates, navigateur, fleuve…
La transformation: le bouleversement, le choc, la densité de l’expérience humaine, totalité, montée, descendre…

L’émotion de la bibliothèque, de la chaise, du rayonnage Ferron.

La signification du lieu: lire, regrouper, créer, raconter, Furetière, la Flore, Sumer, Michel Serres,

Igloo, hutte, lettré, rustique, végétal, minéral, mots et sémiophores…

Nombre de livres par bibliothèque publique au Canada en 1891

Cette carte est une visualisation de données de l’Atlas historique du Canada. On y trouve aussi toutes les informations pertinentes sur l’origine des données, la méthodologie, etc.

  https://www.google.com/fusiontables/embedviz?viz=MAP&q=select+col2+from+1CvZ2ZvOnkIecFJlvHtqCkGsp7qDQqpJLyR_hhig&h=false&lat=44.25306865928177&lng=-79.00466121562499&z=6&t=1&l=col2

Ce projet de l’Atlas historique du Canada a entrepris de mettre en ligne les données contenues dans l’édition imprimée parue en trois tomes aux Presses de l’Université de Montréal. On y trouve une visualisation et une carte beaucoup plus sophistiquée de ces mêmes données.

On peut faire aussi de multiples sélections. L’utilisation demande des connaissances avancées en histoire et en statistiques. C’est pourquoi une application réalisée avec Google Fusion Tables est sans doute plus accessible aux étudiants des collèges. Il suffit d’importer le fichier Excell que l’on trouve sur le site de l’Atlas.

Ensuite, on utilise la fonction « geocode » de Google, puis Visualize/Map. Il y a quelques paramètres que l’on peut modifier, comme utiliser un icone différent selon le nombre de livres par bibliothèques. On obtient ensuite un lien pour l’intégrer dans un page web. Dans Fusion Tables, la visualisation est synchronisée à la feuille de données, donc on peut être plusieurs à la partager et à voir, en temps réel, l’avancement du travail collectif.

Chronologie des commerces du boulevard Saint-Laurent

Chronologie des Nuits de la Main:

var timeline_config = {font: ‘Merriweather-NewsCycle’,maptype: ‘toner’,source: ‘https://docs.google.com/spreadsheet/pub?key=0AnsH41xIGs6xdEh6VjNuUTFJblFCUFZndWU1bkRuMXc&output=html’}http://veritetimeline.appspot.com/latest/timeline-embed.js https://docs.google.com/spreadsheet/pub?key=0AnsH41xIGs6xdEh6VjNuUTFJblFCUFZndWU1bkRuMXc&output=html https://docs.google.com/spreadsheet/pub?key=0AnsH41xIGs6xdE4zWE16Wk1nNkJEbDhxSEQ0SDZydEE&output=html

De l’imprimé aux données ouvertes

Avec ma formation en lettres, je suis venu lentement à l’univers des données par l’établissement d’un index des noms propres dans les œuvres de l’écrivain Jacques Ferron : 12 000 noms, 1 200 textes. J’ai donc entré les 42 000 occurrences, une à la fois, sur mon premier ordi à écran monochrome (sans souris!) et le logiciel DBASE III+. C’était jusque-là un index ordinaire.
Quand j’ai classé les noms dans 20 catégories et que je les ai liées aux données bibliographiques (date, éditeur, collection), j’ai réalisé que je venais de construire une base de données. Au fil des ans avec des amis, j’ai ajouté des données sur : la correspondance, la critique, les manuscrits, la bibliothèque de Ferron, puis des liens internet, etc. J’ai dû numériser des livres, transférer une bibliographie dans une base de données (je vous passe les détails!), créer des relations entre les différents sous-ensembles de données. Voilà 2-3 ans, j’ai appris que je faisais depuis 15 ans de l’extraction d’entitées nommées! Ça donne le module de « Recherche globale » de l’HyperFerron que vous pouvez consulter ici (l’interface de recherche est bien vieilli).
Le passage des informations imprimées à la base de données numérique m’a permis de consulter autrement l’œuvre de Ferron, de me poser de nouvelles questions, de découvrir de nombreux aspects dont je ne pouvais même pas soupçonner l’existence. Pour moi, les données ouvertes, c’est d’abord ça : la séparation des données de leur support fixe sur papier. Tout devient malléable, ouvert aux échanges, aux tris multiples, à des modes de diffusion et de visualisations variées. Je suis donc venu aux données ouvertes par la pratique.
Peu à peu, j’ai essayé d’utiliser des outils et des plateformes en ligne pour mieux exploiter mes données.
1) 2 000 noms de lieux mentionnés par Ferron : a) enregistrer le fichier de données en csv, b) géocoder (ajouter longitude et latitude); 3) importer dans Google Doc; 4) utiliser le plug-in conçu pour les géolocaliser sur une carte! Avec 1 600 noms, le résultat est un peu long à s’afficher, mais ça marche :
2) places de spectacles du boulevard Saint-Laurent : a) numérisation du répertoire A.-G. Bourasse et J.-M. Larrue b) ocr, Word, base de données, ajout de catégorie c) fichier csv, géocodage, importation dans GoogleFusion Tables
d) plug-in pour créer des fichiers kzm pour l’afficher dans Google Earth.
La transformation des informations imprimées en données numériques transforment complètement la vision et la compréhension que l’on pouvait avoir de ce répertoire. On apprécie encore mieux le travail minutieux des deux historiens.
Pour continuer ce projet? Ajouter aux lieux de spectacles des informations sur les artistes, des photos, des extraits sonores, visuels, des extraits de la presse, de la radio, de la littérature, les commentaires des historiens, et laisser les gens ajouter leur propres souvenirs et documents qu’ils ont sur la Main de Montréal.

Le Titanic et l’iceberg du real time

La visibilité du Titanic dans les médias ces jours-ci me donnerait le goût de pirater le Web… si j’avais les compétences d’un super-méga geek. 

Cela m’a inspiré cette divagation historique sur le thème poétique du jour: le naufrage de l’arrogance technologique dans l’océan incertain du futur!
Depuis hier, aujourd’hui, pour quelques jours encore, la célébrité de l’accident maritime du Titanic fait en sorte que le cours normal de l’actualité est légèrement dévié vers les eaux glacées de l’Atlantique Nord en 1912. Des nouvelles du jour sont maintenant celles des jours vieux de 100 ans parce que des informations  titanisques [sic] sont diffusées puis reprises des centaines, des milliers et des milliers de fois dans les médias sociaux et officiels. 
Une hypothèse qui divague

Si 1 000 faits historiques, 100 000 ou même 1 000 000 de faits anciens étaient ainsi re-diffusés dans le Web avec la même amplitude, fréquence et duplication, avec la même frénésie de remixage et de re-twitts, est-ce qu’on pourrait fléchir, détourner de l’actualité 10, 15, 25% des contenus mis en ligne? À la limite, pourrait-on faire croire un moment à des gens qui ouvrent leur plate-forme d’aggrégation de nouvelles qu’elles ont voyagé dans le temps durant leur sommeil et qu’elles reçoivent maintenant, en avril 2012, des nouvelles vieilles de 100, 200 ans?
De quelle manière serait-il possible de construire, secrètement, un gigantesque iceberg de données historiques? Ce pourrait être une sorte de réincarnation pôlenordesque de Moby Dick, l’agglomération de toutes les données imprimées dans l’ère pré-web. Gavé de krill d’informations oubliées, on le ferait dériver lentement dans le fil des réseaux sociaux, en real time de 2012, pour que le cours de l’actualité soit dévié de sa course, pour qu’il se défile à l’envers, à rebours de sa direction normale.
Orson Welles a fait croire aux New-Yorkais que les extraterrestres les envahissaient. Pourquoi ne pourrait-on pas (nous) faire croire que nous sommes à une autre époque? 
J’imagine des armées de chevaux de Troie installés sur des milliers et des milliers d’appareils numériques, sur des blogues, des comptes Twitter, Flickr, Gmail, Facebook, Youtube, Itunes (imaginons des comptes « amis » préprogrammés, synchronisés et interconnectés, clandestins, pour écouter et visionner telle ou telle oeuvre ancienne!) qui, au moment prévu, diffusent des millions de données historiques.
Un complot pour faire couler le Titanic du real time dans les abysses de l’Histoire
(c’est un élément poétique de la divagation!).
Je perds le Nord, et le présent, c’est sûr. Mais l’idée m’est venue en pensant aux énormes trous noirs qui auraient une force gravitationnelle si grande qu’ils pourraient faire dévier, fléchir le trajet de la lumière. 
Toutes les informations, documents et données anciennes que l’on met aujourd’hui en ligne sont comme des trous noirs au milieu Web. C’est la matière sombre de l’univers numérique. Déposée dans les bases de données du web invisible, hors de la chronologie du Web née à peine voilà 25 ans, la mémoire des sociétés et des cultures passées reste dans les oubliettes. On ne sent pas ni sa présence ni son poids: la dématérialisation numérique a plombé la continuité entre hier et maintenant.

Comment donner aux archives de la mémoire humaine une présence réelle, en real time, pour qu’elle apparaisse autrement qu’à l’occasion de la recherche de quelqu’un dans une base de données, ou lors de la consultation d’un site?

Facebook, Google+ et l’environnement Apple, on ne peut pas y échapper: ils sont toujours et tout le temps là.

Pourtant, si on pense au nombre et à la valeur des énoncés qu’il contient, l’univers total des livres et des imprimés (avant 1990) représente un réseau socio-culturel aussi important que les réseaux actuels. On pourrait discuter de la taille de chacun d’eux, mais celui de la mémoire historique est des milliers de fois plus riche et complexe que ce qu’on peut en voir aujourd’hui dans le Web. 

Comme le fatidique iceberg du Titanic s’était formé par l’accumulation de minuscules cristaux de glace, jusqu’à pouvoir couler le plus gros paquebot de l’époque, pourquoi ne pas concevoir un iceberg de données pour déchirer la surface de l’infini présent et nous montrer que nous voguons au-dessus des fosses, des heurs et malheurs de l’Histoire.
C’était mon petit iceberg à la mer, numérique.
Bon voyage!
Et joyeux naufrage!