samedi 19 novembre 2011

Données ouvertes SUR Montréal

Il y a des centaines de milliers, des millions de données et d'informations SUR Montréal en plus de celles que possèdent la Ville.
Voici quelques autres source de données publiques ou utilisables:

- Geoliqi a créé une application pour localiser tous les lieux dans les articles de Wikipédia

C'est fait à partir de l'API d'Infochimps pour géolocaliser toutes les données géographiques contenus dans les articles de Wikipedia

- concevoir une application qui lie ces données aux catalogue des bibliothèques de la Ville (ou d'autres base de données pour lier les articles de Wikipedia à la documentation pour les géo-positionner sur une carte interactive. En cliquant sur Place Ville-Marie, Outremont, rue Saint-Laurent... on pourrait obtenir la documentation sur ce lieu. Même application avec une timeline montréalaise: lier la documentation aux et aux événements...

Le Dictionnaire biographique du Canada contient des infos sur des milliers de Montréal

- Internet Archives permet de télécharger facilement la totalité des données bibliographiques des documents qui contiennent "Montréal" (en fichier csv)

- Google Books: l'API devrait rendre possible l'exploitation des documents liés à Montréal

Commission de toponymie du Québec (Topos): chercher tous les toponymes montréalais et créer des applications ou une carte interactive en affichant la notice sur l'histoire du lieu; ajouter des fonctionnalités Web 2.) pour que les citoyens puissent ajouter leur propre souvenirs ou documents sur les lieux montréalais.

Inventaire des lieux de mémoie de la Nouvelle-France: extraire tous les lieux commémoratifs de l'île de Montréal, les géo-positionner

Liste à poursuivre

-

Recherche dans les données des bibliothèques de Montréal

Le 19 novembre 2011 [ à l'occasion du Hackhaton de données ouvertes] , la Ville de Montréal a rendu accessible des données des catalogues de ses 43 bibliothèques. Le fichier contient des informations sur plus de 4,4 millions. En plus des données bibliographiques, certaines données sur les prêts et la circulation des documents devraient être aussi accessibles.

Voici quelques orientations et idées pour exploiter et visualiser ces données.

Tableaux-synthèses de référence à créer pour:

- global pour l'ensemble des bibliothèques : statistiques variés, dynamiques
- bibliothèque: type de doc, catégorie de sujet, etc.
- auteur et éditeur: nombre de titres, prêts
- titres: données globales, par bibliothèque...

Pour l'analyse des pratiques de lecture et culturelles des Montréalais:

1) Prêts des documents (qu'est-ce que les gens ont lu, regardé, écouté)
- total par TYPE de documents (livres, films, musique) et par SUJETS (à partir des mots-clés); outil pour approfondir la recherche par genre de documents par TYPE (romans, documentaires, thriller, etc.), par sous-catégorie de SUJET; par âge ou sexe (si disponible); par succursale

- par DATE (d'édition); par DATE du SUJET ou du TITRE (si disponible: chercher les caractères numériques (ANNÉE) dans le champ SUJET ou TITRE, ex. "1900"

- en valeur absolue; ET en pourcentage, pondéré en fonction du % de type de documents, sujets dans le catalogue globale (ex.: prêt de 40% des films, 25% des livres, 60 des films)

- nombre de prêts par documents uniques, avec une échelle X documents prêtés + de 100 fois, 75 -99 fois, 0 fois; par succursale (pour établir un profil des SUCCURSALES)

- autres possibilités: par LANGUE du documents; origine (Québec - France, autres)

- s'il y a des données sur les ACQUISITIONS: visualiser les acquisions par ANNÉE, TYPE, SUJET, succursale (pour suivre l'évolution de la politique d'acquisition)

2) Nouvelles voies de la recherche sur la documentation  et la visualisation des résultats

Les outils de recherche des bibliothèques sont souvent banals: de longue liste de résultats. Cherchez à inventer de nouveaux modes de visualisations pour la recherche par CONENU et SUJET

- total des documents par TYPE, SUJETS, ANNÉE (absolu/pourcentage pondéré); par succursale

- inventer un mode de navigation dans les SUJETS, sans moteur de recherche, uniquement visuellement, par catégorie et sous-catégorie (voir la visualisation de 3 millions d'articles de Wikipedia avec Sylverlight)

SUR Montréal

- chercher "Montréal" dans tous les champs (environ 32 000 résultats): analyser les SUJETS, et les visualiser dans différents modes: arbre sémantique, hiérarchique, chronologique

- extraires les entités nommées montréalaises (lieux, quartier, personnages historiques, événements, etc.) et les géo-positionnner sur une carte interactive; les positionner dans des chronologies générale et thématiques

Avec l'extraction et la classification des entitées nommées (dans un thésaurus, une ontologie sémantique), les possibilités deviennent extrêmement nombreuses

---
Ces sujets m'intéressent depuis longtemps. Je vous invite à me contacter pour en discuter.

Luc Gauvreau
lgovro@gmail.com




jeudi 17 novembre 2011

Une Grande Bibliothèque ouverte pour et SUR Montréal

Dans le mouvement des données ouvertes, celui des villes et des gouvernement ouverts, les informations historiques ou culturelles, contenues dans les archives de l'imprimé et les bibliothèques font souvent l'objet de peu de discussion. Les applications pratiques pour répondre aux citoyens en "real time" semblent être les plus développées, susciter le plus grand intérêt. Pourtant, les administrations municipales ne sont pas que des infrastructures matérielles, mais aussi des lieux de culture. Les bibliothèques, musées, festivals, théâtres, cinémas, parcs et jardins font aussi partie des services essentiels qu'une ville doit offrir à ses citoyens. Il faut donc aussi ouvrir les données et les informations des institutions culturelles pour que Montréal devienne une vraie ville ouverte.

Dans ce domaine, ce sont les programmes de numérisation dont on parle le plus, ou des projets en arts numériques. En ce moment, il y a des centaines de milliers pages et d'images, sans doute quelques millions, déjà en ligne, reliées à Montréal et son histoire. Cette documentation est-elle pour autant vraiment accessible, diffusée, lue?

Les ressources de données et d'informations contenues dans ces millions pages sont généralements peu consultées, sous utilisées par rapport aux multiples usages que l'ont peut en faire aujourd'hui. Les sites institutionnels dans lesquels on les consulte sont rarement autre chose qu'un entrepôt de fichiers pdf ou jpg que l'on trouve à partir d'un catalogue en ligne élémentaire, avec peu ou pas de fonctionnalités du Web 2.0. Comme si après la numérisation, il ne restait plus rien à faire. Au contraire, le vrai travail de recherche et d'innovation ne fait que commencer. On doit plutôt considérer cela comme un nouveau territoire de données à exploiter. Cela exige d'en refaire l'inventaire, l'indexation, la classification avec les outils d'extraction, d'analyse et de visualisation que nous possédons aujourd'hui.

Heureusement, il y a parfois de belle initiative. Samedi, le 19 novembre, au Hackhaton, la Ville de Montréal va ouvrir le catalogue de ses 43 bibliothèques, ainsi que des données sur la circulation des documents. C'est une excellente nouvelle! Pour étudier les pratiques culturelle des Montréalais, pour créer toutes sortes de visualisations des collections, pour intégrer les activités des abonnés dans leurs réseaux sociaux, pour explorer la documentation sur Montréal de mille façons, c'est vraiment une très stimulante initiative. C'est une porte ouverte sur d'autres manières de concevoir l'accessibilité aux bibliothèques.

En ce moment, les documents et les informations SUR Montréal sont dispersés dans plusieurs institutions: archives et services de la Ville, bibliothèques nationales (Québec, Canada), bases de données gouvernementales, centres d'archives, sociétés d'histoires, musées (McCord), etc. Avec l'ouverture des données et l'interopérabilité croissant des systèmes de gestion des bibliothèques, les millions de pages "montréalaises" déjà numérisées par Google Books, BAnQ, Internet Archives, Notre mémoire en ligne, il est maintenant possible de regrouper toute cette documentation dans une seule base de données. Tous les documents, données et informations du domaine public pourraient être accessibles à travers un API pour créer la Grande Bibliothèque Ouverte Numérique de Montréal. On peut aussi imaginer de nouvelles bibliothèques pour réunir "virtuellement" toute l'information disponible par arrondissement, quartier, lieu, événement.

- participation de BAnQ au mouvement de l'Open bibliographic data: libre accès aux données et au fichier autorité
- partage de la documentation (données et fichiers numérisés) sur Montréal avec la Ville, d'autres institutions, les citoyens
- s'associer à la communauté de développeurs pour accroitre la diffusion de la culture québécoise et de l'information sur Montréal
- initier un large débat sur l'utilisation des oeuvres et des documents du domaine public, par le milieu scolaire, les éditeurs, les développeurs, les citoyens
- accueillir un prochain Hackhaton dans le grand hall de la Bibliothèque pour inventer de nouvelles façons de lire, d'écouter, d'organiser l'information historique et culturelle SUR Montréal.

Les élections ont lieu du 22 au 27 novembre 2011, en ligne, sur le site de BAnQ. Pour plus d'informations et voter, visiter le site internet:

Je vous remercie de votre appui,

Luc Gauvreau
-

lundi 14 novembre 2011

Élection au CA de BANQ

J'ai posé ma candidature pour représenter les usagers de l'île de Montréal au conseil d'administration de Bibliothèque et Archives nationales du Québec. Quinze autres personnes ont posé leur candidature...

J'aimerais compter sur votre appui.

Amateur de livres et de bibliothèques depuis l’école primaire, j’aimerais mettre mon expérience aux services des abonnés montréalais de BAnQ pour en faire une institution encore plus accessible, mieux branchée sur les ressources du numérique. Depuis plus de 20 ans, j’ai utilisé tous les services des bibliothèques, des microfilms aux bases de données, et j’ai consulté toutes les collections, des cartes postales aux archives privées. Je m’intéresse maintenant aux mutations de l’écrit et de l’imprimé vers le numérique.

Pour lire la suite de ma présentation, je vous invite à la consulter sur le site de BAnQ.

Pour avoir le droit de vote, il faut: habiter sur l'île de Montréal, avoir
18 ans et plus, être abonné à BAnQ.

Le scrutin électronique aura lieu du 22 novembre à 10 h au 27 novembre à 17 h.

Merci de faire circuler cette information parmi vos amis, vos réseaux sociaux, vos contacts.

Je vous remercie de votre soutien,

Luc Gauvreau

jeudi 10 novembre 2011

Le Montréalscope (version complète)

Au Web In 2011 consacré au Web du futur, organisé par l'Alliance numérique, tous les conférenciers avaient 10 minutes pour exposer leurs projets et leurs idées: c'est pas long! Mais cela a donné un rythme stimulant à la journée.
Pour voir et lire ma présentation complète du Montréalscope, il m'aurait bien fallu 20 ou même 30 minutes. Vous pouvez juger par vous-même.
Pour lire mes commentaires, cliquer sur la roulette des options et Afficher les commentaires. L'affichage plein écran est meilleure.
C'est un projet in progress, comme on dit. Tous les commentaires sont bienvenus. Merci!


mardi 1 novembre 2011

Le Montréalscope: histoire données au futur

Au Web In 2011, organisé par Alliance numérique, j'ai présenté une proposition pour organiser et observer la totalité des informations sur Montréal et son histoire:

Le projet du Montréalscope propose d'ouvrir un chantier numérique pour construire le premier territoire virtuel urbain, l'espace structuré de la totalité des données de l'histoire et du présent de la ville. C'est une plateforme pour inventer un nouveau Grand Montréal, une hyper-réalité augmentée, un lieu d'échange commun d'exploration, de découvertes, d'aventures culturelles et technologiques.
Les bibliothèques conservent les données de millions de textes. La numérisation des imprimés ouvre les livres et rend possible l'extraction des informations qu'ils contiennent.
Le défi est aujourd'hui d'entreprendre un séquençage des écrits humains pour lier les données publiées dans l'imprimé aux « Big Data » diffusées en temps réel dans le Web et les réseaux sociaux. (Présenté par Luc Gauvreau; conception visuelle: Irène Ellenberger)


La semaine prochaine, toutes les conférences devraient être en ligne dans le site du Web In.