samedi 19 novembre 2011

Recherche dans les données des bibliothèques de Montréal

Le 19 novembre 2011 [ à l'occasion du Hackhaton de données ouvertes] , la Ville de Montréal a rendu accessible des données des catalogues de ses 43 bibliothèques. Le fichier contient des informations sur plus de 4,4 millions. En plus des données bibliographiques, certaines données sur les prêts et la circulation des documents devraient être aussi accessibles.

Voici quelques orientations et idées pour exploiter et visualiser ces données.

Tableaux-synthèses de référence à créer pour:

- global pour l'ensemble des bibliothèques : statistiques variés, dynamiques
- bibliothèque: type de doc, catégorie de sujet, etc.
- auteur et éditeur: nombre de titres, prêts
- titres: données globales, par bibliothèque...

Pour l'analyse des pratiques de lecture et culturelles des Montréalais:

1) Prêts des documents (qu'est-ce que les gens ont lu, regardé, écouté)
- total par TYPE de documents (livres, films, musique) et par SUJETS (à partir des mots-clés); outil pour approfondir la recherche par genre de documents par TYPE (romans, documentaires, thriller, etc.), par sous-catégorie de SUJET; par âge ou sexe (si disponible); par succursale

- par DATE (d'édition); par DATE du SUJET ou du TITRE (si disponible: chercher les caractères numériques (ANNÉE) dans le champ SUJET ou TITRE, ex. "1900"

- en valeur absolue; ET en pourcentage, pondéré en fonction du % de type de documents, sujets dans le catalogue globale (ex.: prêt de 40% des films, 25% des livres, 60 des films)

- nombre de prêts par documents uniques, avec une échelle X documents prêtés + de 100 fois, 75 -99 fois, 0 fois; par succursale (pour établir un profil des SUCCURSALES)

- autres possibilités: par LANGUE du documents; origine (Québec - France, autres)

- s'il y a des données sur les ACQUISITIONS: visualiser les acquisions par ANNÉE, TYPE, SUJET, succursale (pour suivre l'évolution de la politique d'acquisition)

2) Nouvelles voies de la recherche sur la documentation  et la visualisation des résultats

Les outils de recherche des bibliothèques sont souvent banals: de longue liste de résultats. Cherchez à inventer de nouveaux modes de visualisations pour la recherche par CONENU et SUJET

- total des documents par TYPE, SUJETS, ANNÉE (absolu/pourcentage pondéré); par succursale

- inventer un mode de navigation dans les SUJETS, sans moteur de recherche, uniquement visuellement, par catégorie et sous-catégorie (voir la visualisation de 3 millions d'articles de Wikipedia avec Sylverlight)

SUR Montréal

- chercher "Montréal" dans tous les champs (environ 32 000 résultats): analyser les SUJETS, et les visualiser dans différents modes: arbre sémantique, hiérarchique, chronologique

- extraires les entités nommées montréalaises (lieux, quartier, personnages historiques, événements, etc.) et les géo-positionnner sur une carte interactive; les positionner dans des chronologies générale et thématiques

Avec l'extraction et la classification des entitées nommées (dans un thésaurus, une ontologie sémantique), les possibilités deviennent extrêmement nombreuses

---
Ces sujets m'intéressent depuis longtemps. Je vous invite à me contacter pour en discuter.

Luc Gauvreau
lgovro@gmail.com




Aucun commentaire:

Enregistrer un commentaire