mercredi 30 septembre 2009

Exploration des lieux de la mémoire

Que faire à partir de l'inventaire des lieux de la mémoire du Canada français par le CÉLAT? Comment le présenter pour qu'il devienne un publication internet où un assez large public pourrait y découvrir l'histoire, et aussi, que des associations et des organismes OSBL puissent l'exploiter à leur façon, y aménager des parcours?
D'abord, les lieux de mémoire mettent en relation la géographie et l'histoire, l'espace et le temps selon deux espaces-temps. Leur reconnaissance, et donc leur inventaire, s'appuie sur (au moins):
- deux séries de dates: celle de la date où s'est "produit/ ou a commencé" l'événement commémoré (concept de l'Inventaire: "données mémorielles") : mort, bataille, personnages, fondation, découvertes, lieux, etc. Ces dates sont nécessairement différentes: la commémoration, postérieure à "l'événement".

- deux séries de lieux: le lieu de l'événement commémoré et le lieu/site de la commémoration. Dans ce cas, le lieu commémoré et le lieu commémoratif peuvent souvent correspondre (mais pas toujours), le lieu commémoré n'est généralement plus le même suite à toutes les transformations qu'il a subies: on pose souvent une plaque commémorative sur un édifice "moderne", alors que le "lieu de mémoire" n'est pas cet édifice ou tout autre chose qu'un édifice, même si le lieu proprement dit (longitude-latitude) est le même.

vendredi 25 septembre 2009

Wiki, c'est beau, bon, mais est-ce si nouveau que cela le paraît

Nouveau par le mode de rédaction, mais pas entièrement. J'ai déjà trouvé la mention d'un dictionnaire des noms propres de 83 tomes dans un catalogue d'une libraire d'ouvrages anciens. La Somme théologique de saint Thomas aurait été écrite aussi par un groupe de rédacteurs. Émile Littré a écrit son dictionnaire avec un très large réseau de correspondants, Larousse, comme les frères Grimm, rédacteurs d'un dictionnaire allemande de référence, ou le dictionnaires Oxford et son collaborateur fou qui a envoyé le plus de contributions, le Webster, etc.
Donc former un équipe, pour rédiger une encyclopédie ou un dictionnaire, ce n'est pas nouveau...
Ce qui l'est dans Wikipedia, c'est l'absence d'une hiérarchie forte, la réécriture perpétuelle, la présentation des sujets en étendue et en profondeur. Denis Diderot et D'Alember ont dirigé intellectuellement la rédaction de leur Grande Encyclopédie des Sciences et des Lettres. Et personne avait le droit de récrire les articles écrits par eux ou Voltaire!
Wikipedia, c'est aussi une collaboration ouverte, sans fin, produisant un contenu lui aussi presque sans fin.
C'est à ce demander ce que seront devenus certains sujets dans 10 ans, 20 ans: combien de pages pour décrire l'histoire des États-Unis? Ou même seulement l'entrée "Jacques Ferron", que sera-t-elle devenue dans 20 ans?
Faudra-t-il alors faire subir une cure d'amaigrissement à Wikipédia? D'ailleurs, l'idée d'une Wiki Ligth serait peut-être déjà une bonne chose... La WikiJunior vient d'être lancée, je pense.

La nouveauté de Wiki s'est aussi la caractère bénévole des contribution, ce qui est une réussite assez incroyable. Le caractère multilingue aussi, immense réussite.
L'étendue des choses décrites est immense, bien plus que dans n'importe quelle autre encyclopédie, ce qui en fait plutôt un dictionnaire encyclopédique qu'une encyclopédie dans le sens strict du terme: synthèse du savoir, et non définition des mots (dictionnaire) ou description des "choses". En plus, il y a l'extension de Wiki vers une sorte de répertoire, d'index, de glossaire, de manuel d'instruction, de pages jaunes. D'une foule d'autres genres rédactionnels que ceux des ouvrages de connaissances traditionnels. Wipkipedia est une forme hybride, souple. C'est nouveau et, surtout, une forme non fixée, non stable, appelée à changer sans cesse pour s'adapter à ce qu'on sait. Mais ce changement se fait sous la direction d'équipes, de collaborateurs. Ce n'est pas non plus un ouvrage sans règles de rédaction.

Cette rédaction perpétuelle de Wikipedia mène cependant à un paradoxe

Si Wikipédia était perpétuellement mise à jour, on ne pourrait plus savoir ce que l'on ne savait pas avant! Quand on consulte les vieilles encyclopédies, on note immédiatement tout ce qu'on sait maintenant et qu'on ne savait pas avant. Et le contraire: tout ce qu'on savait avant et qu'on ne sait plus: les métiers disparus, par exemple, ou tous les personnages dont peu à peu on ne parle plus...
Wikipédia garde la mémoire des modifications qu'on lui apporte. La mémoire de ces modifications sera-t-elle toujours infaillible, exacte, exhaustive? Dans tous les cas, il serait amusant de pouvoir reculer, d'antidater Wikipédia de quelques années, et aller voir comment elle était développée alors et ce qu'on savait, qu'on savait pas... Que "savait" Wikipedia en 2000? Aujourd'hui, c'est encore si nouveau et si jeune, que la question semble amusante plus que pertinente. Mais en 2023, avoir une "machine à remonter le temps" (une WayBackWiki) pour voir ce qu'était l'état des connaissances et des savoir dans Wikipedia en 2000 sera devenu essentiel.
Ou quels sont les articles ajoutés, nouveaux, entre telle ou telle année?

C'est surtout sur le plan de l'organisation des savoirs qu'elle propose que Wikipédia demeure le plus traditionnel. De ce côté là, pas de nouveauté du tout, semble-t-il. Consulter les articles qui renvoient les uns aux autres, comme dans le portail du Québec, c'est se promener dans une classification des savoirs traditionnelle, consensuelle. (À suivre)

lundi 21 septembre 2009

Bibliographier Internet?

Un problème quasi insoluble en ce moment, c'est d'établir une bibliographie thématique annotée des informations trouvées dans Internet. Plusieurs difficultés:
  1. ajout perpétuel et rapide d'infos
  2. pluralité des "types" de documents dans Internet: en plus de tous les genres de textes connus associés à l'imprimé (articles, livres, lettres, chroniques...) et leur version numérique, il y a tout un ensemble de nouveaux genres: les blogues et leurs commentaires, les "profils de membres", les clips audio, vidéos, tous les types de photos, etc. S'ajoutent à ces variétés non-standardisées le fait que ce soit souvent des genres très courts, bien moins qu'une page, parfois quelques dizaines de mots comme dans les "chats" les séances de clavardage, les textes hyper brefs de la nouvelle patente "Twitter" (140 mots au maximum, je pense). Autre difficulté, une seule page peut contenir toutes sortes de types de documents, comme une page de journal, mais en pire! Dans l'indexation des journaux anciens, on indique parfois la colonne où apparaît le document ou la citation. Dans les périodiques contemporains, avec leur graphisme éclaté, le concept même de colonne est problématique. Dans Internet, en plus, la "publication" du document est elle-même problématique, elle est souvent aléatoire, contextualisée par une requête de l'usager. L'étude de la publicité pourrait être encore plus difficile. On peut localiser une pub dans un imprimé, mais comment localiser un bandeau publicitaire qui apparaît de temps en temps en puisant dans une liste de bandeaux virtuels?
Donc, il y a une première difficulté à décrire le type de document et d'informations, à le localiser physiquement "spatialement", et à le dater. Sur ce plan, l'indexation d'Internet reste vraiment problématique. Pour l'imprimé, même dans le cas d'un imprimé détruit, on pourrait quand même être sûr que le texte X a paru dans le document Y à la date Z, et ce pour toujours! Un poème publiés dans Les fleurs du mal, mentionné dans la table des matières, ne disparaît pas si on perd l'exemplaire du livre. Dans Internet, cela est possible. On risque fort de ne pas retrouver le texte déjà identifié lorsqu'on retourne sur un site, il n'y a peut-être même plus de trace que ce document ait un jour existé. C'est pourquoi Zotero, par exemple, offre la possibilié de conserver des saisis d'écran de tous les sites et pages que l'on ajoute à sa bibliothèque. Au moin, si la pge disparaît, change et supprime les informations qui nous intéressaient, on aura pas l'impression d'avoir rêvé. Comme si l'établissement d'une bibliographie exigeait que l'on conserve aussi un exemplaire de tous les livres mentionnés au cas où ils disparaîtraient! Cela ne fait que montrer l'importance des institutions de conservation traditionnelle, bibliothèques et archives, mais montre aussi la tâche extrêment complexe d'archiver Internet.

Autres difficultés:
  1. Aussi, localiser correctement un document et lui donner une adresse précise est aussi problématique: le document peut changer souvent de place dans un même site, et être reproduit des dizaines de fois, des centaines de fois. Internet, c'est le règne des doublons. Mais tous les catalogues de bibliothèques mis en ensemble demeurent sans doute le plus énorme univers de doublons jamais créé. Les catalogues collectifs sont confrontés à cela: pour un titre, on trouve des centaines de localisation, de doublons. C'est pratique quand on est rendu à l'étape d'aller le consulter à la bibliothèque près de chez soi, mais dans les résultats préliminaires de recherche, cette montagne de doublons doit être surmontée par une sélection des documents-titres "uniques", ce qui oblige à avoir des descriptions les plus standardisées possibles. Trouver les doublons à partir de descriptions dissemblables est chose presque impossible. Les grandes bibliothèques, grâce à leur tradition, arriveront assez bien à résoudre ce problème de doublons, mais comment Google pourrait-il y arriver? Comme Ebay oy Abebooks où se sont des millions d'usagers-clients-abonnés qui créent leurs descriptions personnelles des documents. Les pages complètes, entièrement identiques sont probablement, toute proportion gardée, peu nombreuses, mais les fragments d'informations, eux, doivent atteindre une quantité astronomique. Avec toutes les applications qui se développent, ce sera encore mille fois pire bientôt.
Alors combien d'informations originales? Et que signifie "combien"?

L'autre chose est la nature des résultats de recherche que donne Google, par exemple. Malgré la possibilité de développer un moteur de recherche personnalisé, on recommence toujours à zéro avec Google et les autres moteurs de recherche. Peut-être y a-t-il un moyen "d'écumer", "d'élaguer" peu à peu un premier résultat et d'éliminer tous les résultats non-pertinents pour ne conserver que ceux qu'on choisit pour annoter, mais cela n'est pas facile à réaliser. Le métachercheur Copernic, version pro, paraît offrir la possibilité de gérer les résultats, de les filtrer, etc. Il semble cependant que l'évolution de ce logiciel soit arrêté. Plus personne en parle, et les dernières infos sur leur site date d'un année ou deux
Aussi, on ne peut chercher que quelques mots à la fois (avec les opérateurs booléens, par exemple... Google fixe le maximum à 25, je crois). Pour une recherche le moindrement complexe qui couvrent un domaine de recherche substantiel, un mot à la fois ne mène à rien. Il faudrait pouvoir chercher des listes d'expressions, fusionner les résultats, et les conserver! Puis, travailler à les identifier, les choisir, les annoter avec des mots-clés standards, et surtout rejeter de ce résultat, les pages-références qui ne sont pas pertinentes.

jeudi 17 septembre 2009

Idées à développer 1

Quelques autres applications du Web 2.0 serait-il possible de réunir dans une seule méta-application? Comme un monde parallèle, un territoire parallèle, dans l'idée d'un territoire imaginaire de la culture (Malraux)...
Par exemple, ViaMichelin, une application sur le site des guides Michelin, permet de créer des albums de voyages multimédias, d'inviter des amis, de les publier dans Internet.
Commentaire: en fait, plusieurs applications de ce genre, Mon Musée, Ma Bibliothèque, Mon Michelin, Mon Youtube sont a peu près construits sur le même modèle de réseautage, de contribution, de collaboration, de blogue, etc., mais adapté à un univers culturel particulier: voyage, lecture, musée, musique, etc.
On pourrait imaginer un seule super-application qui donne le choix de créer tel ou tel type d'application personnalisée. Pour une bibliothèque, vocabulaire du livre, de l'édition, base de données thématiques. Michelin permet de chercher dans les infos de ses très nombreux guides et de les ajouter à ses propres voyages. On crée ainsi des circuits-parcours, et sans doute puiser dans la banque d'images que d'autres "amis-voyageurs" ont ajouté.
Comme pour Wikipédia, on peut très bien imaginer une version ViaMichelin pour les voyages fictifs, les livres de récits de voyages fictifs.

L'utilisation des applications du web 2.0 est trop tournée vers les contemporains, les usagers réels. C'est normal parce que les contributeurs-collaborateurs doivent être des usagers actifs. Cependant, les usagers réels d'aujourd'hui pourraient se créer des avatars ou mieux, devenir des sortes de parrains-tuteurs au service de personnages fictifs ou des personnages historiques morts pour recréer leur monde à eux, fictifs ou oubliés.
Pourquoi ne pas créer une sorte de programme "d'adoption virtuelle". Un usager réel d'aujourd'hui adopte-emprunte l'identité d'un être fictif ou mort et travaille à lui donner une réalité numérique.
En ce moment, la dimension participative du web 2.0 encourage un certain narcissisme: on parle de soi, que de soi...

Une observation générale: le transfert numérique de l'imprimé, des archives sonores et visuelles ramène à la "vie", dans l'actualité un quantité immense de documents et d'oeuvres. D'un autre côté, les contemporains d'Internet, surtout les nés-numériques, créent une quantité encore plus grande, plus rapidement de documents de toutes sortes. Facebook contiendrait déjà 5 milliards de photos???

Donc, les productions nées avant l'ère numérique vont représenter une proportionde plus en plus petite dans l'ensemble des documents en ligne. Dans une dizaine d'années, l'univers pré-numérique, même transféré entièrement sur support numérique, va être engloutie, enterrée sous des masses de documents nés numériques. Un contemporain quelconque, né dans l'ère numérique, aura accès à plus d'informations sur lui-même qu'il n'y en aura jamais sur les plus grands personnages de l'histoire pré-numérique.

En ce sens, la numérisation du pré-numérique n'est pas l'équivalent d'une présence, d'une ré-actualisation d'un document ou de la mémoire. Il faut qu'elle s'accompagne d'une entreprise de vivification, d'une re-personnalisation, d'une ré-incarnation en quelque sorte ou, comme le disait Ferron, de "repiquage". Le mot "virtuel", dans son sens propre de "possibilité", est central. La numérisation donne une possibilité d'existence, une possibilité de lecture, mais n'est ni l'existence et ni la lecture.
La situation des informations à l'intérieur d'une base de données est particulièrement intéressante sur ce plan. C'est uniquement la requête-demande d'un usager qui fait advenir l'information, affiche le document, met en action le clip, démarre la diffusion. Sans sa participation directe, il n'y a rien.

mercredi 2 septembre 2009

1960 a(aura) 50 ans

Il n'y a pas d'autres dates-années plus célèbres dans l'histoire du Québec. 1960 est aujourd'hui même plus marquante que 1760 ou 1837...
1960 sert et a servi à tracer une frontière entre un avant et un après que symbolise le fameux "Désormais" de Paul Sauvé. Un partage historique, sociologique, démographique (fin du baby-boom), économique, national, politique, littéraire, culturel... En fait, l'histoire de tous les domaines de la vie québécoise est traversée par 1960, comme 1789 pour la France. Au Québec, à côté de 1960, 1968 a d'l'air d'un phénomène de surface ou d'une crise d'adolescence.

Mais 1960 est surtout un discours, littéralement un mythe (mythos).

Autant pour ceux qui y voit le début lyrique de la Révolution tranquille que pour ceux qui contestent cette périodisation en insistant sur les signes avant-coureurs et sur la continuité de certaines réalités bien au-delà de 1960. Peu importe ces divergences interprétatives, cette année-là reste un jalon incontournable. La bibliographie des titres d'articles et de livres dans lesquels apparaît cette date serait gigantesque.

Si 1960 est connu, c'est d'abord par le discours et le sens qu'on lui a donné, bien plus que par la mémoire de ce qui s'est passé et réellement vécu cette fameuse année. Il y a bien la mort de Duplessis, en 1959, le bref règne de Sauvé, mais pour le reste, de quoi se souvient-on de 1960?

Autre chose. Il y a un discours dominant sur 1960, une idéologie dominante, des souvenirs dominants sur 1960: ce sont ceux du groupe qui l'a d'abord amorcée, mais surtout ceux du groupe qui a réalisé la Révolution tranquille, avant d'en profiter, comme disent plusieurs aujourd'hui.

Que savons-nous des perceptions qu'ont eu de 1960 les gens qui cette année-là avaient 75 ans, 65 ans, 50 ans, 40, 30 ans... Ceux qui ont eu 20 ans en 1960, on risque fort de la connaître. Si nous prenions la pyramide d'âge en 1960, nous verrions peut-être que nous avons surtout la vision d'une minorité, appelée à devenir une majorité, mais qui ne l'était pas encore. Ainsi, le souvenir, l'interprétation et la signification qu'a eu 1960 pour la majorité de la population nous seraient inconnues ou presque.

Si on ajoute à cela comment ces changements ont modifié les rapports entre les groupes socaiux (les classes!), on verrrait qu'il y a des groupes qui ont eu très peu de voix au chapitre ou que leur voix est maintenant oubliée. On connaît par coeur le discours anti-clérical de cette période; que savons-nous de l'expérience qu'ont vécu, pour prendre l'exemple correspondant, les membres des communautés religieuses?

Même chose pour 1968, en un certain sens, ce qu'on connaît surtout c'est la parole de la jeunesse révoltée, mais que savons-nous réellement du "vécu parental" pendant le conflit des générations? On en sait ce que leurs enfants en ont dit. Comme objectivité faudrait trouver mieux.
Le lyrisme de cette génération, c'est un peu cela. Mais un lyrisme peut-il être encore lyrique quand il devient dominant? Lyrisme dominant, cela fait un bel ozymoron dont on pourrait attribuer la paternité anachronique à François Ricard.

Donc 1960 aura 50 ans...

Les objectifs de ce projet seraient de regrouper en un seul site Internet l'ensemble, la totalité des archives (qui ont été conservées!) sur cette année 1960: tous les imprimés (livres, périodiques...), toutes les émisions de radio, toutes les émissions de télévision, tous les films, toute la musique, tous les spectacles, toutes les pièces de théâtre, toutes les correspondances, tous les documents de la vie économique, toutes les statistiques, etc. À quoi, il faudrait ajouter les archives privées de tous les volontaires qui accepteraient de les mettre en ligne. Aussi, on y ajouterait ce qui est trouvable dans les archives étrangères et qui ont parlé du Québec. C'est-à-dire l'utopique projet d'une archive totale d'une année.

La totalité est utopique, parce qu'il manque au départ tout ce qui n'a pas été conservé. Alors l'utopie serait de ne pas pouvoir même réunir ce qui a été conservé. Est-ce une question de la taille des archives envisagées? Non, il y a déjà des bases de données qui contiennent plus d'informations et de documents que pourrait en contenir ceux de 1960. Google, Youtube, Flickr, Facebook et d'autres sites qui gèrent et mettent en ligne une quantité astronomique de documents consultés par plus d'usagers par jour qu'il y a d'habitants au Québec et même au Canada! Ce n'est pas une utopie technologique. Financière? Ça pourrait coûter cher, disons 100 millions (et là j'exagère), soit 1 km de métro! Pour .2 ou .3 km de métro, on aurait un projet pas mal bien parti...

Donc, une sorte d'archives quelque peu imaginaires parce qu'une grande partie de ce corpus n'était certainement pas connue au Québec en 1960. Aussi, encore, la totalité des références à l'année 1960 dans la culture et littérature québécoise, une sorte de "1960 à travers les âges". Plus, encore et encore, la cueillette des archives audio-visuelles des souvenirs de 1960 par ceux qui l'ont vécu directement, et ceux qui en ont entendu parlé. Par exemple, on peut penser à programme d'interviews de personnes nées après 1960 et leur demander ce qu'ils savent de 1960 et non seulement ce qu'ils en pensent.

En fait, il s'agit un peu de donner à 1960 une "second life".

Impossible, voyons voir...

Archives de Radio-Canada et de CBC: la totalité de 1960
BAnQ: la totalité de l'imprimé de 1960 (en collaboration avec La Presse, Le Devoir, etc...)
Autres archives de l'imprimé: Google -Livre, BNF, BAC, etc...
Cinémathèque et ONF: tous les films
Youtube: Québec - 1960
Musique: sites de musique en ligne, Itune, numérisation du corpus québécois
Web: inventaire, répertoire complet de "1960 - Québec"