Les grands sites commerciaux, ceux qui gèrent des millions de documents, d'informations et de documents, comme Ebay, Amazon, Facebook, Youtube, etc, ont développé d'autres systèmes de classement, non-standardisés, plus intuitifs, où les usagers jouent un rôle central dans l'indexation des dizaines de millions documents multimédias qu'ils décrivent. En ce domaine, c'est sans doute l'expérience de Ebay qui est la plus riche et originale. Le site regroupe des millions d'acheteurs et de vendeurs qui font des millions de transaction par jour pour vendre-acheter de tout: livres, bébelles, voitures, maisons (!), billets de spectacle, vêtements, "weird stuff", etc. La variété des choses décrites est absolument phénoménale: elle recoupe tous les produits et choses possibles. Et pourtant, les acheteurs trouvent rapidement ce que des milliers de vendeurs sans aucune formation en bibliothéconomie ou en indexation décrivent spontanément, sans trop rigueur, d'une manières souvent incomplète et même souvent (involontairement) fausse. Et ça marche! Moins rigoureux que ceux des bibliothèque mais plus souple, ce système est très performant parce qu'il évolue tout le temps selon les ressources nouvelles des NTIC. Celui des bibliothèques ne bouge pas, n'évolue pas. Si de nombreuses discussions portent sur la manière d'introduire la folksonomie dans les bibliothèques web 2.0, faut noter que les exemples sont encore rares et plutôt prudents et craintifs.
Mais comment le sytème d'Ebay réussit-il? Il y a deux systèmes d'identification complémentaire: un thésaurus de catégories structuré, hiérarchique et la recherche plein texte dans le titre (par défaut) et/ou dans le texte de la description rédigée par les vendeurs. Ça peut ressembler à un système Dewey, moins détaillé à l'intérieur de chaque grande classe d'objets (par exemple, le classement des livres y est infiniment moins développé quand dans le Dewey bien sûr), mais avec un spectre, un champ d'application plus large, du dé à coudre pour collectionneur aux photos anciennes, du calendrier aux souliers de contrefaçons.
Autre idée: Youtube permet de découvrir et tous les moteurs de recherche commerciaux sont axés sur la découverte: offrir aux clients plus qu'ils en demandent, leur proposer ce qu'ils ne cherchent pas, les faire cliquer plus et plus, ne jamais les mettre devant "pas de résultats": ces sites nous inondent d'informations qu'on ne cherche pas, et ça marche: souvent, on oublie un peu ce qu'on est venu chercher et on clique sur ce qu'on nous propose. D'ailleurs, les gens utilisent très souvent l'expression "T'as pas vu ce que j'ai découvert..." ou "Tu sais pas ce que j'ai trouvé...", mais employée dans le sens de "découvrir", verbe qui exprime l'étonnement, la surprise... En un certain sens, les moteurs de recherche de ces sites sont plutôt des moteurs de découverte plus que de recherche.
Dans les sites des institutions publiques, c'est comme si à l'entrée d'une musée il y avait un portier qui demandait l'air un peu bête: que cherchez-vous? Si vous ne le savez pas, attendez de le trouver avant d'entrer. On sait tous que souvent la première motivation, comme dans une librairie, est la curiosité même l'ignorance: "Je ne sais pas trop, je m'en viens voir ce que vous avez..." Et c'est au musée et à la librairie de concevoir un aménagement qui m'en mette plein la vue. C'est ce que font les sites commerciaux qui, autre paradoxe, ne produisent aucun contenu! Ils ne doivent pas classer ce qu'ils produisent, mais ce que les usagers et les abonnés ajoutent à leur base de données. Ce sont des sites qui investissent rien dans le contenu, ou presque, et tout dans des applications pour rendre facile l'ajout du contenu, sa consultation, son échange, etc.
À l'inverse, les bibliothèques et les institutions nationales investissent tout dans le contenu numérisé et rien ou presque dans les applications pour le consulter, le commenter, l'échanger. La popularité des premiers est-elle que tout le monde les connaît - même ceux les non-branchés ont entendu parler de Ebay, Amazon, Facebook - alors que le contenu des seconds est à peine connu et consulté par le public branché.
"À partir du moment où un enfant sait lire, son esprit, comme les eaux du fleuve Alphée, est mêlé et livré à l'immensité des eaux marines..." (Roger Caillois, Le fleuve Alphée)
Affichage des articles dont le libellé est folksonomie. Afficher tous les articles
Affichage des articles dont le libellé est folksonomie. Afficher tous les articles
vendredi 20 novembre 2009
Après les systèmes Dewey et Congress II
Ça parle donc de
Dewey,
Ebay,
facebook,
folksonomie,
taxonomie
jeudi 22 octobre 2009
Après les systèmes Dewey et Congress I
Le système de classement des livres de Dewey et celui de la Library of Congress jouent deux rôles: classer les livres et les documents par leur contenu dans le cadre d'une description standardisée des savoirs, ET à classer les livres sur les rayons des bibliothèques.
Pourtant, en théorie, les cotes pour décrire les contenus des livres et leur localisation dans les bibliothèques pourraient être distincts. Par exemple, touts les documents ont un «call number», un numéro de système unique qui sert à les identifier dans la base de données, souvent selon leur date d'acquisition. Ce numéro ne décrit aucun contenu et est attribué arbitrairement, automatiquement. On pourrait classer les livres sur les rayons par ce numéro d'identification... mais ce serait un vrai bordel que de chercher dans une telle bibliothèque: les livres seraient sur le plan des contenus dans un désordre absolu.
Le double usage des cotes Dewey et/ou Congress vient du choix, apparemment logique et pratique, qu'on a fait de mettre côte à côte les livres qui ont le même sujet, des contenus similaires. Avoir un seul système pour eux décrire les contenus et localiser les documents, c'est économique pour la gestion des documents et facile à utiliser par les usagers et le personnel.
Curieusement, dans les moteurs de recherche, les usagers cherchent peu avec la cote ou par sujet. Ils cherchent par titre, par auteur, surtout. Les résultats sont surtout classés par ordre alphabétique ou par date, quand il y a la possibilité de trier les documents trouvés selon différents champs. La chronologie et l'ordre alphabétique sont déjà deux autres systèmes de classement différents de Dewey et Congress. Même s'ils en ont la possibilité, les usagers parcourent «rarement» (ce serait à vérifier) les résultats des moteurs de recherche par la cote, alors que c'est la pratique la plus courante dans la bibliothèque elle-même.
Un système de classement unique a de multiples avantages, entre d'autres de permettent la standardisation de la description, l'échange des notices, le pré-catalogage, etc. Cela ne fait pas de doute et qui va proposer d'abandonner ces systèmes? Y aurait-il seulement deux manières de classer les livres, les imprimés et tous les documents produits par l'humanité? Évidemment non. Et la tâche d'inventer un système qui se propose de permettre de tout classer est immensément difficile. Y en a-t-il des meilleurs que d'autres? Certainement. Mais c'est Dewey et Congress qui se sont imposés, comme les thésaurus de mots-clés et des vedettes-matières internationaux qui les complètent.
Parce que la cote officielle classe le contenu intellectuel et sert aussi à ordonner les documents physiques sur les rayons de la bibliothèque, il est obligatoire qu'il y en est une seule. Cette double fonction («immatérielle» et «matérielle») est donc un compromis. Dans répondre à cette double contrainte, il ne peut alors y avoir plus qu'une classification en usage. Intellectuellement, on fait abstraction des multiples contenus dont peut parler un document pour en retenir que quelques-uns, celui jugé le plus important par Dewey ou Congress, du moins tel que définis à l'intérieur de ces deux systèmes. Les mots-clés complètent ce système et permettent d'ajouter à ce contenu principal d'autres sujets, d'autres contenus. C'est possible de le faire, parce que les livres ne sont pas classés sur les rayons en se basant sur les mots-clés. Pour le faire, il faudrait plusieurs exemplaires d'un même document lié à autant de localisation où il serait placé à côté des autres documents avec le même mot-clé. En fait, dans un tel système, il faudrait avoir autant d'exemplaires d'un document que de mots-clés ayant servi à en décrire le contenu. Peu économique pour la bibliothèque! Mais cela pourrait être utile pour l'usager. C'est d'ailleurs ce que les résultats de recherche en ligne permettent. On peut y afficher une liste de documents par mot-clé.
Quand on veut trouver ces ouvrages, au lieu de les trouver côte à côte, on doit se déplacer sur plusieurs rayonnages pour les regrouper tous. Tout ça pour dire que les classements Dewey et Congress sont des systèmes de description des contenus mais qui remplissent un autre rôle beaucoup plus pragmatique, celui de localiser les documents. C'est la contrainte matérielle d'avoir une seule et unique localisation qui empêche fondamentalement qu'il puisse exister plusieurs systèmes pour décrire les documents des collections.
La question demeure pourtant: pourquoi sont-ils les seuls à être utilisés pour classer la bibliothèque? Pour en intégrer un autre dans une bibliothèque réelle avec de vrais livres sur les rayons, il faudrait que ce soit un système qui ne sert qu'à décrire le contenu. On ne peut pas avoir deux cotes différentes pour localiser un document unique! Pour ouvrir la possibilité d'autres systèmes, il faut donc d'abord distinguer le classement des contenus du classement physique du document. C'est ce que montre la prolifération des modules qui permettent d'ajouter des mots-clés personnels (tag) aux documents consultés.
Ce qu'on appelle la "folksonomie" (classement par le "peuple-folk") est en voie de se généraliser. Leur caractère spontané et le peu de document que ces taxonomies décrivent n'en font pas des systèmes de classement proprement dits: ces mots-clés s'ajoutent à ceux attribués par les responsables de l'indexation. En fait, ils identifient le contenu plus qu'ils le classent dans une hiérarchie, dans un thésaurus.
D'ailleurs, c'est une des limites des folksonomies actuelles que de ne pas permettre, semble-t-il, la création de véritable thésaurus pour représenter un réseau de relations sémantiques entre les termes utilisés pour décrire les contenus. Sans hiérarchie et relations sémantiques pas de système, que des «nuages» de mots-clés. Du moins, c'est ainsi qu'on représente parfois ces nouveaux mots-clés.
Pourtant, en théorie, les cotes pour décrire les contenus des livres et leur localisation dans les bibliothèques pourraient être distincts. Par exemple, touts les documents ont un «call number», un numéro de système unique qui sert à les identifier dans la base de données, souvent selon leur date d'acquisition. Ce numéro ne décrit aucun contenu et est attribué arbitrairement, automatiquement. On pourrait classer les livres sur les rayons par ce numéro d'identification... mais ce serait un vrai bordel que de chercher dans une telle bibliothèque: les livres seraient sur le plan des contenus dans un désordre absolu.
Le double usage des cotes Dewey et/ou Congress vient du choix, apparemment logique et pratique, qu'on a fait de mettre côte à côte les livres qui ont le même sujet, des contenus similaires. Avoir un seul système pour eux décrire les contenus et localiser les documents, c'est économique pour la gestion des documents et facile à utiliser par les usagers et le personnel.
Curieusement, dans les moteurs de recherche, les usagers cherchent peu avec la cote ou par sujet. Ils cherchent par titre, par auteur, surtout. Les résultats sont surtout classés par ordre alphabétique ou par date, quand il y a la possibilité de trier les documents trouvés selon différents champs. La chronologie et l'ordre alphabétique sont déjà deux autres systèmes de classement différents de Dewey et Congress. Même s'ils en ont la possibilité, les usagers parcourent «rarement» (ce serait à vérifier) les résultats des moteurs de recherche par la cote, alors que c'est la pratique la plus courante dans la bibliothèque elle-même.
Un système de classement unique a de multiples avantages, entre d'autres de permettent la standardisation de la description, l'échange des notices, le pré-catalogage, etc. Cela ne fait pas de doute et qui va proposer d'abandonner ces systèmes? Y aurait-il seulement deux manières de classer les livres, les imprimés et tous les documents produits par l'humanité? Évidemment non. Et la tâche d'inventer un système qui se propose de permettre de tout classer est immensément difficile. Y en a-t-il des meilleurs que d'autres? Certainement. Mais c'est Dewey et Congress qui se sont imposés, comme les thésaurus de mots-clés et des vedettes-matières internationaux qui les complètent.
Parce que la cote officielle classe le contenu intellectuel et sert aussi à ordonner les documents physiques sur les rayons de la bibliothèque, il est obligatoire qu'il y en est une seule. Cette double fonction («immatérielle» et «matérielle») est donc un compromis. Dans répondre à cette double contrainte, il ne peut alors y avoir plus qu'une classification en usage. Intellectuellement, on fait abstraction des multiples contenus dont peut parler un document pour en retenir que quelques-uns, celui jugé le plus important par Dewey ou Congress, du moins tel que définis à l'intérieur de ces deux systèmes. Les mots-clés complètent ce système et permettent d'ajouter à ce contenu principal d'autres sujets, d'autres contenus. C'est possible de le faire, parce que les livres ne sont pas classés sur les rayons en se basant sur les mots-clés. Pour le faire, il faudrait plusieurs exemplaires d'un même document lié à autant de localisation où il serait placé à côté des autres documents avec le même mot-clé. En fait, dans un tel système, il faudrait avoir autant d'exemplaires d'un document que de mots-clés ayant servi à en décrire le contenu. Peu économique pour la bibliothèque! Mais cela pourrait être utile pour l'usager. C'est d'ailleurs ce que les résultats de recherche en ligne permettent. On peut y afficher une liste de documents par mot-clé.
Quand on veut trouver ces ouvrages, au lieu de les trouver côte à côte, on doit se déplacer sur plusieurs rayonnages pour les regrouper tous. Tout ça pour dire que les classements Dewey et Congress sont des systèmes de description des contenus mais qui remplissent un autre rôle beaucoup plus pragmatique, celui de localiser les documents. C'est la contrainte matérielle d'avoir une seule et unique localisation qui empêche fondamentalement qu'il puisse exister plusieurs systèmes pour décrire les documents des collections.
La question demeure pourtant: pourquoi sont-ils les seuls à être utilisés pour classer la bibliothèque? Pour en intégrer un autre dans une bibliothèque réelle avec de vrais livres sur les rayons, il faudrait que ce soit un système qui ne sert qu'à décrire le contenu. On ne peut pas avoir deux cotes différentes pour localiser un document unique! Pour ouvrir la possibilité d'autres systèmes, il faut donc d'abord distinguer le classement des contenus du classement physique du document. C'est ce que montre la prolifération des modules qui permettent d'ajouter des mots-clés personnels (tag) aux documents consultés.
Ce qu'on appelle la "folksonomie" (classement par le "peuple-folk") est en voie de se généraliser. Leur caractère spontané et le peu de document que ces taxonomies décrivent n'en font pas des systèmes de classement proprement dits: ces mots-clés s'ajoutent à ceux attribués par les responsables de l'indexation. En fait, ils identifient le contenu plus qu'ils le classent dans une hiérarchie, dans un thésaurus.
D'ailleurs, c'est une des limites des folksonomies actuelles que de ne pas permettre, semble-t-il, la création de véritable thésaurus pour représenter un réseau de relations sémantiques entre les termes utilisés pour décrire les contenus. Sans hiérarchie et relations sémantiques pas de système, que des «nuages» de mots-clés. Du moins, c'est ainsi qu'on représente parfois ces nouveaux mots-clés.
Ça parle donc de
Dewey,
folksonomie,
Library of Congress,
taxonomie
Inscription à :
Articles (Atom)