Le jour d`après : où serez-vous

Transcription

Le jour d`après : où serez-vous
Journée d’étude Médiadix : La fin du catalogage ?! (Jeudi 21 Octobre 2004)
Le jour d’après : où serez-vous ?…
(Patrick Leboeuf, Bibliothèque nationale de France)
Le thème de cette journée d’étude est : « La fin du catalogage ? ! », avec une double ponctuation qui
m’interpelle au niveau de mon vécu d’ex-catalogueur. Certes, le point d’interrogation exprime un doute, une
perplexité face à une telle assertion, mais le point d’exclamation peut s’interpréter, selon les uns ou les autres,
comme marquant soit une stupéfaction hébétée, soit un violent désespoir, soit une explosion de joie… Il ne
s’agit pas ici de déterminer si l’annonce de la fin du catalogage serait une bonne ou une mauvaise nouvelle,
mais d’envisager sereinement un tel « scénario-catastrophe », et de chercher une réponse à votre
interrogation sans nul doute angoissée : Y a-t-il une vie après le catalogage ? L’expression « fin du
catalogage » est-elle synonyme de « fin des catalogues » et de « fin des catalogueurs » ? Prenons pour
acquis que dès demain, c’en est fini du catalogage ; le jour d’après, où serez-vous ?
Et tout d’abord, qu’est-ce que c’est que le catalogage ? Que veut-on faire au juste, lorsque l’on catalogue ?
Quelles sont les finalités du catalogage, et en quoi ces finalités pourraient-elles être remises en cause dans
l’avenir ? Une fois que l’on a déterminé ce que l’on voulait faire en cataloguant, comment le fait-on ? Comment
envisage-t-on de le faire demain ? Comment fera-t-on voir les résultats d’une si noble activité (car il est peu
douteux que si nous cataloguons, c’est avec l’intention que nos catalogues soient visibles) ? Enfin si, le jour
d’après, il n’y a plus ni catalogage ni catalogueurs, mais qu’il y a encore des catalogues, qui les fera ? Cette
intervention s’articulera donc autour de 4 questions cruciales :
Qu’est-ce qu’on veut faire ?
Comment le faire ?
Comment le faire voir ?
Qui le fera ?
Qu’est-ce qu’on veut faire ?
Retour vers le futur : FRBR, ou notre image mentale d’un catalogue
Il existe un outil qui nous permet d’expliciter ce que sont les structures sous-jacentes de nos catalogues. Cet
outil est le modèle FRBR, élaboré à partir des normes internationales actuelles mais qui constitue aussi un
moyen d’éclairer le chemin vers les catalogues du futur.
Les FRBR sont un modèle « conceptuel » visant à expliciter la structure de nos catalogues. Ce modèle a été
élaboré selon la méthodologie « entité-relation » par un Groupe d’étude de l’IFLA entre 1992 et 1997, à la
suite d’un séminaire (séminaire de Stockholm) sur les notices bibliographiques tenu en 1990 sous la double
égide de l’IFLA et de la Conférence des directeurs de bibliothèques nationales (CDNL). La principale
motivation d’une telle initiative était le coût des notices bibliographiques : comment le réduire tout en
maintenant la qualité des notices, comment rationaliser les processus de création de notices bibliographiques,
comment justifier scientifiquement qu’une notice bibliographique coûte si cher… Le texte qui décrit le modèle
FRBR (Functional Requirements for Bibliographic Records: Final Report) a été publié en 1998. Il est épuisé
sur papier, mais il est toujours disponible en ligne à l’adresse <http://www.ifla.org/VII/s13/frbr/frbr.pdf>. Une
traduction
en
français
est
également
disponible
sur
le
site
de
la
BnF :
<http://www.bnf.fr/pages/infopro/outibib/FRBR.rtf>. D’après les termes mêmes de l’étude, le modèle FRBR
donne une représentation de « l’essence même de ce sur quoi la notice bibliographique est censée
renseigner, et l’essence même de ce que nous attendons de la notice en termes d’adéquation aux besoins
des utilisateurs. »
À quoi ressemble-t-il, ce modèle FRBR ? Il définit un certain nombre « d’entités » (des choses, des
machins…) qui présentent un intérêt pour nous dans notre conceptualisation implicite du « catalogue idéal ».
Ces entités sont réparties en 3 groupes distincts, dont le premier est sans doute le plus important, parce qu’il
correspond à la description proprement dite des documents, le « pavé ISBD », plus les données locales. Que
décrivons-nous dans un pavé ISBD et dans les données locales ? Intuitivement, nous aurions tendance à
répondre que le pavé ISBD décrit une publication, et les données locales un exemplaire. Mais le pavé ISBD
rend en fait compte de plusieurs « choses » différentes. Le modèle FRBR analyse comme des entités
distinctes ces différentes « choses » que le langage naturel tend à confondre et dont nous avons une
perception brouillée. Par exemple, dans le langage naturel, un mot aussi banal que le mot « livre » peut en fait
renvoyer à des réalités très différentes (ce n’est qu’à des fins de simplification que je prends ici l’exemple du
mot « livre » : le modèle FRBR englobe tout ce qui peut se trouver dans une bibliothèque : musique,
documents cartographiques, estampes, cédéroms…). Quand nous disons « livre », ce que nous avons en tête
peut être un objet spécifique, purement matériel, composé de papier et d’une reliure (et qui peut le cas
échéant faire office de cale sous un pied de table) ; les FRBR appellent cela : un « Item » (définition officielle
dans le texte du Rapport final sur les FRBR : « un exemplaire isolé d’une manifestation »). Quand nous disons
« livre », nous pouvons également penser à une « publication », comme lorsque nous allons chez notre
libraire et que nous lui demandons une publication identifiée par tel ISBN : l’exemplaire spécifique nous
importe peu, du moment qu’il appartient bien à la classe générique voulue et qu’il est bien complet de toutes
ses pages ; les FRBR appellent cela : une « Manifestation » (définition officielle : « la matérialisation de
l’expression d’une œuvre ». Quand nous disons « livre », comme dans : « Qui a écrit ce livre ? », nous
pouvons penser à un texte donné, le contenu intellectuel d’une publication ; les FRBR appellent cela : une
« Expression » (définition officielle : « la réalisation intellectuelle ou artistique d’une œuvre sous la forme d’une
notation alphanumérique, musicale ou chorégraphique, ou sous une forme sonore, visuelle, objectale,
cinétique, etc., ou bien sous l’aspect d’une combinaison de ces formes »). Enfin, quand nous disons « livre »,
nous pouvons avoir en tête un niveau d’abstraction encore plus élevé, le contenu conceptuel qui sous-tend
l’ensemble de ses versions linguistiques, qu’il s’agisse du texte original ou d’une traduction ; la « chose »
qu’un auteur peut reconnaître comme étant sa création propre, même dans une traduction japonaise alors
qu’il ne parle pas un mot de japonais et ne saurait être tenu pour responsable du texte japonais ; les FRBR
appellent cela : une « Œuvre » (définition officielle : « une création intellectuelle ou artistique déterminée »).
Dans nos règles actuelles de catalogage, ces 4 niveaux sont totalement imbriqués les uns dans les autres.
Même si nous pouvons les concevoir intellectuellement, nous ne marquons pas ces distinctions dans une
notice catalographique type. Prenons l’exemple d’une notice bibliographique établie pour une édition bilingue
(texte anglais et traduction française) de Hamlet de Shakespeare. Dans cette notice, les informations relatives
à l’œuvre sont : « Hamlet », « [Texte] », et « Shakespeare » (ces informations sont d’ailleurs aussi valables
pour le texte original anglais, donc une expression, de cette œuvre). Les informations relatives aux deux
expressions présentes dans la publication sont : « William Shakespeare ; trad. de Jean-Michel Déprats,… ;
éd. présentée et annotée par Gisèle Venet,… ; texte établi par Henri Suhamy,… », et « Trad. de : Hamlet ».
Les informations relatives à la manifestation qui matérialise ces deux expressions sont : « [imprimé] », « Éd.
bilingue. – [Paris] : Gallimard, 2004 (18-Saint-Amand-Montrond : Bussière Camedan impr.). – 405 p. : couv. ill.
en coul. ; 18 cm. – (Collection Folio. Théâtre ; 86) », et « Bibliogr. p. 377-380. – ISBN 2-07-030417-5 (br.) :
7,90 EUR ». Enfin, les informations relatives à un item déterminé sont les données locales : « Tolbiac – Rezde-jardin – magasin 2004-140279 ».
Le groupe 2 est celui des « agents » qui sont intervenus sur une instance de l’une quelconque des entités du
Groupe 1. C’est-à-dire : un auteur (Œuvre), un traducteur (Expression), un éditeur commercial (Manifestation),
un relieur (Item)… Ce peut aussi être un propriétaire ou un ancien propriétaire d’une instance de l’entité Item
(d’un exemplaire, quoi).
Le groupe 3 est celui de toutes les entités dont une instance peut être le sujet d’une œuvre. Il reprend donc
les 2 groupes précédents, plus 4 nouvelles entités qui n’existent que dans ce groupe 3 : Concept, Objet,
Événement et Lieu.
Les FRBR constituent-ils vraiment un retour vers le futur… ou bien vers le passé ? Regardons un catalogue
imprimé de la fin du XIXe siècle, établi en 1867-71 par Charles Ammi Cutter (1837-1903), vénéré par les
Anglo-Saxons comme le père fondateur de toute la tradition catalographique moderne. Dans ce catalogue, le
modèle FRBR est, avant la lettre, mis en pratique à la perfectioni : chaque œuvre se décline en ses multiples
expressions, et chaque expression se décline en de multiples manifestations. Seul le niveau « item » n’est pas
représenté ici.
Expliciter notre idéal implicite, c’est bien joli, mais concrètement, qu’est-ce que ça change ? D’abord,
l’apparition des FRBR a été l’occasion de réviser les ISBD. Mais cette révision n’a pas été enthousiasmante ;
elle a cherché à intégrer la terminologie des FRBR dans les ISBD, mais très vite il a fallu renoncer à cette
initiative : elle aboutissait à des incohérences dues au fait que dans les ISBD, même révisés, tous les niveaux
finement analysés par le modèle sont totalement imbriqués les uns dans les autres. Le principe même des
ISBD, c’est que la description d’une manifestation n’est autre que l’extrapolation d’un item à l’ensemble des
items de la manifestation : pars pro toto. Dans ces conditions, comment distinguer entre item et
manifestation ? Comment savoir si l’on parle de l’un ou de l’autre ? Par ailleurs, cette révision des ISBD a
aussi porté sur les éléments de données qui étaient jugés « facultatifs » dans un chapitre du Rapport final sur
les FRBR qui n’en constitue pas la meilleure partie. À côté de cela, ces efforts de révision n’ont absolument
pas visé à « détricoter » les ISBD pour en faire quelque chose de radicalement nouveau, où les 4 entités du
Groupe 1 des FRBR ne seraient plus aussi totalement enchevêtrées. Au total, c’est donc une initiative assez
décevante. Elle est néanmoins à connaître, puisque chaque fois qu’un ISBD est révisé, les modifications se
répercutent sur le système normatif français. Une version révisée de la norme AFNOR Z 44-050 va
notamment paraître dans le courant 2005…
Bien qu’à l’origine le modèle FRBR ait été conçu pour demeurer purement « conceptuel », sans que ses
auteurs aient eu l’idée ou l’intention d’en faire une nouvelle « norme prescriptive », très vite il a été considéré
comme donnant la clé des « catalogues de l’avenir », et des « implémentations » (c’est-à-dire, des
applications pratiques) en ont été proposées. Ce qui séduit dans les FRBR, c’est la possibilité de réduire le
nombre de réponses à une requête portant sur un auteur tel que Shakespeare ou Balzac tout en organisant
ces réponses selon un ordre logique. La plupart des systèmes actuels se contentent d’afficher des centaines
de notices bibliographiques en les triant par défaut sur le titre propre, ce qui n’est pas intellectuellement
satisfaisant et n’apporte pas une grande aide aux utilisateurs de catalogues. Comme exemple de telles
expérimentations, nous citerons simplement aujourd’hui le prototype « FictionFinder » élaboré par une équipe
de recherche d’OCLC.
Le prototype FictionFinder est disponible gratuitement en ligne à l’adresse <http://fictionfinder.oclc.org/>.
FictionFinder permet d’interroger sur les critères suivants : titre, auteur, personnage fictif, lieu imaginaire, lieu
de l’action, catégorie de fiction, résumé, sujet, forme littéraire, forme spéciale (braille, gros caractères…),
ISBN. Une recherche débouche non pas sur une liste de notices bibliographiques, mais sur une liste
d’œuvres. L’affichage d’une notice d’œuvre montre la chaîne auteur-titre (« Work Set Key ») qui a servi à la
reconnaissance automatique de l’œuvre au sein des notices bibliographiques (automatique, donc imparfaite :
les notices correspondant à certaines éditions de Bonjour tristesse mais où la chaîne auteur-titre était un tant
soit peu différente – par exemple, absence de date après le nom de l’auteurii, ou saisie du complément de titre
« roman » dans la même sous-zone que le titre propre – ont été interprétées par le logiciel comme associées
à une œuvre distincte). Au sein d’une notice d’œuvre, on a l’indication du nombre de langues et du nombre
d’éditions dans lesquelles cette œuvre est disponible. Au bas de l’écran, on a la liste de ces langues (avec,
entre parenthèses, le nombre de notices bibliographiques – donc, a priori, d’éditions différentes – dans chaque
langue) ; en cliquant sur un nom de langue, on affiche les descriptions abrégées – titre propre, date d’édition,
nom d’auteur principal – des éditions dans cette langue ; et en cliquant sur une description abrégée, on ouvre
une nouvelle fenêtre dans laquelle s’affiche la description complète de l’édition en question, avec la possibilité
de localiser un exemplaire conservé dans une bibliothèque près de chez soi.
Outre le prototype FictionFinder, qui comme son nom l’indique, ne concerne que la fiction, OCLC a le projet de
« FRBRiser » l’intégralité de son catalogue WorldCat. L’équipe de recherche d’OCLC travaille sur l’hypothèse
suivante, qui ne saurait être tenue pour « contractuelle » de ce à quoi ressemblera WorldCat dans l’avenir.
Une recherche sur un nom d’auteur – par exemple, au hasard, Edna Ferber – pourra déboucher sur une liste
de titres d’œuvres. Ces œuvres pourront être présentées avec une très brève description (auteurs, date de
première édition, typologie, mais aussi nombre de bibliothèques qui ont au moins un exemplaire d’une
manifestation de cette œuvre), puis la liste des « GMD » (« General Material Designation », indication
générale du type de document) et éventuellement des « SMD » (indication spécifique du type de document –
notamment pour les documents audiovisuels : DVD, cassette…) correspondant aux notices bibliographiques
associées à l’œuvre. Le cas échéant, si l’information est pertinente, une liste des langues dans laquelle
l’œuvre est disponible sera également proposée. Dans les « Préférences » de l’utilisateur, il serait possible
d’enregistrer la localisation géographique de l’utilisateur, afin qu’il puisse rapidement vérifier si un exemplaire
est disponible dans une bibliothèque proche de son domicile.
Comment le faire ?
De « Jurassic MARC » à « The XML Files », ou Vers des formats mutants ?
Les formats MARC ont plus de 30 ans. Aux yeux « d’institutions de mémoire » telles que les bibliothèques,
cela semble très jeune. À l’aune de la révolution numérique, c’est déjà très, très vieux. Que leur reproche-t-on
au juste ? De manquer de souplesse dans la gestion des liens – sur le Web, on est habitué à « suivre des
liens » en permanence : peu à peu les utilisateurs auront cette exigence aussi par rapport à nos catalogues – ;
de ne pas permettre d’aller plus loin dans la « granularité » que le niveau de la sous-zone ; de ne pas
permettre de créer autant de zones et de sous-zones que l’on pourrait en éprouver le besoin. Malgré ces
limitations, ou peut-être à cause d’elles, les formats MARC sont jugés excessivement complexes : il faut du
temps pour apprendre à maîtriser un format MARC, avec ses codes abscons composés de chiffres et de
lettres qui donnent un tour souvent ésotérique aux conversations entre catalogueurs (« Qu’est-ce que tu
mettrais dans le 260 ? Je ne sais pas si je dois mettre un $f dans le 295… »). En outre, bien que les formats
MARC aient été créés à l’origine pour faciliter les échanges de notices, on constate qu’il est souvent difficile
de faire dialoguer des formats MARC entre eux : tant que des bibliothèques utilisent le même format MARC
(en l’interprétant bien de la même manière…), elles peuvent effectivement facilement échanger leurs données,
mais dès qu’on a affaire à des formats MARC différents, on peut être amené à perdre de l’information au
moment de l’échange des notices.
On propose souvent de passer du « paradigme MARC » à un « paradigme XML ». Malheureusement, cela ne
peut pas se faire tout seul, et surtout cela coûterait cher – d’où d’énormes résistances. Mais il n’est pas
douteux qu’il faudra bien franchir le pas un jour ou l’autre. Les caractéristiques d’XML sont : de permettre une
gestion extrêmement souple des liens ; de permettre la définition d’autant de niveaux que l’on veut ; de donner
aux balises des intitulés compréhensibles ; et de dissocier entièrement le contenu informatif et la mise en
forme de ce contenu.
BiblioML est un « habillage » XML du très classique format UNIMARC. Il a été élaboré sous l’égide du
Ministère de la Culture en 1999-2000 et il s’accompagne de AuthoritiesML pour les notices d’autorité. Il ne
s’agit nullement d’une remise en cause de la structure du format, ni, en amont, de la structuration de
l’information (ISBD, normes AFNOR). Il ne s’agit que de « représenter » UNIMARC en langage XML.
MODS (pour « Metadata Object Description Schema ») est un schéma XML élaboré par la Bibliothèque du
Congrès en 2002-2003, principalement pour les métadonnées descriptives de ressources électroniques, mais
il peut s’appliquer aussi aux documents plus « traditionnels ». Ce schéma est présenté de façon complète à
l’adresse <http://www.loc.gov/standards/mods/>. Bien qu’il fasse appel à XML, il repose quand même encore
sur une approche « traditionnelle » du catalogue, puisqu’il est dérivé de MARC21. C’est un schéma qui se
veut très simple, quoique délibérément plus complexe que le Dublin Core : il ne comporte que 19 éléments
principaux (qui se subdivisent toutefois en sous-éléments). Il se veut si simple que ses créateurs envisagent
que des non-catalogueurs puissent s’en servir... Un signe avant-coureur de la fin des catalogueurs ?
Dans sa structure, MODS ne fait pas expressément appel aux concepts dégagés par le modèle FRBR ;
toutefois, dans un article de présentation du schéma MODSiii, Sally McCallum propose de mettre en relation
les principaux éléments de MODS avec une entité du Groupe 1 des FRBR : Œuvre : <titeInfo type =
"uniform">,
<name>,
<genre>,
<targetAudience>,
<classification>,
<subject> ;
Expression :
<typeOfResource>, <language>, <abstract>, <tableOfContents> ; Manifestation : <titleInfo>, <originInfo>,
<physicalDescription>, <note>, <identifier>, <relatedItem> ; Item : <location>, <accessCondition>. Cette
répartition, acceptable dans l’ensemble, est néanmoins discutable sur d’infimes points de détail (par exemple,
les « notes » peuvent concerner aussi bien le niveau œuvre ou expression – ou même item, pour le livre
ancien – que le niveau manifestation). Mais le souci de rapprocher des FRBR ce schéma « émergent » est
intéressant à noter en soi.
Comment le faire voir ?
Alien, ou Vers des OPACs dynamiques et tridimensionnels ?
Admettons que l’on ait trouvé des réponses satisfaisantes à nos deux premières questions métaphysiques, et
que nous sachions ce que nous voulons faire et comment le faire. Reste à le rendre visible. Nulle part on n’est
plus dépendant des possibilités technologiques que dans ce domaine-là. Et les possibilités technologiques
bougent très, très vite en ce moment…
L’impression de relief est actuellement un sujet à l’étude. La société Sun Microsystems est en train de
travailler à un projet de présentation tridimensionnelle du « bureau » sur lequel on range, empile, ouvre,
referme
etc.
ses
applications
Windows,
le
« Project
Looking
Glass »
(<http://wwws.sun.com/software/looking_glass/>). Prise isolément, cette innovation technologique n’a en soi
pas grand rapport avec les catalogues de bibliothèques. Mais en la replaçant dans le contexte d’autres
innovations qui voient le jour actuellement, on peut peut-être avoir une petite idée de ce à quoi pourraient
ressembler les catalogues de l’avenir… Des catalogues qui n’obéiraient plus à une logique « linéaire » héritée
des catalogues imprimés et des catalogues sur fiches, mais qui évoqueraient plutôt un espace tridimensionnel
– visualisation d’ailleurs plus en phase avec le modèle FRBR, car, s’il est vrai, comme il a été dit plus haut,
que les catalogues imprimés du XIXe et de la première moitié du XXe siècles semblent déjà se conformer à
l’idéal catalographique exprimé par les FRBR, la notion de relations bibliographiques entre des œuvres qui
font figure de « noyaux » au sein de systèmes concentriques constitués d’expressions, de manifestations et
d’items de ces œuvres, trouverait une formulation plus exacte dans une représentation spatiale de l’univers
bibliographique.
Ces autres innovations technologiques se rencontrent notamment dans les efforts qui sont déployés pour
rendre le Web plus « intelligent ». Des expériences sont menées pour trouver des alternatives aux
présentations
que
nous
connaissons
actuellement
(Google,
Yahoo…).
WebBrain
(<http://www.webbrain.com>), répertoire du Web créé par la société TheBrain.com et disponible depuis mai
2000, propose de mettre l’accent sur les aspects visuels de la recherche sur le Web, et de présenter de
manière dynamique les informations qui sont reliées entre elles.
Dans la partie supérieure de WebBrain, on voit une sorte de toile d’araignée dynamique avec les termes que
l’on estime être en relation les uns avec les autres ; la partie du bas donne la liste des sites Web qui entrent
dans la catégorie sélectionnée au centre de la toile d’araignée de la partie supérieure ; et la partie médiane
permet de relancer une nouvelle recherche.
OCLC s’intéresse à WebBrainiv et voudrait s’en inspirer. Mais il y a déjà un système disponible sur le marché
et qui permet à n’importe quelle bibliothèque de donner à son catalogue un aspect visuel et dynamique très
proche de l’apparence du WebBrain. Il s’agit du système « AquaBrowser » de la société Medialab, implantée
aux Pays-Bas et qui a déjà équipé 400 bibliothèques néerlandaises, notamment la bibliothèque universitaire
de Nyenrode (<http://nyenrode.medialab.nl/), ainsi qu’un réseau de bibliothèques de Singapour
(<http://aqua.elibraryhub.com/>). Plutôt qu’une longue explication, mieux vaut aller voir directement sur ces
sites… Ils sont fascinants.
Le monde des bibliothèques n’est pas le seul à rechercher des interfaces « innovantes, visuelles et
dynamiques » pour ses catalogues. Le Projet SCULPTEUR (projet européen sur la période 2002-2005,
réunissant notamment l’Université de Southampton, le Musée de Cherbourg, le Centre de recherche et de
restauration des Musées de France (C2RMF), le Victoria and Albert Museum, la National Gallery, la Galerie
des Offices, etc.) est en train d’élaborer le « Concept Browser », une interface d’interrogation qui abandonne
complètement la notion même de « zone de saisie de la requête ».
Toutes ces interfaces – WebBrain, AquaBrowser, Concept Browser – ont un air de famille, ce qui est normal
puisqu’elles reposent toutes sur les technologies Java, même si elles les utilisent différemment (avec
WebBrain, on manipule des instances de classes ; avec Concept Browser, on manipule les classes ellesmêmes ; avec AquaBrowser, on manipule des instances de classes mais aussi des termes simplement situés
physiquement à proximité les uns des autres dans les notices). Est-il encore trop tôt pour parler de
« convergence », de « tendance lourde » ? Tous les catalogues de bibliothèques ressembleront-ils à cela
dans 10 ou 20 ans ? On ne peut pas l’affirmer, mais on ne saurait non plus l’exclure.
Qui le fera ?
I, Robot, ou Vers un catalogue qui se fait tout seul ?
Les catalogues de l’avenir vous semblent-ils séduisants ? Avec des interfaces pareilles, avouez quand même
que ce serait dommage de ne plus cataloguer… Mais qui cataloguera, demain ? Dans le fond, on peut dire
qu’aujourd’hui quasiment tout est produit de façon numérique, même les documents « traditionnels » (la
maquette d’un livre est un fichier informatique qui servira à produire tous les exemplaires papier). Ces fichiers
numériques natifs, qu’ils soient ou non destinés à rester numériques ou à produire des documents de type
« traditionnel », peuvent être dotés de « métadonnées » par le producteur lui-même – c’est le but poursuivi
notamment par des initiatives comme ONIX, dont vous a parlé Mr. Dervieu. Ces métadonnées peuvent être
récupérées automatiquement de la structure même du fichier source (une page de titre structurée en XML où
le titre propre, la mention de responsabilité, le nom de l’éditeur et la date d’édition seraient déjà saisies dans
des balises distinctes…) par des machines et converties vers d’autres formats et d’autres systèmes – y
compris les formats et les systèmes des catalogues de bibliothèques. Partant, on peut se demander s’il y aura
encore besoin d’avoir des catalogueurs à terme, s’il s’avérait qu’il « suffit » d’appuyer sur un bouton pour
extraire automatiquement une notice complète à partir de la matrice numérique d’un document ou du site Web
de l’éditeur… Entre MODS qui se veut utilisable par des non-professionnels et la perspective du catalogage
automatique des ressources électroniques et plus généralement de tous les types de documents via leur
version numérique de production, existe-t-il encore un jour d’après pour les catalogueurs ?
En guise de conclusion
Bienvenue à Catalogattaca…
Nous n’en sommes certainement pas à la fin du catalogage – nous en sommes à la fin d’une certaine
conception du catalogage. Cette activité va muter en profondeur, mais elle est plus que jamais d’actualité. Où
aura-t-elle lieu ? Toujours dans les bibliothèques, ou plus en amont, dès la source, dès les métadonnées
créées par le producteur, voire dès le produit lui-même, s’il est savamment structuré ? Peut-être même aussi
en aval ? Ne pourrait-on pas imaginer que les lecteurs pourraient créer leurs propres descriptions des mêmes
documents, en faisant ressortir ce qui, de leur point de vue mais non forcément du nôtre, leur paraîtrait
intéressant à signaler ? Ils pourraient utiliser MODS ou le Dublin Core pour alimenter des… « catablogues »
(le terme existe déjà sur le Web, mais employé dans un sens différent). Debra Shapiro écritv : « Les
bibliothèques ne sont pas les seuls producteurs de métadonnées. Arrêtons de pleurnicher et de nous plaindre
que les autres producteurs de métadonnées n’adhèrent pas à nos normes ! Si les descriptions
bibliographiques sur Amazon sont si mauvaises, comment se fait-il que tant de gens les utilisent et en soient
contents ? Nous sommes les seuls à utiliser MARC, et cela nous isole… » Et les catalogueurs, alors,
qu’auront-ils à faire ? À créer des notices, comme par le passé, ou bien à relire et améliorer des notices
« moissonnées » automatiquement par des robots ? Si le métier de catalogueur existe encore dans l’avenir,
ne consistera-t-il pas à travailler plutôt sur les fichiers d’autorité (qu’on appellera peut-être : fichiers des
instances de classes d’ontologies) que sur le « descriptif » lui-même ? à vérifier la pertinence des liens établis
automatiquement par les machines, et à en créer d’autres dont les machines ne pourraient pas avoir
l’intuition ? à établir des relations qui auraient échappé à la sagacité des machines ?
De toute façon, où qu’il soit créé, quel que soit son mode de production, et quelle que soit son apparence
extérieure, le catalogue demeure un outil indispensable. Le titre de la présente intervention fait évidemment
référence à un film récent. Ce film d’anticipation se déroule en grande partie dans la Bibliothèque publique de
New York – indice de l’actualité des bibliothèques ! – où trouvent refuge des personnages surpris par une
glaciation consécutive aux dérèglements climatiques. Pour se réchauffer, les héros du film décident de brûler
des livres. Mais par quels livres commencer ? Deux personnages se disputent autour d’indices de la
classification Dewey. Un troisième les départage : « Allez plutôt par là-bas, il y a tout un rayonnage de traités
de droit fiscal… » Que l’indexation ait été réalisée par des bibliothécaires ou par des éditeurs ou par d’autres
agents encore, qu’elle soit établie manuellement ou par des machines, il faut nécessairement qu’à un moment
donné il y ait une opération de « catalogage », même si elle est plus ou moins automatisée, même si elle ne
ressemble plus guère au « catalogage » tel que nous l’avons connu, pour que l’utilisateur puisse en fin de
compte retrouver facilement les ouvrages de droit fiscal – fût-ce pour les brûler.
i
Ce rapprochement est tiré d’un cours dispensé par Pierre Gavin,
<http://www.pierregavin.ch/documents/CESID/02-b-Histoire-du-catalogage-futur.ppt>.
et
disponible
à
l’adresse :
ii
À présent que Françoise Sagan est morte, on risque de voir un nouveau doublon de Bonjour tristesse dans
FictionFinder, si la mise à jour des notices d’autorité de Françoise Sagan dans les catalogues des différentes
bibliothèques qui alimentent OCLC ne se répercute pas d’un seul coup dans toutes les notices bibliographiques…
iii
« An introduction to the Metadata Object Description Schema (MODS) », dans : Library Hi Tech, 2004, vol. 22, n° 1, p.
82-88, ISSN 0737-8831.
iv
OCLC.
2004
Information
Format
<http://www.oclc.org/reports/2004format.htm>.
v
Trends:
Content,
not
Containers.
(OCLC
Reports).
Miller, Steven J., & Shapiro, Debra. Top trends in cataloging and metadata. Wisconsin Library Association, Annual
Conference 2003. <http://www.wla.lib.wi.us/conferences/2003/postconf/miller_shapiro_wla2003.ppt>.