1ère partie

Transcription

1ère partie
Les nouvelles consignes
de catalogage
dans le SUDOC
Web de données, FRBR, RDA
04 mars 2014
Marie-Hélène Henry
Service commun de documentation
Agnès Macquin
1
Plan de l’intervention
Contexte et problématique
Le web de données
Les enjeux
Que fait l’ABES ?
Le modèle FRBR
Les nouvelles consignes de catalogage dans le
SUDOC
2
Service commun de documentation
Contexte et problématique
Ou pourquoi vouloir tout changer
quand tout allait si bien ?
On a notre ISBD …
… nos règles de catalogage …
… notre format MARC …
… notre SIGB …
… notre OPAC sur Internet
What is the problem ?
3
Service commun de documentation
Contexte et problématique
Ou pourquoi vouloir tout changer
quand tout allait si bien ?
La recherche d’information aujourd’hui
4
Service commun de documentation
Contexte et problématique
Ou pourquoi vouloir tout changer
quand tout allait si bien ?
5
Service commun de documentation
Contexte et problématique
Ou pourquoi vouloir tout changer
quand tout allait si bien ?
Où sont les bibliothèques ?
6
Service commun de documentation
Contexte et problématique
Ou pourquoi vouloir tout changer
quand tout allait si bien ?
7
Service commun de documentation
Contexte et problématique
Ou pourquoi vouloir tout changer
quand tout allait si bien ?
Ce qu’on propose aujourd’hui
8
Service commun de documentation
Contexte et problématique
Ou pourquoi vouloir tout changer
quand tout allait si bien ?
Conclusions…
La recherche d’information, aujourd’hui, pour beaucoup de gens,
c’est le Web…
Il faut donc s’adapter à de nouvelles pratiques
Le « syndrome Google »
On n’a plus l’habitude de chercher par index
On utilise des clés de recherche simples …
… à affiner au besoin avec des facettes
Les recherches par mots dans nos catalogues
ramènent trop de réponses …
… classées de manière plus ou moins anarchique
Les catalogues doivent évoluer pour mieux cibler.
9
Service commun de documentation
Contexte et problématique
Ou pourquoi vouloir tout changer
quand tout allait si bien ?
Or :
Le Web ne parle pas MARC
Le Web a ses propres normes
Le Web ne fréquente pas les fournisseurs de SIGB
Le Web concerne tout le monde
Le Web suit son évolution propre…
vers le Web sémantique (ou web de
données)
10
Service commun de documentation
Le web de données
Mais qu’est-ce que c’est à la fin ?!
Web sémantique ou web de données ?
Web sémantique
un ensemble de technologies et de standards
développés par le W3C pour construire le Web de
données
Web de données
une extension du Web permettant de relier non pas
des documents (pages HTML) mais les données
elles-mêmes,
et de les rendre exploitables par des machines.
11
Service commun de documentation
Le web de données
Mais qu’est-ce que c’est à la fin ?!
Le Web gère
Le Web sémantique gère
des documents
des « choses »
.htm, .html
personnes
.pdf
lieux
.xml
événements
.mp3
musique
films
organisations….
12
Service commun de documentation
Le web de données
Mais qu’est-ce que c’est à la fin ?!
13
Service commun de documentation
Le web de données
Mais qu’est-ce que c’est à la fin ?!
Or :
• les données sont cachées sous les pages HTML, ou dans tout
autre document (web profond ou invisible, non repérable par
les robots des moteurs de recherche)
• Seules les pages HTML sont liées entre elles, et non pas les
données
• Les pages HTML sont faites pour les humains
Ce que veulent les machines, ce sont :
• des données brutes
• et des données liées
– car elles se complètent les unes les autres
– car les liens permettent de naviguer et de découvrir
• Et des liens qualifiés, signifiants
–au-delà du « voir aussi » des hyperliens
14
Service commun de documentation
Le web de données
Mais qu’est-ce que c’est à la fin ?!
15
Service commun de documentation
Le web de données
Comment ça marche ?
Resource Description Framework (RDF)
Proposé en 1999 par le W3C
= la grammaire ou syntaxe avec laquelle on décrit,
représente et relie des données à échanger sur le Web.
Le principe de base : toute chose peut être décrite avec des
phrases minimales composées d’un sujet, d’un verbe et
d’un complément
(= déclaration RDF)
En traduction RDF
Le sujet = la ressource
Le verbe = le prédicat
Le complément = l’objet
16
Service commun de documentation
Le web de données
Comment ça marche ?
Exemple
Darwin a écrit « L’origine des espèces »
Sujet : Charles Darwin
Verbe : a écrit
Complément : « L’origine des espèces »
Sujet
Prédicat
Objet
Les 3 éléments sujet – prédicat – objet
constituent un TRIPLET
17
Service commun de documentation
Le web de données
Comment ça marche ?
RDF : une syntaxe
sujet
objet
prédicat
Service commun de documentation
Le SUJET est
toujours une URI.
Le PRÉDICAT est
toujours une URI.
Toute « chose » sur
laquelle on veut faire
des assertions (SUJET)
doit avoir une URI.
Les « choses » ont
toujours un type :
une CLASSE.
Il permet d’exprimer
les PROPRIÉTÉS des
« choses », ou
les RELATIONS des
« choses » entre elles.
L’OBJET peut être
un texte (LITTÉRAL)
ou une URI.
Les CLASSES et les PROPRIÉTÉS
sont déclarées dans des
VOCABULAIRES (ou
« ONTOLOGIES »)
pour être réutilisées.
18
Le web de données
Comment ça marche ?
URI/URL : petit rappel
URI (Uniform Resource Identifier)
= Chaîne de caractères normalisée, unique et univoque,
permettant d'identifier de manière permanente une ressource
abstraite ou physique, accessible ou non sur Internet (personne,
organisme, lieu, évènement, concept, …)
3 déclinaisons
URC (Uniform Resource Characteristic) : caractéristiques
d’une ressource
URN (Uniform Resource Name) : nom d’une ressource
URL (Uniform Resource Locator) : spécification de
l'adresse physique de localisation d'une ressource sur
Internet et de la méthode permettant d'y accéder
19
Service commun de documentation
Le web de données
Comment ça marche ?
Traduction en RDF
Pour un humain :
Sujet : « L’origine des espèces »
Verbe : a pour auteur
Complément : Charles Darwin
Sujet
Prédicat
Objet
Pour un logiciel de bibliothèque :
Sujet : PPN 021050384 (par ex.)
Sujet
(titre contenu dans le 200$a)
Verbe : 700 #1$3026812304$4070
Complément : $3026812304
Prédicat
Objet
(PPN 026812304 = autorité de Charles Darwin)
Pour n’importe quelle machine :
Sujet : http://www.sudoc.fr/021050384/id
Verbe :http://id.loc.gov/vocabulary/relators/aut
Sujet
Prédicat
(ou marcrel:aut)
Complément : http://www.idref.fr/026812304/id Objet
(et pour le titre : dc:title « L’origine… »)
Service commun de documentation
20
Cette publication
a pour titre propre
"L’origine des espèces…"
http://catalogue.bnf.fr/ark:/12148/cb413764782
http://rdvocab.info/Elements/titleProper
des espèces…"
ça"L’origine
marche
pour les
Le web de données
Comment
bibliothèques?
http://catalogue.bnf.fr/ark:/12148/cb413764782
Cette publication
matérialise l’Expression
Darwin, Charles. On the origin
RDAof species…
Français (Becquemont)
http://iflastandards.info/ns/fr/frbr/frbrer/P2004
http://catalogue.bnf.fr/ark:/12148/cb413764782#frbr
:Expression
Cette Expression
a pour forme de contenu
Texte
http://catalogue.bnf.fr/ark:/12148/cb413764782#frbr
:Expression
http://rdvocab.info/Elements/contentType
http://rdvocab.info/termList/RDAContentType/1020
Cette Expression
réalise l’Œuvre
Darwin, Charles. On the origin of species…
http://catalogue.bnf.fr/ark:/12148/cb413764782#frbr
:Expression
http://iflastandards.info/ns/fr/frbr/frbrer/P2002
http://catalogue.bnf.fr/ark:/12148/cb122870840
Cette Œuvre
a pour titre
"On the origin of species…"
http://catalogue.bnf.fr/ark:/12148/cb122870840
http://rdvocab.info/Elements/titleOfTheWork
Cette Œuvre
a pour auteur
Darwin,
Charles (1809-1882)
Service commun de documentation
http://catalogue.bnf.fr/ark:/12148/cb122870840
http://rdvocab.info/roles/author
21
http://catalogue.bnf.fr/ark:/12148/cb11898689q
"On the origin of species…"
Le web de données
Comment ça marche?
Notice SUDOC en RDF
Pour nommer les ressources, il faut rajouter,
devant, un identifiant local qui sera pérenne
Ex : http://www.sudoc.fr/021050384/id
Si on veut voir la notice en rdf, il suffit de rajoute
à n’importe quelle notice du SUDOC .rdf à la fin
Ex : http://www.sudoc.fr/021050384.rdf
22
Service commun de documentation
Le web de données
Comment ça marche ?
L’identifiant de l’élément doit être pérenne Catalogue de la BnF :
Ex : grâce à ARK (Archival resource key) notice du document
Requête sur
Google
Service commun de documentation
Accès au
document
numérisé
depuis l’ARK
du document
numérisé
23
Le web de données
Comment ça marche ?
RDF : le graphe
Ex
24
Service commun de documentation
Le web de données
Comment ça marche ?
Exemple de graphe
25
Service commun de documentation
Le web de données
Comment ça marche ?
AAA : anyone can say anything anywhere
Les ontologies
26
Service commun de documentation
Le web de données
Comment ça marche pour les
bibliothèques?
AAAA : anyone can say anything anywhere
anyhow
Quelles ontologies en bibliothèques ?
Devons-nous utiliser Bibframe, Dublin Core ou RDA ?
RDA = Resource Description and Access
Est destiné à remplacer l’ISBD (dern. version en 2011) qui
n’est plus adapté
Publié officiellement en juin 2010
Pour couvrir tous les types de ressources (dont celles du web)
conformément aux Principes internationaux de catalogage de
l’IFLA
En s’appuyant sur FRBR / FRAD qui sont antérieurs
27
Service commun de documentation
Le web de données
Comment ça marche pour les
bibliothèques?
FRBR = Functional Requirements for Bibliographic
Records
FRAD = Functional Requirements for Authority
Data
FRSAD = Functionnal Requirements for Subject
Authority data
28
Service commun de documentation
Le web de données
Comment ça marche pour les
bibliothèques?
RDA : une norme de contenu
Accessible à travers un outil en ligne
RDA Toolkit
Code de catalogage
Gestion des profils
Mappings avec MARC 21, etc.
Exemples de notices en RDA
Documentation complémentaire
http://www.rdatoolkit.org/sites/default/files/6jsc_rd
a_complete_examples_bibliographic_apr0913_rev.
pdf
29
Service commun de documentation
… mais pas d’identification de l’œuvre
Le web de données
Comment ça marche pour les
bibliothèques?
RDA et FRBR
Reprend la terminologie FRBR
Entités
Attributs
Relations
Utilise constamment
les noms des entités FRBR/FRAD
Œuvre/Expression/Manifestation/Item
les noms des « tâches utilisateur »
Il est indispensable pour cataloguer d'être à l'aise
avec tous ces termes
RDA est encore en réflexion en France pour mieux
l’adapter, mais FRBR est mis en œuvre depuis 2010/2011
Ex : la BnF avec data.bnf.fr, l’ABES avec le SUDOC 31
Service commun de documentation
Les enjeux
En résumé…
Enjeux liés au confort des utilisateurs
32
Service commun de documentation
Les enjeux
En résumé…
Enjeux liés au confort des bibliothécaires
33
Service commun de documentation
Les enjeux
En résumé…
Enjeux économiques
34
Service commun de documentation
Les enjeux
En résumé…
Enjeux d’efficacité
35
Service commun de documentation
Que fait l’ABES ?
ABES et RDF
1. Ouvrir ses données en RDF (2008-…)
36
Service commun de documentation
Que fait l’ABES ?
ABES et RDF
2. FRBRiser le SUDOC (2013-…)
Enrichir la conversion en RDF en utilisant des
vocabulaires RDF métiers : ISBD, FRBR, RDA
= catalogage courant, complétant la
rétroconversion des notices existantes
= objectif des nouvelles consignes de catalogage !
37
Service commun de documentation
Que fait l’ABES ?
La FRBRisation du SUDOC
Nouvelles consignes de catalogage diffusées en
février 2013 :
- pour mieux identifier les « œuvres » et leurs
« expressions » (modèle FRBR)
- pour enrichir la sortie RDF/XML des notices
bibliographiques du SUDOC en utilisant les
vocabulaires RDF spécialisés.
38
Service commun de documentation
Que fait l’ABES ?
La FRBRisation du SUDOC
3. Cataloguer dans le contexte du web de
données (201?-)
= objectif notamment du projet SGBM
(http://sgbm.abes.fr/)
Tout est à imaginer et à faire…
39
Service commun de documentation