1ère partie
Transcription
1ère partie
Les nouvelles consignes de catalogage dans le SUDOC Web de données, FRBR, RDA 04 mars 2014 Marie-Hélène Henry Service commun de documentation Agnès Macquin 1 Plan de l’intervention Contexte et problématique Le web de données Les enjeux Que fait l’ABES ? Le modèle FRBR Les nouvelles consignes de catalogage dans le SUDOC 2 Service commun de documentation Contexte et problématique Ou pourquoi vouloir tout changer quand tout allait si bien ? On a notre ISBD … … nos règles de catalogage … … notre format MARC … … notre SIGB … … notre OPAC sur Internet What is the problem ? 3 Service commun de documentation Contexte et problématique Ou pourquoi vouloir tout changer quand tout allait si bien ? La recherche d’information aujourd’hui 4 Service commun de documentation Contexte et problématique Ou pourquoi vouloir tout changer quand tout allait si bien ? 5 Service commun de documentation Contexte et problématique Ou pourquoi vouloir tout changer quand tout allait si bien ? Où sont les bibliothèques ? 6 Service commun de documentation Contexte et problématique Ou pourquoi vouloir tout changer quand tout allait si bien ? 7 Service commun de documentation Contexte et problématique Ou pourquoi vouloir tout changer quand tout allait si bien ? Ce qu’on propose aujourd’hui 8 Service commun de documentation Contexte et problématique Ou pourquoi vouloir tout changer quand tout allait si bien ? Conclusions… La recherche d’information, aujourd’hui, pour beaucoup de gens, c’est le Web… Il faut donc s’adapter à de nouvelles pratiques Le « syndrome Google » On n’a plus l’habitude de chercher par index On utilise des clés de recherche simples … … à affiner au besoin avec des facettes Les recherches par mots dans nos catalogues ramènent trop de réponses … … classées de manière plus ou moins anarchique Les catalogues doivent évoluer pour mieux cibler. 9 Service commun de documentation Contexte et problématique Ou pourquoi vouloir tout changer quand tout allait si bien ? Or : Le Web ne parle pas MARC Le Web a ses propres normes Le Web ne fréquente pas les fournisseurs de SIGB Le Web concerne tout le monde Le Web suit son évolution propre… vers le Web sémantique (ou web de données) 10 Service commun de documentation Le web de données Mais qu’est-ce que c’est à la fin ?! Web sémantique ou web de données ? Web sémantique un ensemble de technologies et de standards développés par le W3C pour construire le Web de données Web de données une extension du Web permettant de relier non pas des documents (pages HTML) mais les données elles-mêmes, et de les rendre exploitables par des machines. 11 Service commun de documentation Le web de données Mais qu’est-ce que c’est à la fin ?! Le Web gère Le Web sémantique gère des documents des « choses » .htm, .html personnes .pdf lieux .xml événements .mp3 musique films organisations…. 12 Service commun de documentation Le web de données Mais qu’est-ce que c’est à la fin ?! 13 Service commun de documentation Le web de données Mais qu’est-ce que c’est à la fin ?! Or : • les données sont cachées sous les pages HTML, ou dans tout autre document (web profond ou invisible, non repérable par les robots des moteurs de recherche) • Seules les pages HTML sont liées entre elles, et non pas les données • Les pages HTML sont faites pour les humains Ce que veulent les machines, ce sont : • des données brutes • et des données liées – car elles se complètent les unes les autres – car les liens permettent de naviguer et de découvrir • Et des liens qualifiés, signifiants –au-delà du « voir aussi » des hyperliens 14 Service commun de documentation Le web de données Mais qu’est-ce que c’est à la fin ?! 15 Service commun de documentation Le web de données Comment ça marche ? Resource Description Framework (RDF) Proposé en 1999 par le W3C = la grammaire ou syntaxe avec laquelle on décrit, représente et relie des données à échanger sur le Web. Le principe de base : toute chose peut être décrite avec des phrases minimales composées d’un sujet, d’un verbe et d’un complément (= déclaration RDF) En traduction RDF Le sujet = la ressource Le verbe = le prédicat Le complément = l’objet 16 Service commun de documentation Le web de données Comment ça marche ? Exemple Darwin a écrit « L’origine des espèces » Sujet : Charles Darwin Verbe : a écrit Complément : « L’origine des espèces » Sujet Prédicat Objet Les 3 éléments sujet – prédicat – objet constituent un TRIPLET 17 Service commun de documentation Le web de données Comment ça marche ? RDF : une syntaxe sujet objet prédicat Service commun de documentation Le SUJET est toujours une URI. Le PRÉDICAT est toujours une URI. Toute « chose » sur laquelle on veut faire des assertions (SUJET) doit avoir une URI. Les « choses » ont toujours un type : une CLASSE. Il permet d’exprimer les PROPRIÉTÉS des « choses », ou les RELATIONS des « choses » entre elles. L’OBJET peut être un texte (LITTÉRAL) ou une URI. Les CLASSES et les PROPRIÉTÉS sont déclarées dans des VOCABULAIRES (ou « ONTOLOGIES ») pour être réutilisées. 18 Le web de données Comment ça marche ? URI/URL : petit rappel URI (Uniform Resource Identifier) = Chaîne de caractères normalisée, unique et univoque, permettant d'identifier de manière permanente une ressource abstraite ou physique, accessible ou non sur Internet (personne, organisme, lieu, évènement, concept, …) 3 déclinaisons URC (Uniform Resource Characteristic) : caractéristiques d’une ressource URN (Uniform Resource Name) : nom d’une ressource URL (Uniform Resource Locator) : spécification de l'adresse physique de localisation d'une ressource sur Internet et de la méthode permettant d'y accéder 19 Service commun de documentation Le web de données Comment ça marche ? Traduction en RDF Pour un humain : Sujet : « L’origine des espèces » Verbe : a pour auteur Complément : Charles Darwin Sujet Prédicat Objet Pour un logiciel de bibliothèque : Sujet : PPN 021050384 (par ex.) Sujet (titre contenu dans le 200$a) Verbe : 700 #1$3026812304$4070 Complément : $3026812304 Prédicat Objet (PPN 026812304 = autorité de Charles Darwin) Pour n’importe quelle machine : Sujet : http://www.sudoc.fr/021050384/id Verbe :http://id.loc.gov/vocabulary/relators/aut Sujet Prédicat (ou marcrel:aut) Complément : http://www.idref.fr/026812304/id Objet (et pour le titre : dc:title « L’origine… ») Service commun de documentation 20 Cette publication a pour titre propre "L’origine des espèces…" http://catalogue.bnf.fr/ark:/12148/cb413764782 http://rdvocab.info/Elements/titleProper des espèces…" ça"L’origine marche pour les Le web de données Comment bibliothèques? http://catalogue.bnf.fr/ark:/12148/cb413764782 Cette publication matérialise l’Expression Darwin, Charles. On the origin RDAof species… Français (Becquemont) http://iflastandards.info/ns/fr/frbr/frbrer/P2004 http://catalogue.bnf.fr/ark:/12148/cb413764782#frbr :Expression Cette Expression a pour forme de contenu Texte http://catalogue.bnf.fr/ark:/12148/cb413764782#frbr :Expression http://rdvocab.info/Elements/contentType http://rdvocab.info/termList/RDAContentType/1020 Cette Expression réalise l’Œuvre Darwin, Charles. On the origin of species… http://catalogue.bnf.fr/ark:/12148/cb413764782#frbr :Expression http://iflastandards.info/ns/fr/frbr/frbrer/P2002 http://catalogue.bnf.fr/ark:/12148/cb122870840 Cette Œuvre a pour titre "On the origin of species…" http://catalogue.bnf.fr/ark:/12148/cb122870840 http://rdvocab.info/Elements/titleOfTheWork Cette Œuvre a pour auteur Darwin, Charles (1809-1882) Service commun de documentation http://catalogue.bnf.fr/ark:/12148/cb122870840 http://rdvocab.info/roles/author 21 http://catalogue.bnf.fr/ark:/12148/cb11898689q "On the origin of species…" Le web de données Comment ça marche? Notice SUDOC en RDF Pour nommer les ressources, il faut rajouter, devant, un identifiant local qui sera pérenne Ex : http://www.sudoc.fr/021050384/id Si on veut voir la notice en rdf, il suffit de rajoute à n’importe quelle notice du SUDOC .rdf à la fin Ex : http://www.sudoc.fr/021050384.rdf 22 Service commun de documentation Le web de données Comment ça marche ? L’identifiant de l’élément doit être pérenne Catalogue de la BnF : Ex : grâce à ARK (Archival resource key) notice du document Requête sur Google Service commun de documentation Accès au document numérisé depuis l’ARK du document numérisé 23 Le web de données Comment ça marche ? RDF : le graphe Ex 24 Service commun de documentation Le web de données Comment ça marche ? Exemple de graphe 25 Service commun de documentation Le web de données Comment ça marche ? AAA : anyone can say anything anywhere Les ontologies 26 Service commun de documentation Le web de données Comment ça marche pour les bibliothèques? AAAA : anyone can say anything anywhere anyhow Quelles ontologies en bibliothèques ? Devons-nous utiliser Bibframe, Dublin Core ou RDA ? RDA = Resource Description and Access Est destiné à remplacer l’ISBD (dern. version en 2011) qui n’est plus adapté Publié officiellement en juin 2010 Pour couvrir tous les types de ressources (dont celles du web) conformément aux Principes internationaux de catalogage de l’IFLA En s’appuyant sur FRBR / FRAD qui sont antérieurs 27 Service commun de documentation Le web de données Comment ça marche pour les bibliothèques? FRBR = Functional Requirements for Bibliographic Records FRAD = Functional Requirements for Authority Data FRSAD = Functionnal Requirements for Subject Authority data 28 Service commun de documentation Le web de données Comment ça marche pour les bibliothèques? RDA : une norme de contenu Accessible à travers un outil en ligne RDA Toolkit Code de catalogage Gestion des profils Mappings avec MARC 21, etc. Exemples de notices en RDA Documentation complémentaire http://www.rdatoolkit.org/sites/default/files/6jsc_rd a_complete_examples_bibliographic_apr0913_rev. pdf 29 Service commun de documentation … mais pas d’identification de l’œuvre Le web de données Comment ça marche pour les bibliothèques? RDA et FRBR Reprend la terminologie FRBR Entités Attributs Relations Utilise constamment les noms des entités FRBR/FRAD Œuvre/Expression/Manifestation/Item les noms des « tâches utilisateur » Il est indispensable pour cataloguer d'être à l'aise avec tous ces termes RDA est encore en réflexion en France pour mieux l’adapter, mais FRBR est mis en œuvre depuis 2010/2011 Ex : la BnF avec data.bnf.fr, l’ABES avec le SUDOC 31 Service commun de documentation Les enjeux En résumé… Enjeux liés au confort des utilisateurs 32 Service commun de documentation Les enjeux En résumé… Enjeux liés au confort des bibliothécaires 33 Service commun de documentation Les enjeux En résumé… Enjeux économiques 34 Service commun de documentation Les enjeux En résumé… Enjeux d’efficacité 35 Service commun de documentation Que fait l’ABES ? ABES et RDF 1. Ouvrir ses données en RDF (2008-…) 36 Service commun de documentation Que fait l’ABES ? ABES et RDF 2. FRBRiser le SUDOC (2013-…) Enrichir la conversion en RDF en utilisant des vocabulaires RDF métiers : ISBD, FRBR, RDA = catalogage courant, complétant la rétroconversion des notices existantes = objectif des nouvelles consignes de catalogage ! 37 Service commun de documentation Que fait l’ABES ? La FRBRisation du SUDOC Nouvelles consignes de catalogage diffusées en février 2013 : - pour mieux identifier les « œuvres » et leurs « expressions » (modèle FRBR) - pour enrichir la sortie RDF/XML des notices bibliographiques du SUDOC en utilisant les vocabulaires RDF spécialisés. 38 Service commun de documentation Que fait l’ABES ? La FRBRisation du SUDOC 3. Cataloguer dans le contexte du web de données (201?-) = objectif notamment du projet SGBM (http://sgbm.abes.fr/) Tout est à imaginer et à faire… 39 Service commun de documentation