Voilà mes notes de la réunion du 11 juin, un compte rendu de GB

Transcription

Voilà mes notes de la réunion du 11 juin, un compte rendu de GB
Voilà mes notes de la réunion du 11 juin, un compte rendu de GB Concept suivra avec le
diaporama qu'ils ont utilisé. Mon impression générale : plutôt bonne. Pascal Cordereix semble
vraiment vouloir s'impliquer et va demander à la BnF d'héberger le portail. L'équipe technique
bretonne de GB-Concept a bien travaillé et connait le sujet.
L'outil technique pour la crétion de la plateforme collective est celui qui a été préconisé dans
le Cahier des Charges : PKP PLUGIN. Je leur ai signalé qu'il fallait utiliser la version 2 du
logiciel, ils vérifient cette utilisation.
Table d'équivalence des structures a été réunie par Mickaël et présentée, il manquait Dastum
mais Christine Andro les connait bien.
A ma demande de validation du choix du DC simple, voilà résumée la réponse de GB Concept :
face aux multitudes de normes et de standards, l'OAI DC non qualifié permet de mettre
rapidement en place un projet. Dès que commencent les discussions sur les attributs (en
MODS ou METS par exemple) il est difficile d'arriver à une décision collective.
Rappel : attribut = données ou métadonnées associées aux instances d'un type de données
Pierre-Olivier Laulanné présente sa vision du projet (notes en vrac) :
Actuellement 5 centres dans le pôle, qui veulent valoriser leurs documents
Capacité à intégrer d'autres centres de documentation, échelle fédérale à prendre en
considération
Pouvoir inviter d'autres acteurs (hors réseau FAMDT)
Valoriser matériaux bruts collectés et des créations à partir d'une partie base de données sur
Spectacle vivant et archives
coordination VG
Objectif de date possible pour l'inauguration du catalogue collectif : à Rennes sur les journées
Dastum du patrimoine immatériel 12 et 13 décembre 2008.
Pascal Cordereix présente le projet en lien avec la BnF
fondamental : mutualiser un outil d'accès de reconnaissance de l'archive orale
faire émerger les archives sonores
convergence des techniques
fédérer des ressources
combat a mener sur les archives sonores (viviblement lui aussi a un pb de reconnaissance)
Q: faut-il offrir la possibilité de collecter les entrepots et d'en récupérer ?
travail culturel politique depuis plusieurs années, les outils existent depuis 15 ans
Discussion :
la question de la granulométrie va être importante (les différents niveaux
fonds/corpus/enquête/item)
la numérisation implique d'aller vers une granulométrie de plus en plus fine
le niveau d'information doit être décrit précisemment
IMPORTANT dans le moissonnage, seules les informations GUEST sont accessibles
Les moissonnages possibles :
- OAI-DC
- ASCII-XML ou autre logiciel documentaire permettant le moissonnage
- Déconseillé TXT manuel, l'import doit être validé, il faudra créer un entrepôt fictif : possible
mais dangereux,
Les pages à décrire :
Frontend = utilisateur
- recherche simple /avancée
- affichage de liste de résultats
- aboutit sur la notice détaillée et/ou la notice d'origine (celle du catalogue de la structure
qui possède le document)
Points d'entrée simples de personnalisation à rédiger et à décider
- présentation
- à propos
- les logos
- veut-on que soit possible la soumission d'un entrepôt oai par un utilisateur ?
- il faut choisir la charte graphique à adopter
Backend = administration
ajouter un entrepôt c'est simplement ajouter l'url et ses caractéritiques
gestion des collectes pour un test manuel puis le moissonnage se fait de façon automatique
la nuit
correspondances possibles fournies par PKP: formats MODS et MARC21
Donc les schémas reconnus par le portail : DC, MODS, MARC21
pour une recherche il faut que PKP sache ce qu'il affiche en MODS, DC ou MARC21,
il se base sur une série(table) de correspondance
Traduction en cours : français / anglais
mais toutes les langues peuvent être prévues dans l'interface
Tout est possible, il faut traduire simplement l'interface et vérifier et que tous les fichiers de
langues soient présents à chaque fonction
Il est possible d'ajouter certains plugs-in de PKP
- bannissement d'adresses IP
- étendre le schéma DC à OJS
- retransformer le catalogue en entrepôt OAI
- mapping sur les langues (french=français=fr=fre) et sur les types (books=livres=ouvrage...).
A faire : une table de tous les termes utilisés et de leurs synonymes pour que dans la notice
DC un seul terme apparaisse pour tous. Il faudra donc définir des termes communs qui
désignent la même chose. Par exemple le type image animée = audiovisuel = archives filmique
= archive audiovisuelle = vidéo = film
- Possible : plug-in outil de lecture contextuel : étendre un résultat de recherche vers
d'autres ressources en s'appuyant sur un moteur externe, ex. le nom d'auteur, définition (à
voir)
ex google scholar
- La géolocalisation serait possible : IMPORTANT dans ce cas, il faut que tous ayons un
champ département numérique (sur 2 chiffres)
COVERAGE
Validation du choix de Coverage pour le lieu d'enquête dans le DC mais il faudra l'expliquer
dans l'aide en ligne
Présentation de la maquette :
Traduction de l'anglais / terminologie à définir : archives = repository = entrepôt (attention
au terme archives en français qui a un sens fort dans le langage commun)
Pour ajouter un entrepôt sur le portail, il suffit de remplir une fiche qui décrit ce qu'on va faire
Pour gérer l'entrepôt pourra lancer une collecte manuelle ou automatisée
Question posée à GB-Concept : lorsqu'on fait une requête serait-il possible d'avoir des
résultats clicables (recherche par rebond) pour les auteurs ? pour les subjects ?
Ils essaient de voir ce qui est possible.
Exemple de récupération de MODS avec le portail IRCAM, ça roule mais cela implique d'avoir
deux formulaires de recherche un pour MODS, un pour DC. Demande de notre part à
GB-Concept : ne serait-il pas possible d'avoir une seule interface de recherche sur le plus
petit dénominateur commun de MODS et de DC.
Validation du planning prévisionnel
Pour éviter le retard, puisque tous les mappings sont prêt l'équipe de GB-Concept va travailler
en dissociant le fond de la forme (logo, titres, pages à documenter...)
L'envoi des bases va se faire très vite, vous serez contactés par Christine Andro qui vous
expliquera comment faire. Il faudra lui envoyer par FTP une sauvegarde .TXT zippée.
Auparavant, il conviendrait de modifier quelques éléments dans vos bases pour
l'homogénéisation des requêtes dans le portail (cela ne devrait pas être difficile en passant
par des requêtes, téléphonez à Mickël ou à moi) :
- champ code du département du lieu d'enquête sur deux chiffres
- document numérique en ligne : sous forme oui/non
- champ nom du catalogue
afin de gérer au mieux les sets
rappel de la définition des SETS : ensembles disponibles avec des requêtes
Un titre à trouver, qui n'inclurait pas forcemment le terme "famdt" : pourrrait être "portail de
l'oralité" - il faut que l'entrepôt ait un nom
En fait vous pourrez créer tous les sets que vous voudrez pour être moissonnés mais la
plateforme collective moissonera uniquement les documents du set « Catalogue collectif
archives sonores » ou "Portail de l'oralité". Il faudra donc créer un champ permettant de créer
ce set.
Stéphanie préfère PORTAIL DE L'ORALITE
Moi aussi ça me va
donnez nous rapidement votre avis ou une autre proposition
De même, il nous a semblé indispensable de créer dans toutes les bases le champ «
Document numérique en ligne » OUI/NON pour que le set permettant le moissonnage
uniquement des notices liées à des fichiers son puisse s'effectuer.
Pour la géolocalisation des requêtes
Pour permettre des requêtes à partir d'une carte de France, il est nécessaire de permettre au
moins l'accès au code du département. Avant d'envoyer vos bases à GB Concept, l'idéal
serait de créer un champ « Département » et d'y insérer le code à 2 chiffres du département
où à été enregistré le document.
Gestion des niveaux sur la plateforme collective
Comme vous l'avez compris lors de la formation OAI à la BnF, le DC simple ne gère pas les
hiérarchies entre notices. Par contre pour chaque notice il y aura un lien cliquable renvoyant
sur le catalogue original. En conclusion, il y aura intérêt de considérer chaque notice comme
des éléments indépendants d'un point de vue éditorial.
A NOTER l'idéal est d'avoir des notices qui puissent être compréhensibles sans les niveaux de
catalogage, c'est à dire qu'elles puissent avoir leur vie éditoriale propre. En effet, dans le
catalogue collectif toutes les notices de son et vidéo inédits seront moissonnées, donc si une
notice apporte peu d'information sur sa localisation, les responsabilités, le lieu d'enquête...
elle sera incompréhensible au lecteur !
Pas très engageant pour l'avenir d'Alexandrie mais l'équipe nous a rassuré...
Quand POL et Cordereix sont partis, nous avons discuté avec l'équipe de GB Concept du
courrier reçu récemment :
L'histoire d'Alexandrie c'est celle de deux frères, Gilles et Dominique. 800 clients l'utilisent
dans le monde.
Gilles Batteux a travaillé sur le code du logiciel, il en est l'auteur, Dominique Batteux a créé la
société commerciale et les services autour du logiciel.
Désormais, Gilles va développer le logiciel tout seul.
GB Concept c'est 25 personnes, ils vont créer du service autour d'Alexandrie (qui va s'appeler
Kentika).
Le point de vue de l'équipe : Alexandrie est un bon gestionnaire de données, un mauvais
intégrateur web. En résumé, aujourd'hui un sgbd devrait proposer d'être fullweb, unicode et
proposer une interconnexion sous forme de standards (XML, DC et autres). Le futur projet de
GB-Concept, sur lequel ils vont communiquer en septembre, ce sera de proposer un CMS
[contain mangament system
http://fr.wikipedia.org/wiki/Syst%C3%A8me_de_gestion_de_contenu), ils ont choisi JOUMLA
avec une API XML qui dialoguera avec Alexandrie.
A suivre donc...
PS Merci à Stéphanie d'avoir relu et ajouté les précisions nécessaires.