Les services du TGE Adonis - Centre Marc Bloch – Digital Humanities

Transcription

Les services du TGE Adonis - Centre Marc Bloch – Digital Humanities
Les services du TGE Adonis
Sophie David (TGE Adonis, CNRS)
23‐24 avril 2013
Plan de la présentation
• Le TGE Adonis ‐ quelques éléments de contexte
• Missions
– Déployer les services de la grille
– Déployer la plateforme Isidore
– Coordonner la participation française à l’infrastructure Dariah
Le TGE Adonis ‐ éléments de contexte
• 2002 : ESFRI (European Strategy Forum on Research
Infrastructures)
– 2006 : première feuille de route européenne
• 2005 : création du TGE Adonis
• 2008 : première feuille de route nationale
– Pour les SHS, 4 infrastructures : TGE Adonis, Corpus‐IR, Progedo, BSN
• 2012 : – TGIR = TGE Adonis, Corpus‐IR et Progedo
– IR = réseau des MSH, NEFIAS (Network for Internationalising
Advanced Science)
• 2013 : fusion du TGE Adonis et de Corpus‐IR = Huma‐Num
La grille de services
• Mission : proposer un ensemble de services pour la conservation, le traitement et la diffusion de données et documents numériques issues de la recherche
• Opérateurs : centre de calcul de l’IN2P3 et CINES
La grille de services
• Conserver
1. Stockage sécurisé
–
Exemple : Sharedoc
2. Archivage à long terme
– Modèle OAIS (Open Archival Information System)
– Coordination d’un projet d’archivage avec le CINES
• Traiter
1. Grille de calcul
–
3D
2. Outils de traitement
–
Logiciels effectuant des conversions de formats pour des données spatiales, des données multimédia, l'OCRisation de documents, etc.
La grille de services
• Diffuser
1. Hébergement de systèmes d’information
– hébergement de sites (apache, php, etc.).
– serveurs de bases de données (disponibles pour les bases MySql, PosGres, PostGIs, eXist, BaseX, CouchDB, Filemaker)
– serveurs d’applications dédiés aux applicatifs java (MdWeb, Pleade, etc.).
– serveurs dédiés à la diffusion de données spécifiques (streaming audio/vidéo, cartes, etc.)
2. Plateformes de gestion et de diffusion de données
–
pour les données spatiales, les données multimédias, les corpus (WebActors) ; – plateforme pour associer données et publications (en dévelop.)
– « silo » (en dévelop.)
Isidore : www.rechercheisidore.fr
• Avant Isidore : autant d’interrogations qu’il y a d’entrepôts (HAL, Persée, Revues.org, Portails de bibliothèques, Sites de laboratoires, etc.)
• Isidore permet en un seul lieu de trouver ces données :
– des données « brutes », des données sur des données, des publications, des données événementielles
– majoritairement ce sont des données en libre accès
– construction d’un triplestore interrogeable à travers une interface, une API, un Sparql endpoint
• Printemps 2013 : 2 millions de ressources issues de 80 collections
• Maîtrise d’ouvrage : TGE Adonis ; maîtrise d’oeuvre : CCSD
Isidore : www.rechercheisidore.fr
• Un traitement :
– qui moissonne des entrepôts de données (OAI‐PMH, métadonnées en Dublin Core : DC / DCterms) ; des flux (RSS / ATOM) ; des sites web (Sitemap / RDFa)
– qui repose sur l’utilisation de formats standardisés et interopérables. Format pivot en RDF
– qui enrichit ces ressources à l’aide de référentiels (Rameau, Pactols, Geonames)
Les projets du pôle international
• Dariah : Digital Research Infrastructure for the Arts and Humanities (ESFRI)
• NeDiMAH : Network for Digital Methods in the Arts and Humanities
• TEI Consortium : Text Encoding Initiative
• Webdatanet
• Clarin : Common Language Resources and Technology
Infrastructure (ESFRI)