Les services du TGE Adonis - Centre Marc Bloch – Digital Humanities
Transcription
Les services du TGE Adonis - Centre Marc Bloch – Digital Humanities
Les services du TGE Adonis Sophie David (TGE Adonis, CNRS) 23‐24 avril 2013 Plan de la présentation • Le TGE Adonis ‐ quelques éléments de contexte • Missions – Déployer les services de la grille – Déployer la plateforme Isidore – Coordonner la participation française à l’infrastructure Dariah Le TGE Adonis ‐ éléments de contexte • 2002 : ESFRI (European Strategy Forum on Research Infrastructures) – 2006 : première feuille de route européenne • 2005 : création du TGE Adonis • 2008 : première feuille de route nationale – Pour les SHS, 4 infrastructures : TGE Adonis, Corpus‐IR, Progedo, BSN • 2012 : – TGIR = TGE Adonis, Corpus‐IR et Progedo – IR = réseau des MSH, NEFIAS (Network for Internationalising Advanced Science) • 2013 : fusion du TGE Adonis et de Corpus‐IR = Huma‐Num La grille de services • Mission : proposer un ensemble de services pour la conservation, le traitement et la diffusion de données et documents numériques issues de la recherche • Opérateurs : centre de calcul de l’IN2P3 et CINES La grille de services • Conserver 1. Stockage sécurisé – Exemple : Sharedoc 2. Archivage à long terme – Modèle OAIS (Open Archival Information System) – Coordination d’un projet d’archivage avec le CINES • Traiter 1. Grille de calcul – 3D 2. Outils de traitement – Logiciels effectuant des conversions de formats pour des données spatiales, des données multimédia, l'OCRisation de documents, etc. La grille de services • Diffuser 1. Hébergement de systèmes d’information – hébergement de sites (apache, php, etc.). – serveurs de bases de données (disponibles pour les bases MySql, PosGres, PostGIs, eXist, BaseX, CouchDB, Filemaker) – serveurs d’applications dédiés aux applicatifs java (MdWeb, Pleade, etc.). – serveurs dédiés à la diffusion de données spécifiques (streaming audio/vidéo, cartes, etc.) 2. Plateformes de gestion et de diffusion de données – pour les données spatiales, les données multimédias, les corpus (WebActors) ; – plateforme pour associer données et publications (en dévelop.) – « silo » (en dévelop.) Isidore : www.rechercheisidore.fr • Avant Isidore : autant d’interrogations qu’il y a d’entrepôts (HAL, Persée, Revues.org, Portails de bibliothèques, Sites de laboratoires, etc.) • Isidore permet en un seul lieu de trouver ces données : – des données « brutes », des données sur des données, des publications, des données événementielles – majoritairement ce sont des données en libre accès – construction d’un triplestore interrogeable à travers une interface, une API, un Sparql endpoint • Printemps 2013 : 2 millions de ressources issues de 80 collections • Maîtrise d’ouvrage : TGE Adonis ; maîtrise d’oeuvre : CCSD Isidore : www.rechercheisidore.fr • Un traitement : – qui moissonne des entrepôts de données (OAI‐PMH, métadonnées en Dublin Core : DC / DCterms) ; des flux (RSS / ATOM) ; des sites web (Sitemap / RDFa) – qui repose sur l’utilisation de formats standardisés et interopérables. Format pivot en RDF – qui enrichit ces ressources à l’aide de référentiels (Rameau, Pactols, Geonames) Les projets du pôle international • Dariah : Digital Research Infrastructure for the Arts and Humanities (ESFRI) • NeDiMAH : Network for Digital Methods in the Arts and Humanities • TEI Consortium : Text Encoding Initiative • Webdatanet • Clarin : Common Language Resources and Technology Infrastructure (ESFRI)