

n° 2 – Juillet 2015 !
Import & Export de Thésaurus!
La plateforme TMP2 (Thesaurus Management Pla\orm, version 2) permet d’importer et d’exporter des thésaurus dans différents formats. La fonc?on d’import de thésaurus est accessible à parGr de la page d’accueil. Elle prend en charge 2 formats d’échange : SKOS et CSV. Dans la mesure où la TMP2 vérifie la structure des fichiers importés et la cohérence sémanGque des données, l’import est réalisé en mode différé (batch). La TMP2 repose sur la norme ISO 25964 régissant les thésaurus. Elle prend donc en charge les trois types de relaGons « hiérarchiques » : BTG (Générique), BTP (ParGGve) et BTI (Instance). Ces relaGons n’existant pas en SKOS, elles seront traduites sous la relaGon hiérarchique « broader ». Les thésaurus au format CSV doivent respecter une structure bien définie, où les colonnes sont nommées selon le vocabulaire SKOS : prefLabel@en, prefLabel@fr, altLabel@en, scopeNote@en, etc. S KO S p o u r " S i m p l e K n o w l e d g e OrganizaGon System" (Système simple d'organisaGon des connaissances) est une recommandaGon du W3C publiée en août 2009 pour représenter des thésaurus, classificaGons et autres types de vocabulaires contrôlés ou de langages documentaires. S'appuyant sur le modèle de données RDF (Resource DescripGon Framework, hVp://, son principal objecGf est de permeVre l’échange et la publicaGon faciles de vocabulaires structurés pour leur uGlisaGon dans le cadre du Web sémanGque (source : Wikipédia). CSV pour "Comma-­‐Separated values" est un format ouvert représentant des données tabulaires sous forme de valeurs séparées par des virgules. Un fichier CSV est un fichier texte où chaque ligne du texte correspond à une ligne du tableau et les virgules correspondent aux séparaGons entre les colonnes. Les porGons de texte séparées par une virgule correspondent ainsi aux contenus des cellules du tableau (source : Wikipédia). JSON pour "JavaScript Object NotaGon" est un format de données textuelles dérivé de la notaGon des objets du langage JavaScript. Il permet de représenter de l’informaGon structurée comme le permet XML par exemple. Un document JSON a pour foncGon de représenter de l'informaGon accompagnée d'éGqueVes permeVant d'en interpréter les divers éléments, sans aucune restricGon sur le nombre de celles-­‐ci (source : Wikipédia). L’export d’un thésaurus s’effectue par son propriétaire à parGr du menu associé à chaque thésaurus au niveau de la page d’accueil. Les formats SKOS et JSON sont pris en charge. Le format JSON est plus complet que le format SKOS. Il permet d’inclure toutes les informaGons relaGves au thésaurus et en parGculier à la norme ISO 25964 qui sont perdues lors de sa traducGon en SKOS (relaGons hiérarchiques BTG, BTP et BTI). Correspondances entre le format d’échange SKOS et la norme ISO 25964 sur les thésaurus La norme ISO 25964-­‐1, publiée en 2011, a remplacé les précédentes versions des normes ISO 2788 and ISO 5964. Les membres du Groupe de Travail en charge de la norme ISO 25964 ont pris en compte les implicaGons de la nouvelle norme pour les uGlisateurs de SKOS. Ils ont ainsi précisé les liens entre le modèle de données de l’ISO 25964 et ceux de SKOS, SKOS-­‐
XL et MADS/RDF. La présentaGon de la correspondance entre la norme ISO 25964 et les formats SKOS/SKOS-­‐XL est accessible à l’adresse : hVp:// et remplace la version précédente décrite dans le « SKOS Primer ». Newsletter!
n° 2 – July 2015 !
Import & Export of Thesauri!
The TMP2 Pla\orm (Thesaurus Management Pla\orm, version 2) allows to import and export thesauri under different formats. The import func?on is accessible on the homepage. It takes into account two exchange formats : SKOS and CSV. The TMP² verifies the structure of the imported files and the semanGc coherence of the data, so the import is performed in batch mode. The TMP² relies on the ISO 25964 standard on thesauri. Three types of hierarchical relaGons are taken into account: BTG (generic), BTP (parGGve) and BTI (instance). These relaGons do not exist in SKOS and they will be automaGcally translated in a simple “broader” of “narrower” hierarchical relaGon. The CSV files must respect a given structure. Columns must be named according to SKOS labels: prefLabel@en, prefLabel@fr, altLabel@en, scopeNote@en, etc. A template will shortly be available. SKOS Simple Knowledge OrganizaGon System (SKOS) is a W3C recommendaGon designed for representaGon of thesauri, classificaGon schemes, taxonomies, subject-­‐heading systems, or any other type of structured controlled vocabulary. SKOS is part of the SemanGc Web family of standards built upon RDF and RDFS (Resource DescripGon Framework, hVp://, and its main objecGve is to enable easy publicaGon and use of such vocabularies as linked data. (source: Wikipedia) CSV or “Comma-­‐Separated values” is an open format in which data are represented in a tabular structure with values separated by commas. A CSV file is a text file where each line of text corresponds to one line in the table and the commas correspond to the separaGon between the columns. The pieces of text separated by a comma correspond to the content of the table cells (source: Wikipedia). JSON or “JavaScript Object NotaGon” is a format for textual data derived form the object notaGons in JavaScript. It can represent data in a structured way, accompanying informaGon with labels that idenGfy all the different elements. JSON is promoted as a low-­‐overhead alternaGve to XML (source: Wikipedia). The export of a thesaurus is done by his/her owner from the homepage. It is possible to export in SKOS and JSON. The JSON format is more complete than the SKOS format, because it includes all the informaGon stored in the thesaurus, more specifically the hierarchical relaGonships of ISO 25964 (BTG, BTP, BTI) which are not translated in SKOS. Alignment between SKOS and new ISO 25964 thesaurus standard (2012-­‐12-­‐13) ISO 25964-­‐1, published in 2011, replaced the previous thesaurus standards ISO 2788 and ISO 5964 (both now withdrawn). Members of the Working Group responsible for ISO 25964 have gone on to consider the implicaGons for SKOS users. They have developed a set of linkages between the elements of the ISO 25964 data model and the ones from SKOS, SKOS-­‐XL, and MADS/RDF. This new "Correspondence between ISO 25964 and SKOS/
SKOS-­‐XL models" document can be accessed at hVp:// and replaces the previous table presented in the SKOS Primer. 

Documents pareils

Atelier_Vers un thésaurus sur la biodiversité-CR27112015-v4

Atelier_Vers un thésaurus sur la biodiversité-CR27112015-v4 - Présentation de la méthodologie actuelle utilisée à l’INIST partant du tableau Excel --> programme de conversion en SKOS/RDF/XML (xls2skos) --> outil en ligne Skos Play pour obtenir des versions ...

Plus en détail