Import Massif - Open melodie

Transcription

Import Massif - Open melodie
Import Massif Nouvelles fonctionnalités L’import massif introduit plusieurs nouvelles fonctionnalités, selon que l’on importe un thésaurus, un ensemble de valeurs contrôlées ou un corpus. Le fonctionnement de base reste le même : ‐
‐
‐
‐
Connexion au service Google documents ; Choix d’un document Google spreadsheet ; Choix d’une feuille de travail à l’intérieur de ce document ; Sélection de colonnes par glisser / déposer de la liste des colonnes vers la fenêtre d’import. Dans le cas des ensembles de valeurs contrôlées, les colonnes sont toujours importées dans l’ordre dans lequel elles se trouvent dans la feuille de travail, indépendamment de l’ordre dans lequel elles sont glissées / déposées. Si l’ordre des colonnes du document ne correspond pas à celui des éléments du champ composite de l’ensemble de valeurs contrôlées, alors il faut modifier le document. Import de thésaurus L’import de thésaurus permet d’importer une liste de mots‐clés exprimés dans différentes langues. Le tableau portant les mots‐clés est structurée de la façon suivante : ‐
‐
‐
La première ligne porte les noms des colonnes ; La deuxième ligne porte un tag permettant d’identifier la langue de cette colonne, ce tag suit le format suivant : @OMPLD.lang.xx : où xx est le code ISO de la langue choisie (fr pour le français, en pour l’anglais, es pour l’espagnol, de pour l’allemand, it pour l’italien, etc…) ; Les lignes suivantes portent chacune un mot‐clé, traduit dans chaque langue. La première colonne ne doit pas comporter de ligne vide. Toute ligne qui commencerait par une case vide ne serait pas prise en compte lors de l’import. Les colonnes sont importées par glisser / déposer dans la fenêtre d’import, de façon classique. On peut importer plusieurs colonnes à la fois, dans ce cas chaque colonne doit correspondre à une langue différente. Voici un exemple de tableau de thésaurus : Nom FR @OPMLD.lang.fr rouge vert bleu jaune violet blanc Nom EN @OPMLD.lang.en
red green yellow white Nom ES @OPMLD.lang.es rubio verde azul L’import incrémental est supporté. Il est donc possible d’importer plusieurs fois de suite le même tableau dans le même thésaurus. Dans ce cas les valeurs existantes seront mises à jour, les mots‐clés supplémentaires seront ajoutés, de même que les traductions supplémentaires. Il n’est pas possible de modifier la valeur de la première colonne, qui est utilisée pour reconnaître le mot‐clé. Remarques sur l’édition de thésaurus On peut ajouter des mots‐clés dans un thésaurus manuellement, sans passer par l’import massif. Dans ce cas deux modes de saisies sont supportés : 1) Saisie d’un mot sans sa langue, une langue par défaut est alors choisie ; 2) Saisie dans le format suivant : [fr:oiseau ; en:bird] : dans ce cas le mot‐clé oiseau est saisi en français et en anglais. On peut ajouter autant de langues que l’on veut à cette syntaxe, ou n’en mettre qu’une seule. La langue par défaut est la première qui apparaît dans cette syntaxe, en lecture et en saisie. Cette syntaxe n’est pas supportée pour l’import massif des thésaurus. 3) L’édition d’un mot‐clé existant se fait en respectant la même syntaxe. On peut ajouter ou retirer des langues en modifiant cette syntaxe. Il est impossible d’effacer la langue définie par défaut. Import de valeurs contrôlées L’import de valeurs contrôlées fonctionne sur le même modèle que les thésaurus. Cette fonctionnalité impose deux restrictions : ‐
‐
elle ne fonctionne que pour les ensembles de valeurs contrôlées construits sur un type de champ composite ; elle ne fonctionne que si ce champ composite comporte un mot‐clé comme premier élément. Voyons un exemple. Lieu Paris Créteil Versailles Longitude 11.11 33.33 Latitude 22.22 Cet ensemble de valeur contrôlé est construit sur un champ composite, lui‐même comprenant : ‐
‐
Un premier champ de type « mot‐clé », se référant au thésaurus « Nom de lieux » ; Un deuxième et un troisième champ, tous deux de type « nombre décimal ». L’import se fait classiquement par glisser / déposer des colonnes de ce tableau vers la liste de colonnes à importer, puis en cliquant sur le bouton « import ». Open melodie analyse le tableau ligne par ligne : ‐
‐
‐
‐
‐
Il interroge le thésaurus « Nom de lieux » afin de savoir s’il y a un mot‐clé « Paris ». Si c’est le cas il le référence, sinon il crée le mot‐clé « Paris » dans la langue par défaut. Il n’est pas possible de référencer une langue avec ce mot‐clé, par un exemple avec une syntaxe du type [fr:Paris]. Il lit le reste des colonnes afin de construire une valeur contrôlée. Il teste si cette valeur contrôlée existe déjà, pour cela, il fait l’hypothèse qu’il ne peut exister qu’une unique valeur contrôlée qui référence le mot‐clé « Paris ». Si cette valeur contrôlée existe déjà, le reste des colonnes corrige les valeurs existantes en base ; Si cette valeur contrôlée n’existe pas, il la crée. On voit donc que le mécanisme d’import massif ne peut pas créer deux valeurs contrôlées différentes référençant le même mot‐clé. Cela reste possible à faire de façon manuelle, mais est fortement déconseillé. On voit aussi que le mécanisme d’import massif permet de corriger un ensemble de valeurs contrôlées, à partir de la 2ème colonne. On ne peut pas corriger les mots‐clés du thésaurus référencé par ce biais. Il est possible de préciser la langue de certaines colonnes à l’aide des tags Open melodie, comme sur l’exemple suivant. Lieu @OPMLD.keyword Paris Créteil Versailles Longitude 11.11 33.33 Latitude 22.22 Commentaire @OPMLD.lang.fr
La ville lumière. Connue pour son château. Dans ce cas, la première colonne de la deuxième ligne du tableau doit être marquée avec le tag @OPMLD.keyword. Enfin notons que l’import se fait dans l’ordre des colonnes, indépendamment de l’ordre dans lequel elles sont glissées / déposées dans la fenêtre d’import. Notion de tag pour les champs Tags OAI / PMH On peut ajouter un tag à un champ. Les tags OAI / PMH sont les suivants : @OAIPMH.contributor, @OAIPMH.coverage, @OAIPMH.creator, @OAIPMH.date, @OAIPMH.description, @OAIPMH.format, @OAIPMH.identifier, @OAIPMH.language, @OAIPMH.publisher, @OAIPMH.relation, @OAIPMH.rights, @OAIPMH.source, @OAIPMH.subject, @OAIPMH.title, @OAIPMH.type. À chaque fois , le préfixe @OAIPMH permet d’identifier qu’il s’agit d’un tag défini par le standard OAI / PMH. Ces tags peuvent être portés en ligne 2 du tableau importé, ou à la main, via la grille des champs. Pour toutes les colonnes référencées dans l’importation, si un tag OAIPMH est identifié, il est ajouté au champ correspondant. Tags Open melodie Les tags Open melodie sont préfixés par @OPMLD. Les tags supportés sont : ‐
‐
‐
‐
‐
@OPMLD.item.name : permet de qualifier un item @OPMLD.representation.name, @OPMLD.representation.location : permet de qualifier une représentation @OPMLD.lang.XX : lang [fr, en, de, es, it] : permet d’associer une langue au contenu de la colonne. Ce tag est utilisé dans l’import des thésaurus et des corpus. @OMPLD.id.AAA : permet d’importer un élément d’un champ composite. La valeur AAA porte un identificateur, qui permet d’associer les différents éléments entre eux. @OPMLD.tag.XXX : permet d’associer un tag quelconque au champ d’un corpus. Notons qu’il n’est pas nécessaire de spécifier des champs à importer lors d’un import massif. Dès qu’une feuille est choisie, on peut lancer l’import. Le mécanisme d’import massif va alors rechercher les tags @OPMLD.item.name ou @OPMLD.representation.name / @OPMLD.representation.location et procéder à la création des items ou des représentations associées à leurs pyramides le cas échéant. Modification de l’import massif Création d’un item ou d’une représentation Les tags sont pris en compte si la première cellule de la deuxième ligne contient un tag de nom : @OPMLD.item.name ou @OPMLD.representation.name. Une fois que le système a identifié que la deuxième ligne contient des métadonnées, il va les interpréter au fur et à mesure de l’import. Pour la colonne 1, qui porte le nom de l’objet à importer. 1) Si l’objet existe déjà, il est chargé 2) Si l’objet n’existe pas, on crée son nom à partir de la valeur lue dans le tableau, a. Si une langue est identifiée en ligne 2, elle devient la langue du nom. b. Sinon, la langue par défaut est utilisée. 3) Une fois son nom créé, on crée l’item : a. Si le tag @OPMLD.item.name est présent en ligne 2, on crée un item ; b. Si le tag @OPMLD.representation.name est présent en ligne 2, on crée une représentation ; c. Si aucun tag n’est présent on crée un item. Si l’on est en train d’importer des représentations (présence tu tag @OPLMD.representation.name) et que la deuxième colonne est taggée @OPML.representation.location, alors la localisation de la pyramide Open melodie est renseignée dans la représentation créée. La localisation d’une pyramide Open melodie est un chemin dans un répertoire, qui commence toujours par /archive, et qui permet de suivre les sous‐répertoires jusqu’à la pyramide. Pour toutes les colonnes référencées dans l’importation, on lit le tag d’identification. Import d’un mot­clé L’import d’un mot‐clé se fait en référençant un mot‐clé existant par l’une des valeurs dans l’une des langues de ce mot‐clé. Cette langue n’a pas besoin d’être précisée. Import d’une valeur contrôlée On peut importer une valeur contrôlée sous le même genre de restrictions que l’import des ensembles de valeurs contrôlées : ‐
‐
‐
L’ensemble de valeurs contrôlées sous‐jacent doit être construit sur un type de champ composite, qui doit comporter un mot‐clé en premier élément ; La valeur contrôlée doit être désignée par une des valeurs du mot‐clé ; La création de nouvelles valeurs contrôlées n’est pas possible via le processus d’import de corpus, à la différence des mots‐clés de thésaurus. Import d’un texte localisé Il y a deux façons d’importer un texte localisé, et notamment de fixer la langue dans laquelle il est écrit : ‐
‐
Fixer la langue de cette colonne à l’aide du tag @OPLMD.lang.en (dans ce cas pour l’anglais) Fixer une langue par valeur en entrant le texte suivant cette syntaxe : [fr : un texte localisé] Import d’un champ composite Un champ composite est par nature composé de plusieurs éléments. Ces éléments doivent être référencés par un tag @OPMLD.id.XXX, où XXX désigne un identificateur pour ce champ composite. Cet identificateur est purement interne au tableau importé, il n’a pas besoin de correspondre au nom de ce champ, ou au nom de son type (par exemple). Supposons qu’un champ composite « liste de mots‐clés iconographie commentée » soit composé de deux éléments « liste iconographique » et « commentaires ». Il sera réparti dans deux colonnes du tableau d’import, qui porteront tous les deux le même tag @OPMLD.id.icono_commenté. Il est possible d’importer deux champs composites d’un même corpus lors d’un même import, à condition que leurs types de champs soient différents. Exemples d’import massif Exemple 1 Création d’un item, numéro d’inventaire classique, couleur choisie dans un thésaurus, description en anglais. Nom FR @OPMLD.item.name CGR61339 CGR61340 CGR61341 Numéro d’inventaire 1852‐1027‐3 1852‐0902‐110 1948‐0712‐15 Couleur rouge jaune vert Description [en:A red coin] [en: A yellow coin] [en:A green coin] Exemple 2 Création d’un item, Description OAI / PMH en anglais, champs composité « liste de couleurs commentées » Nom FR @OPMLD.item.n
ame CGR61339 CGR61340 CGR61341 Description @OPMLD.lang.en @OAIPMH.descrip
tion A red coin. A yellow coin. A green coin. Liste de Couleurs @OPMLD.id.couleur_comm
entée Commentaire couleur @OPMLD.id.couleur_comm
entée rouge ; bleu jaune ; violet vert ; blanc une belle couleur encore une belle couleur et une dernière belle couleur Exemple 3 Création d’un item, champ composite « lieu géolocalisé ». On remarquera les valeurs manquantes dans le champ composite, qui sont supportées. Nom FR @OPMLD.item.name CGR61339 CGR61340 CGR61341 Lieu @OPMLD.id.lieu Paris Versailles Longitude @OPMLD.id.lieu 1.1 3.1 Latitude @OPMLD.id.lieu 1.2 2.2 Exemple 4 Création de représentation avec la localisation de leurs pyramides. Nom @OPMLD.representation.name IMG_2902 IMG_2903 IMG_2904 Pyramide @OPMLD.representation.location /archive/monnaies/BM /archive/flandin‐coste/livre‐1 /archive/bulles/NINO