Guide sur l`interopérabilité des ressources de la toile Eaufrance

Transcription

Guide sur l`interopérabilité des ressources de la toile Eaufrance
Guide sur l'interopérabilité des ressources
de la toile Eaufrance
Titre : Guide d’interopérabilité des ressources de la toile Eaufrance
Statut : non validé, V6.4.1
Créateur : René Lalement, Laurent Coudercy, Dimitri Meunier, Anne Macaire
Mots clefs : web ; interopérabilité ; identifiants ; liens hypertextes
Résumé : Ce guide fixe les règles et modalités d’écriture des URL normées du SIE, ainsi que des URI
constituant un répertoire des identifiants uniques universels du SIE.
Editeur : Onema
Date d’édition :
Langue : FR
Droits d’usage : http://creativecommons.org/licenses/by-nc-sa/2.0/fr/
Sommaire
Contexte et besoins .............................................................................................................................3
Objectif ...............................................................................................................................................3
Solutions proposées ............................................................................................................................5
1) Sémiologie utilisée dans le document.....................................................................................5
2) Disposer d’URL pérennes et lisibles vers les ressources ........................................................5
a) Les principes généraux........................................................................................................5
b) Le cas des URL identifiées .................................................................................................5
c) Le cas des autres URL ........................................................................................................6
d) Navigation dans les URL ....................................................................................................6
e) L’encodage des URL ..........................................................................................................7
f) Documentation et usage des URL normées ........................................................................7
g) Gouvernance .......................................................................................................................8
2. Avoir un répertoire d’URI...........................................................................................................8
a) Les principes généraux........................................................................................................8
b) Cas particulier des identifiants prévus par la directive Inspire .........................................10
c) L’encodage des URI .........................................................................................................11
d) Les modalités de formation des identifiants utilisés par les URI......................................11
e) Développement des URI ...................................................................................................11
f) L’usage des URI ...............................................................................................................11
g) Les principes pour les espaces de noms des schémas XML du Sandre............................12
h) Gouvernance .....................................................................................................................12
Annexes.............................................................................................................................................13
Exemple Stations qualité eau souterraine .....................................................................................13
Exemple sispea..............................................................................................................................14
Format de base d'une URN Sandre ...............................................................................................15
Contexte et besoins
Les réflexions sur l’accès aux données sur l’eau, dans le sillage de la conférence environnementale
de septembre 2013, et les observations recueillies lors du hackathon de juin 2014, montrent que des
progrès doivent être faits pour faciliter et fiabiliser l’accès sur le Web aux ressources du SIE et
assurer une meilleure interopérabilité des systèmes d’information, tant pour les utilisateurs
(humains) que les applications.
Le cadre de la refonte d’Eaufrance et le développement de nouveaux sites de publication (BNPE,
ONDE, Naïades-diffusion) sont une occasion de fixer et de mettre en œuvre des règles techniques
assurant la persistance des URL utilisées, leur normalisation et leur documentation, en particulier
pour des ressources clefs pour le système d’information.
Objectif
Ce qui fait l’originalité de la notion et du fonctionnement du Web repose principalement sur la
capacité à créer des liens entre ressources web (pages html, fichiers, …), d’où le nom de « toile ».
L'existence de ces liens suppose que leurs cibles soient munies d'un nom, unique à l'échelle du
Web, appelé URL (Uniform Resource Locator). Ce nom a une fonction d'adresse, permettant
d'accéder à la ressource, ou plus exactement à une représentation de la ressource. Si la fonction
d'adresse n'est pas requise, mais que le besoin est de disposer d’un nom unique (un identifiant), on
parle seulement d'URI (Uniform Resource Identifier). Ces noms (URL et URI) constituent le
principal facteur d’interopérabilité des systèmes d’information opérant sur le Web.
Cependant, on constate régulièrement une faiblesse de ce système à base d’URL, quand il est mis
en œuvre sans précaution particulière : les liens permettant d’aller d’une ressource à l’autre sont
rapidement cassés, dès que l’adresse de la ressource cible change. Par ailleurs, les adresses Internet
non organisées et non documentées ne facilitent pas toujours la liaison entre ressources, en
particulier en ne permettant pas de prévoir l’adresse d’une ressource à partir d’identifiants connus,
ni d’obtenir la signification de ces identifiants sans connaissance de leur contexte.. Les objectifs
d’accessibilité et d’interopérabilité ne sont alors pas atteints.
Ce constat amène à se poser la question, pour le SIE, de la persistance des URL utilisées, de leur
normalisation et de leur documentation, en particulier pour des ressources clefs pour le système
d’information ou ses partenaires. Il faut donc définir une organisation, une structuration des URL
pensée pour faciliter les liaisons, tant par des machines que par des êtres humains (ce sont les
principaux utilisateurs des liens en question).
Cela amène à réfléchir à deux types de besoin en matière d’interopérabilité liés aux URL et URI du
SIE, dans la logique évoquée par le livre vert d’architecture du SIE
(http://www.sandre.eaufrance.fr/IMG/pdf/ArchSIE_LivreVert2005_Final.pdf ) et par le schéma
web (http://www.reseau.eaufrance.fr/ressource/schema-web-diffusion-donnees-sie), à savoir :
1. Disposer sur les sites internet du SIE (thématiques, généralistes et de bassin) d’URL à exposer et
à consommer pour permettre l’accès à des ressources informationnelles du SIE sur le Web, et en
particulier les ressources portant sur les données.
2. Avoir un répertoire d’URI pour identifier des objets d'intérêt pour le SIE à l’échelle globale. Ces
URI devront pointer sur des ressources informationnelles quand un client web cherche à les
déréférencer (i.e., à accéder à une représentation particulière de la ressource en interrogeant l’URI
comme une URL).
Pour cela on appliquera autant que possible les bonnes pratiques du W3C concernant les URI :
http://www.w3.org/2013/dwbp/wiki/URI_Design_and_Management_for_Persistence
Ainsi que les éléments de réflexion portés sur les URL :
http://blog.2partsmagic.com/restful-uri-design/
Le document de spécification de l'IETF sur les URL :
http://www.ietf.org/rfc/rfc3986.txt.
et concernant les namespace xml :
http://www.w3.org/TR/xml-names11/
Solutions proposées
1) Sémiologie utilisée dans le document
Règle d’application obligatoire
Règle d’application facultative
Point d’information
2) Disposer d’URL pérennes et lisibles vers les ressources
a) Les principes généraux
1) La syntaxe générale des URL est décrite dans le document de spécification de l'IETF
http://www.ietf.org/rfc/rfc3986.txt. Une URL commence par « http:// », suivi d'un nom
de domaine, d'un chemin et optionnellement d'une requête précédée de « ? » et d'un
fragment précédé de « # ». Le chemin exprime une hiérarchie du plus général au plus
particulier (lue de gauche à droite), ses composantes étant séparées par le caractère
« / ».
2) Les URL de la toile Eaufrance doivent être indépendantes des technologies employées,
de manière à assurer une pérennité suffisante : les URL ne doivent pas comporter des
php ou asp, ou toute autre codification propre à la technologie employée ou au format
3) Ces URL doivent être autant que possible lisibles par l’utilisateur humain, facilement
compréhensibles et donnant une indication sur la hiérarchie des ressources.
4) Etant fréquemment cités dans des documents, il faut éviter les codages de caractères
spéciaux (tels que « %20 » pour représenter un espace), les répétitions de termes
signifiants et la présence de termes non signifiants (articles, prépositions, etc.) qui
allongent inutilement les URL et les rendent peu lisibles.
5) On évitera dans les URL les informations redondantes (ex : dictionnaires/dictionnaire).
b) Le cas des URL identifiées
1) Parmi ces URL, certaines doivent intégrer un code (un identifiant propre à un domaine
particulier) afin de désigner la ressource web concernant cet objet ainsi identifié, sur le
site concerné : on parlera d’URL identifiées (URLI)
2) Ces URLI seront normalisées selon le schéma suivant :
xxx.eaufrance.fr / {ressource niv 1} / {collections niv 2} … / {identifiant} /
{propriété} / {parametre}/…
3) Ainsi pour SISPEA, services.eaufrance.fr/ est la racine des ressources liées à la base
SISPEA, services.eaufrance.fr/communes" désigne la collection des communes, "
services.eaufrance.fr/communes/75056"
désigne
Paris,
"services.eaufrance.fr/communes/75056/exercices" la collection de ses exercices,
"services.eaufrance.fr/communes/75056/exercices/2009" son exercice 2009. Pour le
4)
5)
6)
7)
8)
service services.eaufrance.fr/services/17685, il est possible d’accéder directement aux
indicateurs par services.eaufrance.fr/services/17685/exercices/2009/indicateurs, au prix
de l'eau par services.eaufrance.fr/services/17685/exercises/2009/indicateurs/D102.0, et
à la fiche descriptive d'un indicateur par services.eaufrance.fr/indicateurs/D102.0
les ressources de type collection fournissent soit une liste des éléments de la collection
(par exemple pour les exercices) soit une interface de recherche (par exemple pour les
communes).
Le pluriel est recommandé pour les collections (quand il y a plusieurs valeurs
possibles).
Cette organisation de ressources dépend des ressources présentes sur le site : elle ne
peut donc être définie que par les responsables des sites, au moment de la définition des
fonctionnalités de navigation dans les sites.
Pour faciliter l’indexation des pages sur des moteurs de recherche, il peut être utile de mettre
un complément au nom d’une ressource, pour la rendre plus compréhensible : ex ouvragesprelevement, au niveau seulement de la ressource (pas des propriétés)..
Dans les URL, le format n’est indiqué que si plusieurs sont disponibles (html est le
format par défaut, le terme html ne doit pas être utilisé dans ce cas) : pdf, xml, … Pour
cela l’URL est complétée de /formats/pdf ou /formats/xml (et donc jamais formats/htm
ou formats/html, ni simplement .pdf ou .xml). Une URL se terminant par « /formats »
devrait conduire à la liste des formats disponibles pour la ressource concernée.
c) Le cas des autres URL
1) Des règles de formation des autres URL doivent également être appliquées, notamment
les principes généraux et les règles de navigation et d’encodage rappelées ci-dessous,
sans qu’une normalisation soit nécessaire.
2) L’optimisation des URL est un facteur essentiel pour le référencement par les moteurs
de recherche. La présence de mots-clés dans les URL devient dès lors capitale. Ainsi,
les sites privilégient l’utilisation d’URL statiques pour l’ensemble de leurs contenus
(articles, actualités,…), construites à partir de mots-clés permettant de caractériser la
ressource correspondante. Les sites évitent l’utilisation d’URL dynamiques générés sur
la base de codes internes au liés à une technologie. Par exemple une actualité sur la
parution
d’un
bulletin
de
situation
hydrologique
utilisera
« http://www.eaufrance.fr/actualites/bulletin-situation-hydrologique-mois-annee »
plutôt que « http://www.eaufrance.fr/actualite=123 »
3) On s’abstiendra rigoureusement d’utiliser des termes signifiants tronqués dont le
résultat ne signifie rien (exemples : « http://www.eaufrance.fr/les-documentstechniques-sur-les », « http://www.sandre.eaufrance.fr/Echanges-des-donnees-relativesau »).
d) Navigation dans les URL
1) Les URL doivent permettre de descendre dans l’arborescence des ressources en effaçant
de droite à gauche les composantes du chemin, par effeuillage de l'URL. Par exemple,
pour
l’indicateur
d’un
service
sur
Sispea,
http://www.services.eaufrance.fr/services/17685/exercices/2009/indicateurs/D102.0,
permet d’accéder à une ressource en enlevant les derniers éléments de l’adresse :
services.eaufrance.fr/services/17685/exercices/2009/indicateurs/D102.0 devrait offrir la
liste des indicateurs disponibles sur le service 17685 pour l’exercice 2009 (soit une page
spécifique, soit renvoyer vers services.eaufrance.fr/services/17685/exercices/2009, un
cran plus bas). De même services.eaufrance.fr/services/17685/exercices/2009 devrait
renvoyer vers la liste des années disponibles pour le service 17685, certainement en
renvoyant vers services.eaufrance.fr/services/17685.
2) Cette règle concerne autant les URLI que les simples URL
e) L’encodage des URL
1) Limiter l’URL à 2048 caractères, taille limite généralement admise sur Internet .
2) Les caractères employés dans les URL sont limités aux chiffres, aux lettres non
accentuées (alphabet anglais) majuscule et minuscule et à certains caractères : "-" "."
"!" "~" "*" "(" ")".
3) Les caractères suivants, utilisés de manière spécifique dans les URL, sont à éviter dans
les éléments textuels des URL : ";" "/" "?" "#" "@" " & " "=" "+" "$" ",".
4) Les caractères suivants, qui sont souvent utilisés comme délimiteurs autour des URL
dans les documents ne doivent pas non plus être utilisés pour les éléments textuels : "<"
">" """ (double-quotes). Il en est de même du caractère "%", qui est utilisé pour le
codage de caractères spéciaux. Le tiret bas "_" est à éviter, les moteurs de recherche
associant ce caractère à une liaison au sein d’un même mot (utiliser plutôt le tiret haut
"-" )
5) La casse est significative (« a » est différent de « A »), sauf dans le nom de domaine
(« eaufrance.fr » et « eauFrance.fr » désignent le même domaine).
6) Si les identifiants comportent des caractères « à éviter » par exemple un /, une règle
d'échappement devra être appliquée et documentée (transformer le / en « %2F »).
7) Les URL ne doivent pas comporter de ?, car certains moteurs de recherche peuvent ne
va pas plus loin dans l’indexation de l'URL, et cela n’est pas conforme à la syntaxe
indiquée plus haut (à base de /).
f) Documentation et usage des URL normées
1) Le Sandre maintiendra son codage actuel, à base d’URN, mais le décrira (attention à ce
que les documents provisoires ne soient pas atteignables par ce biais) (voir détail du
codage en annexe).
2) Les modalités de formation des URLI, et plus généralement, les modalités de
réutilisation des URL (qui doivent être traitées comme des données ouvertes), devront
être publiées sur chaque site Eaufrance sous forme d’une page particulière du site, avec
pour nom (relatif) « /liens ». Un lien vers cette page sera placé sur la page d’accueil
dans le bloc de bas des pages … (avec les crédits, avertissements, etc.)
3) Chaque site dispose d’un fichier sitemap.xml, listant l’ensemble des URL du site et
soumis aux moteurs de recherche.
4) L’ensemble de ces pages sera compilé sur une page du portail Eaufrance, afin de
faciliter l’accès aux données réparties entre les différents sites de la toile Eaufrance.
5) Les anciennes URL existantes actuellement devront rester utilisables, mais ne seront
plus documentées ; elles devront être traduites automatiquement dans les nouvelles
dans les navigateurs, de manière à favoriser l’usage de ces dernières.
6) Les URL ainsi définies et gérées seront consommées entre les sites de la toile
Eaufrance, créant ainsi une toile des données.
7) Le Sandre utilisera ces URL identifiées pour, à partir des pages de référentiel, pointer
vers les ressources des sites thématiques, progressivement (donc il faudra le prévoir
dans les dictionnaires référentiels, avec cardinalité 0-n).
g) Gouvernance
1) Chaque projet établit les modalités de formation de ses URL (identifiées ou non),
conformes aux règles ci-dessus, en commençant par les nouveaux sites de publication.
2) Ces propositions d’URL, seront soumises pour avis à la chef de projet Eaufrance.
3) Ces schémas de formation des URL, une fois validés, seront inscrits dans les
spécifications fonctionnelles des projets de site Internet, des évolutions ou des refontes
des sites existants.
4) La création d’URLI sera prioritairement réalisée sur les sites nationaux
2. Avoir un répertoire d’URI
a) Les principes généraux
1) Des URI seront créées pour désigner les objets d'intérêt pour le SIE par des noms
uniques à l’échelle du Web, afin de garantir l’interopérabilité des systèmes
d’information.
2) Ces URI pourront être utilisées comme sujet, prédicat ou objet d'une propriété, selon le
modèle du Web sémantique, ce qui suppose que ces objets soient décrits dans un
dictionnaire de données ; elles pourront aussi être utilisées comme une URL, i.e.
déréférencées pour obtenir une représentation informationnelle de ces objets ;
l'ensemble de ces URI est rassemblé dans un répertoire, qui fournit un service de
déréférencement.
3) Les URI sont administrées par le Sandre. Ils utilisent l’adresse http://id.eaufrance.fr
4) Les objets d'intérêt peuvent être de nature matérielle (cours d'eau, site de mesure, etc.)
ou immatérielle (jeu de données, scénario, paramètre),
5) Une URI sera composée de « http://id.eaufrance.fr/ » suivie d’éléments propres au SIE
selon le modèle générique : {type} / {identifiant} ou {type} / {identifiant} / {version}.
6) Le nom id.eaufrance.fr garantit l’unicité de l’autorité attribuant les URI aux objets
d’intérêt pour le SIE
7) {type} désigne un type d’objets sur lequel nous exerçons une autorité de nommage ; il
est enregistré dans une nomenclature administrée par le Sandre
8) {identifiant} désigne l’objet ; il est enregistré dans un jeu de données administré ou
diffusé par le Sandre
9) Dans le cas d’objets pour lesquels il existe plusieurs versions (par exemple, un
scénario), l’identifiant est complété par la mention de la version (par exemple,
« http://id.eaufrance.fr/scn/referentiel/3.1 ») : cependant le code « V3 », pour la version
3 d’une ressource, sera remplacé par le code « 3 ».
10) Dans ce qui si aucune version n’est indiquée, c’est la version la plus récente qui est
visée
11) Par exemple pour une station, l’URI sera de la forme « http://
id.eaufrance.fr/stq/0123456789 », « stq » indiquant le type de ressource concerné, et
0123456789 identifiant un objet de ce type, ici une station particulière.
12) Dans le cas des stations, il existe un élément plus fin, le point de prélèvement, qui
dispose d’identifiants secondaires, qui n’ont de sens que dans le domaine
d’identification de la station. Dans ce cas la forme suivante de l’URI de l’objet point de
prélèvement
au
sein
du
référentiel station
sera
utilisée :
:
« http://id.eaufrance.fr/stq/0123456789#001 » (attention cependant, dans les adresses
URI, seul un # est autorisé, donc il ne faut gérer ainsi qu’un seul niveau d’identifiant
secondaire).
13) Dans le cas (rare) où un code est composé de plusieurs identifiants primaire, par
exemple le cas des ouvrages, alors chacune des clefs est séparé par le caractère ~
(exemple 01234~5667) ; le dictionnaire du Sandre indiquera l’ordre de présentation des
clefs
14) Dans le cas des données versionnées, ou avec date, l’une URI est datée (ou versionnée)
de type statique « http://id.eaufrance.fr/jdr/stq/2013 », ou l’URI peut être de type
dynamique « http://id.eaufrance.fr/jdr/stq/actuel », ou sans « /actuel », qui sera
déréférencée avec la version la plus récente du jeu de données (qui devra
obligatoirement contenir une date ou un numéro de version);
15) Pour les dictionnaires, le répertoire d’URI sera de la forme :
« http://id.eaufrance.fr/ddd/qul/2002-1 », « ddd » indiquant le type d’objets, ici les
dictionnaires, « qul » étant l’identifiant d’un dictionnaire, dans ce référentiel, et 2002-1
la version.
16) Le Sandre devra donc administrer une nomenclature des types d’objets d’intérêt pour le
SIE, en complétant une nomenclature existante :
o Une nomenclature des jeux de données de référence (nomenclature 373), par
exemple « stq » (stations de mesure de la qualité), « mdo » (masses d’eau).
o Une nomenclature des types de ressources (nomenclature 760) visant les jeux de
données de référence, dictionnaires de données, scénarios … (jdd, jdr, ddd, scn, …)
o Le Sandre veillera à ce qu’il n’y ai pas des identifiants identiques entre ces deux
nomenclatures, 373 et 760
17) Ainsi, pour un même référentiel, différentes URI disponibles sont :
o URI du référentiel (jeu de données de référence). Ex : http://id.eaufrance.fr/jdr/stq
o URI de l’objet au sein du référentiel : http://id.eaufrance.fr/stq/0123456789
o URI du dictionnaire : http://id.eaufrance.fr/ddd/qul/2002-1
o URI du scenario référentiel : http://id.eaufrance.fr/scn/referentiel/3.1
b) Cas particulier des identifiants prévus par la directive Inspire
1) Un cas particulier concerne les identifiants uniques européens et les métadonnées,
imposés par la directive Inspire : la directive impose de disposer d’un identifiant
unique européen (de fait une URI) pour tous les jeux de données visées par la directive,
ainsi que pour tous les objets les constituant, c'est-à-dire aussi bien pour les référentiels
du Sandre que pour les données non référentiel du Sandre. La directive ne précise pas
comment créer ces identifiants.
2) Le mécanisme de gestion des URI des référentiels du SIE est conforme aux exigences
de la directive Inspire : http://id.eaufrance.fr/jdr/stq est bien un identifiant unique,
désignant
un
jeu
de
données
(les
stations
qualité)
et
http://id.eaufrance.fr/stq/0123456789 désigne bien au sein de ce jeu une station
particulière.
3) Ces URI sont décomposées dans les métadonnées Inspire en un identifiant (pour une
station : stq/0123456789) (balise <RS_Identifier> <code>) rattachée à un espace de
nom (ici http://id.eaufrance.fr/) (balise <RS_Identifier> <codeSpace>)
4) Par ailleurs, Inspire impose de disposer pour toutes ces données de fichiers de
métadonnées, accessibles via le web par des mécanismes de moissonnage : cela
suppose que ces métadonnées disposent d’un identifiant unique, identifiant de manière
identique toutes les copies de la métadonnée issues du moissonnage (un site A
moissonne sur un site B la fiche portant l’identifiant bbbb ; sur le site A cette fiche a le
même identifiant bbbb).
5) Pour assurer une unicité fonctionnelle fiable, quelle que soit la pratique de gestion des
identifiants uniques sur les jeux de données, il est recommandé d’utiliser comme
identifiant de la métadonnée un UUID (clef unique universelle, basée sur le MAC de
l’ordinateur émetteur). Par exemple, la fiche de métadonnée du référentiel station porte
le code (balise fileIdentifier) f9d22652-a741-4080-9d44-13d522d17bb5, et est
accessible sur data.eaufrance par l’URL http://www.data.eaufrance.fr/jdd/f9d22652a741-4080-9d44-13d522d17bb5
et
sur
le
géocatalogue
par
http://www.geocatalogue.fr/Detail.do?fileIdentifier=f9d22652-a741-4080-9d4413d522d17bb5
6) L’URI des métadonnées sera donc composée à partir de l’UUID de sa fiche de
métadonnée : http://id.eaufrance.fr/jdd/ec9b2bb2-f862-4eb7-8d2f-7a47870079ea , et
sera déréférencée sur http://www.data.eaufrance.fr/jdd/f9d22652-a741-4080-9d4413d522d17bb5.
7) Le lien entre cette fiche de métadonnée et la donnée se fait au sein de la fiche de
métadonnée, via l’URI de la donnée. Le lien de l’URI de la donnée vers la fiche de
métadonnée (comment consulter une fiche de métadonnée, à partir de l’identifiant de la
donnée), se fera, après déréférencement de l’URI de la donnée, par un lien vers l’URI
de la métadonnée présent sur la ressource décrivant la donnée.
c) L’encodage des URI
1) Les règles d’encodage des URI sont celles rappelées plus haut pour les URL (article 2e).
d) Les modalités de formation des identifiants utilisés par les URI
1) Les URI sont basées sur l’existence d’identifiants, gérés principalement dans le cadre
du Sandre : ces identifiants devraient répondre aux règles suivantes :
2) Les identifiants du Sandre portant sur de nombreux objets doivent être autant que
possible non signifiants. A l’inverse, certaines nomenclatures ont des identifiants
« littéraux », pouvant passer pour des identifiants signifiants :
o nomenclature des données de référence (nomenclature 373)
o nomenclature des types de ressources (ddd, scn, …)
3) Les identifiants non signifiants peuvent cependant être emboités : exemple des stations
et points de prélèvement, des communes et des départements ; l’identifiant complet
d’un point de prélèvement est alors la concaténation des deux identifiants, celui de la
station concerné, suivi de celui du point de prélèvement dans cette station
4) Pour un même type de donnée, les identifiants ne peuvent pas être réutilisés : si un
objet disparait ou est gelé, son identifiant ne peut plus être utilisé pour désigner un
autre objet du même type.
5) Les identifiants ne devraient pas comporter les caractères suivants : ";" "/" "?" "@" "
& " "=" "+" "$" "," "<" ">" "#" "%" <"> (cohérence d’écriture avec les URL et
URI).
6) La casse doit être respectée et a un sens dans les identifiants (a est différent de A).
7) Les règles d’écriture des identifiants (type de caractère, longueur de l’identifiant, …)
doivent être décrites dans les dictionnaires du Sandre.
e) Développement des URI
1) Le SIE commencera par créer les URI correspondant aux URLI du point 1 (elles ont
des ressources publiées).
2) Le SIE ne crée pas les URI pour les ressources des autres (ceux qui ont l’autorité sur
ces ressources). Donc par exemple le SIE ne crée pas les URI des communes (existent
à l’Insee, il faut donc se référer à ces URI Insee).
3) Le SIE référence en URI les documents publiés sous réserve qu’ils disposent d’un
identifiant reconnu (ISBN).
4) Le tout s’appuiera sur le dictionnaire des documents du Sandre, a finaliser et publier.
f) L’usage des URI
1) Les URI sont d’abord employées comme des noms avec un objectif d’interopérabilité
des systèmes d’information ; par conséquent, les jeux de données, dans les formats
simplifiés, incluront les URI des objets en complément de leurs codes, qui y figurent
déjà.
2) Pour satisfaire à l’objectif d’accessibilité, les URI pourront être employées comme des
URL, pour fournir à un client web, qui attend une ressource informationnelle, une page
html décrivant cet objet, généralement sur le site du Sandre.
3) A terme, le déréférencement de cette URI se fera aussi par une description de l’objet
par un graphe RDF quand le client n’est pas un navigateur web ou si cette
représentation est explicitement demandée (c’est l’étape linked data).
4) Les URI devront pouvoir être déréférencer par un flux (xml, WFS, …) si cela
correspond à la demande du logiciel client.
5) L’accès aux différents formats de téléchargement simple (hors accès aux flux) d’une
même ressource via l’URI passe par l’accès à la page html.
g) Les principes pour les espaces de noms des schémas XML du Sandre
1) Le Sandre utilise déjà des URI comme espace de noms (namespace) pour qualifier le
vocabulaire employé (classes et attributs) dans ses scénarios d’échanges et dans ses
dictionnaires;
par
exemple
l’espace
de
noms
http://xml.sandre.eaufrance.fr/scenario/quesu/3, abrégé en « sa_stq », permet de
désigner sans ambiguïté l’entité sa_stq : StationMesureEauxSurface et l’attribut
sa_stq :SuperficieBassinVersantTopo.
2) Les URI des espaces de noms du Sandre sont créées selon le modèle générique :
http://xml.sandre.eaufrance.fr/scenario/{identifiant}/{version} pour les scénarios et
http://xml.sandre.eaufrance.fr/{identifiant}/{version} pour les dictionnaires, par
exemple
http://xml.sandre.eaufrance.fr/dc/2.2,
http://xml.sandre.eaufrance.fr/scenario/si_dc/2.2,
http://xml.sandre.eaufrance.fr/mdo/1.2,
http://xml.sandre.eaufrance.fr/Composants/1
3) Ces URI spécifiques sont gérées par le Sandre, et utilisées dans les schémas XML
associés à ses dictionnaires et à ses scénarios d’échange.
4) Le déréférencement de ces URI se fait en renvoyant vers une page d’accès au
chargement du schéma XML concerné.
h) Gouvernance
1) Les nomenclatures utiles pour créer les URI et les principes généraux d’URI seront
validées par le GPS.
2) Pour chaque nouveau référentiel, les principes de structuration des URI sera défini par
le Sandre, et vérifié par les ADD.
3) Les dictionnaires et scénarios seront complétés pour permettre l’inclusion des URI
dans les jeux de données publiés
4) Le déréférencement de ces URI vers des ressources html devra être indiqué au groupe
ADD.
5) Les modalités d’écriture des URI seront affichées dans la page ad-hoc de
sandre.eaufrance.fr.
Annexes
exemples d’implémentation sur des cas concrets
Exemple Stations qualité eau souterraine
Ressource
Dictionnaire
principal
(versions)
URL actuelles / URL future recommandée
http://sandre.eaufrance.fr/ftp/documents/fr/ddd/qul/20021/sandre_dictionnaire_QUL_2002-1.pdf
http://sandre.eaufrance.fr/dictionnaires/qul/2002-1/pdf
URI
id.eaufrance.fr/ddd/qul/2002-1
Scenarios
référentiel
(versions)
http://sandre.eaufrance.fr/ftp/documents/fr/scn/referentiel/3.1
/sandre_sc_referentiels_v3.1.pdf
http://xml.sandre.eaufrance.fr/scenario/referentiel/3.1/sandre
_sc_referentiel.xsd
http://sandre.eaufrance.fr/scenarios/referentiel/3.1/pdf
http://xml.sandre.eaufrance.fr/scenarios/referentiel/3.1/x
ml
Non disponible
id.eaufrance.fr/scn/
referentiel/3.1
Référentiel
station alpha
Référentiel
station ig
Métadonnée
référentiel
stations
Métadonnée
??
http://www.data.eaufrance.fr/jdd/dbfd7fc6-2750-43e580fa-58572f064f3b
http://www.data.eaufrance.fr/jdd/02cbf41b-0fc4-4fa7-
Déférencé par
http://sandre.eaufrance.f
r/dictionnaires/qul/20021
(page web présentant le
dictionnaire)
http://sandre.eaufrance.f
r/scenarios/referentiel/3.1
(page web présentant le
scénario)
ades qualité
Stations
8ab8-5eb2c13215974fa7-8ab8-5eb2c1321597
http://www.ades.eaufrance.fr/FichePtEau.aspx?code=03636
X0955/PZPP2
http://www.ades.eaufrance.fr/pointseau/03636X0955%2F PZPP2
Données de
mesure sur
station ades
(Paramètres,
dates)
http://www.ades.eaufrance.fr/FicheMesuresQualito.aspx?co
de=03636X0955%2fPZPP2&type_qualito=1&type_pt_eau
=&datedeb=15%2f06%2f1998&datefin
http://www.ades.eaufrance.fr/mesuresqualito/03636X0955~PZPP2/datedebut/1998-15-06
id.eaufrance.fr/pte/03636X0955
%2F PZPP2
http://www.ades.eaufran
ce.fr/pointseau/03636X0955%2F
PZPP2
Exemple sispea
Ressource
Dictionnaire
principal (versions)
Scenarios (versions)
Référentiel step
alpha
Référentiel step ig
Métadonnées step
Métadonnées sispea
selon jeu de donnée
URL actuelles / URL future recommandée
URI
http://services.sandre.eaufrance.fr/telechargement/geo/Sy id.eaufrance.fr/jdr/step
sTraitementEauxUsees_FRA-csv.zip
?????
http://services.sandre.eaufrance.fr/telechargement/geo/Sy
sTraitementEauxUsees_FRA-mif.zip
http://www.data.eaufrance.fr/jdd/ebef2115-bee540bb-b5cc-4593d82ba334
6 métadonnées ! 6 types de données !
Services publics d'assainissement non collectif, collectif
et eau potable :- composition communale des services
Services publics d'assainissement non collectif, collectif
et eau potable :- description et indicateurs de performance
Déférencé par
http://www.data.eaufrance.fr/jdd/a8d7a630-b33d4c0b-a865-ecbe20360de5
Données sur les
communes (avec
année si besoin)
Données sur
le service
Données sur
l’autorité
organisatrice (avec
année si besoin)
www.services.eaufrance.fr/sispea/voirCommune.action?i
nsee=45100
services.eaufrance.fr/communes/45100
http://www.services.eaufrance.fr/sispea/showSPEAPrese
ntationAction.action?id=176855&chosenExerciseId=101
services.eaufrance.fr/services/176855/exercices/2009
www.services.eaufrance.fr/sispea/voirCollectivite.action?
siren=217500016&annee=2009
services.eaufrance.fr/autorites/217500016
/exercices/2009
id.eaufrance.fr/spea/1768
5
services.eaufrance.fr/service/1
76855
Format de base d'une URN Sandre
urn:sandre:[ressource]:[code de la ressource(-sous-ensemble)n]:[pour un doc, version de la ressource; pour un référentiel, version de diffusion de
la ressource]:[balise xml de l'objet filtre]:[valeur de l'attribut]:[identifiant de la révision]:[format]
Liste des ressources Sandre (voir $GLOBALS["RESSOURCES_SANDRE"])
referentiel : Pour designer les jeux de données dans OGRES
notice : Pour designer les notices documentaires
dictionnaire : pour les dico sandre
scenario : pour les scenario sandre <=> synonyme de scenario-d-echanges
referentiels : pour les anciennes urn de geonetwork
page : pour les pages web du site
service : pour les webservices
+ liste des types de document gérer par SPIP (plugin notice)
Liste des formats dispo ( voir $GLOBALS["FORMATS_SANDRE"]):
"html", "pdf","xml", "xsd", "csv", "gzip", "zip".
[modifier]
Exemple : http://www.sandre.eaufrance.fr/urn.php?urn=urn:sandre:donnees:PAR::CdParametre:1340:::referentiel:2:html
Lisible sans « urn.php » : http://www.sandre.eaufrance.fr/?urn=urn:sandre:donnees:PAR::CdParametre:1340:::referentiel:2:html