Guide sur l`interopérabilité des ressources de la toile Eaufrance
Transcription
Guide sur l`interopérabilité des ressources de la toile Eaufrance
Guide sur l'interopérabilité des ressources de la toile Eaufrance Titre : Guide d’interopérabilité des ressources de la toile Eaufrance Statut : non validé, V6.4.1 Créateur : René Lalement, Laurent Coudercy, Dimitri Meunier, Anne Macaire Mots clefs : web ; interopérabilité ; identifiants ; liens hypertextes Résumé : Ce guide fixe les règles et modalités d’écriture des URL normées du SIE, ainsi que des URI constituant un répertoire des identifiants uniques universels du SIE. Editeur : Onema Date d’édition : Langue : FR Droits d’usage : http://creativecommons.org/licenses/by-nc-sa/2.0/fr/ Sommaire Contexte et besoins .............................................................................................................................3 Objectif ...............................................................................................................................................3 Solutions proposées ............................................................................................................................5 1) Sémiologie utilisée dans le document.....................................................................................5 2) Disposer d’URL pérennes et lisibles vers les ressources ........................................................5 a) Les principes généraux........................................................................................................5 b) Le cas des URL identifiées .................................................................................................5 c) Le cas des autres URL ........................................................................................................6 d) Navigation dans les URL ....................................................................................................6 e) L’encodage des URL ..........................................................................................................7 f) Documentation et usage des URL normées ........................................................................7 g) Gouvernance .......................................................................................................................8 2. Avoir un répertoire d’URI...........................................................................................................8 a) Les principes généraux........................................................................................................8 b) Cas particulier des identifiants prévus par la directive Inspire .........................................10 c) L’encodage des URI .........................................................................................................11 d) Les modalités de formation des identifiants utilisés par les URI......................................11 e) Développement des URI ...................................................................................................11 f) L’usage des URI ...............................................................................................................11 g) Les principes pour les espaces de noms des schémas XML du Sandre............................12 h) Gouvernance .....................................................................................................................12 Annexes.............................................................................................................................................13 Exemple Stations qualité eau souterraine .....................................................................................13 Exemple sispea..............................................................................................................................14 Format de base d'une URN Sandre ...............................................................................................15 Contexte et besoins Les réflexions sur l’accès aux données sur l’eau, dans le sillage de la conférence environnementale de septembre 2013, et les observations recueillies lors du hackathon de juin 2014, montrent que des progrès doivent être faits pour faciliter et fiabiliser l’accès sur le Web aux ressources du SIE et assurer une meilleure interopérabilité des systèmes d’information, tant pour les utilisateurs (humains) que les applications. Le cadre de la refonte d’Eaufrance et le développement de nouveaux sites de publication (BNPE, ONDE, Naïades-diffusion) sont une occasion de fixer et de mettre en œuvre des règles techniques assurant la persistance des URL utilisées, leur normalisation et leur documentation, en particulier pour des ressources clefs pour le système d’information. Objectif Ce qui fait l’originalité de la notion et du fonctionnement du Web repose principalement sur la capacité à créer des liens entre ressources web (pages html, fichiers, …), d’où le nom de « toile ». L'existence de ces liens suppose que leurs cibles soient munies d'un nom, unique à l'échelle du Web, appelé URL (Uniform Resource Locator). Ce nom a une fonction d'adresse, permettant d'accéder à la ressource, ou plus exactement à une représentation de la ressource. Si la fonction d'adresse n'est pas requise, mais que le besoin est de disposer d’un nom unique (un identifiant), on parle seulement d'URI (Uniform Resource Identifier). Ces noms (URL et URI) constituent le principal facteur d’interopérabilité des systèmes d’information opérant sur le Web. Cependant, on constate régulièrement une faiblesse de ce système à base d’URL, quand il est mis en œuvre sans précaution particulière : les liens permettant d’aller d’une ressource à l’autre sont rapidement cassés, dès que l’adresse de la ressource cible change. Par ailleurs, les adresses Internet non organisées et non documentées ne facilitent pas toujours la liaison entre ressources, en particulier en ne permettant pas de prévoir l’adresse d’une ressource à partir d’identifiants connus, ni d’obtenir la signification de ces identifiants sans connaissance de leur contexte.. Les objectifs d’accessibilité et d’interopérabilité ne sont alors pas atteints. Ce constat amène à se poser la question, pour le SIE, de la persistance des URL utilisées, de leur normalisation et de leur documentation, en particulier pour des ressources clefs pour le système d’information ou ses partenaires. Il faut donc définir une organisation, une structuration des URL pensée pour faciliter les liaisons, tant par des machines que par des êtres humains (ce sont les principaux utilisateurs des liens en question). Cela amène à réfléchir à deux types de besoin en matière d’interopérabilité liés aux URL et URI du SIE, dans la logique évoquée par le livre vert d’architecture du SIE (http://www.sandre.eaufrance.fr/IMG/pdf/ArchSIE_LivreVert2005_Final.pdf ) et par le schéma web (http://www.reseau.eaufrance.fr/ressource/schema-web-diffusion-donnees-sie), à savoir : 1. Disposer sur les sites internet du SIE (thématiques, généralistes et de bassin) d’URL à exposer et à consommer pour permettre l’accès à des ressources informationnelles du SIE sur le Web, et en particulier les ressources portant sur les données. 2. Avoir un répertoire d’URI pour identifier des objets d'intérêt pour le SIE à l’échelle globale. Ces URI devront pointer sur des ressources informationnelles quand un client web cherche à les déréférencer (i.e., à accéder à une représentation particulière de la ressource en interrogeant l’URI comme une URL). Pour cela on appliquera autant que possible les bonnes pratiques du W3C concernant les URI : http://www.w3.org/2013/dwbp/wiki/URI_Design_and_Management_for_Persistence Ainsi que les éléments de réflexion portés sur les URL : http://blog.2partsmagic.com/restful-uri-design/ Le document de spécification de l'IETF sur les URL : http://www.ietf.org/rfc/rfc3986.txt. et concernant les namespace xml : http://www.w3.org/TR/xml-names11/ Solutions proposées 1) Sémiologie utilisée dans le document Règle d’application obligatoire Règle d’application facultative Point d’information 2) Disposer d’URL pérennes et lisibles vers les ressources a) Les principes généraux 1) La syntaxe générale des URL est décrite dans le document de spécification de l'IETF http://www.ietf.org/rfc/rfc3986.txt. Une URL commence par « http:// », suivi d'un nom de domaine, d'un chemin et optionnellement d'une requête précédée de « ? » et d'un fragment précédé de « # ». Le chemin exprime une hiérarchie du plus général au plus particulier (lue de gauche à droite), ses composantes étant séparées par le caractère « / ». 2) Les URL de la toile Eaufrance doivent être indépendantes des technologies employées, de manière à assurer une pérennité suffisante : les URL ne doivent pas comporter des php ou asp, ou toute autre codification propre à la technologie employée ou au format 3) Ces URL doivent être autant que possible lisibles par l’utilisateur humain, facilement compréhensibles et donnant une indication sur la hiérarchie des ressources. 4) Etant fréquemment cités dans des documents, il faut éviter les codages de caractères spéciaux (tels que « %20 » pour représenter un espace), les répétitions de termes signifiants et la présence de termes non signifiants (articles, prépositions, etc.) qui allongent inutilement les URL et les rendent peu lisibles. 5) On évitera dans les URL les informations redondantes (ex : dictionnaires/dictionnaire). b) Le cas des URL identifiées 1) Parmi ces URL, certaines doivent intégrer un code (un identifiant propre à un domaine particulier) afin de désigner la ressource web concernant cet objet ainsi identifié, sur le site concerné : on parlera d’URL identifiées (URLI) 2) Ces URLI seront normalisées selon le schéma suivant : xxx.eaufrance.fr / {ressource niv 1} / {collections niv 2} … / {identifiant} / {propriété} / {parametre}/… 3) Ainsi pour SISPEA, services.eaufrance.fr/ est la racine des ressources liées à la base SISPEA, services.eaufrance.fr/communes" désigne la collection des communes, " services.eaufrance.fr/communes/75056" désigne Paris, "services.eaufrance.fr/communes/75056/exercices" la collection de ses exercices, "services.eaufrance.fr/communes/75056/exercices/2009" son exercice 2009. Pour le 4) 5) 6) 7) 8) service services.eaufrance.fr/services/17685, il est possible d’accéder directement aux indicateurs par services.eaufrance.fr/services/17685/exercices/2009/indicateurs, au prix de l'eau par services.eaufrance.fr/services/17685/exercises/2009/indicateurs/D102.0, et à la fiche descriptive d'un indicateur par services.eaufrance.fr/indicateurs/D102.0 les ressources de type collection fournissent soit une liste des éléments de la collection (par exemple pour les exercices) soit une interface de recherche (par exemple pour les communes). Le pluriel est recommandé pour les collections (quand il y a plusieurs valeurs possibles). Cette organisation de ressources dépend des ressources présentes sur le site : elle ne peut donc être définie que par les responsables des sites, au moment de la définition des fonctionnalités de navigation dans les sites. Pour faciliter l’indexation des pages sur des moteurs de recherche, il peut être utile de mettre un complément au nom d’une ressource, pour la rendre plus compréhensible : ex ouvragesprelevement, au niveau seulement de la ressource (pas des propriétés).. Dans les URL, le format n’est indiqué que si plusieurs sont disponibles (html est le format par défaut, le terme html ne doit pas être utilisé dans ce cas) : pdf, xml, … Pour cela l’URL est complétée de /formats/pdf ou /formats/xml (et donc jamais formats/htm ou formats/html, ni simplement .pdf ou .xml). Une URL se terminant par « /formats » devrait conduire à la liste des formats disponibles pour la ressource concernée. c) Le cas des autres URL 1) Des règles de formation des autres URL doivent également être appliquées, notamment les principes généraux et les règles de navigation et d’encodage rappelées ci-dessous, sans qu’une normalisation soit nécessaire. 2) L’optimisation des URL est un facteur essentiel pour le référencement par les moteurs de recherche. La présence de mots-clés dans les URL devient dès lors capitale. Ainsi, les sites privilégient l’utilisation d’URL statiques pour l’ensemble de leurs contenus (articles, actualités,…), construites à partir de mots-clés permettant de caractériser la ressource correspondante. Les sites évitent l’utilisation d’URL dynamiques générés sur la base de codes internes au liés à une technologie. Par exemple une actualité sur la parution d’un bulletin de situation hydrologique utilisera « http://www.eaufrance.fr/actualites/bulletin-situation-hydrologique-mois-annee » plutôt que « http://www.eaufrance.fr/actualite=123 » 3) On s’abstiendra rigoureusement d’utiliser des termes signifiants tronqués dont le résultat ne signifie rien (exemples : « http://www.eaufrance.fr/les-documentstechniques-sur-les », « http://www.sandre.eaufrance.fr/Echanges-des-donnees-relativesau »). d) Navigation dans les URL 1) Les URL doivent permettre de descendre dans l’arborescence des ressources en effaçant de droite à gauche les composantes du chemin, par effeuillage de l'URL. Par exemple, pour l’indicateur d’un service sur Sispea, http://www.services.eaufrance.fr/services/17685/exercices/2009/indicateurs/D102.0, permet d’accéder à une ressource en enlevant les derniers éléments de l’adresse : services.eaufrance.fr/services/17685/exercices/2009/indicateurs/D102.0 devrait offrir la liste des indicateurs disponibles sur le service 17685 pour l’exercice 2009 (soit une page spécifique, soit renvoyer vers services.eaufrance.fr/services/17685/exercices/2009, un cran plus bas). De même services.eaufrance.fr/services/17685/exercices/2009 devrait renvoyer vers la liste des années disponibles pour le service 17685, certainement en renvoyant vers services.eaufrance.fr/services/17685. 2) Cette règle concerne autant les URLI que les simples URL e) L’encodage des URL 1) Limiter l’URL à 2048 caractères, taille limite généralement admise sur Internet . 2) Les caractères employés dans les URL sont limités aux chiffres, aux lettres non accentuées (alphabet anglais) majuscule et minuscule et à certains caractères : "-" "." "!" "~" "*" "(" ")". 3) Les caractères suivants, utilisés de manière spécifique dans les URL, sont à éviter dans les éléments textuels des URL : ";" "/" "?" "#" "@" " & " "=" "+" "$" ",". 4) Les caractères suivants, qui sont souvent utilisés comme délimiteurs autour des URL dans les documents ne doivent pas non plus être utilisés pour les éléments textuels : "<" ">" """ (double-quotes). Il en est de même du caractère "%", qui est utilisé pour le codage de caractères spéciaux. Le tiret bas "_" est à éviter, les moteurs de recherche associant ce caractère à une liaison au sein d’un même mot (utiliser plutôt le tiret haut "-" ) 5) La casse est significative (« a » est différent de « A »), sauf dans le nom de domaine (« eaufrance.fr » et « eauFrance.fr » désignent le même domaine). 6) Si les identifiants comportent des caractères « à éviter » par exemple un /, une règle d'échappement devra être appliquée et documentée (transformer le / en « %2F »). 7) Les URL ne doivent pas comporter de ?, car certains moteurs de recherche peuvent ne va pas plus loin dans l’indexation de l'URL, et cela n’est pas conforme à la syntaxe indiquée plus haut (à base de /). f) Documentation et usage des URL normées 1) Le Sandre maintiendra son codage actuel, à base d’URN, mais le décrira (attention à ce que les documents provisoires ne soient pas atteignables par ce biais) (voir détail du codage en annexe). 2) Les modalités de formation des URLI, et plus généralement, les modalités de réutilisation des URL (qui doivent être traitées comme des données ouvertes), devront être publiées sur chaque site Eaufrance sous forme d’une page particulière du site, avec pour nom (relatif) « /liens ». Un lien vers cette page sera placé sur la page d’accueil dans le bloc de bas des pages … (avec les crédits, avertissements, etc.) 3) Chaque site dispose d’un fichier sitemap.xml, listant l’ensemble des URL du site et soumis aux moteurs de recherche. 4) L’ensemble de ces pages sera compilé sur une page du portail Eaufrance, afin de faciliter l’accès aux données réparties entre les différents sites de la toile Eaufrance. 5) Les anciennes URL existantes actuellement devront rester utilisables, mais ne seront plus documentées ; elles devront être traduites automatiquement dans les nouvelles dans les navigateurs, de manière à favoriser l’usage de ces dernières. 6) Les URL ainsi définies et gérées seront consommées entre les sites de la toile Eaufrance, créant ainsi une toile des données. 7) Le Sandre utilisera ces URL identifiées pour, à partir des pages de référentiel, pointer vers les ressources des sites thématiques, progressivement (donc il faudra le prévoir dans les dictionnaires référentiels, avec cardinalité 0-n). g) Gouvernance 1) Chaque projet établit les modalités de formation de ses URL (identifiées ou non), conformes aux règles ci-dessus, en commençant par les nouveaux sites de publication. 2) Ces propositions d’URL, seront soumises pour avis à la chef de projet Eaufrance. 3) Ces schémas de formation des URL, une fois validés, seront inscrits dans les spécifications fonctionnelles des projets de site Internet, des évolutions ou des refontes des sites existants. 4) La création d’URLI sera prioritairement réalisée sur les sites nationaux 2. Avoir un répertoire d’URI a) Les principes généraux 1) Des URI seront créées pour désigner les objets d'intérêt pour le SIE par des noms uniques à l’échelle du Web, afin de garantir l’interopérabilité des systèmes d’information. 2) Ces URI pourront être utilisées comme sujet, prédicat ou objet d'une propriété, selon le modèle du Web sémantique, ce qui suppose que ces objets soient décrits dans un dictionnaire de données ; elles pourront aussi être utilisées comme une URL, i.e. déréférencées pour obtenir une représentation informationnelle de ces objets ; l'ensemble de ces URI est rassemblé dans un répertoire, qui fournit un service de déréférencement. 3) Les URI sont administrées par le Sandre. Ils utilisent l’adresse http://id.eaufrance.fr 4) Les objets d'intérêt peuvent être de nature matérielle (cours d'eau, site de mesure, etc.) ou immatérielle (jeu de données, scénario, paramètre), 5) Une URI sera composée de « http://id.eaufrance.fr/ » suivie d’éléments propres au SIE selon le modèle générique : {type} / {identifiant} ou {type} / {identifiant} / {version}. 6) Le nom id.eaufrance.fr garantit l’unicité de l’autorité attribuant les URI aux objets d’intérêt pour le SIE 7) {type} désigne un type d’objets sur lequel nous exerçons une autorité de nommage ; il est enregistré dans une nomenclature administrée par le Sandre 8) {identifiant} désigne l’objet ; il est enregistré dans un jeu de données administré ou diffusé par le Sandre 9) Dans le cas d’objets pour lesquels il existe plusieurs versions (par exemple, un scénario), l’identifiant est complété par la mention de la version (par exemple, « http://id.eaufrance.fr/scn/referentiel/3.1 ») : cependant le code « V3 », pour la version 3 d’une ressource, sera remplacé par le code « 3 ». 10) Dans ce qui si aucune version n’est indiquée, c’est la version la plus récente qui est visée 11) Par exemple pour une station, l’URI sera de la forme « http:// id.eaufrance.fr/stq/0123456789 », « stq » indiquant le type de ressource concerné, et 0123456789 identifiant un objet de ce type, ici une station particulière. 12) Dans le cas des stations, il existe un élément plus fin, le point de prélèvement, qui dispose d’identifiants secondaires, qui n’ont de sens que dans le domaine d’identification de la station. Dans ce cas la forme suivante de l’URI de l’objet point de prélèvement au sein du référentiel station sera utilisée : : « http://id.eaufrance.fr/stq/0123456789#001 » (attention cependant, dans les adresses URI, seul un # est autorisé, donc il ne faut gérer ainsi qu’un seul niveau d’identifiant secondaire). 13) Dans le cas (rare) où un code est composé de plusieurs identifiants primaire, par exemple le cas des ouvrages, alors chacune des clefs est séparé par le caractère ~ (exemple 01234~5667) ; le dictionnaire du Sandre indiquera l’ordre de présentation des clefs 14) Dans le cas des données versionnées, ou avec date, l’une URI est datée (ou versionnée) de type statique « http://id.eaufrance.fr/jdr/stq/2013 », ou l’URI peut être de type dynamique « http://id.eaufrance.fr/jdr/stq/actuel », ou sans « /actuel », qui sera déréférencée avec la version la plus récente du jeu de données (qui devra obligatoirement contenir une date ou un numéro de version); 15) Pour les dictionnaires, le répertoire d’URI sera de la forme : « http://id.eaufrance.fr/ddd/qul/2002-1 », « ddd » indiquant le type d’objets, ici les dictionnaires, « qul » étant l’identifiant d’un dictionnaire, dans ce référentiel, et 2002-1 la version. 16) Le Sandre devra donc administrer une nomenclature des types d’objets d’intérêt pour le SIE, en complétant une nomenclature existante : o Une nomenclature des jeux de données de référence (nomenclature 373), par exemple « stq » (stations de mesure de la qualité), « mdo » (masses d’eau). o Une nomenclature des types de ressources (nomenclature 760) visant les jeux de données de référence, dictionnaires de données, scénarios … (jdd, jdr, ddd, scn, …) o Le Sandre veillera à ce qu’il n’y ai pas des identifiants identiques entre ces deux nomenclatures, 373 et 760 17) Ainsi, pour un même référentiel, différentes URI disponibles sont : o URI du référentiel (jeu de données de référence). Ex : http://id.eaufrance.fr/jdr/stq o URI de l’objet au sein du référentiel : http://id.eaufrance.fr/stq/0123456789 o URI du dictionnaire : http://id.eaufrance.fr/ddd/qul/2002-1 o URI du scenario référentiel : http://id.eaufrance.fr/scn/referentiel/3.1 b) Cas particulier des identifiants prévus par la directive Inspire 1) Un cas particulier concerne les identifiants uniques européens et les métadonnées, imposés par la directive Inspire : la directive impose de disposer d’un identifiant unique européen (de fait une URI) pour tous les jeux de données visées par la directive, ainsi que pour tous les objets les constituant, c'est-à-dire aussi bien pour les référentiels du Sandre que pour les données non référentiel du Sandre. La directive ne précise pas comment créer ces identifiants. 2) Le mécanisme de gestion des URI des référentiels du SIE est conforme aux exigences de la directive Inspire : http://id.eaufrance.fr/jdr/stq est bien un identifiant unique, désignant un jeu de données (les stations qualité) et http://id.eaufrance.fr/stq/0123456789 désigne bien au sein de ce jeu une station particulière. 3) Ces URI sont décomposées dans les métadonnées Inspire en un identifiant (pour une station : stq/0123456789) (balise <RS_Identifier> <code>) rattachée à un espace de nom (ici http://id.eaufrance.fr/) (balise <RS_Identifier> <codeSpace>) 4) Par ailleurs, Inspire impose de disposer pour toutes ces données de fichiers de métadonnées, accessibles via le web par des mécanismes de moissonnage : cela suppose que ces métadonnées disposent d’un identifiant unique, identifiant de manière identique toutes les copies de la métadonnée issues du moissonnage (un site A moissonne sur un site B la fiche portant l’identifiant bbbb ; sur le site A cette fiche a le même identifiant bbbb). 5) Pour assurer une unicité fonctionnelle fiable, quelle que soit la pratique de gestion des identifiants uniques sur les jeux de données, il est recommandé d’utiliser comme identifiant de la métadonnée un UUID (clef unique universelle, basée sur le MAC de l’ordinateur émetteur). Par exemple, la fiche de métadonnée du référentiel station porte le code (balise fileIdentifier) f9d22652-a741-4080-9d44-13d522d17bb5, et est accessible sur data.eaufrance par l’URL http://www.data.eaufrance.fr/jdd/f9d22652a741-4080-9d44-13d522d17bb5 et sur le géocatalogue par http://www.geocatalogue.fr/Detail.do?fileIdentifier=f9d22652-a741-4080-9d4413d522d17bb5 6) L’URI des métadonnées sera donc composée à partir de l’UUID de sa fiche de métadonnée : http://id.eaufrance.fr/jdd/ec9b2bb2-f862-4eb7-8d2f-7a47870079ea , et sera déréférencée sur http://www.data.eaufrance.fr/jdd/f9d22652-a741-4080-9d4413d522d17bb5. 7) Le lien entre cette fiche de métadonnée et la donnée se fait au sein de la fiche de métadonnée, via l’URI de la donnée. Le lien de l’URI de la donnée vers la fiche de métadonnée (comment consulter une fiche de métadonnée, à partir de l’identifiant de la donnée), se fera, après déréférencement de l’URI de la donnée, par un lien vers l’URI de la métadonnée présent sur la ressource décrivant la donnée. c) L’encodage des URI 1) Les règles d’encodage des URI sont celles rappelées plus haut pour les URL (article 2e). d) Les modalités de formation des identifiants utilisés par les URI 1) Les URI sont basées sur l’existence d’identifiants, gérés principalement dans le cadre du Sandre : ces identifiants devraient répondre aux règles suivantes : 2) Les identifiants du Sandre portant sur de nombreux objets doivent être autant que possible non signifiants. A l’inverse, certaines nomenclatures ont des identifiants « littéraux », pouvant passer pour des identifiants signifiants : o nomenclature des données de référence (nomenclature 373) o nomenclature des types de ressources (ddd, scn, …) 3) Les identifiants non signifiants peuvent cependant être emboités : exemple des stations et points de prélèvement, des communes et des départements ; l’identifiant complet d’un point de prélèvement est alors la concaténation des deux identifiants, celui de la station concerné, suivi de celui du point de prélèvement dans cette station 4) Pour un même type de donnée, les identifiants ne peuvent pas être réutilisés : si un objet disparait ou est gelé, son identifiant ne peut plus être utilisé pour désigner un autre objet du même type. 5) Les identifiants ne devraient pas comporter les caractères suivants : ";" "/" "?" "@" " & " "=" "+" "$" "," "<" ">" "#" "%" <"> (cohérence d’écriture avec les URL et URI). 6) La casse doit être respectée et a un sens dans les identifiants (a est différent de A). 7) Les règles d’écriture des identifiants (type de caractère, longueur de l’identifiant, …) doivent être décrites dans les dictionnaires du Sandre. e) Développement des URI 1) Le SIE commencera par créer les URI correspondant aux URLI du point 1 (elles ont des ressources publiées). 2) Le SIE ne crée pas les URI pour les ressources des autres (ceux qui ont l’autorité sur ces ressources). Donc par exemple le SIE ne crée pas les URI des communes (existent à l’Insee, il faut donc se référer à ces URI Insee). 3) Le SIE référence en URI les documents publiés sous réserve qu’ils disposent d’un identifiant reconnu (ISBN). 4) Le tout s’appuiera sur le dictionnaire des documents du Sandre, a finaliser et publier. f) L’usage des URI 1) Les URI sont d’abord employées comme des noms avec un objectif d’interopérabilité des systèmes d’information ; par conséquent, les jeux de données, dans les formats simplifiés, incluront les URI des objets en complément de leurs codes, qui y figurent déjà. 2) Pour satisfaire à l’objectif d’accessibilité, les URI pourront être employées comme des URL, pour fournir à un client web, qui attend une ressource informationnelle, une page html décrivant cet objet, généralement sur le site du Sandre. 3) A terme, le déréférencement de cette URI se fera aussi par une description de l’objet par un graphe RDF quand le client n’est pas un navigateur web ou si cette représentation est explicitement demandée (c’est l’étape linked data). 4) Les URI devront pouvoir être déréférencer par un flux (xml, WFS, …) si cela correspond à la demande du logiciel client. 5) L’accès aux différents formats de téléchargement simple (hors accès aux flux) d’une même ressource via l’URI passe par l’accès à la page html. g) Les principes pour les espaces de noms des schémas XML du Sandre 1) Le Sandre utilise déjà des URI comme espace de noms (namespace) pour qualifier le vocabulaire employé (classes et attributs) dans ses scénarios d’échanges et dans ses dictionnaires; par exemple l’espace de noms http://xml.sandre.eaufrance.fr/scenario/quesu/3, abrégé en « sa_stq », permet de désigner sans ambiguïté l’entité sa_stq : StationMesureEauxSurface et l’attribut sa_stq :SuperficieBassinVersantTopo. 2) Les URI des espaces de noms du Sandre sont créées selon le modèle générique : http://xml.sandre.eaufrance.fr/scenario/{identifiant}/{version} pour les scénarios et http://xml.sandre.eaufrance.fr/{identifiant}/{version} pour les dictionnaires, par exemple http://xml.sandre.eaufrance.fr/dc/2.2, http://xml.sandre.eaufrance.fr/scenario/si_dc/2.2, http://xml.sandre.eaufrance.fr/mdo/1.2, http://xml.sandre.eaufrance.fr/Composants/1 3) Ces URI spécifiques sont gérées par le Sandre, et utilisées dans les schémas XML associés à ses dictionnaires et à ses scénarios d’échange. 4) Le déréférencement de ces URI se fait en renvoyant vers une page d’accès au chargement du schéma XML concerné. h) Gouvernance 1) Les nomenclatures utiles pour créer les URI et les principes généraux d’URI seront validées par le GPS. 2) Pour chaque nouveau référentiel, les principes de structuration des URI sera défini par le Sandre, et vérifié par les ADD. 3) Les dictionnaires et scénarios seront complétés pour permettre l’inclusion des URI dans les jeux de données publiés 4) Le déréférencement de ces URI vers des ressources html devra être indiqué au groupe ADD. 5) Les modalités d’écriture des URI seront affichées dans la page ad-hoc de sandre.eaufrance.fr. Annexes exemples d’implémentation sur des cas concrets Exemple Stations qualité eau souterraine Ressource Dictionnaire principal (versions) URL actuelles / URL future recommandée http://sandre.eaufrance.fr/ftp/documents/fr/ddd/qul/20021/sandre_dictionnaire_QUL_2002-1.pdf http://sandre.eaufrance.fr/dictionnaires/qul/2002-1/pdf URI id.eaufrance.fr/ddd/qul/2002-1 Scenarios référentiel (versions) http://sandre.eaufrance.fr/ftp/documents/fr/scn/referentiel/3.1 /sandre_sc_referentiels_v3.1.pdf http://xml.sandre.eaufrance.fr/scenario/referentiel/3.1/sandre _sc_referentiel.xsd http://sandre.eaufrance.fr/scenarios/referentiel/3.1/pdf http://xml.sandre.eaufrance.fr/scenarios/referentiel/3.1/x ml Non disponible id.eaufrance.fr/scn/ referentiel/3.1 Référentiel station alpha Référentiel station ig Métadonnée référentiel stations Métadonnée ?? http://www.data.eaufrance.fr/jdd/dbfd7fc6-2750-43e580fa-58572f064f3b http://www.data.eaufrance.fr/jdd/02cbf41b-0fc4-4fa7- Déférencé par http://sandre.eaufrance.f r/dictionnaires/qul/20021 (page web présentant le dictionnaire) http://sandre.eaufrance.f r/scenarios/referentiel/3.1 (page web présentant le scénario) ades qualité Stations 8ab8-5eb2c13215974fa7-8ab8-5eb2c1321597 http://www.ades.eaufrance.fr/FichePtEau.aspx?code=03636 X0955/PZPP2 http://www.ades.eaufrance.fr/pointseau/03636X0955%2F PZPP2 Données de mesure sur station ades (Paramètres, dates) http://www.ades.eaufrance.fr/FicheMesuresQualito.aspx?co de=03636X0955%2fPZPP2&type_qualito=1&type_pt_eau =&datedeb=15%2f06%2f1998&datefin http://www.ades.eaufrance.fr/mesuresqualito/03636X0955~PZPP2/datedebut/1998-15-06 id.eaufrance.fr/pte/03636X0955 %2F PZPP2 http://www.ades.eaufran ce.fr/pointseau/03636X0955%2F PZPP2 Exemple sispea Ressource Dictionnaire principal (versions) Scenarios (versions) Référentiel step alpha Référentiel step ig Métadonnées step Métadonnées sispea selon jeu de donnée URL actuelles / URL future recommandée URI http://services.sandre.eaufrance.fr/telechargement/geo/Sy id.eaufrance.fr/jdr/step sTraitementEauxUsees_FRA-csv.zip ????? http://services.sandre.eaufrance.fr/telechargement/geo/Sy sTraitementEauxUsees_FRA-mif.zip http://www.data.eaufrance.fr/jdd/ebef2115-bee540bb-b5cc-4593d82ba334 6 métadonnées ! 6 types de données ! Services publics d'assainissement non collectif, collectif et eau potable :- composition communale des services Services publics d'assainissement non collectif, collectif et eau potable :- description et indicateurs de performance Déférencé par http://www.data.eaufrance.fr/jdd/a8d7a630-b33d4c0b-a865-ecbe20360de5 Données sur les communes (avec année si besoin) Données sur le service Données sur l’autorité organisatrice (avec année si besoin) www.services.eaufrance.fr/sispea/voirCommune.action?i nsee=45100 services.eaufrance.fr/communes/45100 http://www.services.eaufrance.fr/sispea/showSPEAPrese ntationAction.action?id=176855&chosenExerciseId=101 services.eaufrance.fr/services/176855/exercices/2009 www.services.eaufrance.fr/sispea/voirCollectivite.action? siren=217500016&annee=2009 services.eaufrance.fr/autorites/217500016 /exercices/2009 id.eaufrance.fr/spea/1768 5 services.eaufrance.fr/service/1 76855 Format de base d'une URN Sandre urn:sandre:[ressource]:[code de la ressource(-sous-ensemble)n]:[pour un doc, version de la ressource; pour un référentiel, version de diffusion de la ressource]:[balise xml de l'objet filtre]:[valeur de l'attribut]:[identifiant de la révision]:[format] Liste des ressources Sandre (voir $GLOBALS["RESSOURCES_SANDRE"]) referentiel : Pour designer les jeux de données dans OGRES notice : Pour designer les notices documentaires dictionnaire : pour les dico sandre scenario : pour les scenario sandre <=> synonyme de scenario-d-echanges referentiels : pour les anciennes urn de geonetwork page : pour les pages web du site service : pour les webservices + liste des types de document gérer par SPIP (plugin notice) Liste des formats dispo ( voir $GLOBALS["FORMATS_SANDRE"]): "html", "pdf","xml", "xsd", "csv", "gzip", "zip". [modifier] Exemple : http://www.sandre.eaufrance.fr/urn.php?urn=urn:sandre:donnees:PAR::CdParametre:1340:::referentiel:2:html Lisible sans « urn.php » : http://www.sandre.eaufrance.fr/?urn=urn:sandre:donnees:PAR::CdParametre:1340:::referentiel:2:html