Présentation « Information juridique et Web sémantique »
Transcription
Présentation « Information juridique et Web sémantique »
Information juridique et Web sémantique Jamal Rezzouk Directeur de la technologie [email protected] Journée d’étude AFNOR/Bnf – 27 mai 2011 Référentiels et données d’autorité à l’heure du Web sémantique www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Contexte de la présentation On ne s’intéresse ici qu’à l’information juridique directement produites par l’état et à destination des professionnels du droit On ne s’intéresse … •ni à l’information juridique produite par les éditeurs juridiques •ni à l’information « juridique » produite dans le cadre des évolutions de comportement des usagers du web (blog, twitter, facebook…) •ni à la vulgarisation de l’information juridique à destination des non professionnels Néanmoins, l’essentiel de cette présentation est transposable Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 2 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 L’univers de l’information juridique L’information juridique est un univers …de l’écrit …attachant une grande importance aux mots et au sens des mots …dans le cadre d’un processus de « création » imposé …en perpétuelle évolution …mais… « nul n’est censé ignorer la Loi » En quoi l’approche « Web Sémantique » est elle particulièrement adaptée pour répondre aux enjeux de l'information juridique ? Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 3 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Un Univers de la connaissance écrite Notre système juridique s’appuie avant tout sur l’écrit. La gestion des multiples sources d’information juridique est donc d’abord considérée comme un projet d’informatique documentaire (XML, XSD, …) Mais les contenus juridiques sont très riches en information : jusqu’où va-t-on dans la prise en compte de cette information au sein d’un document structuré ? • • • • • métadonnées balisage « inline » des citations grille de lecture données chiffrées …et quoi d’autre ? Le Web sémantique distingue par principe la « ressource » (le texte de Loi, la décision de jurisprudence…) de la « connaissance » que l’on peut en avoir La complémentarité des deux approches se retrouve au cœur d’un certain nombre de projets : • E-POWER - approche « documentaire » : MetaLex, une approche XML générique et extensible portant sur la structuration et les métadonnées des sources de la Loi et des sources du Droit ( http://www.metalex.eu/ ) • ESTRELLA - approche « ontologie » : LKIF, une ontologie décrite sous la forme d’un ensemble de modules utilisables dans un contexte juridique ( http://www.estrellaproject.org/lkif-core/ ) Lecture : « Proposed XML standards for Law : Metalex and LKIF » Boer, Winkels, Vitali – Proceedings of Jurix 2007 Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 4 www.arisem.com Content_Unit : •Doc_ID : 0937632857 : Decision Jurisprudence •Type •URI : http://www.viasema.com/dtfr/0937632857 chainage •Matières principales : droit de la famille •Concepts principaux : divorce, procedure •Concepts secondaires : •Matières principales : •Concepts principaux : he c o pr rap Lien déc. antérieure Lien fondement Référence_A_Jurisprudence •Juridiction : Cour d’appel •Siège : Versailles •Formation : Chambre 1 section B •N° decision : •Date : 14/11/2004 •Parties : Mme Dupon droit de la famille divorce, garde de l’enfant •Concepts secondaires : pension alimentaire ? nt e m Référence_DE_Jurisprudence : •Juridiction : Cour d’appel •Siège : Versailles •Formation : Chambre 1 section B •N° decision : [RG] 02/01222 •Date : 14/11/2004 •Parties : Mr Duran, Mme Dupon aPourRef KM Référence_DE_Jurisprudence : •Juridiction : Cour de Cassation •Siège : •Formation : Chambre civile 1 •N° decision : [pourvoi] 04-16.502 •Date : 23/12/2005 •Parties : Mr Duran aPourRef Content_Unit : •Doc_ID : 0937632623 : Décision Jurisprudence •Type •URI : http://www.viasema.com/dtfr/0937632623 Référence_A_TexteCodifié : •Code : Code civil : 279 •Article 0937632857 0937632623 Extraction / Enrichissement ---------------------------- ---------------------------- CMS Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Contenu vs. Connaissances Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 5 www.arisem.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Contenu vs. Connaissances ressources terminologiques et ontologiques base de connaissance du domaine taxonomies de publication base de connaissance publiée services de recherche et navigation contenus de la « source » nettoyé et « monitoré » contenus structurés + métadonnées contenus structurés + métadonnées + enrichissements Lecture : « Improving Legal Publishing at LexisNexis® in France with Ontology Driven Processes » J.Rezzouk & J.Delahousse - Semtech 2007 Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 6 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Un Univers de mots Un vocabulaire juridique d’un très grande richesse, de multiples abréviations, des sigles, des formulations différentes en fonction du métier, tout cela entrainant son lot d’ambiguïté, et d’implicite : • • • • • sigles et ambiguïtés : • CA (Cour d’Appel), CE (Conseil d’Etat), JE (Juge des enfants), TA (Tribunal Administratif), TE (Tribunal pour enfants)… • C.C. abréviation possible de Conseil Constitutionnel, Cour de Cassation, Code Civil, Communauté de Communes, Chambre de commerce… flexions : « vendeur » et ses 2 féminins « vendeuse » et « venderesse » de sens différents ; monosémique mais « savant » : synallagmatique, cofidéjusseur, dirimant, emphythéose, exhérédation, adminicule, anatocisme… polysémique mais « cohérent » : conseil, dépôt, cause, matériel… expressions : • • • • habitation légère de loisir (tente) école de pilotage de véhicule terrestre à moteur (auto-école), tatouage par effraction cutanée et perçage corporel (piercing), interceptions de correspondances émises par la voie des télécommunications (écoutes téléphoniques), • participation des employeurs à l’effort de construction-PEEC (1% logement) Lecture : « Linguistique Juridique » Gérard Cornu – Edition Montchrestien – 14 juin 2005 Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 7 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Un Univers de mots Le Web Sémantique propose une solution technique unifiée offrant un cadre formel standard … • skos : une représentation formelle de… • listes d’autorités utiles à l’identification des contenus juridiques (juridiction, siège de juridiction, type de décision, type de texte…) • thésaurus (exemple d’Eurovoc : http://eurovoc.europa.eu/drupal/?q=fr/ontology ) • taxonomies de publication répondant aux besoins spécifiques des utilisateurs du droit (avocats, expert comptables, juristes d’entreprises n’accèdent pas au droit de la même manière) • skos-xl : une distinction explicite de la notion de concept et de forme lexicale associée permettant aussi de créer un pont entre le TAL et le Web Sémantique • Exemple : demo …ainsi que des mécanismes de raisonnement permettant d’aller au-delà de la simple gestion de terminologie : • • stratégie de désambiguïsation règle d’explicitation contextuelle de l’implicite Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 8 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Un Univers organisé L’ensemble du système juridique s’appuie sur un cadre bien formalisé : • des acteurs et des organisations, • des règles de fonctionnement et des processus • Code de l’organisation judiciaire, Code Procédure Civile, Code de Procédure Pénale, Code de justice administrative… • des principes et des habitudes rédactionnelles • "Guide de légistique" : http://www.legifrance.gouv.fr/html/Guide_legistique_2/accueil_guide_leg.htm Le Web Sémantique propose un cadre formel (ontologie) permettant de prendre en compte et d'exploiter toutes ces informations : • une ontologie de type « linguistique et terminologique » • une ontologie de type « documentaire » prenant en compte les problématiques de versionnement juridique, de citation… • une ontologie de type « juridique » Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 9 Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 www.viasema.com Un Univers organisé Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 10 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Un Univers en perpétuelle évolution Pour suivre les évolutions de la société, le système juridique évolue sans cesse : • • • • changement de dénomination d'un concept évolution du sens d'un concept évolution des relations entre concepts Exemples : • • • • l’un des plus vieux texte encore en vigueur date de 1539 (l’Ordonnance de VillersCotterêts) le calendrier révolutionnaire a remplacé le calendrier grégorien entre 1792 et 1806 « Code de procédure civile » partiellement refondu en 1976 en « Nouveau Code de procédure civile » refondu à nouveau en 2007 pour (re)devenir le « Code de procédure civile » le « divorce » avant 2004 n’est pas le « divorce » d’après 2004 La notion de « temps juridique » est liée au cycle de vie naturel des notions juridiques : • • • • • évocation d'une ébauche de concept dans les débats au Parlement définition juridique du concept (date de signature) opposabilité (date de publication) entrée en vigueur (date d’applicabilité) usage qui « renomme » cette notion Le tout, subtilement « pimenté » d’exceptions, limitations, de conditions et autres contraintes de natures variées (temporelles, géographiques, sociétales…) Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 11 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Un univers en perpétuelle évolution La problématique juridique « temporelle » est partiellement couverte par une approche « Web Sémantique » : • • Dublin-Core : un schéma de métadonnées offrant un cadre suffisant pour gérer le cycle de vie des listes d’autorité, thésaurus… OWL-Time : travaux du W3C ( http://www.w3.org/TR/owl-time/ ) • Ontologie orientée « événement » : elle est nécessaire pour prendre en compte les spécificités du cycle de vie des concepts juridiques • • exemple : le « Tribunal de 1ère instance » est le prédécesseur du « Tribunal de grande instance » (Ordonnance n°58-1273 du 22 décembre 1958 relative à l'organisation judiciaire, article 1er, publié au JO du 23 décembre 1958, entré en vigueur le 02 février 1959) Ontologie orientée « temps » : elle permet de représenter des concepts purement temporels autour desquels s’organise le système juridique français : • exemple : • • la 4ème République (oct. 1946 => oct. 1958) a précédé la 5ème République, la XIIIème Législature de la Vème République a commencé le 20 juin Z007 et doit s’achever le 19 juin 2012. …mais il n’existe aucune solution « miracle » et en particulier pas de mécanisme de raisonnement temporel. Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 12 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 « Nul n’est censé ignorer la Loi » Derrière ce vieil adage se cache bien sûr les problématiques de qualité, d’accès à l’information juridique et d'adaptation au "profil" de l'utilisateur final Le Web Sémantique apporte un cadre formel comme support de diffusion de l’information et de ses moyens d’accès : • Une généralisation de la notion de métadonnées et des outils associés (lexiques, listes d’autorité, thésaurus, taxonomies…) facilitant la mise en place de services d’accès exploitant ces données (autocompletion, facettes, information contextuelle, aide à la (re)formulation d’un requête…) • Des graphes nommés (« named graph ») pour en particulier gérer la provenance des données, la notion de licence ou les problématiques de droit d’accès. • Une approche « Linked Data » parfaitement adaptée à la publication de données publiques juridiques : • Tim Berners-Lee : http://www.w3.org/DesignIssues/LinkedData.html • • • • • “Use URIs as names for things Use HTTP URIs so that people can look up those names. When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) Include links to other URIs. so that they can discover more things. “ Exemple : • • site de référence : http://www.legislation.gov.uk/ lecture associée : http://blog.law.cornell.edu/voxpop/2010/08/15/legislationgovuk/ Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 13 www.viasema.com Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable © Copyright ViaSema 2011 Conclusion L’information juridique est un cas d’école idéal de mise en pratique d’une approche de type « Web sémantique » Le Web sémantique apporte des réponses concrètes et formelles couvrant des besoins fondamentaux de modélisation, normalisation, interopérabilité, réutilisabilité et modalités d’accès à l’information juridique. L’information juridique offre un cadre d’application unique autour des grands enjeux du Web sémantique, en particulier pour ce qui concerne la gestion du cycle de vie de ses ressources, leur fiabilité, leurs modalités de publication, ainsi que la gestion des droits. Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique 14