Présentation « Information juridique et Web sémantique »

Transcription

Présentation « Information juridique et Web sémantique »
Information juridique et Web sémantique
Jamal Rezzouk
Directeur de la technologie
[email protected]
Journée d’étude AFNOR/Bnf – 27 mai 2011
Référentiels et données d’autorité à l’heure du Web sémantique
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Contexte de la présentation
On ne s’intéresse ici qu’à l’information juridique directement
produites par l’état et à destination des professionnels du droit
On ne s’intéresse …
•ni à l’information juridique produite par les éditeurs juridiques
•ni à l’information « juridique » produite dans le cadre des
évolutions de comportement des usagers du web (blog, twitter,
facebook…)
•ni à la vulgarisation de l’information juridique à destination des non
professionnels
Néanmoins, l’essentiel de cette présentation est transposable
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
2
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
L’univers de l’information juridique
L’information juridique est un univers
…de l’écrit
…attachant une grande importance aux mots et au sens des mots
…dans le cadre d’un processus de « création » imposé
…en perpétuelle évolution
…mais… « nul n’est censé ignorer la Loi »
En quoi l’approche « Web Sémantique » est elle particulièrement
adaptée pour répondre aux enjeux de l'information juridique ?
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
3
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Un Univers de la connaissance écrite
Notre système juridique s’appuie avant tout sur l’écrit. La gestion des multiples sources d’information
juridique est donc d’abord considérée comme un projet d’informatique documentaire (XML, XSD, …)
Mais les contenus juridiques sont très riches en information : jusqu’où va-t-on dans la prise en compte de
cette information au sein d’un document structuré ?
•
•
•
•
•
métadonnées
balisage « inline » des citations
grille de lecture
données chiffrées
…et quoi d’autre ?
Le Web sémantique distingue par principe la « ressource » (le texte de Loi, la décision de
jurisprudence…) de la « connaissance » que l’on peut en avoir
La complémentarité des deux approches se retrouve au cœur d’un certain nombre de projets :
• E-POWER - approche « documentaire » : MetaLex, une approche XML générique et extensible portant
sur la structuration et les métadonnées des sources de la Loi et des sources du Droit (
http://www.metalex.eu/ )
•
ESTRELLA - approche « ontologie » : LKIF, une ontologie décrite sous la forme d’un ensemble de
modules utilisables dans un contexte juridique ( http://www.estrellaproject.org/lkif-core/ )
Lecture : « Proposed XML standards for Law : Metalex and LKIF » Boer, Winkels, Vitali – Proceedings of
Jurix 2007
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
4
www.arisem.com
Content_Unit :
•Doc_ID
: 0937632857
: Decision Jurisprudence
•Type
•URI : http://www.viasema.com/dtfr/0937632857
chainage
•Matières principales : droit de la famille
•Concepts principaux : divorce, procedure
•Concepts secondaires :
•Matières principales :
•Concepts principaux :
he
c
o
pr
rap
Lien
déc. antérieure
Lien
fondement
Référence_A_Jurisprudence
•Juridiction
: Cour d’appel
•Siège
: Versailles
•Formation
: Chambre 1 section B
•N° decision
:
•Date
: 14/11/2004
•Parties
: Mme Dupon
droit de la famille
divorce,
garde de l’enfant
•Concepts secondaires : pension alimentaire
?
nt
e
m
Référence_DE_Jurisprudence :
•Juridiction
: Cour d’appel
•Siège
: Versailles
•Formation
: Chambre 1 section B
•N° decision
: [RG] 02/01222
•Date
: 14/11/2004
•Parties
: Mr Duran, Mme Dupon
aPourRef
KM
Référence_DE_Jurisprudence :
•Juridiction
: Cour de Cassation
•Siège
:
•Formation
: Chambre civile 1
•N° decision
: [pourvoi] 04-16.502
•Date
: 23/12/2005
•Parties
: Mr Duran
aPourRef
Content_Unit :
•Doc_ID
: 0937632623
: Décision Jurisprudence
•Type
•URI : http://www.viasema.com/dtfr/0937632623
Référence_A_TexteCodifié :
•Code
: Code civil
: 279
•Article
0937632857
0937632623
Extraction
/
Enrichissement
----------------------------
----------------------------
CMS
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Contenu vs. Connaissances
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
5
www.arisem.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Contenu vs. Connaissances
ressources
terminologiques et
ontologiques
base de connaissance
du domaine
taxonomies de
publication
base de connaissance
publiée
services de
recherche et
navigation
contenus
de la « source »
nettoyé et « monitoré »
contenus
structurés
+ métadonnées
contenus
structurés
+ métadonnées
+ enrichissements
Lecture : « Improving Legal Publishing at LexisNexis® in France with Ontology Driven Processes »
J.Rezzouk & J.Delahousse - Semtech 2007
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
6
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Un Univers de mots
Un vocabulaire juridique d’un très grande richesse, de multiples abréviations, des sigles, des
formulations différentes en fonction du métier, tout cela entrainant son lot d’ambiguïté, et
d’implicite :
•
•
•
•
•
sigles et ambiguïtés :
• CA (Cour d’Appel), CE (Conseil d’Etat), JE (Juge des enfants), TA (Tribunal
Administratif), TE (Tribunal pour enfants)…
• C.C. abréviation possible de Conseil Constitutionnel, Cour de Cassation, Code Civil,
Communauté de Communes, Chambre de commerce…
flexions : « vendeur » et ses 2 féminins « vendeuse » et « venderesse » de
sens différents ;
monosémique mais « savant » : synallagmatique, cofidéjusseur, dirimant,
emphythéose, exhérédation, adminicule, anatocisme…
polysémique mais « cohérent » : conseil, dépôt, cause, matériel…
expressions :
•
•
•
•
habitation légère de loisir (tente)
école de pilotage de véhicule terrestre à moteur (auto-école),
tatouage par effraction cutanée et perçage corporel (piercing),
interceptions de correspondances émises par la voie des télécommunications
(écoutes téléphoniques),
• participation des employeurs à l’effort de construction-PEEC (1% logement)
Lecture : « Linguistique Juridique » Gérard Cornu – Edition Montchrestien – 14 juin 2005
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
7
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Un Univers de mots
Le Web Sémantique propose une solution technique unifiée offrant un cadre
formel standard …
•
skos : une représentation formelle de…
• listes d’autorités utiles à l’identification des contenus juridiques (juridiction, siège de
juridiction, type de décision, type de texte…)
• thésaurus (exemple d’Eurovoc : http://eurovoc.europa.eu/drupal/?q=fr/ontology )
• taxonomies de publication répondant aux besoins spécifiques des utilisateurs du
droit (avocats, expert comptables, juristes d’entreprises n’accèdent pas au droit de la
même manière)
•
skos-xl : une distinction explicite de la notion de concept et de forme lexicale
associée permettant aussi de créer un pont entre le TAL et le Web Sémantique
• Exemple : demo
…ainsi que des mécanismes de raisonnement permettant d’aller au-delà de
la simple gestion de terminologie :
•
•
stratégie de désambiguïsation
règle d’explicitation contextuelle de l’implicite
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
8
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Un Univers organisé
L’ensemble du système juridique s’appuie sur un cadre bien formalisé :
• des acteurs et des organisations,
• des règles de fonctionnement et des processus
• Code de l’organisation judiciaire, Code Procédure Civile, Code de Procédure
Pénale, Code de justice administrative…
•
des principes et des habitudes rédactionnelles
• "Guide de légistique" : http://www.legifrance.gouv.fr/html/Guide_legistique_2/accueil_guide_leg.htm
Le Web Sémantique propose un cadre formel (ontologie) permettant de
prendre en compte et d'exploiter toutes ces informations :
• une ontologie de type « linguistique et terminologique »
• une ontologie de type « documentaire » prenant en compte les
problématiques de versionnement juridique, de citation…
• une ontologie de type « juridique »
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
9
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
www.viasema.com
Un Univers organisé
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
10
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Un Univers en perpétuelle évolution
Pour suivre les évolutions de la société, le système juridique évolue sans cesse :
•
•
•
•
changement de dénomination d'un concept
évolution du sens d'un concept
évolution des relations entre concepts
Exemples :
•
•
•
•
l’un des plus vieux texte encore en vigueur date de 1539 (l’Ordonnance de VillersCotterêts)
le calendrier révolutionnaire a remplacé le calendrier grégorien entre 1792 et 1806
« Code de procédure civile » partiellement refondu en 1976 en « Nouveau Code de
procédure civile » refondu à nouveau en 2007 pour (re)devenir le « Code de procédure
civile »
le « divorce » avant 2004 n’est pas le « divorce » d’après 2004
La notion de « temps juridique » est liée au cycle de vie naturel des notions juridiques :
•
•
•
•
•
évocation d'une ébauche de concept dans les débats au Parlement
définition juridique du concept (date de signature)
opposabilité (date de publication)
entrée en vigueur (date d’applicabilité)
usage qui « renomme » cette notion
Le tout, subtilement « pimenté » d’exceptions, limitations, de conditions et autres contraintes de
natures variées (temporelles, géographiques, sociétales…)
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
11
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Un univers en perpétuelle évolution
La problématique juridique « temporelle » est partiellement couverte par une approche « Web
Sémantique » :
•
•
Dublin-Core : un schéma de métadonnées offrant un cadre suffisant pour gérer le cycle de vie
des listes d’autorité, thésaurus…
OWL-Time : travaux du W3C ( http://www.w3.org/TR/owl-time/ )
•
Ontologie orientée « événement » : elle est nécessaire pour prendre en compte les spécificités
du cycle de vie des concepts juridiques
•
•
exemple : le « Tribunal de 1ère instance » est le prédécesseur du « Tribunal de grande
instance » (Ordonnance n°58-1273 du 22 décembre 1958 relative à l'organisation
judiciaire, article 1er, publié au JO du 23 décembre 1958, entré en vigueur le 02 février
1959)
Ontologie orientée « temps » : elle permet de représenter des concepts purement temporels
autour desquels s’organise le système juridique français :
•
exemple :
•
•
la 4ème République (oct. 1946 => oct. 1958) a précédé la 5ème République,
la XIIIème Législature de la Vème République a commencé le 20 juin Z007 et doit
s’achever le 19 juin 2012.
…mais il n’existe aucune solution « miracle » et en particulier pas de mécanisme de raisonnement
temporel.
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
12
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
« Nul n’est censé ignorer la Loi »
Derrière ce vieil adage se cache bien sûr les problématiques de qualité, d’accès à l’information
juridique et d'adaptation au "profil" de l'utilisateur final
Le Web Sémantique apporte un cadre formel comme support de diffusion de l’information et de ses
moyens d’accès :
•
Une généralisation de la notion de métadonnées et des outils associés (lexiques, listes d’autorité,
thésaurus, taxonomies…) facilitant la mise en place de services d’accès exploitant ces données
(autocompletion, facettes, information contextuelle, aide à la (re)formulation d’un requête…)
•
Des graphes nommés (« named graph ») pour en particulier gérer la provenance des données, la
notion de licence ou les problématiques de droit d’accès.
•
Une approche « Linked Data » parfaitement adaptée à la publication de données publiques
juridiques :
•
Tim Berners-Lee : http://www.w3.org/DesignIssues/LinkedData.html
•
•
•
•
•
“Use URIs as names for things
Use HTTP URIs so that people can look up those names.
When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL)
Include links to other URIs. so that they can discover more things. “
Exemple :
•
•
site de référence : http://www.legislation.gov.uk/
lecture associée : http://blog.law.cornell.edu/voxpop/2010/08/15/legislationgovuk/
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
13
www.viasema.com
Les informations contenues dans ce document sont la propriété exclusive de ViaSema. Elles ne doivent pas être divulguées sans accord écrit préalable
© Copyright ViaSema 2011
Conclusion
L’information juridique est un cas d’école idéal de mise en
pratique d’une approche de type « Web sémantique »
Le Web sémantique apporte des réponses concrètes et formelles
couvrant des besoins fondamentaux de modélisation,
normalisation, interopérabilité, réutilisabilité et modalités d’accès
à l’information juridique.
L’information juridique offre un cadre d’application unique autour
des grands enjeux du Web sémantique, en particulier pour ce
qui concerne la gestion du cycle de vie de ses ressources, leur
fiabilité, leurs modalités de publication, ainsi que la gestion des
droits.
Journée d’étude AFNOR/Bnf – 27 mai 2011 - Information juridique et Web Sémantique
14