Analyse du risque d`accidents routiers Une application du Data

Transcription

Analyse du risque d`accidents routiers Une application du Data
Analyse du risque d’accidents routiers
Une application du Data Mining spatial
Karine Zeitouni(1) , Sylvain Lassarre(2), Florence Richard(3)
(1)
Laboratoire PRiSM - Université de Versailles Saint-Quentin
45, Avenue des Etats-Unis, 78035 Versailles Cedex
(2)
DERA - INRETS
2, Avenue de Général Malleret-Joinville - 94114 Arcueil Cedex
(3)
Laboratoire THEMA - CNRS - Section 39
32, rue Mégevan, 25030 Besançon Cedex
Introduction
L’analyse du risque routier permet d’identifier les problèmes de sécurité sur le réseau en vue de proposer les
mesures de sécurité pour y remédier. Le risque est estimé à partir du retour d’expérience sur les accidents corporels de
la circulation, répertoriés par la gendarmerie et la police. Cette analyse a été, jusqu'à présent, de nature statistique mais
n’utilise guère la composante spatiale et le lien avec le voisinage. Partant des données sur les accidents, combinées aux
données spatiales sur le réseau et sur l’environnement, ainsi que les flux de circulation, l’analyse spatiale a pour but de
faire émerger des structures pertinentes du risque routier qui puissent orienter l’action de sécurité routière. Il est donc
nécessaire d’étudier l’intégration des techniques d’analyse de données avec des techniques SIG et d’extraction de
connaissances des données (ECD). Ce qui amène à développer un ensemble d’outils - dans le domaine du data mining
spatial - par la collaboration étroite entre les chercheurs en analyse du risque, en géographie urbaine, en analyse de
données et en bases de données spatiales.
Besoins en analyse du risque routier
La mesure et l’explication des facteurs de risque par section de route, y compris ceux liés à l’interaction avec le
voisinage, est essentielle à la prise de décision sur la sécurité routière. L’approche statistique néglige la dimension
spatiale du risque, et les SIG seuls n’intègrent pas les modèles d’analyse de données. Une solution possible est que le
thématicien développe des modules d’analyse de données dans un applicatif SIG. Mais ces modules ne marcheraient
que pour une base de données particulière et pour des analyses propres à l’application, sans compter que le
développement d’une telle application est complexe.
Solution préconisée
Il s’agit de développer un système offrant des méthodes génériques d’analyse et de synthèse des données
spatiales afin de décharger le thématicien des tâches de programmation. Ce système permet d’intégrer l’interaction du
voisinage aux facteurs de risque. Par conséquent, il combine les requêtes spatiales du SIG avec les méthodes d’analyse
de données. Par ailleurs, nous proposons une approche basée sur la découverte de connaissances et de règles spatiales.
Ainsi, à partir de nombreuses caractéristiques de l’accident (heure, météo,...), des routes, des véhicules (2 roues, VP,...),
des usagers (sexe, âge,...), le système découvre les combinaisons qui spatialement forment des agrégats significatifs sur
le réseau routier et peut produire de façon automatique les cartes qui font “ sens ” parmi le très grand ensemble de
possibilités de cartes.
Apport à la recherche en accidentologie routière et en SIG
L’établissement de tous les facteurs de risque, y compris ceux qui sont liés à la localisation spatiale, motive cette
recherche du point de vue de la thématique de l’accidentologie routière. Les techniques de morphologie mathématiques
seront aussi utilisées pour faire apparaître des formes et des groupes d’accidents. Nous serons guidés par des
connaissances sur la mobilité et la morphologie urbaine qui rythme et structure les flux au cours de la journée et des
jours sur le réseau.
D'un point de vue SIG et base de données spatiale, l’intérêt est d’étudier et d’intégrer des algorithmes optimisés
pour des opérateurs génériques de Data Mining Spatial. Pour ce faire, les techniques d’analyse des données
multidimensionnelles et de data mining devront être étendues à la prise en compte de la proximité spatiale. Cela
comprend des méthodes telles que le clustering ou la recherche de règles d'associations spatiales ou encore la recherche
de tendance dans l'espace ou dans le temps. Ces algorithmes utiliseront de manière intensive les relations spatiales entre
objets. Pour être efficaces, ils nécessitent des mécanismes d'optimisation tels que des indexes spatiaux ou des indexes
de jointure.
Contexte
En France, le risque routier n'est guère analysé sur des critères spatiaux. Le développement par les Services
techniques du Ministère des Transport et de l'Équipement - le CERTU - du logiciel CONCERTO, basé sur un SIG, va
encourager les gestionnaires des villes et des réseaux interurbains à se lancer dans les analyses spatiales du risque. Ce
logiciel ergonomique fournit déjà des possibilités de requêtes d’interrogation et de cartographie des accidents.
Nous cherchons à aller au-delà des possibilités d’analyse que fournit un SIG en développant un outil d’extraction
automatique des caractéristiques et des règles de dépendance non évidentes que renferment les données. Nous nous
baserons sur les travaux existants sur le Data Mining [FAY 96] et les quelques recherches émergentes sur l'extension
aux données spatiales [KOP 96], [HAN 97], [EST 97]. Seulement, les recherches récentes sur ce sujet ne sont pas
toujours adaptées aux réseaux linéaires comme le réseau routier. Les outils avancés d’analyse spatiale du risque routier
qui seront développés pourront notamment être intégrés plus tard dans CONCERTO.
Ce projet s’inscrit dans le programme PSIG 1998 et implique, l’INRETS et les laboratoires PRISM, THEMA et
LIST (Université de Casablanca). Il s'appuiera sur les données géographiques de la communauté urbaine de Lille qui
présente une grande variété au niveau de la morphologie urbaine et du risque routier et qui dispose de données urbaines
et suburbaines assez riches. Le système développé pourra bien sûr s’appliquer à toute autre base de données spatiale
ayant les même besoins d’analyse.
Bibliographie
[BAN 84] Banet A., Lebart L., “Local and partial principal component analysis and correspondance analysis ”, In
proceedings of COMPSAT - Computaional Statistics -, Physica Verlag, Vienne, pp 113-118.
[BER 92] Berthoz E., Brossard T., Lassarre S., “Eds. Cartographie des accidents de la route : modes d'analyse et de
représentation ”, Actes du colloque de Besançon 1-2 octobre 1992. INRETS, Arcueil.
[CAM 94] Cambon de Lavalette B., “Densité urbaine et accidentalité des jeunes piétons ”. Compte-rendu d'activités,
Convention de recherche INRETS-CNRS pour le PIR Villes, INRETS, Arcueil, 1994.
[ESC 89] Escofier B., “Multiple correspondance analysis and neighboring relation ”, In Data analysis - Learning
symbolic and numerical knowledge, pp 55-62, 1989.
[EST 97] Ester M., Kriegel H-P., Sander J., “ Spatial Data Mining: A Database Approach ”, pp. 47-66, In 5th
International Symposium, SSD’97, Berlin, July 1997.
[FAY 96] Fayyad U.M., Piateski-Shapiro G., “Advances in Knowledge Discovery and Data Mining ”, AAAI Press /
MIT Press, 1996
[FLE 95] Fleury D., Jourdan Y., Cadieu J.P.. “Conception d’un plan de sécurité pour la ville de Rennes ”. Rapport
INRETS n° 199, INRETS, Arcueil, 1995.
[HAN 97] Han J., Koperski K., Stefanovic N., “ GeoMiner : A system prototype for spatial data mining ”, In ACMSIGMOD Int. Conference on Mnagement of Data, pp. 553-556, Tucson, Arizona, May 1997.
[KOP 96] Koperski K., Adhikary J., Han J., “ Knowledge Discovery in Spatial Databases: Progress and Challenges ”, In
SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery, Technical Report 96-08,
University of British Columbia, Vancouver, Canada, June 1996.
[PAT 97] Patte L., Lesage P., “Catégorisation des voies urbaines en sécurité routière ”. CERTU, Lyon, 1997.