2015-1 - ITS-CH

Transcription

2015-1 - ITS-CH
its-ch
Swiss Platform for the Promotion of ITS
Thème prioritaire:
Données des transports, sphère privée et avalanches de données
Traité par: EPFL
Rapport: 7 mai 2015 (2015-1)
Les données de trafic et de mobilité sont essentielles pour le déploiement des services ITS.
L’avènement des nouvelles technologies de la communication et de l’informatique offre un fort
potentiel pour la saisie et la transmission d’informations liées à la mobilité. L’usage de ces
technologies permet à chacun de collecter des informations et de les transmettre dans une optique de
production participative (crowdsourcing) pour des services de mobilités ou de gestion des transports.
Ce quatrième rapport propose de préciser le concept de crowdsourcing et son usage dans les
services d’information et de gestion des transports. Il présente la problématique du crowdsourcing
avec ses éléments techniques, quelques exemples d’applications, quelques aspects juridiques et ainsi
que les perspectives pour le domaine des transports.
Responsable:
Nom: Pierre-Yves Gilliéron
Organisation: Ecole polytechnique fédérale de Lausanne
Adresse: EPFL - Laboratoire de Topométrie, Station 18, 1015 Lausanne, [email protected]
Rédaction du 23.04.2015
Its-ch c/o VSS
Silhlquai 255
CH-8005 Zürich
Telefon: +41 44 269 40 20
Telefax: +41 44 252 31 30
E-Mail: [email protected]
Version 23.04.2015
Crowdsourcing pour la mobilité et les transports
1. Concept et principe
1.1 Concept de la production participative
Le « crowdsourcing » est un concept qui a été décrit par J. Howe et M. Robinson en 2006 (Howe,
2006,a) que l’on peut traduire littéralement comme l’approvisionnement par la foule ou production
participative. Le principe proposé se base sur l’utilisation du temps disponible et des compétences
d’un large public ou d’une foule (crowd) pour la réalisation de certaines tâches, la résolution de
problèmes ou la fourniture d’informations. Contrairement au principe de l’outsourcing qui consiste à
confier des tâches spécifiques à des entreprises spécialisées, le crowdsourcing propose un modèle
d’externalisation distribuée basé sur un grand nombre de participants. Au Québec, on a défini le terme
d’externalisation ouverte qui est bien approprié.
Le déploiement de ce mécanisme est devenu possible par l’intermédiaire des nouvelles technologies
de l’Internet, des plateformes mobiles et des télécommunications. La démocratisation de l’accès à ces
technologies a permis à un large public de disposer de moyens informatiques et de communication,
créant des conditions favorables à une production participative.
1.2 Principe de fonctionnement
On distingue 2 types de crowdsourcing : la collaboration active à résoudre un problème (par ex. la
fourniture explicite d’une information sur l’état du trafic), la participation passive (par ex.
enregistrement de traces GPS). En général, la participation de la « foule » est liée au fait d’appartenir
à une communauté ou au travers d’applications mobiles facilitant la récolte et la diffusion
d’informations. On distingue trois type de tâches : routinière (collecte de données) ; complexe
(résolution de problèmes) et créatives (Guittard et Schenk, 2009)
Dans la description de la méthode de crowdsourcing (Howe, 2006, b), l’auteur propose 5 constats à
propos des capacités de la foule : elle est massive et dispersée, elle est pleine de spécialistes, elle est
capable de trouver des solutions appropriées, elle a peu de temps à consacrer, elle peut aussi
contribuer faussement. A partir de ces constats, on peut relever l’immense potentiel du crowd, mais
aussi ses limites et ses risques. On peut relever les questions récurrentes relatives à ce concept que
sont le statut de l’expertise, la propriété intellectuelle d’un travail, la responsabilité en cas d’erreurs,
voir l’esprit malveillant de la part de certains contributeurs. A priori, le crowd s’appuie sur le grand
nombre d’informations redondantes, permettant ainsi, par statistique, d’éliminer des observations
fausses ou aberrantes. Par exemple, la transmission d’une observation d’un incident (par ex. un objet
sur la chaussée) devrait être fournie par plusieurs sources indépendantes, afin d’être vérifiée et
publiée comme une information. Toutefois, ce principe ne s’applique pas toujours, notamment pour
des évènements rares.
Ce phénomène de production participative, impliquant les citoyens, peut être perçu comme une
approche positive et ouverte face au fonctionnement de notre société, que l’on pourrait présenter
comme un outil de démocratie directe. Toutefois, il faut rester vigilant, car ces nouveaux modèles
économiques, suscitent également de la controverse et des critiques, comme l’impact sur des emplois
rémunérés, les intentions commerciales cachées, le respect de la sphère privée, l’attribution de rôles
non souhaité (par ex. : surveillance).
Les champs d’action du crowdsourcing sont nombreux, un des plus célèbres étant l’encyclopédie en
ligne Wikipédia. Dans le domaine des cartes géographiques, on peut citer le projet OpenStreetMap
qui est un bel exemple de travail collaboratif de récolte de géodonnées à grande échelle.
Page 2
EPFL
2. Applications à la mobilité et aux transports
2.1 Services basés sur la localisation
La mobilité et des transports s’imposent naturellement comme un terrain propice au déploiement
d’initiatives collaboratives sachant qu’une foule potentielle d’utilisateurs est prête à contribuer
activement ou passivement à l’amélioration du système de transport par la transmission de données
ou d’observations. Le crowdsourcing permet de mieux renseigner les systèmes d’information car
chaque contributeur est un capteur potentiel de données (Asfora et Bousquié, 2011). Les téléphones
mobiles avec leur capacité de déterminer une position (basée sur le GPS, Wifi ou 3G/4G) offrent le
capteur idéal pour le recueil de données sur la mobilité et le trafic (CETE Méditerranée, 2013). De
nombreuses publications présentent le recueil de données basés sur le « floating car data » ou le
« floating phone data » avec le principe d’une transmission de positions (traces GPS) à une centrale
de collecte ou de détermination à distance de la position des mobiles (Figure 1). Ces positions
transmises ou déterminées en temps réel sont datées et peuvent s’accompagner d’autres données
provenant de capteurs embarqués (par ex. la température) ou d’informations saisies par l’utilisateur
(ex. notification d’un incident).
Figure 1 : Principe du « floating car data » comparé aux capteurs classiques du trafic
2.2 Principales applications
Avec le développement massif d’applications mobiles, il est difficile de faire un inventaire des
principales applications qui intègrent le concept de production participative à la mobilité et aux
transports. Toutefois, on peut distinguer les applications liées à des fournisseurs de services privés
(Ex. Google, TomTom, Coyote) des initiatives citoyennes ou à vocation de service public.
Parmi les fournisseurs de services, on peut citer ceux de la navigation automobile, qui ont développé
des systèmes connectés ou applications qui remontent régulièrement des données sur la position et la
vitesse des véhicules. Ces données, combinées à des historiques de la charge de trafic, permettent
de dériver des informations sur l’état du trafic routier qui peuvent être retournées en temps réel aux
utilisateurs. Les principaux acteurs présents sur ce marché sont : TomTom (cartes Teleatlas), HERE
(cartes Nokia/Navtech) et INRIX. On peut également citer les majeurs de l’Internet comme Google et
Microsoft qui sont aussi actifs sur le marché de la collecte de données et diffusion d’information sur le
trafic. La plupart de ces applications ont recours à la fonction de localisation des smartphones et
remontent automatiquement des parcours des utilisateurs en garantissant a priori un traitement
anonyme des données, sachant que l’utilisateur a donné son accord de principe pour l’exploitation de
ses données de localisation. Pour l’instant ces applications intègrent peu de fonctionnalités pour une
participation active de la communauté des utilisateurs, comme par exemple la transmission
d’informations sur des incidents ou situations de trafic.
Page 3
EPFL
Parmi les principales communautés dans lesquelles les utilisateurs jouent un rôle actif, on peut citer
l’application Waze (Figure 2) qui permet la publication d’informations géolocalisées sur les incidents et
l’état du trafic. En 2013, cette application a été rachetée par Google qui intègre certaines informations
directement sur ses cartes (Figure 3).
Figure 2 : Application Waze, exemple de représentation instantanée d’évènements
Figure 3 : Carte Google avec une information (travaux) issue de Waze
En France, on peut citer le service d’assistance à la conduite Coyote (https://www.moncoyote.com/ )
qui est devenu très populaire, avec la diffusion d’informations sur les zones de dangers, dont font
partie les sections de contrôle de vitesse. Cette communauté compte plus de 4 millions d’utilisateurs
en 2015. Compte tenu de la grande quantité de données collectées sur la position et la vitesse des
véhicules, c’est une source complémentaire de données trafic qui intéresse les opérateurs routiers et
les grandes agglomérations. C’est donc un revenu additionnel pour cette société qui revend ces
données aux gestionnaires de trafic.
Pour les transports publics, on peut noter l’application moovit (http://moovitapp.com/fr/ ) qui est un
système d’assistance et d’information multimodal qui permet aux utilisateurs de poster des
informations sur la situation du trafic et l’état des stations et arrêts (Figure 4)
Page 4
EPFL
Figure 4 : Application « moovit » avec fonctions d’infos trafic à la communauté
Ces quelques applications sont de loin une liste exhaustive de services émergeants basés sur une
production participative, que l’on pourrait étendre à l’ensemble des applications qui se développent
autour de la ville intelligente (ou smart city) dont le spectre va bien au-delà des questions de mobilité
et de transports (par. voirie, énergie). Dans ce contexte, de plus en plus d’initiatives citoyennes voient
le jour et permettent à chacun de rapporter des idées sur l’aménagement de la ville et simplement de
notifier des problèmes. L’application seeclickfix est un exemple d’outil qui permet simplement
d’identifier un incident et de le reporter (http://fr.seeclickfix.com/ ).
2.3 Questions juridiques et statut des données
Sans entrer dans le débat juridique sur l’usage des données personnelles par les majeurs de
l’Internet, il convient de mentionner quelques enjeux sur la protection de la sphère privée et la
protection des données.
La protection des données est régie par une loi fédérale (LPD) ainsi que les ordonnances (OLPD,
OCPD) et les directives qui en découlent (par ex. les directives sur les exigences minimales qu’un
système de gestion de la protection des données doit remplir).Dans le domaine des télécoms et de
l’Internet, la problématique de fond réside dans le fait que l’on gère de l’information qui peut contenir
des données personnelles. Il existe une législation en la matière qui détermine si et dans quelle
mesure une information peut être collectée, par qui et pour combien de temps le maître du fichier
peut/doit la conserver. Il y a bien évidement un lien entre la collecte de données et la sphère privée
qui doit être respecté selon la législation en vigueur. Le maître du fichier doit aussi respecter un
principe de proportionnalité afin de collecter uniquement les données nécessaires à la réalisation d’un
but (par exemple, les données de localisation servant uniquement à estimer le trafic).
Dans la perspective d’applications qui combinent la circulation routière, la transmission d’informations
et le rôle d’un ou plusieurs acteurs (gestionnaire du trafic, fournisseurs de services), il serait judicieux
de développer une vision juridique transversale qui tient compte de la loi sur la circulation routière
(LCR), de la LPD et des lois et obligations auxquels sont soumis les opérateurs. Ceci pourrait initier un
débat public sur la problématique de la protection des données dans le contexte de la collecte de
données émises par une communauté d’utilisateurs et collectées par des opérateurs et sociétés de
services.
La question de la propriété des données, ou propriété intellectuelle, est liée à la création d’une
œuvre avec ses droits d’auteur. La protection de la propriété intellectuelle est régie par la loi sur les
Page 5
EPFL
droits d’auteur (LDA). Dans le cas des applications de type crowdsourcing et de leur capacité à
collecter et transmettre de l’information, on est plutôt dans le cas d’une création de base de données
dont l’usage est réglé contractuellement et dont la propriété appartient à celui qui a créé la collection.
La mise à disposition de ces données doit suivre certaines règles, et respecter notamment le principe
de protection des données. Les personnes concernées par les données doivent être informées des
traitements effectués sur ces dernières, ainsi que des moyens utilisés afin de rendre les données
anonymes, ce qui n’est pas toujours évident à saisir en tant que simple utilisateur.
La question d’anonymisation des données fait l’objet d’un large débat public, avec notamment les
risques liés à la disponibilité croissante de bases de données massives et aux capacités de calculs qui
permettent de croiser des jeux de données rendant possible une identification des personnes. Cette
préoccupation a été largement décrite dans l’étude américaine sur le « Mobile Century » (Bayen,
2010). Cette étude propose notamment des solutions afin d’éviter de pouvoir croiser des données de
traces GPS avec des bases de données de points adresses. En combinant les données brutes, on
peut sans grandes difficultés associer une trace GPS (même anonyme) à un point de départ
(habitation) et une destination (lieu de travail). Ces questions ont également été soulevées et
discutées dans l’étude de TA-Swiss intitulée « Lokalisiert und identifiziert » (Hilty, 2012).
3. Synthèse et perspectives
Le crowdsourcing offre un grand potentiel pour le domaine des transports avec des conditions
favorables à une participation active des acteurs : très grand nombre d’utilisateurs, répartition dans
tous les modes et sur tout le territoire, motivation pour améliorer le système de transport. Parmi les
quelques projets évoqués, on constate que les initiatives basés sur une participation passive de la
foule (enregistrement de traces GPS) sont très bien implémentés et permettent de couvrir une région
ou un réseau routier de manière relativement complète. Toutefois, ces initiatives sont souvent limitées
à un seul mode de transport et n’intègrent pas l’ensemble des informations utiles pour un trajet
multimodal. Les quelques initiatives dans lesquelles la foule est active sont intéressantes car elles
permettent de multiplier les points d’observation des conditions de transport avec toutefois une grande
hétérogénéité de la qualité de l’information.
Cette approche d’une participation de la foule peut donner lieu au meilleur comme au pire. Il est donc
important de développer des mécanismes robustes qui permettent de contrôler la qualité des données
et de se prémunir contre toute forme de malveillance. La multiplication des initiatives et le
regroupement de nombreux acteurs, comme dans la ville intelligente, est certainement un terrain
favorable au renforcement du concept d’une production participative active. Dans un même temps, les
administrations publiques mettent de plus en plus de données en libre accès (Open data), ce qui
favorise également leur enrichissement par les citoyens. On peut citer l’exemple des transports
publics genevois qui ont ouvert leur flux de données en temps réel, permettant ainsi la création
d’applications innovantes pour l’information aux voyageurs (http://www.tpg.ch/open-data-tpg1 ).
Le phénomène de crowdsourcing est en plein essor dans le domaine des transports en restant
toutefois cloisonné à certains modes. Il faudrait recentrer l’initiative au niveau des usagers et
permettre le développement d’une production participative intermodale, car les usagers ont recours à
plusieurs moyens de transport. C’est souvent aux interfaces des modes de transport que les
informations font défaut et qu’apparait une discontinuité.
4. Bibliographie
Asfora L., Bousquié F.(2011), Le crowdsourcing, enjeux dans le domaine des transports, its-Bretagne
CETE Méditerranée (2013), Compte rendu du séminaire véhicule traceur comme capteur de données
trafic, Lyon 23 mai 2013.
Page 6
EPFL
Hilty L. et al (2012), Lokalisiert und identifiziert, Ta-swiss, VDF-ETHZ, 2012
Bayen M. A (2010), Mobile Century Final Report for TO 1021 and TO 1029: A Traffic Sensing Field
Experiment Using GPS Mobile Phones, CCIT Research Report UCB-ITS-CWP-2010-4
Guittard C., Schenk E.(2009), Le crowdsourcing: une typologie des pratiques d’externalisation vers la
foule, colloque « frontière numérique », Brest 2009
Leduc J. (2008), Road Traffic Data: Collection Methods and Applications, JRC Technical Notes
Howe J. (2006,a), The rise of crowdsourcing, Wired magazine, issue
14.06 http://archive.wired.com/wired/archive/14.06/crowds.html, consulté le 23.04.2015
Howe J. (2006,b), 5 rules of the new labor pool, Wired magazine, issue 14.06
http://archive.wired.com/wired/archive/14.06/labor.html , consulté le 23.04.2015
Liens Internet
Dictionnaire de l’office québécois de la langue française :
http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=45436 , consulté le 23.04.2015
Préposé à la protection des données Zh: (consulté le 23.04.2015)
https://dsb.zh.ch/internet/datenschutzbeauftragter/de/themen/datenschutz_in_kuerze.html
Projet Nano-Terra: Crowdsourcing high-resolution air quality sensing
http://www.nano-tera.ch/projects/423.php# , consulté le 23.04.2015
INRIX :
http://www.roadtraffic-technology.com/features/featurecrowd-sourced-traffic-data-android-smartphone/
Moovit:
http://moovitapp.com/ , consulté le 23.04.2015
Page 7
EPFL
5. Annexe
Chronologie des activités
Cette partie reprend les thèmes identifiés dans le premier rapport et définit les priorités et les actions à
entreprendre. Le thème sur le monitoring de la qualité est en première priorité et quelques activités
liées à ce thème sont proposées.
Priorités
Cette partie propose quelques actions possibles selon les thématiques identifiées et fixe des priorités
pour leurs études
[Tableau 1] Liste des propositions de thèmes et actions
Thème
Monitoring de la qualité
Certification des données
Anonymisation des données
Lutte contre la fraude
Types d‘actions
- Concepts, normalisation
- Développement d‘outils
- Aspects organisationnels et juridiques
- Développement d’outils et procédures
- Développement d’outils
- Développement de moyens de contrôle
- Aspects organisationnels et juridiques
- Développement d’outils de diagnostic
- Développement de concepts
Priorité
1
2
3
3
Activités sur le monitoring de la qualité (rapport 1 du 16.5.13)
Parmi les activités envisagées sur ce premier thème, on peut citer les actions à court et moyen
termes :
-
-
-
Organisation d’une journée (its-ch - Tagung) en automne 2014 avec le développement d’une
thématique autour des données du trafic et de la mobilité (programme en cours de
préparation)
Participation à des rencontres nationales et internationales sur le thème de l’acquisition et de
la gestion des données du trafic (par exemple : séminaire IFSTTAR, SETRA, CERTU du
23.05.13 sur le véhicule traceur comme capteur de données trafic).
Etablissement d’un groupe de travail entre la VSS-FK9 et l’OFROU pour la définition de
projets de recherche sur la qualité de données liée à l’information trafic
Inventaire des principaux projets, directives et normes sur la qualité des données et leur
évaluation
Identification des principaux acteurs concernés et représentatifs des enjeux de ce thème
Coordination du thème « données des transports » avec les autres thèmes prioritaires
Page 8
EPFL
Développement dans le rapport 2 (20.11.2013)
e
Le 2 rapport a permis de développer le thème du monitoring de la qualité des données ITS avec les
parties suivantes :
Résume
La multiplicité des sources de données sur les déplacements permet à de nombreux acteurs
de la mobilité de proposer de nouveaux services qui sont diffusés sur l’Internet. Face à ces nouveaux
canaux d’informations, les responsables de réseaux de transports et d’infrastructures doivent gérer le
trafic, prendre des décisions et informer les usagers. Ces opérations ne peuvent être établies que sur
la base d’informations fiables. Ce second article propose de développer le thème du monitoring de la
qualité des données et services ITS en fonction de la situation des normes et projets en Suisse et en
Europe. Il propose des initiatives ou idées de projets en abordant les questions méthodologiques,
organisationnelles et de normalisation.
Situation et développement
o Problématique et situation actuelle de la qualité des données ITS en Suisse et en
Europe
o Moyens d’évaluation et de contrôle, normes et bonnes pratiques, organisation
o Projets clés pour la Suisse
- Contexte du déploiement des services ITS
- Qualité des données et des services dans les ITS
- Etat du développement
o Norme ISO, projet
Méthodologie
- Approche du projet Quantis (www.quantis-project.eu)
Bibliographie
Gilliéron, P.-Y. (2013), Big Data : un enjeu majeur pour gérer le trafic et la mobilité, Route et Trafic, pp
31-33, Vol. 09-2013
Gilliéron, P.-Y. (2014), Qualité et avalanche de données : est-ce compatible ?, Route et Trafic, pp 3335, Vol. 03-2014
Page 9
EPFL
Développement dans le rapport 3 (14.05.2014)
e
Le 3 rapport a permis de développer le thème de l’intégrité du positionnement dans les ITS et le
transport routier. Ce rapport contient les parties suivantes :
Résumé
Les données de trafic et de mobilité sont essentielles pour le déploiement des services ITS. Parmi ces
données, le rôle de la localisation n’est plus à démontrer dans les applications du transport terrestre.
Avec la grande diffusion des systèmes de navigation basée sur le GPS, on a le sentiment que la
question de la localisation est complétement réglée. Or, ce n’est de loin pas le cas pour les
applications exigeantes qui nécessitent un haut niveau de confiance dans la localisation. Cet article
fait le point sur les développements GNSS et les actions en cours pour normaliser et certifier les
terminaux de localisation pour le transport terrestre.
Etat de l’art
o Développement des systèmes de navigation par satellites
o Etat de la normalisation
o Action COST SaPPART
Problématique de la qualité du positionnement
o Localisation par rapport aux exigences des ITS
o Caractéristiques des erreurs et notion d’intégrité
o Concept d’intégrité
Conclusion
Bibliographie
Gilliéron, P.-Y. (2014), Intégrité du positionnement dans le transport routier, Route et Trafic, pp 14-17,
Vol. 09-2014
Page 10
EPFL