2015-1 - ITS-CH
Transcription
2015-1 - ITS-CH
its-ch Swiss Platform for the Promotion of ITS Thème prioritaire: Données des transports, sphère privée et avalanches de données Traité par: EPFL Rapport: 7 mai 2015 (2015-1) Les données de trafic et de mobilité sont essentielles pour le déploiement des services ITS. L’avènement des nouvelles technologies de la communication et de l’informatique offre un fort potentiel pour la saisie et la transmission d’informations liées à la mobilité. L’usage de ces technologies permet à chacun de collecter des informations et de les transmettre dans une optique de production participative (crowdsourcing) pour des services de mobilités ou de gestion des transports. Ce quatrième rapport propose de préciser le concept de crowdsourcing et son usage dans les services d’information et de gestion des transports. Il présente la problématique du crowdsourcing avec ses éléments techniques, quelques exemples d’applications, quelques aspects juridiques et ainsi que les perspectives pour le domaine des transports. Responsable: Nom: Pierre-Yves Gilliéron Organisation: Ecole polytechnique fédérale de Lausanne Adresse: EPFL - Laboratoire de Topométrie, Station 18, 1015 Lausanne, [email protected] Rédaction du 23.04.2015 Its-ch c/o VSS Silhlquai 255 CH-8005 Zürich Telefon: +41 44 269 40 20 Telefax: +41 44 252 31 30 E-Mail: [email protected] Version 23.04.2015 Crowdsourcing pour la mobilité et les transports 1. Concept et principe 1.1 Concept de la production participative Le « crowdsourcing » est un concept qui a été décrit par J. Howe et M. Robinson en 2006 (Howe, 2006,a) que l’on peut traduire littéralement comme l’approvisionnement par la foule ou production participative. Le principe proposé se base sur l’utilisation du temps disponible et des compétences d’un large public ou d’une foule (crowd) pour la réalisation de certaines tâches, la résolution de problèmes ou la fourniture d’informations. Contrairement au principe de l’outsourcing qui consiste à confier des tâches spécifiques à des entreprises spécialisées, le crowdsourcing propose un modèle d’externalisation distribuée basé sur un grand nombre de participants. Au Québec, on a défini le terme d’externalisation ouverte qui est bien approprié. Le déploiement de ce mécanisme est devenu possible par l’intermédiaire des nouvelles technologies de l’Internet, des plateformes mobiles et des télécommunications. La démocratisation de l’accès à ces technologies a permis à un large public de disposer de moyens informatiques et de communication, créant des conditions favorables à une production participative. 1.2 Principe de fonctionnement On distingue 2 types de crowdsourcing : la collaboration active à résoudre un problème (par ex. la fourniture explicite d’une information sur l’état du trafic), la participation passive (par ex. enregistrement de traces GPS). En général, la participation de la « foule » est liée au fait d’appartenir à une communauté ou au travers d’applications mobiles facilitant la récolte et la diffusion d’informations. On distingue trois type de tâches : routinière (collecte de données) ; complexe (résolution de problèmes) et créatives (Guittard et Schenk, 2009) Dans la description de la méthode de crowdsourcing (Howe, 2006, b), l’auteur propose 5 constats à propos des capacités de la foule : elle est massive et dispersée, elle est pleine de spécialistes, elle est capable de trouver des solutions appropriées, elle a peu de temps à consacrer, elle peut aussi contribuer faussement. A partir de ces constats, on peut relever l’immense potentiel du crowd, mais aussi ses limites et ses risques. On peut relever les questions récurrentes relatives à ce concept que sont le statut de l’expertise, la propriété intellectuelle d’un travail, la responsabilité en cas d’erreurs, voir l’esprit malveillant de la part de certains contributeurs. A priori, le crowd s’appuie sur le grand nombre d’informations redondantes, permettant ainsi, par statistique, d’éliminer des observations fausses ou aberrantes. Par exemple, la transmission d’une observation d’un incident (par ex. un objet sur la chaussée) devrait être fournie par plusieurs sources indépendantes, afin d’être vérifiée et publiée comme une information. Toutefois, ce principe ne s’applique pas toujours, notamment pour des évènements rares. Ce phénomène de production participative, impliquant les citoyens, peut être perçu comme une approche positive et ouverte face au fonctionnement de notre société, que l’on pourrait présenter comme un outil de démocratie directe. Toutefois, il faut rester vigilant, car ces nouveaux modèles économiques, suscitent également de la controverse et des critiques, comme l’impact sur des emplois rémunérés, les intentions commerciales cachées, le respect de la sphère privée, l’attribution de rôles non souhaité (par ex. : surveillance). Les champs d’action du crowdsourcing sont nombreux, un des plus célèbres étant l’encyclopédie en ligne Wikipédia. Dans le domaine des cartes géographiques, on peut citer le projet OpenStreetMap qui est un bel exemple de travail collaboratif de récolte de géodonnées à grande échelle. Page 2 EPFL 2. Applications à la mobilité et aux transports 2.1 Services basés sur la localisation La mobilité et des transports s’imposent naturellement comme un terrain propice au déploiement d’initiatives collaboratives sachant qu’une foule potentielle d’utilisateurs est prête à contribuer activement ou passivement à l’amélioration du système de transport par la transmission de données ou d’observations. Le crowdsourcing permet de mieux renseigner les systèmes d’information car chaque contributeur est un capteur potentiel de données (Asfora et Bousquié, 2011). Les téléphones mobiles avec leur capacité de déterminer une position (basée sur le GPS, Wifi ou 3G/4G) offrent le capteur idéal pour le recueil de données sur la mobilité et le trafic (CETE Méditerranée, 2013). De nombreuses publications présentent le recueil de données basés sur le « floating car data » ou le « floating phone data » avec le principe d’une transmission de positions (traces GPS) à une centrale de collecte ou de détermination à distance de la position des mobiles (Figure 1). Ces positions transmises ou déterminées en temps réel sont datées et peuvent s’accompagner d’autres données provenant de capteurs embarqués (par ex. la température) ou d’informations saisies par l’utilisateur (ex. notification d’un incident). Figure 1 : Principe du « floating car data » comparé aux capteurs classiques du trafic 2.2 Principales applications Avec le développement massif d’applications mobiles, il est difficile de faire un inventaire des principales applications qui intègrent le concept de production participative à la mobilité et aux transports. Toutefois, on peut distinguer les applications liées à des fournisseurs de services privés (Ex. Google, TomTom, Coyote) des initiatives citoyennes ou à vocation de service public. Parmi les fournisseurs de services, on peut citer ceux de la navigation automobile, qui ont développé des systèmes connectés ou applications qui remontent régulièrement des données sur la position et la vitesse des véhicules. Ces données, combinées à des historiques de la charge de trafic, permettent de dériver des informations sur l’état du trafic routier qui peuvent être retournées en temps réel aux utilisateurs. Les principaux acteurs présents sur ce marché sont : TomTom (cartes Teleatlas), HERE (cartes Nokia/Navtech) et INRIX. On peut également citer les majeurs de l’Internet comme Google et Microsoft qui sont aussi actifs sur le marché de la collecte de données et diffusion d’information sur le trafic. La plupart de ces applications ont recours à la fonction de localisation des smartphones et remontent automatiquement des parcours des utilisateurs en garantissant a priori un traitement anonyme des données, sachant que l’utilisateur a donné son accord de principe pour l’exploitation de ses données de localisation. Pour l’instant ces applications intègrent peu de fonctionnalités pour une participation active de la communauté des utilisateurs, comme par exemple la transmission d’informations sur des incidents ou situations de trafic. Page 3 EPFL Parmi les principales communautés dans lesquelles les utilisateurs jouent un rôle actif, on peut citer l’application Waze (Figure 2) qui permet la publication d’informations géolocalisées sur les incidents et l’état du trafic. En 2013, cette application a été rachetée par Google qui intègre certaines informations directement sur ses cartes (Figure 3). Figure 2 : Application Waze, exemple de représentation instantanée d’évènements Figure 3 : Carte Google avec une information (travaux) issue de Waze En France, on peut citer le service d’assistance à la conduite Coyote (https://www.moncoyote.com/ ) qui est devenu très populaire, avec la diffusion d’informations sur les zones de dangers, dont font partie les sections de contrôle de vitesse. Cette communauté compte plus de 4 millions d’utilisateurs en 2015. Compte tenu de la grande quantité de données collectées sur la position et la vitesse des véhicules, c’est une source complémentaire de données trafic qui intéresse les opérateurs routiers et les grandes agglomérations. C’est donc un revenu additionnel pour cette société qui revend ces données aux gestionnaires de trafic. Pour les transports publics, on peut noter l’application moovit (http://moovitapp.com/fr/ ) qui est un système d’assistance et d’information multimodal qui permet aux utilisateurs de poster des informations sur la situation du trafic et l’état des stations et arrêts (Figure 4) Page 4 EPFL Figure 4 : Application « moovit » avec fonctions d’infos trafic à la communauté Ces quelques applications sont de loin une liste exhaustive de services émergeants basés sur une production participative, que l’on pourrait étendre à l’ensemble des applications qui se développent autour de la ville intelligente (ou smart city) dont le spectre va bien au-delà des questions de mobilité et de transports (par. voirie, énergie). Dans ce contexte, de plus en plus d’initiatives citoyennes voient le jour et permettent à chacun de rapporter des idées sur l’aménagement de la ville et simplement de notifier des problèmes. L’application seeclickfix est un exemple d’outil qui permet simplement d’identifier un incident et de le reporter (http://fr.seeclickfix.com/ ). 2.3 Questions juridiques et statut des données Sans entrer dans le débat juridique sur l’usage des données personnelles par les majeurs de l’Internet, il convient de mentionner quelques enjeux sur la protection de la sphère privée et la protection des données. La protection des données est régie par une loi fédérale (LPD) ainsi que les ordonnances (OLPD, OCPD) et les directives qui en découlent (par ex. les directives sur les exigences minimales qu’un système de gestion de la protection des données doit remplir).Dans le domaine des télécoms et de l’Internet, la problématique de fond réside dans le fait que l’on gère de l’information qui peut contenir des données personnelles. Il existe une législation en la matière qui détermine si et dans quelle mesure une information peut être collectée, par qui et pour combien de temps le maître du fichier peut/doit la conserver. Il y a bien évidement un lien entre la collecte de données et la sphère privée qui doit être respecté selon la législation en vigueur. Le maître du fichier doit aussi respecter un principe de proportionnalité afin de collecter uniquement les données nécessaires à la réalisation d’un but (par exemple, les données de localisation servant uniquement à estimer le trafic). Dans la perspective d’applications qui combinent la circulation routière, la transmission d’informations et le rôle d’un ou plusieurs acteurs (gestionnaire du trafic, fournisseurs de services), il serait judicieux de développer une vision juridique transversale qui tient compte de la loi sur la circulation routière (LCR), de la LPD et des lois et obligations auxquels sont soumis les opérateurs. Ceci pourrait initier un débat public sur la problématique de la protection des données dans le contexte de la collecte de données émises par une communauté d’utilisateurs et collectées par des opérateurs et sociétés de services. La question de la propriété des données, ou propriété intellectuelle, est liée à la création d’une œuvre avec ses droits d’auteur. La protection de la propriété intellectuelle est régie par la loi sur les Page 5 EPFL droits d’auteur (LDA). Dans le cas des applications de type crowdsourcing et de leur capacité à collecter et transmettre de l’information, on est plutôt dans le cas d’une création de base de données dont l’usage est réglé contractuellement et dont la propriété appartient à celui qui a créé la collection. La mise à disposition de ces données doit suivre certaines règles, et respecter notamment le principe de protection des données. Les personnes concernées par les données doivent être informées des traitements effectués sur ces dernières, ainsi que des moyens utilisés afin de rendre les données anonymes, ce qui n’est pas toujours évident à saisir en tant que simple utilisateur. La question d’anonymisation des données fait l’objet d’un large débat public, avec notamment les risques liés à la disponibilité croissante de bases de données massives et aux capacités de calculs qui permettent de croiser des jeux de données rendant possible une identification des personnes. Cette préoccupation a été largement décrite dans l’étude américaine sur le « Mobile Century » (Bayen, 2010). Cette étude propose notamment des solutions afin d’éviter de pouvoir croiser des données de traces GPS avec des bases de données de points adresses. En combinant les données brutes, on peut sans grandes difficultés associer une trace GPS (même anonyme) à un point de départ (habitation) et une destination (lieu de travail). Ces questions ont également été soulevées et discutées dans l’étude de TA-Swiss intitulée « Lokalisiert und identifiziert » (Hilty, 2012). 3. Synthèse et perspectives Le crowdsourcing offre un grand potentiel pour le domaine des transports avec des conditions favorables à une participation active des acteurs : très grand nombre d’utilisateurs, répartition dans tous les modes et sur tout le territoire, motivation pour améliorer le système de transport. Parmi les quelques projets évoqués, on constate que les initiatives basés sur une participation passive de la foule (enregistrement de traces GPS) sont très bien implémentés et permettent de couvrir une région ou un réseau routier de manière relativement complète. Toutefois, ces initiatives sont souvent limitées à un seul mode de transport et n’intègrent pas l’ensemble des informations utiles pour un trajet multimodal. Les quelques initiatives dans lesquelles la foule est active sont intéressantes car elles permettent de multiplier les points d’observation des conditions de transport avec toutefois une grande hétérogénéité de la qualité de l’information. Cette approche d’une participation de la foule peut donner lieu au meilleur comme au pire. Il est donc important de développer des mécanismes robustes qui permettent de contrôler la qualité des données et de se prémunir contre toute forme de malveillance. La multiplication des initiatives et le regroupement de nombreux acteurs, comme dans la ville intelligente, est certainement un terrain favorable au renforcement du concept d’une production participative active. Dans un même temps, les administrations publiques mettent de plus en plus de données en libre accès (Open data), ce qui favorise également leur enrichissement par les citoyens. On peut citer l’exemple des transports publics genevois qui ont ouvert leur flux de données en temps réel, permettant ainsi la création d’applications innovantes pour l’information aux voyageurs (http://www.tpg.ch/open-data-tpg1 ). Le phénomène de crowdsourcing est en plein essor dans le domaine des transports en restant toutefois cloisonné à certains modes. Il faudrait recentrer l’initiative au niveau des usagers et permettre le développement d’une production participative intermodale, car les usagers ont recours à plusieurs moyens de transport. C’est souvent aux interfaces des modes de transport que les informations font défaut et qu’apparait une discontinuité. 4. Bibliographie Asfora L., Bousquié F.(2011), Le crowdsourcing, enjeux dans le domaine des transports, its-Bretagne CETE Méditerranée (2013), Compte rendu du séminaire véhicule traceur comme capteur de données trafic, Lyon 23 mai 2013. Page 6 EPFL Hilty L. et al (2012), Lokalisiert und identifiziert, Ta-swiss, VDF-ETHZ, 2012 Bayen M. A (2010), Mobile Century Final Report for TO 1021 and TO 1029: A Traffic Sensing Field Experiment Using GPS Mobile Phones, CCIT Research Report UCB-ITS-CWP-2010-4 Guittard C., Schenk E.(2009), Le crowdsourcing: une typologie des pratiques d’externalisation vers la foule, colloque « frontière numérique », Brest 2009 Leduc J. (2008), Road Traffic Data: Collection Methods and Applications, JRC Technical Notes Howe J. (2006,a), The rise of crowdsourcing, Wired magazine, issue 14.06 http://archive.wired.com/wired/archive/14.06/crowds.html, consulté le 23.04.2015 Howe J. (2006,b), 5 rules of the new labor pool, Wired magazine, issue 14.06 http://archive.wired.com/wired/archive/14.06/labor.html , consulté le 23.04.2015 Liens Internet Dictionnaire de l’office québécois de la langue française : http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=45436 , consulté le 23.04.2015 Préposé à la protection des données Zh: (consulté le 23.04.2015) https://dsb.zh.ch/internet/datenschutzbeauftragter/de/themen/datenschutz_in_kuerze.html Projet Nano-Terra: Crowdsourcing high-resolution air quality sensing http://www.nano-tera.ch/projects/423.php# , consulté le 23.04.2015 INRIX : http://www.roadtraffic-technology.com/features/featurecrowd-sourced-traffic-data-android-smartphone/ Moovit: http://moovitapp.com/ , consulté le 23.04.2015 Page 7 EPFL 5. Annexe Chronologie des activités Cette partie reprend les thèmes identifiés dans le premier rapport et définit les priorités et les actions à entreprendre. Le thème sur le monitoring de la qualité est en première priorité et quelques activités liées à ce thème sont proposées. Priorités Cette partie propose quelques actions possibles selon les thématiques identifiées et fixe des priorités pour leurs études [Tableau 1] Liste des propositions de thèmes et actions Thème Monitoring de la qualité Certification des données Anonymisation des données Lutte contre la fraude Types d‘actions - Concepts, normalisation - Développement d‘outils - Aspects organisationnels et juridiques - Développement d’outils et procédures - Développement d’outils - Développement de moyens de contrôle - Aspects organisationnels et juridiques - Développement d’outils de diagnostic - Développement de concepts Priorité 1 2 3 3 Activités sur le monitoring de la qualité (rapport 1 du 16.5.13) Parmi les activités envisagées sur ce premier thème, on peut citer les actions à court et moyen termes : - - - Organisation d’une journée (its-ch - Tagung) en automne 2014 avec le développement d’une thématique autour des données du trafic et de la mobilité (programme en cours de préparation) Participation à des rencontres nationales et internationales sur le thème de l’acquisition et de la gestion des données du trafic (par exemple : séminaire IFSTTAR, SETRA, CERTU du 23.05.13 sur le véhicule traceur comme capteur de données trafic). Etablissement d’un groupe de travail entre la VSS-FK9 et l’OFROU pour la définition de projets de recherche sur la qualité de données liée à l’information trafic Inventaire des principaux projets, directives et normes sur la qualité des données et leur évaluation Identification des principaux acteurs concernés et représentatifs des enjeux de ce thème Coordination du thème « données des transports » avec les autres thèmes prioritaires Page 8 EPFL Développement dans le rapport 2 (20.11.2013) e Le 2 rapport a permis de développer le thème du monitoring de la qualité des données ITS avec les parties suivantes : Résume La multiplicité des sources de données sur les déplacements permet à de nombreux acteurs de la mobilité de proposer de nouveaux services qui sont diffusés sur l’Internet. Face à ces nouveaux canaux d’informations, les responsables de réseaux de transports et d’infrastructures doivent gérer le trafic, prendre des décisions et informer les usagers. Ces opérations ne peuvent être établies que sur la base d’informations fiables. Ce second article propose de développer le thème du monitoring de la qualité des données et services ITS en fonction de la situation des normes et projets en Suisse et en Europe. Il propose des initiatives ou idées de projets en abordant les questions méthodologiques, organisationnelles et de normalisation. Situation et développement o Problématique et situation actuelle de la qualité des données ITS en Suisse et en Europe o Moyens d’évaluation et de contrôle, normes et bonnes pratiques, organisation o Projets clés pour la Suisse - Contexte du déploiement des services ITS - Qualité des données et des services dans les ITS - Etat du développement o Norme ISO, projet Méthodologie - Approche du projet Quantis (www.quantis-project.eu) Bibliographie Gilliéron, P.-Y. (2013), Big Data : un enjeu majeur pour gérer le trafic et la mobilité, Route et Trafic, pp 31-33, Vol. 09-2013 Gilliéron, P.-Y. (2014), Qualité et avalanche de données : est-ce compatible ?, Route et Trafic, pp 3335, Vol. 03-2014 Page 9 EPFL Développement dans le rapport 3 (14.05.2014) e Le 3 rapport a permis de développer le thème de l’intégrité du positionnement dans les ITS et le transport routier. Ce rapport contient les parties suivantes : Résumé Les données de trafic et de mobilité sont essentielles pour le déploiement des services ITS. Parmi ces données, le rôle de la localisation n’est plus à démontrer dans les applications du transport terrestre. Avec la grande diffusion des systèmes de navigation basée sur le GPS, on a le sentiment que la question de la localisation est complétement réglée. Or, ce n’est de loin pas le cas pour les applications exigeantes qui nécessitent un haut niveau de confiance dans la localisation. Cet article fait le point sur les développements GNSS et les actions en cours pour normaliser et certifier les terminaux de localisation pour le transport terrestre. Etat de l’art o Développement des systèmes de navigation par satellites o Etat de la normalisation o Action COST SaPPART Problématique de la qualité du positionnement o Localisation par rapport aux exigences des ITS o Caractéristiques des erreurs et notion d’intégrité o Concept d’intégrité Conclusion Bibliographie Gilliéron, P.-Y. (2014), Intégrité du positionnement dans le transport routier, Route et Trafic, pp 14-17, Vol. 09-2014 Page 10 EPFL