Les initiatives du W3C dans le Digital Publishing, l`Open Data
Transcription
Les initiatives du W3C dans le Digital Publishing, l`Open Data
Les initiatives du W3C dans le Digital Publishing, l'Open Data, le Web Sémantique et l'Internet des Objets Séminaire organisé par le GFII le 6 décembre 2013 Amphithéâtre Gilles Glicenstein, Groupe BNP Paribas, Paris Synthèse Interventions de Bernard Odier, W3C Robin Berjon, expert W3C, éditeur de HTML5 60 participants Introduction sur le W3C La standardisation et la recherche sont intimement liées. L'innovation passe par plusieurs pans, autre que la seule technologie : service/usage, business model, innovation marketing ou financière. On ne peut pas parler d'innovation sans parler d'écosystème (Route 128, Silicon Valley). Le web a été inventé par Tim Berners-Lee en 1989. Un écosystème dédié à sa promotion a été créé en 1995 par l'université de Boston (MIT), L' INRIA, et la Keio University de Tokyo. Le W3C ne reçoit aucune subvention. L'objectif est de créer des standards du web gratuits qui irriguent la sphère économie, publique, sociale … Recherche et standards. En France existe un bureau de représentation du W3C; ce bureau France est porté par INRIA. En effet, la promotion des standards du web constitue une extension naturelle des activités de recherche. Quelques technologies issues de la recherche vont bouleverser le monde économique et la société. Toutes ces recherches se retrouvent dans les standards du W3C, dont le but est de créer des outils interopérables. Par exemple, le traitement des données (Big data) est en train de révolutionner la publicité et le marketing. La composante vidéo de la publicité se développe énormément, liée au développement des mobiles, des réseaux sociaux et de la télé connectée. Transforming the web together L’objectif est “un web pour tous” : assurer l'accessibilité des données (quelque soit la langue par exemple), la richesse des contenus et leur interaction, le portage sur tous les terminaux, la sécurité des données personnelles. De nombreux standards existent. Le but du W3C est de tous les rendre interopérables pour avoir une meilleure communication entre ces données et développer de bonnes pratiques. Il existe de nombreux groupes de travail horizontaux, mais aujourd’hui il est d’intéressant d’avoir une approche par métier (automobile connectée, publishing) : le W3C accompagne ainsi les mutations de ces filières et formule des observations ou recommandations. Web sémantique Le W3C travaille sur RDF, OWL, SPARQL pour créer des données liées (linked data). Les grands acteurs du web comme Google, Baidu, Yandex font partie du groupe de travail Web sémantique. Digital Publishing Le W3C travaille à partir de l’epub3 sur ce qui peut être amélioré pour les fournisseurs de technologies et contenus. Hachette vient de rejoindre le W3C pour être associé aux réflexions autour des innovations du digital publishing et participer à cet écosystème. Il est important que l’industrie du publishing en France et en Europe participe en amont à ces réflexions. GFII - 43 rue Beaubourg - 75003 Paris - Tél. : 01 43 72 96 52 - Fax : 01 43 72 56 04 mél : [email protected] - site web : http://www.gfii.fr Le W3C travaille beaucoup avec les vendeurs de technologies, mais pas suffisamment avec les grands groupes utilisateurs de ces technologies. En marge des discussions technologiques, les impacts sociaux, organisationnels, économiques, en termes d’usage sont discutés au sein des Workgroups du W3C, et font partie intégrante de leur développement. A une question sur la réflexion de standards autour de la propriété intellectuelle (par exemple les DRM), Bernard Odier indique que c’est une question récurrente mais que la réflexion n'a pas abouti : le standard qui en résulterait serait extrêmement complexe et du coup peu utilisé. Des travaux ont été menés sur la gestion des droits audio et vidéo. Cette question a également été évoquée dans le groupe Digital Publishing. Il n’y a pas eu de consensus sur les cas d’usage et sur la gestion des DRM. Les DRM et certaines pratiques commerciales sont un frein au développement des usages et des standards ouverts. . Il convient de travailler sur les usages avant de réfléchir aux solutions que peut proposer l’industrie. Web & TV Integration Il s’agit pour le moment d’un groupe d'intérêts et pas encore d’un groupe de standardisation. HTML5 sert pour le déploiement sur les différents supports : intégration vidéo, gestion des sous-titres, applicatifs (plateformes télévisuelles interactives permettant de proposer des informations complémentaires), synchronisation de plusieurs supports. Open Data Le W3C a des liens serrés avec les acteurs de l'open data. Un Groupe du W3C est consacré à l’eGov, avec notamment un chantier sur la standardisation de l’open data. Pour l'instant, il s’agit du recueil des besoins et problématiques. Ensuite, le W3C travaillera à fournir des solutions. Cette question est très liée également aux Linked Data. Beaucoup de sources, notamment dans l'administration, sont au format Excel et non pas dans les standards du web sémantique. Le W3C travaille notamment, dans le cadre des réflexions autour de l’open data, sur un nouveau standard CSV ouvert (facile à produire à partir d’Excel) pour faciliter la conversion des données en RDF, leur liaison et leur exposition dans le web des données. L’INRIA participe également au projet Datalift1 . HTML5 Le format devrait sortir en 2014. L’objectif est d’en faire une norme de création pour la l’édition et la publication de contenus sur mobile. Côté technique, il n’y a pas d’obstacle. Toute l'architecture d'HTML a été pensée comme indépendante du support et a été axée sur des problématiques d'accessibilité. Ce qui est un énorme atout actuellement pour la mise en place d'HTML5 (voir cours en ligne proposé par le W3C sur le sujet). 1 Datalift porte les données brutes structurées venant de plusieurs formats (bases de données, CSV, XML) vers des données sémantiques interconnectées sur le Web de données. Datalift est un projet de recherche expérimentale financé par l'agence nationale de la recherche. Le but du projet est de développer une plateforme pour publier et interconnecter des jeux de données sur le web de données. Data lift à la fois publie des jeux de données provenant d'un réseau de partenaires et propose un ensemble d'outils facilitant le processus de publication de jeux de données. Source : http://datalift.org/ W3C - Synthèse de la rencontre du 6 décembre 2013 2 Un autre chantier avec HTML5 est le paiement en ligne, la régulation des paiements au niveau international. La question est comment faire un système de paiement totalement sûr et universel. Parmi les pistes à l’étude : développer un « portefeuille numérique » accessible depuis tout type de terminal, mix entre le cloud et une solution embarquée sur le support. Il est important de séparer l’identification de l’authentification. Il existe des générateurs de clés aléatoires mais ce sont des outils propriétaires et on manque de solution universelle. Il faut trouver un équilibre entre la facilité d’usage et la sécurité. Un groupe de lancement se déroulera sur cette question à Paris les 24-25 Mars 2014 : des appels à participation seront lancés. La participation est gratuite sous réserve d’exprimer avant le séminaire ses positions ou ses idées. Web of things Il s’agit d’organiser la communication entre tous les objets connectés : télévision interactive, ordinateur, imprimantes voire même automobile. La standardisation doit s’enrichir avec la prospective et la recherche. Un Community group (état d’un sujet très en amont) a été lancé, avant la création d’un groupe. Ce sujet aura des applications fondamentales dans les domaines des Smart Cities, Smart Health (« santé connectée »), Smart Homes, Smart Retail, voiture étendue. Parmi les champs que la recherche doit encore investiguer : comment décrire les capteurs ? Comment utiliser les capteurs ? Quelle est la nature des informations collectées (publiques, privées)? Comment modéliser et interpréter ces données grâce au web sémantique (moduler l'éclairage public en fonction de la météo)? Quels protocoles d’échange utiliser ? Les questions de la géolocalisation et du respect de la vie privée sont également au cœur des problématiques. Un projet de recherche européen est consacré à la vie privée. Tous ces chantiers sont très importants et sont représentatifs de l'avenir du W3C et du web. Informations complémentaires : le W3C vient de créer deux services en ligne: une suite de validation, et des cours en ligne: https://validator-suite.w3.org/ (validation de site web) http://classroom.w3devcampus.com/ W3C - Synthèse de la rencontre du 6 décembre 2013 3