Les initiatives du W3C dans le Digital Publishing, l`Open Data

Transcription

Les initiatives du W3C dans le Digital Publishing, l`Open Data
Les initiatives du W3C dans le Digital Publishing, l'Open Data, le Web Sémantique et
l'Internet des Objets
Séminaire organisé par le GFII le 6 décembre 2013
Amphithéâtre Gilles Glicenstein, Groupe BNP Paribas, Paris
Synthèse
Interventions de Bernard Odier, W3C
Robin Berjon, expert W3C, éditeur de HTML5
60 participants
Introduction sur le W3C
La standardisation et la recherche sont intimement liées. L'innovation passe par plusieurs pans, autre que la seule
technologie : service/usage, business model, innovation marketing ou financière. On ne peut pas parler d'innovation
sans parler d'écosystème (Route 128, Silicon Valley).
Le web a été inventé par Tim Berners-Lee en 1989. Un écosystème dédié à sa promotion a été créé en 1995 par
l'université de Boston (MIT), L' INRIA, et la Keio University de Tokyo.
Le W3C ne reçoit aucune subvention. L'objectif est de créer des standards du web gratuits qui irriguent la sphère
économie, publique, sociale …
Recherche et standards.
En France existe un bureau de représentation du W3C; ce bureau France est porté par INRIA.
En effet, la promotion des standards du web constitue une extension naturelle des activités de recherche.
Quelques technologies issues de la recherche vont bouleverser le monde économique et la société. Toutes ces
recherches se retrouvent dans les standards du W3C, dont le but est de créer des outils interopérables. Par exemple,
le traitement des données (Big data) est en train de révolutionner la publicité et le marketing. La composante vidéo
de la publicité se développe énormément, liée au développement des mobiles, des réseaux sociaux et de la télé
connectée.
Transforming the web together
L’objectif est “un web pour tous” : assurer l'accessibilité des données (quelque soit la langue par exemple), la
richesse des contenus et leur interaction, le portage sur tous les terminaux, la sécurité des données personnelles.
De nombreux standards existent. Le but du W3C est de tous les rendre interopérables pour avoir une meilleure
communication entre ces données et développer de bonnes pratiques.
Il existe de nombreux groupes de travail horizontaux, mais aujourd’hui il est d’intéressant d’avoir une approche par
métier (automobile connectée, publishing) : le W3C accompagne ainsi les mutations de ces filières et formule des
observations ou recommandations.
Web sémantique
Le W3C travaille sur RDF, OWL, SPARQL pour créer des données liées (linked data). Les grands acteurs du web
comme Google, Baidu, Yandex font partie du groupe de travail Web sémantique.
Digital Publishing
Le W3C travaille à partir de l’epub3 sur ce qui peut être amélioré pour les fournisseurs de technologies et contenus.
Hachette vient de rejoindre le W3C pour être associé aux réflexions autour des innovations du digital publishing et
participer à cet écosystème. Il est important que l’industrie du publishing en France et en Europe participe en amont
à ces réflexions.
GFII - 43 rue Beaubourg - 75003 Paris - Tél. : 01 43 72 96 52 - Fax : 01 43 72 56 04
mél : [email protected] - site web : http://www.gfii.fr
Le W3C travaille beaucoup avec les vendeurs de technologies, mais pas suffisamment avec les grands groupes
utilisateurs de ces technologies. En marge des discussions technologiques, les impacts sociaux, organisationnels,
économiques, en termes d’usage sont discutés au sein des Workgroups du W3C, et font partie intégrante de leur
développement.
A une question sur la réflexion de standards autour de la propriété intellectuelle (par exemple les DRM), Bernard
Odier indique que c’est une question récurrente mais que la réflexion n'a pas abouti : le standard qui en résulterait
serait extrêmement complexe et du coup peu utilisé. Des travaux ont été menés sur la gestion des droits audio et
vidéo. Cette question a également été évoquée dans le groupe Digital Publishing. Il n’y a pas eu de consensus sur les
cas d’usage et sur la gestion des DRM. Les DRM et certaines pratiques commerciales sont un frein au développement
des usages et des standards ouverts. . Il convient de travailler sur les usages avant de réfléchir aux solutions que peut
proposer l’industrie.
Web & TV Integration
Il s’agit pour le moment d’un groupe d'intérêts et pas encore d’un groupe de standardisation.
HTML5 sert pour le déploiement sur les différents supports : intégration vidéo, gestion des sous-titres, applicatifs
(plateformes télévisuelles interactives permettant de proposer des informations complémentaires), synchronisation
de plusieurs supports.
Open Data
Le W3C a des liens serrés avec les acteurs de l'open data. Un Groupe du W3C est consacré à l’eGov, avec notamment
un chantier sur la standardisation de l’open data. Pour l'instant, il s’agit du recueil des besoins et problématiques.
Ensuite, le W3C travaillera à fournir des solutions.
Cette question est très liée également aux Linked Data. Beaucoup de sources, notamment dans l'administration,
sont au format Excel et non pas dans les standards du web sémantique.
Le W3C travaille notamment, dans le cadre des réflexions autour de l’open data, sur un nouveau standard CSV
ouvert (facile à produire à partir d’Excel) pour faciliter la conversion des données en RDF, leur liaison et leur
exposition dans le web des données.
L’INRIA participe également au projet Datalift1 .
HTML5
Le format devrait sortir en 2014. L’objectif est d’en faire une norme de création pour la l’édition et la publication de
contenus sur mobile. Côté technique, il n’y a pas d’obstacle. Toute l'architecture d'HTML a été pensée comme
indépendante du support et a été axée sur des problématiques d'accessibilité. Ce qui est un énorme atout
actuellement pour la mise en place d'HTML5 (voir cours en ligne proposé par le W3C sur le sujet).
1
Datalift porte les données brutes structurées venant de plusieurs formats (bases de données, CSV, XML) vers des données sémantiques
interconnectées sur le Web de données. Datalift est un projet de recherche expérimentale financé par l'agence nationale de la recherche. Le
but du projet est de développer une plateforme pour publier et interconnecter des jeux de données sur le web de données. Data lift à la fois
publie des jeux de données provenant d'un réseau de partenaires et propose un ensemble d'outils facilitant le processus de publication de jeux
de données. Source : http://datalift.org/
W3C - Synthèse de la rencontre du 6 décembre 2013
2
Un autre chantier avec HTML5 est le paiement en ligne, la régulation des paiements au niveau international. La
question est comment faire un système de paiement totalement sûr et universel. Parmi les pistes à l’étude :
développer un « portefeuille numérique » accessible depuis tout type de terminal, mix entre le cloud et une solution
embarquée sur le support. Il est important de séparer l’identification de l’authentification. Il existe des générateurs
de clés aléatoires mais ce sont des outils propriétaires et on manque de solution universelle. Il faut trouver un
équilibre entre la facilité d’usage et la sécurité.
Un groupe de lancement se déroulera sur cette question à Paris les 24-25 Mars 2014 : des appels à participation
seront lancés. La participation est gratuite sous réserve d’exprimer avant le séminaire ses positions ou ses idées.
Web of things
Il s’agit d’organiser la communication entre tous les objets connectés : télévision interactive, ordinateur,
imprimantes voire même automobile. La standardisation doit s’enrichir avec la prospective et la recherche.
Un Community group (état d’un sujet très en amont) a été lancé, avant la création d’un groupe. Ce sujet aura des
applications fondamentales dans les domaines des Smart Cities, Smart Health (« santé connectée »), Smart Homes,
Smart Retail, voiture étendue. Parmi les champs que la recherche doit encore investiguer : comment décrire les
capteurs ? Comment utiliser les capteurs ? Quelle est la nature des informations collectées (publiques, privées)?
Comment modéliser et interpréter ces données grâce au web sémantique (moduler l'éclairage public en fonction de
la météo)? Quels protocoles d’échange utiliser ? Les questions de la géolocalisation et du respect de la vie privée
sont également au cœur des problématiques. Un projet de recherche européen est consacré à la vie privée.
Tous ces chantiers sont très importants et sont représentatifs de l'avenir du W3C et du web.
Informations complémentaires : le W3C vient de créer deux services en ligne: une suite de validation, et des cours en
ligne:
https://validator-suite.w3.org/ (validation de site web)
http://classroom.w3devcampus.com/
W3C - Synthèse de la rencontre du 6 décembre 2013
3

Documents pareils