Observer et Identifier les réseaux P2P

Transcription

Observer et Identifier les réseaux P2P
Observer et Identifier les réseaux P2P
étude commandée par la
SPEDIDAM
et réalisée par
BigChampagne Online Media Measurement
9 Janvier 2006
Introduction
Le principe d’un système de licence qui rémunérerait les ayants droit pour le partage de
leurs enregistrements musicaux par les internautes est discuté depuis plusieurs années par
les universitaires (professeurs de droit, économistes), diverses organisations intéressées
(Recording Industry Association of America, Electronic Frontier Foundation) et par les
différents acteurs industriels du secteur (ayants droit divers, développeurs de logiciels
peer-to-peer, etc.).
A côté de cette discussion demeurée en grande partie informelle, tenue lors de
conférences et dans la presse, il existe des études et des propositions précises préconisant
des variations à cette solution (cf. Références). Il existe également une opposition
importante à ce principe (notamment aux Etats-Unis) pour plusieurs raisons.
L’objet de ce document n’est ni d’examiner ni de prendre position sur les questions
juridiques ou économiques posées par la possibilité d’un tel système de licence. Nous
laissons cela aux juristes et aux économistes. Ce document envisage plutôt de délivrer
une vue d’ensemble sur la façon dont le partage de fichiers en ligne peut être observé,
identifié et la façon dont cela pourrait permettre de déterminer la rémunération des ayants
droit dans l’hypothèse où ce système de licence serait mis en place.
A cet égard, ce qui suit est une présentation des principales considérations techniques et
des principaux éléments à prendre en compte pour cette mise en place.
Quelles sont les informations nécessaires?
Avant de voir où et comment il est possible d’observer le partage de fichiers en ligne, il
est utile de déterminer au préalable les éléments d’information nécessaires.
Ainsi que l’a identifié la SPEDIDAM, il est nécessaire, pour chaque œuvre musicale, de
disposer des éléments d’information suivants :
- Titre de l’œuvre
- Nom de l’interprète principal
- Nom du compositeur
- Maison de disque
- Année de l’enregistrement
- Durée de l’œuvre
- Code ISRC (code international normalisé des enregistrements)
- Nombre de téléchargement
Cette liste contient toutes les informations nécessaires pour la gestion de la rémunération
des ayants droit et permettant également l’élaboration d’analyses statistiques de cette
activité pour les personnes intéressées (Interprètes, compositeurs, Maison de disque, etc.).
1
Bien entendu, toutes ces informations ne sont pas systématiquement intégrées dans
chaque fichier musical, surtout en ce qui concerne les réseaux peer-to-peer où les fichiers
sont en général créés et édités par les utilisateurs sans respecter de format précis et sans
inclure les métadonnées requises.
Cependant, dès lors que l’œuvre peut être identifiée à l’aide de certaines données, les
autres informations peuvent y être associées et apparaître dans le rapport d’activité.
Situation géographique par pays
Il est possible de déterminer la localisation géographique des utilisateurs (la France) en
utilisant leur adresse IP (protocole internet) comme référence. La solution employée par
BigChampagne permet le traitement de plus de 99,99 % des adresses IP, avec un taux
d’exactitude « de plus de 99 pourcent » pour l’association de l’adresse IP à son pays.
L’utilisation de ce système, dont les détails sont disponibles dans la partie Références,
permet de déterminer le pays de chaque utilisateur d’un système de partage de fichiers.
Il n’est pas nécessaire de conserver les enregistrements des adresses IP pour
l’établissement de rapports d’activité. La connaissance du pays où se trouve l’utilisateur
suffit.
Identification des œuvres
Pour identifier les musiques que les utilisateurs des systèmes peer-to-peer partagent en
ligne, trois méthodes sont envisageables. Chaque approche a ses caractéristiques propres,
ses vertus et ses limites. Il est important de noter qu’il est possible de les combiner. En
d’autres termes, un système envisagé par la SPEDIDAM ou mis en œuvre par
BigChampagne Media Measurement devrait probablement recourir à plusieurs de ces
méthodes.
•
Empreinte numérique
Cette méthode comprend les variations d’un processus qui crée une représentation
mathématique d’un enregistrement particulier, communément appellée « empreinte
numérique ». On peut se servir d’une empreinte numérique pour identifier un
enregistrement particulier en dépit du fait que des versions numériques différentes du
même enregistrement peuvent avoir des caractéristiques différentes. Les empreintes ont
l’avantage d’être de très petits fichiers qu’on peut transmettre à travers l’internet très
rapidement, même par une connexion de faible bande passante.
L’empreinte numérique peut être très efficace pour l’identification, mais il faut tenir
compte de deux facteurs importants dans son implémentation. Pour produire un
2
« match » (c’est-à-dire, trouver les informations détaillées qui correspondent au fichier
concerné), un système d’empreinte numérique doit analyser mathématiquement chaque
fichier et le comparer avec une bibliothèque d’empreintes connues afin de l’identifier.
Comme détaillé ci-dessous, on peut observer les fichiers musicaux et créer les empreintes
au niveau de l’utilisateur ou du fournisseur d’accès internet (FAI). Un logiciel situé sur
l’ordinateur de l’utilisateur (un logiciel fourni par exemple par le réseau de partage de
fichiers ou par le FAI) pourrait produire des empreintes et les envoyer à un système
central pour les analyser et les identifier. On pourrait également installer de telles
solutions sur le réseau (au niveau du FAI) pour produire les empreintes et, de cette
manière, identifier les fichiers musicaux qui y transitent.
Dans tous les cas, les informations d’identification peuvent être envoyées à une base de
données centrale afin d’en suivre la trace. Cette base de données inclurait tout
renseignement supplémentaire requis sur l’œuvre, comme le code ISRC et les autres
champs nécessaires, pour qu’une fois l’œuvre identifiée tous les champs de données
importants demandés par la SPEDIDAM puissent être compris dans le rapport d’activité.
Dans certains cas, les codes ISRC peuvent être intégrés dans le fichier lui-même ce qui
permettrait d’extraire cette information directement du fichier. Cependant, les codes
ISRC ne sont pas intégrés dans tous les fichiers numériques musicaux et ne peuvent donc
pas être la seule façon de les identifier, surtout dans le domaine du partage de fichiers en
peer-to-peer où la vérification minutieuse du format et des normes des fichiers musicaux
est au final impossible.
Il faut noter que tout cela peut se faire de manière anonyme, sans identification de
l’utilisateur.
•
Analyse des métadonnées
Dans cette démarche, on se sert des caractéristiques du fichier musical pouvant être
déterminées sans travailler sur le fichier lui-même. Avec quelques adaptations selon la
situation, voici des exemples de ces caractéristiques observés sur le réseau (sans
« toucher » au fichier) : taille du fichier, type du fichier, nom du fichier, nom de l’artiste,
titre de la chanson, durée et hash (c’est-à-dire, la représentation mathématique d’un
fichier donné, et non pas de l’enregistrement unique comme l’empreinte numérique). Les
codes ISRC pourraient également être inclus ( les tags ID3 du format MP3 par exemple
supportent les codes ISRC), mais dans ce cas il faut alors faire confiance à l’exactitude
incertaine d’un tag, puisqu’il peut être édité, et non pas à un code intégré dans le fichier
lui-même.
3
Quelques informations disponibles dans les champs métadonnées des MP3
Temps/Time
1/11/2005 0:16
Nom du fichier/File Name
10 Radiohead Motion Picture Soundtrack.mp3
Artiste/Artist
Radiohead
Titre/Title
Motion Picture Soundtrack
Taille/Size
4,167,081
Hash/Hash
104C1032 86DE28….
Année/Year
2000
Durée/Length
421
Qualité/Quality
128
Bien que cette approche n’offre pas le même niveau d’identification positive que celle de
l’empreinte numérique, elle ne nécessite pas l’installation de logiciels sur les nœuds de
réseau pour traiter chaque fichier partagé ou téléchargé. Une fois l’identification faite à
partir du titre de l’œuvre ou de l’interprète principal, on se sert d’une base de données
d’informations correspondantes (comme les codes ISRC et les autres champs) pour
remplir les autres champs nécessaires pour le rapport d’activité.
L’analyse des métadonnées soutient une méthodologie d’observation passive et, comme
les autres méthodologies, s’achève sans qu’aucune information personnelle sur les
utilisateurs n’ait été collectée.
Il n’est pas nécessaire de conserver les enregistrements des adresses IP pour
l’établissement de rapports d’activité. La connaissance du pays où se trouve l’utilisateur
suffit.
•
Émission de données en provenance de partenaires
La troisième méthode d’identification est basée sur une coopération avec des partenaires
qui ont déjà la capacité d’identifier les fichiers musicaux sur leurs systèmes. Dans ce cas,
l’organisme partenaire fournit une émission automatique de données qui détaille l’activité
de téléchargement à travers son réseau ou son système.
Dans ce cas de figure, le réseau ou le système fournit sa propre solution d’identification.
Le défi reside alors dans la collecte des données en provenance de ces nombreux
systèmes, dans l’analyse de ces données brutes afin de produire des statistiques de
téléchargement, et dans la présentation de ces informations pour qu’elles correspondent
avec d’autres sources et d’autres rapports. Au final, un seul compte rendu global est
produit, peu importe la source ou la méthodologie d’identification.
4
1 - Émission de données en provenance de partenaires
Analysi s &
Tracking
System
P2P User
ISP
P2P User
ISP
ISP
ISP
ISP
internet
Download~Str eaming
System Partner
P2P User
P2P Tr affic
Media Information
Dans ce cas de figure, BigChampagne joue le rôle d’intégrateur de systèmes, comme on
verra ci-dessous.
Mesures d’activité
A côté de ces différentes méthodologies d’identification des fichiers musicaux, il existe
quatre méthodes d’observation de l’activité d’un réseau. Certaines d’entre elles ont déjà
été mentionnées à travers les méthodologies d’identification (cf. ci-dessus).
•
Mesure d’activité avec la coopération des développeurs de logiciels
Cette méthode est fondée sur la coopération des organismes et des individus qui
développent les logiciels utilisés pour accéder aux réseaux peer-to-peer. Parce que ces
organismes contrôlent les logiciels que les internautes installent sur leurs ordinateurs pour
communiquer avec d’autres utilisateurs du réseau, ils sont nécessairement bien placés
pour observer quels fichiers musicaux sont téléchargés et pour communiquer ces
informations à un point de collecte centralisé.
Parce que le logiciel se trouve sur l’ordinateur de l’internaute dans ce cas de figure, une
faible partie du traitement des données peut se faire à ce niveau local sans déranger
l’utilisateur. De même, la connexion internet de l’internaute peut être utilisée
5
occasionnellement pour envoyer au serveur central des informations sur les
téléchargements sans interrompre ou gêner l’utilisateur. Ni l’un, ni l’autre de ces
processus n’affecterait les performances de l’ordinateur, et on peut les mettre en oeuvre
sans utiliser la moindre information personnelle de l’internaute.
2 - Mesure avec la coopération des développeurs de logiciels
Analysi s &
Tracking
System
P2P
Software
P2P User
ISP
ISP
P2P
Software
P2P User
ISP
ISP
P2P
Software
ISP
internet
P2P User
P2P Tr affic
Media Information
Le pays de l’utilisateur peut être déterminé à partir de l’adresse IP. Il n’est pas nécessaire
de conserver les enregistrements des adresses IP pour l’établissement de rapports
d’activité. La connaissance du pays où se trouve l’utilisateur suffit. Il est également
possible de localiser l’utilisateur à partir des informations tirées des inscriptions ou des
paiements conservées par le développeur du logiciel.
Cette méthode est surtout avantageuse dans la mise en place d’un système d’empreinte
numérique. L’ordinateur de l’internaute peut générer des empreintes numériques pour les
fichiers musicaux en cours de téléchargement et sa connexion internet peut être utilisée
pour envoyer les informations liées à ces empreintes numériques à un point de collecte
centralisé pour les analyser et pour l’établissement de rapports d’activité.
Cependant, d’autres types d’identification peuvent également être utilisés en coopération
avec les développeurs de logiciels. Ils pourraient, par exemple, tout simplement
transmettre les métadonnées liées aux téléchargements à un serveur central ou fournir une
émission de données basée sur leur système interne d’identification.
6
Le plus grand défi de ce scénario serait d’y faire participer à peu près tous les
développeurs de logiciels. Parce que le nombre d’individus pouvant créer des logiciels
pour accéder aux réseaux de partage de fichiers est théoriquement illimité, il serait
irréaliste de supposer que tous les développeurs de logiciels coopéreraient avec le
système de licence.
•
Mesure d’activité en association avec les FAIs
Avec cette méthode, la mesure d’activité se fait en coopération avec les FAIs au lieu des
développeurs de logiciels de peer-to-peer comme on a vu ci-dessus.
Dans cette approche, les ordinateurs sont liés aux réseaux des FAIs qui peuvent examiner
tout le trafic internet qui y transite. En observant directement ce trafic, ces systèmes
peuvent analyser le contenu des informations transmises et identifier les chansons
individuelles.
3 - Mesure d’activité en association avec les FAIs
Analysi s &
Tracking
System
P2P User
ISP
ISP
ISP
Traffic
Analysis
P2P User
ISP
Traffic
Analysis
ISP
ISP
Traffic
Analysis
ISP
ISP
Traffic
Analysis
ISP
Traffic
Analysis
ISP
internet
P2P User
P2P Tr affic
Media Information
Le pays de l’utilisateur peut être déterminé à partir de l’adresse IP. Il n’est pas nécessaire
de conserver les enregistrements des adresses IP pour l’établissement de rapports
d’activité. La connaissance du pays où se trouve l’utilisateur suffit.
7
Les ressources nécessaires à la mise en œuvre de ce genre de système seraient
importantes car il serait nécessaire d’installer des ordinateurs puissants à de nombreux
endroits dans chaque réseau des FAIs. Pourtant, la surveillance au niveau du FAI a le
grand avantage d’éviter le besoin de coopération active avec les développeurs de logiciels
et les utilisateurs de réseaux peer-to-peer.
•
Mesure d’activité passive sans partenaires et sans autorisation nécessaire
L’avantage de cette méthode est qu’on peut observer et analyser l’activité des réseaux
peer-to-peer sans la participation de quiconque. Cela est possible grâce à la nature même
des réseaux peer-to-peer, conçus pour permettre aux utilisateurs de chercher, de naviguer
et d’accéder au contenu partagé par tous les autres utilisateurs.
Pour cette raison, il est possible pour les utilisateurs de recueillir à l’occasion de leur
utilisation de ces réseaux des informations sur l’ensemble de leur contenu. En
répartissant massivement cet effort, nos systèmes passifs d’observation peuvent collecter
une quantité énorme d’informations sur les partages d’œuvres sur les réseaux peer-topeer.
4 - Mesure d’activité passive sans partenaires et sans permission
Passive
Monitoring
System
Analysi s &
Tracking
System
P2P User
ISP
P2P User
ISP
Passive
Monitoring
System
ISP
ISP
Passive
Monitoring
System
ISP
internet
P2P User
P2P Tr affic
Media Information
8
Cette méthodologie peut employer plusieurs techniques d’identification y compris
l’analyse des métadonnées (de cette manière, on peut acquérir facilement les informations
associées à un fichier particulier sans acquérir le fichier lui-même) et l’analyse des
empreintes numériques.
Grâce à l’approche passive de ce système, il y a très peu d’inquiétudes à avoir sur la
protection de la vie privée des utilisateurs. Aucun logiciel n’est installé en aucune partie
du réseau, et aucune sollicitation n’est faite des ressources matérielles et réseaux de
l’internaute, comme c’est le cas dans d’autres scénarios.
Le pays de l’utilisateur peut être déterminé à partir de l’adresse IP. Il n’est pas nécessaire
de conserver les enregistrements des adresses IP pour l’établissement de rapports
d’activité. La connaissance du pays où se trouve l’utilisateur suffit.
•
Mesure d’activité en employant un panel d’utilisateurs
Cette démarche est différente des autres méthodes en ce qu’elle ne cherche pas à mesurer
toute l’activité d’un réseau peer-to-peer. En fait, cette approche peut être le complément
d’autres méthodologies.
Comme pour une étude de marché traditionnelle, des volontaires seraient recrutés pour
participer à un groupe dont le téléchargement de musique serait explicitement surveillé.
Les utilisateurs seraient conscients de cette surveillance et pourraient s’en soustraire à
tout moment. Ce système est similaire à celui, aux Etats-Unis, du panel de Nielsen, qui
permet d’établir à travers l’observation des habitudes de téléspectateurs de familles
volontaires les indices d’écoute des émissions télévisées.
Pourtant, contrairement à la réalisation traditionnelle de ce type de panel, celui-ci peut
être de taille immense et l’activité d’observation serait automatique. Il serait
certainement logique d’employer un système d’identification par empreinte numérique
dans ces circonstances, mais on pourrait également promouvoir toute autre technique
d’identification. Le pays de l’utilisateur peut être déterminé à partir de l’adresse IP et/ou
à partir du processus d’inscription au panel.
Les inquiétudes liées à la vie privée dans ce contexte sont différentes car les internautes
donneraient leur permission explicite (« opt-in ») à la surveillance et pourraient choisir de
se retirer du panel n’importe quand. De plus, il ne serait toujours pas nécessaire de
conserver des informations personnelles les concernant. Bien qu’il soit utile à des fins
d’analyse du marché d’enregistrer des éléments tels que le sexe et l’âge, cela n’est pas
indispensable.
9
Rôle de l’intégrateur de systèmes
Comme cela devrait être clair maintenant, étant donné la grande variété de systèmes de
partage de fichiers et de sources de téléchargement, il n’y a pas une seule méthode
d’observation et d’identification qui soit optimale dans toutes les circonstances.
Dans certains cas, la coopération des développeurs de logiciels et/ou des FAIs pourra être
envisagée, tandis que dans d’autres situations, l’observateur passive sera la seule
alternative. Les possibilités sont aussi variées et nombreuses que les systèmes de partage
de fichiers peer-to-peer eux-mêmes.
Mais en tant que tel, l’intégrateur de systèmes doit répondre à certaines exigences. Un
intégrateur de systèmes devrait pouvoir observer des sources multiples, recevoir des
informations supplémentaires d’autres systèmes ou d’autres partenaires, et combiner tout
cela afin de produire un rapport complet de toute l’activité.
L’intégrateur de systèmes doit:
•
•
•
•
Normaliser
o Recevoir des émissions de données multiples et variées et les normaliser
dans un seul format et dans un seul système
Analyser
o Fournir une analyse statistique complète de toute l’activité
Vérifier
o Mettre en œuvre un système interne de vérification de l’intégrité des
données et des analyses afférentes
o Accepter la vérification des données faite par un tiers
Rapporter
o Fournir des rapports à jour et complets de toute l’activité comme l’exige
l’agence qui gère les paiements à partir de ces données
o De manière optionnelle, fournir des outils aux ayants droit et aux autres
parties intéressées permettant la consultation de ces informations en ligne.
Cela pourrait inclure non seulement les informations liées aux paiements
mais aussi des outils sophistiqués d’analyse du marché destinés aux ayants
droit et à d’autres.
En fin de compte, la transparence est essentielle. En tant que base de distribution de la
rémunération aux ayants droit, tous les utilisateurs devraient avoir confiance dans la
transparence et la justesse du système.
10
En conclusion
Les critiques du système de licence pour le partage de musique font remarquer à juste
titre qu’il sera imparfait dans son exécution, et que le grand nombre de défis et de
limitations devra être pris en considération. Cependant, il faut noter que l’internet fournit
une exactitude et une efficacité de mesure autrefois inaccessibles et actuellement sans
égales.
Des systèmes de licence de musique bien établis aux Etats-Unis et dans le monde entier
sont souvent moins extensibles et moins fidèles que les mesures des médias en ligne. De
nos jours, ces systèmes qui rémunèrent les ayants droit des émissions traditionnelles
(radio, télévision, film et même les spectacles publics) ne sont guère controversés. Ils
fournissent d’ailleurs depuis des décennies la base de la rémunération de la plupart des
créateurs.
Les nouvelles technologies apportent de nouveaux défis et de nouvelles menaces, mais
aussi de nouvelles opportunités. Les méthodes proposées pour la mesure et la
valorisation des médias en ligne sont sans égales en termes d’exactitude et d’extensibilité.
Le rythme révolutionnaire du développement des nouvelles capacités de bande passante
et de l’internet sans-fil assure de manière presque certaine que la distribution de la
musique populaire continuera quasiment sans diminution. Toutes les parties intéressées
par les enjeux qui en résultent sont d’accord sur le fait qu’il faille rémunérer les artistes,
les créateurs et les ayants droit.
11
BigChampagne Online Media Measurement
BigChampagne Online Media Measurement est une entreprise privée spécialisée dans la
recherche technologique et d’études de marché, spécialisée dans les médias en ligne.
En octobre 2003, WIRED a consacré BigChampagne indice d’écoute Nielsen de la
musique en ligne. BigChampagne a annoncé une association stratégique avec Nielsen
Entertainment au début de 2005 et a depuis annoncé des accords de partage de données
avec AOL Music, Yahoo! Music et MTV, entre autres.
BigChampagne a lancé l’idée des mesures des réseaux peer-to-peer en commençant par la
communauté populaire de Napster, et elle est aujourd’hui un outil de recherche de
référence.
Les clients et les abonnés à BigChampagne incluent MTV/Viacom, des majors de
l’édition musicale, des stations de radio commerciales, des analystes de Wall Street, des
artistes, des managers et d’autres professionnelles de l’industrie des médias.
Les partenaires de BigChampagne en syndication de palmarès incluent Billboard Radio
Monitor, Entertainment Weekly et E! Entertainment Television.
12
RÉFÉRENCES
Un échantillon des œuvres sur la question de la licence peer-to-peer
•
Neil Weinstock Netanel, “Impose a Noncommercial Use Levy to Allow Free
Peer-to-Peer File Sharing”
o http://papers.ssrn.com/sol3/papers.cfm?abstract_id=267848
•
William W. Fisher III, “Promises to Keep: Technology, Law, and the Future of
Entertainment”
o http://cyber.law.harvard.edu/people/tfisher/PTKChapter6.pdf
•
Electronic Frontier Foundation, “A Better Way Forward: Voluntary Collective
Licensing of Music File Sharing”
o http://www.eff.org/share/collective_lic_wp.pdf
o en Français: http://www.eff.org/share/collective_lic_wp_francais.pdf
Identification de la situation géographique à partir de l’adresse IP
•
Digital Element’s NetAcuity system
o http://www.digital-element.net/ip_intelligence/ip_intelligence.html
13

Documents pareils