Lire l`analyse lexicométrique

Transcription

Lire l`analyse lexicométrique
INTERNET ET LIBERTE D’EXPRESSION
ANALYSE LEXICOMETRIQUE
Ce rapport présente l’analyse lexicométrique d’un corpus de textes choisis sur le sujet
de controverse : « L’affaire Dieudonné : la viralité d’Internet pousse-t-elle à une législation plus
restrictive sur la liberté d’expression ? »
Choix du corpus
Le corpus est constitué de vingt articles de presse sur internet, tous écrits aux alentours
du 10 janvier voire le 10 janvier 2013 pour une majorité, c’est-à-dire en plein cœur de la
polémique. Il s’agit en effet d’une controverse très ponctuelle, qui s’est arrêtée aussi subitement
qu’elle a commencé et qui n’a duré que peu de temps. Il était donc important de bien cibler des
articles de cette période, non seulement parce que les articles traitant du sujet ont principalement
été écrits à ce moment mais aussi parce que l’on a alors accès aux réactions à vif des différents
journalistes. De plus, nous nous sommes concentrés sur les articles sur internet, car il s’agit là
du cœur de notre sujet : la liberté d’expression sur internet. Il est donc intéressant, dans ce cadre,
d’étudier justement la prise de parole de journalistes sur le net, au sujet de la liberté du net. De
plus, la diversité des sources nous permet d’avoir un aperçu global des différents points de vue
et des tendances. Nous avons donc choisi des articles d’horizons très différents, allant de
journaux nationaux comme l’Express1 ou Le Figaro2, à des sites plus engagés dans la polémique
tels Agoravox3, Libertés Chéries4 ou encore Palestine Solidarité5. Il s’agit donc d’un corpus aux
origines – et aux opinions – très variées, avec parfois des opinions très affirmées sur la liberté
d’expression qui nous permet de traiter l’ensemble des points de vue sur la question pour une
analyse plus fine.
1
http://www.lexpress.fr/actualite/societe/justice/dieudonne-aurelie-filippetti-conteste-toute-censure-a-priori_1313382.html
http://www.lefigaro.fr/flash-actu/2014/01/10/97001-20140110FILWWW00263-dieudonne-le-pen-contre-la-censureweb.php
3 http://www.agoravox.fr/actualites/societe/article/filippetti-veut-censurer-sur-146293
4 http://libertescheries.blogspot.fr/2013/12/dieudonne-la-censure-derniere-tentation.html
5 http://www.palestine-solidarite.org/analyses.axel_bernard.210114.htm
2
NUAGE DE MOTS
PERTINENCE DU CORPUS
Le nuage de mot permet d’avoir une vue d’ensemble rapide sur les mots les plus utilisés
dans le corpus et donc de valider ou non le choix des textes.
On retrouve donc bien les termes principaux de la controverse, le premier étant bien
entendu « Dieudonné » puisque c’est à chaque fois sur l’affaire Dieudonné que sont centrés les
articles du corpus – ainsi que notre problématique. On retrouve après des mots liés à la
controverse Dieudonné (« antisémite », « Valls » - à associer à « ministre », « spectacle »…)
mais aussi des mots traitant plus généralement du problème de la liberté d’expression sur
internet (« public », « vidéo », « censure », « liberté », « internet »…).
Le choix du corpus est donc bien justifié par cette première analyse lexicométrique, qui
nous permet par ailleurs d’avoir une première vue des différents axes de la controverse : une
partie traite de l’internet, avec des termes comme « internet », « vidéo », une autre du pouvoir
politique avec « ministre », « gouvernement », « France » et « censure » et une dernière du cas
2
particulier de Dieudonné avec des mots tels « Dieudonné », « antisémite », « juif » ou
« janvier ».
CLASSIFICATION
La classification –méthode Alceste ou GNEPA sous le logiciel IRAMUTEQ utilisé –
nous donne une analyse lexicométrique plus poussée du corpus choisi. Un élément du corpus
correspond à un article. Les résultats sont donnés sous forme de tableau6, avec le chiffre
pourcentage entre parenthèse qui donne le rapport entre le nombre de textes de la classe où
apparaît le mot, et le nombre total de textes dans la classe, et la variable Chi2 qui donne une
quantification de la pertinence du terme vis-à-vis de la classe.
Classe 1
Chi2
Classe 2
Chi2
Classe 3
Chi2
Classe 4
Chi2
vidéo
80,87
censure
23,55
liberté
69,65
valls
81,89
(72,22 %)
supprimer
35,64
(87,5 %)
internaute
34,58
(100 %)
youtube
28,87
18,5
(100%)
avocat
(87,5 %)
6
(75 %)
web (83,33 14,62
régime
%)
(100 %)
dignité
13,35
réunion
(88,89 %)
(81,25 %)
signaler
(62,5 %)
17,27
(82,05 %)
62,89
parole
(100 %)
46,41
manuel
(85,71 %)
(88,89 %)
expression 42,55
intérieur
(43,8 %)
(76,47 %)
(87,5 %)
interdiction 11,83
public
(70,59 %)
(60 %)
dieudonné
humain
12,28
11,24
répression
(87,5 %)
(100 %)
40,93
raciste
67,13
56,42
53,49
(90,48 %)
33,89
antisémite
(63,16 %)
Seuls quelques termes ont été retenus afin de faciliter la compréhension des différentes classes.
3
77,36
35,65
La classe 1 et la classe 2 sont très proches, et rassemblent les termes liés à la censure de
vidéo sur le net ; la classe 1 traite plus de l’aspect technique de la censure sur internet, avec des
termes comme « supprimer », « dénoncer », « visionnage », « signaler » ou « avocat », tandis
que la classe 2 traite d’avantage de la théorie de la censure et des raisons de la censure
(« censure », « dignité », « haineux », « antisioniste »…). La classe 3 rassemble les termes liés
à la liberté d’expression et à sa répression (« jurisprudence », « réunion », « déclaration »,
« public », « libre »…). La dernière classe quant à elle regroupe des termes liés à la controverse
et au débat qui s’est déroulé autour d’elle (« valls », « diffuser », « site », « raciste »,
« comprendre », « discuter », « débat »…).
Cette analyse n’est pas extrêmement concluante, mais elle permet de discerner les
grands axes et les grands acteurs de la controverse. On peut l’affiner grâce au graphe
représentant les termes des différentes classes et leurs liens et domaines de recoupement :
4
L’utilisation du concordancier permet d’affiner encore l’analyse, car il permet de voir
les contextes dans lesquels les termes sont utilisés et donc de mieux comprendre leur présence
dans une classe. Par exemple, on peut observer que le mot « réunion », qui a une signification
vague que l’on peut avoir du mal à comprendre dans le contexte, est le plus souvent utilisé dans
les textes lorsqu’il s’agit de faire la différence entre réunion publique et réunion privée. Il s’agit
donc ici d’un terme plutôt juridique, ce que l’on n’aurait pas pu voir à première vue. Cet outil
permet aussi de faire la liaison entre deux mots d’une même classe, par exemple « régime » et
« répressif » qui vont toujours de pair dans les textes de la classe ou encore « manuel » et
« valls ». De même le mot « parole » est souvent suivi de « raciste » ou « antisémite », ce qui
permet encore une fois d’affiner la compréhension de la classe et donc du corpus.
Un autre outil qui permet d’affiner la compréhension d’une classe et les liens entre les
différents termes d’une même classe est le graphe, qu’il soit seulement d’un mot de la classe
ou qu’il prenne en compte tous les mots de la classe. Voici par exemple le graphe de la classe
3:
On y voit bien les différents liens entre les termes, non évidents au premier abord
(comme le lien entre « public » et « juridique »), et l’on voit bien qu’il s’agit de la classe traitant
de la liberté d’expression et du droit qui lui est lié.
5