MODULE DE METHODOLOGIE TECHNIQUES D

Transcription

MODULE DE METHODOLOGIE TECHNIQUES D
MODULE DE METHODOLOGIE
TECHNIQUES D’ANALYSE DU DISCOURS ET LOGICIELS D’ANALYSE
QUALITATIVE
Mathieu Brugidou- Stéphanie Abrial Objectif pédagogique :
L’objectif du séminaire est de présenter les principaux enjeux théoriques et techniques
d’analyse de contenu et d’analyse du discours appliquées à des corpus politiques. Il s’agit
également de proposer une première initiation à deux types de logiciels d’analyse qualitative :
l’un, NVIVO, appartenant à la famille des CAQDAS (Computer Aided Qualitative Data
Analysis Systems), l’autre, ALCESTE, à la famille des logiciels d’analyse des données
textuelles.
Présentation générale :
Différentes familles de méthodes se rattachent à l’analyse des données qualitatives. Elles
peuvent être caractérisées à la fois par la définition et la place qu’elles donnent au langage
dans le projet scientifique des sciences sociales [Leimdorfer, 2010], par le type de faits et de
données socio-linguistiques qu’elles construisent et par les formes de raisonnement qu’elles
autorisent. Ces différents types de « preuves » peuvent en effet relever d’une statistique
descriptive ou inférentielle, d’une linguistique de la signification - privilégiant la
représentation - ou d’une linguistique du sens - la langue étant conçue d’abord comme un
moyen de communication - ou encore des différents programmes épistémologiques mis en
œuvre par les sciences sociales. Ces approches s’incarnent de manière privilégiée dans des
programmes informatiques qui s’avèrent ainsi indissociablement des programmes
épistémologiques.
La première partie du séminaire sera consacrée à la présentation des enjeux de l’analyse
textuelle et à une première prise en main du logiciel Alceste.
Dans l’analyse des corpus exploités en sciences sociales (entretiens, presses, questions
ouvertes etc.) les procédures de mises en forme des data font en effet co-exister des données
(les variables morphologiques ou d’attitudes décrivant les locuteurs) et un corpus (l’ensemble
des énoncés retranscrits). Le palier des techniques d’analyses proposées ou « supportées » par
le logiciel permet à la fois de mobiliser des approches holistiques (approche structurale
comme la classification descendante hiérarchique ou l’AFC sur les classes) et analytiques
(spécificités, réponses modales, variables/mots étoilés etc.). Par ailleurs le type de preuves et
les formes de raisonnement mobilisés (palier épistémologique) peuvent s’autoriser tour à tour
d’un paradigme interprétatif – en dégageant différentes dimensions sémantiques, mettant en
évidence des grammaires actantielles et en décrivant des actes de langage - ou d’un
paradigme explicatif (avec des stratégies exploratoires ou hypothético-déductives).
Le logiciel apparaît comme un enchaînement plus ou moins réglés de procédures, mettant en
œuvre une série de techniques d’inscriptions scriptovisuels [Goody, 1979 ; Latour, 1987] :
mise au format des différents types de data, mise en liste (fréquentielle, alphabétique,
spécificités etc.), mise en relation sous forme de calculs (cooccurrences, hiérarchisation des
facteurs de l’AFC, mise en classe de la CDH) ou représentations sous forme de graphes. Ces
inscriptions successives rendent possibles une série d’inférences sur le sens qui s’appuient sur
une mise en variation des énoncés : mise en classe d’équivalence sémantique (champs
lexicaux), réalisations multiples d’une même syntaxe (schème narratif, grammaire actantielle)
ou jeux illocutionnaires (dénonciation, stigmatisation) réglés par les mêmes conditions de
félicité.
Programme et bibliographie Analyse de discours (mention Sociétés et politiques comparées)– M.Brugidou- S. Abrial –
1
La deuxième partie du séminaire sera l’occasion de présenter certains logiciels de la famille
des CAQDAS (Computer Aided Qualitative Data Analysis Systems) et de proposer aux
étudiants une initiation en salle informatique en vue de leur permettre de traiter
ultérieurement leur propre corpus de données.
Les CAQDAS sont fondés sur le constat d’une imbrication profonde, une interaction
continue, au cours du processus de traitement, de l’analyse des données et de la construction
théorique ainsi que de la nécessité de garder des traces des hypothèses ou notions émergentes
comme témoins de l’élaboration des résultats. Ils tentent de répondre à ce défi en cherchant à
mettre à plat la tâche organisationnelle complexe que met en œuvre le qualitativiste au cours
de l’analyse 1« manuelle » qui lui permet d’élaborer une théorie :
- Constitution d’un corpus de textes et/ou de documents iconographiques, audio, audiovisuels ;
- Organisation des données par l’entremise d’un procédé d’encodage visant à une de
décontextualisation-recontextualisation du corpus.;
- Elaboration progressive d’un système de codage organisé hiérarchiquement ou à
niveaux multiples sous la forme d’une structure conceptuelle plus ou moins
complexe ;
- Elaboration d’un système de liens entre différentes entités : références encodées,
codes, variables caractérisant les individus et « mémos » ;
- Possibilités de requêtes, de matrices et d’extraction de résultats diversifiés (par code,
par sous-code, par familles de codes, par occurrence de termes, recherches
booléennes…)
1
QDA, Qualitative Data Analysis
Programme et bibliographie Analyse de discours (mention Sociétés et politiques comparées)– M.Brugidou- S. Abrial –
2
PROGRAMME DES SEANCES 2013/2014
SEMAINE
THEMES DES SEANCES
1ère séance
Mathieu Brugidou
Introduction : objectifs, définition de l’objet et présentation du programme
1-1 Objectifs : Présentation des logiciels d’analyse textuelle
1-2 Programme des séances et repères bibliographiques.
I- LOGICIEL D’ANALYSE DES DONNEES TEXTUELLES : ALCESTE
Le logiciel Alceste
2-1 Présentation du logiciel- algorithmes et épistémologie
2-2 Plusieurs exemples d’analyse : Rapports et presse (Corpus Grenelle de
l’environnement), Questions ouvertes
Prise en main du logiciel
3-1 Présentation du corpus de travail
3-2 Exercices sur le logiciel. Les principaux traitements..
Analyse du corpus de travail
2ième séance
Mathieu Brugidou
3ième
séance
Mathieu Brugidou
4ième séance
Mathieu Brugidou
5ème séance
Mathieu Brugidou
Analyse du corpus de travail
6ème séance
Mathieu Brugidou
Analyse du corpus de travail
SEMAINE
7ième
II- CAQDAS : NVIVO
THEMES DES SEANCES
séance
Stéphanie Abrial
7-1 Présentation du logiciel- Analyse de contenu- Grounded Theory et CAQDAS
7-2 Plusieurs exemples d’analyse dont des données d’enquêtes réalisées auprès de
citoyens et d’électeurs en France.
8ième séance
Stéphanie Abrial
Application de NVIVO à un corpus d’entretiens
9ième
séance
Stéphanie Abrial
Etude de cas NVIVO
10ième
séance
Stéphanie Abrial
Etude de cas NVIVO
11ième séance
Stéphanie Abrial
Etude de cas avec NVIVO
Programme et bibliographie Analyse de discours (mention Sociétés et politiques comparées)– M.Brugidou- S. Abrial –
3
Bibliographie
Abrial, S., Louvel S., (2011) "Analyser les entretiens", in BRECHON, P., (sous dir), Enquêtes
qualitatives, enquêtes quantitatives, coll. Politique en+, PUG, Grenoble.
Bonnafous S., Tournier M., « Analyse du discours, lexicométrie, communication et politique »,
Langages, 117, 67-81.
Brugidou M., Escoffier C., Folch H., Lahlou S., Le Roux D., Morin-Andréani P., Piat G., « Les
facteurs de choix et d’utilisation de logiciels d’analyse des données textuelles », JADT, Lausanne,
2000.
Brugidou M. (2008), L’opinion et ses publics, une approche pragmatiste de l’opinion publique, Paris,
Presses de Sciences Po.
Chateauraynaud F., Prospero – Une technologie litteraires pour les sciences humaines, Paris, CNRS
éditions, 2003.
Cotteret J-M., Moreau R., Le Vocabulaire Du Général De Gaulle : Analyse Statistique Des
Allocutions Radiodiffusées (1958-1965), Paris, Presses De La Fondation Nationale Des Sciences
Politiques, Collection "Travaux Et Recherches De Science Politique", 1969, 252 pages.
Cotteret J.M., Emeri C., Gerstlé J., Moreau R., Giscard d’Estaing-Mitterrand : 54 774 mots pour
convaincre, PUF, 1976.
Demonet M., Geffroy A., Gouaze J., Lafon P., Mouillaud M., Tournier M., Des tracts en mai 68.
mesures de vocabulaire et de contenu, Paris, Presses De La Fondation Nationale Des Sciences
Politiques, 1975, Réédition Champs Libres, 1978, 492 Pages.
Goody, J. (1979), La raison graphique, Editions de Minuit, Paris.
Guiglione R., Landré, A., Bromberg M, Molette P. (1998). L’analyse Automatique des contenus.
Paris,Dunod.
Hubert P., Labbe D. (1988), "Un modèle de partition du vocabulaire", In Labbe D., Thoiron P., Serant
D., Etudes sur la richesse et la structures lexicales, Paris-Genève, Slatkine-Champion, 1988, p 93114.
Jenny J. , « Méthodes et pratiques formalisées d’analyse de contenu et de discours dans la recherche
française contemporaine. Etats des lieux et essai de classification », BMS, 54, Mars 1997.
Latour B., 1987, Les vues de l’esprit, Réseaux, vol.5, n°27, pp. 76-96.
Leimdorfer F. (2010), Les sociologues et le langage, Paris, Editions de la Maison des Sciences de
l’Homme.
Labbé D., Normes de saisie et de dépouillement des textes politiques, Cahiers du CERAT, 7. 1990.
Lebart L., Salem A., Statistique textuelle, Paris, Dunod, 1993.
Mangabeira W., Editor. Qualitative Sociology And Computer Programs : Advent And Diffusion Of
Computer-Assisted Qualitative Data Analysis Software (CAQDAS), Current Sociology (44-3)
Hiver 1996, Pp. 187-321, 1996.
Marchand P., L'analyse du discours assistée par ordinateur, Paris, A. Colin, (1998).
Muller C., Initiation aux méthodes de la statistique linguistique, Paris, Hachette Université, collection
"Langue, Linguistique, Communication",1973, 187 pages.
Muller C., Principes et méthodes de statistiques lexicales, Paris, Hachette, 1977.
Rastier, F., Cavazza M., Abeillé A., Sémantique pour l'analyse. De la linguistique à l'informatique,
Paris, Masson, 1994.
Rastier, F. (dir) L’analyse thématiques des données textuelles, L’exemple des sentiments, Paris, didier
erudition, 1995.
Reinert M., « Classification descendante hiérarchique et analyse lexicale par contexte : application au
corpus des poésies d’Arthur Rimbaud », Bulletin de Méthodologie Sociologique, 13, 1987.
Reinert M. (1993), « Les “mondes lexicaux” et leur “logique” a travers l’analyse statistique d’un
corpus de recits de cauchemars », Langage et Société, 66 : 5-39.
Tournier M. , «D'où viennent les fréquences de vocabulaire ? La lexicométrie et ses modèles », Mots,
1, octobre 1980, p 189 à 209.
Programme et bibliographie Analyse de discours (mention Sociétés et politiques comparées)– M.Brugidou- S. Abrial –
4
Ressources sur Internet
Bibliographies sur l’analyse du discours (Anglais)
Discours politique
http://www.discourse-in-society.org/biblio-pol-disc.htm
Sur les médias
http://www.discourse-in-society.org/news-dis.htm
Laboratoires- Chercheurs
Répertoires des équipes en TAL :
http://www.biomath.jussieu.fr/ATALA/labo/
Equipe en Analyse de discours
http://www.univ-paris12.fr/www/labos/ceditec/maingueneau5.html
[email protected]
http://www.chaire-mcd.ca/publication_archives?type=Les%20textes%20de%20méthodologie
(Anglais)
http://www.ulb.ac.be/rech/inventaire/motscles/8/MO48.html
http://www.discourse-in-society.org/Resources.html
http://www.unige.ch/lettres/linge/dialogue/welcome.html
Etienne Brunet :
http://ancilla.unice.fr/~brunet/pub/brunet.html
Jacques Jenny
http://pageperso.aol.fr/jacquesjenny/
Dominique Labbé
http://www.upmf-grenoble.fr/cerat/Recherche/PagesPerso/Labbe.html
Sémantique textuelle, François. Rastier :
http://www.revue-texto.net/
Teun A.Van Dijk Teun (Anglais)
http://www.discourse-in-society.org/teun.html
Réseau Arcati (Atelier Réseau Coopératif pour Analyses Textuelles Informatisées)
www.iresco.fr/bms031119/arcati/arcati.htm
Logiciels.
Alceste:
http://www.image.cict.fr/
Hyperbase :
http://ancilla.unice.fr/~brunet/pub/hypertexte.html
Lexico
http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicowww/
Prospero :
http://prospero.dyndns.org:9673/prospero/acces_public/
Sphinx:
http://www.lesphinx-developpement.fr/
Tropes:
http://www.acetic.fr/tropesfr.htm
Nvivo :
http://www.qsrinternational.com/other-languages_french.aspx
Répertoires des outils qualitatifs informatisés :
Christophe Lejeune (Belgique):
http://www.smess.egss.ulg.ac.be/lejeune/logiciels/
Harald Klein (Allemagne)
www.intext.de/textanae.htm
Angletterre
Programme et bibliographie Analyse de discours (mention Sociétés et politiques comparées)– M.Brugidou- S. Abrial –
5
http://ota.ahds.ac.uk/
Jacques Jenny (France)
http://pageperso.aol.fr/jacquesjenny/ClassifLogicielsAT03.htm
http://www.weblettres.net/sommaire.php?entree=20&rubrique=75&sousrub=251
Bases de textes politiques
Base de textes politiques français du XXe siècle :
http://www.unice.fr/ILF-CNRS/politext/
Compte-rendus analytiques des séances publiques de l'Assemblée Nationale :
http://www.assemblee-nationale.fr/cra
Les débats du Sénat ou ceux du Parlement européen sont accessibles en ligne à partir de :
http://www.europarl.eu.int/home/default_fr.htm
Pour retrouver les noms des Parlementaires et les groupes auxquels ils sont rattachés :
http://wwwdb.europarl.eu.int/ep5/owa/p_meps2.repartition?ilg=FR&iorig=home
Ce qui permet ensuite de retrouver leurs propos en séances plénières :
http://www.europarl.eu.int/plenary/default_fr.htm à partir de la recherche par orateur :
http://www3.europarl.eu.int/omk/omnsapir.so/searchdeb?ORATEUR=yes&LANGUE=FR
Revues
Communication
[email protected]
Corpus
http://www.unice.fr/ILF-CNRS/CORPUS
Discourse & Society (Anglais)
Discourse Studies (Anglais)
http://www.discourse-in-society.org/
Langage et Société
http://www.l-et-s.msh-paris.fr/
Lexicometrica :
http://www.Cavi.univ-paris3.fr/lexicometrica/
Mots
http://doc-iep.univ-lyon2.fr/Ressources/Bases/Somrev/sommaire.html?ID=2352
Revue Française de Science Politique
http://www.persee.fr.
Programme et bibliographie Analyse de discours (mention Sociétés et politiques comparées)– M.Brugidou- S. Abrial –
6