Cours partie1

Transcription

Cours partie1
L'APPROCHE EXPERIMENTALE EN
RECHERCHE:
introduction aux statistiques.
1. BUTS DU COURS :
• se familiariser avec le vocabulaire statistique
o variable dépendante, variable indépendante
o statistique descriptive, inférentielle
o hypothèse nulle, alternative... etc.
• connaître l'existence des principaux outils
statistiques:
o leurs rôles, leurs utilités
o les conditions de leur utilisation
o leur interprétation
o leurs limites
• maîtriser leur mise en oeuvre pratique
• aide au travail de mémoire
• être moins "naïf" devant les données statistiques.
2. LES DONNEES COLLECTEES :
2.1.
Le tableau de données:
Démarche en 3 points:
• délimiter le domaine d'étude
• choix des individus caractérisant un ensemble
plus vaste (population ≠ échantillon)
• définition des variables d'étude pour chacun des
individus
EN ACCORD ET EN COHERENCE PAR RAPPORT
AUX OBJECTIFS DE L'ETUDE
Introduction à l'analyse des données 1
1
Tous les choix préalables à l'analyse des données
conditionnent sa validité :
de mauvais choix méthodologiques ne sont
pas rattrapables par l'analyse des données
(analyse statistique).
Une fois l'expérimentation réalisée, un tableau de
données sera construit: matériau de base de toute
analyse.
Composition:
les individus en ligne (notés indice i)
les variables en colonne (notées indice j)
Cette organisation est souvent la même dans tous les
logiciels statistiques.
Exemple:
VARIABLES
INDIVIDU 1
INDIVIDU 2
INDIVIDU 3
INDIVIDU 4
.
.
.
1
2
3
.....
X1,1
X2,1
X3,1
X4,1
X1,2
X2,2
X3,2
X4,2
.
.
.
X1,3
X2,3
X3,3
X4,3
.
.
.
.
.
.
.
.
.
.
.
.
.
D'une manière générale: Xi,j = valeur numérique de la jème
variable du ième sujet.
Introduction à l'analyse des données 2
2.2.
Les échelles de mesure :
Si les tableaux de données contiennent souvent des
chiffres, ils n’ont pas toujours le même statut. En effet,
les variables peuvent être issues essentiellement de 4
échelles différentes…
IMPORTANCE +++ car impact sur la méthode
d’analyse des données.
2.2.1.
Les échelles nominales :
Variable = étiquette permettant d’identifier les items.
Exemples :
variable sexe : homme=1, femme=2
Réponse OUI / NON à un questionnaire :
OUI=1 ; NON=0
• Les opérations mathématiques ne sont pas licites
(aucun sens)
• Opérations autorisées :
o Distribution des effectifs par item
o Expression du mode
o % de réponse à chaque item.
2.2.2.
Les échelles ordinales :
Les valeurs classent les items entre eux selon une certaine
logique...
MAIS: il est impossible de connaître l'écart entre 2 sujets .
On sait seulement dans quel ordre ils sont classés.
Cette échelle introduit une notion très utilisée en
statistique: la notion de RANG.
Exemple: classement à un concours.
• Opérations possibles:
Introduction à l'analyse des données 3
o idem échelles nominales
o médiane
o corrélation d'ordre
2.2.3.
Les échelles d'intervalle :
L'unité de mesure est constante, mais le zéro est fixé
arbitrairement.
Exemple: mesure du quotient intellectuel, température,
calendrier...
• Opérations possibles:
o idem échelles précédentes
o comparaison de ≠ entre des éléments
mesurés MAIS SANS POUVOIR RAISONNER
EN TERME DE MULTIPLES (implication dans
certains tests).
o moyenne arithmétique
o écart-type
o variance
o coefficient de corrélation
2.2.4.
Les échelles proportionnelles :
Idem que pour échelles d'intervalle, mais le point "zéro" est
unique quelle que soit l'unité. La notion de multiple devient
utilisable.
Exemples: poids, taille, surface d'un local... etc.
• toutes les
possibles.
opérations
mathématiques
sont
Introduction à l'analyse des données 4
2.3.
La nature des variables :
Autre paramètre fondamental à prendre en compte car il
détermine le choix des outils statistiques à utiliser.
Exemple:
• si une variable est non métrique elle implique
obligatoirement des tests non paramétriques
• si une variable est métrique, elle peut permettre
sous certaines conditions l'usage de tests
paramétriques
2.3.1.
Les variables métriques :
Elles prennent des valeurs numériques : âge, taille,
salaire... etc.
Elles sont issues des échelles d'intervalle ou
proportionnelle.
Elles supportent toutes les opérations autorisées sur les
échelles d'origine.
Elles sont aussi appelées VARIABLES QUANTITATIVES.
2.3.2.
Les variables non métriques :
Elles prennent des modalités non numériques : sexe,
secteur d'activité, statut socio-économique... etc.
Elles sont issues d'échelles nominale ou ordinale.
Même règles concernant les opérations licites.
Elles sont aussi appelées VARIABLES QUALITATIVES.
Introduction à l'analyse des données 5
Synthèse des variables et de leurs déterminants.
2.3.3.
Les transformations de variables :
Elément à aborder avec beaucoup de prudence car il existe
des risques d'erreurs méthodologiques graves relatif aux
transformations de variables.
Un principe général à connaître:
Passage de var. métrique à var. non métrique
pas de problème majeur
Introduction à l'analyse des données 6
Passage de var. non métrique à var. métrique
risque d'erreurs important
Transformation métrique Î non métrique:
il y a une perte d'information (échelles moins
structurées), mais on ne peut pas fausser une
information.
La technique classique consiste à constituer des
classes:
• d'amplitudes égales:
1° - chiffre d'affaire (CA) de 10 M€ et moins
2° - CA de 11 à 20 M€
3° - CA de 21 à 30 M€ ... etc.
• d'effectifs égaux (l'amplitude peut varier selon
les classes):
1° - 100 entreprises au CA < 10 M€
2° - 100 entreprises au CA compris entre 11
et 25M€
3° - 100 entreprises au CA > 26 M€
Si des bornes naturelles n'existent pas, il vaut mieux
raisonner sur des effectifs égaux; la part jouée par la
subjectivité du chercheur est moins grande.
Mais cela dépend aussi des objectifs du travail.
Transformation non métrique Î métrique:
Cette transformation est théoriquement interdite.
Cependant, cette règle est souvent contournée car
les analyses non paramétriques (imposées par des
variables non métriques) sont moins nombreuses et
moins "puissantes".
Introduction à l'analyse des données 7
• Si on a recours à cette technique, 2 conditions
doivent être respectées:
1° - la hiérarchisation doit être porteuse de
sens
Correct: Fort=3, moyen=2, faible=1
Incorrect: rouge=1, vert=2
2° - Les distances entre les items doivent être
égales (en pratique, c'est invérifiable):
Ex: dans un questionnaire coté selon une
échelle de Lickert (Fort - moyen - faible)
écartfort - moyen = écartmoyen - faible
Les risques encourus suite à ce type de
transformation implique leur évitement - si
possible.
3. Les objectifs de l'analyse de données :
Selon les objectifs assignés à un travail, il est possible de
distinguer 3 grands types d'analyses.
3.1.
Les analyses élémentaires:
BUTS:
n résumer de façon globale les données
recueillies
o déterminer les tendances générales des
variables
il s'agit souvent du point de départ d'une analyse
Introduction à l'analyse des données 8
Ces analyses peuvent être :
unidimensionnelles
ou
variables étudiées isolément
bidimensionnelles
mise en évidence de "lien" entre
deux variables
35
4.5
4.0
POSITION ELECTRODE
Nbre d'observations
30
25
20
15
10
5
0
3.5
3.0
2.5
2.0
1.5
1.0
20
40
60
80
100
120
140
160
Fréquence Médiane (EMG)
180
200
220
0.5
40
60
80
100
120
140
160
180
Fréquence Médiane (EMG)
3.2.
Les analyses descriptives :
Prise en compte de tout ou partie des variables mesurées
en les considérant sur un même plan. Il n'y a pas d'idée à
priori, pas d'hypothèse particulière, pas de distinction
entre variables explicatives et variables à expliquer.
BUTS:
n décrire de façon synthétique la structure
des données
o organiser un phénomène pour mieux le
comprendre.
LIMITE: il est impossible d'en donner le principe de
fonctionnement (pas de loi, de généralisation
possible).
Les analyses factorielles rentrent dans cette catégorie.
3.3.
Les analyses explicatives :
Elles introduisent une notion fondamentale: l'INFERENCE
STATISTIQUE:
Introduction à l'analyse des données 9
200
• distinction entre variable à expliquer ou
variable dépendante (variable mesurée) et
variable explicative ou indépendante (variable
manipulée par l'expérimentateur dont il veut
savoir si elle influe la VD ou pas).
• implique la notion d'hypothèse nulle
• permet par les outils statistiques appropriés de
généraliser à un ensemble plus vaste les
résultats obtenus sur un petit nombre de sujets
c'est le principe de l'inférence statistique
L'approche expérimentale ou dite "hypothético-déductive"
repose principalement sur ce principe.
BUT: étudier les liaisons entre différents phénomènes
(caractérisés par des variables) dans le but d'en
déduire les principes de fonctionnement ou
d'organisation (lois, principes fondamentaux... etc.)
Ces différentes méthodes ne
exclusives les unes des autres.
Ex:
Décrire ⇒
Expliquer ⇒
sont
pas
forcément
analyse descriptive, mise en relief
du comportement de certaines
variables... etc. puis formulation
d'une hypothèse à vérifier
validation (ou
l'hypothèse
formulée
infirmation) de
préalablement
4. Le choix d'une méthode d'analyse :
1 une idée à oublier définitivement: il existe toujours un
test statistique qui permet de valider l'hypothèse qui
arrange l'expérimentateur. C'est une idée fausse qui ne
peut convaincre que les ignorants.
Introduction à l'analyse des données 10
En fait, il existe un certain nombre de questions préalables
au choix d'un test, et selon la décision finale, les
interprétations n'auront pas la même portée (cf. méthodes
descriptives ou explicatives).
Les questions (principalement) :
• le but est-il descriptif ou explicatif ?
• analyse des individus, des variables, ou des 2 ?
• l'aspect explicatif est appréhendé avec une ou
plusieurs variables ?
• les variables = métriques ou non métriques ?
• leur distribution est-elle normale ou non ?
Le choix n'est donc pas libre, mais dépend:
• de la nature du problème posé
• des variables retenues et de leurs caractéristiques.
Tout n'est pas possible, même si dans certains cas, une
certaine souplesse est possible (transformation de
variables, imbrication des méthodes...).
Quand on a obtenu une certaine connaissance en
statistique, au moment même de l'écriture du protocole, il
est possible de prévoir quel(s) type(s) d'analyses sont
possibles.
Introduction à l'analyse des données 11
5. Place de l'analyse des données dans un processus
expérimental :
A.D.D.
L'analyse des données ne permet pas de s'affranchir de la
qualité des autres phases.
Introduction à l'analyse des données 12