Cours partie1
Transcription
Cours partie1
L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. 1. BUTS DU COURS : • se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive, inférentielle o hypothèse nulle, alternative... etc. • connaître l'existence des principaux outils statistiques: o leurs rôles, leurs utilités o les conditions de leur utilisation o leur interprétation o leurs limites • maîtriser leur mise en oeuvre pratique • aide au travail de mémoire • être moins "naïf" devant les données statistiques. 2. LES DONNEES COLLECTEES : 2.1. Le tableau de données: Démarche en 3 points: • délimiter le domaine d'étude • choix des individus caractérisant un ensemble plus vaste (population ≠ échantillon) • définition des variables d'étude pour chacun des individus EN ACCORD ET EN COHERENCE PAR RAPPORT AUX OBJECTIFS DE L'ETUDE Introduction à l'analyse des données 1 1 Tous les choix préalables à l'analyse des données conditionnent sa validité : de mauvais choix méthodologiques ne sont pas rattrapables par l'analyse des données (analyse statistique). Une fois l'expérimentation réalisée, un tableau de données sera construit: matériau de base de toute analyse. Composition: les individus en ligne (notés indice i) les variables en colonne (notées indice j) Cette organisation est souvent la même dans tous les logiciels statistiques. Exemple: VARIABLES INDIVIDU 1 INDIVIDU 2 INDIVIDU 3 INDIVIDU 4 . . . 1 2 3 ..... X1,1 X2,1 X3,1 X4,1 X1,2 X2,2 X3,2 X4,2 . . . X1,3 X2,3 X3,3 X4,3 . . . . . . . . . . . . . D'une manière générale: Xi,j = valeur numérique de la jème variable du ième sujet. Introduction à l'analyse des données 2 2.2. Les échelles de mesure : Si les tableaux de données contiennent souvent des chiffres, ils n’ont pas toujours le même statut. En effet, les variables peuvent être issues essentiellement de 4 échelles différentes… IMPORTANCE +++ car impact sur la méthode d’analyse des données. 2.2.1. Les échelles nominales : Variable = étiquette permettant d’identifier les items. Exemples : variable sexe : homme=1, femme=2 Réponse OUI / NON à un questionnaire : OUI=1 ; NON=0 • Les opérations mathématiques ne sont pas licites (aucun sens) • Opérations autorisées : o Distribution des effectifs par item o Expression du mode o % de réponse à chaque item. 2.2.2. Les échelles ordinales : Les valeurs classent les items entre eux selon une certaine logique... MAIS: il est impossible de connaître l'écart entre 2 sujets . On sait seulement dans quel ordre ils sont classés. Cette échelle introduit une notion très utilisée en statistique: la notion de RANG. Exemple: classement à un concours. • Opérations possibles: Introduction à l'analyse des données 3 o idem échelles nominales o médiane o corrélation d'ordre 2.2.3. Les échelles d'intervalle : L'unité de mesure est constante, mais le zéro est fixé arbitrairement. Exemple: mesure du quotient intellectuel, température, calendrier... • Opérations possibles: o idem échelles précédentes o comparaison de ≠ entre des éléments mesurés MAIS SANS POUVOIR RAISONNER EN TERME DE MULTIPLES (implication dans certains tests). o moyenne arithmétique o écart-type o variance o coefficient de corrélation 2.2.4. Les échelles proportionnelles : Idem que pour échelles d'intervalle, mais le point "zéro" est unique quelle que soit l'unité. La notion de multiple devient utilisable. Exemples: poids, taille, surface d'un local... etc. • toutes les possibles. opérations mathématiques sont Introduction à l'analyse des données 4 2.3. La nature des variables : Autre paramètre fondamental à prendre en compte car il détermine le choix des outils statistiques à utiliser. Exemple: • si une variable est non métrique elle implique obligatoirement des tests non paramétriques • si une variable est métrique, elle peut permettre sous certaines conditions l'usage de tests paramétriques 2.3.1. Les variables métriques : Elles prennent des valeurs numériques : âge, taille, salaire... etc. Elles sont issues des échelles d'intervalle ou proportionnelle. Elles supportent toutes les opérations autorisées sur les échelles d'origine. Elles sont aussi appelées VARIABLES QUANTITATIVES. 2.3.2. Les variables non métriques : Elles prennent des modalités non numériques : sexe, secteur d'activité, statut socio-économique... etc. Elles sont issues d'échelles nominale ou ordinale. Même règles concernant les opérations licites. Elles sont aussi appelées VARIABLES QUALITATIVES. Introduction à l'analyse des données 5 Synthèse des variables et de leurs déterminants. 2.3.3. Les transformations de variables : Elément à aborder avec beaucoup de prudence car il existe des risques d'erreurs méthodologiques graves relatif aux transformations de variables. Un principe général à connaître: Passage de var. métrique à var. non métrique pas de problème majeur Introduction à l'analyse des données 6 Passage de var. non métrique à var. métrique risque d'erreurs important Transformation métrique Î non métrique: il y a une perte d'information (échelles moins structurées), mais on ne peut pas fausser une information. La technique classique consiste à constituer des classes: • d'amplitudes égales: 1° - chiffre d'affaire (CA) de 10 M€ et moins 2° - CA de 11 à 20 M€ 3° - CA de 21 à 30 M€ ... etc. • d'effectifs égaux (l'amplitude peut varier selon les classes): 1° - 100 entreprises au CA < 10 M€ 2° - 100 entreprises au CA compris entre 11 et 25M€ 3° - 100 entreprises au CA > 26 M€ Si des bornes naturelles n'existent pas, il vaut mieux raisonner sur des effectifs égaux; la part jouée par la subjectivité du chercheur est moins grande. Mais cela dépend aussi des objectifs du travail. Transformation non métrique Î métrique: Cette transformation est théoriquement interdite. Cependant, cette règle est souvent contournée car les analyses non paramétriques (imposées par des variables non métriques) sont moins nombreuses et moins "puissantes". Introduction à l'analyse des données 7 • Si on a recours à cette technique, 2 conditions doivent être respectées: 1° - la hiérarchisation doit être porteuse de sens Correct: Fort=3, moyen=2, faible=1 Incorrect: rouge=1, vert=2 2° - Les distances entre les items doivent être égales (en pratique, c'est invérifiable): Ex: dans un questionnaire coté selon une échelle de Lickert (Fort - moyen - faible) écartfort - moyen = écartmoyen - faible Les risques encourus suite à ce type de transformation implique leur évitement - si possible. 3. Les objectifs de l'analyse de données : Selon les objectifs assignés à un travail, il est possible de distinguer 3 grands types d'analyses. 3.1. Les analyses élémentaires: BUTS: n résumer de façon globale les données recueillies o déterminer les tendances générales des variables il s'agit souvent du point de départ d'une analyse Introduction à l'analyse des données 8 Ces analyses peuvent être : unidimensionnelles ou variables étudiées isolément bidimensionnelles mise en évidence de "lien" entre deux variables 35 4.5 4.0 POSITION ELECTRODE Nbre d'observations 30 25 20 15 10 5 0 3.5 3.0 2.5 2.0 1.5 1.0 20 40 60 80 100 120 140 160 Fréquence Médiane (EMG) 180 200 220 0.5 40 60 80 100 120 140 160 180 Fréquence Médiane (EMG) 3.2. Les analyses descriptives : Prise en compte de tout ou partie des variables mesurées en les considérant sur un même plan. Il n'y a pas d'idée à priori, pas d'hypothèse particulière, pas de distinction entre variables explicatives et variables à expliquer. BUTS: n décrire de façon synthétique la structure des données o organiser un phénomène pour mieux le comprendre. LIMITE: il est impossible d'en donner le principe de fonctionnement (pas de loi, de généralisation possible). Les analyses factorielles rentrent dans cette catégorie. 3.3. Les analyses explicatives : Elles introduisent une notion fondamentale: l'INFERENCE STATISTIQUE: Introduction à l'analyse des données 9 200 • distinction entre variable à expliquer ou variable dépendante (variable mesurée) et variable explicative ou indépendante (variable manipulée par l'expérimentateur dont il veut savoir si elle influe la VD ou pas). • implique la notion d'hypothèse nulle • permet par les outils statistiques appropriés de généraliser à un ensemble plus vaste les résultats obtenus sur un petit nombre de sujets c'est le principe de l'inférence statistique L'approche expérimentale ou dite "hypothético-déductive" repose principalement sur ce principe. BUT: étudier les liaisons entre différents phénomènes (caractérisés par des variables) dans le but d'en déduire les principes de fonctionnement ou d'organisation (lois, principes fondamentaux... etc.) Ces différentes méthodes ne exclusives les unes des autres. Ex: Décrire ⇒ Expliquer ⇒ sont pas forcément analyse descriptive, mise en relief du comportement de certaines variables... etc. puis formulation d'une hypothèse à vérifier validation (ou l'hypothèse formulée infirmation) de préalablement 4. Le choix d'une méthode d'analyse : 1 une idée à oublier définitivement: il existe toujours un test statistique qui permet de valider l'hypothèse qui arrange l'expérimentateur. C'est une idée fausse qui ne peut convaincre que les ignorants. Introduction à l'analyse des données 10 En fait, il existe un certain nombre de questions préalables au choix d'un test, et selon la décision finale, les interprétations n'auront pas la même portée (cf. méthodes descriptives ou explicatives). Les questions (principalement) : • le but est-il descriptif ou explicatif ? • analyse des individus, des variables, ou des 2 ? • l'aspect explicatif est appréhendé avec une ou plusieurs variables ? • les variables = métriques ou non métriques ? • leur distribution est-elle normale ou non ? Le choix n'est donc pas libre, mais dépend: • de la nature du problème posé • des variables retenues et de leurs caractéristiques. Tout n'est pas possible, même si dans certains cas, une certaine souplesse est possible (transformation de variables, imbrication des méthodes...). Quand on a obtenu une certaine connaissance en statistique, au moment même de l'écriture du protocole, il est possible de prévoir quel(s) type(s) d'analyses sont possibles. Introduction à l'analyse des données 11 5. Place de l'analyse des données dans un processus expérimental : A.D.D. L'analyse des données ne permet pas de s'affranchir de la qualité des autres phases. Introduction à l'analyse des données 12