Statistiques I
Transcription
Statistiques I
Exercices Variables qualitatives Graphiques Résumé Statistiques I Alexandre Caboussat [email protected] Classe : Mercredi 8h15-10h00 Salle : C114 http://campus.hesge.ch/caboussata A. Caboussat, HEG STAT I, 2010 1 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice 1.1 Le département marketing de Pepsi fait faire des tests à l’aveugle à 350 clients d’un supermarché afin de connaı̂tre leur préférence entre Pepsi et Coca. Décrire la population Décrire la variable d’intérêt Donner le type de la variable d’intérêt Décrire l’échantillon Décrire l’inférence A. Caboussat, HEG STAT I, 2010 2 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice 1.2 Un supermarché qui vend des yoghourts, qui, correctement remplis ont un poids de 500 gr. Or, d’après les plaintes le consommateurs, le supermarché décide alors de retourner les yoghourts insuffisamment remplis à ses fournisseurs. Une récente livraison contient 1200 yoghourts. Le supermarché choisit aléatoirement 50 yoghourts et les pèse au gramme près. Décrire la population Décrire la variable d’intérêt Donner le type de la variable d’intérêt Décrire l’échantillon Décrire l’inférence A. Caboussat, HEG STAT I, 2010 3 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice 1.3 1 Dans quelles conditions l’ensemble des employés de votre entreprise serait-il considéré comme une population? 2 Dans quelles conditions l’ensemble des employés de votre entreprise serait-il considéré comme un échantillon? A. Caboussat, HEG STAT I, 2010 4 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice 1.3 3 Si l’ensemble des employés de votre entreprise était considéré comme un échantillon, celui-ci serait-il aléatoire ou non? 4 Pourquoi le choix aléatoire de noms à partir de l’annuaire téléphonique d’une ville ne produit-il pas un échantillon représentatif des résidents de cette ville? A. Caboussat, HEG STAT I, 2010 5 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice 1.3 5 Donner un exemple d’étude dans laquelle on s’intéresse au score moyen (tendance centrale) d’une population. A. Caboussat, HEG STAT I, 2010 6 / 31 Exercices Variables qualitatives Graphiques Résumé Variables qualitatives Distribution de fréquences et représentations graphiques A. Caboussat, HEG STAT I, 2010 7 / 31 Exercices Variables qualitatives Graphiques Résumé Objectifs Savoir résumer une variable qualitative par: une distribution de fréquences un diagramme en barres un diagramme circulaire une ogive (variables ordinales) A. Caboussat, HEG STAT I, 2010 8 / 31 Exercices Variables qualitatives Graphiques Résumé Exemple introductif Ingénieur (I), Médecin (M), Etudiant (E), Avocat (A) I, I, M, E, E, A, I, M, E, E, I, A, I, A, E A. Caboussat, HEG STAT I, 2010 9 / 31 Exercices Variables qualitatives Graphiques Résumé Méthode générale Énumérer les différentes valeurs avec leur fréquence. Définition Une classe est une des catégories dans laquelle une variable qualitative peut être classifiée. Définition La fréquence d’une classe est le nombre d’observations dans cette classe. Définition La fréquence relative d’une classe est la fréquence de la classe divisée par le nombre total d’observations dans le jeu de données. A. Caboussat, HEG STAT I, 2010 10 / 31 Exercices Variables qualitatives Graphiques Résumé Distribution de fréquences Résumé des données sous forme de tableau décrivant la fréquence des observations dans les différentes classes juxtaposées classe xi x1 x2 .. . fréquence ni n1 n2 .. . fréq. relative fi n1 /n n2 /n .. . xi .. . ni .. . ni /n .. . xc Total nc n nc /n 1 c xi ni n fi A. Caboussat, HEG : : : : : nombre de classes i-ème valeur nombre d’occurence de la classe Pc xi nombre d’observations (n = i=1 ni ) fréquence relative = ni /n STAT I, 2010 11 / 31 Exercices Variables qualitatives Graphiques Résumé Notations x1 , . . . , xc . n1 , . . . , nc . n= Pc i=1 ni A. Caboussat, HEG STAT I, 2010 12 / 31 Exercices Variables qualitatives Graphiques Résumé Exemple 2 Bon (B), Suffisant (S), Insuffisant (I) B,B,B,B,S,S,S,S,S,I,I,I Comptons-les dans l’ordre! classe A. Caboussat, HEG STAT I, 2010 13 / 31 Exercices Variables qualitatives Graphiques Résumé Définitions (suite) Définition La distribution de fréquence cumulée représente le nombre d’observations dont la valeur est inférieure ou égale à (la limite supérieure de) chaque classe. Définition La distribution de fréquence relative cumulée d’une classe est la fréquence cumulée de la classe divisée par le nombre total d’observations dans le jeu de données A. Caboussat, HEG STAT I, 2010 14 / 31 Exercices Variables qualitatives Graphiques Résumé classe fréquence xi x1 x2 .. . ni n1 n2 .. . xi .. . ni .. . xc Total nc n fréq. cumulée n1 + . . . + ni n1 Notation: n1 + . . . + nc = c X fréq. relative fi n1 /n fréq. relative cumulée f1 + . . . + fi n1 /n ni = n i=1 A. Caboussat, HEG STAT I, 2010 15 / 31 Exercices Variables qualitatives Graphiques Résumé Exemple Le groupe sanguin de 25 donneurs de sang est: AB, B, A, O, B, O, B, O, A, O, B, O B, B, B, A, O, AB, AB, O, A, B, AB, O, A Fréquence A AB B O Total A. Caboussat, HEG 5 4 8 8 25 Pourcentage Fréquence relative 20.0% 16.0% 32.0% 32.0% 100.0% Pourcentage cumulatif Fréquence cumulative 20.0% 36.0% 68.0% 100.0% STAT I, 2010 16 / 31 Exercices Variables qualitatives Graphiques Résumé Remarque La somme des fréquences relatives vaut toujours 1. Commandes Informatiques table (R) frequence (Excel FR) frequency (Excel AN) [Exemple groupe sanguin (Excel). ] A. Caboussat, HEG STAT I, 2010 17 / 31 Exercices Variables qualitatives Graphiques Résumé Diagramme en barres Diagramme en barre décrit des données qualitatives résumées par une distribution de fréquence absolue, relative ou en pourcentage. Synonyme: diagramme en bâtons, graphique en tuyau d’orgue Axe vertical (ordonnée): fréquence Axe horizontal (abscisse): classes Les barres sont de largeurs égales, mais de hauteurs proportionnelles à la fréquence. Commandes Informatiques barplot (R) Insertion→Graphiques→Colonnes (Excel FR) Insert→Chart→Column (Excel AN) A. Caboussat, HEG STAT I, 2010 18 / 31 Exercices Variables qualitatives Graphiques Résumé Exemple Liste des pays dans lesquels les société concurrentes de Sun4all ont leur siège: Allemagne, USA, USA, Taı̈wan, Japon, USA, Corée du Sud, Allemagne, Allemagne, USA, Japon, Japon, Japon, Taı̈wan, Corée du Sud, Allemagne, USA, Corée du Sud A. Caboussat, HEG STAT I, 2010 19 / 31 Exercices Variables qualitatives Graphiques Résumé Exemple Liste des pays dans lesquels les société concurrentes de Sun4all ont leur siège: A. Caboussat, HEG STAT I, 2010 20 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice Nombres de commandes passées à une entreprise 1, 3, 2, 4, 3, 3, 2, 3, 3, 2, 1, 1, 3, 2, 2, 1, 3 Construisez un tableau de fréquences pour ces données, puis représentez-les sur un graphique en bâtons. Commentez les résultats. A. Caboussat, HEG STAT I, 2010 21 / 31 Exercices Variables qualitatives Graphiques Résumé Diagramme circulaire Disque (voire un demi-disque) découpé en secteurs, chacun ayant une surface proportionnelle à la fréquence de la modalité représentée. Synonyme: graphique en camembert, graphique en secteurs Construction: Angle du secteur [degré] = Fréquence relative ×360 Si demi-disque: Angle du secteur [degré] = Fréquence relative ×180 A. Caboussat, HEG STAT I, 2010 22 / 31 Exercices Variables qualitatives Graphiques Résumé Exemple Sièges de sociétés concurrentes A. Caboussat, HEG STAT I, 2010 23 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice Situation en 1997: nombre total de médecins et nombre de médecins généralistes exerçant dans un canton entièrement romand. Canton Nombre total Nombre de médecins de médecins généralistes Genève 1’196 228 Jura 92 42 Neuchâtel 311 118 Vaud 1’413 468 Source: Annuaire statistique de la Suisse, édition 2000. Construisez et comparez deux diagrammes circulaires, l’un pour la distribution du nombre total de médecins par canton et l’autre pour la distribution du nombre de médecins généralistes par canton. A. Caboussat, HEG STAT I, 2010 24 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice (suite) Canton Nombre total Nombre de médecins de médecins généralistes Genève 1’196 228 Jura 92 42 Neuchâtel 311 118 Vaud 1’413 468 Source: Annuaire statistique de la Suisse, édition 2000. A. Caboussat, HEG STAT I, 2010 25 / 31 Exercices Variables qualitatives Graphiques Résumé Ogive Définition La distribution de fréquence cumulée représente le nombre d’observations dont la valeur est inférieure ou égale à (la limite supérieure de) chaque classe. Définition Une ogive est une représentation de la fréquence cumulée par une courbe. → Variables qualitatives ordinales seulement (pas les nominales) A. Caboussat, HEG STAT I, 2010 26 / 31 Exercices Variables qualitatives Graphiques Résumé Exemple Une entreprise a classé ses clients en 5 catégories d’importance croissante: très petite (TP), petite (P), moyenne (M), grande (G) et très grande (TG) TP, TP, TP, TP, P, P, P, P, M, M, M, M, M, M, M, M, G, G, G, TG, TG, TG A. Caboussat, HEG STAT I, 2010 27 / 31 Exercices Variables qualitatives Graphiques Résumé Exemple Une entreprise a classé ses clients en 5 catégories d’importance croissante: très petite (TP), petite (P), moyenne (M), grande (G) et très grande (TG) TP, TP, TP, TP, P, P, P, P, M, M, M, M, M, M, M, M, G, G, G, TG, TG, TG A. Caboussat, HEG STAT I, 2010 27 / 31 Exercices Variables qualitatives Graphiques Résumé Attention aux graphiques pouvant induire en erreur! A. Caboussat, HEG STAT I, 2010 28 / 31 Exercices Variables qualitatives Graphiques Résumé Résumé Distribution de fréquence: résumé des données sous forme de tableau décrivant la fréquence des observations. Diagramme en barres: chaque catégorie correspond à une barre Diagramme en secteurs: chaque catégorie correspond à un secteur Ogive: cumul des fréquences par une courbe croissante. A. Caboussat, HEG STAT I, 2010 29 / 31 Exercices Variables qualitatives Graphiques Résumé Exercice Satisfaction des consommateurs ES, ES, ES, TS, TS, TS, S, S, S, S, S, S, PS, PS, PS, PS, PTS, PTS Ecrire le tableau de distribuation de fréquences. Illustrer un diagramme en barres et un diagramme en secteurs. Dessiner l’ogive. A. Caboussat, HEG STAT I, 2010 30 / 31 Exercices Variables qualitatives Graphiques Résumé A. Caboussat, HEG STAT I, 2010 31 / 31