Statistiques I

Transcription

Statistiques I
Exercices Variables qualitatives Graphiques Résumé
Statistiques I
Alexandre Caboussat
[email protected]
Classe : Mercredi 8h15-10h00
Salle : C114
http://campus.hesge.ch/caboussata
A. Caboussat, HEG
STAT I, 2010
1 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice 1.1
Le département marketing de Pepsi fait faire des tests à l’aveugle à
350 clients d’un supermarché afin de connaı̂tre leur préférence
entre Pepsi et Coca.
Décrire la population
Décrire la variable d’intérêt
Donner le type de la variable d’intérêt
Décrire l’échantillon
Décrire l’inférence
A. Caboussat, HEG
STAT I, 2010
2 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice 1.2
Un supermarché qui vend des yoghourts, qui, correctement remplis
ont un poids de 500 gr. Or, d’après les plaintes le consommateurs,
le supermarché décide alors de retourner les yoghourts
insuffisamment remplis à ses fournisseurs. Une récente livraison
contient 1200 yoghourts. Le supermarché choisit aléatoirement 50
yoghourts et les pèse au gramme près.
Décrire la population
Décrire la variable d’intérêt
Donner le type de la variable d’intérêt
Décrire l’échantillon
Décrire l’inférence
A. Caboussat, HEG
STAT I, 2010
3 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice 1.3
1
Dans quelles conditions l’ensemble des employés de votre
entreprise serait-il considéré comme une population?
2
Dans quelles conditions l’ensemble des employés de votre
entreprise serait-il considéré comme un échantillon?
A. Caboussat, HEG
STAT I, 2010
4 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice 1.3
3
Si l’ensemble des employés de votre entreprise était considéré
comme un échantillon, celui-ci serait-il aléatoire ou non?
4
Pourquoi le choix aléatoire de noms à partir de l’annuaire
téléphonique d’une ville ne produit-il pas un échantillon
représentatif des résidents de cette ville?
A. Caboussat, HEG
STAT I, 2010
5 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice 1.3
5
Donner un exemple d’étude dans laquelle on s’intéresse au
score moyen (tendance centrale) d’une population.
A. Caboussat, HEG
STAT I, 2010
6 / 31
Exercices Variables qualitatives Graphiques Résumé
Variables qualitatives
Distribution de fréquences et
représentations graphiques
A. Caboussat, HEG
STAT I, 2010
7 / 31
Exercices Variables qualitatives Graphiques Résumé
Objectifs
Savoir résumer une variable qualitative par:
une distribution de fréquences
un diagramme en barres
un diagramme circulaire
une ogive (variables ordinales)
A. Caboussat, HEG
STAT I, 2010
8 / 31
Exercices Variables qualitatives Graphiques Résumé
Exemple introductif
Ingénieur (I), Médecin (M), Etudiant (E), Avocat (A)
I, I, M, E, E, A, I, M, E, E, I, A, I, A, E
A. Caboussat, HEG
STAT I, 2010
9 / 31
Exercices Variables qualitatives Graphiques Résumé
Méthode générale
Énumérer les différentes valeurs avec leur fréquence.
Définition
Une classe est une des catégories dans laquelle une variable
qualitative peut être classifiée.
Définition
La fréquence d’une classe est le nombre d’observations dans cette
classe.
Définition
La fréquence relative d’une classe est la fréquence de la classe
divisée par le nombre total d’observations dans le jeu de données.
A. Caboussat, HEG
STAT I, 2010
10 / 31
Exercices Variables qualitatives Graphiques Résumé
Distribution de fréquences
Résumé des données sous forme de tableau décrivant la fréquence
des observations dans les différentes classes juxtaposées
classe
xi
x1
x2
..
.
fréquence
ni
n1
n2
..
.
fréq. relative
fi
n1 /n
n2 /n
..
.
xi
..
.
ni
..
.
ni /n
..
.
xc
Total
nc
n
nc /n
1
c
xi
ni
n
fi
A. Caboussat, HEG
:
:
:
:
:
nombre de classes
i-ème valeur
nombre d’occurence de la classe
Pc xi
nombre d’observations (n =
i=1 ni )
fréquence relative = ni /n
STAT I, 2010
11 / 31
Exercices Variables qualitatives Graphiques Résumé
Notations
x1 , . . . , xc .
n1 , . . . , nc .
n=
Pc
i=1 ni
A. Caboussat, HEG
STAT I, 2010
12 / 31
Exercices Variables qualitatives Graphiques Résumé
Exemple 2
Bon (B), Suffisant (S), Insuffisant (I)
B,B,B,B,S,S,S,S,S,I,I,I
Comptons-les dans l’ordre!
classe
A. Caboussat, HEG
STAT I, 2010
13 / 31
Exercices Variables qualitatives Graphiques Résumé
Définitions (suite)
Définition
La distribution de fréquence cumulée représente le nombre
d’observations dont la valeur est inférieure ou égale à (la limite
supérieure de) chaque classe.
Définition
La distribution de fréquence relative cumulée d’une classe est la
fréquence cumulée de la classe divisée par le nombre total
d’observations dans le jeu de données
A. Caboussat, HEG
STAT I, 2010
14 / 31
Exercices Variables qualitatives Graphiques Résumé
classe
fréquence
xi
x1
x2
..
.
ni
n1
n2
..
.
xi
..
.
ni
..
.
xc
Total
nc
n
fréq.
cumulée
n1 + . . . + ni
n1
Notation: n1 + . . . + nc =
c
X
fréq.
relative
fi
n1 /n
fréq.
relative cumulée
f1 + . . . + fi
n1 /n
ni = n
i=1
A. Caboussat, HEG
STAT I, 2010
15 / 31
Exercices Variables qualitatives Graphiques Résumé
Exemple
Le groupe sanguin de 25 donneurs de sang est:
AB, B, A, O, B, O, B, O, A, O, B, O
B, B, B, A, O, AB, AB, O, A, B, AB, O, A
Fréquence
A
AB
B
O
Total
A. Caboussat, HEG
5
4
8
8
25
Pourcentage
Fréquence relative
20.0%
16.0%
32.0%
32.0%
100.0%
Pourcentage cumulatif
Fréquence cumulative
20.0%
36.0%
68.0%
100.0%
STAT I, 2010
16 / 31
Exercices Variables qualitatives Graphiques Résumé
Remarque
La somme des fréquences relatives vaut toujours 1.
Commandes Informatiques
table (R)
frequence (Excel FR)
frequency (Excel AN)
[Exemple groupe sanguin (Excel). ]
A. Caboussat, HEG
STAT I, 2010
17 / 31
Exercices Variables qualitatives Graphiques Résumé
Diagramme en barres
Diagramme en barre décrit des données qualitatives résumées
par une distribution de fréquence absolue, relative ou en
pourcentage.
Synonyme: diagramme en bâtons, graphique en tuyau
d’orgue
Axe vertical (ordonnée): fréquence
Axe horizontal (abscisse): classes
Les barres sont de largeurs égales, mais de hauteurs
proportionnelles à la fréquence.
Commandes Informatiques
barplot (R)
Insertion→Graphiques→Colonnes (Excel FR)
Insert→Chart→Column (Excel AN)
A. Caboussat, HEG
STAT I, 2010
18 / 31
Exercices Variables qualitatives Graphiques Résumé
Exemple
Liste des pays dans lesquels les société concurrentes de Sun4all ont
leur siège:
Allemagne, USA, USA, Taı̈wan, Japon, USA, Corée du Sud,
Allemagne, Allemagne, USA, Japon, Japon, Japon, Taı̈wan, Corée
du Sud, Allemagne, USA, Corée du Sud
A. Caboussat, HEG
STAT I, 2010
19 / 31
Exercices Variables qualitatives Graphiques Résumé
Exemple
Liste des pays dans lesquels les société concurrentes de Sun4all ont
leur siège:
A. Caboussat, HEG
STAT I, 2010
20 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice
Nombres de commandes passées à une entreprise
1, 3, 2, 4, 3, 3, 2, 3, 3, 2, 1, 1, 3, 2, 2, 1, 3
Construisez un tableau de fréquences pour ces données, puis
représentez-les sur un graphique en bâtons. Commentez les
résultats.
A. Caboussat, HEG
STAT I, 2010
21 / 31
Exercices Variables qualitatives Graphiques Résumé
Diagramme circulaire
Disque (voire un demi-disque) découpé en secteurs, chacun
ayant une surface proportionnelle à la fréquence de la
modalité représentée.
Synonyme: graphique en camembert, graphique en secteurs
Construction:
Angle du secteur [degré] = Fréquence relative ×360
Si demi-disque:
Angle du secteur [degré] = Fréquence relative ×180
A. Caboussat, HEG
STAT I, 2010
22 / 31
Exercices Variables qualitatives Graphiques Résumé
Exemple
Sièges de sociétés concurrentes
A. Caboussat, HEG
STAT I, 2010
23 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice
Situation en 1997: nombre total de médecins et nombre de
médecins généralistes exerçant dans un canton entièrement
romand.
Canton
Nombre total
Nombre de médecins
de médecins
généralistes
Genève
1’196
228
Jura
92
42
Neuchâtel
311
118
Vaud
1’413
468
Source: Annuaire statistique de la Suisse, édition 2000.
Construisez et comparez deux diagrammes circulaires, l’un pour la
distribution du nombre total de médecins par canton et l’autre pour
la distribution du nombre de médecins généralistes par canton.
A. Caboussat, HEG
STAT I, 2010
24 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice (suite)
Canton
Nombre total
Nombre de médecins
de médecins
généralistes
Genève
1’196
228
Jura
92
42
Neuchâtel
311
118
Vaud
1’413
468
Source: Annuaire statistique de la Suisse, édition 2000.
A. Caboussat, HEG
STAT I, 2010
25 / 31
Exercices Variables qualitatives Graphiques Résumé
Ogive
Définition
La distribution de fréquence cumulée représente le nombre
d’observations dont la valeur est inférieure ou égale à (la limite
supérieure de) chaque classe.
Définition
Une ogive est une représentation de la fréquence cumulée par une
courbe.
→ Variables qualitatives ordinales seulement (pas les nominales)
A. Caboussat, HEG
STAT I, 2010
26 / 31
Exercices Variables qualitatives Graphiques Résumé
Exemple
Une entreprise a classé ses clients en 5 catégories d’importance
croissante: très petite (TP), petite (P), moyenne (M), grande (G)
et très grande (TG)
TP, TP, TP, TP, P, P, P, P, M, M, M,
M, M, M, M, M, G, G, G, TG, TG, TG
A. Caboussat, HEG
STAT I, 2010
27 / 31
Exercices Variables qualitatives Graphiques Résumé
Exemple
Une entreprise a classé ses clients en 5 catégories d’importance
croissante: très petite (TP), petite (P), moyenne (M), grande (G)
et très grande (TG)
TP, TP, TP, TP, P, P, P, P, M, M, M,
M, M, M, M, M, G, G, G, TG, TG, TG
A. Caboussat, HEG
STAT I, 2010
27 / 31
Exercices Variables qualitatives Graphiques Résumé
Attention aux graphiques pouvant induire en erreur!
A. Caboussat, HEG
STAT I, 2010
28 / 31
Exercices Variables qualitatives Graphiques Résumé
Résumé
Distribution de fréquence: résumé des données sous forme de
tableau décrivant la fréquence des observations.
Diagramme en barres: chaque catégorie correspond à une
barre
Diagramme en secteurs: chaque catégorie correspond à un
secteur
Ogive: cumul des fréquences par une courbe croissante.
A. Caboussat, HEG
STAT I, 2010
29 / 31
Exercices Variables qualitatives Graphiques Résumé
Exercice
Satisfaction des consommateurs
ES, ES, ES, TS, TS, TS, S, S, S, S, S, S, PS, PS, PS, PS, PTS,
PTS
Ecrire le tableau de distribuation de fréquences.
Illustrer un diagramme en barres et un diagramme en secteurs.
Dessiner l’ogive.
A. Caboussat, HEG
STAT I, 2010
30 / 31
Exercices Variables qualitatives Graphiques Résumé
A. Caboussat, HEG
STAT I, 2010
31 / 31