1 Swiss bank notes

Transcription

1 Swiss bank notes
Université de CAEN
1
20 octobre 2010
M2-IAD MI5 Statistiques
Swiss bank notes
1.1
Description
Six variables measured on 100 genuine and 100 counterfeit old Swiss 1000-franc bank notes. The data stem from
Flury and Riedwyl (1988). The columns correspond to the following 6 variables.
X1
length
Length of the bank note
X2
height.left
Height of the bank note, measured on the left
X3
height.right
Height of the bank note, measured on the right
X 4 distance.lower Distance of inner frame to the lower border
X 5 distance.upper Distance of inner frame to the upper border
X6
diagonal
Length of the diagonal
1.2
Enoncé
1. Créer un répertoire contenant deux répertoires lib et ps. Construire alors la librairie par defaut user associée
au répertoire lib. Tous vos résultats (tables et graphiques) seront dans cette librairie.
2. Mettre le fichier SAS billet.sas7bdat dans le répertoire associé lib à la librairie user.
3. Faire un graphique de hauteur.gauche en ordoonée en fonction de la longueur en abcisse en utilisant deux couleurs
l’une pour les vrais et l’autre pour les faux billets. Distinguez vous les vrais des faux billets ?
4. Faire une analyse en composante principale de la table X centrée réduite. Combien vaut la somme des valeurs
singulières ? Expliquer. On conservera les axes principaux ainsi que les scores (coordonnées des individus (billets)
dans la nouvelle base.
proc princomp data=billet outstat=pca_out out=score;
var longueur--d;
run;
la table pca_out contient la matrice de Gram, les valeurs propres, de la matric de Gram, les vecteurs principaux
de l’espace des lignes. La table score contient les coordonnées des projections des lignes sur les espaces principaux.
5. On peut créer des tables générées par une procédure à l’aide ods. L’exemple suivant permet de récupérer la table
des valeurs propres.
ods output princomp.eigenvalues=vpods;
proc procedure;
ods output close;
6. Faire un graphe de la projection des individus dans le plan principal (V1 , V2 ).
7. Tracé l’éboulis des valeurs singulières.
8. Les coordonnées de la variable X 1 = longueur dans la base U 1 , · · · , U 6 sont
(λ1 v1,1 , λ2 v1,2 , · · · , λ6 v1,6 )
Construire alors la table des coordonnées de toutes les variables dans la base (U 1 , · · · , U 6 ). Les coordonnées des
variables seront en ligne.
9. Faire alors le cercle des corrélations. Quelles sont vos conclusions ?
10. Faire une sauvegarde de vos représentations graphiques sous forme de fichiers postscript.
http ://www.math.unicaen.fr/∼kauffman/cours
1
[email protected]
Université de CAEN
1.3
20 octobre 2010
M2-IAD MI5 Statistiques
Graphisme
hauteur
gauche
131.0
130.0
129.0
213.0
214.0
215.0
216.0
217.0
Longueur du billet
type
faux
vrai
Fig. 1 – Billets longueurx hauteur
Prin2
4
3
2
1
0
-1
-2
-3
-4
-3
-2
-1
0
1
2
3
Prin1
type
faux
vrai
Fig. 2 – Billets plan principal
http ://www.math.unicaen.fr/∼kauffman/cours
2
[email protected]
Université de CAEN
20 octobre 2010
2.00
Eboulis
des
valeurs
M2-IAD MI5 Statistiques
singulieres
1.50
1.00
.50
.00
Fig. 3 – Billets éboulis vp
y
1
longueur
hauteurL
d
hauteurR
0
margeH
margeB
-1
-1
0
1
x
Fig. 4 – Billets cercle corrélation
http ://www.math.unicaen.fr/∼kauffman/cours
3
[email protected]

Documents pareils