Study on first names of elected representatives of the municipal

Transcription

Study on first names of elected representatives of the municipal
Université de Caen Basse-Normandie
U.F.R de Sciences
Mathématiques
jeudi 08 octobre 2015
Master Informatique première année
UMI1FTP
Probabilité et statistiques
Deuxième devoir de statistiques
Ce devoir peut être fait par groupe de 1 ou deux personnes. Ce deuxième devoir comptera pour 1/3 de la note de contrôle
continu de statistiques.
Chaque groupe devra rendre avant le lundi 30 novembre minuit sur le moodle (un seul dépot par groupe)
http: // foad2. unicaen. fr/ moodle/ course/ view. php? id= 11961
1. Un seul fichier correspondant à votre script.
Le document rendu indiquera clairement les noms des étudiants composant le groupe. Le script R devra scrupuleusement suivre
la numérotation des questions. Le script R devra être commenté, il devra pouvoir être exécuté tel quel sans aucune modification.
La notation tiendra compte en particulier de l’efficacité de programmation et de l’orthographe.
1
Enquête sur les prénoms des élus de l’élection municipale de 2014
Sommaire
1.1
1.2
1.1
Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Enoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
4
Description
Dans cet exercice on étudie les prénoms des élus des élections municipales de la France en 2014. Je me suis inspiré d’une
étude faite sur le site Les prénoms de nos conseillers municipaux.
La table a 525146 lignes et 35 colonnes, elle est accessible aux formats :
texte http://www.ideeslibres.org/opendata/communales/2014/elus/elus_mun2014.zip
RData http://www.math.unicaen.fr/~kauffmann/data/elus-2014.RData
Ces données ont été mis en forme par Brice Person. Une description des données est disponible en suivant ce lien.
Les licences d’utilisations de ces données peuvent être consultées en suivant les liens :
• Licence ODbL ©
• IdeesLibres.org
• Ministère de l’Intérieur
1
2
3
4
5
6
7
8
9
10
11
12
13
nom
coddpt
codmindpt
coddpt3car
libdpt
codsubcom
libsubcom
libcom
libextarr
typcom
popsubcom
modescrutin
typsubcom
numliste
type
quali
quali
quali
quali
quali
quali
quali
quali
quali
quanti
quali
label
numéro du département
modalites
01 ;02 ;03 ;04 ;05 ;06 ;07 ;08 ;...
01 ;02 ;03 ;04 ;05 ;06 ;07 ;08 ;09 ;...
001 ;002 ;003 ;004 ;005 ;006 ;007 ;...
...
...
...
nom de la commune
arrondissement
;Commune ;Secteur ;Section
;Liste ;Majoritaire
quanti
1
14
codnualiste
quali
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
nomliste
liblisext
numordcand
teteliste
candidatepci
elucom
eluepci
elusecteur
candidatelucom
tour
nompsn
prepsn
sexe
naissance
csp
quali
quali
quanti
quali
quali
quali
quali
quali
quali
quanti
quali
quali
quali
quali
quanti
30
libcsp
quali
31
nat
quali
32
33
34
codeinsee
age lors elec
codnualisteinitiale
quali
quanti
quali
35
liblisextinitiale
quali
nuance politique
2eme tour
liste
LCOM ; LDIV ; LDVD ; LDVG ;
LEXD ; LEXG ; LFG ; LFN ;
LMDM ; LPG ; LSOC ; LUC ;
LUD ; LUDI ; LUG ; LUMP ;
LVEC
...
...
;N ;O
;N ;O
;O
;N ;O
;N
;O
date de naissance
code
catégorie
professionnelle
catégorie
professionnelle
nationalité
nom de famille
prénom
F ;M
...
sociosocio-
code insee commune
age
code nuance politique 1er
tour
...
AU ; B ; BG ; CZ ; D ; DK ; F ;
FL ; G ; GB ; HR ; HU ; I ; IRL ;
L ; M ; NL ; P ; PL ; RO ; S ; SP
...
LCOM ; LDIV ; LDVD ; LDVG ;
LEXG ; LFG ; LFN ; LMDM ;
LPG ; LSOC ; LUC ; LUD ;
LUDI ; LUG ; LUMP ; LVEC
...
Table 1: Catalogue
1
code
LEXG
libelle
Liste Extrême gauche
ordre
1
2
LFG
Liste Front de Gauche
2
3
4
LPG
LCOM
Liste du Parti de Gauche
Liste du Parti communiste français
3
4
5
6
LSOC
LUG
Liste Socialiste
Liste Union de la Gauche
5
6
2
definition
Liste d’extrême-gaucheă: Parti
Anarchiste Révolutionnaire, Les
Alternatifs, Nouveau Parti Anticapitaliste, Lutte Ouvrière, Solidarité
écologie gauche alternative, Parti
Ouvrier Indépendant
Listes investies par le Parti de
Gauche et le Parti Communiste
Français
Liste du Parti de Gauche
Liste du Parti Communiste Français
Liste du Parti Socialiste
Liste d’Union des partis de gaucheă: Pour être nuancée LUG, une
liste doit obtenir l’investiture du PS
et d’au moins un autre parti de
gauche (EELV, PRG, PCF, Parti de
Gauche). Elle peut néanmoins être
plus large en intégrant par exemple
le Modem.
7
LDVG
Liste Divers gauche
8
9
LVEC
LDIV
Liste
Liste
10
11
LMDM
LUC
Liste
Liste
12
LUDI
Liste
13
LUMP
Liste
14
LUD
Liste
15
LDVD
Liste
16
17
LFN
LEXD
Liste
Liste
7
Liste Parti Radical de Gauche,
Mouvement Républicain et Citoyen, Mouvement Unitaire Progressiste, candidats de gauche sans
investiture et liste de candidats
investis par plusieurs partis de
gauche (autres que LFG) mais sans
l’investiture du Parti Socialiste.
Autres formations se rattachant à
la Gauche.
Europe-Ecologie-Les Verts
8 Liste Europe-Ecologie-Les Verts
Divers
9 Liste Chasse Pêche Nature Tradition, Parti blanc, Parti Pirate,
Parti d’en rire, Rassemblement
des Contribuables Français (et
autres mouvements anti-fiscaliste),
Solidarité et Progrès, parti religieux (Parti des Musulmans de
France), parti socioprofessionnel,
liste régionaliste, autres mouvements écologistesă: Confédération
des
Ecologistes
Indépendants,
Génération Ecologie, Le Trèfle,
Homme-Nature-Animaux, Mouvement Ecologiste Indépendant, Cap
21.
Modem
10 Liste du Mouvement Démocrate
Union du Centre
11 Liste d’union du centreă: Pour être
nuancée LUC, une liste doit obtenir l’investiture de ńăl’Alternativeăż, c’est à dire du Modem et de
l’UDI.
Union Démocrates et Indépendants
12 Parti Radical, Nouveau-Centre,
Parti Libéral Démocrate, Alliance
Centriste, la Gauche Moderne,
Force Européenne Démocrate,
Nouvelle
Ecologie
Démocrate,
Territoires en mouvement.
Union pour un Mouvement Populaire
13 Liste de l’Union pour un Mouvement Populaire.
Union de la Droite
14 Liste d’Union des partis de Droiteă: Pour être nuancée LUD, une
liste doit obtenir l’investiture de
l’UMP et de l’UDI. Elle peut néanmoins être plus large en intégrant
par exemple le PCD, Debout la République ou le Modem
Divers droite
15 Liste Alliance Royale, Parti
Chrétien Démocrate, Debout la
République, République Solidaire,
Centre National des Indépendants
et des Paysans et autres formations
se rattachant à la Droite.
Front National
16 Liste du Front National
Extrême droite
17 Listes Mouvement National Républicain, Nissa Rebela, Bloc Identitaire, Ligue du Sud, Alsace
d’Abord, Force Française, Parti de
la France.
Table 2: Nuancier du minsitère de l’intérieur
3
Ce nuancier a été discuté lors de sa définition, vous pouvez consulter par exemple Libération du 18 mars 2014
1.2
1.2.1
Enoncé
Le langage de programmation R
1. Que font les instructions suivantes ?
DATA="http://www.math.unicaen.fr/~kauffman/data/"
X=read.table(paste(DATA,"elus_mun2014.csv",sep=""),header=TRUE,sep=";")
2. Donnez les instructions R (3 maximum) permettant de construire le tableau de contingence nommé nb :
(a) comptabilisant le nombre d’élus municipaux par sexe et par prénom
(b) en retirant tous les cas n’existant pas Freq==0
1
8
9
104
105
109
prepsn
A.Marie
Abassia
Abbassia
Abella
Abiba
Abida
sexe
F
F
F
F
F
F
Freq
1
2
2
1
1
1
Table 3 – Premières lignes du tableau de contingence nb
3. Quel est la signification précise du nombre calculé par les instructions suivantes ?
nb=nb[order(nb$sexe,nb$Freq,decreasing=TRUE),]
nb[nb$sexe=="M","Freq"][5]
6777
4. On a comptabilisé 211748 élues municipaux féminins et 313398 élus municipaux hommes. Donnez les instructions permettant
d’ajouter à la table nb la colonne total valant 21174 si sexe=="F" et 313398 sexe=="M". Puis ajouter la colonne f à la
table nb proportion pour 1000 élus ayant le prenom.
1
2
3
4
5
6
sexe
F
F
F
F
F
F
prepsn
A.Marie
Abassia
Abbassia
Abella
Abiba
Abida
Freq
1
2
2
1
1
1
total
211748
211748
211748
211748
211748
211748
f
0.0047
0.0094
0.0094
0.0047
0.0047
0.0047
Table 4 – table nb
5. On veut faire une représentation graphique de la fréquence d’apparition pour 100 élus des 5 prénoms masculins les plus
fréquents à l’aide d’un diagramme en barre.
4
Homme
Bernard
Christian
Alain
Philippe
Michel
10
20
30
proportion pour 1000 élus
Figure 1 – Fréquence des prénoms en 1/1000
Donnez les instructions permettant de réaliser ce graphique.
1.2.2
Modélisation statistique
Dans cette question, on voudrait savoir si il est raisonnable de penser que les fréquences d’apparition des 5 prénoms les plus
fréquents des élus hommes au niveau national sont les mêmes que celles au niveau du calvados.
512
556
570
771
802
12
sexe
M
M
M
M
M
M
prepsn
Alain
Bernard
Christian
Michel
Philippe
autre
Freq
8993
6777
6824
10957
9222
270625
total
313398
313398
313398
313398
313398
313398
Freq.14
164
82
101
206
200
4835
total.14
5588
5588
5588
5588
5588
5588
taux.national/1000
28.70
21.62
21.77
34.96
29.43
863.52
taux.calvados/1000
29.35
14.67
18.07
36.86
35.79
865.25
Table 5 – Table des fréquences pour les 5 prénoms les plus fréquents
1. Quel test peut-on utiliser pour répondre à la question ?
2. Décrire l’hypothèse nulle.
3. Voici les résultats de R
> chisq.test(nb2$Freq.14[nb2$sexe=="M"],p=nb2$taux.national[nb2$sexe=="M"]/1000)
Chi-squared test for given probabilities
data: nb2$Freq.14[nb2$sexe == "M"]
X-squared = 24.37, df = 5, p-value = 0.0001843
4. Comment est calculée la p-value ?
5. Peut-on refuser l’hypothèse nulle avec un risque de se tromper de moins de 2/10000 ?
5
6. Estimer cette p-value par simulation, illustrer graphiquement vos résultats.
6