Study on first names of elected representatives of the municipal
Transcription
Study on first names of elected representatives of the municipal
Université de Caen Basse-Normandie U.F.R de Sciences Mathématiques jeudi 08 octobre 2015 Master Informatique première année UMI1FTP Probabilité et statistiques Deuxième devoir de statistiques Ce devoir peut être fait par groupe de 1 ou deux personnes. Ce deuxième devoir comptera pour 1/3 de la note de contrôle continu de statistiques. Chaque groupe devra rendre avant le lundi 30 novembre minuit sur le moodle (un seul dépot par groupe) http: // foad2. unicaen. fr/ moodle/ course/ view. php? id= 11961 1. Un seul fichier correspondant à votre script. Le document rendu indiquera clairement les noms des étudiants composant le groupe. Le script R devra scrupuleusement suivre la numérotation des questions. Le script R devra être commenté, il devra pouvoir être exécuté tel quel sans aucune modification. La notation tiendra compte en particulier de l’efficacité de programmation et de l’orthographe. 1 Enquête sur les prénoms des élus de l’élection municipale de 2014 Sommaire 1.1 1.2 1.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Enoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 Description Dans cet exercice on étudie les prénoms des élus des élections municipales de la France en 2014. Je me suis inspiré d’une étude faite sur le site Les prénoms de nos conseillers municipaux. La table a 525146 lignes et 35 colonnes, elle est accessible aux formats : texte http://www.ideeslibres.org/opendata/communales/2014/elus/elus_mun2014.zip RData http://www.math.unicaen.fr/~kauffmann/data/elus-2014.RData Ces données ont été mis en forme par Brice Person. Une description des données est disponible en suivant ce lien. Les licences d’utilisations de ces données peuvent être consultées en suivant les liens : • Licence ODbL © • IdeesLibres.org • Ministère de l’Intérieur 1 2 3 4 5 6 7 8 9 10 11 12 13 nom coddpt codmindpt coddpt3car libdpt codsubcom libsubcom libcom libextarr typcom popsubcom modescrutin typsubcom numliste type quali quali quali quali quali quali quali quali quali quanti quali label numéro du département modalites 01 ;02 ;03 ;04 ;05 ;06 ;07 ;08 ;... 01 ;02 ;03 ;04 ;05 ;06 ;07 ;08 ;09 ;... 001 ;002 ;003 ;004 ;005 ;006 ;007 ;... ... ... ... nom de la commune arrondissement ;Commune ;Secteur ;Section ;Liste ;Majoritaire quanti 1 14 codnualiste quali 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 nomliste liblisext numordcand teteliste candidatepci elucom eluepci elusecteur candidatelucom tour nompsn prepsn sexe naissance csp quali quali quanti quali quali quali quali quali quali quanti quali quali quali quali quanti 30 libcsp quali 31 nat quali 32 33 34 codeinsee age lors elec codnualisteinitiale quali quanti quali 35 liblisextinitiale quali nuance politique 2eme tour liste LCOM ; LDIV ; LDVD ; LDVG ; LEXD ; LEXG ; LFG ; LFN ; LMDM ; LPG ; LSOC ; LUC ; LUD ; LUDI ; LUG ; LUMP ; LVEC ... ... ;N ;O ;N ;O ;O ;N ;O ;N ;O date de naissance code catégorie professionnelle catégorie professionnelle nationalité nom de famille prénom F ;M ... sociosocio- code insee commune age code nuance politique 1er tour ... AU ; B ; BG ; CZ ; D ; DK ; F ; FL ; G ; GB ; HR ; HU ; I ; IRL ; L ; M ; NL ; P ; PL ; RO ; S ; SP ... LCOM ; LDIV ; LDVD ; LDVG ; LEXG ; LFG ; LFN ; LMDM ; LPG ; LSOC ; LUC ; LUD ; LUDI ; LUG ; LUMP ; LVEC ... Table 1: Catalogue 1 code LEXG libelle Liste Extrême gauche ordre 1 2 LFG Liste Front de Gauche 2 3 4 LPG LCOM Liste du Parti de Gauche Liste du Parti communiste français 3 4 5 6 LSOC LUG Liste Socialiste Liste Union de la Gauche 5 6 2 definition Liste d’extrême-gaucheă: Parti Anarchiste Révolutionnaire, Les Alternatifs, Nouveau Parti Anticapitaliste, Lutte Ouvrière, Solidarité écologie gauche alternative, Parti Ouvrier Indépendant Listes investies par le Parti de Gauche et le Parti Communiste Français Liste du Parti de Gauche Liste du Parti Communiste Français Liste du Parti Socialiste Liste d’Union des partis de gaucheă: Pour être nuancée LUG, une liste doit obtenir l’investiture du PS et d’au moins un autre parti de gauche (EELV, PRG, PCF, Parti de Gauche). Elle peut néanmoins être plus large en intégrant par exemple le Modem. 7 LDVG Liste Divers gauche 8 9 LVEC LDIV Liste Liste 10 11 LMDM LUC Liste Liste 12 LUDI Liste 13 LUMP Liste 14 LUD Liste 15 LDVD Liste 16 17 LFN LEXD Liste Liste 7 Liste Parti Radical de Gauche, Mouvement Républicain et Citoyen, Mouvement Unitaire Progressiste, candidats de gauche sans investiture et liste de candidats investis par plusieurs partis de gauche (autres que LFG) mais sans l’investiture du Parti Socialiste. Autres formations se rattachant à la Gauche. Europe-Ecologie-Les Verts 8 Liste Europe-Ecologie-Les Verts Divers 9 Liste Chasse Pêche Nature Tradition, Parti blanc, Parti Pirate, Parti d’en rire, Rassemblement des Contribuables Français (et autres mouvements anti-fiscaliste), Solidarité et Progrès, parti religieux (Parti des Musulmans de France), parti socioprofessionnel, liste régionaliste, autres mouvements écologistesă: Confédération des Ecologistes Indépendants, Génération Ecologie, Le Trèfle, Homme-Nature-Animaux, Mouvement Ecologiste Indépendant, Cap 21. Modem 10 Liste du Mouvement Démocrate Union du Centre 11 Liste d’union du centreă: Pour être nuancée LUC, une liste doit obtenir l’investiture de ńăl’Alternativeăż, c’est à dire du Modem et de l’UDI. Union Démocrates et Indépendants 12 Parti Radical, Nouveau-Centre, Parti Libéral Démocrate, Alliance Centriste, la Gauche Moderne, Force Européenne Démocrate, Nouvelle Ecologie Démocrate, Territoires en mouvement. Union pour un Mouvement Populaire 13 Liste de l’Union pour un Mouvement Populaire. Union de la Droite 14 Liste d’Union des partis de Droiteă: Pour être nuancée LUD, une liste doit obtenir l’investiture de l’UMP et de l’UDI. Elle peut néanmoins être plus large en intégrant par exemple le PCD, Debout la République ou le Modem Divers droite 15 Liste Alliance Royale, Parti Chrétien Démocrate, Debout la République, République Solidaire, Centre National des Indépendants et des Paysans et autres formations se rattachant à la Droite. Front National 16 Liste du Front National Extrême droite 17 Listes Mouvement National Républicain, Nissa Rebela, Bloc Identitaire, Ligue du Sud, Alsace d’Abord, Force Française, Parti de la France. Table 2: Nuancier du minsitère de l’intérieur 3 Ce nuancier a été discuté lors de sa définition, vous pouvez consulter par exemple Libération du 18 mars 2014 1.2 1.2.1 Enoncé Le langage de programmation R 1. Que font les instructions suivantes ? DATA="http://www.math.unicaen.fr/~kauffman/data/" X=read.table(paste(DATA,"elus_mun2014.csv",sep=""),header=TRUE,sep=";") 2. Donnez les instructions R (3 maximum) permettant de construire le tableau de contingence nommé nb : (a) comptabilisant le nombre d’élus municipaux par sexe et par prénom (b) en retirant tous les cas n’existant pas Freq==0 1 8 9 104 105 109 prepsn A.Marie Abassia Abbassia Abella Abiba Abida sexe F F F F F F Freq 1 2 2 1 1 1 Table 3 – Premières lignes du tableau de contingence nb 3. Quel est la signification précise du nombre calculé par les instructions suivantes ? nb=nb[order(nb$sexe,nb$Freq,decreasing=TRUE),] nb[nb$sexe=="M","Freq"][5] 6777 4. On a comptabilisé 211748 élues municipaux féminins et 313398 élus municipaux hommes. Donnez les instructions permettant d’ajouter à la table nb la colonne total valant 21174 si sexe=="F" et 313398 sexe=="M". Puis ajouter la colonne f à la table nb proportion pour 1000 élus ayant le prenom. 1 2 3 4 5 6 sexe F F F F F F prepsn A.Marie Abassia Abbassia Abella Abiba Abida Freq 1 2 2 1 1 1 total 211748 211748 211748 211748 211748 211748 f 0.0047 0.0094 0.0094 0.0047 0.0047 0.0047 Table 4 – table nb 5. On veut faire une représentation graphique de la fréquence d’apparition pour 100 élus des 5 prénoms masculins les plus fréquents à l’aide d’un diagramme en barre. 4 Homme Bernard Christian Alain Philippe Michel 10 20 30 proportion pour 1000 élus Figure 1 – Fréquence des prénoms en 1/1000 Donnez les instructions permettant de réaliser ce graphique. 1.2.2 Modélisation statistique Dans cette question, on voudrait savoir si il est raisonnable de penser que les fréquences d’apparition des 5 prénoms les plus fréquents des élus hommes au niveau national sont les mêmes que celles au niveau du calvados. 512 556 570 771 802 12 sexe M M M M M M prepsn Alain Bernard Christian Michel Philippe autre Freq 8993 6777 6824 10957 9222 270625 total 313398 313398 313398 313398 313398 313398 Freq.14 164 82 101 206 200 4835 total.14 5588 5588 5588 5588 5588 5588 taux.national/1000 28.70 21.62 21.77 34.96 29.43 863.52 taux.calvados/1000 29.35 14.67 18.07 36.86 35.79 865.25 Table 5 – Table des fréquences pour les 5 prénoms les plus fréquents 1. Quel test peut-on utiliser pour répondre à la question ? 2. Décrire l’hypothèse nulle. 3. Voici les résultats de R > chisq.test(nb2$Freq.14[nb2$sexe=="M"],p=nb2$taux.national[nb2$sexe=="M"]/1000) Chi-squared test for given probabilities data: nb2$Freq.14[nb2$sexe == "M"] X-squared = 24.37, df = 5, p-value = 0.0001843 4. Comment est calculée la p-value ? 5. Peut-on refuser l’hypothèse nulle avec un risque de se tromper de moins de 2/10000 ? 5 6. Estimer cette p-value par simulation, illustrer graphiquement vos résultats. 6