Examen Final Pollution par protoxide d`azote
Transcription
Examen Final Pollution par protoxide d`azote
NOM : Prénom : Groupe : Tronc commun de Statistique de 2ème année (2012-2013) Examen Final Durée : 1h30 heures, aucun document n’est autorisé Calculatrice autorisée – Les réponses doivent figurer sur la présente feuille, dans l’espace réservé à cet effet. – Le sujet doit être rendu dans son intégralité. Pollution par protoxide d’azote Le protoxyde d’azote (N2 0) est un puissant gaz à effet de serre qui subsiste environ 120 ans dans l’atmosphère. Il est en partie responsable de la destruction de l’ozone. EDGAR (Emission Database for Global Atmospheric Research) recense les émissions de N2 0 par pays et par source. Une Analyse en Composantes Principales normée est menée pour réaliser une étude descriptive. > head(N20) Transport Production Solvant Canada 2.074420e+01 27.80 8.99e-01 Saint Pierre and Miquelon 8.780000e-04 0.00 2.47e-05 United States Minor Outlying Islands 0.000000e+00 0.00 0.00e+00 United States 2.117232e+02 137.00 1.72e+01 Mexico 1.192274e+01 5.81 4.78e-01 Aruba 6.931086e-03 0.00 4.48e-04 Agriculture Fire Waste Other Canada 75.6360000 0.750 3.8527000 8.2510e+00 Saint Pierre and Miquelon 0.0003914 0.000 0.0000565 2.2586e-04 United States Minor Outlying Islands 0.0000000 0.000 0.0000000 0.0000e+00 United States 561.9212000 1.213 34.3200000 7.2025e+01 Mexico 103.9350000 3.882 6.3100000 1.0021e+01 Aruba 0.0024730 0.000 0.0033500 5.7760e-03 Les quatre premières valeurs propres de la matrice de corrélation sont les suivantes > print(PCAN20$eig[1:4,1]) [1] 4.9379305 1.0621905 0.4341413 0.3028580 1. Combien vaut la somme des valeurs propres ? 2. Quelle est la part d’inertie portée par le premier axe ? et par le troisième ? 3. Qu’est ce qui distingue la République démocratique du Congo de la majorité des pays ? 4. À votre avis quels sont les individus qui ont contribué le plus fortement à la création de l’axe 1 ? > plot(PCAN20, choix="ind") Individuals factor map (PCA) 5 Dim 2 (15.17%) 10 the Democratic Republic of the Congo Indonesia Brazil Central African Republic Myanmar Guinea 0 Cote d'Ivoire Cambodia Bolivia South Africa Venezuela Int. Shipping Cameroon Sudan Zambia Argentina Ghana Australia Colombia Kazakhstan Mexico Malaysia Nigeria Benin Mali Congo Tanzania_United Republic of of Gabon Guatemala Lao People's Democratic Republic Togo Paraguay Thailand Ethiopia Madagascar Papua New Guinea Mozambique Chad Guyana Chile Sierra Leone Uganda Viet Nam Brunei Darussalam Int. Aviation Uruguay New Angola Zealand Honduras Suriname Kenya Senegal Ecuador Burkina Faso Mongolia Nicaragua Solomon Saudi Islands Arabia Dominican Somalia Republic Philippines Namibia Bhutan Mauritania Botswana Panama Syrian Arab Republic Zimbabwe United Arab Emirates Jamaica Israel Cuba Guinea−Bissau El Salvador Costa Malawi Rica French Guiana Hong Kong Luxembourg Oman Swaziland Bahamas Gambia Bahrain Eritrea Netherlands Martinique Lebanon Fiji Antilles Guadeloupe Lesotho Djibouti Belize New Barbados Grenada Cyprus Caledonia Saint Falkland Vincent Antigua French Cayman Timor−Leste Saint Seychelles Montserrat Dominica Bermuda Islands Gibraltar Vanuatu Liberia and Haiti Polynesia Lucia Islands the Barbuda (Malvinas) Grenadines South Korea, United Heard Georgia Micronesia, British French Saint Northern Turks Cocos Democratic Sao Island States Virgin Saint Virgin Wallis American and Christmas Marshall Western Indian Pierre Tome Norfolk Bouvet Faroe Cook and Saint Southern Cape Antarctica (Keeling) Kitts and Maldives Islands_British the Minor Anguilla Mayotte Tokelau Pitcairn Federated Samoa Kiribati Macao Islands_USA Tuvalu Mariana Nauru Guam Tonga Aruba Palau and Niue Caicos and Ocean Helena Islands and South Islands McDonald Verde People's and Island Sahara Samoa Futuna Outlying Island Principe Territories Miquelon Islands Nevis Islands Sandwich Territory States Republic Islands Islands Equatorial Comoros Iceland Guinea Puerto Rico Yemen Malta Taiwan_Province Ireland Iraq of China Sri Reunion Lanka Greenland Rwanda Libyan Arab Kuwait Jamahiriya Jordan Niger Iran, Burundi Islamic Republic Trinidad and Tobago Korea, of of Islands Armenia Denmark Albania Nepal Estonia Bosnia Herzegovina Morocco Moldova, Republic of Slovenia Kyrgyzstan Tunisia Afghanistan Tajikistan Singapore Azerbaijan Switzerland Turkmenistan Qatar Serbia and Montenegro Algeria Bulgaria Georgia Austria Hungary Slovakia Croatia Bangladesh Norway Sweden Portugal Finland Greece Czech Republic Turkey Lithuania Uzbekistan Netherlands Pakistan Belarus Egypt Spain Romania Peru Canada France Poland Belgium Macedonia, the former Yugoslav United Kingdom Italy JapanRepublic of Mauritius Ukraine Germany Russian Federation Latvia China India United States 0 5 10 15 20 25 Dim 1 (70.54%) Figure 1 – Représentation des individus dans le premier plan principal 30 > plot(PCAN20, choix="var") Variables factor map (PCA) 0.0 Agriculture Other −0.5 Waste Transport Production Solvant −1.0 Dim 2 (15.17%) 0.5 1.0 Fire −2 −1 0 Dim 1 (70.54%) Figure 2 – Cercle des corrélations 1 2 Étude de la photosynthèse chez la plante Echinochloa crus-galli On souhaite étudier l’influence de facteurs environnementaux tels que la température et la concentration en CO2 sur la photosynthèse de la plante Echinochloa crus-galli. Pour cela, une expérience est réalisée sur 60 plantes. Chaque plante reçoit une dose de concentration en CO2 , exprimée en ppm (parties par million) et est placée à une certaine température (variable Traitement). Un indice de l’activité de photosynthèse est alors mesuré (variable Photosynt). Dans cette expérience, on a considéré 5 doses de concentration en CO2 (95, 175, 250, 350 et 500) et 2 températures différentes (26°C : Trait1 et 12°C : Trait2). L’intensité lumineuse est, elle, contrôlée de façon à rester constante. Certaines plantes n’ont pas survécu lors de cette expérience. La table 1 donne la répartition du nombre de plantes entre les différentes doses et les différents traitements. 95 175 250 350 500 Trait1 Trait2 6 4 5 4 6 5 6 6 5 5 Table 1 – Répartition du nombre de plantes entre les différentes doses et les différents traitements. Partie I : On considère dans un premier temps que la variable Dose est une variable qualitative, appelée CodeDose. On cherche à étudier l’influence des 2 facteurs CodeDose et Traitement. 5. Écrire le modèle, noté M1, correspondant à cette analyse en précisant l’ensemble des hypothèses du modèle et en donnant les gammes de variations des différents indices. 6. Écrire le modèle sous forme matricielle et préciser les dimensions des différents objets mis en jeu. Figure 3 – Graphes de diagnostic pour le modèle M1. 7. La figure 3 donne les différents graphes de diagnostic produits par le logiciel R pour le modèle M1. Justifier le passage au modèle, noté logM1, correspondant à l’analyse des effets des deux facteurs sur le logarithme de l’indice d’activité de photosynthèse dont les graphes de diagnostic sont donnés figure 4. Les résultats de l’analyse du modèle logM1 sont donnés dans la Table 2. 8. Dans cette expérience, le dispositif est-il équilibré ? orthogonal ? Quelles en seront les conséquences ? Figure 4 – Graphes de diagnostic pour le modèle Mlog1. 9. Donner l’expression de l’estimation de la variance résiduelle. À combien est-elle estimée ? 10. Donner les sommes des carrés du modèle, résiduelle et totale. 11. Donner les hypothèses H0 et H1 du test du modèle complet. Calculer la statistique de ce test et conclure. 12. Justifier les degrés de libertés associés aux tests des effets Traitement, de CodeDose et de leur interaction. 13. Quels sont les effets significatifs au niveau 5% ? Quelle est la différence entre les sommes de carrés de type I et de type II pour le test de l’effet traitement ? 14. Comment interprétez-vous le résultat du test de l’interaction ? 15. Quelles sont les contraintes utilisées par le logiciel R pour l’estimation des différents paramètres ? 16. Quelle hypothèse teste-t-on dans la ligne ”TraitementTrait2” du tableau Coefficient obtenu par la commande R summary ? Quelle est la conclusion du test ? On souhaite maintenant tester s’il existe une différence entre les deux traitements à dose fixée et ce pour chaque dose. On note µij = E(Yijk ), l’espérance de l’indice de photosynthèse pour un traitement i et une dose j. 17. Ecrire les hypothèses H0 et H1 des différents tests que l’on cherche à faire en fonction des µij . 18. Les résultats de ces tests sont donnés dans la table 3. Interpréter. 19. Donner l’expression de l’espérance de Yi.. en fonction des paramètres du modèle, ainsi que l’expression de la moyenne d’un traitement ajustée aux différentes doses. Expliquer la différence entre les deux. Partie II : On cherche maintenant à tester si la relation linéaire entre l’indice de photosynthèse et la dose de concentration en CO2 est la même quel que soit le traitement. On considère ici la variable dose comme une variable quantitative (Dose). 20. Écrire le modèle, noté logM2, dont les résultats sont donnés dans la table 4. Préciser l’ensemble des hypothèses du modèle et donner les gammes de variations des différents indices. 21. Ecrire les hypothèses H0 et H1 du test permettant de répondre à la question posée dans cette partie et conclure. 22. Que vaut l’estimation du terme d’interaction ”Trait2*Dose”. Interpréter. 23. La concentration moyenne actuelle de CO2 dans l’air est de 390 ppm. Si on suppose que la température est de 26°C, prédire l’indice de photosynthèse d’une plante dans ces conditions. > summary(logM1) Call: lm(formula = logPhotosynt ~ Traitement + CodeDose + Traitement * CodeDose, data = Don1) Residuals: Min 1Q Median -0.38625 -0.08959 -0.00860 3Q 0.09486 Max 0.35506 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.35368 0.07798 30.184 < 2e-16 *** TraitementTrait2 -0.10995 0.12330 -0.892 0.377595 CodeDose175 0.22354 0.11566 1.933 0.060037 . CodeDose250 0.47029 0.11028 4.265 0.000111 *** CodeDose350 0.81047 0.11028 7.349 4.62e-09 *** CodeDose500 1.39534 0.11566 12.064 3.11e-15 *** TraitementTrait2:CodeDose175 -0.28904 0.17782 -1.625 0.111547 TraitementTrait2:CodeDose250 -0.37646 0.16905 -2.227 0.031375 * TraitementTrait2:CodeDose350 -0.46853 0.16542 -2.832 0.007066 ** TraitementTrait2:CodeDose500 -0.86653 0.17261 -5.020 9.97e-06 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.191 on 42 degrees of freedom Multiple R-squared: 0.8712, Adjusted R-squared: 0.8436 F-statistic: XXXX on 9 and 42 DF, p-value: 6.667e-16 > anova(logM1) Analysis of Variance Table Response: logPhotosynt Df Traitement 1 CodeDose 4 Traitement:CodeDose 4 Residuals 42 Sum Sq 2.8450 6.5500 0.9703 1.5323 Mean Sq F value Pr(>F) 2.84498 77.9787 4.01e-11 *** 1.63750 44.8826 1.23e-14 *** 0.24257 6.6487 0.000307 *** 0.03648 > Anova(logM1) Anova Table (Type II tests) Response: logPhotosynt Sum Sq Df F value Pr(>F) Traitement 3.4454 1 94.4368 2.618e-12 *** CodeDose 6.5500 4 44.8826 1.230e-14 *** Traitement:CodeDose 0.9703 4 6.6487 0.000307 *** Residuals 1.5323 42 > Comparaison du modèle le plus simple avec le modèle proposé (anova(logM1.0,logM1)) Analysis of Variance Table Model 1: logPhotosynt ~ 1 Model 2: logPhotosynt ~ Traitement + CodeDose + Traitement * CodeDose Res.Df RSS Df Sum of Sq F Pr(>F) 1 51 11.8976 2 42 1.5323 9 10.365 31.567 6.667e-16 *** Table 2 – Analyse des résultats du modèle logM1. Trait1, Trait1, Trait1, Trait1, Trait1, 95 - Trait2, 95 175 - Trait2, 175 250 - Trait2, 250 350 - Trait2, 350 500 - Trait2, 500 estimate 0.109951215 0.398987600 0.486406395 0.578481140 0.976479402 SE 0.1232951 0.1281320 0.1156610 0.1102785 0.1208040 df 42 42 42 42 42 t.ratio 0.89177 3.11388 4.20545 5.24564 8.08317 p.value 0.37760 0.00332 0.00013 0.00000 0.00000 Table 3 – Test de la différence entre les 2 traitements pour les différentes doses. > summary(logM2) Call: lm(formula = logPhotosynt ~ Traitement + Dose + Traitement * Dose, data = Don1) Residuals: Min 1Q -0.40094 -0.07860 Median 0.00921 3Q 0.11277 Max 0.39906 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.9892609 0.0769051 25.866 < 2e-16 *** TraitementTrait2 0.0172216 0.1168898 0.147 0.883 Dose 0.0034437 0.0002540 13.459 < 2e-16 *** TraitementTrait2:Dose -0.0019146 0.0003745 -5.113 5.48e-06 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 0.1856 on 48 degrees of freedom Multiple R-squared: 0.861, Adjusted R-squared: 0.8523 F-statistic: 99.1 on 3 and 48 DF, p-value: < 2.2e-16 > Anova(logM2) Anova Table (Type II tests) Response: logPhotosynt Sum Sq Df F value Pr(>F) Traitement 3.4592 1 100.392 2.376e-13 *** Dose 6.4980 1 188.584 < 2.2e-16 *** Traitement:Dose 0.9007 1 26.141 5.483e-06 *** Residuals 1.6539 48 Table 4 – Analyse des résultats du modèle logM2.