Examen Final Pollution par protoxide d`azote

Transcription

Examen Final Pollution par protoxide d`azote
NOM :
Prénom :
Groupe :
Tronc commun de Statistique de 2ème année (2012-2013)
Examen Final
Durée : 1h30 heures, aucun document n’est autorisé
Calculatrice autorisée
– Les réponses doivent figurer sur la présente feuille, dans l’espace réservé à cet effet.
– Le sujet doit être rendu dans son intégralité.
Pollution par protoxide d’azote
Le protoxyde d’azote (N2 0) est un puissant gaz à effet de serre qui subsiste environ 120 ans
dans l’atmosphère. Il est en partie responsable de la destruction de l’ozone. EDGAR (Emission
Database for Global Atmospheric Research) recense les émissions de N2 0 par pays et par source.
Une Analyse en Composantes Principales normée est menée pour réaliser une étude descriptive.
> head(N20)
Transport Production Solvant
Canada
2.074420e+01
27.80 8.99e-01
Saint Pierre and Miquelon
8.780000e-04
0.00 2.47e-05
United States Minor Outlying Islands 0.000000e+00
0.00 0.00e+00
United States
2.117232e+02
137.00 1.72e+01
Mexico
1.192274e+01
5.81 4.78e-01
Aruba
6.931086e-03
0.00 4.48e-04
Agriculture Fire
Waste
Other
Canada
75.6360000 0.750 3.8527000 8.2510e+00
Saint Pierre and Miquelon
0.0003914 0.000 0.0000565 2.2586e-04
United States Minor Outlying Islands
0.0000000 0.000 0.0000000 0.0000e+00
United States
561.9212000 1.213 34.3200000 7.2025e+01
Mexico
103.9350000 3.882 6.3100000 1.0021e+01
Aruba
0.0024730 0.000 0.0033500 5.7760e-03
Les quatre premières valeurs propres de la matrice de corrélation sont les suivantes
> print(PCAN20$eig[1:4,1])
[1] 4.9379305 1.0621905 0.4341413 0.3028580
1. Combien vaut la somme des valeurs propres ?
2. Quelle est la part d’inertie portée par le premier axe ? et par le troisième ?
3. Qu’est ce qui distingue la République démocratique du Congo de la majorité des pays ?
4. À votre avis quels sont les individus qui ont contribué le plus fortement à la création de
l’axe 1 ?
> plot(PCAN20, choix="ind")
Individuals factor map (PCA)
5
Dim 2 (15.17%)
10
the Democratic Republic of the Congo
Indonesia
Brazil
Central African Republic
Myanmar
Guinea
0
Cote
d'Ivoire
Cambodia
Bolivia
South
Africa
Venezuela
Int.
Shipping
Cameroon
Sudan
Zambia
Argentina
Ghana
Australia
Colombia
Kazakhstan
Mexico
Malaysia
Nigeria
Benin
Mali
Congo
Tanzania_United
Republic
of of
Gabon
Guatemala
Lao
People's
Democratic
Republic
Togo
Paraguay
Thailand
Ethiopia
Madagascar
Papua
New
Guinea
Mozambique
Chad
Guyana
Chile
Sierra
Leone
Uganda
Viet
Nam
Brunei
Darussalam
Int.
Aviation
Uruguay
New
Angola
Zealand
Honduras
Suriname
Kenya
Senegal
Ecuador
Burkina
Faso
Mongolia
Nicaragua
Solomon
Saudi
Islands
Arabia
Dominican
Somalia
Republic
Philippines
Namibia
Bhutan
Mauritania
Botswana
Panama
Syrian
Arab
Republic
Zimbabwe
United
Arab
Emirates
Jamaica
Israel
Cuba
Guinea−Bissau
El
Salvador
Costa
Malawi
Rica
French
Guiana
Hong
Kong
Luxembourg
Oman
Swaziland
Bahamas
Gambia
Bahrain
Eritrea
Netherlands
Martinique
Lebanon
Fiji
Antilles
Guadeloupe
Lesotho
Djibouti
Belize
New
Barbados
Grenada
Cyprus
Caledonia
Saint
Falkland
Vincent
Antigua
French
Cayman
Timor−Leste
Saint
Seychelles
Montserrat
Dominica
Bermuda
Islands
Gibraltar
Vanuatu
Liberia
and
Haiti
Polynesia
Lucia
Islands
the
Barbuda
(Malvinas)
Grenadines
South
Korea,
United
Heard
Georgia
Micronesia,
British
French
Saint
Northern
Turks
Cocos
Democratic
Sao
Island
States
Virgin
Saint
Virgin
Wallis
American
and
Christmas
Marshall
Western
Indian
Pierre
Tome
Norfolk
Bouvet
Faroe
Cook
and
Saint
Southern
Cape
Antarctica
(Keeling)
Kitts
and
Maldives
Islands_British
the
Minor
Anguilla
Mayotte
Tokelau
Pitcairn
Federated
Samoa
Kiribati
Macao
Islands_USA
Tuvalu
Mariana
Nauru
Guam
Tonga
Aruba
Palau
and
Niue
Caicos
and
Ocean
Helena
Islands
and
South
Islands
McDonald
Verde
People's
and
Island
Sahara
Samoa
Futuna
Outlying
Island
Principe
Territories
Miquelon
Islands
Nevis
Islands
Sandwich
Territory
States
Republic
Islands
Islands
Equatorial
Comoros
Iceland
Guinea
Puerto
Rico
Yemen
Malta
Taiwan_Province
Ireland
Iraq
of
China
Sri
Reunion
Lanka
Greenland
Rwanda
Libyan
Arab
Kuwait
Jamahiriya
Jordan
Niger
Iran,
Burundi
Islamic
Republic
Trinidad
and
Tobago
Korea,
of of Islands
Armenia
Denmark
Albania
Nepal
Estonia
Bosnia
Herzegovina
Morocco
Moldova,
Republic
of
Slovenia
Kyrgyzstan
Tunisia
Afghanistan
Tajikistan
Singapore
Azerbaijan
Switzerland
Turkmenistan
Qatar
Serbia
and
Montenegro
Algeria
Bulgaria
Georgia
Austria
Hungary
Slovakia
Croatia
Bangladesh
Norway
Sweden
Portugal
Finland
Greece
Czech
Republic
Turkey
Lithuania
Uzbekistan
Netherlands
Pakistan
Belarus
Egypt
Spain
Romania
Peru
Canada
France
Poland
Belgium
Macedonia,
the
former
Yugoslav
United
Kingdom
Italy
JapanRepublic of
Mauritius
Ukraine
Germany
Russian
Federation
Latvia
China
India
United States
0
5
10
15
20
25
Dim 1 (70.54%)
Figure 1 – Représentation des individus dans le premier plan principal
30
> plot(PCAN20, choix="var")
Variables factor map (PCA)
0.0
Agriculture
Other
−0.5
Waste
Transport
Production
Solvant
−1.0
Dim 2 (15.17%)
0.5
1.0
Fire
−2
−1
0
Dim 1 (70.54%)
Figure 2 – Cercle des corrélations
1
2
Étude de la photosynthèse chez la plante Echinochloa crus-galli
On souhaite étudier l’influence de facteurs environnementaux tels que la température et
la concentration en CO2 sur la photosynthèse de la plante Echinochloa crus-galli. Pour cela,
une expérience est réalisée sur 60 plantes. Chaque plante reçoit une dose de concentration en
CO2 , exprimée en ppm (parties par million) et est placée à une certaine température (variable
Traitement). Un indice de l’activité de photosynthèse est alors mesuré (variable Photosynt).
Dans cette expérience, on a considéré 5 doses de concentration en CO2 (95, 175, 250, 350 et
500) et 2 températures différentes (26°C : Trait1 et 12°C : Trait2). L’intensité lumineuse est,
elle, contrôlée de façon à rester constante. Certaines plantes n’ont pas survécu lors de cette
expérience. La table 1 donne la répartition du nombre de plantes entre les différentes doses et
les différents traitements.
95
175
250
350
500
Trait1 Trait2
6
4
5
4
6
5
6
6
5
5
Table 1 – Répartition du nombre de plantes entre les différentes doses et les différents traitements.
Partie I : On considère dans un premier temps que la variable Dose est une variable qualitative,
appelée CodeDose. On cherche à étudier l’influence des 2 facteurs CodeDose et Traitement.
5. Écrire le modèle, noté M1, correspondant à cette analyse en précisant l’ensemble des hypothèses du modèle et en donnant les gammes de variations des différents indices.
6. Écrire le modèle sous forme matricielle et préciser les dimensions des différents objets mis
en jeu.
Figure 3 – Graphes de diagnostic pour le modèle M1.
7. La figure 3 donne les différents graphes de diagnostic produits par le logiciel R pour le
modèle M1. Justifier le passage au modèle, noté logM1, correspondant à l’analyse des effets des deux facteurs sur le logarithme de l’indice d’activité de photosynthèse dont les
graphes de diagnostic sont donnés figure 4.
Les résultats de l’analyse du modèle logM1 sont donnés dans la Table 2.
8. Dans cette expérience, le dispositif est-il équilibré ? orthogonal ? Quelles en seront les conséquences ?
Figure 4 – Graphes de diagnostic pour le modèle Mlog1.
9. Donner l’expression de l’estimation de la variance résiduelle. À combien est-elle estimée ?
10. Donner les sommes des carrés du modèle, résiduelle et totale.
11. Donner les hypothèses H0 et H1 du test du modèle complet. Calculer la statistique de ce
test et conclure.
12. Justifier les degrés de libertés associés aux tests des effets Traitement, de CodeDose et de
leur interaction.
13. Quels sont les effets significatifs au niveau 5% ? Quelle est la différence entre les sommes
de carrés de type I et de type II pour le test de l’effet traitement ?
14. Comment interprétez-vous le résultat du test de l’interaction ?
15. Quelles sont les contraintes utilisées par le logiciel R pour l’estimation des différents
paramètres ?
16. Quelle hypothèse teste-t-on dans la ligne ”TraitementTrait2” du tableau Coefficient obtenu
par la commande R summary ? Quelle est la conclusion du test ?
On souhaite maintenant tester s’il existe une différence entre les deux traitements à dose
fixée et ce pour chaque dose. On note µij = E(Yijk ), l’espérance de l’indice de photosynthèse pour un traitement i et une dose j.
17. Ecrire les hypothèses H0 et H1 des différents tests que l’on cherche à faire en fonction des
µij .
18. Les résultats de ces tests sont donnés dans la table 3. Interpréter.
19. Donner l’expression de l’espérance de Yi.. en fonction des paramètres du modèle, ainsi
que l’expression de la moyenne d’un traitement ajustée aux différentes doses. Expliquer la
différence entre les deux.
Partie II : On cherche maintenant à tester si la relation linéaire entre l’indice de photosynthèse et la dose de concentration en CO2 est la même quel que soit le traitement. On considère
ici la variable dose comme une variable quantitative (Dose).
20. Écrire le modèle, noté logM2, dont les résultats sont donnés dans la table 4. Préciser
l’ensemble des hypothèses du modèle et donner les gammes de variations des différents
indices.
21. Ecrire les hypothèses H0 et H1 du test permettant de répondre à la question posée dans
cette partie et conclure.
22. Que vaut l’estimation du terme d’interaction ”Trait2*Dose”. Interpréter.
23. La concentration moyenne actuelle de CO2 dans l’air est de 390 ppm. Si on suppose que la
température est de 26°C, prédire l’indice de photosynthèse d’une plante dans ces conditions.
> summary(logM1)
Call:
lm(formula = logPhotosynt ~ Traitement + CodeDose + Traitement *
CodeDose, data = Don1)
Residuals:
Min
1Q
Median
-0.38625 -0.08959 -0.00860
3Q
0.09486
Max
0.35506
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
2.35368
0.07798 30.184 < 2e-16 ***
TraitementTrait2
-0.10995
0.12330 -0.892 0.377595
CodeDose175
0.22354
0.11566
1.933 0.060037 .
CodeDose250
0.47029
0.11028
4.265 0.000111 ***
CodeDose350
0.81047
0.11028
7.349 4.62e-09 ***
CodeDose500
1.39534
0.11566 12.064 3.11e-15 ***
TraitementTrait2:CodeDose175 -0.28904
0.17782 -1.625 0.111547
TraitementTrait2:CodeDose250 -0.37646
0.16905 -2.227 0.031375 *
TraitementTrait2:CodeDose350 -0.46853
0.16542 -2.832 0.007066 **
TraitementTrait2:CodeDose500 -0.86653
0.17261 -5.020 9.97e-06 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.191 on 42 degrees of freedom
Multiple R-squared: 0.8712, Adjusted R-squared: 0.8436
F-statistic: XXXX on 9 and 42 DF, p-value: 6.667e-16
> anova(logM1)
Analysis of Variance Table
Response: logPhotosynt
Df
Traitement
1
CodeDose
4
Traitement:CodeDose 4
Residuals
42
Sum Sq
2.8450
6.5500
0.9703
1.5323
Mean Sq F value
Pr(>F)
2.84498 77.9787 4.01e-11 ***
1.63750 44.8826 1.23e-14 ***
0.24257 6.6487 0.000307 ***
0.03648
> Anova(logM1)
Anova Table (Type II tests)
Response: logPhotosynt
Sum Sq Df F value
Pr(>F)
Traitement
3.4454 1 94.4368 2.618e-12 ***
CodeDose
6.5500 4 44.8826 1.230e-14 ***
Traitement:CodeDose 0.9703 4 6.6487 0.000307 ***
Residuals
1.5323 42
> Comparaison du modèle le plus simple avec le modèle proposé (anova(logM1.0,logM1))
Analysis of Variance Table
Model 1: logPhotosynt ~ 1
Model 2: logPhotosynt ~ Traitement + CodeDose + Traitement * CodeDose
Res.Df
RSS Df Sum of Sq
F
Pr(>F)
1
51 11.8976
2
42 1.5323 9
10.365 31.567 6.667e-16 ***
Table 2 – Analyse des résultats du modèle logM1.
Trait1,
Trait1,
Trait1,
Trait1,
Trait1,
95 - Trait2, 95
175 - Trait2, 175
250 - Trait2, 250
350 - Trait2, 350
500 - Trait2, 500
estimate
0.109951215
0.398987600
0.486406395
0.578481140
0.976479402
SE
0.1232951
0.1281320
0.1156610
0.1102785
0.1208040
df
42
42
42
42
42
t.ratio
0.89177
3.11388
4.20545
5.24564
8.08317
p.value
0.37760
0.00332
0.00013
0.00000
0.00000
Table 3 – Test de la différence entre les 2 traitements pour les différentes doses.
> summary(logM2)
Call:
lm(formula = logPhotosynt ~ Traitement + Dose + Traitement *
Dose, data = Don1)
Residuals:
Min
1Q
-0.40094 -0.07860
Median
0.00921
3Q
0.11277
Max
0.39906
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
1.9892609 0.0769051 25.866 < 2e-16 ***
TraitementTrait2
0.0172216 0.1168898
0.147
0.883
Dose
0.0034437 0.0002540 13.459 < 2e-16 ***
TraitementTrait2:Dose -0.0019146 0.0003745 -5.113 5.48e-06 ***
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1856 on 48 degrees of freedom
Multiple R-squared: 0.861, Adjusted R-squared: 0.8523
F-statistic: 99.1 on 3 and 48 DF, p-value: < 2.2e-16
> Anova(logM2)
Anova Table (Type II tests)
Response: logPhotosynt
Sum Sq Df F value
Pr(>F)
Traitement
3.4592 1 100.392 2.376e-13 ***
Dose
6.4980 1 188.584 < 2.2e-16 ***
Traitement:Dose 0.9007 1 26.141 5.483e-06 ***
Residuals
1.6539 48
Table 4 – Analyse des résultats du modèle logM2.