ACT-2003 : Modèles linéaires en actuariat - Pixel

Transcription

ACT-2003 : Modèles linéaires en actuariat - Pixel
ACT-2003 : Modèles linéaires en actuariat
NRC 80899
Automne 2014
Mode d'enseignement : Présentiel
Temps consacré : 3-1-5
Crédit(s) : 3
Préalables : ACT 2000 OU STT 4000
Régression simple et multiple : méthode des moindres carrés, théorème de
Gauss-Markov, multicolinéarité, modèles à variables explicatives qualitatives,
hétéroscédasticité, régression pondérée, analyse des résidus. Modèles
linéaires généralisés : modèles, inférence et validation. Estimation,
adéquation et prévision. Présentation et intégration de ces concepts dans un
contexte d'applications actuarielles.
Note importante: Il n'y aura aucun cours la première semaine, 2 cours lors de
la deuxième semaine, l'horaire normal reprendra à la 3e semaine.
Plage horaire :
Cours en classe
jeudi 13h30 à 16h20 PLT-2551
Atelier
mardi 09h30 à 10h20 CMT-2105
Du 2 sept. 2014 au 12 déc. 2014
Du 2 sept. 2014 au 12 déc. 2014
Il se peut que l'horaire du cours ait été modifié depuis la dernière
synchronisation avec Capsule. Vérifier l'horaire dans Capsule
Site de cours :
https://www.portaildescours.ulaval.ca/ena/site/accueil?idSite=54440
Coordonnées et disponibilités
Marie-Pier Côté
Enseignante
[email protected]
Disponibilités :
jeudi 16h30 à 17h20 PLT-2551
Soutien technique :
Du 11 sept. 2014 au 11 déc. 2014
Pour recevoir du soutien technique relatif à l'utilisation du Portail des Cours,
contactez :
Comptoir LiberT (FSG)
Pavillon Adrien-Pouliot, Local 3709
[email protected]
418-656-2131 poste 4651
Toutes sessions (du 1 janvier au 31 décembre)
Lundi
08h00 à 18h45
Mardi
08h00 à 18h45
Mercredi
08h00 à 18h45
Jeudi
08h00 à 18h45
Vendredi
08h00 à 16h45
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 1 de 9
Sommaire
Description du cours ......................................................................................................................... 3
Description sommaire ..................................................................................................................... 3
Objectifs ....................................................................................................................................... 3
Objectifs spécifiques ....................................................................................................................... 3
Déroulement du cours ..................................................................................................................... 3
Contenu ........................................................................................................................................ 3
Contenu et activités .......................................................................................................................... 4
Évaluations et résultats .................................................................................................................... 5
Consignes sur les examens .............................................................................................................. 5
Modalités d'évaluation ..................................................................................................................... 5
Informations détaillées sur les évaluations sommatives ....................................................................... 5
Examen partiel 1 ....................................................................................................................... 5
Examen partiel 2 ....................................................................................................................... 5
Travail pratique 1 ...................................................................................................................... 5
Travail pratique 2 ...................................................................................................................... 6
Détails sur les modalités d'évaluation ................................................................................................ 6
Politique sur les examens ................................................................................................................ 6
Échelle des cotes ............................................................................................................................ 7
Politique sur l'utilisation d'appareils électroniques ............................................................................... 7
Politique sur le plagiat et la fraude académique .................................................................................. 8
Étudiants ayant un handicap, un trouble d’apprentissage ou un trouble mental ....................................... 8
Matériel didactique ........................................................................................................................... 8
Matériel complémentaire ................................................................................................................. 8
Logiciels ........................................................................................................................................ 9
Médiagraphie et annexes .................................................................................................................. 9
Bibliographie ................................................................................................................................. 9
Annexes ........................................................................................................................................ 9
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 2 de 9
Description du cours
Description sommaire
Régression simple et multiple : méthode des moindres carrés, théorème de Gauss-Markov, multicolinéarité,
modèles à variables explicatives qualitatives, hétéroscédasticité, régression pondérée, analyse des résidus.
Modèles linéaires généralisés : modèles, inférence et validation. Estimation, adéquation et prévision.
Présentation et intégration de ces concepts dans un contexte d'applications actuarielles.
Les périodes intitulées "Atelier" correspondent à des périodes de dépannage.
Objectifs
1. Reconnaître les situations où les méthodes statistiques abordées en classe (régression et
modèles linéaires généralisés) peuvent être utiles comme instruments d'analyse et de
prévision.
2. Comprendre les fondements théoriques de la régression et des modèles linéaires généralisés.
3. Suggérer et critiquer un modèle pour l'analyse des données, faire l'estimation des
paramètres et s'en servir pour des fins prévisionnelles.
4. Se servir de Microsoft Excel ou de R pour effectuer les calculs nécessaires à l'analyse
de données et rédiger un rapport sur les résultats.
Objectifs spécifiques
À la fin du cours, l'étudiant devrait maîtriser les concepts énoncés dans le contenu du cours. Il devrait donc être
capable de réaliser les tâches suivantes :
1. Utiliser la régression linéaire simple à des fins d'analyse et de prévision.
2. Utiliser la régression linéaire multiple à des fins d'analyse et de prévision.
3. Utiliser les modèles linéaires généralisés à des fins d'analyse et de prévision.
4. Comprendre les différences entre les divers modèles linéaires et savoir choisir le modèle approprié selon
la situation.
Déroulement du cours
ATTENTION! Modification de l'horaire
Le cours du Jeudi 4 septembre n'aura pas lieu. Il sera reporté le vendredi 12 septembre, de 8 h 30 à 11 h
20
au local CMT-2102.
Contenu
1. Régression linéaire simple
Le modèle et les postulats.
Paramètres : estimation, propriétés, intervalles de confiance et tests d'hypothèses.
Distribution des résidus.
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 3 de 9
Intervalles de confiance pour la droite de régression et pour les prévisions.
Table d'analyse de la variance (ANOVA).
Évaluation de la qualité du modèle : Test F de Fisher, coefficient de détermination.
Vérification des postulats. 2. Régression linéaire multiple
Description du modèle et notation matricielle.
Paramètres : estimation, propriétés.
Interprétation géométrique de la régression.
Tests d'hypothèse sur les paramètres de la régression.
Prévisions et intervalle de confiance.
Table d'analyse de la variance (ANOVA) et coefficient de détermination multiple.
Test F de Fisher pour la validité globale de la régression.
Tests partiels F de Fisher.
Sélection d'un modèle de régression : critères, méthodes algorithmiques.
Analyse des résidus et validation de l'adéquation des modèles de régression.
Régression avec variables qualitatives.
Hétéroscédasticité et régression pondérée.
3. Modèle linéaire généralisé (GLM)
La famille exponentielle et ses cas particuliers
La famille exponentielle linéaire.
Fonctions de lien et predicteur linéaire.
Estimation des paramètres par la méthode du maximum de vraisemblance.
Algorithme de Newton-Raphson et "Fisher Scoring".
Tests d'hypothèses : statistique de Wald et rapport de vraisemblance.
Adéquation du modèle : Khi-carré de Pearson et Déviance.
Comparaison de modèles.
Résidus.
4. Modélisation de données de comptage
Régression Poisson et modèles log-linéaires.
Tableau de contingence.
Surdispersion. 5. Modélisation de données binomiales
Le modèle de régression logistique.
Cas Bernoulli.
Contenu et activités
Le tableau ci-dessous présente les semaines d'activités prévues dans le cadre du cours.
Titre
Date
Chapitre 1: Introduction
11 sept. 2014
Chapitre 2 - Régression linéaire simple.
• Le modèle et les postulats.• Paramètres : estimation, propriétés, intervalles de confiance
et tests d'hypothèses.• Distribution des résidus.• Intervalles de confiance pour la droite de
régression et pour les prévisions.• Table d'analyse de la variance (ANOVA).• Évaluation de
la qualité du modèle : Test F de Fisher, coefficient de détermination.• Vérification des
postulats.
11 sept. 2014
Chapitre 3 - Régression linéaire multiple
• Description du modèle et notation matricielle.• Paramètres : estimation, propriétés.•
Interprétation géométrique de la régression.• Tests d'hypothèse sur les paramètres de la
régression.• Prévisions et intervalle de confiance.• Table d'analyse de la variance (ANOVA)
et coefficient de détermination multiple.• Test F de Fisher pour la validité globale de la
régression.• Tests partiels F de Fisher.• Sélection d'un modèle de régression : critères,
méthodes algorithmiques.• ...
25 sept. 2014
Chapitre 4 - Modèle linéaire généralisé (GLM)
• La famille exponentielle et ses cas particuliers.• La famille exponentielle linéaire.•
Fonctions de lien et predicteur linéaire.• Estimation des paramètres par la méthode du
maximum de vraisemblance.• Algorithme de Newton-Raphson et "Fisher Scoring".• Tests
d'hypothèses : statistique de Wald et rapport de vraisemblance.• Adéquation du modèle :
Khi-carré de Pearson et Déviance.• Comparaison de modèles.• Résidus.
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 4 de 9
Chapitre 5 - Modélisation de données de comptage
• Régression Poisson et modèles log-linéaires.• Tableau de contingence.• Surdispersion.
Chapitre 6 - Modélisation de données binomiales
• Le modèle de régression logistique.• Cas Bernoulli
Note : Veuillez vous référer à la section Contenu et activités de votre site de cours pour de plus amples détails.
Évaluations et résultats
Consignes sur les examens
La calculatrice autorisée par l'École d'actuariat est permise à l’examen.
Modalités d'évaluation
Sommatives
Titre
Date
Mode de travail
Pondération
Examen partiel 1
Le 23 oct. 2014 de 13h30 à 16h20
Individuel
40 %
Examen partiel 2
Le 18 déc. 2014 de 13h30 à 16h20
Individuel
40 %
Travail pratique 1
Dû le 6 nov. 2014 à 13h30
En équipe
10 %
Travail pratique 2
Dû le 18 déc. 2014 à 13h30
En équipe
10 %
Informations détaillées sur les évaluations sommatives
Examen partiel 1
Date et lieu :
Mode de travail :
Pondération :
Matériel autorisé :
Le 23 oct. 2014 de 13h30 à 16h20, PLT-2551,PLT-2700
Individuel
40 %
calculatrice
Examen partiel 2
Date et lieu :
Mode de travail :
Pondération :
Matériel autorisé :
Le 18 déc. 2014 de 13h30 à 16h20, PLT-2751
Individuel
40 %
calculatrice
Travail pratique 1
Date de remise :
Mode de travail :
Pondération :
Remise de l'évaluation :
6 nov. 2014 à 13h30
En équipe
10 %
Boîte de dépot
Remise du rapport en classe ou au secrétariat, remise du code sur la boîte de
dépôt.
Directives de l'évaluation :
Équipes de 2 à 4 personnes
Veuillez lire l'énoncé du TP1. La grille de correction qui sera utilisée est disponible à titre indicatif. Les données à
utiliser sont contenues dans le fichier "Autoroute.csv".
Fichiers à consulter :
Énoncé TP1
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 5 de 9
Énoncé TP1
116,22 Ko, déposé le 10 oct. 2014
Grille de correction
10,41 Ko, déposé le 2 oct. 2014
Autoroute.csv
1,95 Ko, déposé le 2 oct. 2014
Informations supplémentaires :
Pour les intéressés, voici de la documentation sur LaTeX. C'est le logiciel de traitement de texte que j'utilise et
c'est beaucoup plus agréable à manier que Word pour les formules, les images et la structure du document. C'est
plus long au début, mais une fois qu'on est habitués, on ne peut plus s'en passer! Je vous conseille de télécharger la
version gratuite MikTeX et l'éditeur gratuit TeXNic Center.
Travail pratique 2
Date de remise :
Mode de travail :
Pondération :
Remise de l'évaluation :
18 déc. 2014 à 13h30
Le rapport est à remettre au secrétariat avant le début de l'examen final.
En équipe
10 %
Boîte de dépot
Remise du rapport au secrétariat, remise du code dans la boîte de dépôt.
Directives de l'évaluation :
Le travail doit être effectué en équipes de 2 à 4 personnes. Consulter l'énoncé du travail pratique pour les détails de
l'évaluation.
Fichiers à consulter :
TP2.pdf
217,17 Ko, déposé le 18 nov. 2014
T10PersistencyData.csv
29,6 Ko, déposé le 18 nov. 2014
T10previsions.csv
224 octets, déposé le 18 nov. 2014
AUTO.csv
5,24 Mo, déposé le 18 nov. 2014
profils2014.csv
521 octets, déposé le 18 nov. 2014
Grille de correction
11,76 Ko, déposé le 18 nov. 2014
Détails sur les modalités d'évaluation
L'évaluation de l'étudiant sera basée sur un examen partiel, un examen final ainsi que deux projets réalisés en
équipe de 2 à 4 étudiants.
Politique sur les examens
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 6 de 9
Révision de note ou de cote
Prière de consulter les articles 264 à 270 du Règlement des études en ce qui a trait aux révisions de note ou de
cote.
Pour toute révision de note, lorsqu'on indique que vous devez motiver votre demande, cela veut notamment
dire que vous devriez indiquer et expliquer pour quels numéros vous pensez pouvoir vous mériter une note plus
élevée. Cela ne veut cependant pas dire que le reste de l'examen ne sera pas revérifié. Une révision de note
entraîne généralement une recorrection de l'examen en entier. Il peut en résulter, pour l'ensemble de la
vérification, que la note monte, reste inchangée ou voire même baisse.
Pour toute révision de cote, lorsqu'on indique que vous devez motiver votre demande, étant donné que le
barème de conversion est fixe et connu d'avance, cela ne pourrait que vouloir dire que vous devriez justifier en
quoi vous considérez que la cote attribuée ne correspond pas au niveau d'atteinte des objectifs.
Échelle des cotes
Cote
% minimum
% maximum
Cote
% minimum
% maximum
A+
89,5
100
C+
62,5
64,49
A
84,5
89,49
C
59,5
62,49
A-
79,5
84,49
C-
56,5
59,49
B+
74,5
79,49
D+
53,5
56,49
B
69,5
74,49
D
50
53,49
B-
64,5
69,49
E
0
49,99
Politique sur l'utilisation d'appareils électroniques
L'utilisation d'appareils électroniques (cellulaire ou autre appareil téléphonique sans fil, pagette, baladeur,
agenda électronique, etc.) est interdite au cours d'une séance d'évaluation et de toute autre activité durant
laquelle l'enseignant l'interdit.
De plus, lorsque l'usage de la calculatrice est permis, alors seuls certains modèles de calculatrices sont
autorisés durant les séances d'évaluation.
Les modèles suivants sont autorisés :
Hewlett Packard
HP 20S, HP 30S, HP 32S2, HP 33S, HP 35S
Texas Instrument TI-30Xa, TI-30XIIB, TI-30XIIS, TI-36X, BA35
Sharp
EL-531*, EL-535-W535, EL-546*, EL-510 R, EL-520*
Casio
FX-260, FX-300 MS, FX-350 MS, FX-300W Plus, FX-991MS, FX-991ES
* Calculatrices Sharp: sans considération pour les lettres qui suivent le numéro
Dans tous ces cas, la calculatrice doit être validée par une vignette autocollante émise par la COOP étudiante
ZONE.
Dans tous ces cas, la calculatrice doit être validée par une vignette autocollante émise par la COOP étudiante
ZONE.
Information spécifique aux étudiants de l'École d'actuariat
Les calculatrices autorisées lors des examens sont uniquement les modèles répondant aux normes de la Society
of Actuaries et de la Casualty Actuarial Society pour leurs examens, soit les modèles Texas Instruments
suivants :
BA-35 (solaire ou à pile)
BA II Plus
BA II Plus Professional
TI-30Xa
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 7 de 9
TI-30X II (IIS ou IIB)
TI-30X MultiView (XS ou XB)
Politique sur le plagiat et la fraude académique
Règles disciplinaires
Tout étudiant qui commet une infraction au Règlement disciplinaire à l'intention des étudiants de l'Université
Laval dans le cadre du présent cours, notamment en matière de plagiat, est passible des sanctions qui sont
prévues dans ce règlement. Il est très important pour tout étudiant de prendre connaissance des articles 28 à
32 du Règlement disciplinaire. Celui-ci peut être consulté à l'adresse suivante:
http://www.ulaval.ca/sg/reg/Reglements/Reglement_disciplinaire.pdf
Plagiat
Tout étudiant est tenu de respecter les règles relatives au plagiat. Constitue notamment du plagiat le fait de:
i. copier textuellement un ou plusieurs passages provenant d'un ouvrage sous format papier ou
électronique sans mettre ces passages entre guillemets et sans en mentionner la source;
ii. résumer l'idée originale d'un auteur en l'exprimant dans ses propres mots (paraphraser) sans en
mentionner la source;
iii. traduire partiellement ou totalement un texte sans en mentionner la provenance;
iv. remettre un travail copié d'un autre étudiant (avec ou sans l'accord de cet autre étudiant);
v. remettre un travail téléchargé d'un site d'achat ou d'échange de travaux scolaires.
L'Université Laval étant abonnée à un service de détection de plagiat, il est possible que l'enseignant soumette
vos travaux pour analyse.
Étudiants ayant un handicap, un trouble d’apprentissage ou un trouble mental
Les étudiants qui ont une lettre d'Attestation d'accommodations scolaires obtenue auprès d'un conseiller du
secteur Accueil et soutien aux étudiants en situation de handicap (ACSESH) doivent impérativement se
conformer à la politique d'Accommodations scolaires aux examens de la Faculté des sciences et de génie qui
peut être consultée à l'adresse : http://www.fsg.ulaval.ca/fileadmin/fsg/documents/PDF/Politique-Facultaire-Accommodements.pdf
Matériel didactique
Matériel complémentaire
Practical Regression Analysis using R
Auteur : Faraway, J.J.
(2002)
http://cran.r-project.org/doc/contrib/Faraway-PRA.pdf
Extending the linear model with R : generalized linear, mixed effects and nonparametric
regression models
Auteur : Julian J. Faraway
Éditeur : Chapman & Hall/CRC (Boca Raton [u.a.], 2006)
ISBN : 158488424X
Applied linear regression
Auteur : Sanford Weisberg
Éditeur : Wiley-Interscience (Hoboken, N.J [u.a.], 2005)
ISBN : 0471663794
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 8 de 9
Logiciels
L'estimation des paramètres, le calcul de prévisions et l'analyse des résultats (aussi bien en régression qu'en
modèles linéaires généralisés) sont des procédures à forte composante numérique. Dans le cadre du cours,
l'étudiant sera donc appelé à utiliser le logiciel statistique R ainsi que le tableur Microsoft Excel. De nombreux
exemples numériques seront également résolus en classe.
Médiagraphie et annexes
Bibliographie
Agresti, A. (2013). Categorical Data Analysis. Third Edition. Wiley Series in Probability and
Statistics. Wiley, New Jersey, USA.
Draper, N. R. et Smith, H. (1998). Applied regression analysis. Wiley Series in Probability and
Statistics. Wiley, New Jersey, USA.
Faraway, J. (2002). Practical Regression and Anova using R. http://cran.r-project.org/doc/contrib/Faraway-PRA.pdf
Faraway, J. J. (2005). Extending the linear model with R : generalized linear, mixed effects and
nonparametric regression models. CRC press.
Galton, F. (1886). Regression towards mediocrity in heriditary stature. The Journal of the
Anthropological Institute of Great Britain and Ireland, 15:246–263.
McCullagh, P. et Nelder, J. A. (1989). Generalized linear models (Monographs on statistics and
applied probability 37). Chapman Hall, London.
Montgomery, D. C., Peck, E. A. et Vining, G. G. (2012). Introduction to linear regression analysis. 5th
Edition. Wiley Series in Probability and Statstics. Wiley, New Jersey, USA.
Weisberg, S. (1985). Applied linear regression. Second Edition. Wiley Series in Probability and
Mathematical Statistics. Wiley, New Jersey, USA.
Annexes
Annexes
© Université Laval
Mis à jour le 18 nov. 2014 15:33
Page 9 de 9