Notes de démographie

Transcription

Notes de démographie
Démographie
F RANCK A RNAUD
30 janvier 2009
Notes sur la démographie, mêlant à la fois théorie et pratique, sur données françaises.
Table des matières
1
Indicateurs démographiques
1.1 Fécondité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Mortalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2
2
2
Projections de population
2.1 Taux de fécondité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Taux de mortalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
7
7
3
Population stationnaire
3.1 Cas simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Cas réaliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
11
12
12
A Définitions
14
A.1 Concepts d’âge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
B Commentaires sur la mortalité annuelle
14
1
1
Indicateurs démographiques
1.1
Fécondité
– indicateur conjoncturel de fécondité
– descendance finale
Si on définit le baby-boom de façon arbitraire comme les années où l’ICF dépasse le seuil de 2 enfants par
femme (assez arbitraire), alors celui s’étend sur les années J1942; 1974K. Avec un seuil à 2.5 enfants par femme,
le baby-boom s’étend sur J1946; 1969K.
1.1.1
Diagramme de Lexis
1.2
Mortalité
Dans la suite, S désigne la variable aléatoire d’âge de décès. On commence par introduire la brique de base
de la morta
1.2.1
Quotients de mortalité
Soit qi les probabilités instantanées de décès :
q0 = P(S = 0) et ∀n ∈ N∗ , qn = P(S = n|S ≥ n) =
P(S = n)
P(S ≥ n)
Les (qi )i sont appelés quotients de mortalité.
Tables de mortalité Les tables de mortalité contiennent essentiellement les quotients de mortalité, même si
plusieurs autres informations qui en dérivent (espérance de vie, par exemple) sont fréquemment inclues.
Exemples Dans la figure 1 sont représentés les quotients de mortalité des hommes et des femmes pour
l’année 2005 : il s’agit des logit(qa ), pour faciliter la comparaison.
Plusieurs éléments sautent aux yeux :
– la mortalité des hommes excède celle des femmes, à tous les âges,
– le profil de la mortalité est proche entre hommes et femmes :
– forte décrue de la mortalité après la naissance,
– la mortalité atteint un point bas autour de 10 ans,
– puis une remontée progressive entre 10 et 20 ans,
– plateau entre 20 et 30 ans,
– puis remontée quasiment linéaire jusque 100 ans.
Une approche duale consiste à représenter, pour un âge donné, l’évolution de la mortalité au cours du
temps. Les graphiques de la figure 2 correspondent à cette approche ; on y lit que :
– la mortalité à 30 ans1 a connu un plateau jusque 1995, au lieu de la baisse constatée de façon générale :
ce plateau, qui a concerné hommes et femmes entre 20 et 40 ans, est dû à l’épidémie de Sida, bibliographie ?.
– la mortalité des femmes autour de 50 ans fléchit fortement, voire stagnerait sur une période relativement
récente. bibliographie ?
Tables de mortalité actuarielles Pour les besoins spécifiques des actuaires, des tables de mortalité particulières sont construites :
– Génération 1993 de ces tables : Table Prospective de Rente Viagère (TPRV) et Table Prospective par
Génération (TPG),
– Génération 2005 de ces tables : TGF05 et TGH05. Ces nouvelles tables sont distinguées par sexe. L’arrête
du 1er août 2006 impose l’emploi de ces tables à partir du 1er janvier 2008. Dans ces tables, on lit que 50
% des enfants nés en 2000 deviendront centenaires.
1 Pour des raisons de présentation, les données de ce graphique sont normalisées de sorte que les (logits des) mortalités soient égaux
en 1995.
2
Mortalité en 2005
−2
Logit
−4
−6
−8
Hommes
Femmes
−10
0
20
40
60
80
100
Âges
F IG . 1 – Quotients de mortalité pour l’année 2005
Mortalité à 30 ans
Mortalité des Femmes de 50 ans
−5.5
−6.6
−5.6
−6.8
Logit
Logit
−5.7
−7.0
−7.2
−5.8
−5.9
−7.4
−6.0
−7.6
−6.1
1970
1980
1990
2000
1970
F IG . 2 – Quotients de mortalité par âge
3
1980
1990
2000
Ces tables différent des tables démographiques générales de l’Insee, pour deux raisons :
– le format : les tables actuarielles sont indexées non pas par l’année et l’âge, mais par la génération et
l’âge ;
– le champ : les tables actuarielles sont construites sur des portefeuilles de rentiers2 de quelques assureurs.
Une telle procédure améliore la qualité des tables, car la mortalité des rentiers est moindre que celle de
la population générale.
1.2.2
Distribution de la survie
Soit pi = P(S = i) : ces probabilités dérivent des quotients de mortalité :
– p0 = P(S = 0) = q0 ,
– p1 = P(S = 1)P(S = 1|S ≥ 1)P(S ≥ 1) = q1 (1 − P(S < 1)) = q1 (1 − q0 ) = q1 q̄0 , où q̄0 = 1 − q0
– de même : p2 = q2 q̄1 q̄0
On montre par récurrence3 que :
Y
∀i ∈ N∗ , pi = qi
q̄j
j<i
Une condition suffisante pour que
Réciproquement, q0 = p0 et :
P
n∈N
pn = 1 est ∃n ∈ N / qn = 0.
∀i ∈ N∗ ,
qi = P
pi
j≥i
pj
Par conséquent, p et λp mennent au même q : pas injectif.
1.2.3
Espérance de vie
1.2.3.1 Espérances de vie verticale et diagonale Les espérances de vie sont construites à partir des quotients de mortalité. Mais plusieurs quotients sont à notre disposition, pour chaque âge : les quotients de l’année
et les quotients de la génération. Typiquement, pour examiner la mortalité des enfants de 10 ans en 2008, aucune ambiguité ; mais pour étudier la mortalité des enfants de 10 ans nés en 1998, il vaut probablement mieux
utiliser la mortalité de la génération 1998 que la mortalité de l’année 2008.
Conventionnellement, l’espérance de vie est calculée avec les quotients de moralité de l’année : c’est une
approche verticale dans le diagramme de Lexis. Ce faisant, avec une hypothèse de baisse des coefficients de
mortalité, on a tendance à sous-estimer l’espérance de vie, étant donné la diminution anticipée de la mortalité
à tous les âges, due aux progrès de la médecine (entre autres).
Pour lever toute ambiguité de définition, qualifions d’espérance de vie verticale l’espérance de vie ”classique”, et d’espérance de vie diagonale l’espérance de vie calculée avec les quotients de mortalité diagonaux
(connus ou estimés).
Étudions une autre conséquence de ce choix conventionnel : des événements ne sont pas pris en compte à
la bonne date. Par exemple, supposons que la canicule de l’été 2003 n’ait affecté que les personnes âgées d’au
moins 70 ans. Avec l’espérance de vie verticale, les personnes de 60 ans ont vu leur espérance de vie fortement
réduite en 2003. Avec l’espérance de vie diagonale, les personnes de 60 ans n’ont pas vu leur espérance de vie
modifiée, ce qui est normal car cet événement ne les a pas concernées. À l’inverse, l’espérance de vie verticale
en 2000 des personnes ayant eu 70 ans 2000 n’a pas été affectée, puisqu’on a utilisé les quotients de mortalité
de l’année 2000 : en réalité, il est certain que ces personnes ont affronté la canicule de l’été 2003 et donc que
leur espérance de vie a été affectée, ce que l’espérance de vie diagonale traduit bien.
2 Ce terme, sociologiquement connoté, est employé par l’Autorité de Contrôle des Assurances et des Mutuelles, dans son rapport
annuel 2006, qui inspire ces lignes.
3 On montre en effet que :
Y
X Y
q̄i
q̄j =
qi
∀n ∈ N∗ , 1 −
i<n
C’est une récurrence (faible) :
Y
X
q̄j
qi
1−
i<n+1
j<i
=
1−
X
i<n
qi
Y
j<i
q̄j − qn
Y
i<n
4
i<n
j<i
q̄i =
Y
i<n
q̄i − qn
Y
i<n
q̄i = q̄n
Y
i<n
q̄i =
Y
i<n+1
q̄i
1.2.3.2 Définition En input :
– quotients de mortalité : qs est le taux de mortalité à l’âge (ou la tranche d’âge) s,
– âge moyen à l’âge (ou la tranche d’âge) s.
L’espérance de vie à l’âge a est :
X
ps
− ma
Ea =
ms
P(S ≥ a)
(1)
s≥a
Cette écriture se simplifie avec :
P(S ≥ a) =
pa
P(S = a)
=
P(S = a|S ≥ a)
qa
D’où :
Ea =
qa X
ms p s − ma
pa
(2)
s≥a
Comme le montre la formule, qu’on prenne (ms )s ou (ms + 0.5)s (0.5 pour le milieu de la tranche d’âge), le
résultat est identique.
On peut aussi écrire Ea =
X P(S ≥ s)
sous l’hypothèse (souvent réalisée en pratique) que ms −ma = s−a.
P(S ≥ a)
s≥a
En effet, avec une (subtile) intervertion de somme4 :
Ea =
X
s≥a
ms
X
X
X P(S ≥ s)
ps
ps
ps
− ma =
=
=
(ms − ma )
(s − a)
P(S ≥ a)
P(S ≥ a)
P(S ≥ a)
P(S ≥ a)
s≥a
s≥a
s≥a
Pour calculer cela, on montre5 que :
s−1
Y
P(S ≥ s)
q̄i
=
P(S ≥ a) i=a
∀s ≥ a,
a
1.2.3.3 Sensibilité Comment un quotient de mortalité affecte l’espérance de vie ? Calculons ∂E
∂qn . Cette
dérivée partielle est nulle si a > n car qn n’intervient plus dans l’expression de Ea . Plaçons nous par conséquent
= 0, car P(S ≥ a) = 1 − P(S < a) qui dépend de
dans le cas a ≤ n. Commençons par remarquer que ∂P(S≥a)
∂qn
q1 , . . . , qa−1 et pas de qa . Donc :
X
1
∂ps
∂Ea
=
ms
∂qn
P(S ≥ a)
∂qn
s≥a
∂ps
Calculons alors
:
∂qn
4 Que



s < n =⇒






s = n =⇒






s > n =⇒


∂ps
=0
∂qn
Y
∂pn
pn
=
q̄j =
∂qn
qn
j<n
Y
qs
ps
∂ps
=−
q̄j = −
∂qn
q̄n j<n
q̄n
les pédants appellent ”théorème de Fubini” :
X
(s − a)ps =
s≥a
s
XX
1ps =
s≥a i=a
XX
i≥a s≥i
1ps =
X
P(S ≥ i)
i≥a
5 Par récurrence :
– Initialisation : P(S ≥ l|S ≥ l) = 1, P(S ≥ l + 1|S ≥ l) = 1 − P(S = l|S ≥ l) = q̄l
– Hérédité : soit s > a
P(S ≥ s + 1, S = s)
P(S ≥ s)
=
= P(S ≥ s + 1|S ≥ a) + P(S = s|S ≥ a)
P(S ≥ a)
P(S ≥ a)
Or P(S = s|S ≥ a) = P(S = s|S ≥ s)P(S ≥ s|S ≥ a) = qs P(S ≥ s|S ≥ a). Finalement :
P(S ≥ s|S ≥ a) · q̄s = P(S ≥ s + 1|S ≥ a)
5
D’où :
pa ∂Ea
qa ∂qn
X
=
ms
s≥n
mn p n X ms p s
∂ps
=
−
∂qn
qn
q̄n
s>n
mn p n
1 X
ms p s
−
qn q̄n
q̄n
=
s≥n
mn p n
pn (En + mn )
−
qn q̄n
qn q̄n
pn
= −
En
qn q̄n
=
=⇒
pa ∂Ea
qa ∂qn
Le terme de droite ne dépend pas de a mais uniquement de n. Finalement :
∂Ea
=
∂qn
(
−
q a pn
En
pa qn q̄n
0
pour
a≤n
si
a>n
1.2.3.4 Ajustement Comment ajuster les coefficients de mortalité pour cibler une espérance de vie ? Symétriquement, dans quelle mesure une multiplication de tous les quotients de mortalité affecte l’espérance de
vie ? Un développement limité répond à cette question. Modifions en effet les (qi )i en (λqi )i où λ = 1 + h est
proche de 1 de sorte que h → 0. Alors :
Y
pi ((1 + h)q) = (1 + h)qi ·
(1 − (1 + h)qi )
j<i
de sorte que :

pi ((1 + h)q)
= 1 + h · 1 −
pi (q)
X
j<i

qj 
+ o(h)
1 − qj
(3)
Soit ci le terme entre parenthèses du membre de droite6 . C’est une fonction décroissante de i : j > i =⇒ cj < ci .
En passant à l’espérance de vie :
Ei ((1 + h)q) − Ei (q) = −
qi X
h
mj pj (1 + ci − cj ) = −ai h + o(h)
pi j>i
où ai > 0.
Avec ce calcul, on détermine qu’il faut diminuer les quotients de mortalité des hommes de l’année 2005 de
2,8 % (environ) pour augmenter l’espérance de vie (verticale) à la naissance des hommes de 2,5 années. Pour
affiner ce diagnostic, il faudrait faire un développement limité au second ordre.
6 Je
ne suis pas parvenu à interpréter ce terme ou à simplifier son expression :
qj
P(S = j|S ≥ j)
P(S = j)
=
=
1 − qj
P(S > j|S ≥ j)
P(S > j)
La sommation sur les indices j < i n’autorise aucune simplification.
6
2
Projections de population
Les projections de population constituent des exercices de simulation prospective de la population à
long terme, habituellement 50 ou 100 ans. En France, c’est l’Institut National de la Statistique et des Études
Économiques (Insee) qui est chargé de leur réalisation, en collaboration avec d’autres établissements, comme
l’Institut National d’Études Démographiques (INED). Ces projections sont très utiles donner des exemples
d’application. Les projections de population se déclinent en projection de population actives, utilisées par
exemple pour étudier le financement de la protection sociale à moyen terme.
Les projections sont mises à jour régulièrement au vu des nouvelles données : typiquement, l’Insee a publié
des projections en 2002 basées sur le recensement de la population de 1999, mais a dû modifier ces prévisions
quatre ans après : les hypothèses choisies pour l’exercice de 2002, à propos de fécondité et de migration, ont
été ré-estimées. Les projections sont en effet basées sur deux piliers :
– une population pour l’année de base choisie,
– des hypothèses sur :
– la fécondité,
– la mortalité,
– les migrations.
Une projection de population ne consiste pas tant en une trajectoire précise de la population qu’en une trajectoire accompagnée d’indicateurs de sensibilité. Les projections sont en effet par définition fausses : la probabilité que la réalité corresponde exactement aux prévisions est nulle. Il existe deux façons de prendre en compte
cette incertitude :
– utiliser un argument statistique, en considérant non pas une évolution prévue de la fécondité mais une
distribution de probabilité sur l’évolution prévue de la fécondité (idem pour la mortalité et les migrations), et de projeter un grand nombre de fois la population en tirant au hasard des fécondités : cette
méthode produit une distribution de la population projetée, dont on peut retenir une caractéristique de
centralité (moyenne ou médiane) et un indicateur de dispersion (écart-type ou écart inter-déciles, par
exemple) pour chaque année.
– distinguer un scénario central et des variantes simples. Ce procédé est plus explicable. C’est ce qui a été
retenu par l’Insee.
2.1
Taux de fécondité
Idée : projeter deux indicateurs déduits taux de fécondité, et modifier à la marge la structure du taux de
fécondité pour se caler sur ces indicateurs.
2.2
Taux de mortalité
À l’inverse du taux de fécondité, on ne projette pas des indicateurs, mais plutôt les quotients de mortalité,
et des indicateurs dérivés comme l’espérance de vie s’en déduisent.
2.2.1
Méthodes de projection
Notons qat le quotient de mortalité à l’âge a pour l’année y (year) ; l’indice g réfèrera à la génération g =
y − a.
2.2.1.1 Méthodes basiques Il s’agit de régression sur une fonction du temps, de l’âge, ou de la génération.
Toutes les données ne sont pas exploitées simultanément, ce qui représente à la fois un avantage (les estimations sont basées sur plus de données), et un inconvénient (difficulté de modéliser beaucoup avec peu de
coefficients).
Pour fixer les idées sur le nombre de coefficients de chaque modèle, supposons qu’on dispose d’un tableau
rectangulaire de taux de mortalité, avec A âges et T années.
2.2.1.1.1
Méthode verticale Estimation année après année :
qay = αy + βy γya + εay
Ce modèle comprend donc 3Y paramètres.
7
(4)
2.2.1.1.2
Méthode horizontale
Estimation âge par âge :
qay = αa + βa γay + εay
(5)
Ce modèle comprend donc 3A paramètres. Sous une forme contrainte, cette méthode est utilisée au RoyaumeUni.
2.2.1.1.3
Méthode diagonale
Estimation génération par génération :
qay = αg + βg γgy + εay
2.2.1.2
Lee-Carter
(6)
Méthode un peu différente, qui exploite toutes les données. On suppose en effet que :
f (qay ) = αa + βa κy + εay
(7)
où (κy )y est un terme inobservable, traduisant l’évolution de la mortalité à tous les âges, f une transformation
x
), et εat sont indépendants N (0, σ 2 ). On cherche
adéquate des données (typiquement f = log ou f (x) = log 1−x
donc à résoudre le programme suivant :
X
2
min
(f (qay ) − αa − βa κy )
(8)
α,β,κ
ay
Ce programme comprend 2A + Y paramètres. Bien entendu, il n’est pas identifiable tel quel7 , mais le devient
avec un jeu d’hypothèses classiques tel que :
X
X
βa = 1
et
κy = 0
(9)
a
y
8
Je lui préfère toutefois une normalisation du facteur commun :
1 X 2
1 X
κy = 0
et
κ =1
Y y
Y y y
(10)
Plusieurs méthodes d’estimation sont envisageables :
– résoudre numériquement le programme d’optimisation (8) sous les contraintes (10),
– utiliser le premier axe d’une ACP (ou quelque chose comme ça),
– utiliser un algorithme EM qui itère entre :
– une phase Expectation d’inférence sur le processus κt à partir de paramètres α et β,
– une phase Maximization d’estimation des paramètres α et β à partir du processus κ inféré dans la
phase E précédente. Dans cette étape, il s’agit juste de lancer des régressions horizontales (âge par
âge). Notons que dans ce cas, on ne respecte pas exactement le modèle car εat
N (0, σa2 ), ce qui n’est
pas plus mal en soi !
Toutefois, cette méthode présente un inconvénient majeur : elle suppose en effet une certaine régularité de
l’évolution de la mortalité entre les âges, or cette hypothèse ne va pas nécessairement d’elle-même. Typiquement, en France, la population des 25-40 ans a connu une forte baisse de mortalité à partir du milieu des
années 90.
Cette technique pose aussi d’autres questions :
– âges élevés,
– homoscédasticité et non-corrélation des résidus.
2.2.2
Application
J’ai appliqué cette méthodologie sur la mortalité globale9 française des années 1962 à 2005, pour les âges 0
à 89 ans (la mortalité aux âges élevés n’est pas connue très précisément). L’estimation de κy est présenté dans
la figure 3. Sur la période d’estimation, κy semble décroı̂tre linéairement : Lee et Carter avaient déjà constaté
ce phénomène sur données US, et en déduisaient qu’ils pouvaient ajuster une marche aléatoire avec dérive
sur κy : ∆κy = c + uy . En procédant ainsi, on peut projeter κy dans le futur κ̂y+n = κy + nĉ où c n’est autre
que la moyenne des ∆κy . C’est ceci (avec son intervalle de confiance) qui est représenté sur la figure 3.
) génèrent les mêmes distributions.
(α, β, κ) et (α − µ, λβ, κ+λ
µ
: il faut ajouter un truc du style : κ décroissant, sinon (β, κ) et (−β, −κ) fournissent encore le même paramètre.
9 Par opposition à : par type de mortalité (accidents de la route, cancer, etc.).
7 Puisque
8 Attention
8
Prévision de quotients de mortalité
Facteur commun et prévision
−2
1
80
0
−4
70
−1
60
50
−6
−2
40
30
20
0
−3
−8
−4
−10
−5
10
−6
1960
1960
1980
2000
2020
1980
2000
2020
2040
2040
F IG . 4 – Projection de quotients de mortalité à certains âges
F IG . 3 – Projection de l’indice de mortalité κy
De cette projection de κ et ayant estimé αa et βa , on peut construire une projection des quotients de mortalité (enfin, leur log). De tels projections (ainsi que les estimations sur le passé, pour les confronter aux trajectoires réalisées) sont représentées sur la figure 4. La réduction de la mortalité infantile (courbe rouge), sur
le passé et donc en prévision, ressort nettement. La figure 5 présente les profils de mortalité pour plusieurs
années : la mortalité ne cesse de se réduire.
−2
−4
−6
−8
−10
1970
2000
2030
2060
0
20
40
60
80
F IG . 5 – Profils de mortalité en projection
9
2.2.3
Adaptation de Girosi et King
Girosi et King adaptent la méthode à la margeDonner la justification, en termes de variance. Ils proposent
d’estimer :
∆ log qay = γa + εay
(11)
où ∆ log qay = qay − qa,y−1 . Ensuite, ils factorisent γ sous la forme βa θ et θ s’interprète comme ∆κy . Ils proposent de normaliser par V(β) = 1 (en pratique, il suffit de prendre θ = −σ(β)).
Estimer (11) est aisé, par MCO. Pour comparer les résultats de Girosi-King à ceux de Lee-Carter, on peut
écrire log qay = αa + βa κ + uay en prenant
– pour αa la moyenne des (logay )y ,
– pour l’index de mortalité κy :
1 X log qay − αa
κy =
A a
βa
Par construction, la moyenne des différences premières de κy vaut nécessairement θ.
Construire des prévisions est immédiait. Connaı̂tre les intervalles de confiance de ces prévisions l’est
moins. En particulier, θ̂ a une variance difficile à estimer. La réponse générale consiste alors à prendre un
estimateur bootstrap, ce qu’on peut implémenter de deux façons :
– bootstrap fruste : en négligeant l’aléatoire des γ̂a . C’est l’approche que j’ai retenue10 .
– boostrap intégral : il faut revenir aux log qay et faire du bootstrap dessus.
Une fois cela effectué, on peut comparer les méthodes de Girosi-King et Lee-Carter :
– figure 6 : comparaison des index de mortalité κy :
– les estimations sont très proches sur le passé,
– les accroissements θ sont proches (projections parallèles),
– les différences de niveaux s’expliquent par les différences d’estimation du dernier point connu.
– figure 7 : comparaison des profils βa . Ils sont proches, mais différents. En particulier, GK est beaucoup
plus volatile que LC.
Comparaison des mortality indexes
Comparaison des profils de mortalité
6
Girosi−King
Lee−Carter
0.0
5
−0.2
4
−0.4
3
−0.6
2
−0.8
1
1980
2000
2020
2040
2060
0
F IG . 6 – Profils de mortalité
10 J’ai
20
40
60
F IG . 7 – Profils de mortalité
même fait encore plus simple : jacknife.
10
80
3
Population stationnaire
Étant données une fécondité et une mortalité constantes dans le temps (on suppose l’absence de migrations), comment évolue la population ? Il s’agit de mettre en évidence la population stationnaire, pour étudier
ses caractéristiques.
On procède en deux temps, pour clarifier :
– Dans un cas simple, sans distinction de genre : tous les individus sont hermaphrodites. Ce cas présente
toutes les étapes du raisonnement, mais pêche par sa simplicité.
– On enrichit ensuite en rétablissant l’inégalité fondamentale : seules les femmes ont des enfants. Aucune
difficulté conceptuelle ici, seulement un réalisme accru.
3.1
Cas simple
Notations :
– nta le nombre de personnes d’âge a l’année t,
– Mortalité : qa = P(S = a|S ≥ a) la mortalité à l’âge a (supposée constante dans le temps), q̄a = 1 − qa .
a−1
Y
q̄i ,
On montre que : sa = P(S ≥ a) =
i=0
– fa la natalité à l’âge a (nombre d’enfants par personnes d’âge a)
Les équations d’évolution de la population sont :
X
=
nt+1
fa nta et ∀t ∈ N, nt+1
= nta−1 q̄a−1
a
0
a
Normalisons nta par n0a : pta = nta /nt0 ; en régime permanent, pta ne dépend plus du temps (pta ≡ pa ), et les
équations s’écrivent :
X
nt+1
nt0
0
pa−1 q̄a−1
=
fa pa et ∀t ∈ N, pa = t+1
t
n0
n0
a
X
Par conséquent nt0 croı̂t à un taux constant, n = log
fa pa ; puis, par récurrence sur le second membre des
a
équations d’évolution : pa = p0 e−na
a−1
Y
q̄i . Comme p0 = 1, on a bien démontré que : pa = e−na sa .
i=0
Notons enfin que la population croı̂t au taux n, puisque :
X
X
X
nt =
nta = nt0
pta = nt0
pa
a
a
a
Si n ≥ 0, alors les classes d’âges sont de plus en plus petites : pa+1 = e−a sa+1
sa ≤ pa . On a donc plutôt une
structure de pays jeune. Le cas n < 0 est donc plutôt compatible avec des pays post-transition démographique.
Etude de la croissance démographique
s’écrit :
Le paramètre n ne dépend pas seulement de la fertilité, puisqu’il
X
n = log
fa e−na sa
a
Cette équation implicite n’admet pas de solution triviale. Il est évident que n croı̂t avec chacun des taux de
natalité, ainsi qu’avec les survies avant la fin de la fertilité 11 . Toutefois, on peut montrer que12 :
X
n > 0 si et seulement si
fa sa > 1
a
11 Une
diminution de la mortalité après la période de fertilité n’a aucun impact sur n. Á l’inverse, une diminution de la mortalité
infantile augmente le nombre de mères potentielles et donc n.
P
12 Il suffit d’écrire l’équation implicite sous la forme : f (n) = en −
−na s = 0. La fonction f est continue, croissante, et
a
a fa e
P
f (0) = 1 − a fa sa . Donc :
X
fa sa < 1 ⇐⇒ f (0) > 0 ⇐⇒ n < 0
a
11
Il apparaı̂t ainsi que c’est la mortalité aux âges de fertilité qui intervient. Par conséquent, il existe deux explications (non incompatibles) à une diminution de la population à long terme :
– une fertilité trop faible,
– une mortalité trop élevée aux âges des fertilité.
3.2
Cas réaliste
Il faut introduire des hommes et des femmes. La modélisation s’adapte aisément :
X
X
H0t+1 = (1 − λ) ·
fa Fat et F0t+1 = λ
fa Fat
∀a ∈ N∗ ,
Hat+1 =
a
t
H
Ha−1
q̄a−1
et
Fat+1 =
(12)
a
t
F
Fa−1 q̄a−1
(13)
où le paramètre λ désigne la probabilité qu’un bébé soit une fille, λ vaut donc environ 100/205=48.8%. On
t
déduit en particulier de (12) que H0t = 1−λ
λ F0 .
Notons F̄a =
Fat
F0t
supposé ne pas dépendre de t à l’état stationnaire, et n = λ
comme précédemment que
Pour les hommes : H̄a =
F0t+1
F0t
Hat
H0t
= en , puis F̄a = e−na sF
a.
P
a
fa F̄a alors on montre
t
= e−na sH
a , où H0 croı̂t aussi au taux n.
La population totale croı̂t donc au taux n. La proportion des hommes et des femmes à chaque âge est stable
(dans le temps) :
−1
Fat
1 − λ sH
F̄a
a
= 1+
=
Fat + Hat
λ sF
F̄a + H̄a
a
Aux âges faibles, λ <
1
2
implique qu’il y ait légèrement plus d’hommes que de femmes, et cette tendance
s’inverse ensuite en raison de la plus faible mortalité des femmes :
Hat
Fat
=
H
1−λ sa
,
λ sa
F
où
1−λ
λ
= 1.05 si λ =
100
205 .
La condition de croissance de la population s’écrit ici :
X
λ
fa sF
a ≥1
a
C’est la formulation exacte de l’expression : ”2.1 enfants par femme assurent le remplacement des générations”.
3.3
Application
Fixons les taux de mortalité à ceux connus pour 2003 à 2005, et la fécondité à celle de 2007, et faisons
évoluer la population à partir de celle connue en 2008. La pyramide des âges projetée en 2500 fait l’objet de la
figure 8. La population croı̂t au taux de n = −0, 1895% (bref, elle décroı̂t). Les hommes sont plus nombreux
que les femmes jusqu’à l’âge de 53 ans (inclus). La figure 9 compare les structures par âge des hommes, des
femmes, et de la population globale.
12
Pyramide des âges de l’année 2500
100
100
80
80
60
60
40
40
20
20
0
0
1
0
1
F IG . 8 – Pyramide des âges projetée en 2500
1.0
0.8
0.6
0.4
0.2
Tous
Hommes
Femmes
0.0
0
20
40
60
Âge
F IG . 9 – Structure par âge
13
80
100
A
A.1
Définitions
Concepts d’âge
Âge révolu
Âge au 1er janvier
Âge dans l’année
B
Commentaires sur la mortalité annuelle
B.0.0.0.1 Mortalité en 2003 Sur-mortalité due à la canicule d’août 2003. Affecte principalement les personnes âgées, et les femmes. Trouver une publication faisant le point sur ce sujet.
B.0.0.0.2 Mortalité en 2004 Faible mortalité, au regard du tendanciel13 . Explications potentielles :
– contrecoup de la sur-mortalité de l’année 2003,
– pas d’épidémie de grippe en 2004.
Néanmoins, l’Insee souligne que ces deux causes n’expliquent pas l’intégralité de la baisse14
B.0.0.0.3 Mortalité en 2005 Faible mortalité, au regard du tendanciel15 , malgré une forte épidémie de
grippe au début de l’année. 2005 compte 1,5 % de décès de moins que 2002, malgré une population plus âgée.
13 Source
: ”La situation démographique en 2004”, Insee Résultats, n˚ 55 Société, août 2006
l’Institut ne livre pas de chiffrage, sur l’importance relative des causes : mortalité, absence d’épidémie, inexpliqué. Il en a les
moyens techniques.
15 Source : ”Bilan démographique 2005”, Insee Première, n˚ 1059, janvier 2006
14 Mais
14

Documents pareils