algorithmes de tirage

Transcription

algorithmes de tirage
ALGORITHMES DE TIRAGE
Utilisent des nombres aléatoires
uniformément répartis entre 0 et 1
z Qualités souhaitées:
z
z Sans
remise
z Séquentiel
z Rapide
z Respecte les probabilités d’inclusion
z De taille fixe
z Utilisable si N est inconnu
z Etc.
1
Nombres au hasard
z
Un bon algorithme doit pouvoir réaliser des suites
très grandes de nombres qui ont en apparence
toutes les propriétés d’un n-échantillon de
variables indépendantes et identiquement
distribuées.
z
Procédés physiques
z Loteries,
z
décimales de π, des logarithmes
Procédés arithmétiques
z Milieu
du carré de Von Neumann (1946)
2
z
Méthode de Lehmer :
ri+1=ari (m)
z choix
z
z
z
z
z
classiques:
a=75 =16807 m=231-1
a= 216+3=65539 m=231-1
a=279470273 m=4294967291
ri+1 =(1664525ri+1013904223) (m = 232 (Numerical Recipes
in C )
Tests d’ajustement et d’indépendance.
3
http://en.wikipedia.org/wiki/Image:Lcg_3d.gif#file
http://en.wikipedia.org/wiki/Image:Lcg_3d.gif#file
4
Plans à probabilités égales sans
remise
z Tirage
de Bernoulli:
on tire N nombres aléatoires. L’unité i est retenue si Ui<π .
Plan de taille aléatoire
z Tri
aléatoire : on garde les n premiers
z Sélection-rejet
si U1<n/N on prend l’unité 1. Puis n=n-1 et N=N-1. On
sélectionne l’unité 2 si U2<n-1/N-1
Si U1>n/N, on passe à l’unité 2 avec N=N-1. On sélectionne
l’unité 2 si U2<n/N-1 etc.
z Pas
aléatoires
Tirer U et trouver s tel que
CNn − s −1
U ≤ 1−
CNn
sélectionner l’unité s+1, faire N=N-s-1 et n=n-1 etc.
z Tirage
systématique
5
Probabilités inégales sans remise
z
Infinité de plans de sondage pour des π i
fixés
z Plus
de 50 méthodes de tirage! Aucune ne satisfait
tous les critères.
z
Quelques techniques simples:
z Tirage
avec remise et conservation des unités
distinctes mais taille non fixe
z Rejet de l’échantillon si il y a des doublons mais
proba d’inclusion non proportionnelles aux xi
6
z
Tirage successif sans remise:
z On
recalcule les probas d’inclusion après tirage de
πi
chaque individu. Si j est tiré:
π' =
i
z Ne
z
1−π j
respecte pas les probas d’inclusion d’ordre 1
Tirage poissonnien: sélectionner i si Ui<πi
z πij=
πi πj variance simple
z Mais taille non fixe, s=0 pas impossible
z N peut être inconnu a priori
z Ne pas utiliser si n petit
7
z
Tirage poissonnien: exemple (S.Rousseau)
8
z
Méthode de Rao, Hartley, Cochran
z Tri
aléatoire
z Division en n sous ensembles de N/n unités
z Tirage d’un seul individu dans chaque groupe
à probabilité inégales proportionnellement à πi
divisé par Πi = somme des π i du groupe
z Estimateur de Horvitz-Thompson:
n
yi
i =1 π i Π i
Tˆ = ∑
z Variance
2
n
⎛
⎞
⎛
⎞
Y
1
n
⎛
⎞
2
i
ˆ
⎜
⎟
1
−
Π
−
Vˆ (Tˆ ) =
n
T
⎜
⎟⎜ ∑ i ⎜ ⎟
⎟
πi ⎠
n − 1 ⎝ N ⎠ i =1
⎝
⎝
⎠
9
Sondage systématique à probabilités
inégales
z On
cumule pour tous les individus les probabilités
d'inclusion:
z
z
z
z
z
z
Vk = π1+ π2 + ...+ πk
On génére une seule réalisation u de la loi U[0,1[
On sélectionne k tel que Vk-1 ≤ u < V k
puis i tel queVi-1 ≤ u + 1 < Vi
puis j tel que Vj-1 ≤ u + 2 < Vj
etc ... on obtient in fine n individus
10
Tirage systématique
z Simplicité
z Inconvénients:
z certaines
probabilités d’inclusion d’ordre 2
peuvent être nulles
z Dépend de l’ordre du fichier
z Tri aléatoire avant tirage?
11