algorithmes de tirage
Transcription
algorithmes de tirage
ALGORITHMES DE TIRAGE Utilisent des nombres aléatoires uniformément répartis entre 0 et 1 z Qualités souhaitées: z z Sans remise z Séquentiel z Rapide z Respecte les probabilités d’inclusion z De taille fixe z Utilisable si N est inconnu z Etc. 1 Nombres au hasard z Un bon algorithme doit pouvoir réaliser des suites très grandes de nombres qui ont en apparence toutes les propriétés d’un n-échantillon de variables indépendantes et identiquement distribuées. z Procédés physiques z Loteries, z décimales de π, des logarithmes Procédés arithmétiques z Milieu du carré de Von Neumann (1946) 2 z Méthode de Lehmer : ri+1=ari (m) z choix z z z z z classiques: a=75 =16807 m=231-1 a= 216+3=65539 m=231-1 a=279470273 m=4294967291 ri+1 =(1664525ri+1013904223) (m = 232 (Numerical Recipes in C ) Tests d’ajustement et d’indépendance. 3 http://en.wikipedia.org/wiki/Image:Lcg_3d.gif#file http://en.wikipedia.org/wiki/Image:Lcg_3d.gif#file 4 Plans à probabilités égales sans remise z Tirage de Bernoulli: on tire N nombres aléatoires. L’unité i est retenue si Ui<π . Plan de taille aléatoire z Tri aléatoire : on garde les n premiers z Sélection-rejet si U1<n/N on prend l’unité 1. Puis n=n-1 et N=N-1. On sélectionne l’unité 2 si U2<n-1/N-1 Si U1>n/N, on passe à l’unité 2 avec N=N-1. On sélectionne l’unité 2 si U2<n/N-1 etc. z Pas aléatoires Tirer U et trouver s tel que CNn − s −1 U ≤ 1− CNn sélectionner l’unité s+1, faire N=N-s-1 et n=n-1 etc. z Tirage systématique 5 Probabilités inégales sans remise z Infinité de plans de sondage pour des π i fixés z Plus de 50 méthodes de tirage! Aucune ne satisfait tous les critères. z Quelques techniques simples: z Tirage avec remise et conservation des unités distinctes mais taille non fixe z Rejet de l’échantillon si il y a des doublons mais proba d’inclusion non proportionnelles aux xi 6 z Tirage successif sans remise: z On recalcule les probas d’inclusion après tirage de πi chaque individu. Si j est tiré: π' = i z Ne z 1−π j respecte pas les probas d’inclusion d’ordre 1 Tirage poissonnien: sélectionner i si Ui<πi z πij= πi πj variance simple z Mais taille non fixe, s=0 pas impossible z N peut être inconnu a priori z Ne pas utiliser si n petit 7 z Tirage poissonnien: exemple (S.Rousseau) 8 z Méthode de Rao, Hartley, Cochran z Tri aléatoire z Division en n sous ensembles de N/n unités z Tirage d’un seul individu dans chaque groupe à probabilité inégales proportionnellement à πi divisé par Πi = somme des π i du groupe z Estimateur de Horvitz-Thompson: n yi i =1 π i Π i Tˆ = ∑ z Variance 2 n ⎛ ⎞ ⎛ ⎞ Y 1 n ⎛ ⎞ 2 i ˆ ⎜ ⎟ 1 − Π − Vˆ (Tˆ ) = n T ⎜ ⎟⎜ ∑ i ⎜ ⎟ ⎟ πi ⎠ n − 1 ⎝ N ⎠ i =1 ⎝ ⎝ ⎠ 9 Sondage systématique à probabilités inégales z On cumule pour tous les individus les probabilités d'inclusion: z z z z z z Vk = π1+ π2 + ...+ πk On génére une seule réalisation u de la loi U[0,1[ On sélectionne k tel que Vk-1 ≤ u < V k puis i tel queVi-1 ≤ u + 1 < Vi puis j tel que Vj-1 ≤ u + 2 < Vj etc ... on obtient in fine n individus 10 Tirage systématique z Simplicité z Inconvénients: z certaines probabilités d’inclusion d’ordre 2 peuvent être nulles z Dépend de l’ordre du fichier z Tri aléatoire avant tirage? 11