distribution d`echantillonnage

Transcription

distribution d`echantillonnage
DISTRIBUTION D’ECHANTILLONNAGE
• Le but est d ’étendre à la population entière des constatations
faites sur un échantillon en quantifiant les erreurs commises
On appelle taux de sondage le rapport n/N (n taille de
l ’échantillon, N taille de la population)
• On cherche le type de loi modélisant le mieux la distribution du
caractère observé. En supposant ce type connu on cherche à
attribuer la meilleure valeur pour chacun des paramètres, il s ’agit
alors de méthodes paramétriques offrant plusieurs possibilités:
-proposer pour chacun des paramètres une valeur (estimation
ponctuelle), ou une fourchette de valeurs (estimation par
intervalle de confiance)
-émettre à priori des hypothèses contradictoires sur la valeur
d ’un paramètre et retenir celle qui est la plus cohérente avec les
observations (test paramétrique)
Easy PDF Creator is professional software to create PDF. If you wish to remove this line, buy it now.
X VA dont la loi de probabilité dépend d’un paramètre inconnu par
exemple le paramètre ë pour une loi de Poisson
( X 1 , X 2 ,..., X n )
( x1 , x2 ,..., xn )
Estimer
un échantillon de taille n
une réalisation de cet échantillon
c’est lui attribuer une valeur θ̂ fonction de ( x1 , x2 ,..., xn )
θ̂ =f
( x1 , x2 ,..., xn )
Qui est une réalisation de T=f ( X 1 , X 2 ,..., X n )
θ̂
est une estimation ponctuelle de
T est un estimateur de
T est un estimateur sans biais si E(T)=
Easy PDF Creator is professional software to create PDF. If you wish to remove this line, buy it now.
Enquêtes par sondage
• Elles sont notamment utilisées en contrôle de production, en
gestion de stocks …
• PB :désigner la population « mère »
choix de la méthode pour l ’échantillon
recherche d ’un compromis entre les objectifs et les
moyens dont on dispose.
• Différents types de sondages
- Sondages aléatoires : utilisation des nombres au hasard ou
tirages systématiques.
-Échantillons empiriques : on impose à l ’échantillon d ’avoir
une structure identique à celle de la population mère
Easy PDF Creator is professional software to create PDF. If you wish to remove this line, buy it now.
• Exemple de modélisation : contrôle de qualité
Une machine produit des pièces caractérisées par leur diamètre
Soit X la VA modélisant le diamètre des pièces, posons
E(X)=m et σ( X) = σ
La loi de X est inconnue de même pour m et σ
On désigne par X la VA modélisant de diamètre moyen sur
les échantillons de taille n , une réalisation de X sur un
échantillon de taille n, notée x est considéré comme une
estimation ponctuelle de m. Les différentes moyennes
observées sur tous les échantillons de taille n constituent la
distribution d ’échantillonnage des moyennes.
Sur un échantillon (ω1 , ω 2 ,..., ω n ) , la suite ( x1 , x 2 ,..., x n )
des valeurs prise par X peut être considérée comme une suite
de n VA de même loi que X
n
n
∑i=1 X i
∑i =1 x i est une réalisation de la VA
X=
x=
n
n
Easy PDF Creator is professional software to create PDF. If you wish to remove this line, buy it now.
• D ’après le Th Central-limit (n suffisamment grand) X
suit une
σ
N(m,
)
n
Ce résultat permet la mise en œuvre de méthode
paramétrique concernant l ’étude de m (intervalle de
confiance), en utilisant éventuellement une estimation
ponctuelle de σ notée s.
La VA X est un estimateur du paramètre
m
1 n
De même un estimateur σ ² noté S² = n ∑ (X i − X )²
i =1
m
σ
population
x
s
échantillon
Easy PDF Creator is professional software to create PDF. If you wish to remove this line, buy it now.
Étude de la moyenne empirique
• Espérance variance
est la VA modélisant la moyenne sur les échantillons
de taille n
E( X ) = m
-Espérance
-Variance
Tirages avec remise
Tirage sans remise
σ²
n
N −n σ ²
V (X ) =
N −1 n
V( X ) =
Dans le cas de tirage avec ou sans remise (n ≥ 30) X
suit approximativement une
σ
N ( m,
n
)
Easy PDF Creator is professional software to create PDF. If you wish to remove this line, buy it now.
Variance empirique S²
• S² modélise la variance sur les échantillons de taille n
1 n
S² = ∑ (X i − X )²
n i =1
Tirage avec remise
E (S'²) = σ²
Tirage sans remise
E(S'²) =
N
σ²
N −1
Easy PDF Creator is professional software to create PDF. If you wish to remove this line, buy it now.
Fréquence empirique
• Soit p la fréquence d ’individu présentant la modalité M
dans une population de taille N
F modélise la fréquence d ’individus présentant M sur un
échantillon de taille n, dans le cas d ’un tirage sans remise
F suit H(N,n,p)
E(F)=p
V(F)= N − n p(1 − p)
N −1
n
Pour un tirage avec remise
p(1 − p)
E (F) = p
V (F) =
n
p(1 − p)
F → N(p;
)
n
Easy PDF Creator is professional software to create PDF. If you wish to remove this line, buy it now.