Mathadonf de D. Strainchamps

Accueil > Cours magistraux > Btsa > Cours sur l’échantillonnage en Statistiques

Cours sur l’échantillonnage en Statistiques

vendredi 11 avril 2014, par mathadonf

DISTRIBUTION
D’ECHANTILLONNAGE ET ESTIMATION


Sommaire

I. Quelques définitions : 1

II. Notion d’Echantillon Aléatoire
Simple Indépendant (EASI) : 1

III. Distribution d’échantillonnage
d’un paramètre : 1

IV. Estimation ponctuelle 4

V. Estimation par intervalle de
confiance 5


I. Quelques définitions  :

Echantillonnage
 :
connaissant une population et ses caractéristiques, en déduire
les caractéristiques d’un échantillon d’effectif donné.

Estimation
 : a partir d’un échantillon, induire les caractéristiques de la
population dont il est issu .

L’intérêt
de l’estimation vient des problèmes suivants de la statistique
descriptive :

  1. on
    s’intéresse à de plus en plus de caractéristiques sur des
    populations de plus en plus importantes d’où une impossibilité
    matériel de mener de manière exhaustive l’étude de la population
    (exemple : intention de vote) .

  2. On
    s’intéresse à des caractéristiques dont le test (ou l’étude)
    entraîne la destruction de la population (exemple : durée de vie
    d’une lampe)

D’où la
nécessité de trouver des renseignements sur une population à
partir d’un échantillon de la population .

Comment
choisir un échantillon ?

II. Notion d’Echantillon Aléatoire Simple Indépendant (EASI) :

Aléatoire
 : la probabilité d’être choisi est la même pour chaque
individu de la population (On effectue un tirage sans remise dans une
population infinie ou pour préserver cette équiprobabilité on
effectue un tirage avec remise)

Simple
 : il y a la même probabilité pour chaque échantillon d’être
choisi.

Indépendant
 : les choix des individus sont indépendants .

Tirage au
hasard d’un échantillon : le hasard est une réalisation
expérimentale délicate d’où l’utilisation de l’informatique(touche
Ran de la calculatrice) ou d’une table de nombres au hasard .

III. Distribution d’échantillonnage d’un paramètre :

1- Exemple  :

On
considère 4 pièces de fabrication d’une usine (population) et on
s’intéresse à leur masse(Variable Aléatoire noté X)
qui est 332, 344, 336 et 340 grammes .

La moyenne
μ = 338 et l’écart-type σ
= 4,472


A partir
de cette population on construit tous les EASI possibles de 2
individus . il y en a 16


car le
tirage s’effectue avec remise pour préservée l’équiprobabilité


Le choix
du 1er individu d’un échantillon est fonction d’une
variable aléatoire notée X1

X1
= masse du premier individu

Le choix
du second individu d’un échantillon est fonction d’une variable
aléatoire notée X2

X2
= masse du second individu

Remarques
 : -
E(X1) = E(X2) = μ V(X1)=
V(X2) = σ²

- Xt
et X2 sont indépendantes

On
s’intéresse maintenant à la V.A. (V.A. Veut dire variable
aléatoire) Y = maximum(Xi et X2) et on construit sa loi
de probabilité :

yi

332

336

340

344

P(Y=yi)

On
a ainsi pu établir la loi de probabilité d’un paramètre (ici le
maximum) ainsi que sa moyenne et son écart-type au sein de
l’ensemble des échantillons d’une population : On a effectué une
distribution d’échantillonnage d’un paramètre .

E(Y)
=
yiP(Y=yi)
= 340,5 V(Y) = E(Y²) -[E(Y)]² = 115954-340,5²=13.75


On va
maintenant s’intéresser à la distribution d’échantillonnage de la
moyenne .


2- Notations

Pour
éviter toute ambiguïté dans les notations posons :

Population :
Effectif : Echantillon : Effectif : n

Moyenne
 : m| V.
A.
moyenne M

Ecart-type
 : s V.
A.
variance V

Fréquence
 : π V.
A.
fréquence F

3- Distribution d’échantillonnage de la moyenne

On
considère la variable :

M =

Xi
est la moyenne obtenue dans chacun des échantillons .




Calculons
E(M) et V(M) :

E(M) =




V(M) =




En général
dans les ouvrages on pose M =
.
On va définir maintenant la loi de probabilité que suit M
quand les Xi
(noté X)
suivent certaines lois :

Soit
une population P(N, μ, σ)
 ;

Si
X suit N (μ
, σ) alors
suit
N (μ ,
)

Si
X suit une loi quelconque et n >30
alors

suit N (μ ,
)

Si
X suit une loi quelconque et n<30 alors
on ne peut rien dire

Exemple : En une journée,
210 clients passent à une caisse dans un supermarché . En moyenne,
un client dépense 170 francs +/- 30 francs . Calculer la
probabilité pour que la caisse ait un montant supérieur à 36500
francs.

4- Distribution d’échantillonnage de la fréquence (fréquence ou proportion ou pourcentage)


Soit une population P dont les
individus possèdent la propriété A avec la fréquence π
.
Soit Y la variable aléatoire égale au nombre d’individus
possédant la propriété A dans un échantillon de taille n. Alors Y
suit une loi binomiale B(n ; π
) avec E(Y) = n π
et V(Y) = nπ ( 1 -π)

Si n> 30, on peut approcher la
loi de Y par N (n π ;
)


Soit F la fréquence d’individus
possédant la propriété A dans un échantillon de taille n, alors :

F
= Y/n
doncE(F) =
E(Y/n)= E(Y)/n
et V(F)
= V(Y/n) = 1/n²V(Y)


Si
n>30 on peut donc approcher la loi de F par N(
π
 ;
)

Exemple : On a remarqué que la
fréquence des naissances est de 516 garçons sur 1000 enfants . On
tire au hasard dans la population mondiale des échantillons de
taille n = 100 . Soit F la variable aléatoire égale à la fréquence
des garçons dans chaque échantillon . Quelle est la loi suivie par
F ? Donner un intervalle contenant 95% des valeurs de F et centré
sur p = 0,516 .

5- Distribution d’échantillonnage de la variance

Il faut utiliser une loi du KHI2
qui n’est pas au programme

IV. Estimation ponctuelle

Soit
P(N,m, s, p)etE(n,

,s,f) P population E échantillon


II s’agit d’estimer une
caractéristique de la population à partir de la caractéristique
d’un échantillon de celle-ci.

Exemple : μ
étant inconnue on va chercher sa valeur à partir de la valeur de

obtenue dans un

échantillon . On cherche un
estimateur de μ, (noté
)
qui satisfait aux propriétés suivantes :

lim E()
= μ et lim V()
= 0 quand
n tend vers + l’infini

Si
de plus E()
=
m alors
on dit que l’estimateur est dit sans biais


1- Estimation de la moyenne m


On
considère la VA.

=(
Xl+X2+....+Xn)/n

( X
a pour valeur
dans
l’échantillon considéré E)

Et
est
un estimateur sans biais de
m


Le
prouver







2- Estimation de la fréquence

Soit F la
V. A. définissant la fréquence dans un
échantillon .

E(F) =

V(F) =

Donc lim
V(F) =

donc F
est un estimateur ponctuel (sans biais) de π

3- Estimation de variance


Pas au
programme

V. Estimation par intervalle de confiance

On vient
de voir comment il est possible d’estimer à partir d’un échantillon
les caractéristiques d’une population . Il nous reste à déterminer
la précision de ces estimations .


Soit y
le paramètre de la population à estimer et
son
estimateur dans l’échantillon .


On accepte
de courir un risque de probabilité α

(ex : a
= 5%) de faire une erreur sur la précision de l’estimation
. Connaissant la loi de y on peut déterminer autour de la vraie
valeur y ,un intervalle [y-a ;y+b] tel que

P(y -a <
y< y + b ) = 1-α

a
 : risque d’erreur et 1-α
 : niveau de confiance


1- Estimation de moyenne

a) Cas
où n > 30

E(,
σ) risque a
.

Alors
suit
N (μ ,
)

On cherche
a (loi symétrique) tel que P(μ-
a <

< m
+ a)= 1-α

α
=5% ou

1%



Or
P(μ- a <
<
m + a)= P(-
a < m<

+
a)= 1-α

a
=


t se lit dans la table de la loi normale pour 1-
α/2

D’où
l’intervalle de confiance qui contient m :


Remarque
 :
on ne dit pas que l’intervalle ainsi construit a 95% (si a =5%
par exemple) de contenir μ :
la valeur de la moyenne de la population n’est pas aléatoire, c’est
la construction de l’intervalle qui l’est .

Exemple :
Soit l’échantillon n = 40 tel que

=3,2 . Soit s = 2 l’
écart-type de la population . Déterminer l’intervalle de confiance
à 95% de la moyenne μ de
la population .

Si s
est inconnu

On
remplace σ par

s est l’écart-type de l’échantillon

Exemple :
Soit X le poids supporté par un fil (on
suppose que X suit une loi normale) : on
tire un échantillon de 12 fils et on obtient :

=854,11 g et s2 = 4571,585 .

Donner
l’intervalle de confiance à 99% de la moyenne m
de la population

b) Cas
où n < 30
et X suit
toujours la loi normale
N (m
, s
)

A suivre

2- Estimation d’une fréquence

A
suivre