le management est il une sience
227 Estimation et échantillonnage 10 ESTIMATION ET ECHANTILLONNAGE « Rien n’est plus difficile à réfuter que ce qui est entièrement faux. » André MAUROIS MARCHE D’APPROCH 1. GENERALITES 1. 1. Méthodologie Pour étudier un cara deux méthodes : p g tian P on dispose de La méthode exhaustive qui consiste à recenser tous les individus de la population. Cette méthode, en raison de son coût et de sa durée, est fort peu employee.
La méthode des sondages qui consiste à n’étudier qu’un échantillon E, extrait de la population-mère, et à induire, à partir des résultats observés sur et échantillon des résultats concernant la population entière. La difficulté est d’obtenir un échantillon représentatif de la population. Nous admettrons qu’en réalisant un tirage au sort, cette condition est réalisée. 33 la population P, un échantillon aléatoire de taille n et désignons par K la variable aléatoire qui, à cet échantillon, associe le nombre des éléments qui possèdent le caractère C et par F la variable aléatoire qui, à cet échantillon, associe la fréquence f du caractère C. Alors F = . On suppose n petit par rapport à N donc K uit la 101 binon miale B(n, p). 3. 2. Distribution d’échantillonnage des fréquences Soit l’ensemble de tous les échantillons de taille n, issus de la population. Les fréquences fl, fi,… onstituent une série statistique appelé distribution des fréquences. Puisque K suit la loi binomiale B{n, p) nous savons que : E(K) = np et V(K) = npq où npq pq q = 1 —p. alors E 2 Le théorème de la limite centrée permet alors d’énoncer le résultat suivant, noté (P6): Si on prélève des échantillons aléatoires d’effectifs n, où n 30, dans une population 2 OF s a population par la fréquence f du caractère observé sur un échantillon. C’est la variable aléatoire, notée E, définie par E = p Alors, E(E) = p – E(F). r E(F) = p d’après (PE) donc E(E) = O. Par suite f est un estimateur sans biais de p. 3. 4. Intervalle de confiance La variable aléatoire F qui, à chaque échantillon de taille n, associe la fréquence f du caractère C dans cet échantillon, suit la loi normale N p, pq 234 Chapitre 10 suit la loi normale centrée réduite. Si ron fixe un seuil de risque a (donc un seuil de confiance 1 il existe un réel Alors la variable aléatoire T = nique ta (que l’on détermine à l’aide de la table de la loi normale centrée réduite) tel 3 OF s défectueux.
On se propose de calculer, au seuil de confiance 95%, entre quelles limites est compris le pourcentage de fruits défectueux dans l’envoi. | 0) Première méthode Soit respectivement p et f les fréquences de fruits défectueux dans renvoi et dans l’échantillon (p est évidemment inconnu). On sait que la variable aléatoire F qui, à tout échantillon de taille n, associe la fréquence de fruits défectueux dans réchantillon suit la loi normale N p, a) Démontrer que, au risque on a f-
PCI — p) b) En déduire que p vérifie l’inéquation : (n + 4) p – + 2)p+nf c) Appliquer ce résultat à l’échantillon ci-dessus et conclure. 20) Deuxième méthode. Dans le cours nous avons imation ponctuelle non 4 S suit la 101 normale N p, donc la 239 variable T définie par T – On sait que p(LIT2s 1 ,96) = 0,95, donc, au risque 5%, on a : pc 1 — p) f-pg 1,96 , soit en majorant 1,96 par 2 : f — p S 2 b) En élevant au carré les deux membres de l’inégalité précédente il vient (n +4) p- 2) p +nf<0. c) Pour l'échantillon initial on a f - 0,08 et n = 1000. Alors l'inéquation précédente S OF s