imprimer

Module 110:

Tout expérimentateur est amené à se poser la question suivante:

L'estimation du paramètre d'une population (ex: la moyenne) dans un échantillon est-elle conforme à un modèle établi?

En disant cela on introduit la notion de test d'hypothèses.

Seuil de signification:

L'expérimentateur est amené à établir, suivant un seuil de confiance arbitraire, une limite afin de séparer ce qu'il considère comme des valeurs conformes (la zone de confiance) et des valeurs non conformes (la zone d'erreur de type I). Cette limite s'appelle le SEUIL DE SIGNIFICATION et a pour valeur Z1-alpha, c'est-à-dire la valeur de la table de Z qui correspond à une probabilité de 1-alpha.

alpha confiance et erreur de type

 

Un intervalle de confiance pose la question suivante :

Entre quelles limites, de part et d'autre d'une statistique d'un échantillon, le paramètre de la population se situe-t-il? (au risque alpha)

Pour répondre à cette question, l'expérimentateur va devoir définir ARBITRAIREMENT une limite (une frontière) entre la conformité (en vert) et la non conformité (en rouge) à un modèle.

Pour répondre à cette question, l'expérimentateur va devoir définir ARBITRAIREMENT une limite (une frontière) entre la conformité (en vert) et la non conformité (en rouge) à un modèle.

L'expérimentateur peut ainsi définir 3 types de limites arbitraires:

supérieur
Test unidirectionnel à droite:

Seuil Z(1-α)    Confiance 1-α

Ce cas permet à l'expérimentateur de mettre en évidence une augmentation du paramètre étudié:

"L'individu mesuré ou la moyenne de l'échantillon d'individus analysé sont-ils conformes ou plus grands que prévu par le modèle?"

inférieur
Test unidirectionnel à gauche:

Seuil Zα    Confiance 1-α

Ce cas permet à l'expérimentateur de mettre en évidence une diminution du paramètre étudié:

"L'individu mesuré ou la moyenne de l'échantillon d'individus analysé sont-ils conformes ou plus petits que prévu par le modèle?"

pas égal
Test bidirectionnel:

Seuil Z(α/2) et Z(1-α/2)    Confiance 1-α

Ce cas permet à l'expérimentateur de mettre en évidence une diminution ou une augmentation (et donc une différence) du paramètre étudié:

"L'individu mesuré ou la moyenne de l'échantillon d'individus analysé sont-ils conformes ou non (soit plus grands ou plus petits) au modèle?"

En rouge :

 

courbe alpha

Elle constitue une zone de faible probabilité. En général, elle équivaut à 5%, 1% voire 0,1% de la surface totale sous la courbe de Gauss.

Pour qu'une mesure ou une moyenne se retrouve dans cette zone, il faut que sa valeur soit très éloignée du centre de la distribution µ (ou 0 si on travaille avec des paramètres réduits) au point de dépasser la valeur seuil xa.

Si tel est le cas, il y a beaucoup de chances que cette mesure (ou cette moyenne) n'ait pas été obtenue par hasard. Il est fort probable que la mesure (ou la moyenne) provienne d'une autre population que celle prévue par le modèle H0 (population 1). En décidant que le modèle H0 est invalide il y a cependant alpha % de chances de se tromper. Cet alpha est très faible et donc le risque encouru est mineur.

 

Pour qu'une mesure ou une moyenne se retrouve dans cette zone, il faut que sa valeur soit très éloignée du centre de la distribution µ (ou 0 si on travaille avec des paramètres réduits) au point de dépasser la valeur seuil xa.

En vert :

alpha

Une valeur comprise dans cette zone de confiance est considérée par l'expérimentateur comme une valeur tout à fait conforme au modèle H0 décrivant la population d'origine centrée sur la moyenne µ.

Cette zone représente 95%, 99% voire 99,9% de la surface de la courbe de Gauss. La distance qui sépare µ d'une valeur observée dans cette zone n'est pas suffisante que pour être considérée comme non conforme (car inférieure à la distance séparant µ du seuil de signification).

Dans cette zone, l'expérimentateur doit admettre que la mesure (ou la moyenne) est conforme à la population centrée sur µ. Il n'a pas réussi à démontrer le contraire. Ce n'est pas pour autant que le modèle H0 est validé mais la valeur obtenue n'est malheureusement pas située en dehors des limites de la zone de confiance ce qui ne permet pas de postuler que l'échantillon proviendrait d'une autre population, centrée sur M.

1. Savoir d'où l'on part et ce qu'on souhaite démontrer:

Un expérimentateur a mesuré un chevaine de 3 ans et veut le comparer à la population de chevaines de 3 ans centrée sur µ. Son point de départ est de dire que l'individu est conforme à cette population: c'est l'hypothèse nulle H0. Ce qu'il veut démontrer est SOIT:

  1. que le poisson mesuré est plus petit que prédit par la normale et appartient à une population centrée sur µ1 plus petite que µ (en vert)
  2. que le poisson mesuré est plus grand que prédit par la normale et appartient à une population centrée sur µ1 plus grande que µ (en bleu)
  3. que le poisson mesuré est ou plus grand ou plus petit (DIFFÉRENT) que prédit par le modèle et appartient à une population centrée sur µ1 plus grande OU plus petite que µ (en orange)
H0: µ =µ1
H1:
  1. µ1 inférieure à µ
  2. µ1 supérieure à µ
  3. µ1 différente de µ

 

Population

2. Convertir la valeur observée en une valeur réduite:

L'expérimentateur a obtenu une taille pour le poisson capturé (ou une taille moyenne s'il en a capturé plusieurs). Pour faciliter sa prise de décision (Accepter le fait que ce poisson est normal [AH0] ou non [RH0]), il va réduire la valeur observée en une valeur réduite (z réduit, t réduit, ...).

production laitière

 

3. Rechercher dans les tables réduites correspondantes la ou les valeurs seuil:

En fonction du alpha déterminé par l'expérimentateur, il va définir un seuil de signification particulier.

supérieur
Test unidirectionnel à droite:

Z (1-α)

inférieur
Test unidirectionnel à gauche:

Z α

pas égal
Test bidirectionnel:

Z α/2 ou Z (1-α/2)

Exemple: Soit une différence à mettre en évidence pour un alpha de 5% (test bidirectionnel: d'où il y a 2 seuils à trouver Z 0,025 et z0,975) .

Dans la table de Student (pour rappel (module 70, page 5), la dernière ligne de la table de Student résume la table de Z pour cetaines probabilités, dont toutes celles nécéssaires pour les tests d'hypothèses classiques), on détermine la valeur de z0,975 (colonne 0,975, ligne z), qui est de 1,96. Par symétrie, on peut déduire le z0,025: -1,96

table de t de Student

Conclusion du test:

En comparant la valeur réduite des observations (z observé) avec la valeur seuil trouvée dans les tables, l'expérimentateur peut tirer une conclusion à son test.

Exemple: Soit une valeur de z observée de -1,84 pour un test bidirectionnel avec un alpha de 5%. Dans ce cas, -1,84 est compris entre -1,96 et 1,96.

La conclusion au test est la suivante: La mesure observée est normale et obéit aux conditions de l'hypothèse nulle (AH0).

Si la valeur observée n'était pas comprise entre -1,96 et 1,96, l'expérimentateur aurait pu conclure que la mesure observée était différente de la normale et ne répondait plus aux conditions de l'hypothèse nulle (RH0).

intégrale

 

Remarque:

Dans le cas d'un test bidirectionnel, RH0 signifie bien sûr la mise en évidence d'une différence de la valeur observée par rapport à la normale MAIS on peut aller plus loin. En effet, pour un même alpha MAIS pour un test unidirectionnel, on aura aussi un RH0. L'expérimentateur pourra donc dire qu'il y a une différence de la mesure mais aussi que celle-ci est plus grande ou plus petite que la normale.

intégral

ATTENTION: La conclusion inverse n'est pas vraie. Ce n'est pas parce qu'on observe un RH0 dans un test unidirectionnel avec un alpha déterminé qu'il y a RH0 pour un test bidirectionnel avec le même alpha.

Un écologiste étudie une population de chauves-souris de l'espèce Grand Rhinolophe. D'après la littérature, il sait que l'envergure de ces chiroptères obéit à une distribution normale dont la moyenne est de 375 mm pour une variance de 225 mm2.

Cet écologiste capture un individu dont la taille est de 350 mm. Cet individu est-il considéré comme conforme ou bien est-il significativement différent de ce que prévoit le modèle?

Les hypothèses:

H0: µ1 = µ (l'individu a une taille conforme)

H1: µ1 différent de µ (l'individu est non conforme)

Attention: "significativement" qualifie une confiance de 95%, par conséquent le alpha = 5%

Ou encore

Ho : M1 = M    H1 : M1 > M    H2 : M1 < M

Convertir la valeur observée en une valeur réduite:

X observé = 350 mm

z observé = (350-375)/15 (où 15 est l'écart-type de la population)

 

z observé = -1,66666667

Trouver le seuil de signification:

On sait que alpha vaut 5%. Le test est bidirectionnel (H1 ou H2). Le seuil de signification est donc z alpha/2 pour H2 et z (1-alpha/2) pour H1

Dans la table, on ne peut trouver que les probabilités P(Z<z) pour z positif. La borne supérieure de l'intervalle de confiance vaut 1,96. En utilisant la propriété de symétrie la borne inférieure vaut -1,96.

Conclusion:
z observé compris entre les bornes de l'intervalle de confiance

-1,96<-1,66666667<1,96

c'est-à-dire

z observé compris entre les bornes de l'intervalle de confiance

On accepte H0 (AH0) Cela veut dire qu'on n'a pas réussi à montrer que l'individu capturé était significativement (alpha de 5%) différent de la normale.

Un biologiste étudie l’envergure du Grand Rhinolophe. Dans la littérature, il trouve que l’envergure moyenne théorique µ est de 375 mm et la variance de 225 mm2.

1) Dans cette population, on capture un individu dont l'envergure est de 404,5 mm. Cette envergure est-elle anormalement grande pour la population de Grand Rhinolophe (alpha = 5%) ?

2) Dans cette population, on capture un individu dont l'envergure est de 409 mm. Cette envergure est-elle plus grande que celle attendue dans la population de Grand Rhinolophe (alpha = 5%) ? Qu'en est-il avec un intervalle de confiance de 99% ?

3) On a capturé une chauve-souris dans un ancien clocher désaffecté. Divers paramètres ont été mesurés. Vous disposez des moyennes et des écarts-types de ces paramètres pour la population de Grands Rhinolophes. Cet individu fait-il partie de cette population ou bien appartient-il à une population de chauves-souris significativement ou très significativement plus grande? Si non, en combien de points (énoncez-les) diffère-t-il de la population de Grands Rhinolophes?

  µ σ X observé Z observé Z0,95 Z0,99 CCL
               
Poids 26 4,5 35        
Longueur oreille 23 1,5 25,2        
Longueur avant-bras 57,5 1,75 58        
Longueur tête-corps 64 3,5 72        
envergure 375 12,5 404,1