imprimer

Module 130:

Les tests d'hypothèses vont permettre aux statisticiens de comparer des échantillons entre eux ou encore de comparer un échantillon avec une population de référence...

Types de tests d'hypothèses:

Dans le cadre de ces travaux pratiques, nous envisagerons trois types de tests d'hypothèses.

  1. test de comparaison d'une moyenne d'un échantillon par rapport à une population
  2. test de comparaison de 2 échantillons tirés de 2 populations indépendantes
  3. test de comparaison de 2 échantillons tirés de 2 populations pairées

Les tests 2 et 3 sont des cas particuliers qui peuvent être plus simplement traités par l'ANOVA.

Les hypothèses:

Quel que soit le type de tests (voir ci-dessus), il faut toujours prendre pour hypothèse de référence que les moyennes comparées proviennent d'une seule population de moyenne Mx. Il s'agit de l'hypothèse de départ appelée "hypothèse nulle" (H0) qui pourra s'écrire comme suit dans le cas d'une comparaison de deux moyennes:

H0: M1 = M2 = Mx


L'expérimentateur doit ensuite démontrer que les moyennes comparées ne proviennent pas de la même population, mais qu'une des populations possède une moyenne plus grande, plus petite ou tout simplement différente par rapport à l'autre population. Il s'agit de l'"hypothèse alternative" (H1) qui pourra s'écrire comme suit:

H1: M1 > M2 .

ou

H1: M1 < M2 .

ou encore

H1: M1 ≠ M2 .

 

Réalisation du test:

Réduction des moyennes observées:
La (les) moyenne(s) mx obtenue(s) pour (les) l'échantillon(s) peu(ven)t être réduite(s) en une valeur observée (z observée ou t observée). Celle-ci peut ensuite être comparée à une valeur seuil (z table ou t table).

En général, et pour la suite de l'exemple, on appellera M1 la moyenne de la population dont on pense que les individus proviennent, et M2 celle dont ils proviennent réellement.

Recherche d'une limite arbitraire, une valeur seuil:

La valeur seuil va déterminer sous la courbe de Gauss réduite des zones distinctes: une zone probable suivant H0 et une zone improbable suivant H0, vous devrez choisir dans les tables de Z ou de t de student une valeur seuil. En fonction du nombre d'hypothèses attendues (1 ou 2) et de la confiance 1-alpha (95%, 99%, ...).

Comparer la valeur réduite observée à la valeur seuil trouvée dans les tables:

Si l'hypothèse alternative H1 est "M2 plus grand que M1"

Lorsque la valeur observée (Z observée ou t observée) est plus grande que la valeur théorique (Z(1-alpha) ou t(1-alpha)), alors H1 est respectée (AH1)et H0 rejetée (RH0).

Lorsque la valeur observée (Z observée ou t observée) est plus grande que la valeur théorique (Z(1-alpha) ou t(1-alpha)), alors H1 est respectée (AH1)et H0 rejetée (RH0).

Dans le cas d'un rejet de H0 (RH0), l'expérimentateur aura réussi à démontrer que les moyennes observées sont telles que M2 est vraisemblablement plus grande que M1. Comme la valeur de alpha choisie par l'expérimentateur est faible (maximum 5%), un RH0 signifie que la distance qui sépare les moyennes comparées est trop élevée pour être simplement due au hasard. Le risque de se tromper lorsque RH0 est donc très faible. Un RH0 permet à l'expérimentateur d'être quasiment certain que M2 est bien plus grand que M1 avec un risque de se tromper équivalent à alpha.

Dans le cas d'une acceptation de H0 (AH0), rien ne permet à l'expérimentateur de dire que les moyennes sont différentes. Cette AH0 doit être considérée par l'expérimentateur comme une expérience non interprétable. A la différence de la "quasi certitude" au sujet de la conclusion tirée quand RH0, dans le cas d'une AH0, rien ne permet à l'expérimentateur d'être certain que les moyennes comparées

sont effectivement identiques.

 

Si l'hypothèse alternative H1 est "M2 plus petit que M1"

Lorsque la valeur observée (Z observée ou t observée) est plus petite que la valeur théorique (Z(alpha) ou t(alpha)), alors H1 est accéptée (AH1)et H0 rejetée (RH0).

Lorsque la valeur observée (Z observée ou t observée) est plus petite que la valeur théorique (Z(alpha) ou t(alpha)), alors H1 est acceptée (AH1) et H0 rejetée (RH0).

Dans le cas d'un rejet de H0 (RH0), l'expérimentateur a la "quasi certitude" que M2 est plus petit que M1 avec une probabilité de se tromper de alpha (maximum 5%).

Dans le cas d'une acceptation de H0 (AH0), l'expérimentateur n'a pas réussi à démontrer que M2 est plus petite que M1. Le doute est toujours possible.

Si l'hypothèse alternative H1 est "M2 différent de M1"

Lorsque la valeur observée (Z observée ou t observée) est SOIT plus petite que la valeur théorique (Z(alpha/2) ou t(alpha/2)), SOIT plus grande que la valeur théorique (Z(1-alpha/2) ou t(1-alpha/2)), alors H1 est respectée (AH1)et H0 rejetée (RH0).

Lorsque la valeur observée (Z observée ou t observée) est SOIT plus petite que la valeur théorique (Z(alpha/2) ou t(alpha/2)), SOIT plus grande que la valeur théorique (Z(1-alpha/2) ou t(1-alpha/2)), alors H1 est respectée (AH1)et H0 rejetée (RH0).

Dans le cas d'un rejet de H0 (RH0), l'expérimentateur a la "quasi certitude" que M2 est différent de M1 avec une probabilité de se tromper de alpha (maximum 5%).

Dans le cas d'une acceptation de H0 (AH0), l'expérimentateur n'a pas réussi à démontrer que M2 est différent de M1. Le doute est toujours possible.

Test de comparaison d'une moyenne d'un échantillon par rapport à une population standard

population 1

Principe:

Un échantillon est prélevé et sa moyenne est calculée (mx). Cet échantillon provient-il d'une population 1 déterminée de moyenne M1 (ou µ1) ou bien appartient-il à une seconde population appelée population 2 de moyenne M2? Autrement dit, cet échantillon est-il conforme à la population d'origine?

Les hypothèses:

Hypothèse nulle H0:

H0: M1 = M2 = mx
la moyenne de l'échantillon appartient à la population de référence de moyenne M1

Hypothèse alternative H1:

H1: M1 < M2 .
l'échantillon appartient à une population dont la moyenne M2 est supérieure à la moyenne M1 de la population de référence

ou encore

H1: M1 > M2 .
l'échantillon appartient à une population dont la moyenne M2 est inférieure à la moyenne M1 de la population de référence

ou encore

H1: M1 ≠ M2 .
l'échantillon appartient à une population dont la moyenne M2 est différente de la moyenne M1 de la population de référence

Calculer la valeur observée:

Cas 1: la variance de la population de référence est connue:

La réduction de la moyenne de l'échantillon peut se faire par le calcul d'une valeur de Z observée dont la formule est la suivante:

formule

Où mx est la moyenne de l'échantillon; Mx est la moyenne de la population de référence; VARx est la variance de la population de référence; n est la taille de l'échantillon.

Trouvez dans les tables de Z, la (les) valeur(s) seuil en tenant compte de alpha et de H1.

AH0 (et donc RH1)
L'échantillon de moyenne mx appartient à la population de référence dont la moyenne est M1
RH0 (et donc AH1)
L'échantillon de moyenne mx n'appartient pas à la population de référence dont la moyenne est M1 mais à une population dont la moyenne M2 est plus grande OU plus petite que celle de la population de référence de moyenne M1.

Cas 2: la variance de la population de référence est inconnue:

Dans ce cas, il n'est plus possible de calculer directement une valeur de z observée car il nous manque la valeur de la variance de la population de référence VARx.

Cependant, il est possible d'adapter cette formule en remplaçant VARx par une approximation de celle-ci. Cette approximation est donnée par l'estimateur de la variance de la population varx. La variable réduite ainsi obtenue n'est plus une variable z observée mais une variable t observée.

encore la formule

Où mx est la moyenne de l'échantillon; Mx est la moyenne de la population de référence; varx est l'estimateur de la variance de la population (autrement dit la SCE/(n-1) qui est une valeur propre à l'échantillon); n est la taille de l'échantillon.

Ensuite, il reste à trouver dans les tables de t de Student (l'aspect de la courbe est aussi une courbe de Gauss), la ou les valeurs seuil en tenant compte de alpha et de H1. La valeur de t de Student nécessite aussi la détermination d'un certain nombre de degrés de liberté. Pour trouver la ou les valeurs seuil, il faut donc rechercher:

tseuil;(n-1) degrés de liberté

Où "seuil" dépend de H1(α) ou H1 et H2 (α/2) et de la confiance 1-α choisie; n est la taille de l'échantillon

AH0 (et donc RH1)
L'échantillon de moyenne mx appartiendrait à la population de référence dont la moyenne est M1 jusqu'à preuve du contraire.
RH0 (et donc AH1)
L'échantillon de moyenne mx n'appartient pas à la population de référence dont la moyenne est M1 mais à une population dont la moyenne M2 est plus grande OU plus petite que celle de la population de référence, dont la moyenne est M1.

 

Test de comparaison de 2 moyennes provenant de 2 échantillons tirés de 2 populations indépendantes

Test de comparaisson de 2 moyennes provenant de 2 échantillons tirés de 2 populations indépendantes

 

Principe:

Un expérimentateur désire comparer les moyennes (m1 et m2) de deux échantillons composés d'individus distincts: les individus de l'échantillon 1 ne sont pas les mêmes que ceux de l'échantillon 2! Les deux échantillons sont indépendants.

La question est : les deux échantillons proviennent-ils d'une seule population de moyenne Mx ou proviennent-ils de deux populations distinctes de moyennes M1 et M2?

Cette analyse peut être réalisée par une ANOVA I à deux niveaux.

Les hypothèses:

Hypothèse nulle H0:

H0: M1 = M2 = Mx
les moyennes des échantillons appartiennent à une seule population de référence de moyenne Mx

Hypothèse alternative H1:

H1: M1 > M2 .
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 supérieure à la moyenne M2 de la population2

ou encore

H1: M1 < M2 .
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 inférieure à la moyenne M2 de la population2

ou encore

H1: M1 ≠ M2 .
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 différente de la moyenne M2 de la population2

 

Calculer la valeur observée:

Cas 1: les variances des populations 1 et 2 (VAR1 et VAR2) sont connues:

La réduction de la moyenne de l'échantillon peut se faire par le calcul d'une valeur de Z observé dont la formule est la suivante:

formule

Où m1 et m2 sont les moyennes des 2 échantillons; VAR1 et VAR2 sont les variances des 2 populations 1 et 2; n1 et n2 sont les tailles respectives des échantillons 1 et 2.

Trouvez dans les tables de Z, la ou les valeurs seuil en tenant compte de alpha et de H1.

AH0 (et donc RH1)
Les échantillons de moyenne m1 et m2 appartiennent à une seule population de référence dont la moyenne est Mx
RH0 (et donc AH1)
Les échantillons de moyenne m1 et m2 n'appartiennent pas à la même population de référence dont la moyenne est Mx mais appartiennent à 2 populations distinctes dont les moyennes respectives M1 et M2 sont telles que M1 est plus grande OU plus petite OU différente par rapport à M2.

Cas 2: les variances des populations 1 et 2 (VAR1 et VAR2) sont inconnues:

Dans ce cas, il n'est plus possible de calculer directement une valeur de z observée car il nous manque les valeurs de variances des populations de référence VAR1 et VAR2.

Pour pouvoir comparer les moyennes des 2 échantillons, l'expérimentateur va devoir remplacer les variances des deux populations indépendantes par les variances estimées des 2 échantillons, var1 et var2.

Une question préalable doit être posée: La variabilité des 2 échantillons est-elle comparable, homogène? En d'autres termes, il faut vérifier l'égalité des variances des 2 populations étudiées, c'est-à-dire l'homoscédasticité. En effet si les variances sont hétérogènes, la différence de variance risque d'être confondue avec une différence de moyenne.

2.1 : Test sur l'homogénéité des variances des échantillons comparés:

Réalisation du test:

H0: var1 = var2 Les variances des populations comparées sont homogènes

Pour 2 variances :

H1: var1 > var2

H2: var1 < var2


La variance 1 est plus grande que la variance 2

La variance 2 est plus grande que la variance 1

Pour réaliser ce test, l'expérimentateur établit le rapport Var max/Var min. Ce rapport est une valeur appelée F observé que l'on peut comparer avec une valeur F des tables de Fisher ( voir Module 125 : page 3 : Test de Fisher).

 

Fobservé = var1 / var2

si var1 plus grande que var2

 

L'expérimentateur va ensuite comparer cette valeur à une valeur théorique des tables de F de Fisher-Snedecor. Tester les hypothèses alternatives H1 et H2 en même temps implique la réalisation d'un test bidirectionnel. En général, ce test s'effectue avec une confiance de 95%. Ce test étant bidirectionnel, le seuil est fixé à alpha/2.

Fthéorique;(n1-1) dl; (n2-1)dl; 0,975

L'expérimentateur doit sélectionner la table où P(F < f) = 0,975.

Les degrés de liberté du numérateur (n1-1)dl correspondent à ceux de l'échantillon dont la variance est la plus grande. Ils permettent de rentrer en tête de colonne dans la table.

Les degrés de liberté du dénominateur (n2-1)dl correspondent à ceux de l'échantillon dont la variance est la plus petite. Ils permettent de rentrer en tête de ligne dans la table.

AH0 si Fobservé est plus petit que Fthéorique

Les variances des populations d'où sont issues les échantillons sont considérées comme homogènes et l'expérimentateur peut alors envisager de comparer les moyennes des populations d'où sont issus les échantillons.

RH0 si Fobservé est plus grand que Fthéorique

Les variances des populations d'où sont issues les échantillons sont considérées comme hétérogènes.

Il est alors IMPOSSIBLE de comparer par la suite les moyennes pour des échantillons dont les variances ne sont pas homogènes. Dans de nombreux cas, une transformation X'=log(x) ou X'=racine(x) permet d'homogénéiser les variances.

2.2 :Test de comparaison des moyennes des populations d'où proviennent les 2 échantillons:

CONDITION: Ce test d'hypothèses portant sur les moyennes n'est possible QUE SI l'homogénéité des variances des populations a été confirmée par le test détaillé au point précédent

Les hypothèses H0 et H1 sont celles décrites plus haut.

L'expérimentateur va ensuite calculer une valeur de t observé: Dans cette formule, par rapport à celle du Z observé détaillée ci dessus, on remplacera VAR1 et VAR2 par une seule variance appelée "variance résiduelle" Sr² obtenue à partir des variances des deux échantillons var1 et var2.

et une autre formule

Où m1 et m2 sont les moyennes des 2 échantillons; S2r est la variance résiduelle ; n1 et n2 sont les tailles respectives des échantillons 1 et 2, var1 et var2 sont les variances respectives des deux échantillons 1 et 2.

Ensuite, il reste à trouver dans les tables de t de Student (l'aspect de la courbe est aussi une courbe de Gauss), la ou les valeurs seuil en tenant compte de alpha et de H1. La valeur de t de Student nécessite aussi la détermination d'un certain nombre de degrés de liberté. Pour trouver la ou les valeurs seuil, il faut donc rechercher:

tseuil;(n1+n2-2) degrés de liberté

Où "seuil" représente H1 (seuil peut être (1-α) ou α ou (1-α/2) ou (α/2)); n est la taille de l'échantillon.

AH0 (et donc RH1)
Les échantillons 1 et 2 appartiendraient, jusqu'à preuve du contraire, à la population de référence dont la moyenne est Mx.
RH0 (et donc AH1)
Les échantillons 1 et 2 n'appartiendraient pas à la population de référence dont la moyenne est Mx mais à deux autres populations dont les moyennes M1 et M2 sont plus grandes OU plus petites que celle de la population de référence.

 

Test de comparaison de deux moyennes (observations pairées)

Principe:

Un expérimentateur dispose d'une série d'observations associées par paires ou par couples. Par exemple, une expérience a été menée sur des rats. Ils ont été pesés avant et après un traitement hautement énergétique. A chaque individu de l'expérience est associée une pesée avant et après le traitement.

Pour traiter ce genre de test, l'expérimentateur doit considérer la différence de chaque couple de données. Toutes ces différences forment un échantillon dont on peut calculer la moyenne mD et la variance varD.

A partir de ce moment, l'expérimentateur dispose d'une seule série de n observations, supposée par H0 prise dans une population de moyenne D, de variance inconnue estimée par SD, et souhaite éprouver H1 MD > D et ou H2 MD < D

Remarque :ce test peut être réalisé plus simplement par la technique de l'ANOVA II, avec un critère fixe à deux niveaux croisés et un critère aléatoire à n niveaux.

Les hypothèses:

Hypothèse nulle H0:

H0: MD = delta (=0)
la moyenne des différences de la population de référence et delta sont égales et nulles

NB: En général delta vaut 0: Il est rare que l'on souhaite tester une différence particulière, non nulle, mais c'est néanmoins réalisable.

Hypothèse alternative H1:

H1: MD > delta
la moyenne des différences de la population de référence est plus grande que delta
H1: MD < delta
la moyenne des différences de la population de référence est plus petite que delta
H1: MD ≠ delta
la moyenne des différences de la population de référence est non nulle

Calculer la valeur observée:

La réduction de la moyenne des différences peut se faire par le calcul d'une valeur de t observé dont la formule est la suivante:

Où mD est la moyenne des différences des données pairées; varD est la variance des différences des données pairées; n est le nombre de couples de données.

Trouvez dans les tables de t, la ou les valeurs seuil(s), en tenant compte d'alpha pour un test unidirectionnel ou bidirectionnel. Le nombre de degrés de liberté à employer est (n-1) dl où n est le nombre de couples de données.

tseuil, (n-1) dl; (1-α/2)

AH0 (et donc RH1)
la moyenne des différences de la population de référence est nulle
RH0 (et donc AH1)
la moyenne des différences de la population de référence est non nulle

La réalisation d'un test d'Analyse de la Variance est une matière complexe, qui fera l'objet de plusieurs autres modules indépendants.

Pour savoir si vous devez ou non les parcourir, veuilelz vous référer au programme de votre section ou de votre finalité.

  1. L'ANOVA 1 (module 140): principe, conditions d'utilisation, mise en oeuvre, interprétation et comparaison préalable des variances
  2. Tests complémentaires:
    1. Contrastes de Scheffé (module 150)
    2. Contrastes orthogonaux (module 160) (pas au programme du cours 2002-3)
  3. La régression dans l'ANOVA1 (module 170)
  4. L'ANOVA 1 aléatoire (module 180)
  5. L'ANOVA et les critères de classification (module 190)
  6. L'ANOVA2 croisée fixe (module200)
  7. L'ANOVA et les modèles (module 210)

 

  1. comparer une moyenne à un standard
  2. comparer deux échantillons issus de deux populations indépendantes
  3. comparer deux échantillons pairés

Comparer une moyenne à un standard:
H0: M1 = M2 = Mx
ou bien
1
H1: M1 plus grand que M2 .
2
H1: M1 plus petit que M2 .
3
H1: M1 différent de M2 .

 

 

 

 

Si la variance de la population standard (VARx) est connue<
Si la variance de la population standard (VARx) est inconnue<
1
Z tables; (1-alpha)
1
t tables; (n-1) dl; (1-alpha)
2
Z tables; (alpha)
2
t tables; (n-1) dl; (alpha)
3

Z tables; (alpha/2)

Z tables;(1-alpha/2)

3

t tables; (n-1) dl; (alpha/2)

t tables;(n-1) dl; (1-alpha/2)


Comparer 2 moyennes d'échantillons provenant de 2 populations indépendantes:
H0: M1 = M2 = Mx
ou bien
1
H1: M1 plus grand que M2 .
2
H1: M1 plus petit que M2 .
3
H1: M1 différent de M2 .

 

 

 

 

Si les variances des populations (VAR1 et VAR2) sont connues
Si les variances des populations (VAR1 et VAR2) sont inconnues
   
1
Z tables; (1-alpha)
1
t tables; (n1+n2-2) dl; (1-alpha)
2
Z tables; (alpha)
2
t tables; (n1+n2-2) dl; (alpha)
3

Z tables; (alpha/2)

Z tables;(1-alpha/2)

3

t tables; (n1+n2-2) dl; (alpha/2)

t tables;(n1+n2-2) dl; (1-alpha/2)


Comparer deux moyennes (observations pairées)
H0: MD = delta
la moyenne des différences de la population de référence est nulle
H1: MD est différente de delta
la moyenne des différences de la population de référence est non nulle

 

 

 

 

 

La variance de la population (VARD) est toujours inconnue
 
t tables, (n-1) dl; (1-alpha/2) avec n nombre de couples


 

les hypothèses:
H0: M1 = M2 = Mx
ou bien
1
H1: M1 plus grand que M2 .
2
H1: M1 plus petit que M2 .
3
H1: M1 différent de M2 .

 

 

 

1
H1: M1 plus grand que M2 .

AH0 si

Z observé plus petit que Z (1-alpha)

t observé plus petit que t (1-alpha)

RH0 si

Z observé plus grand que Z (1-alpha)

t observé plus grand que t (1-alpha)

 

2
H1: M1 plus petit que M2 .

AH0 si

Z observé plus grand que Z (alpha)

t observé plus grand que t (alpha)

RH0 si

Z observé plus petit que Z (alpha)

t observé plus petit que t (alpha)

 

3
H1: M1 différent de M2 .

AH0 si

Z observé compris entre Z (alpha/2) et Z (1-alpha/2)

t observé compris entre t (alpha/2) et t (1-alpha/2)

RH0 si

Z observé plus grand que Z (1-alpha/2)

t observé plus grand que t (1-alpha/2)

ou

Z observé plus petit que Z (alpha/2)

t observé plus petit que t (alpha/2)

 

1. Un laboratoire étudie l'influence d'un contraceptif X sur un groupe de 18 femmes de 25 ans. Chez la femme, au "jour 14 " du cycle menstruel, une augmentation de la concentration en LH (Luteinizing Hormone) induit l'ovulation. A ce stade précis, la concentration en LH est une v.a.N(14,5; 5,0625). Pour l'échantillon de 18 femmes, on obtient une moyenne de 13,03 mIU/ml et une variance de 6,32 (mIU/ml)². La prise du contraceptif X a-t-elle une influence (significative (alpha =5%) ou hautement significative (alpha =1%)) sur la concentration en LH et sur l'ovulation ? réponse


2. Des études comparatives sur la fécondité des femmes au sein de la communauté européenne ont été menées sur des femmes de 40 ans. Pour cela, un statisticien a réalisé deux échantillons: l'un (de 100 femmes) en France, l'autre (de 80 femmes), en Belgique. Il a obtenu une moyenne de 1,78 enfants / femme et une somme de carrés d'écarts (SCE) de 427,68 (enfants / femme)² pour l'échantillon français et une moyenne de 2,12 enfants / femme et une SCE de 281,24 (enfants / femme)² pour l'échantillon belge. Les femmes françaises sont-elles moins fécondes que leurs homologues belges? réponse


3. Dans une fabrication de boulons pour machines, l'ingénieur du contrôle-qualité trouve qu'un échantillon de taille n = 100 est nécessaire pour détecter des changements fortuits de 0,5mm dans la longueur moyenne du boulon fabriqué. Supposons qu'il souhaite une précision plus grande pour détecter un changement de 0,1mm seulement, avec les mêmes erreurs de type I et II. De combien doit-il augmenter la taille de son échantillon ? (c'est facile si on reformule le problème en terme d'intervalles de confiance. Pour construire un intervalle de confiance 5 fois plus précis, de combien doit-on augmenter la taille de l'échantillon ?) réponse


4. Des études de consommation ont été réalisées en Irlande et en Angleterre. Les dépenses en services médicaux et dépenses de santé représentaient, en 1985, respectivement 1,5% et 1% de la consommation totale des ménages. Sachant qu'en Europe, la variation des dépenses en services médicaux et dépenses de santé est de 1,9 (%²), combien de ménages doit-on étudier (alpha = 5%) dans ces deux pays pour montrer, dans 99% des cas, que la consommation totale en Irlande est supérieure à celle obtenue en Angleterre ? réponse


5. Pour deux catégories différentes de raisins (catégorie 1 et catégorie 2), on a observé l’acidité (pH) de 7 et de 11 grappes respectivement. On remarque que l’échantillon de la catégorie 1 a une acidité moyenne de 3.556 (variance 0.011) et celle de l’échantillon de la catégorie 2 est de 3.477 (variance 0.007). Testez si la différence est significative. réponse


6. Un procédé de fabrication courant a produit des millions de tubes T.V., dont la durée de vie moyenne est µ=1200 heures et l’écart-type σ = 300 heures. Un nouveau procédé, estimé meilleur par le bureau d’études, fournit un échantillon de 100 tubes avec une moyenne de 1265. Bien que cet échantillon fasse apparaître le nouveau procédé comme meilleur, s’agit-il d’un coup de chance de l’échantillonnage? réponse


7. Un enseignant réalise la même interrogation dans deux groupes de 17 étudiants d’une même section. Le groupe A obtient une moyenne sur 20 de 13,1 ± 4,16 et le groupe B obtient une moyenne de 10.8 ± 1,92. Les deux groupes sont-ils de force équivalente (avec un alpha de 5%)? Un troisième groupe (groupe C) de cette section de 17 individus est également testé et la moyenne obtenue vaut 9.8 ± 3.86. Le groupe C est-il moins fort que le groupe A (avec un alpha de 5% et de 1%)? En est-il de même par rapport au groupe B (avec un alpha de 5% et de 1%)? réponse


8. Un étudiant en biologie clinique désire comparer deux méthodes d'analyse des triglycérides sur 10 patients. Une moitié de chaque prélèvement est testée par la méthode A et il note une concentration moyenne de triglycérides de 102.3 mg/dl pour une variance de 7.68 (mg/dl)². L'autre moitié est testée par la méthode B et il observe une concentration moyenne de 107.5 mg/dl pour une variance de 6.23 (mg/dl)². En moyenne la différence enregistrée dans l'échantillon de 10 patients est de 3.75 mg/dl pour une variance de 13.2 (mg/dl)². Ces deux méthodes donnent-elles des résultats comparables avec un seuil de signification de 5%? Sinon, qu'en est-il à 1%? réponse


9. Un biologiste teste 2 techniques de mesure de température sur un troupeau de 30 vaches. La première technique utilise un thermomètre conventionnel au mercure et la seconde utilise un appareil à détection infrarouge à distance. Les 2 techniques donnent respectivement 38.7 ± 0.54 °C et 38.9 ± 0.64°C. La différence moyenne entre les deux techniques est de 0.16 ± 0.44°C. Quelles conclusions pouvez-vous tirer? réponse


10. Un physiologiste étudie l'influence du cadmium sur le taux de glucose dans le sang. Il remplit 2 bassins avec d'une part de l'eau de distribution et d'autre part de l'eau de distribution à laquelle on a ajouté une dose de 0.01mg de Cd par litre. 18 truites sont disposées dans ces 2 bassins et le taux de glucose dans le sang est mesuré après 2 heures d'incubation. Les résultats sont représentés dans le tableau ci-dessous:

 

bassin sans Cd ajouté

bassin avec 0.01mg Cd/l

différence avec/sans Cd

moyenne

86.6

91.2

4.6

variance

5.1

8.3

3.2

Les variances attendues dans le bassin sans Cd étant de 5 et de 10 dans le bassin traité, le cadmium augmente-t-il la glycémie chez les truites (faire le test avec un seuil de signification de 5% et de 1%)? réponse


11. Apparentée aux races anglaises KERRY, DEVON, JERSEY, GUERNESEY, la race BRETONNE PIE NOIRE a été façonnée par le climat et le sol bretons. Cette race est exploitée en Bretagne et dans les départements limitrophes. Elle reste, parmi les races françaises, une de celles ayant le mieux conservé ses caractères originels, l’impact des croisements ayant été faible au siècle dernier.

De récents croisements ont été réalisés afin d'accroître ses performances au niveau de leur production de viande. Ci-dessous, voici les résultats des tests effectués sur des individus provenant du croisement de cette race avec une race déterminée.

  échantillon Pie-Noire échantillon croisé SCE
pie noire vs croisement 1

moyenne = 601,66
variance = 181,53
nb individus = 18

moyenne = 611,57
variance = 258,54
nb individus = 18

SCEF = 884,08
SCER = 7481,18
pie noire vs croisement 2

moyenne = 598,13
variance = 192,55
nb individus = 18

moyenne = 609,19
variance = 294,43
nb individus = 18

SCEF = 1101,68
pie noire vs croisement 3

moyenne =595,85
variance = 142,48
nb individus = 18

moyenne = 622,24
variance = 514,10
nb individus = 18

SCEF = 6263,96
SCER = 11161,87

Les différents croisements donnent-ils des résultats plus performants que la race pure (alpha de 5% et 1%)? [Note: considérer chaque ligne du tableau comme une nouvelle expérience]


12. Une industrie pharmaceutique désire tester trois stimulants de l'appétit (S1, S2, S3) en mesurant la capacité d'absorption de nourriture chez le rat. Quatre groupes de 12 rats sont constitués: le premier servant de témoin, les trois autres recevant respectivement les stimulants S1, S2 et S3. On mesure la quantité de nourriture (en kg) ingérée sur un mois. Que peut-on conclure?

Témoin
S1
S2
S3
Moyennes
2,90
4,11
5,14
5,56
Variances
2,11
0,99
0,35
1,05

On sait aussi que la variance factorielle est de16,90 et la variance résiduelle est de 1,13.


13. Un ornithologue s'intéresse à l'évolution d'une espèce d'oiseaux répartie dans trois sites géographiquement distincts A, B et C, et plus particulièrement aux différences morphologiques engendrées par les mécanismes d'isolement. A cet effet, il a mesuré la longueur des ailes (en mm) de 10 oiseaux capturés sur chaque site. Les barrières géographiques ont-elles engendré des différences morphologiques sur cette espèce?

A
B
C
Moyennes
71,2
74,4
72,6


On sait que la variance résiduelle: 4,31. [On considère que les échantillons sont comparables au niveau de la variabilité entre échantillons]


14. Douze parcelles de terrain sont divisées aléatoirement en 3 groupes. Le premier sert de témoin, les deux autres sont fertilisés respectivement avec les engrais A et B. Les rendements observés sont les suivants. Les engrais affectent-ils la production?

  Témoin A B
Moyennes 61 70 73
Variances 20,6 14 17,3

On sait que la variance expliquée est de 156 et que la variance non expliquée est de 17,3.


15. Pour définir l'impact de la nature du sol sur la croissance d'une plante X, un botaniste a mesuré la hauteur des plantes pour 4 types de sol. Pour chaque type de sol, il disposait de 3 réplicats.

Type de sol

  I II III IV
  15 25 17 10
  9 21 23 13
  4 19 20 19
Moyennes 9,33 21,67 20,00 14,00
variances 30,33 9,33 9,00 21,00

Sachant que la variance expliquée par la nature du sol est de 96,31 et que la variance résiduelle est de 17,42, que peut-on conclure sur cette expérience? [source: http://www.obs-vlfr.fr/~enseigne/maitp6/solution_anova/anvexo1.htm]

16. Dans le cadre d'une étude écotoxicologique, la concentration en DDT et en ses dérivés a été mesurée chez des brochets de différents âges. Les résultats obtenus sont donnés, dans le tableau ci-dessous pour des échantillons de 11 individus chacun.

  2 ans 3 ans 4 ans 5 ans 6 ans
moyennes 0,18300 0,33763 0,45113 0,70738 1,19750
variances 0,00035 0,00106 0,00024 0,00045 0,00125

Sachant que la variance expliquée par l'âge des brochets est de 1,260770 et que la variance résiduelle est de 0,000672, que peut-on conclure sur cette étude? [source:http://www.obs-vlfr.fr/~enseigne/maitp6/solution_anova/anvexo3.htm]


 

1. Concentration en LH:

Test de conformité d'une moyenne (test de Z Unidirectionnel)

H0: µ1 = µ0

H1: µ1 < µ0

zobservé = -2,77

Pour α=5%, Ztables = -1,64, donc on conclut RH0 car zobservé inférieur à Ztables

Pour α=1% Ztables = -2,33, donc on conclut RH0 car zobservé inférieur à Ztables

Conclusion: La prise du contraceptif X provoque une diminution hautement significative de la concentration en LH. L'ovulation ne peut avoir lieu. [retour aux énoncés]


2. Fécondité en France et en Belgique:

Homogénéité des variances:

H0: σ²1 = σ²2

H1: σ²1 ≠ σ²2

Fobs= (427,68/99) / (281,24/79) = 1,21

F0,975; 99dl; 79dl = 1,53

Fobs < F0,975; 99dl; 79dl donc il y a AH0 -> On n'a pas pu montrer que les variances étaient différentes. Le test d'hypothèses portant sur les moyennes est donc réalisable.

Test d'hypothèses:

Comparaison de 2 moyennes tirées d'échantillons indépendants (test de t unidirectionnel à gauche si nous prenons les femmes belges comme référence)

H0: µB = µF

H1: µB > µF

Sr²obs=( 427,68+281,24)/(100+80-2) = 3,98

tobs = (1,78-2,12)/(3,98*(1/100+1/80))0,5= -1,136      NDLR: X0,5= racine de x

t0,05; 178dl = -1,653

tobs supérieur à t0,05; 178dl donc conclusion: AH0, nous n'avons pas pu montrer que les femmes françaises étaient moins fécondes que les femmes belges

[retour aux énoncés]

 

3. Les boulons:

Test unidirectionnel à droite (par exemple) avec une valeur critique

µ + valeur des tables*ET/(n)0,5

Rendre l'intervalle de confiance 5 fois plus petit signifie que la valeur critique devient:

µ + valeur des tables*ET/(n)0,5 * (1/5)

ou encore:

µ + valeur des tables*ET/(25*n)0,5

et donc, l'échantillon doit être 25 fois plus grand. Soit 2500 pièces pour être sûr de voir une augmentation de l'écart à la normalité.

[retour aux énoncés]

 

4. Consommation en Irlande et en Angleterre:

Sur base de l'énoncé on peut postuler : µ0 = 1%; µ1=1,5%; S²=1,9%²

La consultation de la dernière ligne de la table de Student nous donne les valeurs de z suivantes :
Z1-alpha = Z0,95 = 1,645
Z1-beta = Z0,99 = 2,326

En appliquant la formule disponible dans votre formulaire :

Calcul du nombre de ménage

En prenant 120 ménages dans les deux pays étudiés, nous pourrons voir cette différence de dépenses.[retour aux énoncés]


 

5. Les raisins:

Test de comparaison de 2 moyennes tirées de 2 populations indépendantes.

1°) Test de l’homogénéité des variances

H0: σ²1=σ²2

H1: σ²1 différent de σ²2

Fobservé = 0.011/0.007 = 1.57

 

Ftables (6 dl; 10 dl; 0.975) = 4.07

Fobservé inférieur à Ftables donc on conclut AH0 (je n’ai pas pu montrer l'hétérogénéité des variances)

2°) Comparaison des moyennes:

H0: µ1 = µ2

H1: µ1 différent de µ2

tobservé = 1.77

avec Sr²observé = 0.0085

 

ttables (16 dl; 0.975) = 2.12

tobservé inférieur à ttables donc on conclut AH0 pour α=5%.

[retour aux énoncés]

 

6. Un procédé de fabrication de tubes T.V.

Test de conformité d'une moyenne (test de Z Unidirectionnel)

H0: µ1=µ0

H1: µ1 supérieur à µ0

Zobservé= 2.17

5% Ztables = 1.64 RH0 car Zobservé supérieur à Ztables

Conclusion: Le nouveau procédé de fabrication possède une durée de vie significativement plus importante que l’ancien procédé.

[retour aux énoncés]


7. Un enseignant et ses groupes d’étudiants:

Test de comparaison de 2 moyennes tirées de 2 populations indépendantes.

A. Entre A et B:

1°) Test de l’homogénéité des variances

H0: σ²A = σ²B

H1: σ²A différent de σ²B

Fobservé = 4.69

 

Ftables (16 dl; 16 dl; 0.975) = 2.76

Fobservé supérieur à Ftables donc on conclut RH0 (les variances ne sont pas identiques)

Impossible de comparer les moyennes tirées d’échantillons dont les variances sont hétérogènes.

B. Entre A et C:

1°) Test de l’homogénéité des variances

H0: σ²A = σ²C

H1: σ² différent de σ²C

Fobservé = 1.16

 

Ftables (16 dl; 16 dl; 0.975) = 2.76

Fobservé inférieur à Ftables donc on conclut AH0 (les variances sont homogènes)

2°) Comparaison des moyennes:

H0: µA = µC

H1: µA supérieur à µC

tobservé = 2.39

avec S²observé = 16.0998

 

ttables (32 dl; 0.95) = 1.697

ttables (32 dl; 0.99) = 2.457

Le groupe A possède une moyenne significativement plus grande que la moyenne du groupe C. Ce test n’est pas hautement significatif.

C. Entre B et C:

1°) Test de l’homogénéité des variances

H0: σ²B = σ²C

H1: σ²B différent de σ²C

Fobservé = 4.04

 

Ftables (16 dl; 16 dl; 0.975) = 2.76

Fobservé supérieur à Ftables donc on conclut RH0 (les variances ne sont pas identiques)

Impossible de comparer les moyennes tirées d’échantillons dont les variances sont hétérogènes.

[retour aux énoncés]

8. Analyse des triglycérides:

Test de comparaison entre deux échantillons tirés de populations pairées (les mêmes patients, les mêmes prélèvements MAIS des méthodes différentes).

H0: µA = µB

H1: µA différent de µB

tobservé = 3.26

 

ttables (9dl; 0.975) = 2.262

ttables (9dl; 0.995) = 3.25

Les 2 méthodes d’analyses des triglycérides donnent des résultats très différents (différence très significative).

[retour aux énoncés]

9. Techniques de mesure de température sur un troupeau de 30 vaches:

Test de comparaison entre deux échantillons tirés de populations pairées (les mêmes vaches, les mêmes températures MAIS des techniques différentes).

H0: µmercure = µinfra-rouge

H1: µmercure différent de µinfra-rouge

tobservé = 1.99

 

ttables (29 dl; 0.975) = 2.045

Nous n'avons pas pu montrer que les 2 techniques d’analyses de la température donnaient des résultats différents.

[retour aux énoncés]

10. Influence du cadmium sur le taux de glucose dans le sang chez la truite:

Nous pouvons donc réaliser un test de comparaison de 2 moyennes tirées de 2 populations indépendantes et rechercher un Z observé (car les variances des populations avec et sans Cd sont connues et valent respectivement 5 et 10 (mg de glucose/l)² ).

H0: msans Cd = mavec Cd

H1: msans Cd supérieur à mavec Cd

Zobservé = 5,039

 

z(tables 0.95) = 1.645

z(tables 0.99) = 2.326

Le Cd augmente la glycémie de manière hautement significative (RH0 à alpha = 1%)

[retour aux énoncés]