Les tests d'hypothèses vont permettre aux statisticiens de comparer des échantillons entre eux ou encore de comparer un échantillon avec une population de référence...

Types de tests d'hypothèses:

Dans le cadre de ces travaux pratiques, nous envisagerons trois types de tests d'hypothèses.

Les tests 2 et 3 sont des cas particuliers qui peuvent être plus simplement traités par l'ANOVA.

Les hypothèses:

Quel que soit le type de tests (voir ci-dessus), il faut toujours prendre pour hypothèse de référence que les moyennes comparées proviennent d'une seule population de moyenne Mx. Il s'agit de l'hypothèse de départ appelée "hypothèse nulle" (H0) qui pourra s'écrire comme suit dans le cas d'une comparaison de deux moyennes:

L'expérimentateur doit ensuite démontrer que les moyennes comparées ne proviennent pas de la même population, mais qu'une des populations possède une moyenne plus grande, plus petite ou tout simplement différente par rapport à l'autre population. Il s'agit de l'"hypothèse alternative" (H1) qui pourra s'écrire comme suit:

Réalisation du test:

Réduction des moyennes observées:
La (les) moyenne(s) mx obtenue(s) pour (les) l'échantillon(s) peu(ven)t être réduite(s) en une valeur observée (z observée ou t observée). Celle-ci peut ensuite être comparée à une valeur seuil (z table ou t table).

En général, et pour la suite de l'exemple, on appellera M1 la moyenne de la population dont on pense que les individus proviennent, et M2 celle dont ils proviennent réellement.

La valeur seuil va déterminer sous la courbe de Gauss réduite des zones distinctes: une zone probable suivant H0 et une zone improbable suivant H0, vous devrez choisir dans les tables de Z ou de t de student une valeur seuil. En fonction du nombre d'hypothèses attendues (1 ou 2) et de la confiance 1-alpha (95%, 99%, ...).

Si l'hypothèse alternative H1 est "M2 plus grand que M1"

Si l'hypothèse alternative H1 est "M2 plus petit que M1"

Si l'hypothèse alternative H1 est "M2 différent de M1"

Test de comparaison d'une moyenne d'un échantillon par rapport à une population standard

population 1

Principe:

Un échantillon est prélevé et sa moyenne est calculée (mx). Cet échantillon provient-il d'une population 1 déterminée de moyenne M1 (ou µ1) ou bien appartient-il à une seconde population appelée population 2 de moyenne M2? Autrement dit, cet échantillon est-il conforme à la population d'origine?

Les hypothèses:

Hypothèse nulle H0:

H0: M1 = M2 = mx

la moyenne de l'échantillon appartient à la population de référence de moyenne M1

Hypothèse alternative H1:

H1: M1 < M2 .

l'échantillon appartient à une population dont la moyenne M2 est supérieure à la moyenne M1 de la population de référence

ou encore

H1: M1 > M2 .

l'échantillon appartient à une population dont la moyenne M2 est inférieure à la moyenne M1 de la population de référence

ou encore

H1: M1 ≠ M2 .

l'échantillon appartient à une population dont la moyenne M2 est différente de la moyenne M1 de la population de référence

Calculer la valeur observée:

Cas 1: la variance de la population de référence est connue:

La réduction de la moyenne de l'échantillon peut se faire par le calcul d'une valeur de Z observée dont la formule est la suivante:

formule

Où mx est la moyenne de l'échantillon; Mx est la moyenne de la population de référence; VARx est la variance de la population de référence; n est la taille de l'échantillon.

Trouvez dans les tables de Z, la (les) valeur(s) seuil en tenant compte de alpha et de H1.

AH0 (et donc RH1)	L'échantillon de moyenne mx appartient à la population de référence dont la moyenne est M1
RH0 (et donc AH1)	L'échantillon de moyenne mx n'appartient pas à la population de référence dont la moyenne est M1 mais à une population dont la moyenne M2 est plus grande OU plus petite que celle de la population de référence de moyenne M1.

Cas 2: la variance de la population de référence est inconnue:

Dans ce cas, il n'est plus possible de calculer directement une valeur de z observée car il nous manque la valeur de la variance de la population de référence VARx.

Cependant, il est possible d'adapter cette formule en remplaçant VARx par une approximation de celle-ci. Cette approximation est donnée par l'estimateur de la variance de la population varx. La variable réduite ainsi obtenue n'est plus une variable z observée mais une variable t observée.

encore la formule

Où mx est la moyenne de l'échantillon; Mx est la moyenne de la population de référence; varx est l'estimateur de la variance de la population (autrement dit la SCE/(n-1) qui est une valeur propre à l'échantillon); n est la taille de l'échantillon.

Ensuite, il reste à trouver dans les tables de t de Student (l'aspect de la courbe est aussi une courbe de Gauss), la ou les valeurs seuil en tenant compte de alpha et de H1. La valeur de t de Student nécessite aussi la détermination d'un certain nombre de degrés de liberté. Pour trouver la ou les valeurs seuil, il faut donc rechercher:

t_seuil;(n-1) degrés de liberté

Où "seuil" dépend de H1(α) ou H1 et H2 (α/2) et de la confiance 1-α choisie; n est la taille de l'échantillon

AH0 (et donc RH1)	L'échantillon de moyenne mx appartiendrait à la population de référence dont la moyenne est M1 jusqu'à preuve du contraire.
RH0 (et donc AH1)	L'échantillon de moyenne mx n'appartient pas à la population de référence dont la moyenne est M1 mais à une population dont la moyenne M2 est plus grande OU plus petite que celle de la population de référence, dont la moyenne est M1.

Test de comparaison de 2 moyennes provenant de 2 échantillons tirés de 2 populations indépendantes

Test de comparaisson de 2 moyennes provenant de 2 échantillons tirés de 2 populations indépendantes

Principe:

Un expérimentateur désire comparer les moyennes (m1 et m2) de deux échantillons composés d'individus distincts: les individus de l'échantillon 1 ne sont pas les mêmes que ceux de l'échantillon 2! Les deux échantillons sont indépendants.

La question est : les deux échantillons proviennent-ils d'une seule population de moyenne Mx ou proviennent-ils de deux populations distinctes de moyennes M1 et M2?

Cette analyse peut être réalisée par une ANOVA I à deux niveaux.

Les hypothèses:

Hypothèse nulle H0:

H0: M1 = M2 = Mx

les moyennes des échantillons appartiennent à une seule population de référence de moyenne Mx

Hypothèse alternative H1:

H1: M1 > M2 .

les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 supérieure à la moyenne M2 de la population2

ou encore

H1: M1 < M2 .

les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 inférieure à la moyenne M2 de la population2

ou encore

H1: M1 ≠ M2 .

les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 différente de la moyenne M2 de la population2

Calculer la valeur observée:

Cas 1: les variances des populations 1 et 2 (VAR1 et VAR2) sont connues:

La réduction de la moyenne de l'échantillon peut se faire par le calcul d'une valeur de Z observé dont la formule est la suivante:

formule

Où m1 et m2 sont les moyennes des 2 échantillons; VAR1 et VAR2 sont les variances des 2 populations 1 et 2; n₁ et n₂ sont les tailles respectives des échantillons 1 et 2.

Trouvez dans les tables de Z, la ou les valeurs seuil en tenant compte de alpha et de H1.

AH0 (et donc RH1)	Les échantillons de moyenne m1 et m2 appartiennent à une seule population de référence dont la moyenne est Mx
RH0 (et donc AH1)	Les échantillons de moyenne m1 et m2 n'appartiennent pas à la même population de référence dont la moyenne est Mx mais appartiennent à 2 populations distinctes dont les moyennes respectives M1 et M2 sont telles que M1 est plus grande OU plus petite OU différente par rapport à M2.

Cas 2: les variances des populations 1 et 2 (VAR1 et VAR2) sont inconnues:

Dans ce cas, il n'est plus possible de calculer directement une valeur de z observée car il nous manque les valeurs de variances des populations de référence VAR1 et VAR2.

Pour pouvoir comparer les moyennes des 2 échantillons, l'expérimentateur va devoir remplacer les variances des deux populations indépendantes par les variances estimées des 2 échantillons, var1 et var2.

Une question préalable doit être posée: La variabilité des 2 échantillons est-elle comparable, homogène? En d'autres termes, il faut vérifier l'égalité des variances des 2 populations étudiées, c'est-à-dire l'homoscédasticité. En effet si les variances sont hétérogènes, la différence de variance risque d'être confondue avec une différence de moyenne.

2.1 : Test sur l'homogénéité des variances des échantillons comparés:

Réalisation du test:

H0: var1 = var2	Les variances des populations comparées sont homogènes
Pour 2 variances : H1: var1 > var2 H2: var1 < var2	La variance 1 est plus grande que la variance 2 La variance 2 est plus grande que la variance 1

Pour réaliser ce test, l'expérimentateur établit le rapport Var max/Var min. Ce rapport est une valeur appelée F observé que l'on peut comparer avec une valeur F des tables de Fisher ( voir Module 125 : page 3 : Test de Fisher).

F_observé = var1 / var2 si var1 plus grande que var2

L'expérimentateur va ensuite comparer cette valeur à une valeur théorique des tables de F de Fisher-Snedecor. Tester les hypothèses alternatives H1 et H2 en même temps implique la réalisation d'un test bidirectionnel. En général, ce test s'effectue avec une confiance de 95%. Ce test étant bidirectionnel, le seuil est fixé à alpha/2.
F_théorique;(n1-1) dl; (n2-1)dl; 0,975	L'expérimentateur doit sélectionner la table où P(F < f) = 0,975. Les degrés de liberté du numérateur (n₁-1)dl correspondent à ceux de l'échantillon dont la variance est la plus grande. Ils permettent de rentrer en tête de colonne dans la table. Les degrés de liberté du dénominateur (n₂-1)dl correspondent à ceux de l'échantillon dont la variance est la plus petite. Ils permettent de rentrer en tête de ligne dans la table.

AH0 si F_observé est plus petit que F_théorique	Les variances des populations d'où sont issues les échantillons sont considérées comme homogènes et l'expérimentateur peut alors envisager de comparer les moyennes des populations d'où sont issus les échantillons.
RH0 si F_observé est plus grand que F_théorique	Les variances des populations d'où sont issues les échantillons sont considérées comme hétérogènes. Il est alors IMPOSSIBLE de comparer par la suite les moyennes pour des échantillons dont les variances ne sont pas homogènes. Dans de nombreux cas, une transformation X'=log(x) ou X'=racine(x) permet d'homogénéiser les variances.

2.2 :Test de comparaison des moyennes des populations d'où proviennent les 2 échantillons:

CONDITION: Ce test d'hypothèses portant sur les moyennes n'est possible QUE SI l'homogénéité des variances des populations a été confirmée par le test détaillé au point précédent

Les hypothèses H0 et H1 sont celles décrites plus haut.

L'expérimentateur va ensuite calculer une valeur de t observé: Dans cette formule, par rapport à celle du Z observé détaillée ci dessus, on remplacera VAR1 et VAR2 par une seule variance appelée "variance résiduelle" S_r² obtenue à partir des variances des deux échantillons var1 et var2.

et une autre formule

Où m1 et m2 sont les moyennes des 2 échantillons; S²_r est la variance résiduelle ; n₁ et n₂ sont les tailles respectives des échantillons 1 et 2, var1 et var2 sont les variances respectives des deux échantillons 1 et 2.

t_seuil;(n₁+n₂-2) degrés de liberté

Où "seuil" représente H1 (seuil peut être (1-α) ou α ou (1-α/2) ou (α/2)); n est la taille de l'échantillon.

AH0 (et donc RH1)	Les échantillons 1 et 2 appartiendraient, jusqu'à preuve du contraire, à la population de référence dont la moyenne est Mx.
RH0 (et donc AH1)	Les échantillons 1 et 2 n'appartiendraient pas à la population de référence dont la moyenne est Mx mais à deux autres populations dont les moyennes M1 et M2 sont plus grandes OU plus petites que celle de la population de référence.

Test de comparaison de deux moyennes (observations pairées)

Principe:

Un expérimentateur dispose d'une série d'observations associées par paires ou par couples. Par exemple, une expérience a été menée sur des rats. Ils ont été pesés avant et après un traitement hautement énergétique. A chaque individu de l'expérience est associée une pesée avant et après le traitement.

Pour traiter ce genre de test, l'expérimentateur doit considérer la différence de chaque couple de données. Toutes ces différences forment un échantillon dont on peut calculer la moyenne mD et la variance varD.

A partir de ce moment, l'expérimentateur dispose d'une seule série de n observations, supposée par H0 prise dans une population de moyenne D, de variance inconnue estimée par SD, et souhaite éprouver H1 MD > D et ou H2 MD < D

Remarque :ce test peut être réalisé plus simplement par la technique de l'ANOVA II, avec un critère fixe à deux niveaux croisés et un critère aléatoire à n niveaux.

Les hypothèses:

Hypothèse nulle H0:

H0: MD = delta (=0)

la moyenne des différences de la population de référence et delta sont égales et nulles

NB: En général delta vaut 0: Il est rare que l'on souhaite tester une différence particulière, non nulle, mais c'est néanmoins réalisable.

Hypothèse alternative H1:

H1: MD > delta	la moyenne des différences de la population de référence est plus grande que delta
H1: MD < delta	la moyenne des différences de la population de référence est plus petite que delta
H1: MD ≠ delta	la moyenne des différences de la population de référence est non nulle

Calculer la valeur observée:

La réduction de la moyenne des différences peut se faire par le calcul d'une valeur de t observé dont la formule est la suivante:

Où mD est la moyenne des différences des données pairées; varD est la variance des différences des données pairées; n est le nombre de couples de données.

Trouvez dans les tables de t, la ou les valeurs seuil(s), en tenant compte d'alpha pour un test unidirectionnel ou bidirectionnel. Le nombre de degrés de liberté à employer est (n-1) dl où n est le nombre de couples de données.

t_seuil, (n-1) dl; (1-α/2)

AH0 (et donc RH1)	la moyenne des différences de la population de référence est nulle
RH0 (et donc AH1)	la moyenne des différences de la population de référence est non nulle

La r�alisation d'un test d'Analyse de la Variance est une mati�re complexe, qui fera l'objet de plusieurs autres modules ind�pendants.

Comparer une moyenne à un standard:

H0: M1 = M2 = Mx
ou bien	1	H1: M1 plus grand que M2 .
	2	H1: M1 plus petit que M2 .
	3	H1: M1 différent de M2 .

Si la variance de la population standard (VARx) est connue<		Si la variance de la population standard (VARx) est inconnue<

1	Z tables; (1-alpha)	1	t tables; (n-1) dl; (1-alpha)
2	Z tables; (alpha)	2	t tables; (n-1) dl; (alpha)
3	Z tables; (alpha/2) Z tables;(1-alpha/2)	3	t tables; (n-1) dl; (alpha/2) t tables;(n-1) dl; (1-alpha/2)

Comparer 2 moyennes d'échantillons provenant de 2 populations indépendantes:

H0: M1 = M2 = Mx
ou bien	1	H1: M1 plus grand que M2 .
	2	H1: M1 plus petit que M2 .
	3	H1: M1 différent de M2 .

Si les variances des populations (VAR1 et VAR2) sont connues		Si les variances des populations (VAR1 et VAR2) sont inconnues


1	Z tables; (1-alpha)	1	t tables; (n1+n2-2) dl; (1-alpha)
2	Z tables; (alpha)	2	t tables; (n1+n2-2) dl; (alpha)
3	Z tables; (alpha/2) Z tables;(1-alpha/2)	3	t tables; (n1+n2-2) dl; (alpha/2) t tables;(n1+n2-2) dl; (1-alpha/2)

Comparer deux moyennes (observations pairées)

H0: MD = delta	la moyenne des différences de la population de référence est nulle
H1: MD est différente de delta	la moyenne des différences de la population de référence est non nulle

La variance de la population (VARD) est toujours inconnue

t tables, (n-1) dl; (1-alpha/2) avec n nombre de couples

les hypothèses:

H0: M1 = M2 = Mx
ou bien	1	H1: M1 plus grand que M2 .
	2	H1: M1 plus petit que M2 .
	3	H1: M1 différent de M2 .

1	H1: M1 plus grand que M2 .
	AH0 si Z observé plus petit que Z (1-alpha) t observé plus petit que t (1-alpha)
	RH0 si Z observé plus grand que Z (1-alpha) t observé plus grand que t (1-alpha)

2	H1: M1 plus petit que M2 .
	AH0 si Z observé plus grand que Z (alpha) t observé plus grand que t (alpha)
	RH0 si Z observé plus petit que Z (alpha) t observé plus petit que t (alpha)

3	H1: M1 différent de M2 .
	AH0 si Z observé compris entre Z (alpha/2) et Z (1-alpha/2) t observé compris entre t (alpha/2) et t (1-alpha/2)
	RH0 si Z observé plus grand que Z (1-alpha/2) t observé plus grand que t (1-alpha/2) ou Z observé plus petit que Z (alpha/2) t observé plus petit que t (alpha/2)

1. Un laboratoire étudie l'influence d'un contraceptif X sur un groupe de 18 femmes de 25 ans. Chez la femme, au "jour 14 " du cycle menstruel, une augmentation de la concentration en LH (Luteinizing Hormone) induit l'ovulation. A ce stade précis, la concentration en LH est une v.a.N(14,5; 5,0625). Pour l'échantillon de 18 femmes, on obtient une moyenne de 13,03 mIU/ml et une variance de 6,32 (mIU/ml)². La prise du contraceptif X a-t-elle une influence (significative (alpha =5%) ou hautement significative (alpha =1%)) sur la concentration en LH et sur l'ovulation ? réponse

2. Des études comparatives sur la fécondité des femmes au sein de la communauté européenne ont été menées sur des femmes de 40 ans. Pour cela, un statisticien a réalisé deux échantillons: l'un (de 100 femmes) en France, l'autre (de 80 femmes), en Belgique. Il a obtenu une moyenne de 1,78 enfants / femme et une somme de carrés d'écarts (SCE) de 427,68 (enfants / femme)² pour l'échantillon français et une moyenne de 2,12 enfants / femme et une SCE de 281,24 (enfants / femme)² pour l'échantillon belge. Les femmes françaises sont-elles moins fécondes que leurs homologues belges? réponse

3. Dans une fabrication de boulons pour machines, l'ingénieur du contrôle-qualité trouve qu'un échantillon de taille n = 100 est nécessaire pour détecter des changements fortuits de 0,5mm dans la longueur moyenne du boulon fabriqué. Supposons qu'il souhaite une précision plus grande pour détecter un changement de 0,1mm seulement, avec les mêmes erreurs de type I et II. De combien doit-il augmenter la taille de son échantillon ? (c'est facile si on reformule le problème en terme d'intervalles de confiance. Pour construire un intervalle de confiance 5 fois plus précis, de combien doit-on augmenter la taille de l'échantillon ?) réponse

4. Des études de consommation ont été réalisées en Irlande et en Angleterre. Les dépenses en services médicaux et dépenses de santé représentaient, en 1985, respectivement 1,5% et 1% de la consommation totale des ménages. Sachant qu'en Europe, la variation des dépenses en services médicaux et dépenses de santé est de 1,9 (%²), combien de ménages doit-on étudier (alpha = 5%) dans ces deux pays pour montrer, dans 99% des cas, que la consommation totale en Irlande est supérieure à celle obtenue en Angleterre ? réponse

5. Pour deux catégories différentes de raisins (catégorie 1 et catégorie 2), on a observé l’acidité (pH) de 7 et de 11 grappes respectivement. On remarque que l’échantillon de la catégorie 1 a une acidité moyenne de 3.556 (variance 0.011) et celle de l’échantillon de la catégorie 2 est de 3.477 (variance 0.007). Testez si la différence est significative. réponse

6. Un procédé de fabrication courant a produit des millions de tubes T.V., dont la durée de vie moyenne est µ=1200 heures et l’écart-type σ = 300 heures. Un nouveau procédé, estimé meilleur par le bureau d’études, fournit un échantillon de 100 tubes avec une moyenne de 1265. Bien que cet échantillon fasse apparaître le nouveau procédé comme meilleur, s’agit-il d’un coup de chance de l’échantillonnage? réponse

7. Un enseignant réalise la même interrogation dans deux groupes de 17 étudiants d’une même section. Le groupe A obtient une moyenne sur 20 de 13,1 ± 4,16 et le groupe B obtient une moyenne de 10.8 ± 1,92. Les deux groupes sont-ils de force équivalente (avec un alpha de 5%)? Un troisième groupe (groupe C) de cette section de 17 individus est également testé et la moyenne obtenue vaut 9.8 ± 3.86. Le groupe C est-il moins fort que le groupe A (avec un alpha de 5% et de 1%)? En est-il de même par rapport au groupe B (avec un alpha de 5% et de 1%)? réponse

8. Un étudiant en biologie clinique désire comparer deux méthodes d'analyse des triglycérides sur 10 patients. Une moitié de chaque prélèvement est testée par la méthode A et il note une concentration moyenne de triglycérides de 102.3 mg/dl pour une variance de 7.68 (mg/dl)². L'autre moitié est testée par la méthode B et il observe une concentration moyenne de 107.5 mg/dl pour une variance de 6.23 (mg/dl)². En moyenne la différence enregistrée dans l'échantillon de 10 patients est de 3.75 mg/dl pour une variance de 13.2 (mg/dl)². Ces deux méthodes donnent-elles des résultats comparables avec un seuil de signification de 5%? Sinon, qu'en est-il à 1%? réponse

9. Un biologiste teste 2 techniques de mesure de température sur un troupeau de 30 vaches. La première technique utilise un thermomètre conventionnel au mercure et la seconde utilise un appareil à détection infrarouge à distance. Les 2 techniques donnent respectivement 38.7 ± 0.54 °C et 38.9 ± 0.64°C. La différence moyenne entre les deux techniques est de 0.16 ± 0.44°C. Quelles conclusions pouvez-vous tirer? réponse

10. Un physiologiste étudie l'influence du cadmium sur le taux de glucose dans le sang. Il remplit 2 bassins avec d'une part de l'eau de distribution et d'autre part de l'eau de distribution à laquelle on a ajouté une dose de 0.01mg de Cd par litre. 18 truites sont disposées dans ces 2 bassins et le taux de glucose dans le sang est mesuré après 2 heures d'incubation. Les résultats sont représentés dans le tableau ci-dessous:

Les variances attendues dans le bassin sans Cd étant de 5 et de 10 dans le bassin traité, le cadmium augmente-t-il la glycémie chez les truites (faire le test avec un seuil de signification de 5% et de 1%)? réponse

11. Apparentée aux races anglaises KERRY, DEVON, JERSEY, GUERNESEY, la race BRETONNE PIE NOIRE a été façonnée par le climat et le sol bretons. Cette race est exploitée en Bretagne et dans les départements limitrophes. Elle reste, parmi les races françaises, une de celles ayant le mieux conservé ses caractères originels, l’impact des croisements ayant été faible au siècle dernier.

De récents croisements ont été réalisés afin d'accroître ses performances au niveau de leur production de viande. Ci-dessous, voici les résultats des tests effectués sur des individus provenant du croisement de cette race avec une race déterminée.

Les différents croisements donnent-ils des résultats plus performants que la race pure (alpha de 5% et 1%)? [Note: considérer chaque ligne du tableau comme une nouvelle expérience]

12. Une industrie pharmaceutique désire tester trois stimulants de l'appétit (S1, S2, S3) en mesurant la capacité d'absorption de nourriture chez le rat. Quatre groupes de 12 rats sont constitués: le premier servant de témoin, les trois autres recevant respectivement les stimulants S1, S2 et S3. On mesure la quantité de nourriture (en kg) ingérée sur un mois. Que peut-on conclure?

On sait aussi que la variance factorielle est de16,90 et la variance résiduelle est de 1,13.

13. Un ornithologue s'intéresse à l'évolution d'une espèce d'oiseaux répartie dans trois sites géographiquement distincts A, B et C, et plus particulièrement aux différences morphologiques engendrées par les mécanismes d'isolement. A cet effet, il a mesuré la longueur des ailes (en mm) de 10 oiseaux capturés sur chaque site. Les barrières géographiques ont-elles engendré des différences morphologiques sur cette espèce?

On sait que la variance résiduelle: 4,31. [On considère que les échantillons sont comparables au niveau de la variabilité entre échantillons]

14. Douze parcelles de terrain sont divisées aléatoirement en 3 groupes. Le premier sert de témoin, les deux autres sont fertilisés respectivement avec les engrais A et B. Les rendements observés sont les suivants. Les engrais affectent-ils la production?

On sait que la variance expliquée est de 156 et que la variance non expliquée est de 17,3.

15. Pour définir l'impact de la nature du sol sur la croissance d'une plante X, un botaniste a mesuré la hauteur des plantes pour 4 types de sol. Pour chaque type de sol, il disposait de 3 réplicats.

16. Dans le cadre d'une étude écotoxicologique, la concentration en DDT et en ses dérivés a été mesurée chez des brochets de différents âges. Les résultats obtenus sont donnés, dans le tableau ci-dessous pour des échantillons de 11 individus chacun.

Pour α=5%, Z_tables = -1,64, donc on conclut RH0 car z_observé inférieur à Z_tables

Pour α=1% Z_tables = -2,33, donc on conclut RH0 car z_observé inférieur à Z_tables

Conclusion: La prise du contraceptif X provoque une diminution hautement significative de la concentration en LH. L'ovulation ne peut avoir lieu. [retour aux énoncés]

F_obs < F_{0,975; 99dl; 79dl} donc il y a AH0 -> On n'a pas pu montrer que les variances étaient différentes. Le test d'hypothèses portant sur les moyennes est donc réalisable.

Comparaison de 2 moyennes tirées d'échantillons indépendants (test de t unidirectionnel à gauche si nous prenons les femmes belges comme référence)

t_obs supérieur à t_{0,05; 178dl} donc conclusion: AH0, nous n'avons pas pu montrer que les femmes françaises étaient moins fécondes que les femmes belges

Rendre l'intervalle de confiance 5 fois plus petit signifie que la valeur critique devient:

et donc, l'échantillon doit être 25 fois plus grand. Soit 2500 pièces pour être sûr de voir une augmentation de l'écart à la normalité.

Sur base de l'�nonc� on peut postuler : �₀ = 1%; �₁=1,5%; S²=1,9%²

La consultation de la derni�re ligne de la table de Student nous donne les valeurs de z suivantes :
Z_1-alpha = Z_0,95 = 1,645
Z_1-beta = Z_0,99 = 2,326

En prenant 120 ménages dans les deux pays étudiés, nous pourrons voir cette différence de dépenses.[retour aux énoncés]

F_observé inférieur à F_tables donc on conclut AH0 (je n’ai pas pu montrer l'hétérogénéité des variances)

Conclusion: Le nouveau procédé de fabrication possède une durée de vie significativement plus importante que l’ancien procédé.

F_observé supérieur à F_tables donc on conclut RH0 (les variances ne sont pas identiques)

Impossible de comparer les moyennes tirées d’échantillons dont les variances sont hétérogènes.

F_observé inférieur à F_tables donc on conclut AH0 (les variances sont homogènes)

Le groupe A possède une moyenne significativement plus grande que la moyenne du groupe C. Ce test n’est pas hautement significatif.

F_observé supérieur à F_tables donc on conclut RH0 (les variances ne sont pas identiques)

Impossible de comparer les moyennes tirées d’échantillons dont les variances sont hétérogènes.

Test de comparaison entre deux �chantillons tir�s de populations pair�es (les mêmes patients, les mêmes prélèvements MAIS des méthodes différentes).

Les 2 méthodes d’analyses des triglycérides donnent des résultats très différents (différence très significative).

Test de comparaison entre deux échantillons tirés de populations pairées (les mêmes vaches, les mêmes températures MAIS des techniques différentes).

Nous n'avons pas pu montrer que les 2 techniques d’analyses de la température donnaient des résultats différents.

Nous pouvons donc réaliser un test de comparaison de 2 moyennes tirées de 2 populations indépendantes et rechercher un Z observé (car les variances des populations avec et sans Cd sont connues et valent respectivement 5 et 10 (mg de glucose/l)² ).

Le Cd augmente la glycémie de manière hautement significative (RH0 à alpha = 1%)

	bassin sans Cd ajouté	bassin avec 0.01mg Cd/l	différence avec/sans Cd
moyenne	86.6	91.2	4.6
variance	5.1	8.3	3.2

	échantillon Pie-Noire	échantillon croisé	SCE
pie noire vs croisement 1	moyenne = 601,66 variance = 181,53 nb individus = 18	moyenne = 611,57 variance = 258,54 nb individus = 18	SCEF = 884,08 SCER = 7481,18
pie noire vs croisement 2	moyenne = 598,13 variance = 192,55 nb individus = 18	moyenne = 609,19 variance = 294,43 nb individus = 18	SCEF = 1101,68
pie noire vs croisement 3	moyenne =595,85 variance = 142,48 nb individus = 18	moyenne = 622,24 variance = 514,10 nb individus = 18	SCEF = 6263,96 SCER = 11161,87

	Témoin	S1	S2	S3
Moyennes	2,90	4,11	5,14	5,56
Variances	2,11	0,99	0,35	1,05

	A	B	C
Moyennes	71,2	74,4	72,6

	Témoin	A	B
Moyennes	61	70	73
Variances	20,6	14	17,3

	Type de sol
	I	II	III	IV
	15	25	17	10
	9	21	23	13
	4	19	20	19
Moyennes	9,33	21,67	20,00	14,00
variances	30,33	9,33	9,00	21,00

	2 ans	3 ans	4 ans	5 ans	6 ans
moyennes	0,18300	0,33763	0,45113	0,70738	1,19750
variances	0,00035	0,00106	0,00024	0,00045	0,00125

Module 130: document.write(TitreModule);

document.write(TitrePage);

Types de tests d'hypothèses:

Les hypothèses:

Réalisation du test:

Si l'hypothèse alternative H1 est "M2 plus grand que M1"

Si l'hypothèse alternative H1 est "M2 plus petit que M1"

Si l'hypothèse alternative H1 est "M2 différent de M1"

document.write(TitrePage);

Test de comparaison d'une moyenne d'un échantillon par rapport à une population standard

Principe:

Les hypothèses:

Hypothèse nulle H0:

Hypothèse alternative H1:

Calculer la valeur observée:

Cas 1: la variance de la population de référence est connue:

Cas 2: la variance de la population de référence est inconnue:

document.write(TitrePage);

Test de comparaison de 2 moyennes provenant de 2 échantillons tirés de 2 populations indépendantes

Principe:

Les hypothèses:

Hypothèse nulle H0:

Hypothèse alternative H1:

Calculer la valeur observée:

Cas 1: les variances des populations 1 et 2 (VAR1 et VAR2) sont connues:

Cas 2: les variances des populations 1 et 2 (VAR1 et VAR2) sont inconnues:

document.write(TitrePage);

Test de comparaison de deux moyennes (observations pairées)

Principe:

Les hypothèses:

Hypothèse nulle H0:

Hypothèse alternative H1:

Calculer la valeur observée:

document.write(TitrePage);

document.write(TitrePage);

document.write(TitrePage);

document.write(TitrePage);

document.write(TitrePage);

Module 130: