Les contenus sont © P. Calmant et E. Depiereux - 2004; G. Vincke B. De Hertogh et E. Depiereux 2008.
Imprimé le
8/1/2025
Les tests d'hypothèses vont permettre aux statisticiens de comparer des échantillons entre eux ou encore de comparer un échantillon avec une population de référence...
Dans le cadre de ces travaux pratiques, nous envisagerons trois types de tests d'hypothèses.
Les tests 2 et 3 sont des cas particuliers qui peuvent être plus simplement traités par l'ANOVA.
Quel que soit le type de tests (voir ci-dessus), il faut toujours prendre pour hypothèse de référence que les moyennes comparées proviennent d'une seule population de moyenne Mx. Il s'agit de l'hypothèse de départ appelée "hypothèse nulle" (H0) qui pourra s'écrire comme suit dans le cas d'une comparaison de deux moyennes:
H0: M1 = M2 = Mx |
L'expérimentateur doit ensuite démontrer que les moyennes comparées ne proviennent pas de la même population, mais qu'une des populations possède une moyenne plus grande, plus petite ou tout simplement différente par rapport à l'autre population. Il s'agit de l'"hypothèse alternative" (H1) qui pourra s'écrire comme suit:
H1: M1 > M2 . |
ou
H1: M1 < M2 . |
ou encore
H1: M1 ≠ M2 . |
Réduction des moyennes observées:
La (les) moyenne(s) mx obtenue(s) pour (les) l'échantillon(s) peu(ven)t être réduite(s) en une valeur observée (z observée ou t observée). Celle-ci peut ensuite être comparée à une valeur seuil (z table ou t table).
En général, et pour la suite de l'exemple, on appellera M1 la moyenne de la population dont on pense que les individus proviennent, et M2 celle dont ils proviennent réellement.
Recherche d'une limite arbitraire, une valeur seuil:La valeur seuil va déterminer sous la courbe de Gauss réduite des zones distinctes: une zone probable suivant H0 et une zone improbable suivant H0, vous devrez choisir dans les tables de Z ou de t de student une valeur seuil. En fonction du nombre d'hypothèses attendues (1 ou 2) et de la confiance 1-alpha (95%, 99%, ...).
Comparer la valeur réduite observée à la valeur seuil trouvée dans les tables:Lorsque la valeur observée (Z observée ou t observée) est plus grande que la valeur théorique (Z(1-alpha) ou t(1-alpha)), alors H1 est respectée (AH1)et H0 rejetée (RH0). Dans le cas d'un rejet de H0 (RH0), l'expérimentateur aura réussi à démontrer que les moyennes observées sont telles que M2 est vraisemblablement plus grande que M1. Comme la valeur de alpha choisie par l'expérimentateur est faible (maximum 5%), un RH0 signifie que la distance qui sépare les moyennes comparées est trop élevée pour être simplement due au hasard. Le risque de se tromper lorsque RH0 est donc très faible. Un RH0 permet à l'expérimentateur d'être quasiment certain que M2 est bien plus grand que M1 avec un risque de se tromper équivalent à alpha. Dans le cas d'une acceptation de H0 (AH0), rien ne permet à l'expérimentateur de dire que les moyennes sont différentes. Cette AH0 doit être considérée par l'expérimentateur comme une expérience non interprétable. A la différence de la "quasi certitude" au sujet de la conclusion tirée quand RH0, dans le cas d'une AH0, rien ne permet à l'expérimentateur d'être certain que les moyennes comparées sont effectivement identiques. |
Lorsque la valeur observée (Z observée ou t observée) est plus petite que la valeur théorique (Z(alpha) ou t(alpha)), alors H1 est acceptée (AH1) et H0 rejetée (RH0). Dans le cas d'un rejet de H0 (RH0), l'expérimentateur a la "quasi certitude" que M2 est plus petit que M1 avec une probabilité de se tromper de alpha (maximum 5%). Dans le cas d'une acceptation de H0 (AH0), l'expérimentateur n'a pas réussi à démontrer que M2 est plus petite que M1. Le doute est toujours possible. |
Lorsque la valeur observée (Z observée ou t observée) est SOIT plus petite que la valeur théorique (Z(alpha/2) ou t(alpha/2)), SOIT plus grande que la valeur théorique (Z(1-alpha/2) ou t(1-alpha/2)), alors H1 est respectée (AH1)et H0 rejetée (RH0). Dans le cas d'un rejet de H0 (RH0), l'expérimentateur a la "quasi certitude" que M2 est différent de M1 avec une probabilité de se tromper de alpha (maximum 5%). Dans le cas d'une acceptation de H0 (AH0), l'expérimentateur n'a pas réussi à démontrer que M2 est différent de M1. Le doute est toujours possible. |
Un échantillon est prélevé et sa moyenne est calculée (mx). Cet échantillon provient-il d'une population 1 déterminée de moyenne M1 (ou µ1) ou bien appartient-il à une seconde population appelée population 2 de moyenne M2? Autrement dit, cet échantillon est-il conforme à la population d'origine?
H0: M1 = M2 = mx |
la moyenne de l'échantillon appartient à la population de référence de moyenne M1 |
H1: M1 < M2 . |
l'échantillon appartient à une population dont la moyenne M2 est supérieure à la moyenne M1 de la population de référence |
ou encore
H1: M1 > M2 . |
l'échantillon appartient à une population dont la moyenne M2 est inférieure à la moyenne M1 de la population de référence |
ou encore
H1: M1 ≠ M2 . |
l'échantillon appartient à une population dont la moyenne M2 est différente de la moyenne M1 de la population de référence |
La réduction de la moyenne de l'échantillon peut se faire par le calcul d'une valeur de Z observée dont la formule est la suivante:
Où mx est la moyenne de l'échantillon; Mx est la moyenne de la population de référence; VARx est la variance de la population de référence; n est la taille de l'échantillon.
Trouvez dans les tables de Z, la (les) valeur(s) seuil en tenant compte de alpha et de H1.
AH0 (et donc RH1) |
L'échantillon de moyenne mx appartient à la population de référence dont la moyenne est M1 |
RH0 (et donc AH1) |
L'échantillon de moyenne mx n'appartient pas à la population de référence dont la moyenne est M1 mais à une population dont la moyenne M2 est plus grande OU plus petite que celle de la population de référence de moyenne M1. |
Dans ce cas, il n'est plus possible de calculer directement une valeur de z observée car il nous manque la valeur de la variance de la population de référence VARx.
Cependant, il est possible d'adapter cette formule en remplaçant VARx par une approximation de celle-ci. Cette approximation est donnée par l'estimateur de la variance de la population varx. La variable réduite ainsi obtenue n'est plus une variable z observée mais une variable t observée.
Où mx est la moyenne de l'échantillon; Mx est la moyenne de la population de référence; varx est l'estimateur de la variance de la population (autrement dit la SCE/(n-1) qui est une valeur propre à l'échantillon); n est la taille de l'échantillon.
Ensuite, il reste à trouver dans les tables de t de Student (l'aspect de la courbe est aussi une courbe de Gauss), la ou les valeurs seuil en tenant compte de alpha et de H1. La valeur de t de Student nécessite aussi la détermination d'un certain nombre de degrés de liberté. Pour trouver la ou les valeurs seuil, il faut donc rechercher:
tseuil;(n-1) degrés de liberté
Où "seuil" dépend de H1(α) ou H1 et H2 (α/2) et de la confiance 1-α choisie; n est la taille de l'échantillon
AH0 (et donc RH1) |
L'échantillon de moyenne mx appartiendrait à la population de référence dont la moyenne est M1 jusqu'à preuve du contraire. |
RH0 (et donc AH1) |
L'échantillon de moyenne mx n'appartient pas à la population de référence dont la moyenne est M1 mais à une population dont la moyenne M2 est plus grande OU plus petite que celle de la population de référence, dont la moyenne est M1. |
Un expérimentateur désire comparer les moyennes (m1 et m2) de deux échantillons composés d'individus distincts: les individus de l'échantillon 1 ne sont pas les mêmes que ceux de l'échantillon 2! Les deux échantillons sont indépendants.
La question est : les deux échantillons proviennent-ils d'une seule population de moyenne Mx ou proviennent-ils de deux populations distinctes de moyennes M1 et M2?
Cette analyse peut être réalisée par une ANOVA I à deux niveaux.
H0: M1 = M2 = Mx |
les moyennes des échantillons appartiennent à une seule population de référence de moyenne Mx |
H1: M1 > M2 . |
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 supérieure à la moyenne M2 de la population2 |
ou encore
H1: M1 < M2 . |
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 inférieure à la moyenne M2 de la population2 |
ou encore
H1: M1 ≠ M2 . |
les moyennes des échantillons appartiennent à 2 populations distinctes. La population 1 a une moyenne M1 différente de la moyenne M2 de la population2 |
La réduction de la moyenne de l'échantillon peut se faire par le calcul d'une valeur de Z observé dont la formule est la suivante:
Où m1 et m2 sont les moyennes des 2 échantillons; VAR1 et VAR2 sont les variances des 2 populations 1 et 2; n1 et n2 sont les tailles respectives des échantillons 1 et 2.
Trouvez dans les tables de Z, la ou les valeurs seuil en tenant compte de alpha et de H1.
AH0 (et donc RH1) |
Les échantillons de moyenne m1 et m2 appartiennent à une seule population de référence dont la moyenne est Mx |
RH0 (et donc AH1) |
Les échantillons de moyenne m1 et m2 n'appartiennent pas à la même population de référence dont la moyenne est Mx mais appartiennent à 2 populations distinctes dont les moyennes respectives M1 et M2 sont telles que M1 est plus grande OU plus petite OU différente par rapport à M2. |
Dans ce cas, il n'est plus possible de calculer directement une valeur de z observée car il nous manque les valeurs de variances des populations de référence VAR1 et VAR2.
Pour pouvoir comparer les moyennes des 2 échantillons, l'expérimentateur va devoir remplacer les variances des deux populations indépendantes par les variances estimées des 2 échantillons, var1 et var2.
Une question préalable doit être posée: La variabilité des 2 échantillons est-elle comparable, homogène? En d'autres termes, il faut vérifier l'égalité des variances des 2 populations étudiées, c'est-à-dire l'homoscédasticité. En effet si les variances sont hétérogènes, la différence de variance risque d'être confondue avec une différence de moyenne.
2.1 : Test sur l'homogénéité des variances des échantillons comparés:
Réalisation du test:
H0: var1 = var2 | Les variances des populations comparées sont homogènes |
Pour 2 variances : H1: var1 > var2 H2: var1 < var2 |
La variance 2 est plus grande que la variance 1 |
Pour réaliser ce test, l'expérimentateur établit le rapport Var max/Var min. Ce rapport est une valeur appelée F observé que l'on peut comparer avec une valeur F des tables de Fisher ( voir Module 125 : page 3 : Test de Fisher). | |
Fobservé = var1 / var2 si var1 plus grande que var2
|
|
L'expérimentateur va ensuite comparer cette valeur à une valeur théorique des tables de F de Fisher-Snedecor. Tester les hypothèses alternatives H1 et H2 en même temps implique la réalisation d'un test bidirectionnel. En général, ce test s'effectue avec une confiance de 95%. Ce test étant bidirectionnel, le seuil est fixé à alpha/2. | |
Fthéorique;(n1-1) dl; (n2-1)dl; 0,975 |
L'expérimentateur doit sélectionner la table où P(F < f) = 0,975. Les degrés de liberté du numérateur (n1-1)dl correspondent à ceux de l'échantillon dont la variance est la plus grande. Ils permettent de rentrer en tête de colonne dans la table. Les degrés de liberté du dénominateur (n2-1)dl correspondent à ceux de l'échantillon dont la variance est la plus petite. Ils permettent de rentrer en tête de ligne dans la table. |
AH0 si Fobservé est plus petit que Fthéorique |
Les variances des populations d'où sont issues les échantillons sont considérées comme homogènes et l'expérimentateur peut alors envisager de comparer les moyennes des populations d'où sont issus les échantillons. |
RH0 si Fobservé est plus grand que Fthéorique |
Les variances des populations d'où sont issues les échantillons sont considérées comme hétérogènes. Il est alors IMPOSSIBLE de comparer par la suite les moyennes pour des échantillons dont les variances ne sont pas homogènes. Dans de nombreux cas, une transformation X'=log(x) ou X'=racine(x) permet d'homogénéiser les variances. |
2.2 :Test de comparaison des moyennes des populations d'où proviennent les 2 échantillons:
CONDITION: Ce test d'hypothèses portant sur les moyennes n'est possible QUE SI l'homogénéité des variances des populations a été confirmée par le test détaillé au point précédent |
Les hypothèses H0 et H1 sont celles décrites plus haut.
L'expérimentateur va ensuite calculer une valeur de t observé: Dans cette formule, par rapport à celle du Z observé détaillée ci dessus, on remplacera VAR1 et VAR2 par une seule variance appelée "variance résiduelle" Sr² obtenue à partir des variances des deux échantillons var1 et var2.
Où m1 et m2 sont les moyennes des 2 échantillons; S2r est la variance résiduelle ; n1 et n2 sont les tailles respectives des échantillons 1 et 2, var1 et var2 sont les variances respectives des deux échantillons 1 et 2.
Ensuite, il reste à trouver dans les tables de t de Student (l'aspect de la courbe est aussi une courbe de Gauss), la ou les valeurs seuil en tenant compte de alpha et de H1. La valeur de t de Student nécessite aussi la détermination d'un certain nombre de degrés de liberté. Pour trouver la ou les valeurs seuil, il faut donc rechercher:
tseuil;(n1+n2-2) degrés de liberté
Où "seuil" représente H1 (seuil peut être (1-α) ou α ou (1-α/2) ou (α/2)); n est la taille de l'échantillon.
AH0 (et donc RH1) |
Les échantillons 1 et 2 appartiendraient, jusqu'à preuve du contraire, à la population de référence dont la moyenne est Mx. |
RH0 (et donc AH1) |
Les échantillons 1 et 2 n'appartiendraient pas à la population de référence dont la moyenne est Mx mais à deux autres populations dont les moyennes M1 et M2 sont plus grandes OU plus petites que celle de la population de référence. |
Un expérimentateur dispose d'une série d'observations associées par paires ou par couples. Par exemple, une expérience a été menée sur des rats. Ils ont été pesés avant et après un traitement hautement énergétique. A chaque individu de l'expérience est associée une pesée avant et après le traitement.
Pour traiter ce genre de test, l'expérimentateur doit considérer la différence de chaque couple de données. Toutes ces différences forment un échantillon dont on peut calculer la moyenne mD et la variance varD.
A partir de ce moment, l'expérimentateur dispose d'une seule série de n observations, supposée par H0 prise dans une population de moyenne D, de variance inconnue estimée par SD, et souhaite éprouver H1 MD > D et ou H2 MD < D
Remarque :ce test peut être réalisé plus simplement par la technique de l'ANOVA II, avec un critère fixe à deux niveaux croisés et un critère aléatoire à n niveaux.
H0: MD = delta (=0) |
la moyenne des différences de la population
de référence et delta sont égales et nulles
|
NB: En général delta vaut 0: Il est rare que l'on souhaite tester une différence particulière, non nulle, mais c'est néanmoins réalisable.
H1: MD > delta |
la moyenne des différences de la population
de référence est plus grande que delta
|
H1: MD < delta |
la moyenne des différences de la population
de référence est plus petite que delta
|
H1: MD ≠ delta |
la moyenne des différences de la population
de référence est non nulle
|
La réduction de la moyenne des différences peut se faire par le calcul d'une valeur de t observé dont la formule est la suivante:
Où mD est la moyenne des différences des données pairées; varD est la variance des différences des données pairées; n est le nombre de couples de données.
Trouvez dans les tables de t, la ou les valeurs seuil(s), en tenant compte d'alpha pour un test unidirectionnel ou bidirectionnel. Le nombre de degrés de liberté à employer est (n-1) dl où n est le nombre de couples de données.
tseuil, (n-1) dl; (1-α/2)
AH0 (et donc RH1)
|
la moyenne des différences de la population de référence est nulle |
RH0 (et donc AH1)
|
la moyenne des différences de la population de référence est non nulle |
La réalisation d'un test d'Analyse de la Variance est une matière complexe, qui fera l'objet de plusieurs autres modules indépendants.
Pour savoir si vous devez ou non les parcourir, veuilelz vous référer au programme de votre section ou de votre finalité.
H0: M1 = M2 = Mx
|
||
ou bien |
1
|
H1: M1 plus grand que M2 .
|
2
|
H1: M1 plus petit que M2 .
|
|
3
|
H1: M1 différent de M2 .
|
Si la
variance de la population standard (VARx) est connue<
|
Si la
variance de la population standard (VARx) est inconnue<
|
||
1
|
Z tables; (1-alpha)
|
1
|
t tables; (n-1) dl; (1-alpha)
|
2
|
Z tables; (alpha)
|
2
|
t tables; (n-1) dl; (alpha)
|
3
|
Z tables; (alpha/2) Z tables;(1-alpha/2) |
3
|
t tables; (n-1) dl; (alpha/2) t tables;(n-1) dl; (1-alpha/2) |
H0: M1 = M2 = Mx
|
||
ou bien |
1
|
H1: M1 plus grand que M2 .
|
2
|
H1: M1 plus petit que M2 .
|
|
3
|
H1: M1 différent de M2 .
|
Si les
variances des populations (VAR1 et VAR2) sont connues
|
Si
les variances des populations (VAR1 et VAR2) sont
inconnues
|
||
1
|
Z tables; (1-alpha)
|
1
|
t tables; (n1+n2-2) dl; (1-alpha)
|
2
|
Z tables; (alpha)
|
2
|
t tables; (n1+n2-2) dl; (alpha)
|
3
|
Z tables; (alpha/2) Z tables;(1-alpha/2) |
3
|
t tables; (n1+n2-2) dl; (alpha/2) t tables;(n1+n2-2) dl; (1-alpha/2) |
H0: MD = delta |
la moyenne des différences de la population
de référence est nulle
|
H1: MD est différente de delta |
la moyenne des différences de la population
de référence est non nulle
|
La variance de la population (VARD)
est toujours inconnue
|
t tables, (n-1) dl; (1-alpha/2)
avec n nombre de couples
|
H0: M1 = M2 = Mx
|
||
ou bien |
1
|
H1: M1 plus grand que M2 .
|
2
|
H1: M1 plus petit que M2 .
|
|
3
|
H1: M1 différent de M2 .
|
1
|
H1: M1 plus grand que M2 .
|
AH0 si Z observé plus petit que Z (1-alpha) t observé plus petit que t (1-alpha) |
|
RH0 si Z observé plus grand que Z (1-alpha) t observé plus grand que t (1-alpha) |
2
|
H1: M1 plus
petit que M2 .
|
AH0 si Z observé plus grand que Z (alpha) t observé plus grand que t (alpha) |
|
RH0 si Z observé plus petit que Z (alpha) t observé plus petit que t (alpha) |
3
|
H1: M1 différent
de M2 .
|
AH0 si Z observé compris entre Z (alpha/2) et Z (1-alpha/2) t observé compris entre t (alpha/2) et t (1-alpha/2) |
|
RH0 si Z observé plus grand que Z (1-alpha/2) t observé plus grand que t (1-alpha/2) ou Z observé plus petit que Z (alpha/2) t observé plus petit que t (alpha/2) |
1. Un laboratoire étudie l'influence d'un contraceptif X sur un groupe de 18 femmes de 25 ans. Chez la femme, au "jour 14 " du cycle menstruel, une augmentation de la concentration en LH (Luteinizing Hormone) induit l'ovulation. A ce stade précis, la concentration en LH est une v.a.N(14,5; 5,0625). Pour l'échantillon de 18 femmes, on obtient une moyenne de 13,03 mIU/ml et une variance de 6,32 (mIU/ml)². La prise du contraceptif X a-t-elle une influence (significative (alpha =5%) ou hautement significative (alpha =1%)) sur la concentration en LH et sur l'ovulation ? réponse
2. Des études comparatives sur la fécondité des femmes au sein de la communauté européenne ont été menées sur des femmes de 40 ans. Pour cela, un statisticien a réalisé deux échantillons: l'un (de 100 femmes) en France, l'autre (de 80 femmes), en Belgique. Il a obtenu une moyenne de 1,78 enfants / femme et une somme de carrés d'écarts (SCE) de 427,68 (enfants / femme)² pour l'échantillon français et une moyenne de 2,12 enfants / femme et une SCE de 281,24 (enfants / femme)² pour l'échantillon belge. Les femmes françaises sont-elles moins fécondes que leurs homologues belges? réponse
3. Dans une fabrication de boulons pour machines, l'ingénieur du contrôle-qualité trouve qu'un échantillon de taille n = 100 est nécessaire pour détecter des changements fortuits de 0,5mm dans la longueur moyenne du boulon fabriqué. Supposons qu'il souhaite une précision plus grande pour détecter un changement de 0,1mm seulement, avec les mêmes erreurs de type I et II. De combien doit-il augmenter la taille de son échantillon ? (c'est facile si on reformule le problème en terme d'intervalles de confiance. Pour construire un intervalle de confiance 5 fois plus précis, de combien doit-on augmenter la taille de l'échantillon ?) réponse
4. Des études de consommation ont été réalisées en Irlande et en Angleterre. Les dépenses en services médicaux et dépenses de santé représentaient, en 1985, respectivement 1,5% et 1% de la consommation totale des ménages. Sachant qu'en Europe, la variation des dépenses en services médicaux et dépenses de santé est de 1,9 (%²), combien de ménages doit-on étudier (alpha = 5%) dans ces deux pays pour montrer, dans 99% des cas, que la consommation totale en Irlande est supérieure à celle obtenue en Angleterre ? réponse
5. Pour deux catégories différentes de raisins (catégorie 1 et catégorie 2), on a observé lacidité (pH) de 7 et de 11 grappes respectivement. On remarque que léchantillon de la catégorie 1 a une acidité moyenne de 3.556 (variance 0.011) et celle de léchantillon de la catégorie 2 est de 3.477 (variance 0.007). Testez si la différence est significative. réponse
6. Un procédé de fabrication courant a produit des millions de tubes T.V., dont la durée de vie moyenne est µ=1200 heures et lécart-type σ = 300 heures. Un nouveau procédé, estimé meilleur par le bureau détudes, fournit un échantillon de 100 tubes avec une moyenne de 1265. Bien que cet échantillon fasse apparaître le nouveau procédé comme meilleur, sagit-il dun coup de chance de léchantillonnage? réponse
7. Un enseignant réalise la même interrogation dans deux groupes de 17 étudiants dune même section. Le groupe A obtient une moyenne sur 20 de 13,1 ± 4,16 et le groupe B obtient une moyenne de 10.8 ± 1,92. Les deux groupes sont-ils de force équivalente (avec un alpha de 5%)? Un troisième groupe (groupe C) de cette section de 17 individus est également testé et la moyenne obtenue vaut 9.8 ± 3.86. Le groupe C est-il moins fort que le groupe A (avec un alpha de 5% et de 1%)? En est-il de même par rapport au groupe B (avec un alpha de 5% et de 1%)? réponse
8. Un étudiant en biologie clinique désire comparer deux méthodes d'analyse des triglycérides sur 10 patients. Une moitié de chaque prélèvement est testée par la méthode A et il note une concentration moyenne de triglycérides de 102.3 mg/dl pour une variance de 7.68 (mg/dl)². L'autre moitié est testée par la méthode B et il observe une concentration moyenne de 107.5 mg/dl pour une variance de 6.23 (mg/dl)². En moyenne la différence enregistrée dans l'échantillon de 10 patients est de 3.75 mg/dl pour une variance de 13.2 (mg/dl)². Ces deux méthodes donnent-elles des résultats comparables avec un seuil de signification de 5%? Sinon, qu'en est-il à 1%? réponse
9. Un biologiste teste 2 techniques de mesure de température sur un troupeau de 30 vaches. La première technique utilise un thermomètre conventionnel au mercure et la seconde utilise un appareil à détection infrarouge à distance. Les 2 techniques donnent respectivement 38.7 ± 0.54 °C et 38.9 ± 0.64°C. La différence moyenne entre les deux techniques est de 0.16 ± 0.44°C. Quelles conclusions pouvez-vous tirer? réponse
10. Un physiologiste étudie l'influence du cadmium sur le taux de glucose dans le sang. Il remplit 2 bassins avec d'une part de l'eau de distribution et d'autre part de l'eau de distribution à laquelle on a ajouté une dose de 0.01mg de Cd par litre. 18 truites sont disposées dans ces 2 bassins et le taux de glucose dans le sang est mesuré après 2 heures d'incubation. Les résultats sont représentés dans le tableau ci-dessous:
bassin sans Cd ajouté |
bassin avec 0.01mg Cd/l |
différence avec/sans Cd |
|
moyenne |
86.6 |
91.2 |
4.6 |
variance |
5.1 |
8.3 |
3.2 |
Les variances attendues dans le bassin sans Cd étant de 5 et de 10 dans le bassin traité, le cadmium augmente-t-il la glycémie chez les truites (faire le test avec un seuil de signification de 5% et de 1%)? réponse
11. Apparentée aux races anglaises KERRY, DEVON, JERSEY, GUERNESEY, la race BRETONNE PIE NOIRE a été façonnée par le climat et le sol bretons. Cette race est exploitée en Bretagne et dans les départements limitrophes. Elle reste, parmi les races françaises, une de celles ayant le mieux conservé ses caractères originels, limpact des croisements ayant été faible au siècle dernier.
De récents croisements ont été réalisés afin d'accroître ses performances au niveau de leur production de viande. Ci-dessous, voici les résultats des tests effectués sur des individus provenant du croisement de cette race avec une race déterminée.
échantillon Pie-Noire | échantillon croisé | SCE | |
pie noire vs croisement 1 | moyenne = 601,66 |
moyenne = 611,57 |
SCEF = 884,08 SCER = 7481,18 |
pie noire vs croisement 2 | moyenne = 598,13 |
moyenne = 609,19 |
SCEF = 1101,68 |
pie noire vs croisement 3 | moyenne =595,85 |
moyenne = 622,24 |
SCEF = 6263,96 SCER = 11161,87 |
Les différents croisements donnent-ils des résultats plus performants que la race pure (alpha de 5% et 1%)? [Note: considérer chaque ligne du tableau comme une nouvelle expérience]
12. Une industrie pharmaceutique désire tester trois stimulants de l'appétit (S1, S2, S3) en mesurant la capacité d'absorption de nourriture chez le rat. Quatre groupes de 12 rats sont constitués: le premier servant de témoin, les trois autres recevant respectivement les stimulants S1, S2 et S3. On mesure la quantité de nourriture (en kg) ingérée sur un mois. Que peut-on conclure?
Témoin |
S1 |
S2 |
S3 |
|
Moyennes |
2,90 |
4,11 |
5,14 |
5,56 |
Variances |
2,11 |
0,99 |
0,35 |
1,05 |
On sait aussi que la variance factorielle est de16,90 et la variance résiduelle est de 1,13.
13. Un ornithologue s'intéresse à l'évolution d'une espèce d'oiseaux répartie dans trois sites géographiquement distincts A, B et C, et plus particulièrement aux différences morphologiques engendrées par les mécanismes d'isolement. A cet effet, il a mesuré la longueur des ailes (en mm) de 10 oiseaux capturés sur chaque site. Les barrières géographiques ont-elles engendré des différences morphologiques sur cette espèce?
A |
B |
C |
|
Moyennes |
71,2 |
74,4 |
72,6 |
On sait que la variance résiduelle: 4,31. [On considère que les échantillons sont comparables au niveau de la variabilité entre échantillons]
14. Douze parcelles de terrain sont divisées aléatoirement en 3 groupes. Le premier sert de témoin, les deux autres sont fertilisés respectivement avec les engrais A et B. Les rendements observés sont les suivants. Les engrais affectent-ils la production?
Témoin | A | B | |
Moyennes | 61 | 70 | 73 |
Variances | 20,6 | 14 | 17,3 |
On sait que la variance expliquée est de 156 et que la variance non expliquée est de 17,3.
15. Pour définir l'impact de la nature du sol sur la croissance d'une plante X, un botaniste a mesuré la hauteur des plantes pour 4 types de sol. Pour chaque type de sol, il disposait de 3 réplicats.
Type de sol |
||||
I | II | III | IV | |
15 | 25 | 17 | 10 | |
9 | 21 | 23 | 13 | |
4 | 19 | 20 | 19 | |
Moyennes | 9,33 | 21,67 | 20,00 | 14,00 |
variances | 30,33 | 9,33 | 9,00 | 21,00 |
16. Dans le cadre d'une étude écotoxicologique, la concentration en DDT et en ses dérivés a été mesurée chez des brochets de différents âges. Les résultats obtenus sont donnés, dans le tableau ci-dessous pour des échantillons de 11 individus chacun.
2 ans | 3 ans | 4 ans | 5 ans | 6 ans | |
moyennes | 0,18300 | 0,33763 | 0,45113 | 0,70738 | 1,19750 |
variances | 0,00035 | 0,00106 | 0,00024 | 0,00045 | 0,00125 |
Sachant que la variance expliquée par l'âge des brochets est de 1,260770 et que la variance résiduelle est de 0,000672, que peut-on conclure sur cette étude? [source:http://www.obs-vlfr.fr/~enseigne/maitp6/solution_anova/anvexo3.htm]
Test de conformité d'une moyenne (test de Z Unidirectionnel)
H0: µ1 = µ0
H1: µ1 < µ0
zobservé = -2,77
Pour α=5%, Ztables = -1,64, donc on conclut RH0 car zobservé inférieur à Ztables
Pour α=1% Ztables = -2,33, donc on conclut RH0 car zobservé inférieur à Ztables
Conclusion: La prise du contraceptif X provoque une diminution hautement significative de la concentration en LH. L'ovulation ne peut avoir lieu. [retour aux énoncés]
Homogénéité des variances:
H0: σ²1 = σ²2
H1: σ²1 ≠ σ²2
Fobs= (427,68/99) / (281,24/79) = 1,21
F0,975; 99dl; 79dl = 1,53
Fobs < F0,975; 99dl; 79dl donc il y a AH0 -> On n'a pas pu montrer que les variances étaient différentes. Le test d'hypothèses portant sur les moyennes est donc réalisable.
Test d'hypothèses:
Comparaison de 2 moyennes tirées d'échantillons indépendants (test de t unidirectionnel à gauche si nous prenons les femmes belges comme référence)
H0: µB = µF
H1: µB > µF
Sr²obs=( 427,68+281,24)/(100+80-2) = 3,98
tobs = (1,78-2,12)/(3,98*(1/100+1/80))0,5= -1,136 NDLR: X0,5= racine de x
t0,05; 178dl = -1,653
tobs supérieur à t0,05; 178dl donc conclusion: AH0, nous n'avons pas pu montrer que les femmes françaises étaient moins fécondes que les femmes belges
[retour aux énoncés]3. Les boulons:
Test unidirectionnel à droite (par exemple) avec une valeur critique
µ + valeur des tables*ET/(n)0,5
Rendre l'intervalle de confiance 5 fois plus petit signifie que la valeur critique devient:
µ + valeur des tables*ET/(n)0,5 * (1/5)
ou encore:
µ + valeur des tables*ET/(25*n)0,5
et donc, l'échantillon doit être 25 fois plus grand. Soit 2500 pièces pour être sûr de voir une augmentation de l'écart à la normalité.
[retour aux énoncés]
4. Consommation en Irlande et en Angleterre:
Sur base de l'énoncé on peut postuler : µ0 = 1%; µ1=1,5%; S²=1,9%²
La consultation de la dernière ligne de la table de Student nous donne les valeurs de z suivantes :
Z1-alpha = Z0,95 = 1,645
Z1-beta = Z0,99 = 2,326
En appliquant la formule disponible dans votre formulaire :
En prenant 120 ménages dans les deux pays étudiés, nous pourrons voir cette différence de dépenses.[retour aux énoncés]
Test de comparaison de 2 moyennes tirées de 2 populations indépendantes.
1°) Test de lhomogénéité des variances
H0: σ²1=σ²2 H1: σ²1 différent de σ²2 |
Fobservé = 0.011/0.007 = 1.57 |
Ftables (6 dl; 10 dl; 0.975) = 4.07 |
Fobservé inférieur à Ftables donc on conclut AH0 (je nai pas pu montrer l'hétérogénéité des variances)
2°) Comparaison des moyennes:
H0: µ1 = µ2 H1: µ1 différent de µ2 |
tobservé = 1.77 avec Sr²observé = 0.0085 |
ttables (16 dl; 0.975) = 2.12 |
tobservé inférieur à ttables donc on conclut AH0 pour α=5%.
[retour aux énoncés]
6. Un procédé de fabrication de tubes T.V.
Test de conformité d'une moyenne (test de Z Unidirectionnel)
H0: µ1=µ0
H1: µ1 supérieur à µ0
Zobservé= 2.17
5% Ztables = 1.64 RH0 car Zobservé supérieur à Ztables
Conclusion: Le nouveau procédé de fabrication possède une durée de vie significativement plus importante que lancien procédé.
7. Un enseignant et ses groupes détudiants:
Test de comparaison de 2 moyennes tirées de 2 populations indépendantes.
A. Entre A et B:
1°) Test de lhomogénéité des variances
H0: σ²A = σ²B H1: σ²A différent de σ²B |
Fobservé = 4.69 |
Ftables (16 dl; 16 dl; 0.975) = 2.76 |
Fobservé supérieur à Ftables donc on conclut RH0 (les variances ne sont pas identiques)
Impossible de comparer les moyennes tirées déchantillons dont les variances sont hétérogènes.
B. Entre A et C:
1°) Test de lhomogénéité des variances
H0: σ²A = σ²C H1: σ² différent de σ²C |
Fobservé = 1.16 |
Ftables (16 dl; 16 dl; 0.975) = 2.76 |
Fobservé inférieur à Ftables donc on conclut AH0 (les variances sont homogènes)
2°) Comparaison des moyennes:
H0: µA = µC H1: µA supérieur à µC |
tobservé = 2.39 avec S²observé = 16.0998 |
ttables (32 dl; 0.95) = 1.697 ttables (32 dl; 0.99) = 2.457 |
Le groupe A possède une moyenne significativement plus grande que la moyenne du groupe C. Ce test nest pas hautement significatif.
C. Entre B et C:
1°) Test de lhomogénéité des variances
H0: σ²B = σ²C H1: σ²B différent de σ²C |
Fobservé = 4.04 |
Ftables (16 dl; 16 dl; 0.975) = 2.76 |
Fobservé supérieur à Ftables donc on conclut RH0 (les variances ne sont pas identiques)
Impossible de comparer les moyennes tirées déchantillons dont les variances sont hétérogènes.
[retour aux énoncés]Test de comparaison entre deux échantillons tirés de populations pairées (les mêmes patients, les mêmes prélèvements MAIS des méthodes différentes).
H0: µA = µB H1: µA différent de µB |
tobservé = 3.26 |
ttables (9dl; 0.975) = 2.262 ttables (9dl; 0.995) = 3.25 |
Les 2 méthodes danalyses des triglycérides donnent des résultats très différents (différence très significative).
[retour aux énoncés]9. Techniques de mesure de température sur un troupeau de 30 vaches:
Test de comparaison entre deux échantillons tirés de populations pairées (les mêmes vaches, les mêmes températures MAIS des techniques différentes).
H0: µmercure = µinfra-rouge H1: µmercure différent de µinfra-rouge |
tobservé = 1.99 |
ttables (29 dl; 0.975) = 2.045 |
Nous n'avons pas pu montrer que les 2 techniques danalyses de la température donnaient des résultats différents.
[retour aux énoncés]10. Influence du cadmium sur le taux de glucose dans le sang chez la truite:
Nous pouvons donc réaliser un test de comparaison de 2 moyennes tirées de 2 populations indépendantes et rechercher un Z observé (car les variances des populations avec et sans Cd sont connues et valent respectivement 5 et 10 (mg de glucose/l)² ).
H0: msans Cd = mavec Cd H1: msans Cd supérieur à mavec Cd |
Zobservé = 5,039 |
z(tables 0.95) = 1.645 z(tables 0.99) = 2.326 |
Le Cd augmente la glycémie de manière hautement significative (RH0 à alpha = 1%)
[retour aux énoncés]