imprimer

Module 140:

L'analyse de la variance à un critère de classification a pour but la comparaison des moyennes de nA populations, à partir d'échantillons aléatoires et indépendants prélevés dans chacune d'elles. Ces populations sont en général des variantes (ou niveaux na) d'un facteur contrôlé (ou facteur A) de variation.

Conditions

  1. le paramètre étudié suit une distribution normale
  2. les variances des populations sont toutes égales (HOMOSCEDASTICITE)
  3. les échantillons sont prélevés aléatoirement et indépendamment dans les populations

Procédure de calcul d'une ANOVA

  1. Déterminer si les échantillons varient de la même manière
  2. Si nous démontrons l'homogénéité des variances, alors, nous pouvons comparer les moyennes de ces échantillons

Le test de Hartley est utilisé lorsqu'il faut comparer des variances calculées à partir d'échantillons possédant des nombres identiques d'individus.

Rappel : la réalisation de ce test a été détaillée au module 125 page 2 .

Dans le cas d'une ANOVA, le test de Hartley est utilisé pour vérifier que tous les échantillons d'une expérience (s'ils ont des nombres d'individus identiques) ont des variances qui sont comparables. Ceci est indispensable pour s'assurer que les échantillons proviennent effectivement d'une même population de départ, et que si le facteur de variation utilisé dans l'expérience a eu un effet sur les données, il a bien induit une modification de moyenne, mais pas de variance.

Le test de Fisher est utilisé lorsque qu'il faut comparer 2 variances de deux échantillons possédant des nombres différents d'individus.

Rappel : la réalisation de ce test a été détaillée au module 125 page 3.

Dans le cas d'une ANOVA, le test de Fisher est utilisé pour comparer deux carrés moyens car les carrés moyens sont des variances, et qu'ils ont en général des nombres de degrés de liberté différents (ils sont donc calculés à partir de nombres d'individus différents).

Dans le cas d'une ANOVA1 le seul rapport de carrés moyens est :

Fobservé = CMF/CMR

On verra par la suite (régression dans l'ANOVA, ANOVA2, ANOVA multiples) qu'il peut y avoir d'autres rapports de carrés moyens à comparer en utilisant ce test.

H0: toutes les moyennes sont identiques
H1: au moins une des moyennes est différente des autres

Le calcul:

Si vous utilisez MS Excel, le plus simple est de réaliser un tableau tel que:

SCE
dl
CM
Fobservé
Fthéorique
Total
SCET
N-1
dlF et dlR
factoriel
SCEF
na-1
SCEF/dlF
CMF/CMR
alpha 5%
résiduel
SCER
N-na
SCER/dlR
alpha 1%

La formule de somme des carrés d'écarts est disponible dans MS Excel via le bouton fx (coller une fonction) dans la catégorie "statistique", chercher la formule SOMME.CARRES.ECARTS(série de données)

Convention d'écriture: Remarques:
  1. SCER =SCET-SCEF (premier niveau de vérification du tableau d'ANOVA)
  2. le CMR est aussi égal à la moyenne des variances (second niveau de vérification du tableau d'ANOVA)

Seuil de signification:

Dans les tables, il faut aller rechercher:

F dlfactoriel; dlrésiduel; (1-alpha)

Le test d'ANOVA est unilatéral (voir Dagnelie, Théorie et Méthodes statistiques, vol. 2)

Conclusion du test:

Lorsque le Fobservé est supérieur ou égal au Fthéorique (F des tables), il y a rejet de l'hypothèse nulle H0. Cela implique que l'on a réussi à mettre en évidence la présence d'au moins une moyenne différente des autres.

Fobs ≥ Ftables: RH0

On ne peut cependant pas dire avec précision la ou lesquelles des moyennes est ou sont différente(s) des autres:

Pour pouvoir tirer de telles conclusions, il est nécessaire d'effectuer des analyses complémentaires telles que les contrastes de Scheffé ou les contrastes orthogonaux (si ces derniers sont justifiés).

1. Dans une expérience portant sur des moutons, on observe l'effet d'une injection d'hormone sur la croissance pondérale. L'accroissement de poids (en kg) après trois semaines est mesuré chez un groupe témoin, et sur 3 groupes recevant une dose croissante de l'hormone. Ci-dessous, voici ce qui est mis à votre disposition:

  Doses
  Témoin 0,5 1 2  
Moyennes 3,05 4,60 5,63 6,13 4,85 moyenne générale
Variances 0,31 0,21 0,19 0,19 0,23 moyenne des variances
             
             
  SCE dl CM Fobs  
  Totale 76,62 47      
  Factorielle 66,68 ? ? ?  
  Résiduelle 9,94 ? ?    

Quelle est la taille d'un échantillon?

Quelles conclusions pouvez-vous en tirer?

Correction


2. Une industrie pharmaceutique désire tester trois stimulants de l'appétit (S1, S2, S3) en mesurant la capacité d'absorption de nourriture chez le rat. Quatre groupes de 12 rats sont constitués: le premier servant de témoin, les trois autres recevant respectivement les stimulants S1, S2 et S3. On mesure la quantité de nourriture (en kg) ingérée sur un mois. Ci-dessous, voici ce qui est mis à votre disposition:

  Témoin S1 S2 S3    
Moyennes 2,90 4,11 5,14 5,56 4,42 moyenne générale
Variances 2,11 0,99 0,35 1,05 1,13 moyenne des variances
             
             
SCE dl CM Fobs    
Totale 100,34 47        
Factorielle 50,69 3 16,90 14,97    
Résiduelle 49,66 44 1,13      

Quelles conclusions pouvez-vous en tirer?

Correction


3. Un ornithologue s'intéresse à l'évolution d'une espèce d'oiseaux répartie dans trois sites géographiquement distincts A, B et C, et plus particulièrement aux différences morphologiques engendrées par les mécanismes d'isolement. A cet effet, il a mesuré la longueur des ailes (en mm) de 10 oiseaux capturés sur chaque site. Les barrières géographiques ont-elles engendré des différences morphologiques sur cette espèce? On considère que les variances des échantillons sont comparables. Ci-dessous, voici ce qui est mis à votre disposition:

  A B C    
Moyennes 71,2 74,4 72,6 72,73 moyenne générale
Variance résiduelle:   4,31      
           
SCE dl CM Fobs  
Totale 167,84 29      
Factorielle 51,47 2 ? ?  
Résiduelle 116,37 27 ?    

Quelles conclusions pouvez-vous en tirer?

Correction


4. Pour fixer les quotas laitiers, on souhaite réaliser une estimation de la production laitière annuelle du cheptel de la Région Wallonne. Cette production varie évidemment d'un animal à l'autre, mais aussi, vraisemblablement, d'une région à l'autre. L'expérimentateur décide de prospecter trois régions: la Hesbaye, le Condroz et les Ardennes. Dans chaque région, il recueille les statistiques de production de dix vaches, prises au hasard dans différentes exploitations. Ci-dessous, voici ce qui est mis à votre disposition:

  Hesbaye Condroz Ardennes    
Moyennes 3714,8 4400,4 5157,4 4424,2 moyenne générale
Variances 696291,5 1184127,4 1244629,8 1041682,9 moyenne des variances
 
 
  SCE dl CM Fobs
  Totale 38539408,8 29    
  Factorielle 10413970,4 ? ? ?
  Résiduelle ? ? ?  

Quelles conclusions pouvez-vous en tirer?

Correction


5. Un hydrobiologiste s'intéresse à la teneur en phosphates de quatre lacs. Il effectue dans chaque lac 5 mesures indépendantes de la concentration en phosphates (microgrammes par litre). Analysez les résultats.

  Lac 1 Lac 2 Lac 3 Lac 4    
Moyennes 101,8 112,2 109,6 114,2 109,45 moyenne générale
Variances 22,7 18,7 19,3 14,7 18,85 moyenne des variances
 
             
SCE dl CM Fobs    
Totale 744,95 ?        
Factorielle ? ? ? ?    
Résiduelle 301,6 ? ?      

Quelles conclusions pouvez-vous en tirer?

Correction


6. Lors d'une étude sur l'effet de la teneur en calcium dans la nourriture des brebis, le poids frais (en g) du muscle semi-tendineux est mesuré sur les animaux de six groupes:
A : pas d'apport de sels minéraux
B,C,D : trois rations de sels minéraux sous forme de supplément
E,F : deux rations additionnées à la nourriture.
Ci-dessous, voici ce qui est mis à votre disposition:

  A B C D E F    
Moyennes 41,46 55,51 56,36 46,21 62,57 61,29 53,90 moyenne générale
Variances 198,01 287,11 120,84 318,48 69,26 145,73 189,90 moyenne des variances
                 
                 
SCE dl CM Fobs        
Totale ? ?            
Factorielle 2465,97 ? ? ?        
Résiduelle ? ? ?          

Quelles conclusions pouvez-vous en tirer?

Correction


7. Douze parcelles de terrain sont divisées aléatoirement en 3 groupes. Le premier sert de témoin, les deux autres sont fertilisés respectivement avec les engrais A et B. On effectue une mesure de rendement sur chaque parcelle. Ci-dessous, voici ce qui est mis à votre disposition:

  Témoin: A: B:    
Moyennes 61 70 73 68 moyenne générale
Variances 20,67 14 17,33 17,33 moyenne des variances
           
SCE dl CM Fobs  
Totale ? ?      
Factorielle 312 2 ? ?  
Résiduelle 156 ? ?    

Quelles conclusions pouvez-vous en tirer?

Correction


1. Dans une expérience portant sur des moutons, on observe l'effet d'une injection d'hormone sur la croissance pondérale. L'accroissement de poids (en kg) après trois semaines est mesuré chez un groupe témoin, et sur 3 groupes recevant une dose croissante de l'hormone. Ci-dessous, voici ce qui est mis à votre disposition:

  Doses
  Témoin 0,5 1 2  
Moyennes 3,05 4,60 5,63 6,13 4,85 moyenne générale
Variances 0,31 0,21 0,19 0,19 0,23 moyenne des variances
             
             
  SCE dl CM Fobs  
  Totale 76,62 47      
  Factorielle 66,68 3 22,23 96,65  
  Résiduelle 9,94 44 0,23    

Quelle est la taille d'un échantillon ?
De l'énoncé on sait qu'il y a 4 groupes (3+1 témoin), et si dlSCET=47 c'est qu'il y a 48 moutons en tout, soit 12 par échantillon.

Quelles conclusions pouvez-vous en tirer?
Commençons par tester l'homoscédasticité des 4 échantillons :
Hobs=0,31/0,19=1,63 donc Hobs<Htables (entre 5,67 et 4,79) donc on accepte l'hypothèse nulle et on peut faire l'ANOVA.
Pour l'ANOVA Fobs> F tables pour alpha=0,001 (F(0,001;3;44)=compris entre 6,60 et 6,34) donc l'influence de l'hormone sur la croissance pondérale des moutons est très hautement significative.

Retour à la page des exercices


2. Une industrie pharmaceutique désire tester trois stimulants de l'appétit (S1, S2, S3) en mesurant la capacité d'absorption de nourriture chez le rat. Quatre groupes de 12 rats sont constitués: le premier servant de témoin, les trois autres recevant respectivement les stimulants S1, S2 et S3. On mesure la quantité de nourriture (en kg) ingérée sur un mois. Ci-dessous, voici ce qui est mis à votre disposition:

  Témoin S1 S2 S3    
Moyennes 2,90 4,11 5,14 5,56 4,42 moyenne générale
Variances 2,11 0,99 0,35 1,05 1,13 moyenne des variances
             
             
SCE dl CM Fobs    
Totale 100,34 47        
Factorielle 50,69 3 16,90 14,97    
Résiduelle 49,66 44 1,13      

Quelles conclusions pouvez-vous en tirer?
Commençons par tester l'homoscédasticité des 4 échantillons :
Hobs=2,11/0,35=6,02 donc Hobs> Htables (entre 5,67 et 4,79) donc on refuse l'hypothèse nulle et on ne peut pas faire l'ANOVA.

Retour à la page des exercices


3. Un ornithologue s'intéresse à l'évolution d'une espèce d'oiseaux répartie dans trois sites géographiquement distincts A, B et C, et plus particulièrement aux différences morphologiques engendrées par les mécanismes d'isolement. A cet effet, il a mesuré la longueur des ailes (en mm) de 10 oiseaux capturés sur chaque site. Les barrières géographiques ont-elles engendré des différences morphologiques sur cette espèce? On considère que les variances des échantillons sont comparables. Ci-dessous, voici ce qui est mis à votre disposition:

  A B C    
Moyennes 71,2 74,4 72,6 72,73 moyenne générale
Variance résiduelle:   4,31      
           
SCE dl CM Fobs  
Totale 167,84 29      
Factorielle 51,47 2 25,735 5,97  
Résiduelle 116,37 27 4,31    

Quelles conclusions pouvez-vous en tirer?
On vous précise que les échantillons ont des variances comparables donc on passe directement à l'ANOVA:
CMF=51,47/2= 25,735
CMR=116,37/27=4,31
Fobs=25,735/4,31=5,97
Ftable compris entre 3,37 et 3,34 pour alpha=0,05, compris entre 5,53 et 5,45 pour alpha=0,01, compris entre 9,12 et 8,93 pour alpha=0,001. Nous rejetons donc l'hypothèse nulle à alpha=0,05 et alpha=0,01, et on l'accepte à alpha=0,001: L'effet étudié est donc très significatif.

Retour à la page des exercices


4. Pour fixer les quotas laitiers, on souhaite réaliser une estimation de la production laitière annuelle du cheptel de la Région Wallonne. Cette production varie évidemment d'un animal à l'autre, mais aussi, vraisemblablement, d'une région à l'autre. L'expérimentateur décide de prospecter trois régions: la Hesbaye, le Condroz et les Ardennes. Dans chaque région, il recueille les statistiques de production de dix vaches, prises au hasard dans différentes exploitations. Ci-dessous, voici ce qui est mis à votre disposition:

  Hesbaye Condroz Ardennes    
Moyennes 3714,8 4400,4 5157,4 4424,2 moyenne générale
Variances 696291,5 1184127,4 1244629,8 1041682,9 moyenne des variances
 
 
  SCE dl CM Fobs
  Totale 38539408,8 29    
  Factorielle 10413970,4 2 5206985.2 4.99
  Résiduelle 28125438.4 27 1041682.904  

Quelles conclusions pouvez-vous en tirer?
Homoscédasticité: 1244629,8/696291,5=1,787 < 5,34 (H pour 3 et 9 dl) donc on accepte l'idée que les variances sont homogènes, donc on peut réaliser l'ANOVA.
ANOVA: Ftable compris entre 3,37 et 3,34 pour alpha=0,05, et compris entre 5,53 et 5,45 pour alpha=0,01, donc nous refusons l'hypothèse nulle à alpha=0,05 et on l'accepte à alpha=0,01: L'effet étudié est significatif.

Retour à la page des exercices


5. Un hydrobiologiste s'intéresse à la teneur en phosphates de quatre lacs. Il effectue dans chaque lac 5 mesures indépendantes de la concentration en phosphates (microgrammes par litre). Analysez les résultats.

  Lac 1 Lac 2 Lac 3 Lac 4    
Moyennes 101,8 112,2 109,6 114,2 109,45 moyenne générale
Variances 22,7 18,7 19,3 14,7 18,85 moyenne des variances
 
             
SCE dl CM Fobs    
Totale 744,95 19        
Factorielle 443,35 3 147,78 7,84    
Résiduelle 301,6 16 18,85      

Quelles conclusions pouvez-vous en tirer?
Homoscédasticité: 22,7/14,7=1,54 < 20,6 (H pour 4 et 4 dl) donc on accepte l'hypothèse que les variances sont homogènes, donc on peut réaliser l'ANOVA.
ANOVA: Ftable=3,24 pour alpha=0,05, Ftable=5,29 pour alpha=0,01, Ftable=9,00 pour alpha=0,001, donc nous refusons l'hypothèse nulle à alpha=0,05 et alpha=0,01, mais nous l'acceptons à alpha=0,001 : L'effet étudié est très significatif.

Retour à la page des exercices


6. Lors d'une étude sur l'effet de la teneur en calcium dans la nourriture des brebis, le poids frais (en g) du muscle semi-tendineux est mesuré sur les animaux de six groupes:
A : pas d'apport de sels minéraux
B,C,D : trois rations de sels minéraux sous forme de supplément
E,F : deux rations additionnées à la nourriture.
Ci-dessous, voici ce qui est mis à votre disposition:

  A B C D E F    
Moyennes 41,46 55,51 56,36 46,21 62,57 61,29 53,90 moyenne générale
Variances 198,01 287,11 120,84 318,48 69,26 145,73 189,90 moyenne des variances
                 
                 
SCE dl CM Fobs        
Totale ? ?            
Factorielle 2465,97 ? ? ?        
Résiduelle ? ? ?          

Quelles conclusions pouvez-vous en tirer?
Il n'y a pas assez de données pour résoudre cet exercice.

Retour à la page des exercices


7. Douze parcelles de terrain sont divisées aléatoirement en 3 groupes. Le premier sert de témoin, les deux autres sont fertilisés respectivement avec les engrais A et B. On effectue une mesure de rendement sur chaque parcelle. Ci-dessous, voici ce qui est mis à votre disposition:

  Témoin: A: B:    
Moyennes 61 70 73 68 moyenne générale
Variances 20,67 14 17,33 17,33 moyenne des variances
           
SCE dl CM Fobs  
Totale 468 11      
Factorielle 312 2 156 9  
Résiduelle 156 9 17,33    

Quelles conclusions pouvez-vous en tirer?
Homoscédasticité: 20,67/14=1,47< 27,8 (H pour 3 et 3 dl) donc on accepte l'idée que les variances sont homogènes, donc on peut réaliser l'ANOVA.
ANOVA: Ftable=4,26 pour alpha=0,05, Ftable=8,02 pour alpha=0,01, 16,4 pour alpha=0,001. Donc nous refusons l'hypothèse nulle pour alpha=0,05 et alpha=0,01, et nous l'acceptons à alpha=0,001 : L'effet étudié est très significatif.

Retour à la page des exercices