Imaginons un modèle qui répartisse
les observations en trois catégories, par exemple les produits
AA, Aa et aa de plusieurs croisements hétérozygotes, de
probabilité 25%, 50% et 25% respectivement. Effectuons 5 fois lexpérience
qui consiste à relever la fréquence de chaque phénotype :
N°
|
AA
|
Aa
|
aa
|
obs
|
|
|
|
|
|
1
|
27
|
49
|
20
|
1.06
|
2
|
17
|
53
|
31
|
4.13
|
3
|
27
|
46
|
22
|
0.62
|
4
|
22
|
46
|
27
|
0.62
|
5
|
28
|
53
|
17
|
3.12
|
Comment sont calculées ces valeurs ?
Ligne 1: 27+49+20=96 données, ce qui donne des fréquences théoriques de 24, 48, et 24 (25%, 50%, 25% de 96).
Le Chi²observé est donc = (27-24)2/24 + (49-48)2/48 + (20-24)2/24 = 1.0625, c'est à dire 1.06 si on arrondit à deux chiffres significatifs.
Répétition de lexpérience,
fréquences observées et valeurs de Chi²observé
Considérons la probabilité
a priori de 10 acides aminés de se trouver dans une hélice
alpha et dénombrons leur fréquence dans 4 protéines.
Acide aminé
|
Probabilité
|
Protéines
|
|
|
1
|
2
|
3
|
4
|
Ile
|
0.03
|
4
|
3
|
3
|
3
|
Asn
|
0.05
|
8
|
5
|
8
|
4
|
Val
|
0.07
|
12
|
7
|
8
|
4
|
Thr
|
0.07
|
5
|
8
|
7
|
9
|
Tyr
|
0.07
|
9
|
7
|
10
|
5
|
Leu
|
0.13
|
8
|
15
|
15
|
12
|
Pro
|
0.13
|
14
|
13
|
12
|
13
|
Glu
|
0.15
|
9
|
18
|
16
|
17
|
Gly
|
0.15
|
17
|
12
|
16
|
10
|
Met
|
0.15
|
12
|
16
|
18
|
20
|
total
|
1
|
98
|
104
|
113
|
97
|
2
obs
|
|
12.32
|
1.49
|
2.35
|
6.40
|
Probabilités, fréquences
observées et Chi² observé pour 10 acides aminés répertoriés
dans les hélices alpha de 4 protéines.
Si lon répète
lexpérience sur un plus grand nombre de protéines,
on observe une distribution de Chi²observé
qui peut se comparer à une distribution théorique de Chi² avec 9 degrés de liberté.
Comparaison des écarts quadratiques standardisés à la distribution théorique de khi-carré avec 9 degrés de liberté :
|