imprimer

Module 40:

Il existe deux grands types de distributions : les distributions discontinues (ou discrètes) et les distributions continues.

Les distributions discrètes

Nous envisageons des variables discrètes (X) qui ne peuvent prendre que des valeurs entières positives ou nulles. Elles se représentent par un diagramme de barres avec, en abscisse, les valeurs individuelles xi et, en ordonnée, la densité de fréquences relatives, qui est égale à la fréquence relative (Δx=1)

Exemple: Parmi ces distributions figurent les distributions binomiales et de Poisson.

Les distributions continues

Nous envisageons des variables continues (X) qui peuvent prendre n'importe quelles valeurs entre deux bornes, éventuellement entre + ou - l'infini.

La différence entre deux valeurs x et x+Δx tend vers 0 et donc P(X=xi)=0.

Les distributions continues se représentent, dans la population, par une fonction de densité de probabilité et dans l'échantillon par un histogramme.

Pour établir un histogramme, les valeurs xi doivent être regroupées en classes.

La variable X est représentée en abscisse. En ordonnée, on représente la densité de fréquences relatives ou, pour n tendant vers l'infini, la densité de probabilités.

Exemple: Parmi ces distributions figurent les distributions normales, normales réduites et chi-carré

Variables aléatoires discrètes et continues

Les distributions discrètes binomiales et de Poisson sont utilisées pour modéliser, à priori, (sans réaliser aucune observation dans un échantillon), la distribution de probabilité de la variable X. Ces deux distributions se représentent par des diagrammes de barres et s’emploient dans les conditions particulières suivantes :

Ces deux distributions convergent vers une seule et même distribution lorsque :
X v.a. Bi (n;) avec n supérieur à 25 et proche de 0,5

De la loi binomiale à la loi Normale

avec m =n.

et s2=n.(1-)

X v.a. Po (µ) avec µ supérieur à 10

De la loi de Poisson à la loi Normale

La variable aléatoire normale est caractérisée par sa moyenne et sa variance   Cette distribution devient continue et se modélise par une courbe de Gauss-Laplace : c’est la variable aléatoire normale X v.a. N (µ ; σ²). La plupart des variables biologiques obéissent à un tel modèle. Il existe une moyenne et une variance propre à chaque variable, compliquant de ce fait le calcul des probabilités sous la courbe.

Afin de faciliter le calcul de probabilités, il est possible de créer une variable aléatoire normale dépourvue d’unités, centrée sur 0 et de variance 1 : c’est la variable aléatoire réduite Z [ Z v.a. N (0 ;1)]. Elle a été totalement caractérisée et les probabilités calculées pour un grand nombre d'intervalles z+Dz.

Généralisation de la Normale par réduction de X en Z

Une simple transformation d’une variable aléatoire normale X permet d'obtenir Z et donc d’évaluer rapidement les probabilités correspondantes. La conversion se fait par l’intermédiaire de la formule suivante :

zi = (xi-µ)/Sigma

Dans certains contextes expérimentaux, l’expérimentateur est amené à comparer des fréquences observées (fobs) dans l’échantillon par rapport aux fréquences prédites par un modèle (fth).

Cette comparaison se fait par le calcul d’écarts quadratiques standardisés (chi-carré observé) : pour chaque catégorie (classe), il est possible de calculer des différences observées réduites (chi carré)

distribution de chi-carré

Comparons la formule de z et de chi carré:

z= (x-µ)/σ

chi carré observé= (fobs-fth)2/fth

basée sur la propriété d'une v.a. Po avec Pi=σ2 qui est plus ou moins égal à fth;

La somme des chi carrés observés pour toutes les classes est donc une somme de z2, modélisée par une distribution chi carré pour (k-1) degré de liberté, où k est le nombre de termes de cette somme.

La valeur chi carré observée doit donc être comparée à une distribution chi carré (k-1)

 

Une étude est réalisée sur une population de chauve-souris. L’envergure moyenne est, selon des publications très sérieuses, de (375 ± 15) millimètres.


Exercice 2

La pression sanguine chez le rat suit un modèle de Gauss-Laplace. Elle est de 120 mm de Mercure pour une variance de 100 mm².

  1. De quel type de variable aléatoire parle-t-on ? Définissez-la en employant la symbolique vue au cours.
  2. Quelles sont les limites de pression sanguine telles que la pression sanguine la plus petite de cette zone est inférieure ou égale à 95 % et la plus grande inférieure ou égale à 99 % ? Faites apparaître vos réponses dans un tableau tel que :

    Si s vaut : … mm

    Limite inférieure

    Limite supérieure

    P(XInferieur ou egalxi)=…

    Zi vaut …

  3. Déterminez les limites de l’intervalle autour de moyenne permettant d’isoler 68 % ; 95 % et 99 % pour la population de chauves-souris adultes mâles sachant que la pression sanguine moyenne est aussi de 120 mais la variance est quatre fois moindre par rapport à la variabilité de la population prise dans sa totalité. Comme au point précédent, réalisez un tableau pour résumer vos résultats. Définissez symboliquement cette sous-population.
  4. Lorsque la variance diminue, comme c’est le cas dans cet exercice, comment évolue la fonction f(x), notamment au niveau de la densité de probabilité lorsque X = µ ? Comparez ces valeurs pour la population totale de chauves-souris et la sous-population des mâles.