La variance permet de caractériser la dispersion des valeurs par rapport à la moyenne.
![]() |
(1)
|
Pour une distribution discrète avec N valeurs possibles de , la variance de la population est :
![]() |
(2)
|
tandis que pour une distribution continue, on a :
![]() |
(3)
|
Attention à bien interpréter comme la variance, car le symbole
est aussi généralement utilisé comme paramètre mais non-équivalent à la
racine carrée de la variance (comme par exemple pour la loi
log-normale, la loi de Maxwell, et la loi de Rayleigh).
Si la distribution est inconnue alors, la variance se définit comme suit :
![]() |
(4)
|
où est l'échantillon moyen
Remarquons que la variance d'échantillon définie ci dessus n'est pas une estimation non-biaisée de la variance de la population
. Afin d'obtenur une estimation non-biaisée pour
, il faut plutôt définir une "variance d'échantillon corrigée"
![]() |
(5)
|
La différence entre et
prête souvent à confusion, donc attention à bien définir quelle convention est utilisée, surtout lorsque le
est communément utilisé pour les deux. La variance d'échantillon corrigée
pour une liste de données est implémentée comme Variance[list].
La racine carrée de la variance est connue comme étant l'écart type.
Si donne une estimation biaisée de la variance c'est parce que deux paramètres libres
et
sont estimés à partir de la donnée. Dans de pareils cas, il est
conseillé d'utiliser une loi de Student au lieu d'une loi normale, car
la loi de Student est la meilleure option si l'on ne connaît pas
(pour rappel, la loi de Student permet de déterminer l'intervalle
de confiance de l'estimateur de l'espérance d'une loi normale dont la
variance est inconnue).
Afin d'estimer la variance d'échantillon de
éléments avec une moyenne à priori inconnue, il nous faut un estimateur sans biais pour
. Ceci nous est fourni par la statistique-k
, où
![]() |
(6)
|
et est la variance variance d'échantillon non corrigée uncorrected.
Ainsi, la quantité a une loi du
(« khi-deux » ou « khi carré »).
Pour un ensemble de données , la variance de la donnée obtenue par une transformation linéaire est donnée par :
![]() | ![]() | ![]() |
(7)
|
![]() | ![]() | ![]() |
(8)
|
![]() | ![]() | ![]() |
(9)
|
![]() | ![]() | ![]() |
(10)
|
![]() | ![]() | ![]() |
(11)
|
![]() | ![]() | ![]() |
(12)
|
Pour des variables multiples, la variance est obtenue en utilisant la définition de la covariance,
![]() | ![]() | ![]() |
(13)
|
![]() | ![]() | ![]() |
(14)
|
![]() | ![]() | ![]() |
(15)
|
![]() | ![]() | ![]() |
(16)
|
![]() | ![]() | ![]() |
(17)
|
Une somme linéaire à une forme similaire :
![]() | ![]() | ![]() |
(18)
|
![]() | ![]() | ![]() |
(19)
|
![]() | ![]() | ![]() |
(20)
|
Ces équations peuvent s'exprimer au moyen de la matrice de covariance.