Para uma única variada tendo uma
distribuição
com população média
conhecida
, a variância da população
, geralmente também escrito
, é definido como
|
(1)
|
Onde é a media da
população é
denota o valor
esperado
. Para uma distribuição discreta com
valores possíveis de
, a variância da população é, portanto
|
(2)
|
Ao passo que para uma distribuição
contínua, é dada pela
|
(3)
|
A variância é, por conseguinte,
igual ao Segundo momento central .
Note que é preciso algum cuidado na
interpretação com uma variância, em vez de um símbolo
também é vulgarmente
utilizada como um parâmetro relacionado, mas não é equivalente à raiz quadrada
da variância, por exemplo, na distribuição log-normal, distribuição de Maxwell,
e da distribuição de Rayleigh..
Se a distribuição subjacente não é
conhecida, então a variância da amostra pode ser calculada como
|
(4)
|
Onde é a media da amostra.
Note-se que a variância da amostra definido acima não é
um estimador não tendencioso para a variância da população
. A fim de obter um estimador para
, é necessário definir uma vez "variância da amostra
viés corrigida"
|
(5)
|
A distinção entre e
é uma fonte comum de
confusão, e um cuidado extremo deve ser exercido ao consultar a literatura para
determinar qual convenção está em uso, especialmente desde a notação
uninformative é comumente usada para ambos. A amostra variância viés corrigida
para uma lista de
dados é implementada como Variância[list].
A raiz quadrada da variância é
conhecido como o desvio padrão.
A razão pela qual dá um estimador
tendencioso da variância da população que são dois parâmetros livres
e
estão realmente a ser calculados a partir dos dados em si. Em
tais casos, é apropriado utilizar uma distribuição t de Student, em vez de uma
distribuição normal como modelo uma vez que, vagamente falando, a distribuição
t de Student é o "melhor" que pode ser feita sem o saber
.
Formalmente, a fim de estimar a
variância da população a partir de uma amostra de
elementos com um desconhecido à priori significa (ou seja, a
média é calculada a partir da própria amostra), precisamos de um estimador
imparcial para
. Esta é dada pela k-estatística
, onde
|
(6) |
e é a variância não
corrigida de viés.
Acontece que a quantidade tem uma distribuição do Qui-quadrado.
Para um conjunto de dados , a variância dos dados obtidos por uma transformação linear
é dada pela
|
|
|
(7)
|
|
|
|
(8)
|
|
|
|
(9)
|
|
|
|
(10)
|
|
|
|
(11)
|
|
|
|
(12)
|
Para múltiplas variáveis, a
variância é dada usando a definição de covariância,
|
|
|
(13)
|
|
|
|
(14)
|
|
|
|
(15)
|
|
|
|
(16)
|
|
|
|
(17)
|
A soma linear tem uma forma semelhante:
|
|
|
(18)
|
|
|
|
(19)
|
|
|
|
(20)
|
Estas equações podem ser expressas
utilizando a matriz da covariância.