Per una singola variabile X avente una distribuzione P(x) con known population mean mu, la population variance var(X), comunemente scritta come sigma^2, è definita come

 sigma^2=<(X-mu)^2>,
(1)

dove mu è la media della popolazione e <X> denota il valore atteso di X. Per una distribuzione discreta con N i possibili valori di x_i, la varianza della popolazione è pertanto

 sigma^2=sum_(i=1)^NP(x_i)(x_i-mu)^2,
(2)

mentre per una distribuzione continua, è data da

 sigma^2=intP(x)(x-mu)^2dx.
(3)

La varianza è quindi uguale al secondo momento centrale mu_2.

Si noti che è necessaria una certa attenzione nell\'interpretare sigma^2 come una varianza, poiché il simbolo sigma è anche comunemente usato come un parametro correlato ma non equivalente alla radice quadrata della varianza, per esempio nella distribuzione logaritmica normale, nella distribuzione diMaxwell e in quella di Rayleigh.

Se la distribuzione sottostante non è conosciuta, allora la varianza campione può essere calcolata come

 s_N^2=1/Nsum_(i=1)^N(x_i-x^_)^2,
(4)

dove x^_ è la media campionaria.

Si noti che il campione varianza s_N^2 sopra definito non è uno stimatore corretto per la varianza della popolazione sigma^2. Per ottenere uno stimatore obiettivo per sigma^2, è necessario definire invece una "bias-varianza corretta del campione"

 s_(N-1)^2=1/(N-1)sum_(i=1)^N(x_i-x^_)^2.
(5)

La distinzione tra s_N^2 e s_(N-1)^2 è una comune fonte di confusione, e la cura estrema dovrebbe essere esercitata quando si consulta la letteratura per determinare quale convenzione è in uso, tanto più che la notazione disinformativa s è comunemente utilizzato per entrambi. La bias-varianza corretta del campione s_(N-1)^2 per un elenco di dati è implementata come Varianza[list].

La radice quadrata della varianza è nota come la deviazione standard.

La ragione per cui s_N^2 dà uno stimatore distorto della varianza della popolazione è che i due parametri liberi mu e sigma^2 vengono di fatto stimati sulla base dei dati stessi. In tali casi, è opportuno utilizzare la distribuzione t dello Studente invece di una distribuzione normale come modello, molto in senso lato, la distribuzione t dello Studente è la "migliore" che può essere utilizzata senza conoscere sigma^2.

Formalmente, per stimare la varianza della popolazione sigma^2 da un campione di n elementi con una priorità sconoscita significa che (cioè, la media è stimata dal campione stesso), abbiamo bisogno di uno stimatore per sigma^2. Questa è data da k-statistic k_2=sigma^^^2, dove

 k_2=N/(N-1)m_2
(6)

e m_2=s_N^2 è un esempio di varianza non corretta per bias.

Risulta che la quantità Ns_N^2/sigma^2 ha una distribuzione chi-quadrata.

Per un insieme di dati X, la varianza dei dati si ottiene da una trasformazione lineare che è ottenuta da

var(aX+b)=<[(aX+b)-<aX+b>]^2>
(7)
=<(aX+b-a<X>-b)^2>
(8)
=<(aX-amu)^2>
(9)
=<a^2(X-mu)^2>
(10)
=a^2<(X-mu)^2>
(11)
=a^2var(X)
(12)

Per variabili multiple, la varianza è ottenuta usando la definizione di covarianza,

var(sum_(i=1)^(n)X_i)=cov(sum_(i=1)^(n)X_i,sum_(j=1)^(n)X_j)
(13)
=sum_(i=1)^(n)sum_(j=1)^(n)cov(X_i,X_j)
(14)
=sum_(i=1)^(n)sum_(j=1; j=i)^(n)cov(X_i,X_j)+sum_(i=1)^(n)sum_(j=1; j!=i)^(n)cov(X_i,X_j)
(15)
=sum_(i=1)^(n)cov(X_i,X_i)+sum_(i=1)^(n)sum_(j=1; j!=i)^(n)cov(X_i,X_j)
(16)
=sum_(i=1)^(n)var(X_i)+2sum_(i=1)^(n)sum_(j=i+1)^(n)cov(X_i,X_j).
(17)

Una somma lineare è della forma:

var(sum_(i=1)^(n)a_iX_i)=cov(sum_(i=1)^(n)a_iX_i,sum_(j=1)^(n)a_jX_j)
(18)
=sum_(i=1)^(n)sum_(j=1)^(n)a_ia_jcov(X_i,X_j)
(19)
=sum_(i=1)^(n)a_i^2var(X_i)+2sum_(i=1)^(n)sum_(j=i+1)^(n)a_ia_jcov(X_i,X_j).
(20)

Queste equazioni possono essere scritte usando la matrice di covarianza.