Empirisk varians og frihetsgrader!

dan · 23/02-2013 00:14

Hei!

I boka "Modern mathematical statistics with applications" tilbys formelen

[tex] S^2 = \frac{\sum(x_i - \bar{x})^2}{n-1}[/tex] som empirisk varians (sample variance).

I boka nevnes det ingen grunn for hvorfor vi deler på n-1 og ikke n, som virker intuitivt.

Etter en del googling ser jeg at forklaringen er at det å dele på n-1 gir et svar som ligger nærmere sen sanne variansen til poulasjonen enn dersom en deler på n. Men hvordan kan dette ha seg?

Jeg har ennå tilgode å finne en forklaring på dette som ikke er vag

Takk!

2357 · 23/02-2013 00:29

Boken tilbyr en forklaring. I eksempel 7.6 viser de at [tex]S^2[/tex] er forventningsrett. Det vil si at forventningen til observatoren er lik parameteren man forsøker å estimere.

dan · 23/02-2013 00:32

Uff, jeg får moderere meg litt;

Boken hadde altså enn så lenge ikke gitt noen forklaring

Takk!

23/02-2013 00:51

Ah, Bessel's korreksjon.

Sånn helt generelt så deler vi på n-1 istedet for n, siden den opprinnelige formelen er ubalansert nedover. Ved å senke nevneren retter vi noe opp for denne ubalansen, siden mindre nevner betyr at brøken i sin helhet får større verdi (gitt at både teller og nevner er positive).

Hva står det forresten om det i boka di? Jeg fikk beskjed av læreren om å bare "la det ligge", siden det ikke var forventet at vi skulle kunne gjøre rede for det =/

dan · 23/02-2013 10:26

I eksempelet som ble nevnt over blir det gjort godt rede for grunnen.

Hvis du lurer, Aleks, så blir forklaringen "the xi's tend to be closer to their average x-bar than the population average m, so to compensate for this the division with (n-1) is used rather than n".

Men som sagt, så forklares alt i eksempelet noen kapitler senere.