Empirisk varians og frihetsgrader!

Her kan du stille spørsmål vedrørende problemer og oppgaver i matematikk på høyskolenivå. Alle som har kunnskapen er velkommen med et svar. Men, ikke forvent at admin i matematikk.net er spesielt aktive her.

Moderatorer: Vektormannen, espen180, Aleks855, Solar Plexsus, Gustav, Nebuchadnezzar, Janhaa

Svar
dan
Dirichlet
Dirichlet
Innlegg: 188
Registrert: 25/09-2010 16:38

Hei!

I boka "Modern mathematical statistics with applications" tilbys formelen

[tex] S^2 = \frac{\sum(x_i - \bar{x})^2}{n-1}[/tex] som empirisk varians (sample variance).

I boka nevnes det ingen grunn for hvorfor vi deler på n-1 og ikke n, som virker intuitivt.

Etter en del googling ser jeg at forklaringen er at det å dele på n-1 gir et svar som ligger nærmere sen sanne variansen til poulasjonen enn dersom en deler på n. Men hvordan kan dette ha seg?

Jeg har ennå tilgode å finne en forklaring på dette som ikke er vag :)

Takk!
2357
Lagrange
Lagrange
Innlegg: 1180
Registrert: 07/12-2007 22:08

Boken tilbyr en forklaring. I eksempel 7.6 viser de at [tex]S^2[/tex] er forventningsrett. Det vil si at forventningen til observatoren er lik parameteren man forsøker å estimere.
dan
Dirichlet
Dirichlet
Innlegg: 188
Registrert: 25/09-2010 16:38

Uff, jeg får moderere meg litt;

Boken hadde altså enn så lenge ikke gitt noen forklaring :) Takk!
Aleks855
Rasch
Rasch
Innlegg: 6862
Registrert: 19/03-2011 15:19
Sted: Trondheim
Kontakt:

Ah, Bessel's korreksjon.

Sånn helt generelt så deler vi på n-1 istedet for n, siden den opprinnelige formelen er ubalansert nedover. Ved å senke nevneren retter vi noe opp for denne ubalansen, siden mindre nevner betyr at brøken i sin helhet får større verdi (gitt at både teller og nevner er positive).

Hva står det forresten om det i boka di? Jeg fikk beskjed av læreren om å bare "la det ligge", siden det ikke var forventet at vi skulle kunne gjøre rede for det =/
Bilde
dan
Dirichlet
Dirichlet
Innlegg: 188
Registrert: 25/09-2010 16:38

I eksempelet som ble nevnt over blir det gjort godt rede for grunnen.

Hvis du lurer, Aleks, så blir forklaringen "the xi's tend to be closer to their average x-bar than the population average m, so to compensate for this the division with (n-1) is used rather than n".

Men som sagt, så forklares alt i eksempelet noen kapitler senere.
Svar