
Gjennomsnitt
Moderatorer: Vektormannen, espen180, Aleks855, Solar Plexsus, Gustav, Nebuchadnezzar, Janhaa
Heisann. La oss si jeg teller 120 mennesker som går forbi meg, og noterer hvem som bruker hodeplagg eller ei. Hvilken måte er best for å finne gjennomsnittet? Median, variasjonsbredde, typetall eller middelverdi? Selv mener jeg sistnevnte. Er det noen jeg ikke kan bruke, evt. hvorfor? Takker på forhånd 

Først kan det være greit å vite hva de forskjellige tingene er:
Du har innsamlet data, en datamengde vi kan kall D. feks 0 betyr ikke hatt og 1 betyr hatt. Dataene du fikk ble slik: D = { 0 , 0 , 1, 0, 1, 0, 0 }
- HVis du tar gjennomsnittet, så er det definert som sum data /antall data.
(data1 + data2 + ...) / (antall målinger)
- Median finner du ved å sortere dataene i stigende rekkefølge (slik som i lotto), og ta den midterste verdien.
lavest verdi, nest laveste verdi, , nest høyeste verdi, høyeste verdi.
---
Nå kan vi forsøke oss på datasettet D.
gjennomsnitt = (0+0+1+0+1+0+0)/7 = 2/7
Median:
Sorterer datasettet i stigende rekkefølge:
0 0 0 *0* 0 1 1 midterste verdien på denne rekka er 0.
median = 0.
Så medianen ser ut til å være ubrukelig her da median=0 men gjennomsnittet er 2/7. Så gjennomsnittet er best å bruke når man har bare to mulige verdier (0 og 1, ja eller nei).
---
Ta et annet eksempel hvor du måler høyde på 7 personer. Du måler et nytt datasett
D = {180, 181, 181, 191, 130, 170, 185 }cm
Nå har jeg lagdt inn 130cm med vilje for at en lav verdi skal ødelegge for majoriteten.
gjennomsnitt = (180+181+181+191+130+170+185)cm / 7 = 174cm
median:
(130 170 180 *181* 181 185 191)cm
median = 181cm
Hvis du ser på datasettet kan vi tenke oss at de fleste er 180cm. Når gjennomsnittet sier 174cm er det fordi 130cm trekker så voldsomt ned og ødelegger gjennomsnittet. Da er medianen som er 181 et bedre tall.
Når det gjelder de andre begrepene er jeg litt rusten, de er fortsatt åpen for evaluering. Varians kan si noe om hvor mye en verdi varierer rundt et gjennomsnitt. F.eks datasettet 180 180 180 180 har ingen varians, 180 180 181 180 180 har litt varians mens, 0 1 180 2000 2 har kjempe stor varians. Vi bruker disse begrepene for å presentere datasett. Store datasett (100 verdier++) er med det blåtte øye vanskeligere å få en følelse av.
Mvh,
MV
Du har innsamlet data, en datamengde vi kan kall D. feks 0 betyr ikke hatt og 1 betyr hatt. Dataene du fikk ble slik: D = { 0 , 0 , 1, 0, 1, 0, 0 }
- HVis du tar gjennomsnittet, så er det definert som sum data /antall data.
(data1 + data2 + ...) / (antall målinger)
- Median finner du ved å sortere dataene i stigende rekkefølge (slik som i lotto), og ta den midterste verdien.
lavest verdi, nest laveste verdi, , nest høyeste verdi, høyeste verdi.
---
Nå kan vi forsøke oss på datasettet D.
gjennomsnitt = (0+0+1+0+1+0+0)/7 = 2/7
Median:
Sorterer datasettet i stigende rekkefølge:
0 0 0 *0* 0 1 1 midterste verdien på denne rekka er 0.
median = 0.
Så medianen ser ut til å være ubrukelig her da median=0 men gjennomsnittet er 2/7. Så gjennomsnittet er best å bruke når man har bare to mulige verdier (0 og 1, ja eller nei).
---
Ta et annet eksempel hvor du måler høyde på 7 personer. Du måler et nytt datasett
D = {180, 181, 181, 191, 130, 170, 185 }cm
Nå har jeg lagdt inn 130cm med vilje for at en lav verdi skal ødelegge for majoriteten.
gjennomsnitt = (180+181+181+191+130+170+185)cm / 7 = 174cm
median:
(130 170 180 *181* 181 185 191)cm
median = 181cm
Hvis du ser på datasettet kan vi tenke oss at de fleste er 180cm. Når gjennomsnittet sier 174cm er det fordi 130cm trekker så voldsomt ned og ødelegger gjennomsnittet. Da er medianen som er 181 et bedre tall.
Når det gjelder de andre begrepene er jeg litt rusten, de er fortsatt åpen for evaluering. Varians kan si noe om hvor mye en verdi varierer rundt et gjennomsnitt. F.eks datasettet 180 180 180 180 har ingen varians, 180 180 181 180 180 har litt varians mens, 0 1 180 2000 2 har kjempe stor varians. Vi bruker disse begrepene for å presentere datasett. Store datasett (100 verdier++) er med det blåtte øye vanskeligere å få en følelse av.
Mvh,
MV
Dersom du velger å bruke middelverdien, vil du få som svar at 120 mennesker bruker i gjennomsnitt 0,4 hodeplagg f.eks.
Dette tallet er vel ikke så veldig interessant? Enten så bruker man hodeplagg, eller ikke...
Her ville jeg brukt typtall som et mål. Er det mest typisk blant de 120 å bruke hodeplagg, eller er det mest typisk å ikke bruke hodeplagg.
I dette ekspemplet kan man egentlig ikke snakke om variasjonsbredde. Variasjonsbredden er største verdi - minste verdi, og det er ikke mulig å regne ut hodeplagg - uten hodeplagg.
Dette tallet er vel ikke så veldig interessant? Enten så bruker man hodeplagg, eller ikke...
Her ville jeg brukt typtall som et mål. Er det mest typisk blant de 120 å bruke hodeplagg, eller er det mest typisk å ikke bruke hodeplagg.
I dette ekspemplet kan man egentlig ikke snakke om variasjonsbredde. Variasjonsbredden er største verdi - minste verdi, og det er ikke mulig å regne ut hodeplagg - uten hodeplagg.

"Det umulige er bare en midlertidig arbeidshypotese" (A. Næss)