Page 1 of 1

statstikk - percentil

Posted: 13/04-2004 17:57
by Pokerfjes
Driver og programmerer, og har laget funksjon for å finne snitt, min, max og median for en tallrekke. Skal nå lage en funksjon for å finne en hvilken som helst percentil til en tallrekke.

Slik jeg har forstått dette er f.eks. 50-percentilen det samme som median. Fordi man tar midterste tall (evt snitt av to midterste). Og 25- og 75-percentilen kalles nedre og øvre kvartil. (Er forresten median og middelverdi det samme? Eller er middelverdi=snittverdi?)

Eks.: Man har tallrekken 1 2 3 4 5 og skal finne f.eks. 12.5-percentilen.

Slik jeg har tenkt så lang (og som jeg lurer på om er riktig) er at min og max (dvs 1 og 5) er hhv 0- og 100-percentilen. 25-, 50- og 75-percentilene er hhv 2, 3 og 4.

For å finne 12.5-percentilen (dvs halve av 25) tar man snittet av 0- og 25-percentilen. Dvs svaret er da 1.5.

Og for å finne f.eks. 5-percentilen, som ligger mellom 0 og 25,
nærmere bestemt 1/5 på veien fra 0 til 25, så bruker man et
veiet snitt mellom 1 og 2. Dvs 1 får vekt 4/5 og 2 får vekt 1/5
(Avstanden fra 5 ned til 0 er fire ganger kortere enn fra 5 til 25,
derfor bør 0-percentilen veie tilsvarende mer enn 25-percentilen
når man skal finne 5-percentilen, som da blir 1*4/5+2*1/5 = 6/5
eller 1,2.

Er dette riktig? Og er det riktig å definere min og max som 0- og 100-percentiler? Eller skal min og max være hhv 1/n og (n-1)/n?
Hvordan er dette vanligvis definert i statistikk?

Re: statstikk - percentil

Posted: 14/04-2004 00:23
by oro2
Pokerfjes wrote:Er dette riktig? ?
Fant en definisjon i Statistikkboken min, "Statistical Concepts and Methods" av Bhattacharyya & Johnson

En p-percentil er en verdi slik at etter at dataene er ordnet i stigende rekkefølge fra minst til størst, minst p% av dataene er mindre enn denne verdien og minst (100-p)% er større enn denne verdien.