Statistikk I: Forskjell mellom sideversjoner
Linje 193: | Linje 193: | ||
Median er den midterste verdien etter alle verdien er blitt sortert i stigende rekkefølge | Median er den midterste verdien etter alle verdien er blitt sortert i stigende rekkefølge. | ||
<p></p> | |||
Fra eksemplet over har man: (142, 142, 154, 156, 156, 156, 161,'''162''', 163, 169, 169, 172, 172, 173, 178). 162 er det tallet som står midt i rekka når verdiene er sortert i stigende rekkefølge og derved median. | |||
<p></p> | |||
Dersom antall observasjoner er partall vil to tall stå i midten. Median blir da gjennomsnittet av disse. | |||
== Typetall == | == Typetall == |
Sideversjonen fra 19. aug. 2010 kl. 09:50
Innledning
Statistikk er å bearbeide tallmaterialet / data slik at man forhåpentligvis kan observere en trend eller tendens. I beste fall kan man trekke en konklusjon. Tallmaterialet skaffes ofte ved hjelp av spørreundersøkelser, målinger eller observasjoner. Statistikk kan presenteres i forskjellige former og det kan være en god måte å speile virkeligheten på. Statistikk kan også, uten å være direkte feil, presenteres på en måte som tåkelegger virkeligheten. I slike tilfeller er det ofte interessegrupper som presenterer et tallmaterialet med det formål å fremme sin sak. VÆR PÅ VAKT, i slike tilfeller er statistikk mer forvirrende en forklarende.
Frekvenstabell
Eksempel
En liten skoleklasse har femten elever. Høyden på elevene målt i cm. er slik:
178, 142, 156, 162, 154 , 156, 163, 169, 172, 142, 156, 172, 173, 161, 169
Vi kan sette resultatet opp i en tabell
Høyde x Frekvens f 142 2 154 1 156 3 161 1 162 1 163 1 169 2 172 2 173 1 178 1 N = 15 N er antall målinger, i dette tilfellet antall elever. Man ser at frekvensen er 3 for høyden 156 cm.
Søylediagram
Med frekvens mener vi hvor mange ganger en verdi forekommer. Tabellen kan presenteres som den er, eller vi kan presentere den som et diagram. Et eksempel kan være et søylediagram. På y aksen har vi antall observasjoner og på x aksen har vi de forskjellige type observasjoner.
På y aksen har man antall eller frekvens, og på x aksen høyden
Gjennomsnitt
Gjennomsnitt er summen av alle verdier delt på antall verdier.
Høyde x | Frekvens f | Sum høyde f <tex> \cdot </tex> x |
142 | 2 | 2 <tex> \cdot </tex> 142 |
154 | 1 | 154 |
156 | 3 | 3 <tex>\cdot </tex> 156 |
161 | 1 | 161 |
162 | 1 | 162 |
163 | 1 | 163 |
169 | 2 | 2<tex>\cdot </tex> 169 |
172 | 2 | 2<tex>\cdot </tex> 172 |
173 | 1 | 173 |
178 | 1 | 178 |
N = 15 | S = 2425 |
Gjennomsnittet er summen av alle høydene delt på antall elever:
Gjennomsnitt: <tex> \frac SN= \frac{2425 cm}{15}= 161,7cm</tex>
Median
Median er den midterste verdien etter alle verdien er blitt sortert i stigende rekkefølge.
Fra eksemplet over har man: (142, 142, 154, 156, 156, 156, 161,162, 163, 169, 169, 172, 172, 173, 178). 162 er det tallet som står midt i rekka når verdiene er sortert i stigende rekkefølge og derved median.
Dersom antall observasjoner er partall vil to tall stå i midten. Median blir da gjennomsnittet av disse.
Typetall
Typetallet er den verdi som det er flest forekomster av i datamengden. I eksempelet over er typetallet 156 cm, fordi det forekommer flest (3) ganger.
Dersom flere verdier skulle opptre i like antall og disse har høyeste frekvens, må alle oppgies som typetall.
histogram
Histogrammet på statistikksiden vår (se link i venstremarg) har klasser som alle har lik klassebredde. Slik trenger det ikke å være.
Eksempel: Eva lurer på hvor mange telefoner hun får inn på kontoret en dag og bestemmer seg for å telle. Resultatet setter hun opp i en frekvenstabell:
Her ser man at tidsintervallene, altså klassebredden, varierer fra en time til tre timer.
Her må man behandle hver klasse for seg. Høyden på klassen eller diagramhøyden / histogramhøyden finnes ut fra formelen:
Om man tenker på frekvensen som et areal ser man lett at formelen over må være riktig.
Ved å bruke formelen over og informasjonen i frekvensdiagrammet kan vi tegne histogrammet:
Fra histogrammet ser vi at det kommer inn flest telefoner per time i perioden tolv til to.