Forskjell mellom versjoner av «Statistikk I»

Fra Matematikk.net
Hopp til:navigasjon, søk
 
(24 mellomliggende revisjoner av 2 brukere er ikke vist)
Linje 41: Linje 41:
 
[[Bilde:soile.png]]<p></p>
 
[[Bilde:soile.png]]<p></p>
 
På y aksen har man antall eller frekvens, og på x aksen høyden
 
På y aksen har man antall eller frekvens, og på x aksen høyden
 +
 +
= Sentralmål =
  
 
== Gjennomsnitt ==
 
== Gjennomsnitt ==
Linje 52: Linje 54:
 
   <td>'''Høyde ''x'' '''</td>
 
   <td>'''Høyde ''x'' '''</td>
 
   <td>'''Frekvens ''f'' '''</td>
 
   <td>'''Frekvens ''f'' '''</td>
   <td>'''Sum høyde ''f  <tex> \cdot </tex> x'' '''</td>
+
   <td>'''Sum høyde ''f  <math> \cdot </math> x'' '''</td>
 
</tr>
 
</tr>
  
Linje 59: Linje 61:
 
   <td>142</td>
 
   <td>142</td>
 
   <td> 2  </td>
 
   <td> 2  </td>
   <td> 2  <tex> \cdot </tex> 142 </td>
+
   <td> 2  <math> \cdot </math> 142 </td>
 
</tr>
 
</tr>
 
<tr>
 
<tr>
Linje 69: Linje 71:
 
   <td> 156  </td>
 
   <td> 156  </td>
 
<td> 3  </td>
 
<td> 3  </td>
   <td>3 <tex>\cdot </tex> 156 </td>
+
   <td>3 <math>\cdot </math> 156 </td>
 
    
 
    
 
</tr>
 
</tr>
Linje 91: Linje 93:
 
   <td> 169  </td>
 
   <td> 169  </td>
 
   <td> 2  </td>
 
   <td> 2  </td>
   <td> 2<tex>\cdot  </tex> 169 </td>
+
   <td> 2<math>\cdot  </math> 169 </td>
 
    
 
    
 
</tr>
 
</tr>
Linje 97: Linje 99:
 
   <td> 172  </td>
 
   <td> 172  </td>
 
   <td> 2  </td>
 
   <td> 2  </td>
   <td> 2<tex>\cdot  </tex> 172 </td>
+
   <td> 2<math>\cdot  </math> 172 </td>
 
    
 
    
 
</tr>
 
</tr>
Linje 127: Linje 129:
 
Gjennomsnittet er summen av alle høydene delt på antall elever:
 
Gjennomsnittet er summen av alle høydene delt på antall elever:
  
Gjennomsnitt: <tex> \frac SN= \frac{2425 cm}{15}= 161,7cm</tex>
+
Gjennomsnitt: <math> \frac SN= \frac{2425 cm}{15}= 161,7cm</math>
  
  
 
<p></p>
 
<p></p>
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=9C3%2B9C4%2B9C5%2B9C6%2B9C7%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
+
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=9E6%2B9E7%2B9E8%2B9E9%2B9EA%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
  
 
== Median ==
 
== Median ==
Linje 147: Linje 149:
  
 
<p></p>
 
<p></p>
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=9C3%2B9C4%2B9C5%2B9C6%2B9C7%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
+
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=9EB%2B9EC%2B9ED%2B9EE%2B9EF%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
  
 
== Typetall ==
 
== Typetall ==
Linje 159: Linje 161:
  
 
<p></p>
 
<p></p>
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=9C3%2B9C4%2B9C5%2B9C6%2B9C7%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
+
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=9F0%2B9F1%2B9F2%2B9F3%2B9F4%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
 
 
== Spredningsmål ==
 
  
 +
= Spredningsmål =
 +
===Variasjonsbredde===
 +
Variasjonsbredden i et tallmaterialet er største verdi minus minste verdi.<p></p>
 +
142, 142, 154, 156, 156, 156, 161,162, 163, 169, 169, 172, 172, 173, 178
 +
<p></p>
 +
Variasjonsbredden = 178 - 142 = 36<p></p> Dersom det er store utslag på største eller minste verdi vil ikke variasjonsbredden gi et god bilde av spredningen.
  
 +
===Nedre kvartil ===
 
'''Median'''
 
'''Median'''
  
 
Median er midt i tallmaterialet. Det betyr at 50% av tallmaterialet er mindre enn median, og 50% er større.
 
Median er midt i tallmaterialet. Det betyr at 50% av tallmaterialet er mindre enn median, og 50% er større.
  
===Nedre kvartil ===
+
 
 
Dersom man tar den nedre halvpart av tallmaterialet og deler den i to, vil "midtpunktet" av denne delen kalles nerdre kvartil, eller 25% prosenttilet.<p></p>
 
Dersom man tar den nedre halvpart av tallmaterialet og deler den i to, vil "midtpunktet" av denne delen kalles nerdre kvartil, eller 25% prosenttilet.<p></p>
 
Dersom man ser på måling av høyden på elevene i skoleklassen er nedre halvdel disse høydene:
 
Dersom man ser på måling av høyden på elevene i skoleklassen er nedre halvdel disse høydene:
Linje 177: Linje 184:
  
 
<p></p>
 
<p></p>
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=9C3%2B9C4%2B9C5%2B9C6%2B9C7%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
 
  
 
===Øvre kvartil===
 
===Øvre kvartil===
Linje 186: Linje 192:
  
 
Den midterste verdien er 172, som da er øvre kvartil.
 
Den midterste verdien er 172, som da er øvre kvartil.
 +
 +
 +
<p></p>
  
 
===Kvartilbredde===
 
===Kvartilbredde===
Linje 195: Linje 204:
 
<p></p>
 
<p></p>
 
Det betyr at halvparten av eleven har en høyde som ligger innefor en forskjell på 16cm.
 
Det betyr at halvparten av eleven har en høyde som ligger innefor en forskjell på 16cm.
 +
 +
<p></p>
  
 
===Varians===
 
===Varians===
Linje 202: Linje 213:
 
<tr>
 
<tr>
 
   <td>'''Høyde ''x'' '''</td>
 
   <td>'''Høyde ''x'' '''</td>
   <td> (gjennomsnitt - måling) <tex>^2 </tex>  </td>
+
   <td> (gjennomsnitt - måling) <math>^2 </math>  </td>
  
 
</tr>
 
</tr>
Linje 209: Linje 220:
 
<tr>
 
<tr>
 
   <td>142</td>
 
   <td>142</td>
   <td> (161,7 - 142)<tex>^2 </tex> = 19,7<tex>^2 </tex> = 388,1 </td>
+
   <td> (161,7 - 142)<math>^2 </math> = 19,7<math>^2 </math> = 388,1 </td>
 
    
 
    
 
</tr>
 
</tr>
 
<tr>
 
<tr>
 
   <td>142</td>
 
   <td>142</td>
   <td> (161,7 - 142)<tex>^2 </tex> = 19,7<tex>^2 </tex> = 388,1 </td>
+
   <td> (161,7 - 142)<math>^2 </math> = 19,7<math>^2 </math> = 388,1 </td>
 
    
 
    
 
</tr>
 
</tr>
 
<tr>
 
<tr>
 
   <td>154</td>
 
   <td>154</td>
   <td> (161,7 - 154)<tex>^2 </tex> = 7,7<tex>^2 </tex> = 59,3 </td>
+
   <td> (161,7 - 154)<math>^2 </math> = 7,7<math>^2 </math> = 59,3 </td>
 
    
 
    
 
</tr>
 
</tr>
 
<tr>
 
<tr>
 
   <td>156</td>
 
   <td>156</td>
   <td> (161,7 - 156)<tex>^2 </tex> = 5,7<tex>^2 </tex> = 32,5 </td>
+
   <td> (161,7 - 156)<math>^2 </math> = 5,7<math>^2 </math> = 32,5 </td>
 
    
 
    
 
</tr>
 
</tr>
 
<tr>
 
<tr>
 
   <td>156</td>
 
   <td>156</td>
   <td> (161,7 - 156)<tex>^2 </tex> = 5,7<tex>^2 </tex> = 32,5 </td>
+
   <td> (161,7 - 156)<math>^2 </math> = 5,7<math>^2 </math> = 32,5 </td>
 
    
 
    
 
</tr>
 
</tr>
 
<tr>
 
<tr>
 
   <td>156</td>
 
   <td>156</td>
   <td> (161,7 - 156)<tex>^2 </tex> = 5,7<tex>^2 </tex> = 32,5 </td>
+
   <td> (161,7 - 156)<math>^2 </math> = 5,7<math>^2 </math> = 32,5 </td>
 
    
 
    
 
</tr>
 
</tr>
Linje 240: Linje 251:
 
<tr>
 
<tr>
 
   <td> 161  </td>
 
   <td> 161  </td>
   <td> (161,7 - 161)<tex>^2 </tex> = 0,7<tex>^2 </tex> = 0,5</td>
+
   <td> (161,7 - 161)<math>^2 </math> = 0,7<math>^2 </math> = 0,5</td>
 
    
 
    
 
</tr>
 
</tr>
 
<tr>
 
<tr>
 
   <td> 162  </td>
 
   <td> 162  </td>
   <td> (161,7 - 162)<tex>^2 </tex> = (-0,3)<tex>^2 </tex> = 0,1 </td>
+
   <td> (161,7 - 162)<math>^2 </math> = (-0,3)<math>^2 </math> = 0,1 </td>
 
    
 
    
 
</tr>
 
</tr>
Linje 251: Linje 262:
 
<tr>
 
<tr>
 
   <td> 163  </td>
 
   <td> 163  </td>
   <td> (161,7 - 163)<tex>^2 </tex> = (-1,3)<tex>^2 </tex> = 1,7 </td>
+
   <td> (161,7 - 163)<math>^2 </math> = (-1,3)<math>^2 </math> = 1,7 </td>
 
    
 
    
 
</tr>
 
</tr>
 
<tr>
 
<tr>
 
   <td> 169  </td>
 
   <td> 169  </td>
   <td> (161,7 - 169)<tex>^2 </tex> = (-7,3)<tex>^2 </tex> = 53,3 </td>
+
   <td> (161,7 - 169)<math>^2 </math> = (-7,3)<math>^2 </math> = 53,3 </td>
 
    
 
    
 
    
 
    
Linje 262: Linje 273:
 
<tr>
 
<tr>
 
   <td> 169  </td>
 
   <td> 169  </td>
   <td> (161,7 - 169)<tex>^2 </tex> = (-7,3)<tex>^2 </tex> = 53,3 </td>
+
   <td> (161,7 - 169)<math>^2 </math> = (-7,3)<math>^2 </math> = 53,3 </td>
 
    
 
    
 
    
 
    
Linje 269: Linje 280:
 
<tr>
 
<tr>
 
   <td> 172  </td>
 
   <td> 172  </td>
   <td> (161,7 - 172)<tex>^2 </tex> = (-10,3)<tex>^2 </tex> = 106,1 </td>
+
   <td> (161,7 - 172)<math>^2 </math> = (-10,3)<math>^2 </math> = 106,1 </td>
 
    
 
    
 
    
 
    
Linje 275: Linje 286:
 
<tr>
 
<tr>
 
   <td> 172  </td>
 
   <td> 172  </td>
   <td> (161,7 - 172)<tex>^2 </tex> = (-10,3)<tex>^2 </tex> = 106,1 </td>
+
   <td> (161,7 - 172)<math>^2 </math> = (-10,3)<math>^2 </math> = 106,1 </td>
 
    
 
    
 
    
 
    
Linje 284: Linje 295:
  
 
  <td> 173  </td>
 
  <td> 173  </td>
   <td> (161,7 - 173)<tex>^2 </tex> = (-11,3)<tex>^2 </tex> = 127,7 </td>
+
   <td> (161,7 - 173)<math>^2 </math> = (-11,3)<math>^2 </math> = 127,7 </td>
 
      
 
      
 
</tr>
 
</tr>
Linje 290: Linje 301:
 
<tr>
 
<tr>
 
   <td> 178  </td>
 
   <td> 178  </td>
   <td> (161,7 - 178)<tex>^2 </tex> = (-16,3)<tex>^2 </tex> = 265,7 </td>
+
   <td> (161,7 - 178)<math>^2 </math> = (-16,3)<math>^2 </math> = 265,7 </td>
 
    
 
    
 
    
 
    
Linje 304: Linje 315:
 
</table>
 
</table>
  
Når man deler summen av kvadratene på antall målinger får man variansen: <tex>Var = \frac{Sum}{N} = \frac{1647,5}{15} = 109,8 </tex>
+
Når man deler summen av kvadratene på antall målinger får man variansen: <math>Var = \frac{Sum}{N} = \frac{1647,5}{15} = 109,8 </math>
 +
<p></p>
 +
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=A12%2BA13%2BA14%2BA15%2BA16%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
  
 
===Standardavik===
 
===Standardavik===
 
Standardavviket er et mål på spredningen rundt gjennomsnittet.
 
Standardavviket er et mål på spredningen rundt gjennomsnittet.
Standardavviket er kvadratroten av variansen: Standardavvik = <tex> \sqr{Var} = \sqr{109,8} = 10,5</tex>
+
Standardavviket er kvadratroten av variansen: Standardavvik = $ \sqrt{Var} = \sqrt{109,8} = 10,5$
 +
<p></p>
 +
[http://www.matematikk.net/ressurser/oppgaver/kari/vis_oppgaver.php?q=A17%2BA18%2BA19%2BA1A%2BA1B%7Ctimer_off%7Cshow_all%7Cnq%5B5%5D%7Ccat%5B35%5D%7Cdiff%5B0%5D%26quser_submit_step3 Test deg selv]
  
== Boksplott ==
+
= Boksplott =
For å angi typeske verdier for et utvalg kan man oppgi gjennomsnitt, median eller typetall. Dersom fordelingen i utvalget er skjev kan det være store forskjeller på de tre størrelsene. For at leseren skal få mest mulig informasjon må det framgå hvilket sentralmål som brukes (bruk gjerne flere). Alternativt kan man lage et boksplott:  
+
For å angi typiske verdier for et utvalg kan man oppgi gjennomsnitt, median eller typetall. Dersom fordelingen i utvalget er skjev kan det være store forskjeller på de tre størrelsene. For at leseren skal få mest mulig informasjon må det framgå hvilket sentralmål som brukes (bruk gjerne flere). Alternativt kan man lage et boksplott:  
  
  
Linje 325: Linje 340:
 
Man merker seg at det er informasjon om median, nedre og øvre kvartil, samt største og minste observasjon, i samme grafiske fremstilling.
 
Man merker seg at det er informasjon om median, nedre og øvre kvartil, samt største og minste observasjon, i samme grafiske fremstilling.
  
== histogram ==
+
= Histogram =
  
 
Det er ikke altid praktisk å behandle hver observasjonsverdi individuelt. Dersom vi måler høyden på alle eleven på en 1 - 10 skole med 556 elever er det upraktisk å behandle alle høyder individuelt fordi høydene vil sprike mye og datamengden er stor.
 
Det er ikke altid praktisk å behandle hver observasjonsverdi individuelt. Dersom vi måler høyden på alle eleven på en 1 - 10 skole med 556 elever er det upraktisk å behandle alle høyder individuelt fordi høydene vil sprike mye og datamengden er stor.
Linje 336: Linje 351:
 
   <td>'''Frekvens ''f'' '''</td>
 
   <td>'''Frekvens ''f'' '''</td>
 
   <td>'''Klassebredde  b-a'''</td>
 
   <td>'''Klassebredde  b-a'''</td>
   <td>'''Høyde<br>på histogram <tex> \frac{f}{b-a} </tex>
+
   <td>'''Høyde<br>på histogram <math> \frac{f}{b-a} </math>
 
</tr>
 
</tr>
 
<tr>
 
<tr>
Linje 399: Linje 414:
 
Høyden [130,140> inkluderer alle elever som har høyde fra og med 130cm til 140cm, men '''ikke''' 140cm. Høyden 140cm vil ligge i gruppen [140, 150> osv. Intervallene omfatter 10cm og det kalles for '''klassebredden'''. Man kan ha søyler med varierende klassebredde i samme histogram, dvs. alle gruppene trenger ikke ha bredden 10cm. Dette materialet er inndelt i åtte klasser.
 
Høyden [130,140> inkluderer alle elever som har høyde fra og med 130cm til 140cm, men '''ikke''' 140cm. Høyden 140cm vil ligge i gruppen [140, 150> osv. Intervallene omfatter 10cm og det kalles for '''klassebredden'''. Man kan ha søyler med varierende klassebredde i samme histogram, dvs. alle gruppene trenger ikke ha bredden 10cm. Dette materialet er inndelt i åtte klasser.
 
<p></p>  
 
<p></p>  
Søylehøyde <tex> = \frac{frekvens}{klassebredde}</tex>  
+
Søylehøyde <math> = \frac{frekvens}{klassebredde}</math>  
  
  
Linje 413: Linje 428:
 
   <td>'''Frekvens ''f'' '''</td>
 
   <td>'''Frekvens ''f'' '''</td>
 
   <td>'''Klassebredde  b-a'''</td>
 
   <td>'''Klassebredde  b-a'''</td>
   <td>'''Høyde<br>på histogram <tex> \frac{f}{b-a} </tex>
+
   <td>'''Høyde<br>på histogram <math> \frac{f}{b-a} </math>
 
</tr>
 
</tr>
 
<tr>
 
<tr>
Linje 475: Linje 490:
  
 
<ul>
 
<ul>
<li>Man finner klassemidtpunktet i de forskjellige klassene. <tex>x_m</tex>  <p></p>
+
<li>Man finner klassemidtpunktet i de forskjellige klassene. <math>x_m</math>  <p></p>
  
  
 
<li>Man multiplisere klassemidtpunktet med antallet i klassen (varierer fra klasse til klasse).
 
<li>Man multiplisere klassemidtpunktet med antallet i klassen (varierer fra klasse til klasse).
 
og får:
 
og får:
<tex>x_m \cdot f</tex><p></p>
+
<math>x_m \cdot f</math><p></p>
  
<li>Man legger sammen <tex>x_m \cdot f</tex> for alle klassene, i eksemplet over var det åtte klasser. Matematisk kan det skrives slik
+
<li>Man legger sammen <math>x_m \cdot f</math> for alle klassene, i eksemplet over var det åtte klasser. Matematisk kan det skrives slik
<tex>\sum x_m \cdot f</tex><br>
+
<math>\sum x_m \cdot f</math><br>
<tex>\sum </tex> er et "summetegn" og betyr at man legger sammen <tex>x_m \cdot f</tex> for alle klassene.<p></p>
+
<math>\sum </math> er et "summetegn" og betyr at man legger sammen <math>x_m \cdot f</math> for alle klassene.<p></p>
  
  
<li>Man deler så <tex>\sum x_m \cdot f</tex> med summen av alle frekvkvensene i hver klasse, og får gjennomsnittet:
+
<li>Man deler så <math>\sum x_m \cdot f</math> med summen av alle frekvkvensene i hver klasse, og får gjennomsnittet:
  
<tex>\bar{x}=\frac{\sum x_m \cdot f}{\sum f}</tex>
+
<math>\bar{x}=\frac{\sum x_m \cdot f}{\sum f}</math>
  
  
Linje 504: Linje 519:
 
<tr>
 
<tr>
 
   <td>'''Klasse [a,b>, <br>Høyde på elever'''</td>
 
   <td>'''Klasse [a,b>, <br>Høyde på elever'''</td>
   <td>'''Midtpunkt <tex>x_m</tex> '''</td>
+
   <td>'''Midtpunkt <math>x_m</math> '''</td>
 
   <td>'''Frekvens f'''</td>
 
   <td>'''Frekvens f'''</td>
   <td>'''<tex> x_m \cdot f</tex>'''<td>
+
   <td>'''<math> x_m \cdot f</math>'''<td>
 
</tr>
 
</tr>
 
<tr>
 
<tr>
Linje 558: Linje 573:
  
  
Gjennomsnittet blir da:<tex>\bar{x}=\frac{\sum x_m \cdot f}{\sum f}=\frac{91730}{556}= 165cm</tex>
+
Gjennomsnittet blir da:<math>\bar{x}=\frac{\sum x_m \cdot f}{\sum f}=\frac{91730}{556}= 165cm</math>
 
<p></p>
 
<p></p>
 
<p></p>
 
<p></p>

Nåværende revisjon fra 17. des. 2019 kl. 11:37

Innledning

Statistikk er å bearbeide tallmaterialet / data slik at man forhåpentligvis kan observere en trend eller tendens. I beste fall kan man trekke en konklusjon. Tallmaterialet skaffes ofte ved hjelp av spørreundersøkelser, målinger eller observasjoner. Statistikk kan presenteres i forskjellige former og det kan være en god måte å speile virkeligheten på. Statistikk kan også, uten å være direkte feil, presenteres på en måte som tåkelegger virkeligheten. I slike tilfeller er det ofte interessegrupper som presenterer et tallmaterialet med det formål å fremme sin sak. VÆR PÅ VAKT, i slike tilfeller er statistikk mer forvirrende en forklarende.

Frekvenstabell

Eksempel

En liten skoleklasse har femten elever. Høyden på elevene målt i cm. er slik:

178, 142, 156, 162, 154 , 156, 163, 169, 172, 142, 156, 172, 173, 161, 169

Vi kan sette resultatet opp i en tabell


Høyde x 142154 156 161 162 163 169 172 173 178
Frekvens f 2 1 3 1 1 1 2 2 1 1 N = 15

N er antall målinger, i dette tilfellet antall elever. Man ser at frekvensen er 3 for høyden 156 cm.

Søylediagram

Med frekvens mener vi hvor mange ganger en verdi forekommer. Tabellen kan presenteres som den er, eller vi kan presentere den som et diagram. Et eksempel kan være et søylediagram. På y aksen har vi antall observasjoner og på x aksen har vi de forskjellige type observasjoner.

Soile.png

På y aksen har man antall eller frekvens, og på x aksen høyden

Sentralmål

Gjennomsnitt

Gjennomsnitt er summen av alle verdier delt på antall verdier.


Høyde x Frekvens f Sum høyde f <math> \cdot </math> x
142 2 2 <math> \cdot </math> 142
154 1 154
156 3 3 <math>\cdot </math> 156
161 1 161
162 1 162
163 1 163
169 2 2<math>\cdot </math> 169
172 2 2<math>\cdot </math> 172
173 1 173
178 1 178
N = 15 S = 2425

Gjennomsnittet er summen av alle høydene delt på antall elever:

Gjennomsnitt: <math> \frac SN= \frac{2425 cm}{15}= 161,7cm</math>


Test deg selv

Median

Median er den midterste verdien etter alle verdien er blitt sortert i stigende rekkefølge.

Fra eksemplet over har man: (142, 142, 154, 156, 156, 156, 161,162, 163, 169, 169, 172, 172, 173, 178). 162 er det tallet som står midt i rekka når verdiene er sortert i stigende rekkefølge og derved median.

Dersom antall observasjoner er partall vil to tall stå i midten. Median blir da gjennomsnittet av disse.



Test deg selv

Typetall

Typetallet er den verdi som det er flest forekomster av i datamengden. I eksempelet over er typetallet 156 cm, fordi det forekommer flest (3) ganger.

Dersom flere verdier skulle opptre i like antall og disse har høyeste frekvens, må alle oppgies som typetall.


Test deg selv

Spredningsmål

Variasjonsbredde

Variasjonsbredden i et tallmaterialet er største verdi minus minste verdi.

142, 142, 154, 156, 156, 156, 161,162, 163, 169, 169, 172, 172, 173, 178

Variasjonsbredden = 178 - 142 = 36

Dersom det er store utslag på største eller minste verdi vil ikke variasjonsbredden gi et god bilde av spredningen.

Nedre kvartil

Median

Median er midt i tallmaterialet. Det betyr at 50% av tallmaterialet er mindre enn median, og 50% er større.


Dersom man tar den nedre halvpart av tallmaterialet og deler den i to, vil "midtpunktet" av denne delen kalles nerdre kvartil, eller 25% prosenttilet.

Dersom man ser på måling av høyden på elevene i skoleklassen er nedre halvdel disse høydene: 142, 142, 154, 156, 156, 156, 161

Den midterste verdien er 156, som da er nedre kvartil.


Øvre kvartil

Dersom man tar den øvre halvpart av tallmaterialet og deler den i to, vil "midtpunktet" av denne delen kalles øvre kvartil, eller 75% prosenttilet.


Dersom man ser på måling av høyden på elevene i skoleklassen er øvre halvdel disse høydene:163, 169, 169, 172, 172, 173, 178.

Den midterste verdien er 172, som da er øvre kvartil.


Kvartilbredde

Kvartilbredden er differansen mellom øvre og nedre kvartil. Kvartilbredden vil inneholde halvparten av måledataene i måleserien.

I eksempelet med høyden på elevene i klassen er kvartilbredden:

Kvartilbredde = 172cm - 156cm = 16cm

Det betyr at halvparten av eleven har en høyde som ligger innefor en forskjell på 16cm.

Varians

Gjennomsnittet av høydemålingene over var 161,7cm. Man sammenligner hver enkel måling opp mot gjennomsnittet på den måten at man finner avviket og kvadrerer dette. Man får:







Høyde x (gjennomsnitt - måling) <math>^2 </math>
142 (161,7 - 142)<math>^2 </math> = 19,7<math>^2 </math> = 388,1
142 (161,7 - 142)<math>^2 </math> = 19,7<math>^2 </math> = 388,1
154 (161,7 - 154)<math>^2 </math> = 7,7<math>^2 </math> = 59,3
156 (161,7 - 156)<math>^2 </math> = 5,7<math>^2 </math> = 32,5
156 (161,7 - 156)<math>^2 </math> = 5,7<math>^2 </math> = 32,5
156 (161,7 - 156)<math>^2 </math> = 5,7<math>^2 </math> = 32,5
161 (161,7 - 161)<math>^2 </math> = 0,7<math>^2 </math> = 0,5
162 (161,7 - 162)<math>^2 </math> = (-0,3)<math>^2 </math> = 0,1
163 (161,7 - 163)<math>^2 </math> = (-1,3)<math>^2 </math> = 1,7
169 (161,7 - 169)<math>^2 </math> = (-7,3)<math>^2 </math> = 53,3
169 (161,7 - 169)<math>^2 </math> = (-7,3)<math>^2 </math> = 53,3
172 (161,7 - 172)<math>^2 </math> = (-10,3)<math>^2 </math> = 106,1
172 (161,7 - 172)<math>^2 </math> = (-10,3)<math>^2 </math> = 106,1
173 (161,7 - 173)<math>^2 </math> = (-11,3)<math>^2 </math> = 127,7
178 (161,7 - 178)<math>^2 </math> = (-16,3)<math>^2 </math> = 265,7
SUM = 1647,5

Når man deler summen av kvadratene på antall målinger får man variansen: <math>Var = \frac{Sum}{N} = \frac{1647,5}{15} = 109,8 </math>

Test deg selv

Standardavik

Standardavviket er et mål på spredningen rundt gjennomsnittet. Standardavviket er kvadratroten av variansen: Standardavvik = $ \sqrt{Var} = \sqrt{109,8} = 10,5$

Test deg selv

Boksplott

For å angi typiske verdier for et utvalg kan man oppgi gjennomsnitt, median eller typetall. Dersom fordelingen i utvalget er skjev kan det være store forskjeller på de tre størrelsene. For at leseren skal få mest mulig informasjon må det framgå hvilket sentralmål som brukes (bruk gjerne flere). Alternativt kan man lage et boksplott:


Boksplott.png

Median er det samme som 50 - prosenttilet, det betyr at 50% av observasjonene er mindre enn median. Tilsvarende er 25% av observasjonene mindre enn nedre kvartil (25 - prosenttilet) og 75% av observasjonene mindre enn øvre kvartil (75 - prosenttilet).

I eksempelet med høyden på elevene i klassen ser boksplottet slik ut:


Boksplott3.png

Man merker seg at det er informasjon om median, nedre og øvre kvartil, samt største og minste observasjon, i samme grafiske fremstilling.

Histogram

Det er ikke altid praktisk å behandle hver observasjonsverdi individuelt. Dersom vi måler høyden på alle eleven på en 1 - 10 skole med 556 elever er det upraktisk å behandle alle høyder individuelt fordi høydene vil sprike mye og datamengden er stor.

Dette løses ved å dele tallmaterialet opp i grupper. Man kan for eksempel gruppere slik:

Klasse [a,b>,
Høyde på elever
Frekvens f Klassebredde b-a Høyde
på histogram <math> \frac{f}{b-a} </math>
Klasse [130,140> 18 10 1,8
Klasse [140,150> 29 10 2,9
Klasse [150,160> 102 10 10,2
Klasse [160,165> 89 5 17,8
Klasse [165,170> 117 5 23,4
Klasse [170,175> 122 5 24,4
Klasse [175, 180> 67 5 13,4
Klasse [180,190> 12 10 1,2
556

Høyden [130,140> inkluderer alle elever som har høyde fra og med 130cm til 140cm, men ikke 140cm. Høyden 140cm vil ligge i gruppen [140, 150> osv. Intervallene omfatter 10cm og det kalles for klassebredden. Man kan ha søyler med varierende klassebredde i samme histogram, dvs. alle gruppene trenger ikke ha bredden 10cm. Dette materialet er inndelt i åtte klasser.

Søylehøyde <math> = \frac{frekvens}{klassebredde}</math>


Histigrammet ser slik ut:

Histo1.png

I fremstillingen over har klassene forskjellig bredde. Dersom man holder bredden lik i alle klassene, for eksempel 10 cm. blir resultatet slik:

Klasse [a,b>,
Høyde på elever
Frekvens f Klassebredde b-a Høyde
på histogram <math> \frac{f}{b-a} </math>
Klasse [130,140> 18 10 1,8
Klasse [140,150> 29 10 2,9
Klasse [150,160> 102 10 10,2
Klasse [160,170> 206 10 20,6
Klasse [170,180> 189 10 18,9
Klasse [180,190> 12 10 1,2
556

Det tilhørende histigrammet blir da slik:

Histo2.png

Hva er forskjellen på de to histogrammene? Man ønsker at en grafisk fremmstilling skal være lett å lese. Dersom klassebredden blir liten blir diagrammet hakkete og vannskelig å lese. dersom klassebredden blir for stor mister man verdifull informasjon. Dersom klassebredden varierer i et diagram, kan de gi leseren økt informasjon, men det gir også et diagram som er vannskeligere å lese. Ofte ser man at histogrammer har lik klassebredde, gjerne mellom 5 og 15 enheter.


Gjennomsnitt i gruppert materiale

Man finner gjennomsnittet i klassedelt materiale ved å gjøre følgende:

  • Man finner klassemidtpunktet i de forskjellige klassene. <math>x_m</math>


  • Man multiplisere klassemidtpunktet med antallet i klassen (varierer fra klasse til klasse). og får: <math>x_m \cdot f</math>

  • Man legger sammen <math>x_m \cdot f</math> for alle klassene, i eksemplet over var det åtte klasser. Matematisk kan det skrives slik <math>\sum x_m \cdot f</math>
    <math>\sum </math> er et "summetegn" og betyr at man legger sammen <math>x_m \cdot f</math> for alle klassene.


  • Man deler så <math>\sum x_m \cdot f</math> med summen av alle frekvkvensene i hver klasse, og får gjennomsnittet: <math>\bar{x}=\frac{\sum x_m \cdot f}{\sum f}</math>


Den gjennomsnittsverdien man får er ikke helt riktig, for den forutsetter en jevn fordeling innen hver klasse, men gir en tilnærmet verdi.


I eksemplet med høyden på elevene ved skolen blir det slik (Her tar man utgangspunkt i den siste klassedelingen der alle klassebreddene var 10cm.):

Klasse [a,b>,
Høyde på elever
Midtpunkt <math>x_m</math> Frekvens f <math> x_m \cdot f</math>
Klasse [130,140> 135 18 2430
Klasse [140,150> 145 29 4205
Klasse [150,160> 155 102 15810
Klasse [160,170> 165 206 33990
Klasse [170,180> 175 189 33075
Klasse [180,190> 185 12 2220
SUM 556 91730


Gjennomsnittet blir da:<math>\bar{x}=\frac{\sum x_m \cdot f}{\sum f}=\frac{91730}{556}= 165cm</math>

Median i gruppert materiale


For å finne medianen I et gruppert tallmateriale (vi bruker fortsatt høyden på elevene på skolen) gjør man følgende:

Man regner ut den relative kumulative frekvensen for alle klassene.

Med den relative frekvensen mener man frekvensen i prosent.

Med kumulativ mener man at man samler opp, altså legger sammen prosentene etter hvert som man regner ut den relative frekvens for hver klasse. Eksempel: Dersom du kaster ent terning 4 ganger og får følgende antall øyner: 2, 3, 3, 6 blir det kummulativt 2,5,8,14. Man summerer antallet etter hvert forsøk, etter to forsøk har man 2+3 øyner, osv.

Først bør man lage en tabell som likner på denne:

Klasse [a,b>,
Høyde på elever
Antall elever=frekvens Kumulativ frekvens Relativ hyppighet = prosentandel Relativ kumulativ hyppighet
Klasse [130,140> 18 18 3,2 3,2
Klasse [140,150> 29 47 5,2 8,4
Klasse [150,160> 102 149 18,3 26,7
Klasse [160,170> 206 355 37,0 63,7
Klasse [170,180> 189 544 34,0 97,7
Klasse [180,190> 12 556 2,2 99,9
SUM 556 99,9

At man får 99,9 og ikke 100,0 skyldes at noe blir borte på veien i avrundingen.

Når man har tabellen plotter man resultatene i et koordinatsystem. Median blir i overkant av 166 cm. alså ganske lik gjennomsnittet.

Kum.png

Tilbake til 2P Hovedside

Hovedside