Statistikkutkast: Forskjell mellom sideversjoner
Linje 12: | Linje 12: | ||
Her har vi tatt et utvalg på 20 fra en produksjonsserie på 1000. Vi har målt høyden på det enkelte produkt. | Her har vi tatt et utvalg på 20 fra en produksjonsserie på 1000. Vi har målt høyden på det enkelte produkt. | ||
==Begreper i statistikk== | |||
Populasjon - det totale antall individer eller objekter et sted eller over en tidsperiode. Eks: Alle harene i Nordmarka. Alle eplene produsert i Hardanger i 2023. | |||
utvalg En del (liten) av populasjonen- | |||
Målet er å kunne si noe fornuftig / få kunnskap om populasjoner (store mengder) på grunnlag av små mengder - utvalg. | |||
forventningsrettet estimator | |||
Kurtose. Normalfordelingen har kurtose 3. Høyere tall indikerer større forekomst av ekstreme verdier og motsatt. | Kurtose. Normalfordelingen har kurtose 3. Høyere tall indikerer større forekomst av ekstreme verdier og motsatt. | ||
Linje 18: | Linje 26: | ||
[ https://matematikk.net/side/Spredningsm%C3%A5l | Spredningsmål ] | [ https://matematikk.net/side/Spredningsm%C3%A5l | Spredningsmål ] | ||
==Standardnormalfordelingen== | ==Standardnormalfordelingen== |
Sideversjonen fra 29. mar. 2022 kl. 04:58
Utvalg
Dersom man produserer 1000 enheter av noe per dag og ønsker å sjekke kvaliteten kan det være for tidkrevende å sjekke alle 1000. Vi han ta et tilfeldig utvalg, en stikkprøve, og ved å få informasjon om utvalget kan vi forhåpentligvis si litt om hele produksjonen. Når man analyser tallmaterialet kan man selvsagt gjøre det for hånd, men det er tidkrevende og digitale hjelpemidler er gode på dette. Fordelen med å bruke regneark eller programmering er at du trolig vil treffe disse igjen etter vgs. Du kan også bruke Geogebra, men det er ikke sikkert du støter på dette programmet etter vgs.
Nedenfor viser regnearket 20 tilfeldige verdier fra en produksjon på 1000. Vi ønsker å bruke de 20 enhetene til å si noe om hele dagsproduksjonen på 1000. 1000 er da populasjonen og 20 er utvalget ("sampel" på engelsk)
Her har vi tatt et utvalg på 20 fra en produksjonsserie på 1000. Vi har målt høyden på det enkelte produkt.
Begreper i statistikk
Populasjon - det totale antall individer eller objekter et sted eller over en tidsperiode. Eks: Alle harene i Nordmarka. Alle eplene produsert i Hardanger i 2023.
utvalg En del (liten) av populasjonen-
Målet er å kunne si noe fornuftig / få kunnskap om populasjoner (store mengder) på grunnlag av små mengder - utvalg. forventningsrettet estimator
Kurtose. Normalfordelingen har kurtose 3. Høyere tall indikerer større forekomst av ekstreme verdier og motsatt.
Skjevhet. Dersom skjevheten er null er fordelingen symmetrisk
[ https://matematikk.net/side/Spredningsm%C3%A5l | Spredningsmål ]
Standardnormalfordelingen
En stokastisk variabel X med forventning $\mu =10 $ og standardavvik $\sigma = 3$ kan standardiseres ved variabelen Z.
$Z = \frac{X - \mu}{\sigma}$
Z er normalfordelt med forventning = og standardavvik 1. Z er standardnormalfordelt.
Konfidensintervall
Et intervall der vi tror en ukjent parameter ligger, kalles et konfidensintervall. Et konfidensintervall har et konfidensnivå som sier noe om hvor sannsynlig det er å finne den ukjente parameteren i intervallet. Det er vanlig å bruke et konfidensnivå på 95%, altså er det da 95% sannsynlig at parameteren man jakter på ligger i intervallet. Det er 5% sannsynlig at den ikke gjør det.