Regresjon: Forskjell mellom sideversjoner

Fra Matematikk.net
Hopp til: navigasjon, søk
Linje 16: Linje 16:
<p></p>
<p></p>


Over ser man forskjellige grafer som representerer matematiske funksjoner. Modelleringen består i hovedsak å finne en matematisk funksjon som passer til de måledata man har. Dersom man har følgende data:
Over ser man forskjellige grafer som representerer matematiske funksjoner. Modelleringen består i hovedsak å finne en matematisk funksjon som passer til de måledata man har. Man har følgende data plottet i et koordinatsystem:<p></p>
 
[[Bilde:punkt.png]]
[[Bilde:punkt.png]]
<p></p>
Oppgaven blir å finne en kurve / graf som passer best mulig til målepunktene. Man ser at graf nr. 2 over trolig er den som passer best. For å finne grafen og det matematiske uttrykket bruker vi digitale hjelpemidler. I denne sekvensen bruker vi regneark, men det går også an å bruke kalkulator eller annen programvare.


== Koeffisienten r ==
== Koeffisienten r ==

Sideversjonen fra 23. nov. 2010 kl. 12:07



Innledning

Poenget med regresjon er at man ut fra noen få målinger (observasjoner) lager en matematisk funksjon som forutsier hendelsen innenfor et visst område.

Regresjon på grunnkurset handler mye om å bruke kalkulatorens statistikkfunksjon, legge inn tabeller med observasjonsdata, og om å velge riktig regresjonstype. For å mestre kalkulatoren er det viktig at du leser bruksanvisningen og ”taster” deg gjennom et par eksempler.

Så langt har vi tegnet grafer ut fra kjente funksjonsuttrykk. I mange fag som økonomi, teknikk og naturfagene, er det ofte ønskelig å finne en sammenheng mellom forskjellige størrelser.

Man kan måle og observere sammenhengen mellom størrelse og på det grunnlag formulere et funksjonsuttrykk som gir en sammenheng.

Fil:Linje.png

Over ser man forskjellige grafer som representerer matematiske funksjoner. Modelleringen består i hovedsak å finne en matematisk funksjon som passer til de måledata man har. Man har følgende data plottet i et koordinatsystem:

Oppgaven blir å finne en kurve / graf som passer best mulig til målepunktene. Man ser at graf nr. 2 over trolig er den som passer best. For å finne grafen og det matematiske uttrykket bruker vi digitale hjelpemidler. I denne sekvensen bruker vi regneark, men det går også an å bruke kalkulator eller annen programvare.

Koeffisienten r

Når vi benytter regresjon går vi fra noen målepunkter (sammenhørende x og y verdier) til en generell sammenheng mellom x og y, uttrykt ved et funksjonsuttrykk.

Et mål på hvor god vår modell er finner vi ved å se på bestemmelseskoeffisienten r. Verdiene for r varierer mellom -1 og 1, avhengig av hvor god tilpassningen er mellom data og trendlinje (graf) er. Dersom r er nær 0 er tilpassningen dårlig. Desto nærmer 1 eller -1 r- verdien kommer, desto bedre tilpassning.

Vi velger altså den regresjonstypen med r verdi lengst fra null (nær 1 eller -1). Dersom man ser på <tex>r^2</tex> skal den være så nær en som mulig for å representere en god modell.


Når man lager modeller på denne måten må man tenke på området modellen er gyldig i. Dersom man lager en modell i Mai, for veksten av en blomst, vil modellen ha et gyldighetsområde. Det kan være fra Mai til oktober. Det er lite trolig at modellen er gyldig i Desember, når det er mørkt, kaldt og snøen liggger i hagen.

Lineær regresjon

Et blikk på kurven og på målepunktene forteller oss at samsvaret er dårlig. På lang sikt ser et ut som om kurven underestimerer antallet, mens den overestimerer antallet individer i perioden 3 – 7,5 uker. Verdien for r2 er 0,717 og vi forkaster denne modellen.


Geometrisk regresjon

Denne tilpassningen ser bedre ut og r 2 = 0,906 bekrefter det. Men, når tiden øker ser det ut som om funksjonen viser for lave y verdier. Tilpassningen er god fram til x = 7 uker.


Eksponentiell regresjon

Kurven ser ut til å passe godt med målepunktene og en r 2 verdi på 0,9968 bekrefter at tilpassningen er god. Den funksjonen som best beskriver situasjonen er altså

f(x) = 0,8758e0,7628x , eller f(x) = 0,8758e0,7628x = 0,8758(e 0,7628)x = 0,8758·2,144 x

Vi har brukt 9 uker på undersøkelser og det er fortsatt 3 måneder igjen av sesongen for innsektene. Til sammen er det 21 uker.

f(21) = 0,8758· 2,144 21= 790.000

Dersom innsektene får formere seg med samme hastighet som i måleperioden ser man at antallet langt overstiger myndighetenes grense for å gripe inn (100.000).

Grensen myndighetene har satt nåes etter:

f(x) = 100.000

0,8758· 2,144 x= 100.000

x ≈ 15

ca 15 uker.

I dette eksemplet forutsettes det at veksten fortsetter etter den matematiske modellen i hele forplantningsperioden. Kan du tenke deg hva som kan inntreffe og føre til at modellen vil avvike fra virkeligheten?