Regresjon: Forskjell mellom sideversjoner
Linje 73: | Linje 73: | ||
== Eksponentiell regresjon== | == Eksponentiell regresjon== | ||
[[Bilde:exp1.png]] [[Bilde:exp2.png]] | [[Bilde:exp1.png]] [[Bilde:exp2.png]]<p></p> | ||
Dersom noe øker sakte til å begynne med, for så å øke rakt, som i figur 2, kan man trolig bruke en eksponentiell modell.<p></p> | |||
Det samme gjelder dersom noe avtar raskt, for så nesten å flate ut, som i figur 3. | |||
<table border="1" cellpadding="5"> | <table border="1" cellpadding="5"> |
Sideversjonen fra 8. des. 2010 kl. 04:43
Innledning
Poenget med regresjon er at man ut fra noen få målinger (observasjoner) lager en matematisk funksjon som forutsier hendelsen innenfor et visst område.
Så langt har vi tegnet grafer ut fra kjente funksjonsuttrykk. I mange fag som økonomi, teknikk og naturfagene, er det ofte ønskelig å finne en sammenheng mellom forskjellige størrelser.
Man kan måle og observere sammenhengen mellom størrelse og på det grunnlag formulere et funksjonsuttrykk som gir en sammenheng.
Over ser man forskjellige grafer som representerer matematiske funksjoner. Modelleringen består i hovedsak å finne en matematisk funksjon som passer til de måledata man har og finne ut i hvilket område modellen har gyldighet. Man har følgende data plottet i et koordinatsystem:
Oppgaven blir å finne en kurve / graf som passer best mulig til målepunktene. Man ser at graf nr. 2 over trolig er den som passer best. For å finne grafen og det matematiske uttrykket bruker vi digitale hjelpemidler. Det finnes mange digitale hjelpemiddler du kan bruke, inkludert kalkulator. Hovedsaken er at du lærer deg å bruke hjelpemiddlet godt.
Man observerer at grafen ikke helt passer til målepunktene, men den passer ganske godt. Hvor godt den passer er r et mål på.
Koeffisienten r
Når vi benytter regresjon går vi fra noen målepunkter (sammenhørende x og y verdier) til en generell sammenheng mellom x og y, uttrykt ved et funksjonsuttrykk.
Et mål på hvor god vår modell er finner vi ved å se på bestemmelseskoeffisienten r. Verdiene for r varierer mellom -1 og 1, avhengig av hvor god tilpassningen er mellom data og trendlinje (graf) er. Dersom r er nær 0 er tilpassningen dårlig. Desto nærmer 1 eller -1 r- verdien kommer, desto bedre tilpassning.
Vi velger altså den regresjonstypen med r verdi lengst fra null (nær 1 eller -1). Dersom man ser på <tex>r^2</tex> skal den være så nær en som mulig for å representere en god modell.
Når man lager modeller på denne måten må man tenke på området modellen er gyldig i. Dersom man lager en modell i Mai, for veksten av en blomst, vil modellen ha et gyldighetsområde. Det kan være fra Mai til oktober. Det er lite trolig at modellen er gyldig i Desember, når det er mørkt, kaldt og snøen liggger i hagen.
Lineær regresjon
Figur 1 viser en rett linje. Dersom man har målepunker som ligger nesten på linje er det mulig at lineær regresjon er den beste modellen.
Man vil da få en funksjon av typen:
f(x) = ax+b
Dersom man har har følgende observasjoner
x - verdi | 1 | 2 | 3 | 4 | 5 |
y - verdi | 2 | 3 | 3 | 4 | 4,5 |
Plotter man disse i et koordinatsystem får man:
Eksponentiell regresjon
Dersom noe øker sakte til å begynne med, for så å øke rakt, som i figur 2, kan man trolig bruke en eksponentiell modell.
Det samme gjelder dersom noe avtar raskt, for så nesten å flate ut, som i figur 3.
x - verdi | 1 | 2 | 3 | 4 | 5 |
y - verdi | 1,8 | 2,2 | 2,5 | 6 | 12 |
Logaritmisk regresjon
x - verdi | 1 | 2 | 3 | 4 | 5 |
y - verdi | 2 | 3 | 3 | 4 | 4,5 |
Polynom regresjon
x - verdi | 1 | 2 | 3 | 4 | 5 |
y - verdi | 2 | 3 | 3 | 4 | 4,5 |
Case
x - verdi | 1 | 2 | 3 | 4 | 5 |
y - verdi | 2 | 3 | 3 | 4 | 4,5 |