Den levende matematikken
 8277820194

Citation preview

Forord Dette er den tredje boka av noe som må sies å være en nordisk trilogi. Professor Dan Laksov ved KTH var prosjektleder for den svenske boka "Velg spesialarbeide i matematikk", og hans bok resulterte i en tilsvarende dansk -og altså denne norske boka. Den norske Laksovboka er skrevet av norske matematikere og inneholder også utvalgte artikler fra både den danske og

svenske "Laksovboka". Boka har som intensjon å skride utover det som oppfattes som tradisjonell matematikk. Det er biografier over våre store matematikere. Norge har på ingen måte vært i noen europeisk bakevje innen matematikken, og Abel, Lie, Skolem og andre er fremtredende representanter for norsk vitenskap og er personer som burde være mer kjent i vår kulturhistorie enn de er. Av plasshensyn har vi valgt å utelate en biografi om Niels Henrik Abel. Abel er behørig omtalt i alle leksikon og interesserte henvises til professor Karl Egil Auberts fyldige artikkel i tidskriftet Normat nr. 4 1979. Det er også tatt med historisk-filosofiske artikler for å vise matematikkens betydning for den filosofiske tenknings utvikling. Matematikk forbindes oftest med menn. Kvinnens ukjente innsats belyses i egen artikkel. Interessen for matematikk vekkes ofte i tidlig alder. I denne boka har vi prøvd å lage matematikk-artikler tilpasset høyskolestudenter og elever i det siste året i den videregående skolen. Fagartiklene har som målsetting å gi innsikt i den mangesidige og spennende verden

som matematikken utgjør. Artiklene er skrevet av forskere og endel av de er oversatt og bearbeidet av hovedfagsmatematikere i skolen, det var gledelig at så mange var villige til å gjøre en faglig-pedagogisk innsats. Jeg vil også gjeme få rette en særlig takk til Bernt Øksendal, Torgeir Onstad, Ragnar Normann, Erik Bølviken, Hans Brodersen og Dan Laksov ved matematisk institutt ved Universitetet i Oslo for aktiv deltakelse den tiden det tok å få lagd boka. Det har ikke vært lett å integrere de ulike tekstbehandlingssystemene som har vært brukt av de forskjellige forfatterne. Ame Strøm har i så måte hjulpet til med enkelte av artiklene skrevet i TeX. Hans Georg Killingbertrø har tegnet de nydelige figurene i artikkelen om Fibonaccitallene.

Boka er en non-profitt bok. Bidragsyterne har arbeidet vederlagsfritt. Boka er blitt sponset av Norsk Matematisk forening, Matematisk naturvitenskaplig fakultet ved Universitet i Oslo, Norges Tekniske høgskole og importørene av skolekalkulatorene Casio og Texas instruments. Uten deres støtte ville ikke boka ha kommet ut.

Det har hele tiden vært et interessant sammarbeide med den danske matematikklærerforeningen ved lektor Sven Toft Jensensom har utgitt boka "Matematiske ideer". I Norge savner vi helt klart en egen matematikklærerforening!

Truls Sevje Langesund 1994

5% av omsetningen fra Den levende matematikken går til Norsk Matematisk Forening. NORSK MATEMATISK FORENING P.B 1053 BLINDERN N-0316 OSLO Tlf: 22 85 58 87/88 Telefaks: 22 85 43 49 Formann: Geir Ellingsrud

Copyright 1994, Undervisningsforlaget AS

Det må ikke kopieres fra denne boka ut over det som er tillatt etter bestemmelsen i "Lov om opphavsrett til åndsverk" og "lov om rett til fotografering".

Brudd på disse bestemmelsene vil bli anmeldt. Utgave Forside Layout Prosjektleder

: 1. utgave november 1994 : Nina K. Svean : Jan Lystad : Jan Lystad

ISBN

: 82-7782-019-4

Til deg som vil skrive en prosjektoppgave i matematikk Artiklene er utformet slik at de skal kunne brukes som utgangspunkt for prosjektoppgaver. Noen av artiklene er vanskelige, noen er lette og de fleste ligger vel et sted midt i mellom. Enkelte artikler foutsetter at du kjenner litt til partiell derivasjon og komplekse tall. Induksjonsbeviset går også igjen i flere artikler. Statistikk og sannsynlighetsregning er noe mange skoleelever er ukjente med. Det er tatt med innledningsartikler som dekker opp disse emnene.

De fleste artiklene inneholder en rekke ulike oppgaver. Disse oppgavene er ment å være inspirasjonskilder for et selvstendig arbeid og er derfor utformet noe annerledes enn du kanskje er vant med fra skolematematikken. En prosjektoppgave med utgangspunkt i et emne kan

bestå i at du: • løser noen av de gitte oppgavene • gir en selvstendig framstilling av deler av emnet • fordyper deg i en mindre del av emnet • diskuterer forholdet mellom emnet og deler av skolepensumet • anvender materialet som bakgrunn for eget emne • utreder begreper og definisjoner som forekommer i emnet • gjør dataeksperimenter som bekrefter resultatene i emnet Dette er noen forslag av mange muligheter til hvordan en prosjektoppgave kan utformes. Det er selvfølgelig også fullt ut akseptabelt at det skrives prosjektoppgaver av biografisk eller historisk-filosofisk karakter. Det er langt i fra nødvendig å løse alle oppgavene i et emne for å ha skrevet en fullgod prosjektoppgave. Mange av emnene inneholder også stoff nok til flere prosjektoppgaver og egner seg derfor utmerket som gruppearbeide. (Pass imidlertid på at ingen blir gratispassasjer).

Vil du gå videre med deler av ett emne og kanskje behøver ytterligere materiale eller forklaringer, er det meningen at du skal kontakte artikkelforfatteren(e). (Telfonnr. +og adresse står bak i boka).

Veilederveiledning Emnene passer som prosjektoppgaver både på høyskolenivå og siste året i den videregående skolen. Med Reform 94 vil prosjektoppgaver få sin faste plass i skolen, denne boka er ment å være til hjelp i så måte.

Man bør unngå at matematikklærerne oppfatter prosjektoppgaver som en ny arbeidsbelastning. Det er også urimelig å kreve at lærerne behersker alle emnene som boka inneholder. Lærerens oppgave bør være av oppmuntrende art, kjøpe inn litteratur til skolebiblioteket, finne referansene i artiklene, fordele oppgavene mellom elevgrupper, hjelpe til med å skaffe kontakt med artikkelforfatteren osv. Den ideelle situasjonen er selvfølgelig at læreren engasjerer seg i problemstillingene sammen med elevene.

Det må også presiseres at den enkelte skole står ganske fritt i å legge forholdene til rette for lærere som veileder elever i prosjektoppgaver. Økt arbeidsbyrde på et område bør ledsages av redusert arbeidsbyrde på et annet.

Innholdsfortegnelse Innledningsartikler Litt om komplekse tall......................................................................................................7 Partiell derivasjon............................................................................................................ 10 Induksjonsbeviset, dominoeffekten på de hele tall...................................................... 12 Sannsynlighet og loven om store tall............................................................................ 14

Analyse To formler for tallet 7C.....................................................................................................38 Konvekse funksjoner...................................................................................................... 47 Om funksjonalligninger........................................................................ '•........................ 58 En trafikkmodell..............................................................................................................64 Dynamisk programmering............................................................................................. 86 Funksjoners forskjellige størrelsesorden...................................................................... 97

Geometri Trekantens nipunktsirkel............................................................................................. 105 Deformasjonsteori - nøkkelen til å forstå verden!................................................... 110 Vinkelen som måler 60° kan ikke deles i tre like deler med bare passer og linjal 121 Om Pytagoras hadde vore drosjesjåfør i Kristiansand.............................................. 125 Fraktaler og iterasjon av funksjoner........................................................................... 137

Kombinatorikk og algoritmer Litt om permutasjoner.................................................................................................. 143 Kampen om den siste fyrstikken................................................................................. 148 Registermaskiner........................................................................................................... 151 Periodisk desimalbrøk.................................................................................................. 161 Om grafer og handelsreisendes problemer................................................................. 164

Sannsynlighetsregning og statestikk Binomiske sannsynligheter........................................................................................... 179 Betinget sannsynlighet.................................................................................................. 187

Tallteori Pythagoreiske trekanter................................................................................... 194 Primtall fra Euklid til CRAY..................................................................................... 215 Litt av hvert om kjedebrøk............................................................................. Frankering og computer-nettverk.............................................................................. 246 Om myntveksling........................................................................ 251 Fibonacci-tallene..........................................................................................

227

254

Biografier Axel Thue.................................................................................................... Marius Sophus Lie.............................................................................................. Thoralf Albert Skolem...................................................................................... Peter Ludvig Mejdell Sylow...................................................................................

273 276 286 290

Filosofiske/historiske artikler Naturvitenskapene og den allmene kultur.................................................................293 Når matematikken åpner verden....................................................................... 295 Vitenskapskvinner 1750-1850................................................................................ 297 Fields' medalje - matematikkens nobelpris............................................................... 304

Matematikk-konkurranser Abel-konkurransen 1993 og 1994............................................................................. 306 Matematikkolympiaden i Moskva 1992.................................................................... 321 Den 34. internasjonale matematikkolympiaden i Istanbul, 13-24 juli 1993.......... 328

Adresse- og telefonliste..........................................................................

Litt om komplekse tall Av lektor Finn Holme, Ski videregående skole

Hvis vi går ut i fra de naturlige tall N = {1,2,3....} må vi innføre negative tall for å løse

likningen x + 2 = 0. Skal vi løse en likning som 2x + 3 = 0, må vi innføre rasjonale tall, eller brøker. For å løse likningen x2 - 2 = 0 må vi innføre irrasjonale tall. Det finnes nemlig ikke / \2 i — a slik vi at. f — a I -2o noen vbrøk b \b)

De irrasjonale tallene danner sammen med de rasjonale tall de reelle tallene. Mengden av de reelle tall betegnes ofte med R og illustreres gjeme med en tallinje.

Ønsker vi å løse ligningen x2 4-1 = 0 og finne løsning(er) blant de reelle tall, står vi fast. Det finnes ingen reile tall hvis kvadrat er lik -1. (Fra skolematematikken husker du sikkert at 4a bare eksisterte så lenge a > 0). Vi kan imidlertid utvide tallbegrepet

vårt til også og omfatte tall hvis kvadrat er negative. Slike tall kalles for imaginære

tall. Imaginært kan bety «uvirkelig» og er strengt tatt et litt uheldig valgt ord i denne

sammenheng. Imaginære tall er like «virkelige» og nyttige som andre tall, men for de fleste mennesker ligger de utenfor dagliglivets erfaringsverden. Derfor har de også blitt omspunnet med endel mystikk og misforsåelser. Standard skrivemåte i dag er

4-i = i og ligningen x2 +1 = 0 har løsningen x = ±i. Imaginære tall skrives på formen ai hvor a er med blant de reelle tall. Et komplekst tall

skrives på formen a + bi. En likning på formen

anxn + an_pcn~l +...... +apc + aQ =0 der a, e R og n e N kalles en algebraisk likning av grad n.

Et naturlig spørsmål er om en slik likning alltid har en løsning, samt hvordan finne

disse. Gjennom matematikkens historie har man arbeidet mye med dette problemet. I dag vet man svaret Ved å foreta nok en tallutvidelse, fra R til mengden C av de

såkalte komplekse tall kunne Carl Friedrich Gauss (1777- 1865) bevise at enhver algebraisk likning av grad n (hvor koeffisientene også kunne være komplekse tall)

hadde minst en løsning. Men hvis n>5 fantes det ingen fremgangsmåte for å finne disse ved hjelp av de fire regningsartene addisjon, subtraksjon, multiplikasjon, divisjon samt

rotutdragning. Den første som beviste dette var forøvrig nordmannen Niels Henrik Abel (1802- 1829).

7

Den levende matematikken

Det var også en nordmann, Caspar Wessel (1745- 1818), som først fant en måte å illustrere de komplekse tallene på.

Han laget et vanlig koordinatsystem der Laksen var de vanlige reelle tall med enheten 1 og en 2.akse som skulle forestille de såkalte rene imaginære tall. Enheten på denne

aksen ble kalt i. Et komplekst tall ble illustrert som en vektor med origo som begynnelsespunkt, og med tallparet (a,b) som endepunkt. Denne vektoren illustrerte da det komplekse tallet

z = a + bi Tallet a ble kalt for realdelen til z, Re z, mens b ble kalt imaginærdelen, Im z. Dersom Imz = Z> = Oerzet vanlig reelt tall.

Selv om det komplekse tallet z = a + ib kan illustreres som vektoren [a,b] er det

likevel forskjell på et komplekst tall og en vektor. Og slik regner man så med de komplekse tall:

Vi adderer/subtraherer komplekse tall ved å addere/subtrahere rell- og imaginærdelen. Eksempel: (2 - 5i) + (3 + f) = (2 + 3) + (-5/ + i) = 5 - 4z Dette er jo identisk med hvordan vi adderer/subtraherer vektorer.

Samme analogi får vi når vi skal multiplisere et komplekst tall a + ib med et reellt tall c. Svaret er ac + ibc slik at f.eks. 2-(3 —4z)= 6 —8z. Dette tilsvarer vektorregelen

c[a,b] = [ca,cb]. Forskjellen på komplekse tall og vektorer trer tydelig fram når vi skal innføre

multiplikasjonsbegrepet Mens vi for vektorer har den raritet at produktet

(skalarproduktet) mellom to vektorer ikke er en vektor (men et reelt tall), så er imidlertid produktet mellom to komplekse tall et komplekst tall. Dette bestemmes ved de vanlige regneregler for paranteser, men med tillegget at i • i = i2 = -1.

Eksempel: (3 + 2z)(4 - 3z) = 3- 4 - 3 • 3z + 2z • 4 + 2i • (-3z) = 12 - 9i + 8z - 6z2 = 12 - i - 6(-l) = 18 - i

Dersom

z = a + bi er

z = a - bi e C, og vi kaller vi tallet

z = a-ib

(kompleks) konjugerte til z.

Multipliserer vi z og z får vi zz = (a + bi- bi) = a2 + b2 e R og tallet a +b =>Jzz kalles gjerne absoluttverdien til z og betegnes med Izl.

Eksempel: |3 + 4z| = V32 +42 = 5, |z| = 1.

8

det

Litt om komplekse tall Vi ser da at |z| kan illustreres som lengden (normen) av z = a + bi og svarer til

lengden Ja2+b2 av vektoren [a,b].

Dersom vi skal dividere et komplekst tall med et annet, f.eks. 3 + 4/ (3+4/) -5- (2 - 3z) = ——— kan dette skrives på formen a + bi e C ved at vi utvider brøken med det konjugerte uttrykket til nevneren: 3 + 4; _ 3 + 4; 2 + 31 (3 + 4i)(2 + 3;) 6 + 9i' + 8i + 12i2 _-6 + 17i 2-3i ~ 2-3i 2 + 3/~ 22+32 " 13 13

6 13

17 ‘ 13

Regnereglene på generell form blir altså som følgende:

(a + bi) + (c + di) = (a + c) + (b+ d)i (a + bi)-(c + di) = (ac - bd) + (bc + ad)i a + bi _ac + bd bc-ad . c + di c2+d2+c2 + d21

Vi avslutter denne korte innføringen om komplekse tall med å vise et eksempel på nytten av komplekse tall. Trigonometriske formler kan ofte være kronglete å huske. Moivre’s formel rydder opp i det problemet:

(cos v + i sin v)n = cos nv + i sin nv

Oppgave: Bevis Moivre’s formel ved hjelp av induksjon. (Regn først ut in for flere verdier av n. Forklar også hvorfor aY + b{i = a2 + b2i hvis og bare hvis = a2 og b{ =b2).

Oppgave: Bruk Moivre’s formel til å vise de fleste av skolepensumets trigonometriske formler.

9

Partiell derivasjon av lektor Truls Sevje, Sandefjord gymnas, Telemark tekniske fagskole

Skal vi finne stigningen i et punkt på grafen til funksjonen /(x) i xy-planet, vet vi at vi kan derivere/(x). Kan vi tilsvarende finne stigninger på flater i rommet? Svaret er selvfølgelig ja,

men hvordan skal det gjøres? I et fast punkt på en flate kan vi ofte trekke mange tangenter med ulike stigningstall. I denne innledningsartikkelen skal vi begrense oss til å se på tangenter som er parallelle med xz-planet eller yz-planet. I xy-planet har vi en variabel x. (Gitt at y = / (x)). I rommet -som vi skal betegne med xyz-rommet- har en funksjon f to variable x og y gitt at

z = f (x, y). Vi kjenner f.eks. ligningen for et plan i rommet ax+by + cz + d = 0. Denne kan vi omforme til a b d z = —x — y---c c c

d b d z = / (x, y) = —x — y---- . Skal vi finne planets stigning i retning x-aksen, kan vi c c c ad . . .. , projisere planet inn i xz-planet ved å sette y = 0. Det gir z = —x---- og stigningen til denne altså,

linja er som kjent gitt ved z' = —. Planets stigning i retning y-aksen er tilsvarende gitt ved z' = —. Vi må skilne mellom disse to forskjellige deriverte av z. Skal vi finne stigningen i xc 3/(x,y) Skal vi finne aksens retning, deriverer vi z med hensyn på x, og vi skriver z' = dx

stigningen i y-aksens retning, deriverer vi z med hensyn på y, og vi skriver

, Zy

d/(x,y) 3y

Dette kalles for partiell derivasjon og gjelder selvfølgelig også for andre romflater enn plan. Rent teknisk foregår derivasjonen ved at vi betrakter y som en konstant når deriverer med

hensyn på x, og vi betrakter x som konstant når vi deriverer med hensyn på y.

Eksempel: z = /(x, y) = x3 + 3xy 4- y2, dermed får vi: —- = 3x2 + 3y, og —- = 3x + 2y ox dy Legg også merke til at:

[ dx = /(x, y) + G(y\ og J dy = f (x, y)+H (x) J 9x J dx Her spiller altså funksjonene G og H samme rolle som konstanten C når vi har ubestemt

integrasjon og en variabel. Vi skal se på partiell derivasjon i et mer generelt tilfelle: La funksjonen z = /(x, y) være gitt,

anta også den fremstiller en «pen» flate i rommet. Vi lar y = c være planet som skjærer flaten slik at den felles punktmengden vil fremstille en kurve gitt ved z = / (x,c) i rommet.

10

Partiell derivasjon

Se figuren. (Kurven z = f (x, c) kan tegnes i xz-planet og vil ha samme form som kurven i planet y = c.) Vi ønsker å finne stigningen til en tangent på denne kurven. Vi merker oss at en

tangent på kurven ligger i planet y = c. Er c bestemt vil stigningen til tangenten kun avhenge av x. Denne stigningen vil være bestemt ved df r /(x + Ax,c)-/(x,c)

dx

Ax

Ax~>0

Altså ganske analogt med hvordan vi definerte /'(x).

Siden vi ønsker generelle definisjoner lar vi y være med i definisjonen: dx

De dobbeltderiverte defineres ved:

åx-»o

---- = lim Ax

92/_ 9 p/' Da vi har to 9/ 9ypy,

92/ = 9 p/' 9x2 9x^9x, ^2 f

variable gir det også menig i å regne ut

^2

- og ------- . Vi deriverer altså først med hensyn dydx dxdy

på x, deretter med hensyn på y, og vise versa. d2 f For «pene» funksjoner gjelder dessuten at dxoy

d2 dydx

Oppgave: Lag en figur som gir en forklaring på definisjonen df Um f(x,y+åy)-f0 Ay Oppgave: La /(x, y) = x3 + 2xy2 - 5x2y + 4xy - 2x + 3y -1

p

8

t H. H. HL dx’ dy’ dx2 ’

dy2’

hl dxdy’

Hl dydx

11

Induksjonsbeviset, dominoeffekten på de hele tall av lektor Truls Sevje, Sandefjord gymnas, Telemark tekniske fagskole

Av og ril er det lett å gjette hva en matematisk formel blir, vanskeligere kan det være og bevise den. Betrakt oddetallene 1,3,5,.......

Vi skal eksperimentere litt med summen av disse tallene. 1=1 1+3= 4

1+ 3+5 = 9 1 + 3 + 5 + 7 = 16

Som du ser får vi kvadrattallene på høyre side av likhetstegnet. Vi kan derfor skrive: 1 = 12 l + 3 = 22 1 + 3 + 5 = 32

l + 3+5 + 7 = 42 Vi ser dermed at summen av oddetallene kan bli lik kvadratet til antall oddetall vi summerer, nemlig:

1 + 3 + 5 + 7 + — + (2m — 1) = h2

Imidlertid; dette må bevises. I skolematematikken er du vant med at formler stort sett utledes. F.eks. lærte du å utlede formelen for summasjonen av et endelig antall ledd i en geometrisk rekke. Induksjonsbeviset, som denne artikkelen handler om, er noe annerledes. Når man

arbeider mye med matematikk, opparbeider man seg en god intuisjon om hva som kan være riktige resultater innen matematikken. Av og til kan man bevise sin gjetning ved hjelp av det

som kalles induksjonsbeviset Induksjon er et axiom som tillater oss å gi beviser for at visse egenskaper er sanne for alle hele tall.

La P(l) være påstanden 1 = 12

Påstanden P( 1) er åpenbart sann. La P(n) være påstanden 1 + 3 + 5 H----- F (2n -1) = n1

Vi vet ikke om påstanden P(n) er sann. Prinsippet i induksjonsbeviset går imidlertid ut på å anta at påstanden P(n) er sann. Dersom vi kan bruke denne antagelsen til å bevise at da blir påstanden P(n +1) sann, er vi framme. Hvorfor? Jo, fordi vi har vist at P(l) er sann. Da må jo

12

Induksjonsbeviset

også P(2) bli sann. Og når P(2) er sann må P(3) bli sann, og når P(3) er sann må........... osv, altså er P(n) sann for alle hele positive tall n.

Vi fortsetter med vårt eksempel. Vi antar altså at P(n) er sann: l+3+5+-+(2n-l)= n2 Påstanden P(n +1)

(1)

kan skrives som: 1 + 3+5+--- + (2n-l)+(2(n + l)-l) = (n+l)2

Det er denne vi skal bevise er sann. Det skal vi gjøre ved å addere (2(n +1)—1) på begge sider av likhetstegnet i ligning (1). l+3+5 + --- + (2/i-l) + (2(n + l)-l) = n2+ (2(n + l)-l)

Dersom vi nå kan vise at høyre side blir lik (n +1)2 er vi framme: n2 + (2(/z +1) — 1) = n2 + (2/i + 2 — 1) = n2 + 2n +1 = (n +1)2

Vi har altså bevist at dersom P(/z) er sann blir P(/i +1) sann. Da P(l) er sann må følgelig P(2)

bli sann, og da P(2) er sann må P(3) bli sann,............ Oppgaver: Vis at for alle hele tall n > 1, så gjelder: . ~ ~ n(n + l) 1 + 2 4- 3 + • • • + n = —------ 2

12 + 22 + 32 +••• +n2 = —n(n + l)(2n + l) 6 Z

/

^3 3 i n(n + l) ] 13 +23 +33 +••• +n3 = —------ V 2 ) ,,

13

Sannsynlighet og loven om store tall Professor Erik Bølviken, UiO

1

Innledning: Hva er sannsynlighet?

Poenget ved å kaste en terning, knipse en mynt, dreie en rullett, eller trekke en bridge-eller pokerhånd er at utfallet er usikkert. Resultatet vil variere fra gang til gang. Hensikten med dette kapitlet er å introdusere en teori som gir en presis, matematisk beskrivelse av tilfeldige hendelser. Ingen må tro at betydningen av denne teori er begrenset til spill av den type som ble nevnt ovenfor. I virkeligheten er det tilfeldige elementer til stede i betydelige deler av all menneskelig atferd. Det er mulig det i en slik påstand ligger grunnleggende filosofiske problemer. Likevel vil antakelig få protestere mot at det er et vesentlig tilfeldig innslag i følgende eksempler: • nyfødtes kjønn • utfallet av en risikabel investering • hvem som rammes av sykdom • meningsmålinger

og ved nærmere ettertanke kanskje også • nøyaktig hvilket tall som avleses når noe måles.

Vi skal på en eller annen måte komme tilbake til alle disse eksemplene i løpet av boken. Vi skal i inneværende kapittel lage en (sterkt forenklet) investeringsteori som gir en betingelse for om det er verdt å foreta en usikker investering (avsnitt 3). I avsnitt 6 ser vi hvorledes unøyaktige målinger kan kompenseres ved gjentakelser1. I senere kapitler skal vi bli i stand til å si noe vesentlig om kjønnene blant barna i en og samme familie ved å studere en tabell over et stort antall familier, og vi skal også komme fram til en matematisk formel som angir sjansen for at en person virkelig er syk gitt at medisinske tester tyder på det.

At noe er tilfeldig uttrykkes ved sannsynlighetsbegrepet. Det undervises i dag (1995) i dette på MS-linjene, men ikke på MN. Den framstilling som vil bli gitt her, bygger ikke på noen forkunnskaper i sannsynlighetsregning. Vårt siktemål er å klargjøre hvorledes sannsynligheter brukes til å beskrive tilfeldige hendelser av den type som ble nevnt oven­ for, dvs. vi skal innføre begrepet sannsynlighet som en matematisk modell for virkelige fenomener. Hva er det, for eksempel, egentlig som menes når det påstås at sjansen2 er 1/6 for å få sekser ved kast med en vanlig terning? Antakelig betyr det at nøyaktig 1 sekser på 6 forsøk ansees typisk. Samtidig er det på det rene at tallet kan bli større eller ingen sekser kan forekomme i det hele tatt. Men hva med 6000 forsøk, som i Figur 1? Det er formodentlig utenkelig (i praksis) at vi ikke får noen, og tror vi ikke når det kommer til 1 Det er denne ide som ligger under bedømmelse av prestasjonen i idretter som kunstløp, turn, stuping, konkurransedans og skihopp. Flere dommere vurderer (“måler”) uavhengig av hverandre, og deres bedømmelse blir slått sammen etter en eller annen regel. Man erkjenner i utgangspunktet at det er vanskelig å si, for eksempel, nøyaktig hvor god en skihoppers stil er. 2Betegnelsene sjanse og sannsynlighet vil bli brukt i lik betydning.

14

Sannsynlighet og loven om store tall

stykke at det vil bli rundt 1000 seksere?

Figur 1. Relativt antall seksere (mn/n) etter n kast med en vanlig terning, simulert ved help av en datamaskin.

I Figur 1 har vi latt mn være antall seksere etter de n første kastene og plottet det relative antall mn/n mot n. I starten er mn/n et godt stykke fra 1 /6, men etter hvert blir forskjellen mindre, og det ser ut som n

lo

------- >nar n —> oc. n 6

(-i

-i \

U--U

I forrige århundre (og tidligere) var det vanlig å definere sannsynlighetsbegrepet ved slike grenseoverganger, dvs. sannsynligheten for sekser ved et terningkast skulle være 1/6 der­ som (1.1) holder. Det er ikke tvil om at denne definisjonen fanger opp noe vesentlig ved vår oppfatning av sannsynlighet som begrep. Men fra en matematisk synsvinkel er prob­ lemet at følgen mn/n ikke er en vanlig følge slik du har lært, fordi mn er et tilfeldig og ikke et fast tall (du vil ikke få den vanlige definisjonen av grense til å stemme helt). Det er derfor i vårt århundre blitt vanlig å definere sannsynlighetsbegrepet på en annen måte og deretter bevise gyldigheten av (1.1) som en konsekvens. Det er denne fremgangsmåten vi skal følge her. I slutten av dette kapitlet (avsnitt 7) skal vi gjennom matematisk argu­ mentasjon komme fram til (1.1) i en sterkt utvidet utgave. For å få dette til må vi innføre flere begreper som tilsammen gir en definisjon av sannsyn­ lighet. Før vi gir dette en generell formulering i neste avsnitt, la oss se hvorledes oppset­ tet ser ut i terningeksemplet. Terningkastet oppfattes som et tilfeldig eksperiment der et av tallene {1,2, ..,6} vil bli resultatet. Vi skal kalle resultatene utfall og mengden av

15

Den levende matematikken

alle utfall utfallsrommet. Sistnevnte vil bli representert ved den greske bokstav Q slik at Q = {1,2, ..,6} i terningeksemplet. Hvert utfall G Q3 tilordnes et tall P(cft) som kalles sannsynligheten til &i. For et vanlig terningkast er

P(o>,) = l, b

= 1,2,..,6.

(1.2)

Det vi egentlig da gjør er å uttale oss om terningen og måten vi kaster den på. Å legge (1.2) til grunn er det samme som å gå ut fra at terningen er ekte og at den kastes på en ærlig måte. Men det finnes falske terninger også, og for slike vil sannsynlighetsfunksjonen (1.2) være annerledes (og formodentlig ukjent, men vi skal diskutere siden hvorledes man kan finne ut hva den er). Heller ikke grenseovergangen (1.1) vil da være gyldig. Vårt hov­ edresultat (i avsnitt 7) vil medføre at høyresiden i (1.1) skal erstattes med P(l/6), dvs. sannsynligheten (hva den enn måte være) for en sekser ved kast med den falske terningen. Det begrepsapparat vi skal legge fram, gir oss altså anledning til å uttrykke matema­ tisk, som en såkalt modell, hva vi vet og måtte finne ut om tilfeldige hendelser. Det finnes en stor sannsynlighetsalgebra som deretter kan koples inn for å beregne sannsynligheten for tilfeldige hendelser av interesse. Det undervises i dette på MS-linjene, og vi vil nesten ikke komme inn på det her. Vårt mål er å introdusere begrepet sannsynlighet, forsøke å gi en forståelse av hva begrepet betyr og demonstrere dets betydning for virkelige fenomener.

2

Sannsynlighet som matematisk modell.

Definisjon 1. Et eksperiment frembringer ett av flere (eller mange) alternative resultater eller utfall. Definisjon 2. og betegnes Q.

Mengden av alle mulige utfall cu i et eksperiment kalles utfallsrommet

I terningkasteksemplet var Q = {1,2, ..,6}. Andre muligheter fra spill er Q = {mynt,kron} (myntkast), Q = {0,1,2,. .,36} (rullett), Q = {alle 13-korts hender} (bridge).

Det siste eksemplet atskiller seg fra de to øvrige ved at antall elementer i utfallsrommet er så stort (ca. 635 milliarder)4, og det er et problem i seg selv å finne ut hvor mange. Dette skal vi ikke komme inn på. Poenget her er bare å påpeke at utfallsrommet kan omfatte et 3Q er en såkalt stor “Omega”, mens w er en liten utgave av den samme greske bokstaven. Den leses på samme måte (som “omega”). Notasjonen w,- G Q er en skrivemåte for at elementet er med i mengden Q. 4Dersom vi spiller bridge 12 timer hver dag (hele året), og vi legger til grunn at hvert spill varer 10 minutter ( et representativt tall for konkurransebridge), vil det ta ca. 14-15 millioner år å spille gjennom alle.

16

Sannsynlighet og loven om store tall

stort eller lite antall elementer. Vi skal forutsette at det ikke er uendelig stort. Elementene i Q kan dermed nummereres, for eksempel

Q = {ui,cj2,

(2.1)

Videregående fremstillinger tillater uendelig antall utfall (ofte alle reelle tall). Behandlingen av slike sannsynlighetsmodeller er mulig innenfor videregående skoles matematikkpensum, men er teknisk mer komplisert, og det er her rimelig å forenkle problemene mest mulig5. Definisjon 3. En sannsynlighetsfunksjon P er en funksjon som til hvert utfall tilordner et tall P(u;t) slik at P(uØ >

o,

£F(u>,) = l, 1=1

6 Q

(2.2) (2.3)

der venstre siden i (2.3) er det samme som summen P(cu1)4-P(cj2) + ...4-P((x>Ar) 6■ Den første forutsetningen sier at sannsynligheter ikke skal være negative tall (som er selvinnlysende), mens vi skal komme tilbake til den andre nedenfor. Legg merke til at sannsynlighetsfunksjonen (1.2) for terningkastet ovenfor tilfredsstiller begge betingelser. Eksperimenter som er tilordnet en sannsynlighetsfunksjon som i Definisjon 3, vil vi kalle til­ feldige eksperimenter. Før vi nå går videre må vi innføre begrepet hendelse eller begivenhet.

Definisjon 4. En begivenhet A er en delmengde av Q ( med matematisk notasjon A C Q). Dersom eksperimentet gir et utfall cu,- G A, sier vi at A har forekommet eller inntruffet. I terningeksemplet kunne vi betrakte (for eksempel) begivenheten partall, dvs. at ternin­ gen viser et like antall øyne. Da er A = {2,4,6}, en delmengde av Q = {1,2..., 6}. Vi ønsker å tilordne sannsynligheter til begivenheter. Hvordan skal det gjøres? I eksemplet med like antall øyne og et ekte terningkast kunne vi resonnere slik: Av 6 like sannsynlige muligheter fører 3 til at begivenheten “like antall øyne” inntreffer. Følgelig er sannsyn­ ligheten 3/6 = 1/2. Men et annet argument er å anføre at sannsynligheten må være 1/6 + 1/6 + 1/6 = 1/2. Den siste måten å tenke på er den første overlegen, fordi den også kan brukes for falske terninger (dersom, for eksempel, sannsynligheten for sekser er større enn 1/6, erstattes den siste 1/6 i summen med det større tallet). Argumentet peker altså mot en generell konstruksjon. For eksempel, dersom A = {^4,^71,^102}, så er P(A) = P(cj4) + P(y>7i) + P(cg>io2)- Generelt for en vilkårlig begivenhet A C D defineres

P(A) = £ P(wi),

(2.4)

u,ea

5Dessuten kan uendelige utfallsrom tilnærmes med endelige, omtrent som at vanlige integraler kan tilnærmes med endelige summer. 6Tilsvarende notasjon vil bli brukt en rekke ganger i det etterfølgende.

17

Den levende matematikken

der summen på høyre side går over alle som er med i A. (2.4) sier at for å finne P(A) skal vi legge sammen sannsynligheten for alle enkeltutfallene E A. Hvorfor er denne definisjonen rimelig? For å besvare dette spørsmålet må vi minne om union/snitt-relasjonene mellom vanlige mengder (som også lar seg anvende på begivenheter, siden disse i følge Definisjon 4 ovenfor er definert som mengder). Mengden A U B består av alle som enten ligger i A eller B (eller begge). Tolket som begivenheter uttrykker unionen at enten inntreffer A, eller B (eller begge). Tilsvarende betyr A Pl B at både A og B forekommer. Spesielt skal vi nedenfor være opptatt av såkalte disjunkte begivenheter som ikke kan forekomme samtidig, dvs. begivenheter som tilfredsstiller

APiB = 0,

(2.5)

der 0 er den tomme mengde ( eller umulige begivenhet) som ikke inneholder noen ele­ menter. (2.5) sier at A og B ikke inneholder noen elementer felles (og følgelig ikke kan forekomme samtidig). La A og B være to begivenheter som tilfredsstiller (2.5) (og som derfor er slik at om A forekommer, så inntreffer ikke B og omvendt). Anta at n uavhengige eksperimenter utføres. La mn(A) være antall ganger (eksperimenter) A har forekommet og mn(B) tilsvarende for B. Da må, siden A og B ikke forekommer samtidig, mn(A) + mn(B) = mn(A U B),

når A Pl B = 0,

(2.6)

der mn(A U B) er antall ganger A eller B inntreffer. Divisjon på n på begge sider gir

mn(AUB) = m44) + m2Cg)> n n n

nSUnB = 0.

(2.7)

Men husk at relative hyppigheter, som de i (2.7) skulle nærme seg mot sannsynligheter når n oo, dvs. definisjonen av sannsynligheter skulle være slik at mn(A)/rz P(A) osv. Ved å la n -H- oo i (2.7) framkommer som en konsekvens Aksiom 1. P(A UB) = P(A) + P(B),

når A Pl B = 0 .

Dette betyr at vi må definere sannsynligheter slik at aksiomet er oppfylt ( ellers vil ikke 772n(A)/72 —> P(A) slik vi ønsker). Men definisjonen (2.4) er nettopp slik at Aksiom 1 blir tilfredsstilt. Tenk deg, for eksempel, at A = {cji,lu2} og B = {cj3,cj4,cj5} der alle a?}, cj2,..,lo5 er forskjellige. Da er A U B = {cji,u>2,^3, tv4,u5}, og, i følge (2.4) er P(A UB)

= P^i) + F’(cj2) + P( 0. Aksiom 3. F(Q) = 1.

Disse er lette å motivere. Det er selvinnlysende at sannsynligheter ikke kan være neg­ ative tall og ved at P(Q) = 1 uttrykkes at et eller annet element i utfallsrommet inntreffer helt sikkert. Det er opplagt at konstruksjonen (2.4) gir oss Aksiom 2 og Aksiom 3 følger av (2.3) ved å sette A = Q inn i (2.4).

De tre aksiomene gir oss muligheter til å regne ut sannsynligheter for kompliserte og sam­ mensatte begivenheter. Dette diskuteres i lærebøker i sannsynlighetsregning på MS linjen, men vi trenger ikke gå inn på det her.

3

Tilfeldige variable.

Vi starter med et eksempel.

Eksempel 1. Anta at vi representerer en finansinstitusjon, for eksempel en bank, som har til vurdering et kortsiktig, risikabelt lån av størrelse K kroner. I den sterkt forenklede versjon som her diskuteres, kan en av to hendelser inntreffe. Enten betaler kunden lånet tilbake ved forfall (la oss si etter ett år) eller han går konkurs. I sistnevnte tilfelle regner vi det som sikkert at vi ikke får noen dekning slik at hele lånebeløpet må avskrives som tapt for banken (i praksis vil bildet være langt mer nyansert, men i vår spesielle verden er det bare disse to mulighetene). Utfallsrommet består altså av to utfall, for eksempel Q = {0,1} (som i myntkast), der 0 svarer til at vi får lånebeløpet tilbake og 1 gir full tapsavskrivning. La q være sannsynligheten for det siste slik at sannsynlighetsfunksjonen er

P(0) = 1-g P(l) = q

(lån tilbakebetales), (lån avskrives).

Det vi etterhvert skal si noe om, er hvilken rentefot r (i %) vi bør forlange for at det å gi lånet, i en eller annen forstand er en “sunn” sjanse å ta for banken. La F være bankens fortjeneste ved lånet. F avhenger åpenbart av hvilket utfall i Q som inntreffer og kan dermed oppfattes som en matematisk funksjon over Q. Funksjons verdiene er F(0) og F(l). Dersom vi forlanger forskuddsrente (som forfaller med en gang) og lånebeløpet er K, blir r = Yqq ^’ r =- Yqq —

F(0) =

(bankens fortjeneste er lik renteinntekten)

F(l)

(lånebeløpet er tapt og må fratrekkes renteinntekten)

Legg merke til at F er negativ (svarende til at at banken har et reelt tap) dersom utfall 1 inntreffer7 7Ved normale renter. Betingelsen er at r < 100.

19

Den levende matematikken

I Eksempel 1 knytter interessen seg til en funksjon over utfallsrommet. Slike funksjoner kalles tilfeldige variable. Generelt:

Definisjon 5. En funksjon X = X(cut) som til enhver coi E fl tilordner et reelt tall, kalles en tilfeldig variabel. Poenget ved definisjonen er at eksperimentet gir et tilfeldig utfall cu,- og at tilfeldigheten overføres til X. Eksempel 1 illustrer dette. Først foregår et tilfeldig eksperiment der ett av to mulige utfall inntreffer. Betales lånet tilbake, vil banken sitte igjen med en fortjen­ este /□ = og sannsynligheten for at dette skjer er 1 — q. Den andre muligheten er at lånet ikke betales tilbake. Sannsynligheten er q. “Fortjenesten” (som da er tap) blir /i = — K. F antar altså verdiene /0 and fa med sannsynlighetene F(F = /o) = 1-9,

P(F = fi) = q,

som kalles punkts annsynlighet ene til F. La generelt X være en tilfeldig variabel med verdier Xi, x2, som forekommer med sannsynligheter PfaX = rri), P(X = x2)K.. Vi sier at X følger en sannsynlighetsfordeling, og PfaX = xj) for j = 1,2,... kalles punktsannsynligheten. Den kan tilbakeføres til sannsynlighetsfunksjonen P(wi) for utfallene i utfallsrommet på følgende måte. Definer for hver mulig verdi x3 A3 = {ui\X(cof) = æ,}.

(3.1)

Aj er da en begivenhet8 og angir at X = Xj, dvs. at eksperimentet har resultert i et utfall oji slik at X(u>i) — Xj. I følge (2.4) beregnes P{Aj) — PfaX = Xj) ved å legge sammen P(cj1) for de cut- som gir X(u;t) = Xj, dvs.

P(X = x,) = £ P(^). CUj 6Aj

(3.2)

Det kan vises at

P(X = (d) + P(X = x2) + P(X = x3) + ... = 1.

(3.3)

Dette er uttrykk for omtrent det samme som Aksiom 3. Når sannsynlighetene for alle de verdiene X kan anta legges sammen, blir summen 1. (3.3) kan avledes fra Aksiomene 1-3. Et formelt bevis er antydet i det avsluttende Avsnitt 9 der de fleste av de matematiske utledningene er samlet. 8dvs. en delmengde av Q, jfr. Definisjon 4.

20

Sannsynlighet og loven om store tall

4

Matematisk forventning.

Det vi først og fremst trenger for vårt formål, er en størrelse som uttrykker gjennom­ snittsverdien, som regel kalt forventningsverdien, til en tilfeldig variabel. Hvordan bør et slikt begrep defineres? Dersom terningen brukes som eksempel enda en gang, gjelder spørsmålet hvilken verdi som “gjennomsnittlig forventes” ved kast med en vanlig terning. Et opplagt svar er (1+ 24-3 + 4 + 5 + 6)/6 = 3.5, som også kan skrives 1’^ + 2*£+3’fi+4’fi+5’6+6’6 = 3'5‘ 666600

Den siste skrivemåten har den fordel at den leder til versjoner av begrepet forventning som er gyldige også for falske terninger (jfr. argumentasjonen som ledet til (2.4) i Avsnitt 2). Poenget er at tallene 1/6 i summen ovenfor erstattes med de sannsynlighetene som gjelder for den falske terningen. Generelt: Definisjon 6. Den matematiske forventning, skrevet E(X), for en tilfeldig variabel X er definert som £(X) = £x(Wj)P(a>j).

(4-1)

1=1

Ved hjelp av Eksempel 1 skal vi nå demonstrere at denne størrelsen virkelig representerer en “gjennomsnittsverdi” av den tilfeldige variablen X. Eksempel 1. Fortsatt.

For fortjenesten F reduserer summen (4.1) seg til

E(F) = X(0)P(0) + X(l)P(l)

ved å sette inn for X(0), X(l), P(0) og P(l). Den siste linjen gir, etter en liten omforming

S(F) = K(^-?). Vi har i Figur 2 forsøkt å illustrere betydningen av denne formelen. Anta at banken finan­ sierer n prosjekter av akkurat denne typen. La fortjenestene være Fi,.., Fn, noen positive, andre negative (svarende til tap). Gjennomsnittsfortjenesten for alle de n prosjektene blir da

Fn = (Fi + F2 + ... + F^/n, Det er mulig å simulere virksomheten ved at en datamaskin trekker om prosjektene gir fortjeneste eller tap. Anta at lånebeløpet K = 10 (millioner kroner), tapssannsynligheten q = 0.1 og rentfoten r = 15%. Da blir, i følge formelen for F(F)

F?(^) = 10 -

15

~ - Q-1) = °-5-

21

Den levende matematikken

I Figur 2 nedenfor er Fn plottet mot n etter hvert som resultatene for enkeltprosjektene kommer inn. I begynnelsen er gjennomsnittet negativt (på grunn av noen tidlige tapsbrin­ gende prosjekter), men etter hvert stiger den og ligger til slutt ikke langt fra E(F) = 0.5. Vi skal bevise siden (i Avsnitt 7 nedenfor) at det nødvendigvis må gå slik i det lange løp, dvs. at

Fn —> E(F),

når n —> oo,

slik at den faktiske gjennomsnittsfortjenesten Fn på n prosjekter nærmer seg mot den matematisk forventede fortjeneste E(F) når antall prosjekter blir stort.

Figur 2. Gjennomsnittsfortjenesten Fn etter n prosjekter for investeringen i Eksempel 1 når lånebeløpet K = 10 (millioner), tapssannsynligheten q = 0.1 og rentefoten r = 15%. Legg merke til at bankens samlete fortjeneste etter n prosjekter er nFn. Helt i begyn­ nelsen er denne negativ (svarende til et tap totalt på denne typen investeringer), men etter hvert tar inntjeningen seg opp, og etter 1000 låneprosjekter er fortjenesten omtrent 1000 • 0.5 = 500 millioner kroner.

Det finnes enkle regneregler for forventninger, som vi nå oppsummerer. De matematiske bevisene er gitt i Avsnitt 9. Setning 1.

E(X) = X1P(X = xT) + x2P(X = x2) + x3P(X = x3) + ....

Setningen sier at forventninger kan regnes ut ved å gange sammen Xj med punktsannsynlighetene P(X = xf) og summere, se forøvrig diskusjonen som ledet til Definisjon 6 ovenfor.

22

Sannsynlighet og loven om store tall

Setning 2.

For vanlige reelle tall a og b er E(a + bX) = a + bE(X).

Poenget her er at Z = a + bX kan oppfattes som en ny tilfeldig variabel. I følge Defin­ isjon^ er en tilfeldig variabel en funksjon over utfallsrommet fl. De verdiene Z antar er ZEjx) = a + 6X(u;.). Et enkelt eksempel er å la X være et terningkast og Z = 2X + 1 (dvs. vi dobler antall øyne og legger til 1 slik at Z-verdiene blir 3,5,7,9,11,13). Nå sier Setning 2 at

E(Z) = 1 + 2E(X) = 1 + 2 • 3.5 = 8, som også er gjennomsnittet av tallene 3,5, 7,9,11,13.

Setning 3.(a) For to tilfeldige variable X og Y er E(X+Y)=E(X)+E(Y). (b) For n tilfeldige variable Xu ..,Xn er tilsvarende E(XÅ + ... + Xn) = E(X-i) + ... + E(Xn).

Vi må først se på meningsinnholdet i setningen. Dersom X og Y er to tilfeldige variable, kan Z - X + Y oppfattes som en ny tilfeldig variabel (med verdi Z(u^) = X(u;t) + Y(u?t) for utfall wt). Det har derfor mening å beregne E(Z) = E(X + Y) og Setning 3(a) sier at E(X) og E(Y) skal legges sammen for å finne E(Z). Utvidelsen til (b)-tilfellet, der det er mer enn to variable, er rett fram.

Som en enkel illustrasjon, anta at en terning kastes tre ganger, og la X, være antall øyne ved j’te kast, j = 1,2, 3. Da er E(Xj) = 3.5 og E(X1 + x2 + X3) = E{X.) + E(X2) + E(X3) = 3.5 + 3.5 + 3.5 = 10.5.

Ved tre kast med en vanlig terning vil altså den forventede summen av øynene være 10.5, men naturligvis med store avvik hver gang. Dersom vi isteden etterspør forventningen for det gjennomsnittlige antall øyne, dvs.(Xi + X2 + X^/S, blir svaret, i henhold til Setning

2, + X2 + X3) = | • 10.5 = 3.5. 3 3° Dette regnestykket vil bli utvidet i avsnitt 6 og 7 når vi beviser store talls lov. eXx.

5

+

X2 + X3)) =

Uavhengige tilfeldigheter.

I forutsetningene for de grenseresultatene som flere ganger er blitt antydet, er det un­ derslått at det trengs en ekstra antakelse om at de tilfeldige hendelsene som inngår, ikke skal ha noen sammenheng med hverandre9. Det første vi da må gjøre er a formulere hva dette betyr matematisk. Denne problemstillingen er av betydning i seg selv. Dersom vi, for eksempel, kaster to ganger med en terning, forestiller vi oss at resultatet første gang er EStrengt tatt er dette utsagnet bare sant i den forstand at vi må ha en slik antakelse i den argumentasjon som benyttes her. I virkeligheten holder resultatene under mye svakere betingelser.

23

Den levende matematikken

uavhengig av resultatet andre gang. Hvordan bør en slik oppfatning uttrykkes i matema­ tisk språk? La A og B være to begivenheter. Det vi er ute etter, er å presisere hva det betyr at sjansen for at B inntreffer ikke påvirkes av om A har inntruffet. La, som før, mn(A) og mn(B) være antall ganger A og B forekommer i løpet av n gjentakelser av eksperimentet og la mn(A A B) være antall eksperimenter der både A og B forekommer. Om det er slik at A like gjerne kan inntreffe i de eksperimenter hvor B forekommer som i de hvor B ikke forekommer, burde det typisk være slik at

mn(A ABj mn(A) mn(B) ~ n ’

(

J

dvs. A inntreffer (omtrent) forholdsvis like mange ganger i de eksperimentene hvor B også forekommer som A gjør totalt. Vi kan avgjort ikke definere uavhengighet mellom begivenhetene A og B på denne måten, siden (5.1) er en upresis tilnærming, og ikke en identitet. Vi har, for gitt n, ingen kontroll med hvor god tilnærmingen er og tilfeldigheter kan føre til store avvik i enkelte eksperimentserier. Men vi kan la la n —> og og forlange likhet i (5.1) i grense, omtrent som vi gikk fram da vi motiverte Aksiom 1. La oss først omskrive (5.1) til

mn(AnB) mn(A)mn(B) ~ , n n n

(5-2)

etter å ha dividert med n på begge sider. Når vi lar n —* oo, vil mn(AC\ B)/n —> P(AAB), mn(A)/n —> P(A) osv. I grense framkommer da følgende definisjon: Definisjon 7. To begivenheter A og B sies å være tilfeldig uavhengige av hverandre (eller bare uavhengige) dersom

P(A A B) = P(A)P(B).

(5.3)

Legg merke til at begrepet uavhengighet er definert relativt en gitt sannsynlighetsfunksjon P(cui). Dersom denne endres, vil (normalt) to uavhengige begivenheter ikke lenger være uavhengige. Det er en forbindelse mellom uavhengighet og begrepet betinget sannsynlighet, som vi skal komme tilbake til i et senere kapittel i boken.

Definisjon 7 leder umiddelbart til en tilsvarende definisjon av hva det vil si at to tilfeldige variable X og Y er uavhengige. Definisjon 8.

To tilfeldige variable X og Y sies å være uavhengige dersom

P(X = x3 A Y = yk) = P(X = x3)P(Y = yk) for alle par (x3, yk).

24

(5.4)

Sannsynlighet og loven om store tall

Slike uavhengige par av tilfeldige variable tillater en enkel faktorisering av forventnin­ gen til deres produkt. Bemerk at når X og Y er funksjoner over utfallsrommet Q, er XY en ny funksjon, som til tilordner X(cut)y(cut). For forventningen til denne gjelder:

Setning 4.

For to uavhengige tilfeldige variable X og Y er E(XY} = E(X)E(Y).

Vi kan igjen illustrere ved terningkast. Anta at to terninger kastes, og vi multipliserer antall øyne. Hva er da forventningen for produktet? La X være antall øyne for den ene og Y antall øyne for den andre terningen. I følge Setning 4 er E(XY) = E(X)E(Y) = 3.5 • 3.5 = 12.25.

6

Eksempel 2. Gjentatte målinger.

Vi har nå opparbeidet det nødvendige maskineri til å kunne diskutere virkningen av å gjenta målinger for å øke totalnøyaktigheten. Eksemplet vi presenterer har større rekkev­ idde og generalitet enn det som kanskje framtrer ved første øyekast og leder til loven om de store tall i Avsnitt 7. Anta at en ukjent størrelse /?° kan måles (i videst mulig betydning) ved en annen størrelse X, for eksempel en instrumentavlesning eller en annen form for observasjon/registrering. Vi regner ikke med perfekt nøyaktighet. Det er dermed til stede en målefeil U slik at

X = n + U.

(6-1)

Det vil ofte være rimelig å gå ut fra at feilen U varierer fra gang til gang målingen utføres av årsaker vi ikke har kontroll over og kanskje ikke helt forstår. Dette betyr at det kan være rimelig å anta at U er en tilfeldig variabel som følger en eller annen sannsynlighetsfordeling slik dette begrep ble definert i Avsnitt 3 ovenfor. Vi skal anlegge dette synspunkt. Vi skal også regne med at feilen like gjerne kan ligge over null som under null, eller mer presist anta at E(U) = 0.

(6-2)

Det er i utgangspunktet klart at feil som regel vil kunne ha både positivt og negativt fortegn, men at forventningen skal være 0 er en klar avgrensning. Til tross for dette er det i mange tilfelle på ingen måte urimelig å tenke seg at “gjennomsnittsfeilen i det lange løp er 0”, som er hva (6.2) uttrykker. Andre antakelser om sannsynligetsfordelingen til feilene gjør vi ikke10 11, men i tillegg trengs et begrep som uttrykker hvor store feilene typisk er. Den vanlige framgangsmåten her er å innføre den såkalte varians a2 = E(U2),

(6-3)

10n er en gresk bokstav som leses “my”. 11 Det vil som regel være rimelig å tenke seg at feilene kan være et hvilket som helst tall over et in­ tervall. Den sannsynlighetsmodell vi har innført tidligere, tillater bare et endelig antall mulige feil, om enn et stort antall. Dette utgjør under enhver omstendighet en god tilnærming, og dessuten vil enhver instrumentavlesning ha endelig oppløsning, slik at bare et endelig antall mulige verdier er til stede i praksis.

25

Den levende matematikken

eller kvadratroten cr = y/cr*, som kalles standardavviket12. cr2 og a er mål for spredning eller variabilitet. Poenget er at verdiene for U ligger rundt 0 (siden E(U) = 0). Dersom de har en tendens til å ligge langt fra 0, gir dette opphav til store verdier for U2 og dermed til en stor forventet verdi a2. Betydningen av a2 er illustrert i Figur 3 der 1000 datmaskinsimulerte målinger X av en størrelse er plottet for en stor og en liten verdi av cr13. Legg merke til at målingene ligger mye nærmere verdien som måles i tilfellet til høyre der a er minst.

Figur 3. 1000 gjentatte målinger av en størrelse /i = 10 når cr2 = 2 (cr~ 1.41) (til venstre) og cr2 = 0.5 (cr æ 0.71) (til høyre). Hvert punkt representerer en måling. Vi er ute etter å studere virkningen av å gjenta målingene. La Åi,..,Xn være n målinger av nøyaktig samme type som (6.1) ovenfor, dvs.

Xj = Z2 + Uj,

j = l,2, ..,n,

(6.4)

der UiT^Un er tilfeldige variable som alle følger samme sannsynlighetsfordeling som U i (6.1). Spesielt er E(Uj) = 0 og cr2 = E(U2). Den naturlige måten å utnytte informasjonen om p i alle n målinger samtidig, er å beregne deres gjennomsnitt Xn = (-V1 + ••• + Xn)/n.

(6-5)

Feilen, dersom vi anvender Xn som anslag for //, er åpenbart en = Xn-fi,

(6.6)

som vi kan uttrykke ved målefeilene for de opprinnelige målingene ved følgende lille reg­ nestykke. Først innsett (6.5) for Xn i (6.6) slik at

en = (*i + ... + Xn}ln — //, 12Bokstaven cr er gresk og leses “sigma”. 13Den anvendte feilfordeling er den såkalte gaussiske (også kalt den normale). Denne fordelingen har den egenskap at den er “symmetrisk rundt 0”, dvs alle positive verdier u > 0 har den samme sannsynlighet for å forekomme som de tilsvarende negative —u. For slike symmetriske fordelinger vil anslagsvis 2/3 av observasjonene ligge innenfor ±cr fra 0 og 95 prosent innenfor ±2cr. Hvorledes stemmer dette med figuren?

26

Sannsynlighet og loven om store tall

og når hver Xj erstattes med utrykket i (6.4) blir en — (/Z + i/1 + ... + // + Vn)/n ~ M — (M ••• d" Z2) /n d" (t^l + .. + Un)!n — n slik at p forsvinner og e„ = ({/, + ... + t/„)/n.

(6.7)

Dette betyr at feilen i anslagsverdien Xn er gjennomsnittet til feilene i de n opprinnelige målingene.

Identiteten (6.7), som tilbakefører feilen i gjennomsnittet Xn til feilen i basismålingene, ser interessant ut. En umiddelbar konsekvens er følgende. La Sn = U\ + .. + Un slik at en = Sn/n. Av Setning 3(b) har vi at E(Sn) = E(U,) + . . + E(Un) = 04-... + 0 = 0. Setning 2 (med a = 0 og b = 1/n) gir deretter E(en) = E(Sn/n) = {E(Sn)}/n

slik at

E(en) = 0.

(6.8)

Vi har altså etablert at feilen til Xn har til felles med de opprinnelige målingene at den matematiske forventningen er 0, dvs. det er (grovt sagt) like sannsynlig å overstimere som å underestimere. Spørsmålet er om feilenes størrelse har endret seg. En måte å angripe dette på er å innføre

(6.9) Vi diskuterte fortolkningen av størrelser av denne typen ovenfor. Det gjelder å få den så liten som mulig. Er den for eksempel mindre enn den tilsvarende størrelsen cr2 for enkeltmålingene? Svaret er bekreftende dersom målingene foretas uavhengig av hverandre i den forstand at målefeilene Uj i (6.4) er uavhengige slik begrepet uavhengighet ble de­ finert i Avsnitt 5 ovenfor. Under denne forutsetningen har vi følgende viktige resultat:

Setning 5. (T2 = cr2/n.

Anta at alle målefeilene

i (6.4) er uavhengig av hverandre. Da er

Setningen viser nytten av å midle uavhengige målinger. Standardavviket crn går ned fra a i enkeltmålingene til cr/y/n for gjennomsnittet Xn. Vi må derfor kunne forvente at gjen­ takelser vil kunne føre til vesentlig mer nøyaktige resultater. Dette er demonstrert i Figur

27

Den levende matematikken

4, hvor situasjonen i venstre del av Figur 3 er simulert på nytt på følgende måte, n obser­ vasjoner ble generert og gjennomsnittet beregnet for n= 4 og n=1000. Dette ble gjentatt 1000 ganger for n—4 og 200 for n=1000. Verdiene av X4 og Xiooo er plottet i Figur 4.

Figur 4. Plot av gjentatte beregninger av Xn for n = 4 (til venstre) og n = 1000 (til høyre) når /i = 10 og /i,

(7-4)

Det er denne egenskap som kalles store talls lov. I virkeligheten dreier det seg snarere om store talls lover, for den finnes i flere versjoner og formuleringer. Den vi nå betrakter kalles konvergens i kvadratisk middel, siden (7.3) dreier seg om å kvadrere differansen mellom Xn og // og “midle” gjennom forventningen. Uansett viser (7.3) (og diskusjonen i Avsnitt 6) at gjennomsnittet Xn står i et bestemt forhold til den matematiske forventningen i den underliggende fordelingen. Derfor måtte gjennomsnittsfortjenesten Fn i Eksempel 1 bli omtrent lik (^ — q)K når mange prosjekter ble lagt sammen, som i Figur 2. (og altså garantert positiv bare 755 > 9, men også helt sikkert negativ om rentefoten r var lagt for lavt). Derfor kan vi i situasjoner som dem i Eksempel 2 overkomme unøyaktig enkeltmålinger. Ved å gjenta dem mange nok ganger, kan vi få feilen ned til et hvilket som helst lite nivå, uansett hvor dårlige målingene i ut­ gangspunktet er. Endelig gir (7.3) en formulering av (og bevis) for grenserelasjonen (1.1) som vi startet med (og som vi har brukt til å motivere mange av definisjonene). For å vise dette la A være en begivenhet som med en bestemt, fast sannsynlighet P(A) inntreffer ved hvert eksperiment i en serie bestående av n eksperimenter.. Definer tilfeldige variable X3 ved at

Xj — 1, = 0,

dersom A forekommer i eksperiment j ellers.

Da er åpenbart summen av alle X^ene lik antall ganger A har forekommet i serien, en størrelse vi har kalt mn(A) tidligere. Følgelig er

Xn =

(7.5) Yl

for disse tilfeldige variablene. Samtidig er (i følge Setning 1)

E(Xj) = 0 • P(A ikke forekommer i eksperiment j) + 1 • P(A) = F(A) slik at n — F(A). Kombineres disse bemerkningene med (7.3) følger at

E{—_ P(A)}2 —> 0, n

når n —» 00,

(7-6)

som uttrykker at mn(A) ------------ > P(A), n

o nar n —> oc.

z x (