Sannolikhetsteori och statistikteori med tillämpningar [6 ed.] 9789144122953, 9789144123561

Sannolikhetsteori och statistikteori har vidsträckta tillämpningar inom olika forskningsområden och olika delar av samhä

341 77 11MB

Swedish Pages 426 [438] Year 2017

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Sannolikhetsteori och statistikteori med tillämpningar [6 ed.]
 9789144122953, 9789144123561

  • Commentary
  • Cleaned up version from 6F25847730D581440F43FCA29DA6F385
Citation preview

Sannolikhetsteori OIH4)

STL el:T0

tillämpningar

GUNNAR JAN

ENGER

GUNNAR JAN (RS

BLOM ENGLUND

GRANDELL a ONES

Kurs Sanno

vVEL. OCH

KU Ndi



=" H Electrumbi blioteket

Sannolikhetsteori och statistikteori

med tillämpningar GUNNAR JAN

ENGER

GUNNAR JAN LARS

BLOM

ENGLUND

GRANDELL HOLST

Sjätte upplagan

dv

(

KTH Electrumbiblioteket

2

ÅA Studentlitteratur

Från och med sjätte upplagan ges denna bok ut som mjukband. Denna upplaga innehåller dock inga förändringar av innehållet

jämfört med den femte upplagan.

KR

Kopieringsförbud

Detta verk är skyddat av upphovsrättslagen. Kopiering, utöver lärares och studenters begränsade rätt att kopiera för undervisningsändamål enligt Bonus Copyright Access kopieringsavtal, är förbjuden. För information om avtalet hänvisas till utbildningsanordnarens huvudman eller Bonus Copyright Access.

Vid utgivning av detta verk som e-bok, är e-boken kopieringsskyddad. Den som bryter mot lagen om upphovsrätt kan åtalas av

allmän åklagare och dömas till böter eller fängelse i upp till två år samt bli skyldig att erlägga ersättning till upphovsman eller rättsinnehavare. Studentlitteratur har både digital och traditionell

bokutgivning. Studentlitteraturs trycksaker är miljöanpassade, både när det gäller papper och tryckprocess.

Art.nr 359 ISBN 978-91-44-12295-3

Upplaga 6:1 O Författarna och Studentlitteratur 1969, 2017

studentlitteratur.se Studentlitteratur AB, Lund Omslagslayout: Henry Sivula Printed by Holmbergs i Malmö AB, Sweden 2017

Innehåll Förord

1

ix

Inledning till sannolikhetsteorin 1.1 Om nyttan av sannolikhetsteori . .. 1.2 Om modeller, särskilt slumpmodeller

1.3

Något om sannolikhetsteorins historia

........... . ..........

..........

Sannolikhetsteorins grunder 2.1 Inledning -soeeeeeeeserer rr rs rr rs tra 2.2 Händelser . ..oosoeeseseseceorssr ss ss ss ss ss 2.3 Sannolikheter i allmänna utfallsrum 2.4 Sannolikheter i diskreta utfallsrum . ........... 2.5 Likformigt sannolikhetsmått och kombinatorik ..... 2.6 Betingad sannolikhet . . ....osssc0occ soccer 2.7 Oberoende händelser . .oscososrss rs sr rss osv rr 2.8 Sammanfattning ..osossrsesrsosrss rss sovr 2.9 Problem .oosereeee reser ss rr rr rss ess Endimensionella stokastiska variabler 3.1 Inledning so sssssseseseecres esse ever 3.2 Allmänt om stokastiska variabler . ............ 3.3 Diskret stokastisk variabel . . ...........s.co.c.v.

3.4

Några diskreta fördelningar

3.5 3.6 3.7 3.8 3.9

Kontinuerlig stokastisk variabel . ............. Några kontinuerliga fördelningar . ............ Fördelningsfunktion oo. sosse ss ses sr os eva Intensitet . ooo ess ses ers sr ss ess Blandning av stokastiska variabler . ........... iii

. ......sosscscsccc..

12 17 26 32 37 38

Innehåll

3.10

Funktioner

3.11

Sammanfattning

av en stokastisk variabel

....osssrrssscseoss oso vr

3.12

Problem

ooo

.. ....

4.10

sososs..es...... ort

82 Inledning so seseseeesrersreskr rss rs tr 82 Tvådimensionella stokastiska variabler . . ........ 82 Diskret tvådimensionell stokastisk variabel . . ...... 84 Kontinuerlig tvådimensionell stokastisk variabel . . . . . 87 Oberoende stokastiska variabler . . ............ 39 Största och minsta värdet ................. 92 Summa av stokastiska variabler . . ............ 94 Betingade fördelningar . . .....ssscsssc oss vv. 98 Sammanfattning ...ososrscsrsssse oo e ov 101 Problem .. ... esse rsessso..s soo sv rv er 102

Flerdimensionella

4.1 4.2 4.3 4.4 4.5 4,6 4.7 4.8 4.9

...........

stokastiska

variabler

Väntevärden 107 5.1 Inledning so sessseesreessrs ss rss ess 107 93.2 Definition och egenskaper .......s.ssscoccc cc. 107 3.3 Lägesmått och spridningsmått . ...........c..c. 114 5.4 Beroendemått . . .. ooo ososrs oss ss oss vo sr 121 5.5 Summa och linjärkombination . .....ss.cscsccccc. 125 93.6 Stora talens lag . .. oss ss rer rr ser sr 128 3.7 Betingade väntevärden och varianser . .......... 131 5.8 Sammanfattning ..o.ossssssssss.osso vo vv. 135 0.9 Problem . oso ee eees ses. rss orsa 136 Normalfördelningen

iv

6.1

Inledning

=..|. sosse

esreseseoss

rss

rr

6.2 6.3 6.4 6.5 6.6 6.7 6.8

Allmänt om normalfördelningen . . ............ Standardiserad normalfördelning ............. Allmän normalfördelning. . «soo ss sco sv vr Linjärkombinationer av oberoende normalfördelade s.v. Tvådimensionell normalfördelning ............ Centrala gränsvärdessatsen . .. oo... ...o...c.c. Sammanfattning . sosse sss.s soo svt

6.9

Problem

..osoeseserrerrerser rs rs re ts sr

Innehåll

7

Binomialfördelningen och dess släktingar 7.1 Inledning «.o|!Å ss oreee ses re sr ses 7.2 Binomialfördelningen . . ... ...s cc .cccc + 7.3 Hypergeometriska fördelningen ......... 7.4 Poisson-fördelningen . ........c..c.c.c.c. 7.5 Något om multinomialfördelningen . ...... 7.6 Sammanfattning .........s.s.scc.c.cocc. 7.7 Problem oso r rr es rs rr es era

8

Slumptal och simulering 8.1 Inledning -. ssesresessres esse 8.2 Programmeringskod . .............. 8.3 Slumptal. ooo sosse css ss ss sees 8.4 Inversmetoden . oo .osersss soo s vv. 8.5 Diskreta fördelningar . . ....sscosococ0c cc. 8.6 Slumptal från standardfördelningar . . ..... 8.7 Urval ur ändliga populationer . ......... 8.8 Simulering . co som cor ers sr rs es es 8.9 Sammanfattning ....s.ssssoso.c.ss..ss 8.10 Problem . oo meserssesessse ss se. es

9

Introduktion

9.1 9.2 9.3 9.4 9.5

till statistikteorin

Inledning ..osossasssrsss rss vor ctr Om statistiska undersökningar ......... Exempel på stickprovsundersökningar ..... Huvudproblem inom statistikteorin . . ..... Något om statistikteorins historia . . . . ....

10 Beskrivande

statistik

10.1 Inledning smo resresss ses scr 10.2 Tabulering och grafisk presentation . . ..... 10.3 Lägesmått och spridningsmått =... ....... 10.4 Korrelation . soooesscres rr sr sr resa 10.5 En anmärkning om terminologi . ........ 10.6 Om numerisk precision . ............. 10.7 Sammanfattning ...ooss.s.oss.cscscc cc. 10.8 Problem . so mess er rss ss ers

Innehåll

11 Punktskattning 11.1 Inledning sosse

esssress

ses

11.2

11.3 Allmänt om punktskattningar =. ....o.s.ssccocc-11.4 Skattning av väntevärde och varians ...........

Exempel:

241 250

11.5

Maximumr-likelihood-metoden

253

11.6 11.7 11.8 11.9

Opinionsundersökning

ss

239 ses 239

..........ccc

.......s.scocc-cc

239

Minsta-kvadrat-metoden . .. css. c ss ro. Tillämpning på normalfördelningen . . .... cs. --Tillämpning på binomialfördelningen och dess släktingar Medelfel för en skattning . . . .. ss. css cc cor

259 264 268 270

11.10Felfortplantning . . «ss. oss sr rr ses er er er 11.11Parameter med apriori-fördelning . . . . sc. sc co cc 11.12Sammanfattning -.. sosse ser ss re oc vs 11.13Problem . os ess esse rr rr rt es

273

280 280

12 Intervallskattning 12.1 Inledning sosse ere rr rs 12.2 Allmänt om intervallskattning . . . .. ss ccccco. 12.3 Tillämpning på normalfördelningen . . .. co. sc cc «oo 12.4 Användning av normalapproximationen ......... 12.5 Tillämpning på binomialfördelningen och dess släktingar 12.6 Sammanfattning ... secs esse rs rer rr rer

287 287 287 290 302 307 312

12.7

Problem

. . . ..ososeossss.ese sr eo eo ooo vh 313

13 Hypotesprövning 13.1 Inledning ooo ses sees see 13.2 Ett exempel på hypotesprövning .. 13.3

13.4 13.5 13.6 13.7 13.8 13.9

Generell metod

. ..

. . ...

rr rr ss

ss

se

rr re .ecccc

320 320 320

sov

321

ro

ee es ee rss tre rer Styrkefunktionen . . ses Samband mellan hypotesprövning och intervallskattning Tillämpning på normalfördelningen . . .. se cc ccc . ...cccccAnvändning av normalapproximationen

Tillämpning på binomialfördelningen . . cc. co. . ...... Teckentestet och Wilcoxons rangsummetest

13.12Sammanfattning 13.13Problem

324 329 330 333 334 337

RR RR KRA 341 348 «cc. 6 e6se 6 es ter 350 .....s-e

rr rr 13.10x?-test . . . soc 13.11 Signifikanstestens praktiska värde . . «+.

vi

277

Innehåll

14 Regressionsanalys 14.1 Inledning «sosse so ever 14.2 Modell för enkel linjär regression ....... 14.3 Punktskattningar . .........cscsoc0ccc cv. 14.4 Intervallskattningar . . .......cs.ccocc.. 14.5 Multipel regression . . ....s.csosccorc cc cc 14.6 Korrelation . oo soo ses rss ss ss ses 14.7 Sammanfattning . ............c.c.c. 14.8 Problem . sosse sesesesers rese vo rt 15 Planering av statistiska undersökningar 15.1 Inledning -. sosse rss rese se ver 15.2 Allmänt om planering ..........c.ccm 15.3 Icke-jämförande undersökningar . . ...... 15.4 Jämförande undersökningar .......... 15.5 En avslutande anmärkning .......... 16 Fallgropar Tabeller

397

Svar till problemen

407

Sakregister

422

Förord Sedan 1970-talet har Gunnar Bloms bok ”Blom C” blivit ett begrepp för många studerande på inledande kurser i matematisk statistik vid tekniska högskolor och universitet. Genom sin blandning av teori och tillämpningar har den fint illustrerat sannolikhetsteorins och statistikens användbarhet och givit en god grund för vidare studier. Tidens tand har dock drabbat ”Blom C” och en uppfräschning har känts angelägen. Vi blev mycket hedrade när Gunnar Blom frågade oss om vi kunde göra en sådan. Resultatet är denna omarbetning. Vi har försökt behålla det allmänna upplägget och andan i boken. Delar har lagts till eller skrivits om och delar har förkortats eller strukits, bl.a. avslutas kapitlen med korta sammanfattningar. Teknikens utveckling har också satt sina spår i layouten. Vi hoppas att en bra lärobok blivit ännu bättre. Stockholm i januari 2005 Jan Enger

Gunnar Englund

Jan Grandell

ix

Lars Holst

Kapitel

1

Inledning till sannolikhetsteorin 1.1

Om

nyttan av sannolikhetsteori

Vi skall ge tre exempel avsedda att visa att man kan ha praktisk nytta av sannolikhetsteori. Exempel 1.1 Parti med felaktiga enheter Vid köp av vissa bildelar från en underleverantör tar man vid en bilfabrik ur ett parti på 1000 enheter ut 75 enheter och undersöker dessa. Om man påträffar högst

två felaktiga enheter, godkänner man partiet, annars återsänder man det till leve-

rantören. Antag att hela partiet innehåller 20 felaktiga enheter. Hur stor är i så fall sannolikheten att partiet kommer att godkännas vid kontrollen? En sådan fråga är naturlig att ställa, ty svaret kan ge bilfabriken en uppfattning om kontrollens effektivitet. För detta ändamål kan man använda sannolikhetsteori. Oo Exempel 1.2 Mätning av fysikalisk konstant En fysikalisk konstant bestäms fem gånger vid ett laboratorium.

värdena (i viss enhet)

2.13

2.10

2.05

2.11

Man

får därvid

2.14.

På grund av mätfel av olika slag får man som synes inte samma värde varje gång, utan det uppstår en viss okontrollerbar variation, som man kan kalla slumpmässig. För att få en uppfattning om hur värdena ligger i förhållande till den konstant man vill bestämma kan man ställa frågan: Hur stor är sannolikheten att det aritmetiska medelvärdet av de fem mätvärdena avviker från det korrekta värdet med mer än en viss kvantitet? För att besvara frågan behöver man sannolikhetsteori.C

1 Inledning till sannolikhetsteorin Exempel 1.3 Djurförsök En forskare vid ett läkemedelsföretag sprutar sulin och mäter minskningen i blodsockerhalt. utgångsvärdet): 11.2

21.2

—- 4.0

18.7

2.8

27.2

25.1

på 12 kaniner in en viss dos inResultat (i procent, beräknat på 25.8

2.2

28.3

23.7

— 2.2.

Värdena varierar som synes kraftigt, vilket är regel vid studium av biologiska företeelser. Se på ytterlighetsvärdena: Ett djur har minskat sin blodsockerhalt med 28 PN, ett annat har ökat den med 4 AX. Variationerna är stora, trots att man bemödat sig om att uppföda kaninerna på samma sätt och i övrigt behandla dem lika. Av diverse olika skäl reagerar kaninerna mycket olika för en och samma dos. Trots den stora variationen mellan försöksvärdena kan värdefull information utvinnas ur sådana försök; läkemedelsföretaget utför dem för att bestämma styrkan på tillverkade insulinpartier. För detta ändamål behövs sannolikhetsteori. Oo

Gemensamt för de tre exemplen och för alla andra situationer, som undersöks med hjälp av sannolikhetsteori, är att det föreligger variabilitet. I Exempel 1.1 varierar antalet påträffade defekta enheter om man utför provtagningen om och om igen på samma parti, i Exempel 1.2 uppstår variationer från mätning till mätning och i Exempel 1.3 från djur till djur. Variabilitet är en mycket generell företeelse. Variationerna kan vara små, som mellan precisionstillverkade kugghjul eller mellan enäggstvillingar ”lika som bär”, eller stora, som mellan stenarna i Sveriges moränmarker eller omsättningarna i kronor ett visst år hos dess inregistrerade företag. Olikheter mellan människor, fysiska och psykiska, variationer ifråga om geografiska betingelser, mineraltillgångar,

väderlek och ekonomiska förhållanden påverkar samhällslivet på ett grundläggande sätt, och kännedom härom är ofta väsentlig för enskilt

och samhälleligt handlande. Det kan vara äventyrligt att försumma variabiliteten. Ett enda, nästan trivialt exempel skall nämnas: Om man tänker vada över en flod räcker det inte med att veta att medeldjupet är en meter, man måste känna till hur djupet varierar.

På grund av variabilitetens allestädesnärvaro är det naturligt att sannolikhetsteorin — variabilitetens grundläggande vetenskap —- har mångskiftande användningar inom teknisk forskning, fysik, kemi, biologi, medicin,

m.m.

Intresset för tillämpad sannolikhetsteori har ökat

kraftigt på senare år t.ex. i samband med signalbehandling och telekommunikation, modeller för köbildning och produktionsplanering, finans- och försäkringsmatematik samt epidemiologiska modeller (un2

1.2 Om

modeller, särskilt slumpmodeller

dersökning av sjukdomars utbredningsförhållanden). Sannolikhetsteorin ligger också till grund för statistikteorin. Det bör tilläggas att sannolikhetsteorin är en inte bara nyttig utan också nöjsam och elegant vetenskap. Nöjet kan t.ex. den erfara som är road av tippning, lotterier och totalisatorspel och finner att han med sannolikhetsteorins hjälp kan lösa många sannolikhetsproblem förknippade med sådana aktiviteter. Och många forskningsfrågor inom sannolikhetsteorin kan ge den matematiskt intresserade tillfälle

både till anspänning och tillfredsställelse. Lysande exempel på detta

ges i Häggström (2004).!

1.2

Om

modeller,

särskilt slumpmodeller

Av grundläggande betydelse för all vetenskap är begreppet modell. En modell är avsedd att beskriva väsentliga egenskaper hos en företeelse

utan att kopiera den i alla detaljer. Ett fundamentalt men vanligt fel

är att sammanblanda modellen med den verklighet som den är avsedd att efterlikna. Viktigt är att minnas att varje modell är approtimativ. Ett gott valspråk för den som sysslar med modeller är därför: Skilj på modellen och verkligheten. Modeller kan vara av olika slag. Man skiljer mellan fysiska modeller (exempel: hus i skala 1:50), analoga modeller (exempel: karta, ritning, atommodell med kulor på stänger) och abstrakta modeller. Inom matematiska och experimentella vetenskaper används ofta abstrakta modeller. Sådana modeller hör hemma i matematikens värld och kan beskrivas i matematiska termer. Abstrakta modeller kan vara deterministiska eller stokastiska. I stället för stokastisk modell säger vi oftast slumpmodell. Ordet stokastisk kommer från grekiskans stochastikos, skicklig att träffa rätt, att gissa rätt; stochos betyder måltavla, gissning. v I en deterministisk modell approximeras företeelser med matematiska funktioner. Om man t.ex. vill bestämma arean av ett runt bord, tänker man sig bordsskivan ersatt med en cirkel och får då arean 7r?, där r är cirkelns radie. Att detta är en modell står klart: exakt cirkelformade bordsskivor finns bara i en abstrakt värld. Låt oss ta en mer fantasieggande situation. I en under tidernas lopp mycket omdebatterad deterministisk modell, med stora konsekvenser !Häggström,

O. (2004)

Slumpens skördar, Studentlitteratur, Lund.

1 Inledning till sannolikhetsteorin

för individ och världsåskådning, antas att kännedom om alla atomers läge och rörelse i ett visst ögonblick ger möjlighet till exakt förutsägelse av hela den efterföljande världsutvecklingen. Enklare betydelsefulla exempel på deterministiska modeller är den euklidiska geometrin, som t.ex. användes för jordmätning i det gamla Egypten, och den klassiska mekaniken, som bl.a. gav Newton möjlighet att beskriva planeternas rörelser kring solen.

I det följande ägnar vi oss helt åt slumpmodeller. Sådana model-

ler används inom sannolikhetsteorin för beskrivning av slumpmässiga försök. Därmed avses, något vagt uttryckt, varje företeelse som kan upprepas under likartade förhållanden och vars utfall inte exakt kan anges i förväg, även om man många gånger tidigare utfört samnya försök. Det är just den oförutsägbara variationen i utfallen, som man beskriver med en slumpmodell. Låt oss beskriva ett klassiskt exempel på ett slumpmässigt försök. Kasta en tärning upprepade gånger och anteckna varje gång antalet ögon. Resultatet blir kanske 1,5,1,6,3,2,4,1,6,... För att detta skall kunna kallas ett slumpmässigt försök fordras att den som kastar tärningen uppför sig på lämpligt sätt så att utfallet ej kan förutses. Han skulle ju kunna hålla tärningen strax ovanför bordet varje gång och därigenom bestämma utfallet. Av detta inses att vissa villkor måste vara uppfyllda, för att en företeelse skall kunna rubriceras som ett slumpmässigt försök, och även att dessa villkor inte går att formulera strängt.

Ett annat slumpmässigt försök erbjuder studiet av radioaktivt sönderfall. Resultatet av en berömd serie sådana experiment publicerades i början av 1900-talet av Rutherford och Geiger. De registrerade hur många atomer som sönderfaller på en minut i en viss mängd av ett radioaktivt preparat. Försöket upprepades med den ena lika stora mängden

efter den andra. Antalet registrerade partiklar vid sådana försök kan bli t.ex. 24, 31,29, 16,19, 25,... Innan man kan tillämpa sannolikhetsteori på de försök som här beskrivits, måste man ställa upp en slumpmodell som beskriver hur resultatet varierar. I exemplen ovan är modellerna ganska enkla, men ibland behöver man komplicerade modeller, t.ex. då man efter reglertekniska principer önskar styra fartyg eller industriella processer. 4

1.3 Något om sannolikhetsteorins historia

I denna bok kommer vi att syssla med grundläggande egenskaper hos vissa viktiga slumpmodeller och därmed lägga en grund för sannolikhetsteorin.

1.3

Något

om

sannolikhetsteorins

historia

Sannolikhetsteorin har sina rötter i 1500-talets Italien och 1600-talets Frankrike och var till att börja med en teori för hasardspel. Italienaren Cardano författade i mitten av 1500-talet en skrift om sådana spel, där han löste flera sannolikhetsproblem. Berömd är den 1654 påbörjade brevväxlingen mellan Pascal och Fermat rörande vissa spelproblem. Andra föregångsmän från en något senare tid är Bernoulli och de Moivre. Laplace framställde i Théorie analytique des probabilités, utgiven 1812, sannolikhetsteorin som en matematisk teori av imponerande omfång och utvidgade tillämpningarna till astronomi, mekanik, m.m. Väsentliga insatser gjordes också av Gauss, som med hjälp av sannolikhetsteori studerade fel vid fysikaliska observationer. Vetenskap i modern mening har sannolikhetsteorin blivit först un-

der 1900-talets första årtionden. Flera ryska matematiker har bidragit

härtill, bl.a. Tjebysjov, Markov, Liapunov och Kolmogorov. Väsentliga bidrag har också lämnats bl.a. av fransmannen Lévy, österrikaren von Mises, amerikanerna Doob och Feller samt svensken Cramér. ” Under de senaste decennierna har skett en explosionsartad utveckling av sannolikhetsteorin, speciellt teorin för s.k. stokastiska processer. En mängd nya tillämpningsområden har tillkommit, t.ex. bioinformartik, bildbehandling och finansiell matematik. Dessa har också inspirerat teoriutvecklingen. Inte minst datorutvecklingen har betytt mycket, bl.a. genom att beräkningar på komplexa och mer realistiska slumpmodeller för många fenomen nu kan praktiskt genomföras.

Kapitel 2

Sannolikhetsteorins

grunder 2.1

Inledning

Detta kapitel är viktigt. För att få en snabb kontakt

med

det re-

kommenderas läsaren att vid första genomläsningen hoppa över alla anmärkningar och flertalet exempel. Flera läsningar rekommenderas

för att grunden skall bli stabil. Viktigast

är Avsnitten

2.2 och 2.3

som handlar om händelser respektive om sannolikhetsdefinitionen; vi

understryker betydelsen av Kolmogorovs

axiomsystem

på sidan 14.

I Avsnitt 2.4 införs den klassiska sannolikhetsdefinitionen och exempel ges på sannolikheter i diskreta utfallsrum. Avsnitt 2.5, innehåller några satser från kombinatoriken och flera exempel med anknytning till den klassiska sannolikhetsdefinitionen. De båda Avsnitten 2.6 och 2.7 handlar om betingad sannolikhet respektive om det betydelsefulla begreppet oberoende händelser.

2.2

Händelser

Vi börjar med tre definitioner. Definition 2.1 utfall.

Resultatet av ett slumpmässigt försök kallas ett

2.2 Händelser

Definition 2.2

Mängden av möjliga utfall kallas utfallsrummet.

Definition 2.3

En händelse är en samling av utfall.

En händelse är alltså en delmängd av utfallsrummet (eventuellt hela detta). Utfall brukar betecknas med siffror eller bokstäver, i denna bok ofta med wj,wo,...

(små omega).

Utfallsrummet betecknas med

A (stora omega). Händelser betecknas med stora bokstäver A, B,C,... Att ÅA inträffar innebär att ett utfall som tillhör A inträffar. Exempel

2.1

Kast med en tärning

Låt oss kasta en tärning. Vi inför sex utfall (= antal ögon)

vilka vi betecknar

1,2,...,6. Utfallstummet AN består av dessa utfall och kan skrivas Q = (1,2,...,6). Exempel på händelser som man kan vara intresserad av är A = ”antal ögon udda” och B = ”antal ögon högst 2”. Med användning av beteckningarna för utfallen kan vi skriva dessa händelser A = (1,3,5), B = (1,2). Observera att vi inte har sagt

något mer om tärningen än att den har sex sidor; den kan för övrigt se ut hur som

helst.

Exempel 2.2 Kast med två tärningar Låt oss kasta två tärningar på en gång. Det ligger nära till hands att införa 36 utfall wi, ...,ws36 allt efter det antal ögon som kommer upp. Dessa utfall kan skrivas (1,1),(1,2),...,(6,6), där första siffran avser ena tärningen och den andra

siffran den andra. (Vi antar att tärningarna har olika färg så att de kan skiljas åt.) Utfallsrummet omfattar dessa 36 utfall. Som händelse A kan man ta t.ex. Å = ”summan

av ögonen

högst 3”, vilket kan tecknas A=

((1, 1), (1,2), (2, 1))

Händelsen A omfattar alltså tre utfall. Det är ofta praktiskt

att åskådliggöra

N och A med

någon

typ av figur eller

diagram (se Figur 2.1, där A motsvaras av de inringade punkterna).

Exempel 2.3 Radioaktivt sönderfall Man har en viss mängd av ett radioaktivt preparat och registrerar med hjälp av en räknare hur många partiklar som sönderfaller under ett visst tidsintervall. Resultatet kan bli något av talen 0,1,2,... Vi låter vart och ett av dessa tal utgöra ett

utfall. I utfallsrummet Q = (0,1,2,...) finns alltså ett uppräkneligt (numrerbart)

oändligt antal utfall.

[a

Exempel 2.4 Håillfasthet Ur ett parti armeringsstål tar man ut ett antal stavar av 8 cm längd och bestämmer deras sträckgräns i MPa. Resultatet blir kanske 624.3, 696.8, 650.0, 631.5, 768.2,...

7

a

DO RB MOM

2 Sannolikhetsteorins grunder

1

Figur 2.1

5 6 43 2,

Kast med två tärningar.

mellan 0 och Tänkbara värden (= utfall) är, åtminstone teoretiskt sett, alla tal mot vad olikhet I tal. ativa icke-neg alla omfatta 00. Vi låter därför utfallsrummet fallet var i de båda föregående exemplen

är det omöjligt att skriva upp

utfallen i

en följd. Händelsen A kan t.ex. vara ”sträckgräns mellan 600.0 och 650.0”.

med en I praktiken anges sträckgränsen med ett visst antal decimaler, kanske kommer N A ty oändligt, ligt uppräkne utfall decimal som ovan. I så fall blir antalet

att omfatta talen 0.0, 0.1,0.2,... Då kommer ÅA att bestå av ett ändligt antal utfall

600.0, 600.1, ...,650.0.

Matematiskt

sett är det i allmänhet enklast att bortse från

detta och använda det kontinuerliga betraktelsesättet.

OO

Nu ger vi ytterligare en definition.

Definition 2.4 Om antalet utfall är ändligt eller uppräkneligt oändligt, säges NA vara ett diskret utfallsrum. Om antalet är ändligt, säges AN speciellt vara ett ändligt utfallsrum.

Om antalet utfall icke är ändligt eller uppräkneligt oändligt, säges

AN vara ett kontinuerligt utfallsrum.

I Exemplen 2.1, 2.2 och 2.3 är utfallsrummet diskret, i Exemplen 2.1 och 2.2 är det till och med ändligt; i Exempel 2.4 är det kontinuerligt. Exempel 2.5 Myntkast Ett mynt kastas upprepade gånger. Klave kallas 0 och krona 1.

a) Givet antal kast Resultatet av n kast kan representeras med ett binärt n-siffrigt tal. (Om t.ex. n = 3 blir de möjliga talen 000, 001, 010, 011, 100, 101, 110, 111.) Vi låter varje sådant tal vara ett utfall; antalet utfall är 2”. Man kan i detta och liknande fall som illustration

använda ett ”träddiagram”

n=3.

(ett kullfallet träd), i Figur 2.2 åskådliggjort i fallet

2.2 Händelser

000 001 010 011 100 101 110 111

Figur

2.2

Ire kast med ett mynt.

b) Kast tills krona erhålls Myntet kastas tills krona erhålls för första gången. Det

naturliga är att ange antalet kast som behövs: 1,2,.... Med den binära representationen som användes i a) kan utfallen även skrivas 1,01,001,0001,... Deras antal är uppräkneligt oändligt. Oo

Då man skall undersöka olika händelser är det praktiskt att använda mängdlärans symboler. Vi antar att läsaren är förtrogen med dessa men ger ändå som serviceåtgärd i Figur 2.3 en lista över vad

vi kommer att behöva jämte illustrerande s.k. Venn-diagram. Vi ger

definitionerna till höger på mängdlärans vanliga språk och till vänster på det speciella händelsespråk som vi ofta kommer att använda. En mängd som vi inte åskådliggjort är den tomma mängden 0, dvs den omöjliga händelsen och komplementet till Q. Skrivsätten AU B och AN B utvidgas på ett självklart sätt till fler än två händelser. Ibland är det därvid bekvämt att använda följande symboler: UA;

= minst en av händelserna A;,..., An inträffar;

n

(14; = alla händelserna Ai,..., An inträffar.

i=1

Utvidgning till (Uf, 4; och (YE, 4; behövs ibland och vållar inga problem. Händelserna A;,..., Ån säges vara parvis oförenliga om alla par A;

och A; är oförenliga (disjunkta), dvs om det är omöjligt att två eller flera av händelserna inträffar samtidigt. Det visar sig bekvämt att som beteckning för komplementär händelse skriva A” i stället för den vanligt förekommande CA.

2 Sannolikhetsteorins grunder

Utfallsrummet

Grundmängden

Händelsen A; A inträffar

Delmängden A

Komplementära händelsen A" till A; A inträffar inte

Komplementet

A" till A

Unionhändelsen

AU PB; A eller B eller båda inträffar

Unionen AU B

Snitthändelsen AN B; både A och B inträffar

Snittet AN

A och B oförenliga händelser; A och B kan inte inträffa samtidigt

A och B disjunkta

Figur

10

2.3

Några viktiga händelser och termer.

B

2.2 Händelser

Man inser direkt att (A”)" = A. Man måste sätta ut parenteser för att ange i vilken ordning mängdoperationerna skall utföras i ett uttryck om det innehåller både NM och U. Ett uttryck som AU BNAC

är inte väldefinierat eftersom i allmänhet (4U B)JOC £ AU(BNC) (Rita figur!). Följande räkneregler är lätta att bevisa (Gör det!):

AN(BUC)=(ANB)U(A U AU(BNAC)=(AUB)N(A n (UA)

- NA

Å sl och ( i=1

C) C) UA.

i=1

(2.1)

De två första formlerna påminner om räkneregeln a -: (b+ ec) = (a-b) + (a : ec). Formlerna (2.1) brukar kallas De Morgans lagar. Med

upprepad

användning av De Morgans

lagar kan man enkelt

få fram att t.ex. (A"U(BNC"))" = AN(B”UC), där man använt sig av regeln: Byt NM mot U, U mot MN, A mot ÅA" samt A” mot A när man skall ta komplementet av ett komplicerat uttryck. Anm.

2.1

Definitionen av utfall

I de hittills givna exemplen

har vi använt

en mycket

”finfördelad”

definition

av

utfallen i ett slumpmässigt försök. Vi har gjort en uppdelning i så många alternativ

som möjligt och kallat vart och ett för ett utfall. Det ligger inte något tvingande i detta. Om man t.ex. kastar en tärning, kan man eventuellt nöja sig med att skilja på de båda utfallen ”etta kommer upp” och ”etta kommer inte upp”. På liknande sätt kan man vid mätning av en persons längd, i stället för att betrakta varje längd som ett utfall, bara skilja på de båda fallen ”längd mindre än 170 cm” och ”längd större än eller lika med 170 cm”. Ett flertal omständigheter, t.ex. utfallsrummets mäktighet och den praktiska frågeställningen, påverkar valet av utfall. Oo

Anm.

2.2

Modellens språk och verklighetens

Valspråket på sidan 3 utsäger: tigt hålla isär begreppen borde

Skilj på modellen och verkligheten. För att rikman egentligen genomgående ha olika termer för

något i ” verkligheten” och motsvarande sak i ”modellvärlden”. Utfall skulle då bara

användas om verkligheten och på modellspråk alltid kallas element i grundmängden, händelse skulle alltid översättas till delmängd osv (jfr Figur 2.3). Vi kommer att i fortsättningen betona modellaspekten, men konsekvent ”tvåspråkig” kan fram-

ställningen inte vara; då skulle den bli både alltför svårskriven och alltför tung att ta del av. Oo

11

2 Sannolikhetsteorins grunder

2.3

Sannolikheter

i allmänna

utfallsrum

I detta avsnitt låter vi utfallsrummet vara allmänt, dvs framställningen omfattar både diskreta och kontinuerliga utfallsrum. Vi skall efter förberedelserna i föregående avsnitt bygga en slumpmodell för ett slumpmässigt försök. Begreppet sannolikhet är därvid av central betydelse. Hur skall detta begrepp definieras matematiskt? Det finns mycket att säga härom, och det skulle vara befogat att ge en historisk exposé över sannolikhetsbegreppets utveckling. Vi måste emellertid fatta oss kort. Slumpmodellen skall avbilda verkligheten, och vid valet av sannolikhetsdefinition får vi god ledning genom att utnyttja en viktig egenskap hos empiriskt utförda slumpmässiga försök. Antag att vi har en välgjord tärning. Om den kastas många gånger,

och man några gånger gör en paus och räknar ut relativa frekvensen av t.ex. ettorna, dvs kvoten mellan antalet erhållna ettor och hela antalet utförda kast, skulle man kunna få följande resultat:

Antal | Antal | Relativ kast ettor | frekvens

2 öd 10 50 100 300 1 000

0 1 1 6 17 93 173

0.000 0.200 0.100 0.120 0.170 0.186 0.173

Den relativa frekvensen tycks bli mer och mer stabil och rentav tendera emot ett gränsvärde, gissningsvis 1/6 = 0.16666... (se Figur 2.4). Är tärningen dåligt gjord, blir det kanske ett annat gränsvärde, som man inte på förhand kan gissa. Man skulle nu kunna definiera sannolikheten för händelsen ”etta” som gränsvärdet för den relativa frekvensen då antalet kast går mot oändligheten. En sådan definition skulle ha den fördelen att den stämmer bra med vad de flesta antagligen menar med att ”sannolikheten för en etta är 1/6”. Vissa matematiska svårigheter uppstår

emellertid om man gör på det sättet. Enklare är att postulera att det 12

Relativ frekvens SS =Oo NM

2.3 Sannolikheter

1

Figur

2.4

i allmänna

utfallsrum

1/6?

5

10

Relativ frekvens

50 100

Antal kast

1000

ettor vid vätande

10000

antal kast med tärning.

finns ett tal som kallas sannolikheten för händelsen ifråga. Därmed menas helt enkelt att man tilldelar varje händelse ett visst tal. Om händelsen är A, betecknas talet med P(A), sannolikheten för A. (P

som i Probability.)

Beträffande talet P(A) gäller allmänt, att man söker välja det så att den relativa frekvensen vid ett någorlunda stort antal försök kom-

mer i närheten av P(A). Om vi säger att P(A) = 0.2 kan vi ge detta uttalande den påtagliga men samtidigt vaga frekvenstolkningen: Vid ett stort antal försök blir den relativa frekvensen av händelsen A nog ungefär lika med 0.2.

Hur man sedan skall bära sig åt mer i detalj beror på situationen. Ibland har man möjlighet att göra ett förnuftigt val redan på förhand. I exemplet ovan är det, om tärningen är välgjord, rimligt att välja P(A) = 1/6. Därigenom bör man

kunna få en hygglig approximation till de verkliga förhållandena. Att det blir en

approximation står klart: Ingen tärning är perfekt gjord, man slarvar ibland vid kasten så att någon sida kommer upp för ofta, osv. Vanligare är att man inte har någon möjlighet att välja sannolikheten på förhand. Om A betyder ” nyfödd pojke lever i minst 50 år”, kan man inte teoretiskt

fundera ut hur P(A) skall väljas. I sådana fall måste man insamla ett empiriskt ma-

terial och som värde på sannolikheten välja den relativa frekvensen av individer med ifrågavarande egenskap. (I fallet med tärningskasten skulle detta tillvägagångssätt

innebära att man t.ex. kastar 50 gånger och tar P(A) = 0.120 eller 1000 gånger och tar P(A) = 0.173.) I sådana fall blir modellens noggrannhet beroende av storleken på materialet (jämte alla andra egenskaper som bestämmer dess användbarhet).

Alla frågor rörande det faktiska valet av sannolikheter lämnar vi tillsvidare åt sitt öde och övergår nu till att undersöka allmänna egenskaper hos sannolikheter i ett utfallsrum 2. Antag att vi skall tillordna varje händelse i utfallsrtummet QQ en 13

2 Sannolikhetsteorins grunder

sannolikhet. Kan vi göra det hur som helst? Om vi jämför med frekvenstolkningen är det lätt att se att det inte går utan vissa regler måste gälla om modellen skall vara användbar: Varje sannolikhet bör ligga mellan 0 och 1 (gränserna inkluderade),

dvs för varje händelse A bör gälla att 0 < P(A)

Vid tillverkning av en viss typ av byggelement kan två slags fel A och B föreligga hos

de tillverkade enheterna. Man vet att P(A) = 0.1, P(B) = 0.2 och P(ANB) = 0.05. Beräkna sannolikheten att en tillverkad enhet har

a) åtminstone något av felen, b) felet A men inte felet B, c) felet B men inte felet A,

d) exakt ett av felen A och B. Böyrvå

A

händelser A och B har resp sannolikheterna 0.6 och 0.7. Kan händelserna vara

disjunkta?

20050 de två händelserna A och B gäller att P(AN B) P(A" MN B) = 0.1. Beräkna P(AU B). 2.11

2.12

= 0.5 och

Visa att sannolikheten för att exakt en av händelserna A och B inträffar är P(A) + P(B) -2P(AN B). Booles olikheter. a)

P(A,

U...U

Visa att för godtyckliga händelser A;,..., An An)


0.

Bestäm täthetsfunktionen för X + Y. Ledning: När faltningsformeln (4.15) tillämpas blir fz(z) = f; fx(x)fr(2z — z)dr där z > 0. (Observera integrationsområdet.) Varför blir det så? 4.24 Beräkna fördelningen

tionerna

för X + Y om X och Y är oberoende och har täthetsfunkfxl(t)

=

fr(v)=5 4.25

Bestäm täthetsfunktionen täthetsfunktionerna

Ledning: 4.26

för

1

2-7

om

1

Z

— 00

0. 5.8 Den s.v. X har Fx(z) = 1-— (1+=z)"” för z > 0. Här är a en positiv konstant.

Beräkna E(+x)-

5.9 Den s.v. X har täthetsfunktionen fx(z) = 1/10, —5 < I < 5.

Beräkna E[g(X)], där

går) = |

-1

omz)0.

5.10 I ett kärl med volymen a häller man volymen X av en vätska. (Om X > a så rinner det givetvis ut en del.) Här är X en s.v. med täthetsfunktionen fx (z) = (z+1)7?, z > 0. Låt Y vara volymen av den vätska som finns i kärlet efter påfyllningen. Beräkna E(Y). 5.11 Den s.v. X har väntevärdet 81 och variansen 81. Beräkna dess standardayvvikelse och variationskoefficient.

5.12 Den s.v. X har täthetsfunktionen fx(x) = 3x7', z > 1. Beräkna dess väntevärde och varians.

Den s.v. X a) Beräkna b) Beräkna c) Beräkna

5.13

har täthetsfunktionen fx(r) = 2zx för 0 < z