Beschreibende und schließende Statistik: Aufgaben und Beispiele [9., korrigierte und erweiterte Auflage. Reprint 2015] 9783486809206, 9783486257939

Ein ideales Übungs- und Wiederholungsbuch für die Vorbereitung zur Statistikklausur: Systematisch geordnete Aufgaben mit

219 18 18MB

German Pages 505 [508] Year 2001

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Beschreibende und schließende Statistik: Aufgaben und Beispiele [9., korrigierte und erweiterte Auflage. Reprint 2015]
 9783486809206, 9783486257939

Table of contents :
Vorworte
1 Beschreibende Statistik
1.1 Aufgaben
1.2 Lösungen
2 Schließende Statistik
2.1 Aufgaben
2.2 Lösungen
3 Überprüfen Sie Ihre Statistik-Kenntnisse
3.1 Vorbemerkung
3.2 Aussagen zur beschreibenden Statistik Seite
3.3 Lösungen
3.4 Aussagen zur schließenden Statistik Seite
3.5 Lösungen
4 Ergänzungen
4.1 Beschreibende Statistik
4.2 Schließende Statistik

Citation preview

Beschreibende und schließende

Statistik Aufgaben und Beispiele Von

Dr. Friedrich Vogel o. Professor fur Statistik

9., korrigierte und erweiterte Auflage

R. Oldenbourg Verlag München Wien

Die Deutsche Bibliothek - CIP-Einheitsaufnahme Vogel, Friedrich: Beschreibende und schließende Statistik / von Friedrich Vogel. München ; Wien : Oldenbourg Aufgaben und Beispiele. - 9., korrigierte und erw. Aufl.. - 2001 ISBN 3-486-25793-5

© 2001 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 www.oldenbourg-verlag.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere fur Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Gedruckt auf säure- und chlorfreiem Papier Druck: Grafik + Druck, München Bindung: R. Oldenbourg Graphische Betriebe Binderei GmbH ISBN 3-486-25793-5

Inhaltsverzeichnis Vorworte

Seite VII

1

Seite

1

Beschreibende Statistik

1.1

Aufgaben

Seite

1

1.2

Lösungen

Seite

50

2

Schließende Statistik

Seite 169

2.1

Aufgaben

Seite 169

2.2

Lösungen

Seite 221

3

Überprüfen Sie Ihre Statistik-Kenntnisse! Seite 365

3.1

Vorbemerkung

3.2

Aussagen zur beschreibenden Statistik Seite 365

3.3

Lösungen

Seite 380

3.4

Aussagen zur schließenden Statistik

Seite 381

3.5

Lösungen

Seite 395

Ergänzungen

Seite 397

4

Seite 3 65

4.1

Beschreibende Statistik

Seite 397

4.2

Schließende Statistik

Seite 446

Vorwort zur neunten Auflage Auch für die neunte Auflage wurden einige wenige Aufgaben geringfügig korrigiert, so daß ich nunmehr die begründete Hoffnung habe, daß der Text keine Schreibfehler, aber auch keine Ungenauigkeiten und Unklarheiten mehr enthält. Natürlich habe ich außerdem die "Ergänzungen" verbessert und um einige Aufgaben aus früheren Diplomvorprüfungsklausuren erweitert. Wiederum haben einige Hörer Korrekturvorschläge gemacht. Ihnen danke ich dafür herzlich. Ausdrücklich danke ich meinen Mitarbeitern, Herrn Dipl.-Kfm. Sanyel Arikan MBA, Herrn Dipl.-Kfm. Stefan Goller und Herrn Dipl.-Math. Hans Kiesl, für die äußerst tatkräftige Unterstützung bei der Auswahl und Konstruktion von Aufgaben und Lösungen. Frau Sieglinde Wächter danke ich für die rasche Erstellung der Druckvorlage und Herrn Dipl.-Vw. Martin Weigert für die stets gute Zusammenarbeit. Friedrich Vogel

Vorwort zur siebten Auflage Für die siebte Auflage wurden einige wenige Aufgaben geringfügig korrigiert, vor allem aber wurde das 4. Kapitel "Ergänzungen" überarbeitet und erweitert. Diese Ergänzungen enthalten Aufgaben und Lösungen zur beschreibenden und zur schließenden Statistik. Ein Teil der Aufgaben stammt aus Diplomvorprüfungsklausuren der letzten Jahre. Die Aufgaben und Lösungen in diesem Teil der "Aufgabensammlung" folgen dem Aufbau meiner "Formelsammlung" (Beschreibende und schließende Statistik, Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen). Zu fast jedem der insgesamt 16 Kapitel der Formelsammlung wurde mindestens eine Aufgabe mit Lösung in die Ergänzungen aufgenommen . Einige Hörer haben Verbesserungsvorschläge gemacht. Ihnen sei herzlich gedankt. Mein besonderer Dank gilt meinen Mitarbeitern, Herrn Dipl.-Kfm. Sanyel Arikan MBA und Herrn Dipl.-Math. Hans Kiesl, für die überaus tatkräftige Unterstützung bei der Auswahl und Konstruktion von Aufgaben und Lösungen. Frau Sieglinde Wächter danke ich für die zügige Erstellung der Druckvorlage und Herrn Dipl.-Vw. Martin Weigert für die seit vielen Jahren gute Zusammenarbeit. Friedrich Vogel

VIII

Vorworte

Vorwort zur fünften Auflage Für die fünfte Auflage wurden bei Aufgaben und Lösungen einige - noch immer vorhandene - Ungenauigkeiten und Druckfehler beseitigt und einige wenige Präzisierungen vorgenommen. Vor allem aber habe ich die Gelegenheit genutzt, ein Kapitel "Ergänzungen", mit weiteren Aufgaben zur beschreibenden und zur schließenden Statistik, anzufügen. Meine Mitarbeiter, Herr Dipl.-Kfm. Martin Eiglsperger, Herr Dipl.-Kfm. Rainer Knirsch und Herr Dipl.-Kfm. Torben Wiede, haben sich durch das "Erfinden" von Aufgaben und Erstellen von Musterlösungen sowie durch zahlreiche Korrekturhinweise große Verdienste erworben. Ihnen sei dafür herzlich gedankt. Auch den Studierenden, die es gewagt haben, mich auf Fehler hinzuweisen, danke ich sehr. Schließlich danke ich Frau Sieglinde Wächter für die mühsamen Korrekturen und Herrn Dipl.-Vw. Martin Weigert für die stets gute Zusammenarbeit.

Friedrich Vogel

Vorwort zur vierten Auflage Die vierte Auflage unterscheidet sich von ihrer Vorgängerin durch noch weniger Druck- und Rechenfehler und Unklarheiten in Aufgaben und Lösungen, vor allem aber durch eine ganze Reihe neuer Aufgaben und Lösungen zur beschreibenden und schließenden Statistik. Einige Aufgaben und Lösungen dienen der Vertiefung und Abrundung bestimmter Gebiete, die bei Klausuren häufig wenig ergiebig waren, einige ergänzende Aufgaben und Lösungen, wie z.B. die zu den "Kaufkraftparitäten" und die zu den "Tests und Konfidenzintervallen für die Differenz zweier Anteilswerte" sind bedingt durch Anpassungen an die neue Auflage meiner "Formelsammlung" (Beschreibende und schließende Statistik, Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen, 6.- Auflage, R. Oldenbourg Verlag, München -. Wien 1991). Die Aussagen und Lösungen zur beschreibenden und schließenden Statistik wurden überarbeitet und ergänzt und zu einem Kapitel "Überprüfen Sie Ihre Statistik-Kenntnisse" zusammengefaßt. Auch wegen abschreckender Beispiele von Fehlanwendungen statistischer Methoden und/oder Fehlinterpretationen von erzielten Ergebnissen in der sozial- und wirtschaftswissenschaftlichen Literatur wurde bei der Überarbeitung wiederum besonderer Wert darauf gelegt, die Voraussetzungen und Grenzen der eingesetzten Methoden zu erläutern und zu erklären, wie statistische Ergebnisse zu interpretieren sind. Meinen Mitarbeitern, Herrn Dr. Werner Grünewald und Herrn Dipl.-Kfm. Torben Wiede, danke ich für Ihre stets tatkräftige

Vorworte

IX

Unterstützung beim Entwurf und der Korrektur von Aufgaben und Lösungen, Frau Sieglinde Wächter für die zügige Erstellung der Druckvorlage und den Lesern für Ihre konstruktive Kritik. Für die langjährige Zusammenarbeit danke ich Herrn Dipl.-Vw. Martin Weigert, Lektoratsleiter beim Oldenbourg Verlag.

Friedrich Vogel

Vorwort zur dritten Auflage Für die dritte Auflage wurden alle Aufgaben und Lösungen überarbeitet, Druck- und Rechenfehler korrigiert sowie Unklarheiten in Aufgabenstellungen und Lösungen beseitigt. Einige Aufgaben und Lösungen wurden entfernt, um Platz für notwendige Erweiterungen zu schaffen. Aufgaben, die sich als Klausuraufgaben weniger eignen sowie vertiefende und ergänzende Aufgaben und Beispiele wurden mit einem * versehen. Die "Klausuraufgaben und Ergänzungen" des dritten Kapitels der zweiten Auflage wurden meiner "Formelsammlung" (Beschreibende und schließende Statistik - Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen, R. Oldenbourg Verlag, München - Wien) entsprechend eingegliedert. Schließlich wurden die Lösungen der etwas geänderten Symbolik der Formelsammlung (4. Auflage) angepaßt. Die dritte Auflage wurde mit dem Textverarbeitungsprogramm ChiWriter geschrieben und mit einem KYOCERA LASER-Drucker gedruckt, daher konnte der Umfang dieser Sammlung - trotz einiger Erweiterungen - in den gesetzten Grenzen gehalten werden. Für die zur zweiten Auflage eingegangenen Hinweise und Anregungen danke ich sehr; sie wurden, soweit möglich, bei der Überarbeitung berücksichtigt. Für ausdauernde Hilfe und konstruktive Kritik danke ich meinen Mitarbeitern, Herrn Dipl.-Kfm. Ch. Braun, Herrn Dr. W. Grünewald und Frau Dipl.-Kfm. S. Kohaut sehr herzlich. Mein besonderer Dank gilt Frau S. Wächter, die wiederum großem Einsatz für eine termingerechte Fertigstellung schwierigen Typoskripts sorgte.

mit des

Herrn Dipl.-Vw. Martin Weigert, Lektoratsleiter beim Oldenbourg Verlag, danke ich für die stets gute Zusammenarbeit. Friedrich Vogel

Vorwort zur zweiten Auflage Gegenüber der ersten Auflage, die bereits nach drei Semestern vergriffen war, wurden einige Aufgaben und Lösungen exakter formuliert, Druck- und Rechenfehler korrigiert sowie kleinere

χ

Vorworte

Ungenauigkeiten beseitigt. Außerdem wurde die Sammlung um ein drittes Kapitel "Klausuraufgaben und Ergänzungen" erweitert. Viele Studierende haben Verbesserungsvorschläge gemacht. Ihnen sei dafür herzlich gedankt. Mein besonderer Dank gilt meinen Mitarbeitern, Herrn Dr. Werner Grünewald und Herrn Dipl.-Kfm. Christoph Braun, für viele wertvolle Anregungen und Frau Sieglinde Wächter für einige meisterhafte Collagen.

Friedrich Vogel

Vorwort zur ersten Auflage Diese Sammlung von Aufgaben und Beispielen zur beschreibenden und schließenden Statistik ist aus Vorlesungen und Übungen zur statistischen Grundausbildung, vor allem für Wirtschafts- und Sozialwissenschaftler, hervorgegangen. Sie ergänzt meine "Formelsammlung" (Beschreibende und schließende Statistik Formeln, Definitionen, Erläuterungen, Stichwörter und Tabellen, R. Oldenbourg Verlag, München - Wien) und ist daher im Aufbau, in der Symbolik und in der Darstellungsweise eng an diese angelehnt. Aufgaben oder zumindest Beispiele finden sich zu jedem Kapitel der Formelsammlung. Die Aufgabensammlung soll es dem Studierenden und dem Praktiker ermöglichen, sich häufig verwendete statistische Methoden zu erarbeiten und eine gewisse Vertrautheit bei ihrem Einsatz zu gewinnen und ihre Voraussetzungen, Grenzen und Interpretationsmöglichkeiten verstehen zu lernen. Sie soll dazu beitragen, typische Fehler, aber auch Mißverständnisse sowie Fehlinterpretationen bei der Anwendung statistischer Verfahren in der Praxis und in der empirischen Forschung zu vermeiden und statistische Methoden sachgerecht anzuwenden. Die Aufgaben und Beispiele stammen überwiegend aus dem Bereich der Wirtschafts- und Sozialwissenschaften und sind von unterschiedlichem Schwierigkeitsgrad. Ein Teil der Aufgaben entspricht etwa denen, die üblicherweise in DiplomvorprüfungsKlausuren gestellt werden. Ergänzend zu den Aufgaben und Beispielen wurden noch je 140 Aussagen zur beschreibenden und schließenden Statistik in die Sammlung aufgenommen. Sie sind mit "richtig" oder "falsch" zu kennzeichnen und ermöglichen eine Überprüfung der erworbenen Kenntnisse. Erfahrungsgemäß ist bei realitätsnahen Aufgaben der Rechenaufwand erheblich. Um diesen und den Umfang der Sammlung in Grenzen zu halten, wurden sowohl einige weniger realitätsnahe als auch theoretisch-formale Aufgaben beziehungsweise Beispiele eingefügt. Besonderer Wert wurde gen gelegt, die daher umfangreich sind. Die und die Lösungen durch

auf die gute Verständlichkeit der Lösunausführlich und gelegentlich auch recht einzelnen Lösungsschritte werden erklärt zahlreiche Abbildungen ergänzt. Speziel-

XI

Vorworte

le mathematische Kenntnisse werden nicht vorausgesetzt; die zur Lösung der Aufgaben benötigten Tabellen finden sich in der Formelsammlung . Aufgabensammlung und Formelsammlung können als Begleittexte für ein zweisemestriges Grundstudium in Statistik verwendet werden und ein zeitraubendes Mitschreiben von Aufgaben, Lösungen und Formeln ersparen. Wegen der Ausführlichkeit der Lösungen sind die Sammlungen, wenn sie auch ein Lehrbuch nicht ersetzen sollen, auch für ein Selbststudium geeignet. Meinen Mitarbeitern, Herrn Dr. Reinhard Dobbener und Herrn Dr. Werner Grünewald, gilt mein besonderer Dank für ihre überaus tatkräftige Unterstützung, vor allem bei der Ausarbeitung der Lösungen. Herzlich danke ich auch Frau Sieglinde Wächter, die mit großer Sorgfalt, Geduld und Ausdauer für eine fristgerechte Fertigstellung des schwierigen Typoskripts sorgte, Herrn Bernd Knorr, der mit großer Sachkenntnis die Plots erstellte und nicht zuletzt Herrn Dipl.-Vw. Martin Weigert, R. Oldenbourg Verlag, für die gute Zusammenarbeit. Für Anregungen und kritische Hinweise bin ich stets dankbar. Friedrich Vogel

1. Beschreibende Statistik 1.1 Aufgaben Aufgabe 1 In der amtlichen Statistik der Bundesrepublik Deutschland gibt es zwei Erhebungsverfahren, um Aufschluß über die Bevölkerung der Bundesrepublik zu gewinnen: die Volkszählung und den Mikrozensus. Allerdings bestehen zwischen beiden Verfahren erhebliche Unterschiede. Bei der Volkszählung werden die Mitglieder aller Haushalte der Bundesrepublik Deutschland erfaßt. Da diese Erhebung großen organisatorischen und finanziellen Aufwand erfordert, können Volkszählungen nur im Abstand mehrerer Jahre durchgeführt werden. Um auch zwischen zwei Volkszählungen Informationen über die Bevölkerung zu erhalten, werden zusätzlich Mikrozensuserhebungen durchgeführt. Im Gegensatz zur Volkszählung werden beim Mikrozensus nur 1% der Wohnbevölkerung, d.h. ca. 280.000 Haushalte, befragt. Der Fragenkatalog des Mikrozensus ist sehr umfangreich: er reicht von Fragen nach der Haushaltsgröße und dem Haushaltseinkommen bis zu Fragen nach Alter, Geschlecht, Beruf, Art der Krankenkasse und Familienstand einzelner Haushaltsmitglieder. Es fehlen hingegen (wie übrigens auch bei der Volkszählung) Fragen nach Geburten und Sterbefällen. a) Erläutern Sie am Beispiel der Volkszählung (VZ) und des Mikrozensus (MZ) die Begriffe: Merkmalsträger (statistische Einheit), Gesamtheit, Umfang der Gesamtheit, Merkmal, Merkmalsausprägung, Erhebungsmerkmal, Vollerhebung, Teilerhebung, Primär-/Sekundärstatistik! b) Ordnen Sie die erwähnten Merkmale nach ihrem Merkmalstyp! Kennzeichnen Sie binäre, häufbare, diskrete, stetige Merkmale! c) Warum fehlen sowohl bei der Volkszählung als auch beim Mikrozensus Fragen zu Geburten und Sterbefällen? Aufgabe 2 Anzahl der landwirtschaftlichen Betriebe (eines bestimmten Landes zu einem bestimmten Zeitpunkt) nach der landwirtschaftlich genutzten Fläche. Fläche von ... bis unter . . ha

Anzahl der Betriebe

1 - 2 2 - 5 5 - 10 10 - 20 20 - 50 50 - 100 100 und mehr

100.620 150.300 144.400 176.370 176.450 27.790 4.560

2

1. Beschreibende Statistik

a) Bestimmen Sie aus diesen Angaben die approximierende funktion, den Median und das arithmetische Mittel! b) Wieviel Prozent der landwirtschaftliehen wirtschaftlich genutzte Fläche

Verteilungs-

Betriebe haben eine

land-

- von höchstens 20 ha, - von mehr als 50 ha, - zwischen 20 h a und 75 ha? Aufgabe 3 In einem Betrieb wurden der laufenden Produktion 25 fertiggestellte Wellen entnommen. Die Messung ihrer Länge (in mm) brachte folgendes Ergebnis.

X

V 1 2 3 4 5

ν

29,9 29,7 30,2 29,8 30,3

V 6 7 8 9 10

X

V

30,2 30,0 30, 1 30,2 30,0

V 11 12 13 14 15

X

V

V

X

30,0 30, 1 29,9 29,6 30,3

16 17 18 19 20

30,4 29,7 30,5 29,8 29,9

V

V 21 22 23 24 25

X

V

30,0 29,9 29,8 30, 1 30,0

a) Stellen Sie die Häufigkeitsverteilung und die empirische Verteilungsfunktion graphisch dar! b) Teilen Sie die Beobachtungswerte in linksoffene Klassen mit Δ(χ^) = = const.

=0,1

mm ein und stellen Sie das Ergebnis

in Form

eines

Histogramms und einer approximierenden Verteilungsfunktion graphisch dar! Begründen Sie die Wahl von X q ! c) Ermitteln Sie mit Hilfe der approximierenden Verteilungsfunktion (vgl. b)) einen Bereich, in dem sich 80% der Beobachtungswerte befinden! d) Teilen Sie die ein: χ

Beobachtungswerte

wie

folgt

in

linksoffene

Klassen

= 29,55, Δ(χ,) = Δ(χ ) = 0,1 mm, Δ(χ„) = A ( x J = Δ(χ.) = Δ(χ„) = 1 6 2 3 4 5 = 0,2 mm! ο

Zeichnen Sie das zugehörige Histogramm! Aufgabe 4 Anzahl der Privathaushalte eines Landes in einem bestimmten Monat mit einem monatlichen Haushaltselnkoimnen von ... bis unter ... DM (in 1000).

I. Beschreibende Statistik

Einkommensklasse unter 1200 1800 2500 3000 4000 5000

3

Anzahl der Haushalte

1200 - 1800 - 2500 - 3000 - 4000 - 5000 und mehr

a) Bestimmen Sie die approximierende

4479 5194 5605 2752 3429 1356 1079

Verteilungsfunktion!

b) Stellen Sie die Häufigkeitsverteilung in Form eines Histogramms einer approximierenden Verteilungsfunktion graphisch dar!

und

c) Bestimmen Sie rechnerisch und graphisch, wie groß der Haushalte ist, der über ein monatliches Nettoeinkommen

der

Anteil

- von weniger als 1 5 0 0 , — DM, - mehr als 3 8 0 0 , — DM, - mehr als 1 7 0 0 , — DM, aber weniger als 2 9 0 0 , —

DM

verfügt! Welche Annahme müssen Sie treffen?

Aufgabe 5 Der Import v o n Unsitten aus dem Ausland läßt nicht nach. Mit der Liberalisierung d e s Sargangebotes begann für das deutsche Bestattungsgewerbe der Kampf ums Überleben. Nicht nur bei der Nachfrage nach Särgen und Urnen befürchtet man "ausländische Zustände". Um tiefere Einblicke in das Nachfrageverhalten beim Kauf v o n Särgen und Urnen zu bekommen, stellt ein Marktforschungsinstitut die folgende Tabelle zusammen. Nachfrage n a c h Särgen und Urnen in einem bestimmten Zeitraum (in % der Gesamtnachfrage)

Nachfrage Särge im Selbstbausatz Leihsärge Cash- und carry Särge Tischlersärge Urnen

Inland 1 0 5 75 19

Ausland 10 6 25 20 39

a) Bestimmen Sie Merkmalsträger, Merkmal und Merkmalstyp!

4

1. Beschreibende Statistik

b) Charakterisieren und vergleichen Sie die beiden Häufigkeitsverteilungen hinsichtlich der zentralen Tendenz und der Streuung! Welche inhaltlichen Aussagen können aus dem Vergleich abgeleitet werden? Aufgabe 6 Bei Straßenverkehrsunfällen mit Personenschaden werden die folgenden Unfalltypen unterschieden: Fahrunfall (A^), Abbiege-Unfall (Α,,), Einbiegen-/Kreuzen-Unfal1 (A^), Überschreiten-Unfall

(A^), Unfall durch ruhen-

den Verkehr (Ag), Unfall im Längsverkehr (Α β ) und Sonstiger Unfall (A^). In einem westeuropäischen Land ereigneten sich in einem bestimmten Jahr insgesamt 374107 Unfälle mit Personenschaden; sie verteilten sich wie folgt auf die genannten Unfalltypen. Unfalltyp A

1

A

2

A

3

A

4

A

5

A

6

Anzahl der Unfälle 75769 54584 83569 39168 12561 65961 42495

a) Stellen Sie die Häufigkeitsverteilung graphisch dar! b) Bestimmen Sie den Modus der Verteilung! c) Berechnen Sie geeignete Streuungs-/Konzentrationsmaße! Aufgabe 7 Bei den Bundestagswahlen 1980 und 1983 erzielten die Parteien die folgenden Ergebnisse:

SPD CDU/CSU FDP Grüne Sonstige

1980

1983

42,9% 44,5% 10,6% 1,5% 0,5%

38,2% 48,8% 7,0% 5,6% 0,4%

a) Läßt sich aus diesen Daten schließen, daß die von 1980 auf 1983 zu-/abgenommen hat?

(Stimmen-)Konzentration

1. Beschreibende Statistik

5

b) Wie ändert sich das Ergebnis, wenn die Stimmenanteile der "Grünen" und der "Sonstigen" zusammengefaßt werden? Hat sich durch diese Zusammenfassung die Konzentration im Vergleich zu Teilaufgabe a) verändert?

Aufgabe 8 A n einer Diplom-Vorprüfung im Fach Statistik nahmen 80 Studierende teil. V o n d e n Teilnehmern haben 8 nicht bestanden (Note 5), 22 haben die Note 4, 28 die Note 3, 20 die Note 2 und zwei die Note 1 erzielt. a) S t e l l e n sie die Häufigkeitsverteilung Häufigkeiten graphisch dar!

und

die

kumulierten

b) Bestimmen Sie für diese Notenverteilung ein Maß der zentralen Tendenz sowie ein geeignetes Streuungsmaß und interpretieren Sie die Ergebnisse.

Aufgabe 9

Holzaufwurf (Kiefer) zweier Forstämter beste, Η schlechteste Qualität) Güteklasse SS TS В с Η

Forstamt А

in

m

3

nach

Güteklassen

(SS

Forstamt В

30 0 10 50 10

160 20 20 0 0

a) Bestimmen Sie Merkmalsträger, Merkmal und Merkmalstyp! b) Charakterisieren und lungen, indem Sie

vergleichen

Sie

die

beiden

Häufigkeitsvertei-

- geeignete Maße der zentralen Tendenz und der Streuung berechnen - u n d die kumulierten Häufigkeitsverteilungen bestimmen!

Aufgabe 10 Zwei Gruppen von Studierenden der Studiengänge "Betriebswirtschaftslehre" und "Germanistik" (kein Doppelstudium!) wurden über ihre Einstellung zur "modernen Lyrik" befragt. Sie konnten ihre Einstellung mit den Skalenwerten 1 (sehr positiv) bis 5 (sehr ablehnend) bewerten. Die Befragung lieferte die beiden folgenden Verteilungen.

6

1. Beschreibende Statistik

Skalenwert 1 2 3 4 5 Vergleichen Verfahren!

Sie

diese

Anzahl der Studierenden der Germanistik der BWL 28 19 20 5 2

1 2 10 10 18

beiden Verteilungen mit

Hilfe

geeigneter

Maße/

Aufgabe 11 Nach einem Bericht des Bayerischen Innenministeriums wird auf den bayerischen Autobahnen immer schneller gefahren. Aufgrund einer umfangreichen Erhebung (bei der nur PKW erfaßt wurden) wurde festgestellt, daß in einem bestimmten Jahr nur 25,3% der Autofahrer bis zu 100 km/h fuhren, zwischen 100 und 130 km/h fuhren 49,27., zwischen 130 und 150 km/h fuhren 19,3% und über 150 km/h fuhren 6,2%. Nach d e n Vorstellungen bestimmter Gruppen soll die Höchstgeschwindigkeit auf Autobahnen auf 110 km/h begrenzt werden. Wieviel Prozent der Autofahrer wären von einer solchen Regelung betroffen?

* Aufgabe 12 Im Bereich der OR-unterstützten Unternehmensplanung sind in vielen Fällen nicht von vornherein alle Kostenaspekte der möglichen Alternativen exakt oder vollständig zu berücksichtigen, da häufig schon recht grobe, dafür aber einfach zu handhabende Modelle hinreichend genaue Hinweise auf einige wenige Planungsalternativen liefern, die ernsthafte Realisierungschancen besitzen. So 1st es beispielsweise üblich, bei der Standortplanung von zentralen Lägern, von denen aus eine gewisse Anzahl von Verkaufsstellen beliefert werden sollen, anzunehmen, daß die Transportkosten zwischen Zentrallager und Verkaufsstelle je Gütereinheit dem quadrierten euklidischen Abstand der beiden Standorte proportional ist. Die folgende Tabelle enthält die Standortangaben (rechtwinklige Rasterkoordinaten) von 5 Verkaufsstellen. Nr. der Verkaufsstelle

X. 1

y

1 2 3 4 5

2 13 5 12 10

2 5 10 17 15

i

1. Beschreibende Statistik

7

a) Geben Sie die Koordinaten des optimalen Standortes des Zentrallagers an, wenn die nachgefragte Menge an allen Verkaufsstellen gleich groß ist und unterstellt wird, daß die Transportkosten dem quadrierten euklidischen Abstsind proportional sind! b) Wie ändert sich das Ergebnis zu a), wenn sich die an den Verkaufsstellen 1, 2, 3, 4 und 5 nachgefragten Mengen wie 2 : 3 : 1 : 6 : 15 verhalten? * Aufgabe 13 Bei der Festlegung des Standortes für eine Feuerwehrwache in einem neu angelegten Stadtteil einer deutschen Kleinstadt erscheint es dem zuständigen Planungsamt wesentlich, daß die folgenden Einrichtungen im Mittel möglichst schnell zu erreichen sind: (1) (2) (3) (4) (5)

Krankenhaus Möbelfabrik Altersheim Hochhaus Schule

Die nachfolgende Skizze zeigt einen Ausschnitt aus dem örtlichen Stadtplan mit den Standorten der fünf besonders schutzwürdigen Einrichtungen (die der Einfachheit halber jeweils an Kreuzungen liegen).

10.0 8.06.0

3.

4.0 2.

2.01. -1

0.0 0.0

1.0

I 2.0

I I I 3.0 4.0

I

. 5.0

6.0

г 7.0

a) Geben Sie die Lage (Koordinaten) der fünf Schutzobjekte in einem geeigneten Koordinatensystem an! b) Die "Straßen-Entfernung" zwischen zwei Kreuzungen ist mit Hilfe ihrer Koordinaten auszudrücken! Beachten Sie dabei die Besonderheiten des angegebenen Straßennetzes! c) Geben Sie die Koordinaten des Standorts für die Feuerwehrwache an! Gehen Sie davon aus, daß die Fahrzeit zwischen zwei Punkten der zurückgelegten Entfernung proportional ist!

8

l. Beschreibende Statistik

d) Wie groß ist die mittlere Entfernung von der Feuerwehrwache zu den fünf Schutzobjekten? e) Wie ändert sich das Ergebnis von Teilaufgabe c), wenn bekannt ist, daß man in west-östlicher Richtung schneller fahren kann als in nord-südlicher Richtung?

Aufgabe 14 Aus der Personalkartei eines Unternehmens wurde von 20 Arbeitnehmern die Betriebszugehörigkeit in (vollendeten) Jahren festgestellt.

Betr1ebszugehör i gke i t in Jahren

Anzahl der Arbeitnehmer

1 2 3 7 9 11 15 18 21 25 29 30 33 47

2 3 1 3 1 1 1 1 1 1 1 1 1

Berechnen Sie aus diesen Angaben a) das arithmetische Mittel und den Median, b) die Standardabweichung Median

und

die

durchschnittliche

Abweichung

vom

und interpretieren Sie die Ergebnisse!

Aufgabe 15 Bei einem Zehnkampf-Wettbewerb der Herren werden im Hochsprung und im lOOm-Lauf von fünf Teilnehmern folgende Leistungen erzielt:

1. Beschreibende Statistik

Teilnehmer

Hochsprung in m

1 2 3 4 5

9

100m in sec.

2,06 1,97 1,91 2,00 2,16

10,83 11,01 11,18 10,65 10,78

Welcher Teilnehmer erzielte in Bezug auf diese beiden Disziplinen die beste Gesamtleistung?

Aufgabe 16 Aus den fünf Abteilungen eines Η.+H.-Marktes werden der Betriebsleitung die folgenden monatlichen Umsätze gemeldet.

Abtei lung

A В С D Ε

2 Umsatz je m Verkaufsfläche

Umsatz

285600,— 273700,— 345100,— 154700,— 130900,—

DM DM DM DM DM

700,— 1100,— 4200,— 1500,— 900,—

DM/nu DM/nu DM/nu DM/nu DM/m

2 Berechnen Sie den durchschnittlichen Umsatz je m Verkaufsfläche!

Aufgabe 17 Im Juni 1991 trafen sich 1500 Manta-Fahrer beim "Internationalen MantaTreffen" im Spessart. Bei den Gesprächen rund ums Auto ging es nicht nur um das Tieferlegen, die Stoßdämpfer und Spoiler, sondern auch um den Benzinverbrauch der Fahrzeuge. Manni I bis V machten dazu folgende Angaben:

Manta von Manni

I II III IV V

Verbrauch je 100 km 12,8 13,4 15,6 14,0 20,2

1 1 1 1 1

Jahresverbrauch je Manta 23040 16080 12480 21000 22220

1 1 1 1 1

10

1. Beschreibende Statistik

Aus diesen Angaben berechnete Manni III den Durchschnittsverbrauch der fünf Mantas wie folgt: χ = =(12,8 + 13,4 + 15,6 + 14,0 + 20,2) = 15,2 (1/100 km). D a) Wieviel 1/100 km haben die fünf Mantas tatsächlich im Durchschnitt verbraucht? b) Unter welcher Bedingung wäre die Berechnung von Manni III richtig? Aufgabe 18 Berechnen Sie aus den folgenden Angaben die durchschnittliche Bevölkerungsdichte der ABC-Länder zu einem bestimmten Zeitpunkt und zwar a) als Beziehungszahl, b) als arithmetisches Mittel, c) als harmonisches Mittel! Land

Fläche in 1000 km

A В С

31 3 41

2

Bevölkerung

Einwohner

in 1000

je km^

9860 363 14140

318 121 345

* Aufgabe 19 a) Für welche reelle Zahl a ist

η Σ (χ -a) = 0 ? y=l 17

1 b) Für welche reelle Zahl b nimmt f(b) = η

П

2 Σ (χ -b) das Minimum an? „ ν

Aufgabe 20 Ein Autofahrer fährt von В nach N. Auf dem Hinweg (rush-hour!) fährt er 7,2 km je Liter Benzin, auf dem Rückweg fährt er 12,0 km je Liter Benzin. Wieviel km fährt er im Durchschnitt je Liter Benzin? Aufgabe 21 Ein Handelsunternehmen hat die Bundesrepublik in vier Vertreterbezirke (Nord, Süd, Ost, West) eingeteilt. Von den Bezirksleitern werden die

1. Beschreibende Statistik

Anzahl der e i n g e s e t z t e n Vertreter und die d u r c h s c h n i t t l i c h e n lichen) V e r t r e t e r p r o v i s i o n e n wie folgt eingegeben.

Bezirk

Anzahl der Vertreter

durchschnittliche Vert r e t e r p r o v i s i o n in D M

Nord Süd Ost West

15 38 22 45

68300,— 70900,— 61500,— 86100,—

11

(Jähr-

DM DM DM DM

B e r e c h n e n S i e die durchschnittliche V e r t r e t e r p r o v i s i o n f ü r d a s u n t e r n e h m e n u n d d i e Summe der Vertreterprovisionen!

Handels-

Angenommen, e s w ü r d e (aus d i e s e n Daten) die Varianz der d u r c h s c h n i t t lichen V e r t r e t e r p r o v i s i o n e n berechnet; w i e wäre d i e s e z u e r k l ä r e n ?

A u f g a b e 22 V e r a n s c h a u l i c h e n Sie mit Hilfe der e m p i r i s c h e n Verteilungsfunktion, daВ der M e d i a n - wie a u c h die Quantile - nicht immer e i n d e u t i g bestimmbar ist!

Aufgabe 23 A n e i n e r W i e d e r h o l u n g s k l a u s u r in S t a t i s t i k h a b e n 24 S t u d i e r e n d e teilgenommen. Die e r z i e l t e n Punkte - maximal 100 - enthält die f o l g e n d e Tabelle.

V

u

1 2 3 4 5 6

45 63 67 24 38 51

V

V 7 8 9 10 11 12

u

у

V

57 94 85 5 66 75

13 14 15 16 17 18

u

V

12 33 84 59 17 81

V 19 20 21 22 23 24

u

V

79 9 84 29 90 83

W e r t e n Sie d i e s e Informationen s t a t i s t i s c h aus, indem Sie -

die H ä u f i g k e i t s v e r t e i l u n g u n d die k u m u l i e r t e n H ä u f i g k e i t e n bestimmen, die Quartile, e i n Lagemaß u n d - falls e r f o r d e r l i c h - e i n S t r e u u n g s m a ß berechnen!

Welche d i e s e r E r g e b n i s s e lassen s i c h sinnvoll

interpretieren?

geeignetes

12

1. Beschreibende Statistik

Aufgabe 24 Von einer Häufigkeitsverteilung seien nur χ = 81 und s 2 = 16 bekannt. Lassen sich aus diesen Angaben weitere Informationen über die Häufigkeitsverteilung ableiten? Wenn ja, welche?

Aufgabe 25 Ein Unternehmen der Investitionsgüterindustrie hat in einem bestimmten Jahr für die (männlichen) Arbeiter und Angestellten ein durchschnittliches Bruttojahresgehalt in Höhe von 38502,40 DM bezahlt. Das durchschnittliche Bruttojahresgehalt der (männlichen) Arbeiter betrug 32720,— DM und das der (männlichen) Angestellten 50790,— DM. Wieviel Prozent der (männlichen) Arbeitnehmer waren Angestellte?

Aufgabe 26 In einem Entwicklungsland wird an einem bestimmten Stichtag eine Volkszählung durchgeführt. Die folgende Tabelle enthält die Altersverteilung der Bevölkerung an diesem Tag. Alter von . . . bis Anteil der Bevölkerung im Alter unter Jahren von ... bis unter ... Jahren 0 - 15

44,6%

15 - 30

25,7%

30 - 45

14,2%

45 - 65

10,8%

65 und älter

4,7%

a)Bestimmen Sie - approximativ - das Durchschnittsalter der Personen dieser Bevölkerung am Erhebungsstichtag durch Berechnung des arithmetischen Mittels und des Medians. Welche der beiden Maßzahlen ist besser geeignet, das mittlere Alter der Bevölkerung anzugeben? b)Die Regierung dieses Landes will aufgrund der Volkszählungsergebnisse das Rentenalter neu festlegen. Nach den vorliegenden Plänen sollen die 10% ältesten Personen der Bevölkerung in den sofortigen Genuß der Rente kommen. Wie ist (approximativ) die Altersgrenze für den Bezug einer Rente festzulegen?

* Aufgabe 27 Gegeben seien zwei Häufigkeitsverteilungen 1 und 2 eines Merkmals X mit nx = 60 bzw. n 2 = 40 Merkmalsträgern. Es sei xx = x 2 = 70, s^ = 188 und s 2 = 160. Beide Häufigkeitsverteilungen werden zusammengefaßt.

1. Beschreibende Statistik

a) Es ist die Standardabweichung teilung zu bestimmen! b) Was ergäbe sich, wenn χ

der

= 70 und χ

zusammengefaßten

13

Häufigkeitsver-

= 50 wäre?

Aufgabe 28 Bei der Prüfung der Tragkraft von Plastik-Tragetaschen der Sorten Α und В ergaben sich folgende Häufigkeitsverteilungen.

Tragkraft von . . . bis unter ... kg

Anzahl der Tragetaschen Sorte Α Sorte В

unter 6,4 6,4 - 7,4 7,4 - 8,4 8,4 - 9,4 9,4 - 10,4 10,4 - 11,4 11,4 - 12,4 12,4 - 13,4 13,4 - 14,4 14,4 und mehr

16 16 30 84 136 98 50 36 24 10

6 4 14 35 67 48 22 20 0 4

Charakterisieren und vergleichen Sie die beiden Verteilungen mit geeigneter Maße/Verfahren!

Hilfe

Aufgabe 29 Versorgungsempfänger im Öffentlichen Dienst nach Laufbahngruppen

Laufbahngruppe

Einfacher Dienst(E) Mittlerer Dienst (M) Gehobener Dienst (G) Höherer Dienst (H)

Anzahl der Versorgungsempfänger 1.2.1983 1.2. 1977 181168 391083 275277 149988

Beurteilen Sie die zeitliche Entwicklung,

207095 382420 263540 138060

indem Sie

- die relativen und kumulierten relativen Häufigkeiten bestimmen, - zeitliche Meßzahlen für die einzelnen Laufbahngruppen und für den öffentlichen Dienst insgesamt berechnen und die Ergebnisse interpretieren!

14

I• Beschreibende Statistik

* Aufgabe 30 Die folgenden Häufigkeitsverteilungen eines klassierten Merkmals sind durch geeignete Maßzahlen zu charakterisieren!

Klassen 130 150 170 190 210 230 250

b.u. b.u. b.u. b.u. b.u. b.u. b.u.

n

150 170 190 210 230 250 270

Ji2 )

(1) i

n

n „

(3)

i

0 12 52 72 52 12 0

2 10 42 92 42 10 2

metrischen

2 12 50 58 76 2 0

Kommentieren Sie die Ergebnisse! Stellen Sie die Verteilungen graphisch dar!

Aufgabe 31 In der folgenden Tabelle sind die Längen der fünf Etappen einer Fahrradrundfahrt in Spanien und die jeweilige Durchschnittsgeschwindigkeit des Siegers des gesamten Rennens aufgeführt.

Etappe i

1 2 3 4 5

Länge der i-ten Etappe in km

Durchschnittsgeschwindigkeit des Siegers in km/h auf der 1-ten Etappe

135 325 70 175 295

a) Stellen Sie die graphisch dar!

23 38 27 26 34

empirische

Verteilungsfunktion

b) Berechnen Sie für die Etappenlänge St reuungsmaß!

der

Etappenlänge

Jeweils ein geeignetes Lage- und

c) Mit welcher Durchschnittsgeschwindigkeit gesamten Rennens?

fuhr der Sieger während des

1. Beschreibende Statistik

15

Aufgabe 32 Gegeben sind die durchschnittlichen Heizölpreise und die Varianzen (bei Abnahme von 8000 bis 10000 1) ohne Mehrwertsteuer in einer bestimmten Woche für den Raum Köln, Paris und London. Raum

Durchschni ttspre i s

Köln

65,45 (DM/100 1)

0.30 (DM/100 l) 2

Paris

228,95 (FF/100 1)

7,53 (FF/100 l) 2

London

15,6

(£/100 1)

Varianz

0,012 (Г/100 l) 2

Wie kann man etwas über die Streuung der Preise aussagen, ohne den Wechselkurs in die Überlegungen einzubeziehen? Aufgabe 33 Bei einem Zehnkampf-Wettbewerb der Herren werden in den Disziplinen Hochsprung, lOOm-Lauf und Kugelstoßen von fünf Teilnehmern folgende Leistungen erzielt: Teilnehmer 1 2 3 4 5

Hochsprung in cm 206 197 191 200 216

100m in sec 10,83 11,01 11,18 10,65 10,78

Kugelstoßen in m 17,58 16,76 15,60 16,82 17,24

In welcher Disziplin waren die durchschnittlichen Leistungsunterschiede am größten? Beantworten Sie diese Frage durch Berechnungen einer geeigneten Maßzahl! * Aufgabe 34 Zwei Dreher stellen eine größere Anzahl von zwei verschiedenen Wellen her. Um die Qualität der Arbeit dieser Dreher zu beurteilen, wurden der Produktion je zehn Wellen entnommen, und es wurde ein für die Präzision (Qualität) maßgebliches Merkmal (zum Beispiel der Durchmesser der Wellen a n einer bestimmten Stelle) gemessen. Die Messungen lieferten folgende Ergebnisse (in mm).

16

1. Beschreibende Statistik

Dreher 1 50,89 51,01 50,36 50,69 50,66 50,09 50,70 51,07 50,94 50,80

Dreher 2 20,09 20,84 20,57 20,50 20,47 20,06 20,48 20,27 20,94 20,51

Begründen Sie, warum es nicht möglich ist, mit den gegebenen Informationen und d e n Ihnen bekannten statistischen Verfahren die Qualität der Arbeit dieser beiden Dreher zu beurteilen! Analysieren Sie inhaltlich, welche Probleme beim Vergleich der Qualität der Arbeit dieser Dreher auftreten können!

Aufgabe 35 Zeitungsverlage und Beschäftigte eines bestimmten Landes zu einem stimmten Zeitpunkt nach Beschäftigtengrößenklassen Verlage mit ... bis ...Beschäftigten bis 9 10 - 19 20 - 49 50 - 99 100 - 199 200 - 499 500 - 999 1000 und mehr

Anzahl der Verlage 14 19 38 51 57 62 36 34

be-

Anzahl der Beschäftigten 86 294 1265 3629 7799 20298 25270 65656

a) Berechnen Sie die Anzahl der Verlage mit mehr als 150 Beschäftigten! b) Wieviel Beschäftigte haben die Verlage im Mittel? c) Warum kann χ hier exakt bestimmt werden? d) Die Hälfte der Beschäftigten arbeitet in Verlagen mit höchstens d Beschäftigten. Berechnen Sie d!

1. Beschreibende Statistik

17

Aufgabe 36 Auf einer Geflügelfarm werden täglich rd. 2500 Eier produziert, die find e n Verkauf sieben Güteklassen (Gewichtsklasse 1 = beste Qualität: 70 g und mehr) zugeordnet werden. Mit Hilfe einer neuen Kraftfuttermischung hofft man, die Qualität der Eier wesentlich verbessern z u können. Ein halbes Jahr nach der Einführung der neuen Kraftfuttermischung liegen die folgenden Daten vor.

Güteklasse

Durchschnittliche Anzahl mit Standardkraftfutter in %

1 2 3 4 5 6 7

50 200 449 873 524 249 150

2 8 18 35 21 10 6

Σ

2495

100

[er täglich produzierten Eier mit neuer Kraftfuttermischung in '/. 127 357 637 892 382 127 25 2547

5 14 25 35 15 5 1 100

Werten Sie diese Daten mit Hilfe geeigneter statistischer Verfahren/Maße aus!

Aufgabe 37 Berechnen Sie aus den Daten der Aufgabe 3 das arithmetische Mittel, Varianz und die Standardabweichung

die

a) aus den Einzelwerten, b) aus den gemäß 3 d) klassierten Werten!

Aufgabe 38 Grundlage ist die Aufgabe 3! a) Bestimmen Sie d e n Median aus den Einzelwerten, mit Hilfe der approximierenden Verteilungsfunktion gemäß 3 b) und aus den gemäß 3 d) klassierten Werten! b) Bestimmen Sie die durchschnittliche (absolute) Abweichung vom Median aus den Einzelwerten und aus den gemäß 3 d) klassierten Werten!

18

1. Beschreibende Statistik

Aufgabe 39 Die folgenden Daten für ein westeuropäisches Land sind durch die Berechnung geeigneter Verhältniszahlen (Beziehungszahlen, Meßzahlen mit fester und wechselnder Basis) auszuwerten!

Jahr

Chemische Industrie Bruttoprodukt ionswert Personalkosten in Mio. DM in Mio. D M

1981 1982 1983 1984 1985

113090 115019 134994 133103 143041

25682 26920 29245 30247 31877

* Aufgabe 40 Vergleichen Sie anhand der folgenden Daten das Sterblichkeitsniveau der Bundesrepublik Deutschland mit dem Griechenlands, indem Sie a) die rohe Sterberate: gS _ Anzahl der im Kalenderjahr Gestorbenen ^ Ю С Ю durchschnittlicher Bevölkerungsbestand ' im Kalenderjahr b) altersspezifische Sterberaten: Anzahl der im Kalenderjahr Gestorbenen der i-ten ^ S _ Altersklasse i durchschnittlicher Bevölkerungsbestand der i-ten Altersklasse im Kalenderjahr

>

1000

für beide Bevölkerungen berechnen! c) Weisen Sie nach, daß die rohe Sterberate das arithmetische Mittel der mit den Bevölkerungsanteilen in den jeweiligen Altersklassen gewichteten altersspezifischen Sterberaten ist! d) Berechnen Sie sogenannte standardisierte rohe Sterberaten, indem Sie die altersspezifischen Sterberaten der Bundesrepublik Deutschland mit der Altersstruktur Griechenlands gewichten und umgekehrt. Wie sind diese Werte insbesondere im Hinblick auf die Ergebnisse von Tellaufgäbe a) zu interpretieren? Altersstruktur der Bevölkerung und der Gestorbenen in der Bundesrepublik Deutschland und in Griechenland 1978

1. Beschreibende Statistik

i

Altersklassen

mittlerer Bevölkerungsbestand BRD Griechenland in 1000 in 1000

1 2 3 4

u. 15 30 45

15 b. u.30 b.u.45 b. u.65

5

65 u.älter Σ

-

19

Gestorbene BRD Griechenland

12009 13558 13086 13300

2189 1996 1840 2131

13134 13750 25300 113408

3676 1426 2199 13415

9373

1205

557617 J)

60872^

61326

9361

723209

81588

1) Einschließlich Alter unbekannt. Quelle: United Nations (Hrsg.), Demographie Yearbook, New York 1979.

Aufgabe 41 Anzahl der Studierenden in einem Wintersemester an einer kleinen Universität

Studienabschnitt Fakultät Katholische Theologie

Erstes Fachsemester

Höhere Fachsemester

45

199

Pädagogik, Philosophie, Psychologie

160

962

Sozialwesen

140

545

Sprach- und Literaturwissenschaften

162

466

Geschichts- und Geowi ssenschaft en

144

371

Sozial- und Wirtschaftswissenschaften

354

520

Bestimmen Sie a) die gemeinsame Häufigkeitsverteilung und die Randverteilungen, b) die bedingten Verteilungen und interpretieren Sie ausgewählte Werte dieser Verteilungen!

20

1 Beschreibende Statistik

Aufgabe 42 Zur Wohnbevölkerung eines Landes zählten Personen, darunter 32189900 weibliche. differenzierte Wohnbevölkerung verteilte Fami1ienstand.

Familienstand (A)

ledig verheiratet verwitwet geschieden

an einem Stichteig 61712800 Die nach dem Geschlecht s i c h wie folgt auf den

Geschlecht (B) männlich weiblich 0,442 0,508 0,026 0,024

0,354 0,470 0,144 0,032

Interpretieren Sie ausgewählte Werte dieser Tabelle und ermitteln die gemeinsame Häufigkeitsverteilung der beiden Merkmale sowie Randverteilungen!

Sie die

Aufgabe 43 Eheschließungen in einem bestimmten Religionszugehörigkeit der Ehepartner

Religionszugehörigkeit des Mannes

evangelisch röm. -kath. anders christl. jüdisch jj sonstige

Land

und

Jahr

nach

evangelisch

Religionszugehörigkeit der Frau röm.anders jüdisch sonstige kath. christl.

93349 42282 923 36 20122

43503 111515 915 45 12094

920 833 2983 1 444

29 19 61 25

der

6311 3799 207 34 19208

1) Sonstige Religion, freireligiös, gerneinschaftlos und ohne Angabe. Bestimmen Sie a) die gemeinsame Häufigkeitsverteilung der Merkmale Α (Religionszugehörigkeit des Mannes) und В (Religionszugehörigkeit der Frau) sowie die Randverteilungen, b) die bedingten Häufigkeitsverteilungen

f ( A . u n d

terpretieren Sie die Werte f(A 2 |B 2 ) und f ( B 2 | A 2 ) !

f С В^|A 2 ) und in-

1. Beschreibende Statistik

21

Aufgabe 44 Die folgende Vierfeldertafel enthält relative Häufigkeiten. Sie ist unter der Annahme, daß die Merkmale Α und В statistisch unabhängig sind, zu vervollständigen!

\ А

В \ 0

0

1

Σ

J 0, 144

1 Σ i

0,520

Aufgabe 45 Ein Dozent pflegt aus pädagogischen Gründen seinen (meist weiblichen) Hörern tief in die Augen zu blicken. Ihm deucht, daß es zwischen Augenund Haarfarbe einen Zusammenhang gibt. In Denkpausen fertigt er die folgende Übersicht an.

Augenfarbe grau

grün

blau

4 10 12

18 6 4

Haarfarbe blond brünett schwarz

1 15 10

a) Sind die beiden Merkmale statistisch unabhängig? b) Berechnen diese!

Sie

geeignete

Zusammenhangsmaße

und

interpretieren

Sie

2 c) Wie ändert sich der Wert von χ (bzw. V), wenn in der Tabelle alle Häufigkeiten mit с > 0 multipliziert werden? d) Welche Auswirkungen auf die Werte der Zusammenhangsmaße Vertauschen von Zeilen und Spalten der Tabelle?

hat

ein

* Aufgabe 46 Den Rauchgewohnheiten wird ein erheblicher Einfluß auf verschiedene Krankheitsrisiken zugeschrieben. Die folgende Tabelle enthält Angaben über Rauchgewohnheiten und Gesundheitszustand der Bürger (über 15

22

1. Beschreibende Statistik

Jahren) eines westeuropäischen Landes in einem bestimmten Monat in 1000 Einwohnern).

(Angaben

Rauchgewohnheiten Gesundheitszustand

zur Zeit regelmäßig

zur Zeit gelegentlich

zur Zeit nicht, aber früher regelmäßig oder gelegentlich

niemals

insgesamt

Kreislaufkrankheiten

360

90

310

1280

2040

Krankheiten der Atmungsorgane

450

100

190

720

1460

40

100

370

750

12300

2480

3380

23620

41780

13350

2710

3980

25990

46030

Krankheiten der Verdauungsorgane keine oder sonstige Krankheiten insgesamt

240

Ein Statistiker möchte ein beiden Merkmalen berechnen.

geeignetes

Zusammenhangsmaß

zwischen

den

a) Welches Problem bei einem der beiden Merkmale macht die Berechnung des Zusammenhangsmaßes eigentlich unmöglich? Wodurch hätte dieses Problem gelöst werden können? b) Berechnen Sie trotzdem auf der Basis der vorliegenden Informationen den Wert des Zusammenhangsmaßes. Berücksichtigen Sie bei der Ergebnisinterpretation die Überlegungen von Teilaufgabe а)!

Aufgabe 47 In einem Sanatorium für Manager wird versucht, den Gedächtnisschwund mit Hilfe von Frischzellen und Tiefschlaf zu heilen. Von der Gruppe 1 (n^=100) der mit Frischzellen und Tiefschlaf behandelten werden 80, von der

Kontrollgruppe

2

(n 2 =100)

der

nicht

(mit

Frischzellen

und

Tief-

schlaf) behandelten werden 55 geheilt. a) Wie stark ist der Zusammenhang zwischen Behandlungsmethode und -ergebnis? Kann auch die Richtung des Zusammenhangs gemessen werden? b) Ändert s i c h das Ergebnis, wenn aufgrund einer differenzierteren (weiteren) Untersuchung die folgenden Daten zur Verfügung stehen?

1. Beschreibende Statistik

\Behandlungsergebnis Behändlungsmetho de\

geheilt

unverändert

23

verschlechtert

Frischzellen und Tiefschlaf

40

35

25

nur Tiefschlaf

30

40

30

keine Behandlung

25

25

50

Hinweis: Die Behandlungsmethode sei ein komparatives Merkmal mit den Ausprägungen 1 (keine Behandlung), 2 (nur Tiefschlaf) und 3 (Frischzellen und Tiefschlaf). Aufgabe 48 Nach Abschluß des Grundstudiums werden 20 Studierende nach ihren Leistungen in Statistik und Jura in eine Rangordnung gebracht. Das Ergebnis enthält die folgende Tabelle.

Lfd. Nr. 1 2 3 4 5 6 7 δ 9 10

Rang Statistik Jura 3 4 7 19 17 12 9 2 10 18

16 11 7 9 13 20 1 3 4 14

Lfd. Nr. 11 12 13 14 15 16 17 18 19 20

Rang Statistik

Jura

15 13 1 16 5 6 8 20 11 14

8 6 5 15 2 12 10 18 17 19

Berechnen Sie den Rangkorrelationskoeffizienten nach KENDALL und interpretieren Sie das Ergebnis!

Aufgabe 49 Entscheidend für die Leistungsfähigkeit eines Teams ist neben anderen Faktoren auch die Führungsqualität des Teamleiters. Eine Forschungsgemeinschaft aus Personalwissenschaftlern und Organisationspsycho logen hat im Rahmen einer empirischen Untersuchung zunächst eine Methode zur Messung der Führungsqualität von Teamleitern entwickelt, um dann bei 100 Arbeitsgruppen mit untereinander vergleichbaren Aufgaben die FUhrungsqualität des Gruppenleiters und die Leistung der Arbeitsgruppe (gemessen durch die Wertschöpfung je Gruppenmitglied in einem bestimmten Zeitraum) zu erheben. Die Ergebnisse dieser Umfrage

24

l- Beschreibende Statistik

sind in der Tabelle dargestellt. \

Führungsqualität Wert-\ schöp— fung ( i n ^ y TDM) \ 4

gering

mittel

hoch

30 10 5

10 5 5

5 20 10

0 - 100 100 - 200 über 200

a) Geben Sie Merkmalsträger, Merkmale und Merkmalstypen an! b) Bestimmen Sie durch Berechnung einer geeigneten Maßzahl die und die Richtung des monotonen Zusammenhangs zwischen den Merkmalen! c) Können Sie aus dem Ergebnis von Teilaufgabe b) Abhängigkeit der Merkmale schließen? Begründung!

auf

Stärke beiden

statistische

Aufgabe 50 An einem größeren Lehrstuhl soll eine (Halbtags-) Sekretärin eingestellt werden. Angesichts der Arbeitsmarktlage finden sich nur sieben Bewerberinnen ein, die zum einen von der Frauenbeauftragten (F) und dem Lehrstuhlinhaber (L), zum anderen von den beiden Assistenten (Al und A2) nach ihren Fähigkeiten eingestuft werden. Die

Ergebnisse

der

Einstufung

finden

sich

in

der

folgenden

Tabelle

(A = hohe Qualifikation,..., L = geringe Qualifikation).

Bewerberin Nr. 1 2 3 4 5 6 7

Einstufung F

L

Al

A2

Ε В А С G F J

D A С В Ε F G

В A A С D С L

С A A С Ε A G

a) Stellen Sie fest, inwieweit ein Zusammenhang besteht zwischen den Einstufungen der Bewerberinnen von der Frauenbeauftragten und dem Lehrstuhlinhaber einerseits sowie von den beiden Assistenten andererseits! Interpretieren Sie die Ergebnisse! b) Welche Bewerberin würden Sie einstellen?

1. Beschreibende Statistik

25

A u f g a b e 51 Z u B e g i n n eines jeden F O R T R A N - K u r s e s pflegt der D o z e n t die S t u d i e r e n d e n auf d e n e n g e n Z u s a m m e n h a n g z w i s c h e n d e n p r a k t i s c h e n Ü b u n g e n (gemessen d u r c h die Anzahl d e r Läufe) und der Note, die d e r e i n z e l n e Student erzielt, hinzuweisen. Bei B r a u s e v e r f e h l e n solche "einfältigen, p s y c h o l o g i s c h e n T r i c k s " ihre Wirkung. D a er j e d o c h d u r c h s e i n schlechtes A b s c h n e i d e n in S t a t i s t i k verunsichert ist, beschließt er, d e n D i n g e n auf d e n G r u n d z u gehen. Er besorgt s i c h die n ö t i g e n D a t e n (siehe unten) und wertet s i e s t a t i s t i s c h aus. Die f o l g e n d e T a b e l l e enthält die Anzahl der Punkte der K l a u s u r t e i l n e h m e r des F O R T R A N - K u r s e s eines Wintersemesters und die Anzahl ihrer Läufe.

Punkte Lauf e 0 10 20 40 80

bis 9 bis 19 bis 39 bis 79 bis 170

0 bis 39 10 3 4 0 0

40 bis 49

50 bis 69

70 bis 89

9 0 b i s 100

4 3 1 2 0

2 0 4 3 2

0 0 1 2 0

0 0 0 0 1

Brause versucht, d i e f o l g e n d e n F r a g e n z u beantworten: a) W i e g r o ß ist die mittlere Anzahl der Läufe - v o n Studierenden, die die Prüfung nicht bestanden, weil s i e weniger als 40 Punkte erzielt haben, - v o n S t u d i e r e n d e n mit 70 und mehr P u n k t e n ? b) Ist der (statistische) Zusammenhang z w i s c h e n d e r Anzahl der Läufe und der e r z i e l t e n Note in der Tat so e n g (und p o s i t i v ) w i e d e r Dozent behauptet?

Aufgabe 52 Die f o l g e n d e n T a b e l l e n e n t h a l t e n die N o t e n der W i r t s c h a f t s s t u d e n t e n in d e n P r ü f u n g s f ä c h e r n Betriebswirtschaftslehre u n d V o l k s w i r t s c h a f t s l e h r e bzw. S t a t i s t i k u n d Recht in einer Diplom-Vorprüfung.

26

1. Beschreibende Statistik

\

Note in \ VWL Note \ in BWL \ 1 2 3 4 5 insges.

1

2

3

4

5

insges.

0 0 0 0 0

0 1 3 0 0

0 0 11 15 4

0 0 0 5 4

0 0 1 2 3

0 1 15 22 11

0

4

30

9

6

49

a) Bestimmen Sie jeweils den Mittelwert der Noten in BWL, VWL, Statistik und Recht! Welche Note wurde insgesamt zun häufigsten vergeben? b) Wieviel Prozent der Studierenden haben in den einzelnen Fächern nicht bestanden (Note 5)? c) In jedes Vordiplomzeugnis wird eine Gesamtnote, und zwar das arithmetische Mittel der Einzelnoten in BWL, VWL, Statistik und Recht, eingetragen. Nehmen Sie dazu aus statistischer Sicht Stellung! d) Überprüfen Sie an Hand einer geeigneten Maßzahl, wie stark der (statistische) Zusammenhang zwischen den Merkmalen "Note in BWL" und "Note in VWL" einerseits und "Note in Statistik" und "Note in Recht" andererseits ist! Interpretieren Sie die Ergebnisse! Aufgabe 53 Ein Testinstitut untersucht die Abhängigkeit der Geschwindigkeit bestimmter PKW-Typen. Zu verschiedenen PKW eines Typs 120 Testfahrten Testfahrten wird mit besonderen Meßgeräten die

des Benzinverbrauchs von diesem Zweck werden mit durchgeführt. Bei diesen Geschwindigkeit (in km/h)

1. Beschreibende Statistik

27

und der Benzinverbrauch (in 1/100 km) gemessen. Die Ergebnisse Testfahrten sind in der folgenden Übersicht zusammengefaßt.

Geschwindikeit (X) von . . bis unter . . km/h 20 40 60 80 100 120 140 160

-

Benzinverbrauch (Y) von . . . bis unter . . 1/100 km 4-6 6-8 8-10 14-16 10-12 12-14

40 60 80 100 120 140 160 180

-

-

Σ

5 2

7

12

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

6 1

6 6

4 12

25 12 9 18 11 8 18 19

14

19

28

120

-

-

6 2

-

-

-

4 12 6

22

21

Σ

1 7

3 5 6 5 2

-

16

a) Bestimmen Sie die gemeinsame Häufigkeitsverteilung Merkmale sowie die Randverteilungen! b) Bestimmen Sie die bedingten Verteilungen der interpretieren Sie je eine!

der

der

beiden

beiden Merkmale

und

c) Bei welchem Anteil von Testfahrten war der Verbrauch höher als 11 1/100 km? 2 2 d) Berechnen Sie χ und y, s^ und s^ sowie die bedingten Mittelwerte und -

2

2

Varianzen x(y,), y(x. ), sx (y ) und s v (x ) für alle i und j! 1 J J I i e) Interpretieren Sie je einen bedingten Mittelwert und je eine bedingte Varianz! f) Berechnen

Sie

die

uncl

Korrelationsverhältnisse

^γ|χ

unt

*

interpretieren Sie diese! g) Stellen Sie die Regressionslinien x(Y) und y(X) graphisch dar! h) Sind die beiden Merkmale statistisch unabhängig? i) Berechnen Sie den Korrelationskoeffizienten das Ergebnis!

und

interpretieren Sie

Aufgabe 54 Bei einer Einkommens- und Verbrauchsstichprobe wurde unter anderem das monatliche Haushalts(netto-)einkommen und der Wertpapierbesitz (Tageswerte) privater Haushalte zu einem bestimmten Zeitpunkt erfaßt.

28

1. Beschreibende Statistik

Für die 5,8 Mio. privaten Haushalte dieser Stichprobe ergab folgende Verteilung (Angaben in DM bzw. in Millionen Haushalte). \Wert der Wert\ p a p i e r e (Y) Haushaltsein-\ kommen (X) unter 1200 1200 b.u. 2200 2200 b.u. 4000 4000 b.u. 20000 insgesamt

unter 2000

2000 bis unter 5000

5000 bis unter 15000

15000 bis unter 60000

sich

insges.

0,1 0,5 0,4 0,0

0,1 0,5 0,5 0, 1

0,3 0,7 0,7 0 , 1

0,2 0,5 0,8 0.3

0,7 2,2 2,4 0,5

1,0

1.2

1,8

1,8

5,8

a) Bestimmen Sie die empirische Regressionsbeziehung des Wertes der Wertpapiere in Abhängigkeit vom Haushaltseinkommen und interpretieren Sie diese! b) Stellen Sie die zu a) gehörende Regressionslinie graphisch dar! c) Kann der Graphik entnommen werden, daß der Wert des Wertpapierbesitzes im Mittel von der Höhe des monatlichen Nettoeinkommens abhängt? Überprüfen Sie Ihre Feststellung durch Berechnung einer geeigneten Maßzahl!

» Aufgabe 55 Zeigen Sie, daß sich das Bestimmtheitsmaß und der Korrelations— koeffizient nicht ändern, wenn an Stelle der ursprünglichen Merkmale X und Y die (mit a,c€lR und b,d>0) transformierten Merkmale X* = (X-a)/b und Y* = (Y-c)/d verwendet werden! Inwiefern ist diese Tatsache für praktische Anwendungen von Bedeutung?

Aufgabe 56 Eine wichtige Aufgabe der Bevölkerungsstatistik ist die Bereitstellung von Verfahren zur Messung demographischer Phänomene wie zum Beispiel der Fruchtbarkeit. Im Regelfall existieren mehrere, im Prinzip gleichwertige Verfahren zur Messung eines Phänomens. Im folgenden werden zwei Verfahren zur Messung der Fruchtbarkeit einer Bevölkerung vorgestellt: die rohe Geburtenrate, definiert als Verhältnis zwischen der Anzahl der Lebendgeborenen eines Jahres und dem mittleren Bevölkerungsbestand, und die allgemeine Geburtenrate, definiert als Verhältnis zwischen der Anzahl der Lebendgeborenen eines Jahres und dem mittleren Bestand an Frauen im Alter zwischen 15 und 44 Jahren. Die folgende Tabelle enthält die Werte beider Maßzahlen (jeweils multipliziert mit 1000) für die Bevölkerung einiger Länder.

1. Beschreibende Statistik

Land

rohe Geburtenrate (Y)

1 2 3 4 5 6

9,5 9,4 9,5 10, 1 10, 1 10, 1

29

allgemeine G e b u r t e n r a t e (X) 45,4 44,4 44,3 46,7 46,6 46,2

a) B e r e c h n e n Sie die ausgleichende R e g r e s s i o n s g e r a d e

X(Y)!

b) B e r e c h n e n Sie d e n K o r r e l a t i o n s k o e f f i z i e n t e n n a c h BRAVAIS/PEARSON! c) Interpretieren Sie das Ergebnis v o n Teilaufgabe b)

inhaltlich!

A u f g a b e 57 Zur Ü b e r p r ü f u n g der Wirkung eines Düngemittels für G e t r e i d e w u r d e n sechs benachbarte Versuchsfelder von jeweils einem Hektar Größe in v e r s c h i e d e n e m Maße gedüngt. Die D ü n g e m i t t e l m e n g e n u n d die E r t r ä g e s i n d i n der f o l g e n d e n Tabelle dargestellt (Angaben jeweils in kg):

Feld А В С D Ε F

Menge des Düngemittels (X) 80 200 240 140 400 320

Ertrag (Y) 2700 3250 3500 3100 4000 3800

a) S t e l l e n Sie die Werte der T a b e l l e g r a p h i s c h d a r und ü b e r p r ü f e n Sie a n h a n d d i e s e r Zeichnung, o b es gerechtfertigt ist, e i n e n a n n ä h e r n d l i n e a r e n Zusammenhang z w i s c h e n d e n b e i d e n M e r k m a l e n anzunehmen! b) B e r e c h n e n Sie die Parameter der a u s g l e i c h e n d e n R e g r e s s i o n s g e r a d e n Y(X), interpretieren Sie diese Werte und z e i c h n e n Sie die G e r a d e in d a s S t r e u u n g s d i a g r a m m ein! c) Lohnt s i c h der Einsatz des Düngemittels, w e n n 1 k g 0,80 D M k o s t e t und f ü r e i n e n Doppelzentner G e t r e i d e e i n Preis v o n D M 3 0 , — erzielt werden kann? d) W e l c h e n Hektar-Ertrag könnte m a n bei g l o b a l e r Gültigkeit d e r in Те11aufgäbe b) berechneten Regressionsgeraden bei einem D ü n g e m i t t e l e i n s a t z v o n 1500 k g pro Hektar e r w a r t e n ? Ist dieses E r g e b n i s realistisch?

30

l. Beschreibende Statistik

Aufgabe 58 In einem Fami1ienunternehmen herrscht Uneinigkeit über die zukünftige Unternehmenspolitik. Während der mittlerweile hochbetagte Unternehmensgründer weiterhin an personal intensiven Produktionsverfahren festhalten will, spricht sich sein als Geschäftsführer tätiger Enkel für ein kapitalintensiveres Verfahren bei gleichzeitigem Personalabbau aus. Um seinem Großvater zu zeigen, daß der von diesem unterstellte Zusammenhang zwischen Personaleinsatz und Produktionsergebnis keineswegs so eng ist wie dieser zu glauben scheint, stellt er in einer Tabelle die durchschnittliche Anzahl der Beschäftigten und die Umsätze verschiedener Betriebe seines Gewerbezweiges im letzten Jahr zusammen. Betrieb

Anzahl der Beschäftigten (in Tsd. )

A В С D

1,5 3,6 2,4 0,5

Umsatz (in Mio.) 400 500 200 100

Berechnen und interpretieren Sie den Wert eines Zusammenhangsmaßes für die beiden betrachteten Merkmale!

geeigneten

Aufgabe 59 Zu den unabdingbaren Pflichten eines Besuchers des "Yellowstone National Park" in d e n Vereinigten Staaten gehört auch die Beobachtung einer Eruption von "Old Faithful", dem größten Geysir des Landes. Der "Old Faithful Staff" weist in einem speziellen Merkblatt darauf hin, daß zwischen der Dauer einer Eruption und der Zeit zwischen zwei Eruptionen ein sehr enger (wechselseitiger) linearer Zusammenhang besteht, so daß jeder Besucher anhand einer Tabelle den Zeitpunkt der Jeweils nächsten Eruption bestimmen und sich rechtzeitig mit Filmen und dergleichen versorgen kann. Ein Europäer glaubt das nicht. Aufgrund einer längeren Beobachtungsserie ordnet er acht Eruptionen deren Dauer und die Zeit, die zwischen dem Beginn einer Eruption und dem Beginn der darauf folgenden Eruption verstrichen ist (= "Zwischenzeit"), zu. Dauer einer Eruption in min 2,8 3, 1 3,9 4,9 1,4 2,2 4, 1 4,5

Zwischenzeit in min 65 65 76 98 50 56 88 89

1. Beschreibende Statistik

31

a) Bestimmen Sie die Parameter der ausgleichenden Regressionsgeraden, aus der abgelesen werden kann, wie groß - im Mittel - die Zwischenzeit bei vorgegebener Eruptionsdauer ist! b) Wann ist mit der nächsten Eruption zu rechnen, w e n n die letzte Eruption um 10.15 Uhr begann und 4,2 min dauerte? c) Lassen die verfügbaren Daten d e n Schluß zu, daß der lineare Zusammenhang zwischen der Dauer einer Eruption und der Zwischenzeit tatsächlich "sehr eng" ist?

Aufgabe 60 E i n Soziologe interessiert sich für den Zusammenhang zwischen dem Alter v o n Straffälligen bei ihrer ersten einschlägigen Fühlungnahme mit der Polizei (X) und deren Alter beim Antritt der ersten Freiheitsstrafe (Y). Aufgrund besonderer Beziehungen zur Verwaltung einer nahegelegenen Justizvollzugsanstalt (Gefängnis) verfügt er über die folgende Datenmenge: X.: 10; 18; 11; 12; 17; 17; 20; ι y ^ 23; 27; 30; 19; 25; 30; 21. In der Fachliteratur publizierten und daher wohl ernst gemeinten Ansichten zufolge soll es zwischen den Merkmalen X und Y eine lineare Beziehung geben. a) Berechnen Sie den Korrelationskoeffizienten nach BRAVAIS/PEARSON interpretieren Sie das Ergebnis!

und

b) Berechnen Sie die Parameter der ausgleichenden Regressionsgeraden Y(X)! Bestimmen Sie den Wert dieser Geraden an der Stelle X = 4 und kommentieren Sie das Ergebnis!

* Aufgabe 61 Eine

(lineare)

schrieben.

Regressionsbezlehung werde durch

Es sei ferner χ = 12 und r = 0,9.

Y(X) = 6 + 1,5 X

Man bestimme die

be-

Regres-

s i onsgerade X(Y)!

Aufgabe 62 Aus

den

folgenden

Angaben

sind

die

Parameter der beiden Regres2 2 sionsgeraden Y(X) und X(Y) abzuleiten: r = 0,7, s = 4,0, s v = 16,0, χ = Λ Υ = 20 und у = 40!

32

1. Beschreibende Statistik

Aufgabe 63 In der folgenden Tabelle 1st der Bestand an Gütermotorschiffen der Binnenschiffahrt eines westeuropäischen Landes a n einem bestimmten Stichtag nach dem Alter (Y) und der Tragfähigkeit (X) aufgegliedert.

\ Alter (in _ \ Jahren) Trag\ fähigkeiK (t) \ unter 400 400 b.u. 1000 1000 b.u. 3000 insgesamt

unter 20

20 bis unter 40

40 bis unter 60

60 80 370

60 280 280

170 370 130

510

620

670

60 bis unter 80

80 und mehr

insges.

200 380 50

40 170 20

530 1280 850

630

230

2660

a) Bestimmen Sie die ausgleichende Regressionsgerade X(Y) = b Berechnen und interpretieren Sie den Wert X(36)! Gehen Sie bei Ihren Berechnungen davon aus, daß älter als 100 Jahre ist!

kein

+ b.Y!

Güterschiff

b) Geben Sie, ohne die Parameter der ausgleichenden Regressionsgeraden Y(X) = a + a.X zu berechnen, das Vorzeichen des Parameters a, an! O l 1 c) Berechnen Sie die Parameter a

о

und a,! 1

d) Berechnen Sie den Korrelationskoeffizienten nach BRAVAIS/PEARSON interpretieren Sie diesen! e) W o r i n unterscheiden sich der Korrelationskoeffizient BRAVAIS/PEARSON und das Bestimmtheitsmaß inhaltlich und formal? Welchen Wert nimmt das Bestimmtheitsmaß in diesem Falle an?

und

nach

Aufgabe 64 Ein Student der Volkswirtschaftslehre hat in einer Vorlesung den Hinweis eines Professors aufgeschnappt, daß viele makroökonomische Größen wechselseitig voneinander abhängen. Nun will er seine frisch erworbenen Statistikkenntnisse an einem volkswirtschaftlichen Beispiel erproben. Er wählt willkürlich zwei gesamtwirtschaftliche Variable (Saldo des Warenverkehrs und Saldo der Kapitalbilanz) aus und ermittelt deren Werte für je ein Land aus verschiedenen Kontinenten.

1. Beschreibende Statistik

Land

Saldo des Warenverkehrs 1986 (X) in Mio SZR

Niederlande Kenia Guatemala China Papua-Neuguinea

J)

33

Saldo der Kapitalbilanz 1986 (Y) in Mio SZR 1 *

6150 -248 148 -7791

2053 -14 48 -6207

61

-113

1) Die SZR sind Werteinhelten, die dem Wert eines gewogenen Mittels der Währungen der wichtigsten am Welthandel beteiligten Länder entsprechen. Quelle: Statistisches Bundesamt (Hrsg.), Statistisches Jahrbuch 1988 Mit diesen Werten berechnet er: a) die beiden ausgleichenden dieser Geraden,

Regressionsgeraden

und

den

Schnittpunkt

b) eine geeignete Maßzahl, mit der die Modellannahme der ausgleichenden Regressionsgeraden überprüft werden kann. Zu welchen Ergebnissen hätte er kommen müssen? 2 c) Es wird behauptet, daß das Bestimmtheitsmaß г "jenen Varianzanteil kennzeichnet, der durch die Regressionsgerade erklärt wird". Der Student versteht das nicht, weil es ja zwei Regressionsgerade gibt; und überhaupt, Anteil von welcher Varianz? Erklären Sie es anhand dieses Beispiels!

Aufgabe 65 Im Rahmen einer Wirtschaftlichkeitsuntersuchung soll die durchschnittliche Verweildauer an einem Arbeitsplatz und die durchschnittliche Reparaturzeit von Kraftfahrzeugen in einer Reparaturwerkstätte grob abgeschätzt werden. Zu diesem Zwecke wurden für 20 Kraftfahrzeuge die folgenden Zeiten aufgeschrieben.

34

1. Beschreibende Statistik

Kfz. Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Verweildauer in min. 85 40 130 90 95 55 25 40 110 150 10 205 80 150 240 115 95 465 160 190

Reparaturzeit in min. 65 30 110 70 85 35 15 20 90 140 5 190 50 125 230 105 90 450 150 170

Berechnen Sie die' durchschnittliche Verweildauer und die durchschnittliche Reparaturzeit der Kraftfahrzeuge! Aufgabe 66 In einem Unternehmen sind im Bereich "Kurzstrecken" zwölf LKW eingesetzt, die jeden Morgen beladen werden. Bestimmen Sie aus den folgenden Angaben die mittlere Dauer der Beladung eines LKW! Nr. des LKW 1 2 3 4 5 6 7 8 9 10 11 12

Ankunftszeit Uhr 7 7 7 7 7 7 7 7 7 7 8 8

00 00 10 15 30 40 40 45 45 50 00 15

Abfahrtszeit ... Uhr 7 8 10 8 8 8 8 8 9 9 10 9

30 50 20 45 30 00 15 00 05 30 10 50

I. Beschreibende Statistik

35

Aufgabe 67 Ein 600-Betten-Krankenhaus (Klinikum) beginnt zum Jahresanfang seinen Betrieb mit 200 Patienten. Am Ende des jeweiligen Quartals werden 400, 470, 500 und 540 Patienten gezählt. a) Wurde die geplante Belegungsquote von durchschnittlich 70% erreicht? b) Am Jahresende wird die mittlere Verweildauer der Patienten mit sieben Tagen angegeben. Bestimmen Sie den Zugang und Abgang während des Jahres!

Aufgabe 68 Die Lehrstühle einer Universität haben das Recht, außerhalb der Universitätsbibliothek einen eigenen Präsenzbestand an wichtigen Fachbüchern zu halten (Handapparat). Dieser Handapparat darf im Jahresmittel nicht mehr als 200 Bücher umfassen, anderenfalls tritt ein Bestellstop für diesen Handapparat in Kraft. Die Lehrstühle können aber veraltete oder aus anderen Gründen nicht mehr benötigte Bücher zurückgeben und gegebenenfalls durch neue Bücher ersetzen. Ein Lehrstuhl dieser Universität hat am Anfang eines Jahres 190 Bücher im Handapparat. Im Laufe dieses Jahres werden folgende Anzahlen von Büchern zurückgegeben bzw. angeschafft.

Quartal I II III IV

Anzahl der Rückgaben

Anzahl der Neuanschaffungen

3 10 15 2

15 20 45 10

a) Erhält dieser Lehrstuhl ein Buch, das er am Anfang des nächsten Jahres für seinen Handapparat bestellt, sofort, ohne daß er Bücher zurückgibt? b) Wie lange befindet sich im Mittel ein Buch in diesem Handapparat?

Aufgabe 69 Detlev Brause, 29, Luxusstudent, besitzt eine Hausbar, die regelmäßig sieben Tage vor einem Klausurtermin (um 7.00 Uhr) mit 300 Flaschen Bier bestückt wird. Damit glaubt er, über einen hinreichenden Vorrat an Beruhigungsmitteln zu verfügen. Allmorgentlich um 7.00 Uhr registriert er den aktuellen Bestand und kommt zu folgendem Ergebnis:

36

1. Beschreibende Statistik

Bestand am ... Morgen (7.00 Uhr)

Flaschen

2. 3. 4. 5. 6. 7. 8.

280 260 220 180 120 50 0

Bei d e m Versuch, kurz vor Klausurbeginn (übungshalber) d e n Durchschnittsbestand u n d die mittlere Verweildauer des Bieres zu bestimmen, wird es dunkel um ihn, so daß er den Versuch erfolglos abbrechen muß. Z u welchem Ergebnis hätte er kommen müssen? (Annahme: Brause trinkt gleichmäßig über die 24 Stunden eines Tages hinweg. )

Aufgabe 70 In einem Laborversuch werden 1000 neugeborene weiße Mäuse mit einem neuen Serum geimpft. In den folgenden Wochen wird jeweils am Wochenende (Samstag, 10.00 Uhr) festgestellt, wieviel Mäuse zu diesem Zeitpunkt n o c h leben. Das Ergebnis enthält folgende Tabelle.

Alter χ in vollendeten Wochen 1 2 3 4 5 6 7

Anzahl der Mäuse, die das Alter χ vollendet haben 980 860 430 210 90 20 0

Bestimmen Sie den Durchschnittsbestand und die mittlere Verweildauer der Mäuse! Wie kann die mittlere Verweildauer interpretiert werden?

Aufgabe 71 Der Forderungsbestand eines Unternehmens entwickelte sich wie folgt.

1. Beschreibende Statistik

Zeitpunkt^

Bestand in DM

t 0

Zugang in DM im Zeitraum t^

400000

4

s 4

1) t i - t

37

bis t^

-

500000

1080000

320000

1200000

380000

1500000

440000

1320000

520000

900000

= 0,5 Jahre

Bestimmen Sie a) den Durchschnittsbestand, b) die mittlere Laufzeit (λ=0,5) und c) die Umschlaghäufigkeit der Forderungen!

Aufgabe 72 Eine westdeutsche Galerie hat sich auf sozialistische Kunst spezialisiert. Während die Ausstellungen dieser Galerie vor der Änderung der gesellschaftlichen Verhältnisse in Osteuropa im allgemeinen sehr gut besucht waren, nahm insbesondere seit der Wiedervereinigung Deutschlands das Interesse an dieser Kunstform deutlich ab. Zur Eröffnung einer Ausstellung mit Skulpturen des stalinistischen Bildhauers Antonow Glasnost kamen gerade noch sieben Interessenten. Ihre individuellen Aufenthaltsdauern sind in folgender Tabelle zusammengestellt.

Besucher Nr. 1 2 3 4 5 6 7

Aufenthaltsdauer von

18 18 18 19 18 18 18

00 00 20 30 30 00 00

-

21 19 18 22 20 19 18

bis ... Uhr

35 10 50 und 19 30 - 22 00 00 45 00 und 19 30 - 21 20 10

a) Bestimmen Sie den Bestand zum Zeitpunkt 20.00 Uhr!

38

/. Beschreibende Statistik

b) Berechnen Sie bi) die durchschnittliche Verweildauer je Besucher und b 2 ) die durchschnittliche Aufenthaltsdauer je Zugang! c) Berechnen und interpretieren Sie die Zeitmengenfläche! Aufgabe 73 Die Anzahl der Bakterien vermehrte sich in einer bestimmten Nährlösung innerhalb von fünf Tagen von 100 auf 895. Bestimmen Sie den durchschnittlichen prozentualen Zuwachs je Tag! Aufgabe 74 Eine Maschine, die zu Beginn eines Jahres für 50000,- DM angeschafft wurde, soll in fünf Jahren degressiv (in gleichen Prozentsätzen vom Restbuchwert) abgeschrieben werden bis auf einen Erinnerungsposten von 1,- DM. Es sind die Abschreibungsbeträge und Restbuchwerte zu berechnen! Aufgabe 75 Bestimmen Sie anhand der folgenden Meßzahlenreihen die mittlere Wachstumsrate der (durchschnittlichen) Bruttomonatsverdienste im betrachteten Zeitraum in der Mineralölverarbeitung und im Versicherungsgewerbe sowie das Jahr mit dem jeweils größten Verdienstzuwachs! Meßzahlen der Bruttomonatsverdienste Jahr t

in der MineralölVerarbeitung Bezugszeit t 0 = 2

(in %)

Ve r s i che rungs gewe rbe Bezugszeit t 0 = 5

93,22

78,46

100,00

83,28

109,74

89,74

116,94

94,80

124,18

100,00

Um wieviel Prozent haben die Bruttomonatsverdienste auf t = 4 zugenommen?

von t = 3

Aufgabe 7 6 Ein Portefeuille fikaten:

besteht

aus

den

folgenden

Investment-Zerti-

1. Beschreibende Statistik

Zertifikat

Anzahl

Interstat Uniba Erzetbe Eurofonds

120 80 150 30

39

Rücknahmepreis (in DM)

154,24 51,41 35,11 81,25

163,17 47,10 40,40 70,18

a) Bestimmen Sie die durchschnittliche jährliche Wertsteigerungsrate des Portefeuilles! ( t 2 - t l = 2 J a h r e ) · b) Welche Wertsteigerungsrate ergäbe sich, wenn der Rücknahmepreis für Interstat-Zertifikate zum Zeitpunkt t auf DM 1 5 1 , — gesunken wäre?

Aufgabe 77 In d e n Jahren t=l bis t=5 hat die Anzahl der in der Bundesrepublik tätigen Ärzte, Apotheker und Zahnärzte zugenommen. Bestimmen Sie anhand der folgenden Meßzahlenreihen a) die Berufsgruppe, nommen hat,

die von t=l bis t=5 prozentual a m stärksten zuge-

b) die durchschnittliche gruppen!

jährliche

Ärzte Jahr t

Wachstumsrate

Apotheker

В e ζ u g s ζ e i t jeweils t-1 1,026 1,038 1,044 1,027 1,025

1,000

1,025 1,040 1,069 1,099

für

die

drei

Berufs-

Zahnärzte

t =3 о 0,975 0,986

1,000

1,009

1,016

Aufgabe 78

In der folgenden Tabelle sind die Entwicklungen der Ausgaben in der Bundesrepublik Deutschland für drei EDV-Bereiche im Zeitraum von 1986 bis 1990 aufgeführt.

1 Beschreibende Statistik

40

Hardware in Mio.DM

Jahr

1,087 1,099 1,079

0,694 0,839 1,000

1989*

19307

1,067

1, 187

1

20700

1,069

1,410

1990 )

Software und Services Meßzahlen; Bezugsjahr ist 1988

16182 16647 17796

1986 1987 1988

ι

HardwareWartung Meßzahlen; Bezugszeit ist Jeweils das Vorjahr

S c h ä t z u n g e n der

Ausgaben

Quelle: UNIT 2/89, S. 1.

a) Bestimmen Sie d e n EDV-Bereich, für d e n die Ausgaben Zeitraum prozentual am stärksten zugenommen haben!

im

angegebenen

b) Berechnen Sie die durchschnittliche jährliche Wachstumsrate Ausgaben in den drei Bereichen v o n 1986 bis 1990!

für

die

Aufgabe 79 Von einem Unternehmen sind in zwei Perioden t=l und t=2 die folgenden Mengen qj ^ von fünf Grundstoffen (j=l,2 5) zu den Preisen Pj ^ (j=l,2,...,5) bezogen worden.

J

p

J.i 12 27 4 40 16

1 2 3 4 5

P

q

J,2 17 26 3 58 18

j,i 85 40 18 8 22

q

j,2 95 45 20 10 22

a) Berechnen Sie die Indizes: a

l3

LP1,2'

a

3> Λ . 2 ·

a

5>

U

l,2·

LP2,1:

U

a

25 PP1,2'

PP2,1:

V

Ρ°2, Г

Ρ°1,2·

2,l!

b) Welche inhaltliche Bedeutung haben diese Indizes?

1. Beschreibende Statistik

41

Aufgabe 80 Ein Student der Wirtschaftswissenschaften im 1. Semester hat sich vorgenommen, während seines Studiums exakt über seine Ausgaben Buch zu führen. Er interessiert sich besonders für die Preisentwicklung von Grundnahrungsmitteln, da ihm seine Großmutter hierfür monatlich einen festen Betrag zukommen läßt. Nach den ersten Monaten möchte er sich einen Überblick über die bisherige Entwicklung seiner Ausgaben für Grundnahrungsmittel verschaffen. Seinen Aufzeichnungen entnimmt er folgende Informationen:

Gut

1 2 3 4

durchschni 111i eher Preis des Gutes J im ersten Monat 2,50 1,00 2,00 2,40

DM DM DM DM

durchschnitt 1 icher Preis des Gutes J im zweiten Monat 2,75 1.13 2,40 2,52

DM DM DM DM

a) Um wieviel Prozent ist der Preis eines jeden Gutes gestiegen? Geben Sie für jedes Gut die entsprechende Preismeßzahl an! b) Um seiner Großmutter in einfacher Weise die besorgniserregende Preisentwicklung zu schildern, faßt der Student die vier Preismeßzahlen zusammen, indem er die Summe der Prelsmeßzahlen durch die Anzahl der Güter teilt. Stimmen Sie seiner so gewonnenen Aussage zu, damit seien auch seine Ausgaben für die vier Güter insgesamt um 124 gestiegen? c) Während des ersten Monats seines Studiums verbrauchte der Student folgende Gütermengen:

Gut j 1 2 3 4

verbrauchte Menge des Gutes j 2 1 3 5

Berechnen Sie das arithmetische Mittel der in Teilaufgabe a) ermittelten Prelsmeßzahlen! Verwenden Sie dabei die Ausgabensummen des ersten Monats als Gewichte! Um wieviel Prozent sind die Preise der vier Güter dann im Durchschnitt gestiegen? d) Das in Teilaufgabe c) berechnete (gewogene) arithmetische Mittel ist ein Preisindex. Um was für einen Preisindex handelt es sich?

42

1. Beschreibende Statistik

Aufgabe 81 Theobald, ein Student der Wirtschaftswissenschaften mit einer sehr fortgeschrittenen Semesterzahl, meint, daß ihn sein Vater ungerecht behandelt, weil er den monatlichen Scheck während der letzten 17 Semester nie erhöht hat. Auf der Suche nach Argumentationshilfen verfällt er auf die Idee, einerseits einen Preisvergleich und andererseits einen Mengenvergleich der wichtigsten Waren seines täglichen Bedarfs über die letzten 8 Jahre hinweg anzustellen. Er stellt folgende Liste mit ausgewählten Gütern des täglichen Bedarfs samt Preisen zusammen.

Gut i

verbrauchte

verbrauchte

Preis des i-ten Preis des i-ten

Menge des

Menge des

Gutes im Juli

i-ten Gutes

i-ten Gutes

1982 in DM je

im Juli 1982 im Juli 1990 Mengeneinheit Miete (warm) Benzin in 1

1

1

Gutes im Juli 1990 in DM je Mengene i nhe i t

560,—

580,—

120

200

1,40

1,10

Bier in 1

32

46

1,30

1,60

Wein/Sekt/ Spirituosen in 1

10

16

18,—

16,—

Brot in kg

8

4

1,80

3,20

Fleisch und Wurstwaren in kg

7

5

13,80

15,80

14

9

1,70

2,40

Obst und Gemüse in kg

Führen Sie einen Preis- und einen Mengenvergleich durch! Verwenden Sie für Ihre Berechnungen die Strukturen von 1990 und kommentieren Sie die Ergebnisse!

Aufgabe 82 Der Preisindex für die Lebenshaltung (LASPEYRES-Index) ist in einem Entwicklungsland E^ im Laufe von acht Jahren von 340 auf 560 und in einem anderen Entwicklungsland Ε^ im gleichen Zeitraum von 172 auf 289 gestiegen. a) In welchem Land ist der Preisindex für die gestiegen und wie groß ist der Unterschied?

Lebenshaltung

stärker

I. Beschreibende Statistik

43

b) Wie groß ist die durchschnittliche Jährliche Zunahme des Preisindex in diesen Ländern? Aufgabe 83 In einer bayerischen Stadt bieten 3 Tankstellen (unter anderem) Normalund Superkraftstoff an. Beunruhigt über die Preispolitik der Mineralölkonzerne und die nach ihrer Ansicht drohenden Umsatzeinbußen setzen sich die drei Pächter zusammen, um ihre Lage zu analysieren. Ausgangspunkt ihrer Überlegungen ist das folgende Datenmaterial.

Tankstelle

о Preis je 1 in DM

1 2 3

Tankstelle

15

Abgabemenge in 1000 1

1,41 1,40 1,43

90 80 50

о Preis je 1 in DM ^ 1,46 1,44 1,46

4 Preis je 1 1

in DM ^ 1,29 1,32 1,34

Abgabemenge in 1000 1 110 80 60

SuperKraftstoff

t

1

1 2 3

Normsilkraftstoff

t

Abgabemenge

Preis je 1

Abgabemenge

in 1000 1

in DM 1 }

in 1000 1

90 80 90

1,33 1,35 1,38

100 80 70

1) Die Preise sind Durchschnittspreise des jeweiligen Zeitraums. a) Welche prozentuale Veränderung ergibt sich bei einem Vergleich der Umsätze aus dem Verkauf von Normal- und Superkraftstoff in t und t^ bei jeder Tankstelle? b) Um wieviel Prozent erhöhte oder verringerte sich der Gesamtumsatz der drei Tankstellen zusammen in diesem Zeltraum? c) Zerlegen Sie die Umsatzänderung der Tankstelle 1 in die Mengen- und Preiskomponente und interpretieren Sie das Ergebnis! Aufgabe 84 Der Index der Grundstoffpreise (nach LASPEYRES) wird in Veröffentlichungen der amtlichen Statistik unter anderem auch "nach dem produktionswirtschaftlichen Zusammenhang" ausgewiesen.

44

1. Beschreibende Statistik

Berechnen Sie aus den folgenden Angaben a) den Preisindex der Grundstoffe aus der Land- und Fischerei,

Forstwirtschaft,

b) den Preisindex der Grundstoffe aus dem Produzierenden Gewerbe, c) den Preisindex der Grundstoffe insgesamt (Gesamtindex) zum Zeitpunkt

Wägungsanteil TeilIndex am Gesamtindex zum Zeitpunkt in % 4 1. Grundstoffe aus der Land- und Forstwirtschaft, Fischerei a) inländisch b) importiert 2. Grundstoffe aus dem Produzierenden Gewerbe a) inländisch b) importiert d) Der Gesamtindex

13,410 7,598 5,812

112,6 121,6

86,590 57,261 29,329

135,2 158,4

ist von t bis t^ um 1,1% gestiegen.

Welchen Wert

hatte der Gesamt index im Zeitpunkt t? Aufgabe 85 Der Preisindex für die Lebenshaltung aller privaten Haushalte wird insgesamt und für 9 Hauptgruppen ausgewiesen. Die Hauptgruppen (in Klammern jeweils der Anteil der Hauptgruppe am Warenkorb in t in '/.) sind: 1. Nahrungs- und Genußmittel (26,672), 2. Kleidung, Schuhe (8,746), 3. Wohnungsmiete (13,327), 4. Elektrizität, Gas, Brennstoffe (4,913), 5. übrige Waren und Dienstleistungen für die Haushaltsführung (10,010), Waren und Dienstleistungen für 6. Verkehrszwecke, Nachrichtenübermittlung (14,753), 7. Körper- und Gesundheitspflege (4,316), 8. Bildungs- und Unterhaltungszwecke (7,873), 9. Persönliche Ausstattung, sonstige Waren und Dienstleistungen (9,390). Berechnen Sie aus den folgenden Angaben a) die durchschnittliche Preisänderung für die Güter der Hauptgruppen 2 und 4 von t bis t. bzw. von t bis t_, o l о 2 b) den Preisindex für die Lebenshaltung aller privaten Haushalte für t_!

1. Beschreibende Statistik

Hauptgruppe

45

Teil Indizes 4

1 2 3 4 5 6 7 8 9

с) Um

wieviel

Prozent

106,4 109,4 106,4 103,3 106,8 105,1 108,0 103,4 109,4

haben

sich

die

leistungen für die Lebenshaltung

125,5 132,5 126,4 171,0 129,3 130,9 131,7 118,2 137,5

Preise

der

Güter

in der Zeit v o n t^

und

bis t^

Dienstdurch-

schnittlich verändert?

Aufgabe 86 In der Bundesrepublik Deutschland waren kurz nach der Wiedervereinigung enorme Kaufkraftunterschiede zwischen dem östlichen und dem westlichen Landesteil festzustellen. a) Beschreiben Sie die Kaufkraftunterschiede im Bereich der Grundnahrungsmittel am Beispiel zweier in etwa gleichgroßer Städte in Ost(L) und Westdeutschland (H) durch die Berechnung von Kaufkraftparitäten auf der Basis von fünf repräsentativen Gütern! Ihre durchschnittlichen Preise (in DM) und ihre von einem durchschnittlichen Privaten Haushalt der jeweiligen Stadt gekauften Mengen (in jeweiligen Mengeneinheiten) sind für einen Monat kurz n a c h der Wiedervereinigung in der folgenden Tabelle zusammengestellt.

Η

L Gut Kaffee (500 g) Reis (500 g) Schokolade (100 g) Fruchtsaft (0,7 1) Margarine (500 g)

P

J

7,88 3,24 1,18 2,19 1,88

4

J

1,5 3 20 3 5

P

J

7,15 3,09 1,08 1,94 1,72

q

j

4 2 5 10 3

b) Z u Vergleichszwecken liegen zusätzlich die von einem durchschnittlichen Privaten Haushalt einer Kleinstadt (B) in der Nähe der früher e n innerdeutschen Grenze gekauften Mengen vor:

46

l. Beschreibende Statistik

Gut

q

Kaffee (500 g) Reis (500 g) Schokolade (100 g) Fruchtsaft (0,7 1) Margarine (500 g)

j,B

2 2 10 6 4

Inwieweit verändert sich die Kaufkraftparität zwischen L und H, wenn die Berechnung auf der Basis des Warenkorbs von В durchgeführt wird?

* Aufgabe 87 Preisvergleiche von Urlaubsgebieten (verschiedener Länder) werden anhand von Reisegeldparitäten, eine besondere Form von Kaufkraftparitäten durchgeführt. Familie Weckermann hört kurz vor ihrer diesjährigen Urlaubsentscheidung erstmals von diesem statistischen Begriff und beschließt, die endgültige Entscheidung über ihr Urlaubsgebiet anhand von Reisegeldparitäten zu treffen. Nach eingehendem Literaturstudium in der Stadtbücherei seiner Wohngemeinde stellt Vater Weckermann den Urlaubswarenkorb (für sechs Tage) seiner 4-köpfigen Familie mit fünf repräsentativen Gütern und Dienstleistungen zusammen. Anschließend stellt er durch intensive Befragungen bei allen ortsansässigen Reisebüros die Preise dieser Güter und Dienstleistungen für die beiden Urlaubsgebiete fest, die Familie Weckermann von Anfang an ins Auge gefaßt hatte. Die folgende Tabelle enthält neben diesen Informationen außerdem die Preise der Güter und Dienstleistungen des Warenkorbs in der Heimatregion der Familie Weckermann.

Gut

Menge Preis je Mengeneinheit in jeBusitanien Brulandie Heimatweiligen region Einheiten (in B«) (in BF) (in DM)

Wiener Schnitzel (Stück)

24

32000

55,—

10,—

Deutsches Bier (0,33 1)

42

2000

3,—

0,70

Postkarte incl. Porto (weniger als 5 Worte) (Stück)

10

800

3,50

1,10

Besuch einer landesüblichen Folkloreveranstaltung (Anzahl)

1

85000

480,—

120,—

Unterkunft in Mittelklassehotel (Anzahl)

1

1950000

8550,—

2800,—

1. Beschreibende Statistik

47

a) Berechnen Sie die Kosten des Urlaubswarenkorbs von Familie Weckermann in ihrer Heimatregion sowie in den beiden Urlaubsregionen. Welche Informationen erhält man, wenn mein die Kosten für jeweils zwei Regionen zueinander in Beziehung setzt? b) Für welche Urlaubsregion wird sich Familie Weckermann entscheiden, wenn zum Zeitpunkt der Entscheidung 1000 Busltanlen-Dollar 1,40 DM und 100 Brulandie-Francs 33,— DM kosten? Aufgabe 88 Brause hat auf einem Rosenmontagsball kräftig harten Alkoholika zugesprochen. Als verantwortungsbewußter Verkehrsteilnehmer möchte er jedoch erst damn wieder seinen Wagen besteigen, wenn sein Blutalkoholgehalt den Wert 0,8 Promille erreicht hat. Um 5 Uhr morgens ergibt ein Blutalkoholtest bei ihm einen Promillegehalt von 3, 15. Daraufhin stellt er unverzüglich den Alkoholgenuß ein und läßt seinen Blutalkoholgehalt in den nächsten fünf Stunden regelmäßig messen. Das Ergebnis ist in folgender Tabelle enthalten:

Zeitpunkt 5.00 6.00 7.00 8.00 9.00 10.00

Blutalkoholgehalt in Promille 3,15 2,98 2,87 2,69 2,53 2,36

a) Bestimmen Sie den (linearen) Trend nach der Methode der kleinsten Quadrate! b) Wie gut läßt sich das dargestellte Phänomen durch ein lineares Modell approximieren? c) Ist aufgrund des Ergebnisses von Teilaufgabe a) damit zu rechnen, daß Brause rechtzeitig um 19.00 Uhr beim Faschings-Kehraus im Nachbarort mit seinem Wagen erscheint? Von welcher Annahme ist bei der Beantwortung dieser Frage auszugehen?

Aufgabe 89 In einem Industriebetrieb wurde die Anzahl der täglichen Arbeitsunfälle registriert (der erste Tag ist ein Montag).

48

l- Beschreibende Statistik

Tag 1 2 3 4 5 6 7

Anzahl der Unfälle 24 18 14 10 25 9 8

Tag

Anzahl der Unfälle

8 9 10 11 12 13 14

26 16 14 9 25 9 7

Tag

Anzahl der Unfälle

15 16 17 18 19 20 21

27 19 15 10 24 10 7

a) Bestimmen Sie den Trend nach der Methode der kleinsten Quadrate und stellen Sie die Ursprungswerte und die Werte der geschätzten glatten Komponente graphisch dar! b) Ermitteln Sie die Restkomponente! Tragen Graphik ein und interpretieren Sie diese!

Sie

ihre

Werte

in

die

c) Berechnen Sie den Trend und die Restkomponente nach der Methode der gleitenden Durchschnitte! Die Anzahl der Glieder dieses Durchschnitts ist geeignet festzulegen! Aufgabe 90 Für das Überleben, das Wachstum und die Innovationskraft von Unternehmen und damit einer VolksWirtschaft ist eine ausreichende Eigenkapitalbasis von entscheidender Bedeutung. In der Bundesrepublik Deutschland hat die (durchschnittliche) Eigenkapitalquote über einen längeren Zeitraum hinweg ständig abgenommen. Jahr 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981

Eigenkapitalquote in % 31,4 30,6 28,4 26,7 25,9 24,6 24,0 23,7 23,7 23, 1 22,9 22,4 21,7 19,8 18,7

1. Beschreibende Statistik

49

a) Stellen Sie die Zeltreihe graphisch dar! b) Berechnen Sie den (linearen) Trend nach der Methode der kleinsten Quadrate und zeichnen Sie die Trendgerade in die Abbildung zu a) ein! c) Wie gut läßt sich die zeitliche Entwicklung der Eigenkapitalquote durch einen linearen Trend beschreiben?

Aufgabe 91 Der Bestand an Personenkraftwagen eines westeuropäischen Landes entwickelte sich wie folgt: Jahr

1977: 1 7. 1978: 1 1. 1 7. 1979: 1 1. 1 7. 1980: 1 1. 1 7. 1981: 1 1. 1 7. 1982: 1 1. 1 7. 1983: 1 1.

Bestand an Personenkraftwagen in Mio. 18,5 18,9 19,6 20,0 20,8 20,9 21,4 21,5 21,9 21,8 22,2 22,1

a) Stellen Sie die Zeitreihe graphisch dar! b) Berechnen Sie den linearen Trend nach der Methode der kleinsten Quadrate und zeichnen sie die Trendgerade ein! c) In welchem Umfang erklärt der lineare Trend die (Varianz der) Bestandsentwicklung? Berechnen Sie eine geeignete MaBzahl! d) Bestimmen Sie den Trend nach der Methode der gleitenden Durchschnitte und tragen Sie diesen in die Zeichnung ein! e) Welchen Bestand an Personenkraftwagen könnte man aufgrund des linearen Trends für den 1.1.1984 erwarten? Ist dieser Wert realistisch?

1. Beschreibende Statistik

50

1.2

Lösungen

Lösung 1 a) - Merkmalsträger: Personen bzw. Haushalte bei VZ und MZ; - Gesamtheit: Wohnbevölkerung der Bundesrepublik Deutschland zu einem bestimmten Zeitpunkt; - Umfang der Gesamtheit: 1996 etwa 82 Mio. Personen; - Merkmale: erfaßbare (meßbare) Eigenschaften (Tatbestände) der Merkmalsträger, zum Beispiel das Haushaltseinkommen; - Merkmalsausprägung: beim Merkmal Beruf rer, Schlosser, Zahnarzt, Bäcker, ...;

zum Beispiel

Leh-

- Erhebungsmerkmal: im Rahmen einer Erhebung erfaßte Eigenschaft, beim MZ zum Beispiel die Haushaltsgröße; - Vollerhebung oder Totalerhebung: alle statistischen Einheiten einer Gesamtheit werden erfaßt (z.B. bei der VZ); - Teilerhebung oder Stichprobenerhebung: aus der Menge aller Merkmalsträger einer Gesamtheit wird mit Hilfe eines geeigneten statistischen Verfahrens eine Teilmenge entnommen und erfaßt (z.B. beim MZ) ; - Primärstatistik: VZ und MZ; im Gegensatz zur Sekundärstatistik, wie z.B. der Lohnsteuerstatistik, die auf Daten zurückgreift, die zu Steuerzwecken erhoben wurden. b) Nominal (klassifikatorisch): Geschlecht (binär), Beruf (häufbar), Art der Krankenkasse (häufbar), Familienstand. Metrisch: Haushaltsgröße (diskret), Haushaltseinkommen (diskret), Alter (stetig, aber diskret erfaßt). c) Geburten und Sterbefälle können als Bewegungsmassen nur zeitraumbezogen erfaßt werden; VZ und MZ sind aber Erhebungen von Bestandsmassen zu einem bestimmten Zeitpunkt. Lösung 2 Merkmal: landwirtschaftlich genutzte Fläche eines Betriebes; Merkmalstyp: stetiges metrisches Merkmal, klassiert; Merkmalsträger: landwirtschaftliche Betriebe jenes Landes. a) Arbeitstabelle i 1 2 3 4 5 6 7

x

2 5 10 20 50 100 3001'

i

1,5 3,5 7,5 15, 0 35, 0 75,0 200,0

i = ni/n

№)

0, 129 0, 193 0, 185 0, 226 0,226 0, 036 0, 006

0,129 0, 322 0, 507 0,733 0, 959 0, 995 1

f

Xi

·4

0,1935 0,6755 1,3875 3,3900 7,9100 2,7000 1,2000

Als Obergrenze der Klasse über 100 ha wird 300 ha angenommen.

1. Beschreibende

Approximierende Verteilungsfunktion

F^xJ

siehe

Statistik

51

Arbeitstabel-

le. In d i e s e m B e i s p i e l ist F'x(xi) = f ( x < x i ) l Median, Medianklasse:

i = 3,

x0,5 = *ι-ι + (θ,5 - F x (x i _ 1 ))A(x 1 )/f i = 5 + (θ,5 - 0,322) · 5/0,185 = 9,81 (ha) . Arithmetisches к χ = Σ x A

Mittel:

= 1 Λ 4 6 (ha) b e i

x 7 = 300 (ha).

i=l

Der M e d i a n b e t r ä g t 9,81 ha, d.h. m i n d e s t e n s 50% der B e t r i e b e u n t e r s c h r e i t e n die l a n d w i r t s c h a f t l i c h e Fläche v o n 9,81 ha n i c h t u n d m i n d e s t e n s 50% ü b e r s c h r e i t e n d i e s e n W e r t nicht, und d a s a r i t h m e t i s c h e M i t t e l b e t r ä g t 17,46 h a l a n d w i r t s c h a f t l i c h g e n u t z t e Fläche. Der W e r t des a r i t h m e t i s c h e n M i t t e l s hängt von der gewählten Obergrenze der siebten Größenklasse ab ( x 7 = 300 (ha)) . b ) F* (ξ) =

Fx(*i-i)

+

-

S

i-l)fi/

A

(

x

i)'

f a l l s

X

i-i

< ξ *

X



f x (X < 20) = F*(20) = F x (20) = 0,733 f x (X > 50) = 1 - f x (X < 50) = 1 - F*(50) = 0,041 (*0,036+0,006=0,042 w e g e n

Rundungsfehlern).

F*(75) = 0,959 + (75 - 50)0,036/50 = 0,977. f x (20 < X < 75) = f x (x < 75) - f x (X < 20) = F*(75) - F*(20) = 0,977 - 0,733 = 0,244. 73,3% d e r B e t r i e b e h a b e n e i n e l a n d w i r t s c h a f t l i c h genutzte F l ä c h e v o n h ö c h s t e n s 20 ha, 4,1% von m e h r als 50 ha u n d 24,4% d e r B e t r i e b e h a b e n e i n e Fläche z w i s c h e n 20 u n d 75 h a . W e g e n d e r V e r w e n d u n g der a p p r o x i m i e r e n d e n V e r t e i l u n g s f u n k t i o n gelt e n d i e s e A u s s a g e n nur a p p r o x i m a t i v . Lösung 3 Merkmal: Wellenlänge in mm; Merkmalstyp: stetig, metrisch; M e r k m a l s t r ä g e r : W e l l e n , d i e in d e m b e t r a c h t e t e n B e t r i e b gefertigt werden.

52

1. Beschreibende Statistik

a) Arbeitstabelle 1 J

X '[j]

1 2 3 4 5 6 7 8 9 10

f(x

29,6 29,7 29,8 29,9 30,0 30,1 30,2 30,3 30,4 30,5

ij])

= f

W j ] )

j

0,04 0,12 0,24 0,40 0,60 0,72 0,84 0,92 0,96 1,00

0,04 0,08 0,12 0,16 0,20 0,12 0,12 0,08 0,04 0,04

Stabdiagramm f

i

0.20 0.16 0.12 0.08 0.04 0.00 29.6

29.8

30.0

30.2

30.4

Empir ische/approximierende Verte i1ungsfunkt ion

1. Beschreibende Statistik

53

b) x q = 29,55; technische Begründung: MeBgenauigkelt; s t a t i s t i s c h e Begründung: Klassenmitten = Klassenmittelwerte (=Meßwerte) = x^ = 29,6; Klassenbrelte = 0,1; x q = x 1 - Δ(χ 1 >/2 = 29,6 - 0,05 = 29,55 (mm). Arbeltstabelle 2

i

über . . einschl

1 2 3 4 5 6 7 8 9 10

29,55 29,65 29,75 29,85 29,95 30,05 30,15 30,25 30,35 30,45

-

bis mm 29 29 29 29 30 30 30 30 30 30

65 75 85 95 05 15 25 35 45 55

fj/AiXj) 0,04 0,08 0, 12 0, 16 0,20 0, 12 0, 12 0,08 0,04 0,04

29,6 29,7 29,8 29,9 30,0 30, 1 30,2 30,3 30,4 30,5

0,04 0, 12 0,24 0,40 0,60 0,72 0,84 0,92 0,96 1,00

0,4 0,8 1.2 1,6 2,0 1,2 1,2 0,8 0,4 0,4

1) Vgl. Arbeitstabelle 1 Histogramm

f

1

= X

A(*i) 2.0

-

1.6

-

1.2 0.8 -

0.4 0.0 -

00 O) (O 0 ) 0 0)0) ΓΜ ГМ ГМ CM

о

to

τ°

(Μ «Ο 4|· ° я °

in °

Approximierende Verteilungsfunktion siehe Teilaufgabe a). c) Wegen x

0,8 = V i

+

(0,8-Fx(51_1))A(x1)/fi =

= 30,15 + ( 0 , 8 - 0 , 7 2 ) 0 , 1 / 0 , 1 2 = 30,22 (mm)

54

1. Beschreibende

Statistik

1st (-»;30,22] = [0;30,22] = [29,55;30,22] ein Bereich, in dem sich 80'/. der Beobachtungswerte befinden, allerdings nur approximativ! Vergleiche die approximierende Verteilungsfunktion! Bei hinreichend großem η und gleichmäßig verteilten Beobachtungswerten innerhalb der Klassen ist der Genauigkeitsverlust vernachlässigbar. N.B.: Es gibt (unendlich) viele derartiger Bereiche! d) Arbeltstabelle 3

1 1 2 3 4 5 6

i

f i /A(x 1 )

0,04 0,20 0,36 0,24 0,12 0,04

0,4 1,0 1,8 1,2 0,6 0,4

f

*i 29,65 29,85 30,05 30,25 30,45 30,55

Histogramm

f

X

=

A(Xj) 2.0 -ι 1.6

-

1.2

-

0.8

-

0.4 0.0

m in cri (N

m σ> a> о (N oo

1 m τΟ CO

I ir in CN со η о с со

in in •4- m о ö со со

Lösung 4 Merkmal: Haushaltselnkommen in DM; Merkmalstyp: metrisch, klassiert; Merkmalsträger: Privathaushalte jenes Landes.

1. Beschreibende Statistik

a) Arbeitstabelle i

f

i

i y v

fj/ACXj)

1 2 3 4 5 6

12001J 1800 2500 3000 4000 5000

0,187 0,217 0,235 0,115 0,144 0,057

0,187 0,404 0,639 0,754 0,898 0,955

0,00031 0,00036 0,00034 0,00023 0,00014 0,00006

7

10000 2)

0,045

1,000

0,00001

1) χ

о

= 600 (=Existenzminimum),

2) x^ = 10000 (Ausreißer werden vernachlässigt) b) Histogramm

Δ(χ,)

•10"

0 4 -j 0.3 0.2

-

0.1

-

0.0

-

2000

4000

6000

τ 8000

Approximierende Verteilungsfunktion Fx

2000

1 4000

1

1 6000

1

1 ' Γξ 8000 10000

=l ξ 10000

55

56

1. Beschreibende Statistik

с) F x ( ? ) = Ρ χ ί ^ ! . ^ + (ξ"*!-!) '

f / ^ V

F*(1500) = 0,187 + (1500-1200)0,217/600 = 0,187 + 0,1085 = 0,2955 = 0,3, 30% der Haushalte. F*(3800) = 0,754 + (3800-3000)0,144/1000 = 0,754 + 0,1152 = = 0,8692 = 0,87, 1 - F*(3800) = 1 - 0,87 = 0,13, 13% der Haushalte. F*(2900) = 0,639 + (2900-2500)0,115/500 = 0,639 + 0,092 = = 0,731 = 0,73, F x (1700) = 0,187 + (1700-1200)0,217/600 = 0,187 + 0,181 = = 0,368 = 0,37, F*(2900) - F*(1700) = 0 , 7 3 - 0,37 = 0,36, 36% der Haushalte. Es haben zum Beispiel 13% der Haushalte ein monatliches Nettoeinkommen über 3 8 0 0 , — DM. Annahme: Gleichmäßige Einkommensklassen.

Verteilung

der

Beobachtungswerte

Innerhalb

der

Lösung 5 a) Merkmalsträger: Sargkäufe; Merkmale: Sargtyp Ausland (B); Merkmalstyp: klassifikatorisch.

im

Inland

(A)

und

b) Für klassifikatorlsche Merkmale ist der Modus ein geeignetes Maß der zentralen Tendenz und die Entropie oder das Maß vom Typ HERFINDAHL ist ein Maß zur Charakterisierung der Streuung. Modus: n(A ) =

max. 1=1,2

к

n(B ) =

max. i=l,2

к

ö

n(A ) = 75 , 1

n(B ) = 39 . 1

Der Modus des Merkmals Α (Sargtyp im Inland) ist die vierte Merkmalsausprägung, Tischlersärge, der des Merkmals В (Sargtyp im Ausland) Urnen. Die weitaus häufigste Beerdigungsart im Inland ist die Beerdigung in Tischlersärgen, im Ausland werden Urnen präferiert.

1. Beschreibende Statistik Entropie: к H(Α) = - Σ

f

Id f, =

1=1

= -(0,01 Id 0,01+0,00 Id 0,00+0,05 Id 0,05+0,75 Id 0,75+ + 0,19 Id 0,19) = = 0,0664 + 0,0000 + 0,2161 + 0,3113 + 0,4552 = 1,0490 H(B) = 0,3322 + 0,2435 + 0,500 + 0,4644 + 0,5298 = 2,0699 0 £ H(A),H(B) i l d k ;

Id к = Id 5 = 2,3219 .

Die Streuung der Nachfrage nach Särgen und Urnen im Ausland ist wesentlich größer. Sie tendiert zur Gleichverteilung (H(B) = 2,07 ist nahe a n ld к = 2,32, der Gleichverteilung), die Streuung der Nachfrage im Inland ist deutlich niedriger, aber dennoch nicht nahe an der Ein-Punkt-Verteilung. Maß vom Typ HERFINDAHL Arbeitstabelie A Nachfrage

Särge im Selbstbausatz Leihsärge Cash- und carry Särge Tischlersärge Urnen Σ

KjjCA) =

f

i

В f2 i

f

i

f2 i

0,01 0 0,05 0,75 0,19

0,0001 0 0,0025 0,5625 0,0361

0,10 0,06 0,25 0,20 0,39

0,0100 0,0036 0,0625 0,0400 0,1521

1,0

0,6012

1,0

0,2682

Σ f 2 = 0,6012 , S H ( A ) = 1 - 0,6012 = 0,3988 , i=l

Kj^(B) = 0,2682 , S H (B) = 1 - 0,2682 = 0,7318 , 0 s S H ( A ) , S H ( B ) s 1 - i = 1 - 0,2 = 0,8 . Die Streuung des Merkmals В liegt nahe ein der Grenze des Wertebereichs des Maßes vom Typ HERFINDAHL zur empirischen Gleichverteilung. Die Streuung des Merkmals Α ist niedriger, läßt aber keine präzise Interpretation zu, da der Wert in der Mitte des Wertebereichs liegt. Auf jeden Fall ist die Streuung von Α (Inland) wesentlich als die Streuung von В (Ausland).

geringer

57

58

1- Beschreibende Statistik

Lösung 6 Merkmal: Unfalltyp von Verkehrsunfällen; Merkmalstyp: klassifikatorlsch; Merkmalsträger: Straßenverkehrsunfälle mit Personenschaden. a) Geeignete Darstellungsform Häufigkeiten (in Prozent)

\ 100-f 1

A

A

1

^

20,3

14,6

ist das Stabdiagramm.

A

3

22,3

A

4

10,5

3,4

6

Mit den

relativen



17,6

11,4

ergibt sich das folgende Stabdiagramm:

Ί

0.25

-

0.20

-

0.15

-

0.10

-

0.05

-

0.00

-I

I

1 A

1

A

2

A

3

A

b) Wegen n(A 3 ) = 83569 = maxintAj)}

4

A

5

ist A 3

A

6

A

7

(Einbiegen-/Kreuzen-Unfall)

der Modus. c) Geeignete Streuungs-/Konzentrationsmaße sind die Entropie und das Maß vom Typ HERFINDAHL. A

f

A

0 203

0,4670

0 041209

0 146

0,4053

0 021316

0 223

0,4828

0 049729

0 105

0,3414

0 011025

0 034

0,1659

0 001156

0 176

0,4411

0 030976

\

0 114

0,3571

0 012996

Σ

1 001

2,6606

0 168407

1

A

?

Ν A

4

\ a

R

i

"fi

ld

f

i

4

1. Beschreibende Statistik

7 H(A) = - Σ f i=l K^A)

=

7

Σ f i=l

Id f

= 2,6606 < Id 7 = 2,8074

59

(Gleichverteilung);

2 = 0,168, S CA) = 1 - 0,168 = 0,832 < 0,857

(Gleichverteilung).

Die Abweichung der empirischen Verteilung v o n der Gleichverteilung ist - gemessen mit d i e s e n M a ß e n - nicht sehr ausgeprägt, d e n n die Werte der b e i d e n Streuungsmaße weichen nicht stark v o n d e n ents p r e c h e n d e n W e r t e n für eine empirische Gleichverteilung ab.

Lösung 7 Merkmal A: Partei Merkmalsträger: Wähler Merkmalstyp: klassifikatorisch Ein geeignetes Maß zur Beschreibung der Konzentration der Stimmen die fünf unterschiedenen Parteien ist d a s Maß von HERFINDAHL.

a) Es ist:

K^A) =

к Σ

f^

mit

i = i *

A) s 1 ;

dabei ergibt s i c h

KJJ(A) = 1 im Fall der vollständigen Konzentration auf eine Partei KJJ(A) = ^

auf

und

im Fall minimaler Konzentration, d.h. Gleichverteilung der

S t i m m e n auf die Parteien. Arbeitstabelle

i

-f. ld f, 1 i 1983

1980

1980

«Ϊ

1983

1 2 3 4 5

0,5238 0,5198 0,3432 0,0909 0,0382

0,5304 0,5051 0,2686 0,2329 0,0319

0,184041 0,198025 0,011236 0,000225 0,000025

0,145924 0,238144 0,004900 0,003136 0,000016

Σ

1,5159

1,5689

0,393552

0,392120

Damit erhält mein КцШдд

= 0,394

und

KjjCAJgg = 0,392 .

D a der Wert des Maßes v o n HERFINDAHL von 1980 bis 1983 geringfügig zurückgegangen ist, hat die Konzentration der S t i m m e n auf d i e Part e i e n minimal abgenommen.

1. Beschreibende Statistik

60

Da Verteilungen mit gleicher Anzahl von Ausprägungen (k=5) miteinander verglichen werden, muß das Maß von HERFINDAHL nicht normiert werden. Anmerkung: Da zwischen Streuung und Konzentration ein enger Zusammenhang besteht, kann die Fragestellung auch mit der Entropie und dem Streuungsmaß vom Typ HERFINDAHL beantwortet werden. Es gilt (vgl. Arbeitstabelle): H(A) 80 = 1,52, H(A)83 i 1,57, S H (A) 80 = 1 - K ^ A ) ^ = 0,606, S

H(A)83 =

1

- *ПШ83

= °'608

*

Die Werte der Streuungsmaße haben von 1980 bis 1983 geringfügig zugenommen, d.h. sie haben sich ihren Grenzwerten für den Fall der empirischen Gleichverteilung angenähert, was bedeutet, daß die Konzentration abgenommen hat. b) Werden die Stimmenanteile der "Grünen" und der "Sonstigen" zusammengefaßt, ergibt sich für k' = 4:

"fi 1980 i=k' = 4

0,1129

.2 i

d f. 1 1983 0,2435

1980

1983

0,0004

0,0036

Damit ist: K^(A)80= 0,394

und

K^(A)83 = 0,393

H'(A)80 = 1,50

und

H'(A)83 = 1,55,

S

H ( A ) 80 °

0,606 Und S

bzw.

H ( A ) 83 ° °· 611 ·

Alle Ergebnisse belegen, daß auch im Fall der Zusammenfassung der beiden Merkmalsausprägungen "Grüne" und "Sonstige" die Konzentration von 1980 bis 1983 geringfügig abgenommen hat. Für einen Vergleich der Konzentrationen mit und ohne Zusammenfassung der Stimmenanteile der "Grünen" und der "Sonstigen" sind die verwendeten Maße (wegen k=5 und k'=4) zu normieren. Die Ergebnisse der Normierung mit 0 s R(А) =

ΗΓΑ) к-КЛАЫ а 1 und 0 s К Д А ) = s 1 Id k Ή norm. k-1

S (Α) = H norm.

bzw.

k«S„(A) Ξ-τk-1

sind für die Fälle a (k=5) und b (k'=4) der folgenden Übersicht zu entnehmen:

1. Beschreibende Statistik

VA)norm. 1980 1983 а b

0,2400 0,1907

0,2425 0,1920

S„( А) Η norm. 1983 1980

R(A) 1980

1983

0,655 0,750

0,676 0,775

61

0,758 0,808

0,760 0,810

Aus dieser Übersicht geht hervor, daß die Stimmenkonzentration in beiden Fällen geringfügig abgenommen hat. Die Übersicht zeigt aber auch, daß die "relative Konzentration" im Falle b nicht unwesentlich geringer als im Falle a ist (weil sich die Stimmenanteile gleichmäßiger auf weniger Parteien/Ausprägungen verteilen).

Lösung 8 a) Merkmalsträger sind die Studierenden, die an der Diplomvorprüfung im Fach Statistik teiInahmen. Komparatives Merkmal "Note", mit der Verteilung Note

Anzahl

Anteil

n(Ut)

fiUj)

1 2 3 4 5

2 20 28 22 8

0,025 0,250 0,350 0,275 0,100

Σ

80

1

U

i

w

0,025 0,275 0,625 0,900 1,000

Stabdiagramm (Häufigkeitsverteilung)

0.4

η

0.3 0.2 0.1

-

Λ—

0.0 -Ι Η 1

2

3

4

5

U

62

1. Beschreibende Statistik

Kumulierte relative Häufigkeiten

и

1.0 0.8

0.6

0.4 0.2 0.0

U

b) Der Median 1st ein geeignetes LagemaB für komparative Merkmale. Median IL _ = 3, d.h. mindestens 507. der Teilnehmer haben die Note 3 U, о und besser und mindestens 50% die Note 3 oder eine schlechtere Note erzielt. Da 28 Teilnehmer die Note 3 erzielt haben, ist der Median wie so oft - nicht besonders aussagefähig. Ein Streuungsmaß für komparative Merkmale ist k-1 S(U) = Σ H(A ), mit H(A ) = -[f.

A

J

A

1

f

J.i

f

J.2

Id f

+ f

0,975

0,025

0,1686

0,275

0,8486

A

?

A

1

0,375

0,625

0,9544

0,100

0,900

0,4690

4

Damit ist S(U) =

].

H( Aj )

0,725

A

Id f

4 Σ H(A.) = 2,4406 und S(U) = 2,4406/4 = 0,6. J norm.

Wegen 0 s S(U) s 1 ist die Streuung dieser Verteilung also nicht norm. sehr stark. Die Verwendung der normierten Streuung hat den Vorteil, daß Verteilungen mit unterschiedlicher Anzahl von Ausprägungen (zum Beispiel Zwischennoten) hinsichtlich der Streuung miteinander verglichen werden können.

1. Beschreibende Statistik

63

Lösung 9 a) Merkmalsträger sind die gefällten Kiefern der beiden Forstämter. Die Güteklassen der Kiefern sind Ausprägungen des komparativen Merkmals "Güte". b) Für komparative Merkmale ist der Median ein geeignetes Maß der zentralen Tendenz, und der Quartilsabstand oder das Maß auf der Basis der Entropie sind geeignete Streuungsmaße. Arbeitstabelle 1

Güteklasse 1 2 3 4 5

Forstarnt А nCU^ w

SS TS В С Η

Forstamt В niVj) w

30 30 40 90 100

30 0 10 50 10

160 20 20 0 0

160 180 200 200 200

Median: Der Median U^ ^ = 4 ist - für das Forstamt A - die Merkmalsausprägung vierte Güteklasse (Güteklasse C). 90% des Holzaufwurfes ist von gleicher oder besserer und 60% von gleicher oder schlechterer Holzqualität. Für das Forstamt В ergibt sich analog V„ „ = 1, die 0, b beste Güteklasse (SS). 80% sind von der gleichen Güteklasse und 100% von der gleichen oder einer schlechteren Güteklasse. Der Median ist hier - wie so oft - von nur geringer Aussagekraft. Quart ilsabstand: q

A = U 0,75 " U 0.25 =

4

*

1

=

3

(Forstamt Α) ,

q

B = V 0,75 - V 0,25 =

1

*

1

=

0

(Forstamt B) .

Der Quart iisabstand für das Forstamt Α beträgt 3 Güteklassen (Merkmalsausprägungen), der für das Forstamt В 0 Güteklassen. Die Aussagekraft des Quartilsabstands ist grundsätzlich (fast immer) gering. Am Beispiel des Forstamtes Α besagt der Quart 1lsabstand, daß mindestens 50% der gefällten Kiefern (Merkmalsträger) Ausprägungen zwischen den Güteklassen SS und С aufweisen. Die Betrachtung der absoluten Häufigkeiten ist hier aufschlußreicher. Maß auf der Basis der Entropie:

I. Beschreibende Statistik

64

Arbeitstabelle 2: Forstamt A

A

J

A

1

A

?

s A

4

f

J.i

f

- f J.l

J.2

ldf

j.i

- f J,2

ld

f

j,2

H(Aj)

0,7

0,3

0,3602

0,5211

0,8813

0,7

0,3

0,3602

0,5211

0,8813

0,6

0,4

0,4422

0,5288

0,9710

0, 1

0,9

0,3322

0,1368

0,4690

Σ

-

-

-

4 Σ Η(Α,) = 3,2026, J j=l

S(U) =

3,2026

-

0 s S(U) ί к-1 = 4 .

Arbeitstabelle 3: Forstamt В

В. J

f

B

0,2

0,8

0,4644

0,2575

0,7219

0, 1

0,9

0,3322

0,1368

0,4690

0

1,0

0

0

0

0

1,0

0

0

0

1

B

J.i

f

j,2

- f j,i

ld f

ü.l

" f J,2

ld

f

J,2

H(Bj)

? B

1

B

4

Σ

-

-

S(V) = 1,1909 ,

-

-

1,1909

0 s S(V) s k-1 = 4 .

Für das Forstamt Α weist dieses Streuungsmaß eine relativ starke Streuung aus. Die Verteilung des Merkmals Güte des Forstamts В ähnelt eher einer Ein-Punkt-Verteilung als die entsprechende Verteilung des Forstamts A, da das Streuungsmaß wesentlich näher an der Untergrenze (S(U)=0), der empirischen Ein-Punkt-Verteilung, liegt. Kumulierte Häufigkeitsverteilungen: Siehe Arbeitstabelle 1!

Lösung 10 Komparatives Merkmal: Einstellung zur modernen Lyrik; Merkmalsträger sind die Studierenden der Studiengänge Betriebswirtschaftslehre und Germanistik. Es werden zwei Gesamtheiten betrachtet. Der Median ist ein geeignetes Lage maß und das Maß auf der Basis der Entropie ein Streuungsmaß zur Charakterisierung von Häufigkeitsverteilungen komparativer Merkmale. Die Spannweite wird hier nicht als Streuungsmaß verwendet, da sie in der Regel wenig aussagefähig ist. Im

1. Beschreibende Statistik

65

folgenden wird das oben definierte Merkmal mit U bezeichnet, wenn es sich auf die Betriebswirte bezieht und mit V, wenn die Germanisten gemeint sind. Arbeitstabelle 1

U

l'vi

fCUj)

1 2 3 4 5

0,024 0,049 0,244 0,244 0,439

fCVj)

w 0,024 0,073 0,317 0,561 1

W 0,378 0,635 0,905 0,973 1

0,378 0,257 0,270 0,068 0,027

Der Median U_ _ = 4 ist der Skalenwert 4 und V. _ = 2 ist der Skalenwert и,э u,o 2. Die Betriebswirte haben also im Mittel eine ablehnendere Einstellung zur modernen Lyrik als die Germanisten. Mindestens 5054 der Betriebswirte geben ihre Einstellung mit dem Skalenwert 4 oder schlechter und mindestens 50% mit 4 oder besser ал. Die Interpretation von V^ ^ erfolgt analog. Maß auf der Basis der Entropie Arbeitstabelle 2 V

U A

J

A

1

A

4

f

J.i

f

J.2

H( Aj )

f

J.i

f

J.2

H( Aj )

0,976

0,024

0,1633

0,622

0,378

0,9566

0,927

0,073

0,3770

0,365

0,635

0,9467

0,683

0,317

0,9011

0,095

0,905

0,4529

0,439

0,561

0,9892

0,027

0,973

0,1791

Σ

2,4306

-

-

2,5353

S(U) = Σ H(A.) = 2,4306 wobei J J=1 H( Aj ) = - tf J(1 id f J > 1 + f J > 2 l d f J > 2 ]; S(V) = 2,5353 , 0 a S(U),S(V) s k-1 = 4 . Die Streuung von V ist etwas stärker als die von U, beide Verteilungen weisen eine mittlere Streuung auf. D.h. es liegt weder eine empirische Einpunktverteilung (S(U),S(V)=0) noch die Konstellation ^ = f g = 0,5 (S(U), S(V)=4) vor.

66

l. Beschreibende Statistik

Lösung 11 Gegeben

ist

die

Verteilung

der

relativen

Häufigkeiten

von

hungszahlen (X=km/h). Merkmalsträger sind die in der Erhebung

Bezieerfaßten

PKW.

i 1 2 3 4

*i

f

100 130 150 über 150

0,253 0,492 0,193 0,062

i 0,253 0,745 0,938 1,000

+

Es ist approximativ Γ χ ( ξ ) =

)f

i/A(xi*·

Bei der Approximation des Anteils wird eine Gleichverteilung der Geschwindigkeiten der PKW in den Geschwindigkeitsklassen angenommen. Mit ξ = 110 (km/h) ergibt sich i=2 und F*(110) = F x (100) + (110-100)0,492/30 = 0,253 + 0,164 = 0,417 , so daß 1-0,417 = 0,583 = 58,3% der Autofahrer von einer solchen Regelung betroffen wären.

Lösung 12 a) Der quadrierte euklidische Abstand des Zentrallagers Verkaufsstelle Vj(i=l 5) ist definiert durch d 2 (z,v.) = ( x ^ x j ) 2 + ( y ^ )

2

Ζ

zur

i-ten

·

Die Summe (und damit auch die gesamten Transportkosten) 5 5 5 Σ d 2 (Z,V.) = Σ (x_-x.) 2 + Σ (y„-y,) 2 = 5-s 2 (x_) + 5-s 2 (y„) 1 X Z Y Z i=l 1=1 Z 1 i=l ist (sind) minimal, wenn x_ = χ = C

Σ χ.'g, i=l 1

und y_ = Υ = Z

Σ у,*g., i=l 1 1

η Σ g. = 1 (Minimaleigenschaft der Varianz bezüglich i=l des arithmetischen Mittels). mit

g. £ 0 1

und

Mithin sind χ = 8,4 und у = 9,8 (mit gleichen Gewichten g^ = 0,2 für i=l

5) die Koordinaten des optimalen Standorts von Z.

1. Beschreibende Statistik

b) In diesem Falle sind χ und у mit den Gewichten gj = 2/27, ^

67

= 3/27,

g 3 = 1/27, g 4 = 6/27 und gg = 15/27 zu berechnen. Damit sind χ = 10,0 Standorts von Z.

und

у

=

13,2

die

Koordinaten

des

optimalen

Lösung 13 a) Rechtwinkliges Koordinaten:

Koordinatensystem

Objekt

X

1 2 3 4 5

i

1,0 6,5 2,5 6,0 5,0

y

parallel

zu

den

Straßen;

i

1,5 3,0 6,5 10,0 9,0

b) Die Straßenentfernung zwischen zwei Kreuzungen i und j ist durch d(i,j) = |xi - Xj| + |y. - yjI definiert. Zum Beispiel ist d(l,2) = = Ii - 6,5| + |1,5 - 3,01 = 7 Entfernungs-/Koordinateneinheiten. Wenn zum Beispiel 1 Koordinateneinheit = 200 m, dann sind 7 Einheiten gleich 1,4 km. c) Die mittlere Entfernung der Feuerwehrwache (F) zu den Objekten 1 bis 5 soll minimal sein. d = I Σ|χ. - x p | + I Σ | Υ ι - Ур.| = d(Xp.) + d(y F )

min.

Die durchschnittliche Abweichung d^ib) bzw. dy(b) ist minimal für b = = x 0 > 5 bzw. b = y 0

5;

d.h. für x F = x 0

5

= 5 und у р = y ^

= 6,5.

Somit sind Xp. = 5 und Ур = 6,5 die Koordinaten der Feuerwehrwache. 5 5 d) d = d(x =5) + d(y =6,5) = | Σ |x -5| + g Σ |y,-6,5| = 1,8 + 2,9 = 4,7 h h i=l 1 i=l 1 Ent fernungse i nhe i ten. e) Das Ergebnis ändert sich nicht, weil der Median gegenüber Transformationen invariant ist.

monotonen

Lösung 14 Merkmal: Betriebszugehörigkeit in Jahren Merkmalsträger: Arbeitnehmer des Betriebs.

(X);

Merkmalstyp:

metrisch;

68

I- Beschreibende

a) χ =

Σ

Statistik

χ,·η, = 15 Jahre Betriebszugehörigkeit.

Wegen n(x=s9) = 10 = n/2 und п ( х Ы 1 ) = 10 = n/2 kann Jeder Wert zwischen 9 und 11 Median sein. Es ist vielfach Üblich, х л „ in der 0,5 Mitte eines solchen Intervalls, hier also mit x„ _ = 10 (Jahre BeU, о tri ebszugehör1gke11) festzulegen. b) s 2 = - Σ(χ,-χ)2η, = 0,05-3426 = 171,3 (Jahre)2 , η j 1 1 s = i/171,3 = 13,1 (Jahre) d(x. _) = - Σ|χ, - χ. _|·η, = 0,05*218 = 10,9 (Jahre). 0, Ь η ^ 1 0, ο 1 Bei asymmetrischen Verteilungen - wie dieser - sind häufig Median und durchschnittliche Abweichung vom Median geeignete Maße. Der Median ist von Extremwerten unabhängig, das arithmetische Mittel hingegen nicht, daher ist letzteres hier auch nicht unwesentlich größer. Die durchschnittliche Abweichung ist minimal bezüglich des Medians. Sie hat die gleiche Dimension wie der Median und ist leichter zu interpretieren als die Standardabweichung (Varianz).

Lösung 15 Hochsprungergebnisse und lOOm-Zeiten lassen sich schon aufgrund der unterschiedlichen Dimensionen (m, sec.) nicht einfach addieren. Bei Wettbewerben werden die Leistungen daher nach einem vorgegebenen Punkteschema bewertet und die in den einzelnen Disziplinen erzielten Punkte zum Gesamtergebnis zusammengezählt (statistisch problematisch!). Eine andere Möglichkeit besteht in der Standardisierung der Merkmale. Standardisierte Merkmale sind dimensionslos und somit addierbar. Sei

die erzielte Höhe im Hochsprung in m und Xg die lOOm-Zeit in

sec.; dann sind X X _X 1~ X 1 2 2 X* = — — - und X* = - = — 1 S 2 S 1 2

die beiden standardisierten Merkmale. Ein sinnvolles Maß für die Gesamtleistung

ist

(X*-X*). X· wird von X* abgezogen, weil eine geringere

lOOm-Zeit (X* negativ) besser zu bewerten ist als eine höhere. Die Gesamtleistung ist umso besser, je größer (X*-X*) ist.

χ

1

1 = η

n

1 Σ x,. = i (2,06+1,97+1,91+2,00+2,16) = 2,02 , Ii 5

i=1

1. Beschreibende Statistik

69

s2 = Σ (χ,.-χ,) 2 = ^Г(2,06-2,02) 2 + ... + (2,16-2,02) 2 1J = 0,00724, l n . . l l l b L 1=1

= + J s ^ = 4 0,00724' = 0,0851 ; 1 n 1 x„ = Σ x„. = ^(10,83+11,01+11,18+10,65+10,78) = 10,89 , Ζ η . , b 1=1 s 2 = - Σ (x^.-x-) 2 = if(10,83-10,89) 2 + ... + (10,78-10,89) 2 1 = 0,03436,

s 2 = +-ls| = -10,03436' = 0, 1854 .

Arbeitstabelle

Теi1nehmer i 1 2 3 4 5

X

li

2,06 1,97 1,91 2,00 2,16

X

2i

• _ Ii

10,83 11,01 11, 18 10,65 10,78

X

X

ü Sl

0,4700 -0,5875 -1,2926 -0,2350 1,6451

1

, *2i

X

2i X 2 s2

-0,3236 0,6472 1,5642 -1,2945 -0,5933

li

-

0 -1 -2 1 2

7936 2347 8568 0595 2384

X X *

X*

2i

Die beste Gesamtleistung erzielte somit der Teilnehmer Nr. 5.

Lösung 16

2

Merkmale: Umsatz in DM (Y) und Verkaufsfläche in m (X); metrisch, Beziehungszahlen; Merkmalsträger: Abteilungen.

Merkmalstyp:

Bei Beziehungszahlen ist das harmonische Mittel das geeignete Maß zur Berechnung von Durchschnittswerten, wenn die Gewichte (hier die Umsätze) und das Merkmal im Zähler der Beziehungszahlen (hier: Umsätze/Verkaufsfläche) übereinstimmen.

2 Mit b^ = Yj/Xj (Umsatz/m ) und hj = Yj/Σ y .

(Umsatzanteile) gilt

70

l. Beschreibende Statistik

Σ у. = 1190000,— DM (Gesamtumsatz), i Σ (yj/b^ = Σ x i = 987,5 m 2 (Gesamtfläche), 1 i so daß b„ = 1190000/987,5 = 1205,— DM/m2 der durchschnittliche Umsatz η 2 je m Verkaufsfläche ist.

Lösung 17 Merkmalsträger: η Strecke; metrisch;

=

5

Mantas;

Merkmale:

Benzinverbrauch,

gefahrene

Der Verbrauch je 100 km ist eine Beziehungszahl der Art b

= y = - L χ 100 km '

a) Ein spezieller Mittelwert für solche Beziehungszahlen ist das harmonische Mittel b = Η

η

mit den (gegebenen) Gewichten

.

ι=ι b i y

h. =

1

n i - — ь 0 , Σ h, = 1 ;

1=1

' ϊ j=l

dabei

J

ist h^ der Anteil des Jahresverbrauchs des 1-ten Mantas sun

Jahresverbrauch aller fünf Mantas. Arbeitstabelle

i

1 b

h

i

1 2 3 4 5

12,8 13,4 15,6 14,0 20,2

Σ

-

b

i

0,0781 0,0746 0,0641 0,0714 0,0495 -

i

k-s

0,2430 0,1696 0,1316 0,2215 0,2343

0,0190 0,0127 0,0084 0,0158 0,0116

1,0000

0,0675

/. Beschreibende Statistik

71

Somit ist 1 bHH = — = 14,8 α/100 km) . 0,0675 Die fünf Mantas haben verbraucht.

also

im Durchschnitt

14,8

1/100

km

b) Die Berechnung von Manni III wäre nur dann richtig, wenn die fünf Mantas in dem betreffenden Jahr alle die gleiche Fahrtstrecke zurückgelegt hätten, denn dann wäre Σ''

!

_ = bH .

V- ι Σ TT -hl i bi

Für die Gewichte h i galt: У1

h.| =

^

=

Σ УЗ : ten Mantas.

• fi

; dabei ist £

die Fahrtstrecke des i-

Σ bj · f, j

Unter der Bedingung gleicher Fahrtstrecken für alle Mantas, d.h. = f für i = 2, ... , n, ist h, 1

Z b j - f - Z b j j j Daraus folgt 1 V — fbi

1 h" 1

v i i bi

1 b

i Σ bj j

1

v i Zbj 5

1

j η Zb, 3

η

Lösung 18 Merkmale:

Fläche in km2

(X) und Bevölkerung

in 1000

Personen

(Y) ;

Merkmalstyp: der .

metrisch,

Beziehungszahlen;

Merkmalsträger:

In dieser Aufgabe werden drei Methoden zur Berechnung Mittelwertes von Beziehungszahlen vorgestellt.

Läneines

a) b = y/x = £ y i / £ x ± mit у = Bevölkerung und χ = Fläche. i i b = 24363/75 = 325 Einwohner/km2 . b) b = J] b ^ , arithmetisches Mittel mit den Gewichten, den i Flächenanteilen, gi = X i / Σ x j ·

:

72

I. Beschreibende Statistik b = ( 318 · 31 + 1 2 1 · 3 + 345 · 4 1 ) / 75 = 325 E i n w o h n e r / k m 2 . 1 ^

'hi

1

Gewichten



^

= yi /

Yj , h a r m o n i s c h e s

Mittel

(Bevölkerungsanteile).

Der M i t t e l w e r t b e t r ä g t in jedem Falle 325 Einwohner kilometer.

Lösung Σ

b)

den

= 2 4 3 6 3 / 7 5 i 325 E i n w o h n e r / k m 2 .

bH

a)

mit

Quadrat-

19 (xv - a) = Σ

1 xv - na = 0

=> n a = Σ ν

x

f(b) = - Σ

( x v - b)2 = - Σ ( x v - 2 x v b + b 2 ) .

5f(b) 5b

v

=> a = —n X x v V

= χ .

2 ! = - - Σ x v + 2b = 2(-x + b) = 0 η ^

=> b = χ

Lösung

je

.

20

Merkmale: (X) ;

gefahrene

Kilometer

(Y)

und Benzinverbrauch

Merkmalstyp: metrisch, Beziehungszahlen; Fahrt von В nach N u n d zurück.

in

Liter

Merkmalsträger:

eine

b = у / χ, bx

= 7,2 k m / 1 , b 2 = 12,0 k m / 1 ,

b =

j

Hier

ist

gleich!), bu

=

m i t hi = yi / Σ

hx = h2 = 1 / 2 so

: _L 1 7,2 ' 2

1 +

Vj

(die

·

zurückgelegten

Strecken

sind

daß 1 1 , : Γ = = = 9 km / 1 . jL I 0,0694 + 0,0417 0,1111 . 12 ' 2

Der A u t o f a h r e r fährt auf dem H i n - u n d Rückweg im Durchschnitt km m i t e i n e m Liter Benzin.

9

1. Beschreibende Statistik

73

Lösung 21 Merkmal: Vertreterprovisionen In DM; Merkmalstyp: metrisch; Merkmalstr&ger: Vertreter In den vier Bezirken. Die durchschnittliche Vertreterprovision 1st ein arithmetisches Mittel von Vertreterprovisionen (x^, 1=1,2,3,4), so daß 1

χ = П

-

k

Σ 1=1

χ,· η. 1

8946200/120 = 74552 (DM)

1

die durchschnittliche Vertreterprovision für das Handelsunternehmen und die Summe der Vertreterprovisionen gleich 8946200,— DM ist. Die Varianz der durchschnittlichen Vertreterprovisionen 2 1 Ϊ s = - Σ η 1=1

",2 2 (χ.-χ) ·η, = s . 1 1 ext.

wäre die externe Varianz der Vertreterprovisionen, d. h. die Varianz zwischen den Teilgesamtheiten (Bezirken).

Lösung 22

1.0P

0.80.6-

0.4 0.2Η

0.0

~r a

Τ

ζ

Jeder Wert zwischen a und b kann ein Quanti1 zur Ordnung ρ sein: a s χ л b; das gilt (natürlich) auch für ρ = 0,5 (Median).

74

1- Beschreibende

Statistik

Lösung 23 Komparatives Merkmal Punkte mit u^ e U., i=0,1

100.

Merkmalsträger sind die Studierenden, die ал der Wiederholungsklausur Statistik teilgenommen haben.

In

Zur Charakterisierung der Häufigkeitsverteilung (siehe Tabelle) komparativer Merkmale sind (unter anderem) die Quartile und der Median geeignete LagemaBe. Häufigkeitsverteilung/kumulierte

Punkte u

nCu

[j] 5 9 12 17 24 29

s

u(u[j]J 1

2 3 4 5

6

33 38 45 51 57 59

1. Quart i1

7

8 9 10 11 12

63

Median

13 14 15 16 17 18

66

75 76 79 81 83 84 85 90 94 η = 24;

[J]3

(absolute) Häufigkeiten

3. Quart 11

19 21

22 23 24 U

[j]'

J=1

·2'

,23 (eine Bindung der Länge 2).

n(57) = 1 besagt, daß ein Student in der Klausur 57 Punkte erzielt hat. 5^(57) = 1 1

bedeutet, daß 11 Studenten 57 Punkte oder weniger haben.

Der Median ist In diesem Beispiel eindeutig definiert (entweder

=

wie die Quartile auch nicht 59 Punkte oder u [ j 3 j = 63 Punkte

oder 60, 61 oder 62 Punkte). Daher ist es wohl besser, keitsverteilung zum Beispiel wie folgt zu charakterisieren: 25% (6) haben 29 Punkte oder weniger, 50% (12) haben 59 Punkte oder weniger, 75% (18) haben 81 Punkte oder weniger.

die

Häufig-

75

1. Beschreibende Statistik

W e n n bekannt wäre, daß die Klausur bestanden ist, w e n n zum Beispiel 50 Punkte oder mehr erzielt wurden, ließe sich die Durchfallquote (hier 9/24 =0,375=37,5% für diese Klausur bestimmen. Aus d e n oben genannten Gründen Quart iisabstand (q) zu bestimmen.

ist

es

auch

wenig

sinnvoll,

den

Das Streuungsmaß S(U) liefert hier auch keine zusätzlichen Informationen. Der oben angegebenen Verteilung der absoluten Häufigkeiten - die Merkmalsausprägungen verteilen sich relativ gleichmäßig auf den Wertebereich - läßt sich entnehmen, daß weder eine Ein-Punkt-Verteilung oder eine Tendenz zur Ein-Punkt-Verteilung (S(U)=0) noch die Konstellation f = f = 1/2 (S(U)=100) vorliegt. S(U) wird einen Wert zwischen 0 und 100 annehmen. Dieser Sachverhalt läßt sich auch aus der Tatsache ableiten, daß 101 Merkmalsausprägungen, 24 Merkmalsträger aber nur eine Bindung existiert.

Lösung 24 Mit

Hilfe

der Ungleichung

v o n TSCHEBYSCHEFF

läßt

s i c h der

Merkmalswerte, die das Intervall (x-cs, x+cs) enthält,

Anteil

der

(grob) abschätzen.

Beispielsweise ist f(73

s y = +-10,03436' = 0, 1854 ,

s2 = - Σ Ζ η ν ν

2

- ζ 2 = i · 1413,444 - 1 6 , 8 2 = 0,4488 5

s z = +-10,4488' = 0,6699 . D i e V a r i a t i o n s k o e f f i z i e n t e n n e h m e n folgende W e r t e an: ν χ = s x / - = 8,5088/202 = 0 , 0 4 2 1 , v γv = s„/γ у = 0,1854/10,89 = 0,0170 , v „ = s _ / - = 0,6699/16,8 = 0 , 0 3 9 9 . Ζ Ζ ζ Mit

den

von

der

Streuungsmaßen

ist

jeweiligen v.^ < v ^

Leistungsunterschiede (2)

Maßeinheit < νχ

unabhängigen

, so d a ß d i e

(relativen)

durchschnittlichen

im Hochsprung a m g r ö ß t e n sind.

Relative d u r c h s c h n i t t l i c h e

(absolute) Abweichung v , = d(x„ α и,о

,, и,о

W i r d die d u r c h s c h n i t t l i c h e Leistung mit Hilfe d e s M e d i a n s gemessen, ist v_j das geeignete relative Streuungsmaß. E s ist x_ _ = 200 , U, D y. „ = 10,83 U, о Z

0,5 =

16

und

'82 *

Arbeitstabelle

V

|x y -200|

|y v -io.83|

|z v -16,82|

1 2 3 4 5

6 3 9 0 16

0 0, 18 0,35 0, 18 0,05

0,76 0,06 1,22 0 0,42

Σ

34

0,76

2,46

90

1. Beschreibende Statistik Daraus ergibt sich: i · 34 = 6,8 э i · 0,76 = 0,152 ü z, 0,5

ν

i · 2,46 = 0,492 э

sowie ν . v = d ( x n „)/x n „ = 6,8/200 = 0,034 , α, X 0,5 0,5 V

d Υ

=

d(y

0 5)/y0 5

=

°·152/1°.83 = °·014 .

ν. = d(z. _)/z n „ = 0,492/16,82 = 0,029 , α, ί О, Ь 0,5 so daß

- wegen v . „ < v. „ < v . „ - wie zuvor die durchschnitt11d, Υ Λ,ί α, л chen Leistungsunterschiede im Hochsprung am größten sind. * Lösung 34 Merkmale: Durchmesser einer Welle, gefertigt von Dreher 1 CX), Durchmesser einer Welle, gefertigt von Dreher 2 CY); Merkmalstyp: Jeweils metrisch; Merkmalsträger: Jeweilige Wellen. Gegeben ist für Jedes Merkmal eine Häufigkeitsverteilung. Es ist zu überprüfen, inwieweit allein aufgrund dieser Informationen Aussagen über die Qualität der Arbeit der beiden Dreher getroffen werden können. Bevor man Aussagen über die Qualität der Arbeit machen kann, muß man vorab den Qualitätsstandard kennen und Qualitätskriterien festlegen. Bezogen auf das vorliegende Beispiel bedeutet dies, daß man zunächst wissen muß, wie groß der jeweilige Wellendurchmesser im Idealfall ist bzw. sein sollte (Sollwert) und - gegebenenfalls - wie groß die zulässige Toleranz ist. Es liegt aufgrund der gegebenen Werte nahe, auf die Sollwerte 50 mm bei Dreher 1 und 20 mm bei Dreher 2 zu schließen, doch ist dies keineswegs zwingend. Wenn diese Information vorliegen würde, wäre als nächstes ein geeignetes Qualitätskriterium festzulegen. Als Qualitätskriterien verwendet werden könnten beispielsweise: - Streuungsmaße (durchschnittliche Abweichung, Varianz, StandardabweΙο hung), - relative Streuungsmaße, - die größte absolute oder relative Abweichung in einer Richtung oder in beiden Richtungen.

1. Beschreibende Statistik

Allerdings müßten dabei die jeweiligen Differenzen nicht von einem Mittelwert) bestimmt werden.

vom

Sollwert

91

(und

Es müßte auch gewährleistet sein, daß die beiden Dreher a n gleichartigen Maschinen gleicher Präzision arbeiten und gleichartige Rohlinge (Material, Härte) verarbeiten. Schließlich müßte a u c h der Zeitfaktor und die Produktion v o n Ausschuß angemessen berücksichtigt werden. Da jedoch all diese Informationen fehlen, ist keine Qualität der Arbeit der beiden Dreher möglich.

Aussage

über

die

Lösung 35 Merkmal: Verlagsgröße, gemessen durch die Anzahl der Beschäftigten Verlag; Merkmalstyp: metrisch; Merkmalsträger: Verlage.

je

Vorbemerkung: Das Merkmal "Verlagsgroße" ist metrisch-diskret; trotzdem liegen die Werte in diesem Fall klassiert vor. Dies hat Auswirkungen auf die Bildung der Klassengrenzen und dies wiederum auf die Werte der Klassenmitten. Im folgenden werden die in der Aufgabe angegebenen Klassen insofern modifiziert, als die Klassenobergrenzen beibehalten werden und die Klassenuntergrenzen den Jeweiligen Obergrenzen der Vorklasse angepaßt werden (zum Beispiel wird die Klasse Nr. 2 "10 bis 19 Beschäftigte" transformiert in "über 9 bis 19 Beschäftigte"). Dies ist eine, aber keineswegs die einzige mögliche Anpassung der Klassengrenzen. Eine Alternative wäre zum Beispiel, die Klassenuntergrenzen beizubehalten und die Obergrenzen entsprechend zu modifizieren. a) Die Anzahl der Verlage mit mehr als 150 Beschäftigten k a n n nur approximativ mit Hilfe der approximierenden Verteilungsfunktion bestimmt werden. Arbeitstabelle i

X. 1

1 2 3 4 5 6 7

9 19 49 99 199 499 999

0,045 0, 106 0,228 0,392 0,576 0,775 0,891

8

5999

1,000

1) Festsetzung!

F'cs>

= i y V i >

+

(€-Va

}

F*( 150) = F x ( 9 9 ) + (150-99)

Й7Дπςγ -

3 1

^

1 0 0

f a l l s

< € * ^

:

= 0,392 + 51·0,001833 = 0,4855.

92

1. Beschreibende Statistik

Die Anzahl der Verlage mit mehr als 150 Beschäftigten beträgt also approximativ (1-ί·χ( 150)) ·η = (1-0,4855) ·311 = 160 (Verlage). 1

1

n

k

b) χ = ±

Σ χ = ± Σ χ.η. = 124297/311 = 399,67 = 400 (Beschäftigte n v=l " 1=1 1 1 Im Mittel).

c) Well

In der dritten Spalte der gegebenen Tabelle die

n

klassenspe-

zifischen Totalwerte x^n^ aufgeführt sind. d) Merkmal ist nun die Größe des Verlags, in dem die Beschäftigten tätig sind, gemessen durch die Anzahl der beschäftigten Personen (Χ'). X' ist metrisch. Merkmalsträger sind die im Verlagsgewerbe beschäftigten Personen. Die

Anzahl

der Beschäftigten

je Größenklasse,

also

die

absoluten

Häufigkeiten, sind durch x J n i = n^ gegeben (vgl. Teilaufgabe c). Es ist d, der Median des Merkmals X', also xl _ zu berechnen. u, ö Xg g kann hier nur grob abgeschätzt werden, weil dieser Wert in diesem

Beispiel

(Rand-)Klasse

(auch)

von

abhängt.

der

Festlegung

der

Wird diese Obergrenze

Obergrenze

mit 5999

der

(=x g )

8.

fest-

gelegt, ergibt sich, mit F^,(x^), der approximierenden Verteilungsfunktion für die beschäftigten Personen und 1=8, der Median x'Q g wie folgt. Arbeitstabelle i

X. 1

?X,(X.)

1 2 3 4 5 6 7

9 19 49 99 199 499 999

0,00069 0,00306 0,01323 0,04243 0,10518 0,26848 0,47178

8

5999 1 1

1,00000

1) Festsetzung! Δ(χ.)·η' X

0,5 = V i

+

I. Beschreibende Statistik

Ό, 5 = « » - (О, 5-0, 47178)

93

.

= 999 + 0,02822*9465,776 = 1266, so daß (approximativ) die Hälfte der Beschäftigten in Verlagen mit höchstens 1266 Beschäftigten arbeitet.

Lösung 36 Merkmale: Güteklasse des Eies einer Henne, die Standardkraftfutter erhalten hat (U), Güteklasse des Eies einer Henne, die neues Kraftfutter erhalten hat (V); Merkmalstyp: jeweils komparativ; Merkmalsträger: jeweilige Eier. Anmerkung: Da die Güteklassen aufgrund des Gewichts der Eier festgelegt werden, handelt es sich ursprünglich um metrische Merkmale, die jedoch in komparative Merkmale transformiert wurden. Man spricht in diesem Zusammenhang davon, daß die Merkmale "komparatisiert" wurden. Insgesamt hat die Produktion (im Mittel) um täglich 52 Eier = 2,08% zugenommen. Wesentlicher als diese geringfügige Zunahme sind jedoch die Qualitätsverbesserungen, die sich durch den Median (Güteklasse 4) und die Quartile (Güteklasse 3 und 5 bzw. 3 und 4) nicht angemessen beschreiben lassen. Informativer sind die kumulierten relativen Häufigkeiten F ^ U . ) bzw. F y (V ), j=l,2 7.

F^UjMOO j 1 2 3 4 5 6 7

Standardkraftfut ter 2 10 28 63 84 94 100

Fy(Vj)·100 neues Kraftfutter 5 19 44 79 94 99 100

Danach konnte zum Beispiel der Anteil der mittleren Tagesproduktion in der Güteklasse 1 um 150%, in den Güteklassen 1 und 2 zusammen um 90% und in den Güteklassen 1 bis 4 um rd. 25% gesteigert werden, während dieser Anteil in den Güteklassen 5 bis 7 um rd. 43% abnahm. Angesichts der gegebenen Daten ist die Berechnung des Streuungsmaßes S(U) bzw. S(V) entbehrlich; es sind keine wesentlichen zusätzlichen Informationen zu erwarten. Anmerkung: Die Frage, ob die Einführung der neuen Kraftfuttermischung ökonomisch sinnvoll ist, kann ohne Einbeziehung der Einkaufs- und Absatzpreise nicht beantwortet werden.

1. Beschreibende Statistik

94

Lösung 37 Hinsichtlich Merkmal, Merkmalstyp und Merkmalsträger vgl. Aufgabe 3 1 χ = η

*

Σ

1=1

2 " 2 - 2 . . ~ 2 1 ^ 2 χ, η,, s„ = χ - χ , mit χ = - Σ χ,η. . i i' Χ η 1=1 i i

a) Arbeitstabelle

i 1 2 3 4 5 6 7 8 9 10

X

i

n

2 i

X

V i

1 2 3 4 5 3 3 2 1 1

29,6 59,4 89,4 119,6 150,0 90,3 90,6 60,6 30,4 30,5

876,16 882,09 888,04 894,01 900,00 906,01 912,04 918,09 924,16 930,25

25

750,4

-

29,6 29,7 29,8 29,9 30,0 30,1 30,2 30,3 30,4 30,5

-

X

i

2 ini

876,16 1764,18 2664,12 3576,04 4500,00 2718,03 2736,12 1836, 18 924,16 930,25 22525,24

Damit ist χ = 750,4/25 = 30,016 (mm), s 2 = 901,0096 - (30.016) 2 = = 0,049344 (mm 2 ) und β χ = V s | = 0,222 (mm). b) Arbeitstabelle

i

1 2 3 4 5 6

-

x

i

n

i

29,60 29,75 29,95 30,15 30,35 30,50

X

ini

2 x.n. ι i

1 5 9 6 3 1

29,60 148,75 269,55 180,90 91,05 30,50

876,1600 4425,3125 8073,0225 5454,1350 2763,3675 930,2500

25

750,35

22522,2475

Damit ist approximativ χ = 750,35/25 = 30,014 (mm), s 2 = 900,8899 - (30.014) 2 = = 0,049704 (mm 2 ) und s

= V^f = 0,223 (mm).

95

1. Beschreibende Statistik

Durch die vorgenommene Klassierung ändern s i c h die Werte arithmetischen Mittels, der Varianz und der Standardabweichung geringfügig.

des nur

Lösung 38 Hinsichtlich Merkmal, Merkmalstyp und Merkmalsträger vgl. Aufgabe 3. a) Berechnung des exakten Wertes: Der

Median

(x^

ist der Wert,

Reihe der Merkmalswerte X

0,5

=

X

[ 13]

=

30



der

in der Mitte

in der aufsteigend

geordneten

steht

(bei

und das

ist

n=25)

( m m b

Berechnung mit Hilfe der approximierenden Verteilungsfunktion: Der Median liegt in der fünften Klasse zwischen x. = 29,95 und x_ = 4 о = 30,05. Somit ist X

0,5 = V i

+

(O.S-FjjCX^JUCx^

=

= 29,95 + (0,5-0,4)0,1/0,2 = 30,00 (mm). Berechnung mit Hilfe der gemäß 3 d) klassierten Werte: Der Median liegt in der dritten Klasse zwischen x^ = 29,85 und x^ = = 30,05. Somit ist approximativ x n „ = 29,85 + (0,5-0,24)0,2/0,36 = 29,994 (mm). U, э Dieses Beispiel zeigt, daß im allgemeinen bei Klassierungen mit zunehmenden Klassenbreiten die Linearitätsannahme immer weniger erfüllt ist und in der Folge daraus abgeleitete Maßzahlen immer stärker von den exakten Werten abweichen. b) Berechnung des exakten Wertes: d(x

1 0,5) = η

k

-

X

0.5lnl '

Mit χ . _ = 30,0 (mm) und k=10 ist d(30,0) = i=· (4,4) = 0,176 (mm). U, ö Zb Berechnung mit Hilfe der gemäß 3 d) klassierten Werte: Mit x_ _ = 29,994 (mm) und k=6 U, о ist d(29,994) = i=· (4,52) = 0,1808 (mm). Zur Interpretation vgl. Teilaufgabe a).

96

l Beschreibende Statistik

Lösung 39 Merkmale: Bruttoproduktionswert der Chemischen Industrie in einem westeuropäischen Land (X), Personalkosten der Chemischen Industrie in einem westeuropäischen Land (Y); Merkmalstyp: jeweils metrisch; Merkmalsträger: jeweilige Jahre. a) Beziehungszahlen b

= yVx.., t=1981,1982

Jahr t

1985.

b t (in %) 22,71 23,40 21,66 22,72 22,29

1981 1982 1983 1984 1985

1981 betrugen die Personalkosten der Chemischen Industrie in diesem Land 22,71% des Bruttoprodukt ionswertes, 1985 nur noch 22,29%. Allerdings ist keine einheitliche Entwicklung der Werte dieser Beziehungszahl von 1981 bis 1985 erkennbar-. b) Zeitliche Meßzahlen mit fester Basis t = 1981: о < 9 8 1 , t = X t / X 1981

bZW

· O

Arbeitstabelle

X

2 V

V

X

1 2 3 4 5 6

80 200 240 140 400 320

2700 3250 3500 3100 4000 3800

6400 40000 57600 19600 160000 102400

216000 650000 840000 434000 1600000 1216000

Σ

1380

20350

386000

4956000

V

x у

Daraus ergibt sich: у = 3391,667; χ = 230 , s ^ = 826000 - 780083,41 = 45916,59 , s^ = 64333,333 - 52900 = 11433,333 . Damit ist а

= 45916,59/11433,333 = 4,016

und

а

= 3391,667 - 4,016·230 = 2467,987 = 2468 .

Die Gleichung der ausgleichenden Regressionsgeraden ist somit Ϋ(Χ) = 2468 + 4,02 X . Der Wert a^ = 2468 (kg/ha) gibt den mittleren Hektar-Ertrag an, der bei den ausgewählten Feldern - auch ohne Zugabe von Düngemittel erzielbar ist (wenn die lineare Beziehung auch im Bereich 0 s χ < 80 gültig ist!). Der Regressionskoeffizient а = 4,02

bedeutet, daß 1 kg

Düngemittel im Durchschnitt (dieser linearen Beziehung) eine Ertragssteigerung von 4,02 (kg/ha) bewirkt. c) Aus b) folgt, daß zusätzliche Kosten in Höhe von 0,80 DM/ha (für 1 kg Düngemittel Je ha) im Mittel einen zusätzlichen Ertrag von a^ kg/ha, d.h. von 4,02-0,30 = 1,21 DM/ha bewirken. Somit ist - im Wertebereich des Merkmals X - der Düngemitteleinsatz ökonomisch sinnvoll.

1. Beschreibende

Statistik

125

d) Bei "globaler Gültigkeit" der oben bestimmten Regressionsgeraden könnte man bei einem Düngemitteleinsatz von 1500 kg/ha einen Hektar-Ertrag von Y( 1500) = 2468 + 4,02·1500 = 8498 (kg/ha) erwarten. Dieses Ergebnis ist jedoch völlig unrealistisch, weil der Zusammenhang zwischen der Menge des Düngemittels und dem Ertrag für höhere DüngernIttelgaben sicherlich nicht linear ist. Dieser Zusammenhang wird wohl dem klassischen Ertragsgesetz unterliegen, wonach - ab einer bestimmten Düngemittelmenge - der Grenzertrag abnimmt und bei extrem hohen Gaben negativ ist. Mit Ϋ(1500) = 8498 (kg/ha) wird also der zu erwartende Ertrag erheblich überschätzt.

Lösung 58 Merkmale: Anzahl der Beschäftigten (X), metrisch; Umsatz (Y), metrisch; Merkmalsträger: Betriebe (des Gewerbezweiges). a) Als (lineares) Zusammenhangsmaß für zwei metrische Merkmale ist sowohl der Korrelationskoeffizient als auch das Bestimmtheitsmaß geeignet. 2 2 S XY Bestimmtheitsmaß: г = 2 2 '

S

XSY

Korrelationskoeffizient:

S

XY

S

XSY

r =

Arbeitstabelle

ν

χ

1 2 3 4

1,5 3,6 2,4 0,5

400 500 200 100

Σ

8

1200

X = i η У = 1 η

ν

Σ

ν

ν

2 χ

2

600 1800 480 50

2,25 12,96 5,76 0,25

160000 250000 40000 10000

2930

21,22

460000

χ у ν

ν

ν

χ = 7 = 2, , ι/ 4

Σ у = ψ . = 300 . . ι> 4 ι>=1

s 2 = χ 2 - χ 2 = 5,305 - 4 = 1,305 , Sy = У 2 - У 2 = 115000 - 90000 = 25000 ,

ι Beschreibende Statistik

126

s„„ = - Σ x у XY η v'v ν

- xy = *

= I 2930 - 2-300 = 732,5 - 600 = 132,5 , = 17556,25 , 2 Γ

=

17556,25 1,305.25000 • ° - 5 3 8 132,5

und

= 0,734 .

•1,305-25000' 2 Das Bestimmtheltsmaß г = 0,538 gibt an, daß 53,8% der GesamtVarianz durch die Regressionsgerade erklärt wird, d.h., daß ein (relativ starker) linearer Zusammenhang zwischen der Anzahl der Beschäftigten und dem Umsatz besteht. Der Korrelationskoeffizlent gibt neben der Stärke auch die Richtung der linearen Beziehung an. In diesem Beispiel bedeutet das, daß zwischen der Anzahl der Beschäftigten und dem Umsatz ein positiver linearer Zusammenhang besteht. Der Umsatz steigt also mit zunehmender Anzahl der Beschäftigten. Dem Enkel gelingt es mit dieser Untersuchung sicherlich nicht, seinen Großvater zu überzeugen, da der Zusammenhang zwischen der Beschäftigtenzahl und dem Umsatz doch relativ stark ist.

Lösung 59 Merkmalsträger: Eruptionen des Geysirs (n=8); Merkmale: Dauer einer Eruption In min (X), Zwischenzelt in min (Y); Merkmalstyp: jeweils metrisch. Gegeben sind zwei metrische Merkmale, die Dauer einer Eruption in min (X) und die Zwischenzeit in min (Y). Zwischen beiden Merkmalen soll ein sehr enger (wechselseitiger) linearer Zusammenhang bestehen. Das bedeutet, daß sowohl X von Y als auch Y von X linear abhängen. Es gibt also (grundsätzlich) zwei sinnvolle Regressionsgeraden. a) Die gesuchte Regressionsgerade, aus der abgelesen werden kann, wie lang im Mittel die Zwischenzeit (Y) bei vorgegebener Eruptionsdauer (X) ist, ist Y(X) = а

+ а. Χ .

Ihre Parameter a Q und a^, die Regressionskoeffizienten, ergeben sich aus aQ = у - ax χ

und

aj = s ^ s *

.

1. Beschreibende Statistik

127

Arbeitstabelle

y

v

1 2 3 4 5 6 7 8

2,8 3, 1 3,9 4,9 1.4 2,2 4, 1 4,5

Σ

26,9

1 χ = η

у =

s

1

w ΧΥ

y

i>

2 V

2 i>

y

65 65 76 98 50 56 88 89

182 201,5 296,4 480,2 70 123,2 360,8 400,5

7,84 9,61 15,21 24,01 1,96 4,84 16,81 20,25

4225 4225 5776 9604 2500 3136 7744 7921

587

2114,6

100,53

45131

1 Σ χ =έ·26,9= , ν 8 ι>=1 Σ

,

y

ι = i η

η

3,3625 ,

χ 2 - χ 2 = i · 100,53 - 3.3625 2 = 1,2598 , ν 8

η

Σ

Ε

f

n

s2 = i Χ η -

X

1

i>= § ' ι>=1

5 8 7 = 73

- 375 ·

1 Σ xy - xy = 5· · 2114,6 - 3,3625 · 73,375 = 17,6016 , ν'ι> ' 8 ν=1

Somit ergeben sich a

i

a

о

=

1

ί τ 5 ϋ =

1 3

·9717

= 73,375 - 13,9717 · 3,3625 = 26,3952

als Parameter der ausgleichenden Regressionsgeraden und es ist Y(X) = = 26,3952 + 13,9717 X . Steigt die Eruptionsdauer (X) um eine Minute an, damn verlängert sich die Zwischenzeit im Durchschnitt um ca. vierzehn Minuten. Der Achsenabschnitt a Q läßt sich nicht sinnvoll interpretieren, da eine Eruption ohne Dauer keine Eruption darstellt. b) Durch Einsetzen von χ = 4,2 in die ausgleichende Regressionsgerade aus Teilaufgabe a) erhält man die (mittlere) Zeitdauer bis zum Beginn der nächsten Eruption: Ϋ(4,2) = 26,3952 + 13,9717 · 4,2 = 85,0763 (min). Die nächste Eruption ist zu erwarten um 10.15 Uhr + 85,1 min = 11.40 Uhr.

128

1. Beschreibende Statistik

с ) Das Bestimmtheitsmaß 2 г

2

S XY

ist

2

2

SX

SY

g e e i g n e t , d i e Stärke eines linearen g

Mit s 2 = Υ η 2

Σ

,

У 2 - У 2 = i · 45131 - 7 3 . 3 7 5 2 = 257,4844 ν 8

Γ

17,6016 2 1,2598·257,4844

d.h.

95,5% d e r V a r i a n z

=

sehr

starker

zu messen,

ist

=

'aoal

u



von Y bzw.

Regress ions geraden Y ( X ) ein

Zusammenhangs

X werden durch d i e

bzw. X ( Y ) e r k l ä r t .

wechselseitiger

linearer

Es l i e g t

ausgleichenden i n der

Tat

Zusammenhang zwischen

somit

den

b e t r a c h t e t e n Merkmalen v o r .

Lösung 60 Merkmale: A l t e r d e r S t r a f f ä l l i g e n zu zwei v e r s c h i e d e n e n Merkmalstyp: m e t r i s c h ; Merkmalsträger: S t r a f f ä l l i g e . Zur Lösung d e r T e i l a u f g a b e n a ) und b ) werden b e n ö t i g t : χ = - Σ χ , у = - Σ у η ν • η ν ν ρ s

2 Χ

1 _

2

-2

2

1

2

-2

= - Σ χ - χ , Ξ = - Σ у - у η ν Υ η ν ν ν

,

s ν „ = - Σ χ у - ху . ΧΥ η ι> ι> ν Arbeitstabelle

ν

χ

1 2 3 4 5 6 7

10 18 11 12 17 17 20

Σ

105

2 ι>

2

23 27 30 19 25 30 21

100 324 121 144 289 289 400

529 729 900 361 625 900 441

230 486 330 228 425 510 420

175

1667

4485

2629

χ

ν

χ у

Zeitpunkten;

1. Beschreibende Statistik

129

Damit ist χ

= |·105 =15, у = i-175 = 25 ,

s 2 = |·1667-152 = 13,1429 , s 2 = |·4485-252 = 15,7143 und s =

|·2629-15·25 = 0,5714 .

a) Korrelationskoeffizient nach BRAVAIS/PEARSON: S

r —

XY 0,5714 · . „_ = — о 04 s x -s y 3,6253·3,9641 '

Der Wert des Korrelationskoeffizienten ist positiv, aber derart klein, daß von einem wechselseitigen linearen Zusammenhang zwischen den Merkmalen X und Y keine Rede sein kann. Dies zeigt sich noch 2 2 etwas deutlicher beim Bestimmtheitsmaß. Aus r

= 0,04

= 0,0016 geht

hervor, daß der Varianzanteil, der durch die Regressionsgerade Y(X) bzw. X(Y) erklärt wird, nahezu Null ist. b) Parameter der Regressionsgeraden Y(X) = aQ+a^X: Es gilt a

l

= S

XY / S X

=

° > 5 7 1 4 / 1 3 · 1 4 2 9 = 0.0435 und

a Q = y-a^x = 25-0,0435· 15 = 24,3475 , so daß Ϋ(Χ) = 24,3475+0,0435 X ist. Für die Stelle X = 4 ergibt sich: Y(4) = 24,5 (Jahre). Die Berechnungen zu Teilaufgäbe b) sind aus verschiedenen Gründen unsinnig. Die Ergebnisse von Teilaufgabe a) zeigen nämlich, daß zwischen den Merkmalen X und Y keine lineare Beziehung existiert. Es ist somit nicht möglich, die (Werte der) Regressionsgerade(n) sinnvoll zu interpretieren: Y(X) = у. D m gilt natürlich auch für die Stelle X = 4, zu der anzumerken ist, daß eine erste einschlägige Fühlungsnahme mit der Polizei im Alter von X = 4 Jahren sehr unwahrscheinlich ist; zumindest sollte man daraus keinen Zusammenhang mit der ersten Freiheitsstrafe ableiten. Es kommt hinzu, daß der Wert X = 4 außerhalb des Stützbereichs der Regressionsgeraden liegt. Bereits aus diesem Grunde ist der Wert Y(X=4) = 24,5 Jahre nicht sinnvoll interpretierbar. Eine derartige Extrapolation ist angesichts der Sachlage nicht zulässig (vgl. Y(X) an der Stelle X=0).

130

1. Beschreibende Statistik

Lösung 61

Y(X) = a

о

+ a . X = 6 + 1 , 5 X ; χ = 12 , 1

Aus г 2 = a ^ l ^

folgt 0,92 = l,5»b

г = 0,9 .

und b j = 0 , 5 4 .

Aus Ϋ ( χ ) = у f o l g t Ϋ ( χ ) = 6 + 1 , 5 · 1 2 = 2 4 = у , b o = χ - Ь Х У = 12 - 0 , 5 4 · 2 4 = - 0 , 9 6 , s o d a ß X(Y) = b

0

+ b.Y = - 0 , 9 6 + 0.54Y 1

.

0

+ а , X u n d Χ ( Υ ) = b + b , Y . Da г = 0 , 7 , 1 o l

Lösung 62 Es 1 s t Y(X) = а 2

-

Ξγ = 16,0,

χ = 2 0 u n d у = 40 g e g e b e n

sind,

fehlt

zur

s 2 = 4,0, X Bestimmung

P a r a m e t e r v o n Y ( X ) und X ( Y ) n u r n o c h d e r Wert d e r K o v a r i a n z s ^ . läßt s i c h aus der Beziehung r =

S XY

der

Dieser

ableiten:

SXSY

Ξ χ γ = Γ · Ξ χ · Ξ γ = 0 , 7 · 2 , 0 * 4 , 0 = +5,6 ( p o s i t i v e r

Korrelationskoeffizient).

2 = s ^ s ^ = 5,6/4,0 = 1,4 ,

Damit i s t

Ьг = δχγ/Ξγ = 5 , 6 / 1 6 , 0 = 0 , 3 5 а

o

,

= y - a , x = 4 0 - 1 , 4 · 2 0 = 12 u n d l

bQ = x - b j y = 2 0 - 0 , 3 5 - 4 0 = 6 .

Lösung 63 Merkmale: A l t e r , termotorschiffe.

metrisch;

Tragfähigkeit,

metrisch;

Merkmalsträger:

Vorbemerkung: Da d i e beiden metrischen Merkmale Alter T r a g f ä h i g k e i t (X) k l a s s i e r t s i n d , können d i e zu b e r e c h n e n d e n nur a p p r o x i m a t i v bestimmt werden. a ) Zu b e r e c h n e n X(Y) = b

О

(Y) und Maßzahlen

ist:

+ b Y m i t b = χ - b y und b = s / s j . J. О X 1 AI Υ

Durchschnittliche

Tragfähigkeit:

1 k χ = - Σ χ. η. , η . , ι ii=l * = ^bbU ösö^ (200-530+700·1280+2000·850)

Gü-

= 1015,7895 = 1015,8 ( t )

.

1. Beschreibende

Statistik

131

*-*Α Durchschnittliches

Alter:

у = ^ggQ(10·510+30·620+50·670+70·630+90·230) Kovarianz: Es g i l t : 3

1 k = - ^

χ γ

1

Д ( х

г

х ) ( у

г

у ) п

= 45,86 = 45,9

η

и

к Σ

i=1

1 Σ

(Jahre).

χ. у η 1 j ij

J=1

-

xy

.

1 (200·10·60+200·30·60+200·50·170+200·70·200 + 2660 + 2 0 0 · 9 0 · 4 0 + 7 0 0 · 1 0 · 8 0 + 7 0 0 · 3 0 · 2 8 0 + 7 0 0 · 5 0 · 3 7 0 + 7 0 0 · 7 0 * 380 + + 700·90·170+2000·10·370+2000·30·280+2000·50·130 + + 2000·70·50+2000·90·20) - 1015,7895-45,8647 = 1 (102220000) - 46588,88068 = - 8 1 6 0 , 3 0 9 3 ( t · J a h r e ) . 2660

XY

V a r i a n z von Y: 2 SV

1 =

Ι

2

η

J-У

n

1 * .J = η Д

2 -

-2 У ·

Sw = ö F F n C 1 0 0 * 5 1 0 + 9 0 0 · 6 2 0 + 2 5 0 0 · 6 7 0 + 4 9 0 0 · 6 3 0 + 8 1 0 0 · 2 3 0 ) Y ^bbU =

7234000) -

Damit Ь1

=

2103,5707 = 615,9782

(Jahre2)

-

45,86472 =

.

ist S

XY/SY

bQ = χ -

=

~ 1 3 · 2 4 7 7 = -13,2

,

b ^ y = 1623,3913 = 1 6 2 3 , 4 u n d X ( Y )

= 1623,4 -

13,2Y .

D i e a u s g l e i c h e n d e R e g r e s s i o n s g e r a d e nimmt a n d e r S t e l l e Y=36 d e n W e r t X(36)

= 1623,4 -

Schiffe

13,2*36 = 1 1 4 8 , 2 ( t )

im M i t t e l

(approximativ)

an;

das b e d e u t e t ,

eine Tragfähigkeit

daß

36-jährige

v o n 1148,2

t

haben. b)

Das

Vorzeichen

der

beiden

Regressionskoeffizienten

g l e i c h und w i r d d u r c h d i e K o v a r i a n z kleiner als c)

-

2

1

s„ = Χ η

a^x

Folglich

und ist

a^

b^ wie

0.

Um d i e b e i d e n aQ = у -

bestimmt.

a^

Regressionskoeffizienten 2

und

к 2 Σ χ.η. i i·

a^ = s ^ y / s ^

-2

χ

berechnet

bestimmen z u können,

werden.

muß n u r

noch

ist bj

1. Beschreibende Statistik

132

Es ist X

= ^ t t (40000·530+490000· 1280+4000000·850) - 1015,78922 = 0) und es sich um äquidistante o n Beobachtungszeitpunkte (Quartale) handelt, kann der Durchschnittsbestand mit В В

ο,η

=

В η

geschätzt

werden.

Zugangs- und Abgangsfunktion zwischen zwei Zeitpunkten werden linear approximiert. 5

Bq ^ =

100+400+470+500+270 ^

„.... . , = 1740/4 = 435 (Patienten)

136

ι Beschreibende Statistik

Bei 600 B e t t e n ergibt s i c h eine mittlere Belegungsquote v o n 435/600 = = 72,5%, so cLelB die geplante Belegungsquote geringfügig überschritten wurde. В t κι Η ο.η ο.η b) d - λΖ—+( I-a)A— ο,η ο,η W e g e n B 4 - B q = 540 - 200 = 340 muß der Zugang um 340 höher s e i n a l s der Abgang. Mit λ = В / ( В +B.) = 200/740 = 0,27 ergibt s i c h aus о о 4 л - η 435»365 " " 7 " °,27.Z0i4+0,73.A0i4 0,27-ZQ

4

+ 0,73·AQ

4

'

^

= 22682 ist. Weil ZQ

4

= AQ

+ 340 ist,

folgt

daraus A - . = 22590 sowie Z„ „ = 22930. 0,4 0,4

Lösung 68 a) Zur Beantwortung dieser Frage ist festzustellen, wieviel Bücher Handapparat des Lehrstuhls im Jahresmittel angehörten. Durchschnittsbestand ergibt sich aus во

dem Der

вп

= _ 2~+Bl+B2+"'+Bn-l+2~ ti — ; ο, η η

95+202+212+242+125 _,„ ti — -„ = А1У , о, 4 4

d a keine Fehlmengen auftreten ( B Q , B n > 0 ) u n d es s i c h u m äquidistante Zeitpunkte (Quartale) handelt. Der Lehrstuhl erhält das Buch nicht sofort, da der Durchschnittsbestand v o n 219 Büchern über dem zulässigen Jahresmittel v o n 200 B ü c h e r n liegt. b) Die Schätzung der m i t t l e r e n Verweildauer hängt a u c h d a v o n ab, wie der Parameter λ festgesetzt wird. E s gibt keinen G r u n d anzunehmen, daß d

= d = d/2 u n d somit λ = 0,5 ist, zumal В = 190 kleiner als B„ = o n о 4 = 190+90-30 = 250 ist. Mithin ist der Parameter λ auf λ = В / ( В +B )= о o n = 190/440 = 0,4318 festzusetzen. В

D a m i t

ist

d

=

so d a ß s i c h befindet.

t о 4 о 4 219·4 ΛΖ .+(1-Ä)Α , = 0,4318-90+0,5682.30 o,4 o,4 ein Buch

im Mittel

etwa

15,7

=

15

Quartale

'67 ' im

Handapparat

1. Beschreibende Statistik

137

Lösung 69 Da die Mode 11 annahmen (Β , В sO; äquidistante Zeitpunkte, hier: Tage; lineare

Abgangsfunktion,

s.

Aufgabe) erfüllt

sind,

läßt

sich

der

Durchschnittsbestand wie folgt schätzen. 'ΕΙ В " в = 1 ο, η η^ • • • • • V r В _ = ο, ι ι

mit η = 7 Zeiträumen = Tage ,

150+280+. . . +50+0) =

I

= 180 [Flaschen],

Der Durchschnittsbestand in den 7 Tagen vor dem Klausurtermin beträgt 180 Flaschen Bier. Mittlere Verweildauer: Es ist А „ = N = 300, o,7 o,7

Б = 180 und o,7

t = 7 . o,n

N Aus Β = τ—'-— · d ergibt sich ο, η t ο, η τ d

Β ο,η 4 ο,η = "Ν ο, η

180·7 löö

1260 . _ r_ . 3ÖÖ = ' [Tage],

d.h. die mittlere Verweildauer (des Inhalts) einer Bierflasche beträgt 4,2 Tage.

Lösung 70 Überprüfung der Modellannahmen: -

Zwischen zwei Beobachtungszeitpunkten liegt Jeweils eine Woche, d.h. es handelt sich um äquidistante Zeitpunkte. В = 1000; В = B_ = 0, das bedeutet, daß keine Fehlmengen auftreten. ο η 7

Unter diesen Model1annahmen läßt sich der Durchschnittsbestand wie folgt schätzen:

В = i|4+B+...+B , Λ ο,η η 2 1 η-1 2

Βο

7

= |р^+980+860+. . .+20+0] =

= 441,43 = 441 [Mäuse] .

Der Durchschnittsbestand der weißen Mäuse beträgt in den sieben Wochen 441 Mäuse.

138

l- Beschreibende Statistik

Mittlere Verweildauer: Α

„ = Ν = 1000; В _ = 441; t = 7 [Wochen] . o, 7 o,7 ο, I 0,1

Aus В

N = j ^ · t ο, η

o.n

d

ergibt s i c h d = 4f\'JL = 3,09 [Wochen] . 1UUU

Die mittlere Verweildauer einer weißen Maus beträgt 3,09 Wochen. Die mittlere Verweildauer k a n n als Zeitraum, d e n die Mäuse im Mittel überlebt haben, interpretiert werden. Die Mäuse leben n a c h der Impfung also im Durchschnitt n o c h 3,09 Wochen.

Lösung 71 Die

Modellannahmen

"keine

Fehlmengen"

(BQ,Bn>0)und

"äquidistante

Beobachtungszeitpunkte" (Erfassung jeweils halbjährlich) sind erfüllt, Zuund Abgangsfunktion zwischen zwei Zeitpunkten werden linear approximiert, so daß der Durchschnittsbestand und die mittlere Laufzeit mit Hilfe des Fortschreibungsmodells geschätzt werden können. a) Durchschnittsbestand В

ο, b

= (0,5·Β +B.+Β„+Β_+Β.+0,5·Β_)/5 ο 1 £ J 4 b = 1000(200+500+320+380+440+260)/5 = 420000 D M (im betrachteten Zeitraum von 2 1/2 Jahren).

Der durchschnittliche Zeitraum 420000 DM.

Forderungsbestand

beträgt

im

betrachteten

b) Mittlere Laufzeit (für beidseitig offene Massen und λ=0,5) J

В

_

В t 2 В t o , n o,n _ o,n o,n = 0,5 Ζ +0,5 Α Ζ +X ' ο,η ο,η о,η о,η

_ = 420000 DM , о, 5

t „ = 5 Halbjahre (=2,5 Jahre = 2 Jahre 6 Monate), о, b Ζ Α -

d

_ = 6000000 DM, o, b 0,5

=B

о

+Z

„ - B c = о, 5 5

?·4?0000·5 = 6000000+5880000 =

400000 + 6000000 - 520000 = 5880000 DM. ° ' 3 5 3 5 Halbjahre = 2,121 Monate = 63,63 Tage (1 Jahr=360 Tage).

Die mittlere Laufzeit der Forderungen beträgt 2,121 Monate oder 63,63 Tage.

I. Beschreibende Statistik

139

с) Umschlaghäufigkeit U T = 1/d = 1/0,3535 = 2,8 (mal im Halbjahr) = 1/2,121 = 0,47 (mal im Monat). Im Mittel wird der Bestand an Forderungen 2,8 mal im Halbjahr bzw. 0,47 mal im Monat erneuert. Lösung 72 Sei d. die individuelle Verweildauer des j-ten Besuchers, J=l,2

1

2

3

4

5

6

7

Σ j

215

70

180

150

135

170

10

930

j

d . (in min): J

7 =

Die sieben Besucher bilden eine geschlossene Masse. Zwei Besucher (Nr. 3 und Nr. 6) gehen allerdings zweimal zu und ab. a) Gesucht ist

, die Anzahl der Besucher, die um 20.00 Uhr in der

Galerie anwesend waren. Um 20.00 Uhr anwesend waren die Besucher Nr. 1, 3, 4, 5 und 6. Somit iSt B

20.00 = 5 *

bj)

Die durchschnittliche Verweildauer je Besucher ergibt sich aus 7 1 d = rj-!— Σ d und beträgt ο,η j=l J

d = i · 930 = 132,9

min.

Das bedeutet, jeder Besucher hat min in der Galerie aufgehalten. b2)

sich im Durchschnitt rd. 2 h 13

Die durchschnittliche Aufenthaltsdauer je Zugang ergibt sich - bei neun Zugängen - aus

d = i a

7 Σ d. j=l J

und beträgt

d = i · 930 = 103,3 min.

140

l. Beschreibende

Statistik

Das bedeutet, Jeder Besucher hat Im Durchschnitt rd. 1 h 43 min nach seinem Eintritt die Galerie wieder verlassen. c) Die Zeitmengenfläche 1st wie folgt definiert: F

= t В = t ji— ο,η ο,η ο,η ο, η t Q n

N o,n Σ d, = j

N

=

o.n 7 Σ d. = Σ d J J=1 j=l J

= 930 Besucherminuten.

Sie ist also die gesamte Verweildauer aller sieben Besucher, d.h. die sieben Besucher der Eröffnungsveranstaltung haben sich insgesamt 930 min in der Galerie aufgehalten. Lösung 73 Der durchschnittliche Wachstumsfaktor beträgt

ι ^ 4* = 1 +

n-1ν

η

в5

*гл1

H I

= ^ 8 7 9 5 · = 1,55, so daß sich die Bakterien

um rd. 55% Je Tag (durchschnittliche prozentuale Wachstumsrate) mehrten.

ver-

Lösung 74 Mit t=l,2,... ,6 (Zeitpunkte), n-1 = 5 (Zeiträume), Xj = 5 0 0 0 0 , — DM und x6 = l , - D M i s t

- A5 g ö I 5 Ϊ" 1 ^ 4* = ö ö = 0,1149. ++ 71 - "Msööc

Damit ergibt sich: t

(Rest)Buchwert (DM) zu Beginn des Jahres t

1 2 3 4 5 6

50000,~ 50000, — · 0 , 1 1 4 9 = 5 7 4 5 , — 5 7 4 5 , - 0 , 1 1 4 9 = 660,10 660,10·0,1149 = 75,85 75,85-0,1149= 8,72 8,72-0,1149 = 1,—

Abschreibung (DM) im Jahre t-1 44255,— 5084,90 584,25 67,13 7,72

Abgeschrieben werden Jährlich 88,51% vom (Rest)Buchwert.

1. Beschreibende Statistik

141

Lösung 75 Zur Berechnung der mittleren Wachstumsrate Meßzahl M, _ durch Umbasieren zu bestimmen; 1,5 Mi neral ö 1verarbe 1 tung: Ma

5

ist

zunächst

Jeweils

die

= Mg s / » 2 j = 124,18/93,22 = 1,3321.

Vers i cherungsgewerbe: Μχ

5

= Mg g/Mg

χ

= НЮ/78,46 = 1,2745.

Daraus kann der durchschnittliche Wachstumsfaktor mittlere Wachstumsrate (η*) berechnet werden.

(1+η·)

und

die

Mineralölverarbei tung:

• 1 + И

4 . =

, 1,3321 = 1,0743, mittlere Wachstumsrate: 7,437. Je Jahr.

Vers1cherungsgewerbe: 1 + 1) = 1,2745 = 1,0625, mittlere Wachstumsrate: 6,25% je Jahr. Die mittlere Wachstumsrate der Bruttomonatsverdienste betrug im betrachteten Zeitraum in der Mineralöl verarbe i t ung 7,43% Je Jahr und im Versicherungsgewerbe 6,25% Je Jahr. Zur Bestimmung des Jahres mit dem größten Verdienstzuwachs Meßzahlen mit variabler Bezugszeit berechnet werden. t 1 2 3 4 5

Mi neralö1verarbe i tung 1,0727 1,0974 1,0656 1,0619

müssen

Vers i cherungsgewerbe 1,0614 1,0776 1,0564 1,0549

Das Jahr des größten Verdienstzuwachses gegenüber dem Vorjahr ist jeweils das Jahr t=3. Die Zunahme der Bruttomonatsverdienste von t=3 auf t=4 betrug 6,56% bzw. 5,64% . Lösung 76 a) Wert des Portefeuilles zum Zeitpunkt t^: 30325,6 DM, zum Zeitpunkt t : 31513,8 DM.

1. Beschreibende Statistik

142

315137? „ 1 0 1 g 4 1 0la4 30325,6 ' ·

" " ' • Μ

Die durchschnittliche Jährliche Wertsteigerungsrate des Portefeuilles beträgt 1,94%. b) Neuer Wert des Portefeuilles zum Zeitpunkt t ^ 30053,4 DM,



1 + η

2

=

3005374 д 30325,6 irnic с

=

и,ааэо .

Die durchschnittliche Jährliche Hertsteigerungsrate des Portefeuilles würde in diesen Fall -0,45% betragen.

Lösung 77

a) Gesucht ist M, _ . 1,9

Apotheker: M, „ = 1,099 ; 1, о Zahnärzte: ί^

5

= Mg g/Mg

χ

= 1,042 .

Die größte Zunahme ist also In diesem Zeitraum bei den Ärzten mit 14, 1% zu beobachten. b) Durchschnittliche Jährliche Wachstumsrate:

4

4 =

γ

Ärzte = +3,35'/., Apotheker = +2,39'/., Zahnärzte = +1,03'/. . Die Anzahl der Ärzte (Apotheker, Zahnärzte) stieg in diesem Zeitraum durchschnittlich um 3,35% (2,39%, 1,03%) pro Jahr.

Lösung 78 a) Um den EDV-Bereich zu bestimmen, für den die Ausgaben von 1986 bis 1990 prozentual am stärksten zugenommen haben, sind (zeitliche) MeBzahlen "86:90

= X

90

7 x

zu bestimmen.

86

143

1. Beschreibende Statistik

- Hardware (1); gegeben sind x^.-Werte. M ^ o n = 20700/16182 = 1,279 . Ob! aU Die Ausgaben für Hardware sind also um 27,95! gestlegen. - Hardwarewartung (2); gegeben zeit:

sind Meßzahlen mit

variabler Bezugs-

Μ = ν //ν "t-l,t t xt-l ' Es gilt: M(2)

86; 90

(2) . 86; 87

=

(2) . ^ 7 ; 88

(2) , ^ 8 ; 89

(2) = ^ 9 ; 90

= 1,099 · 1,079 · 1,067 · 1,069 = 1,353 so daß die Ausgaben für Hardwarewartung 35,3% gestiegen sind. - Software und Services Bezugszeit (1988): M(3)

X

88;t

t

X

(3);

,

im gleichen

Zeitraum

gegeben sind Meßzahlen mit

um

konstanter

88

(3) Die Meßzahl M„_ n n muß umbasiert werden: oo; oU м(3) = м(3) /Mi3) 86; 90 88; 90 ^ 8 ; 86 = 1,410/0,694 = 2,032 . D a sich die Ausgaben für diesen Bereich mehr als verdoppelt haben (+ 103,2%), sind die Ausgaben für diesen Bereich am stärksten gestiegen (Hardware: + 27,9%; Software und Services: + 35,3%). b) Die durchschnittliche niert: G =

^ Μ, =1 l,n

Jährliche

Wachstumsrate

ist

wie

folgt

defi-

+ η·

ist der durchschnittliche Wachstumsfaktor und rj* = G - 1 die durchschnittliche Wachstumsrate. Mit η = 5 ist

und M a

= Mg6

90

/· Beschreibende Statistik

144

Λ 4

1,279 = 1,063

, η·

1,353 = 1,079

, τι*2 = 0,079 ,

2,032 = 1,194

, η» 3 = 0,194

Λ ΛΙ 4

= 0,063 ,

Die durchschnittliche jährliche Wachstumsrate betrug also im Zeitraum von 1986 bis 1990 im Bereich Hardware 0,063 (= + 6,3%), Hardwarewartung 0,079 (= + 7,9%) und im Bereich Software und Services 0,194 (= + 19,4·/.).

Lösung 79 Es genügt, nur die vier Indizes zu a^) und a^) aus den in der Tabelle gegebenen Daten zu berechnen; die übrigen Indizes ergeben sich aus ( 1

1)P ' L t ,t о

(2)

(3)

Л

о

Ρ Ρ t,t

,t · P Q t,t

=1 о =

о

1

'

L p t ,t ' P Q t ,t = u t ,t = Л о о о

(4) u

t ,t · u t,t = о о

1

,t · P p t ,t о о

und

·

Die zu berechnenden Indizes sind zunächst:

а

a

1 ] I р1 9 = ^ 1 L 1,2 2

3 } L Q 1,2

P

^ j jlqj(1

und

I Po

1 = ^ ^

~ J, 2 j, 2

J

J

;qj.2pj.i

;qj.ipj.2 und

Л,:

=

sowie

5 q j.2 p j,2

Betrachtet man die Summen im Zähler bzw. Nenner dieser Indizes, so kann man feststellen, daß nur die vier in der folgenden Arbeitstabelle aufgeführten Summen berechnet werden müssen:

1. Beschreibende Statistik

J

P

J.2*J,1

P

P

J,l4J.l

P

J.14J.2

145

J,2qJ,2

1 2 3 4 5

1445 1040 54 464 396

1020 1080 72 320 352

1140 1215 80 400 352

1615 1170 60 580 396

Σ

3399

2844

3187

3821

Damit ist aj)

LPj

= 3399/2844 =

119,51·/.; das bedeutet,

daß der Warenkorb

Periode 1 (d.h. die in der Periode 1 bezogenen Grundstoffe) Periode 2 19,51·/. mehr kostet als in der Periode 1. L

P 2 ^ = 3187/3821

= 83,41%;

das bedeutet,

daß der

a

2} PP1 2

=

L2

1

1/ P

=

1/0

·8341

=

119,89·/.;

das

in der

Warenkorb

Periode 2 (d.h. die in der Periode 2 bezogenen Grundstoffe) Periode 1 16,59% weniger gekostet hat als in der Periode 2. bedeutet,

der

der

in der

daß

der

Warenkorb der Periode 2 in der Periode 2 19,89% mehr kostet als in der Periode 1. pP2

= 1/JPJ

г

2

= 1/1,1951 = 83,68%; das bedeutet, daß der Warenkorb

der Periode 1 in der Periode 1 Periode 2. a3) ^

=

3187/2844

=

112,06%;

16,32% weniger kostete als in der das

bedeutet,

daß

-

bewertet

mit

Preisen der Periode 1 - der Warenkorb der Periode 2 um 12,06% größer war als in der Periode 1. j^Qg j = 3399/3821 = 88,96%; das bedeutet, daß - bewertet mit Preisen der Periode 2 - der Warenkorb in der Periode 1 um 11,4% kleiner war als In der Perlode 2. =

a^) pQ^ 2

1

=

112,41%; das bedeutet, daß - bewertet mit Preisen

der Periode 2 - der Warenkorb der Periode 2 um 12,41% größer war als In der Periode 1. pQg j = 1 / ] ^ 2

=

89,24%; das bedeutet, daß - bewertet mit Preisen

der Periode 1 - der Warenkorb in der Periode 1 um 10,76% kleiner war als in der Periode 2. a

5)

U

t*P Q t t = 1,1951· 1,1241 = 134,34% o* o' bedeutet, daß das Unternehmen in der Periode 34,34% mehr ausgegeben hat als in der Periode 1. 1 2

=

LPt

(=3821/2844); 2

für

das

Grundstoffe

146

I- Beschreibende Statistik

ι

=

1/υι

1 für ode 2.

2

bedeutet, daß das Unternehmen in der Periode

=

Grundstoffe

25,56% weniger ausgegeben hat a l s in der P e r i -

Lösung 80 a) Der P r e i s von Gut 1 s t i e g um 0 , 2 5 DM oder um 1054, der P r e i s des Gutes 2 s t i e g um 13%, der von Gut 3 um 20% und der von Gut 4 um 5%. Preismeßzahlen sind wie f o l g t d e f i n i e r t : =

О

J=1,2

k

·

0,to

Somit i s t Mj = 2,75/2,50 = 1, 10 , M2 = 1,13/1,00 = 1,13 , M3 = 2,40/2,00 = 1,20 , M4„ = 2,52/2,40 = 1,05 . !

b) Natürlich i s t -

4

Σ M. = J J=1 diese Güter sind nur nachgefragten Mengen ( q j , Anmerkung: Seine Ausgaben

1,12,

aber die Ausgaben des Studenten für

unter bestimmten Bedingungen über j = l , 2 , 3 , 4 ) um 12% gestiegen. sind genau dann um 12% gestlegen, wenn

Еъл]-'·"^..."]

die

ist.

Da die P r e i s e p . . und p , . ( J = l , 2 , 3 , 4 ) bekannt sind, J,to J' Bedingung auch wie f o l g t formuliert werden:

kann diese

[2,75'qj+l,13-q2+2,40-q3+2,52'q4] = = 1, 1 2 [ 2 , S ' q ^ l . O - q ^ , 0 - q 3 + 2 , 4 - q 4 ]

.

Wenn die Mengen (q^) umgekehrt proportional den Preisen in t Q , also g l e i c h 1/p, . sind, i s t der Term l i n k s vom Gleichheitszeichen g l e i c h J' о dem Term r e c h t s vom Gleichheitszeichen (=4,48) und die Ausgaben sind um genau 12% gestiegen. Das Gleiche g i l t , wenn f ü r die Mengen q^ j e w e i l s das c - f a c h e (celR+) von 1/p, . e i n g e s e t z t wird. Die Ausgaben J' о des Studenten sind aber auch dann um genau 12% gestiegen, wenn ( c e t e r i s paribus) - zum Beispiel - q^ = 1 und q^ = 4 gesetzt wird.

1. Beschreibende Statistik

147

Das bedeutet, es gibt noch viele andere Kombinationen von q^-Werten (j=l,2,3,4), die zu einer Ausgabensteigerung von genau 12% führen. Da es aber ebenso (unendlich) viele Kombinationen von qj-Werten gibt, die zu einer geringeren oder stärkeren Ausgabensteigerung führen man braucht sich nur vorzustellen, daß das Gut mit der geringsten oder höchsten Preissteigerung besonders stark nachgefragt wird - kann ohne Informationen über die nachgefragten (bzw. verbrauchten) Mengen über die Höhe der Ausgabensteigerung nur spekuliert werden. c) Arithmetisches Mittel der Preismeßzahlen M.

.

J :

mit

den

Gewichten

ρ

V

. q, . o J* о

J,t

j 1 2 3 4

M 4

·^ο

2,50 1,00 2,00 2,40

Σ

-

2 1 3 5

5,0 1,0 6,0 12,0

-

24,0

J;to,t'pj,toqj,to 5,50 1, 13 7,20 12,60 26,43

Somit ist

=

5 pj,o.t0 j

=

= i^'26,43 = 1,10125 = 110,1% . Die mit den Mengen des ersten Monats gewichteten Preise sind im Durchschnitt um rd. 10,1% gestiegen. d) In c) wurden die Gewichte der Bezugszeit (tQ). nämlich

= ^PJ.tqJ.t

= g. . J'fco

Somit ist Μ

fc

J

* o'

verwendet.

= LPt

ein Preisindex nach LASPEYRES. o'

Lösung 81 Es sollen ein Preis- und ein Mengenverglelch (1982-1990) ausgewählter Güter auf der Grundlage der Mengen- bzw. Preisstrukturen von 1990 durchgeführt werden.

1. Beschreibende Statistik

148

Dafür geeignete Maßzahlen sind der Preis- bzw. Mengenindex nach ΡAASCHE, weil die Strukturen von 1990 verwendet werden sollen. a) Preisindex

„Po82,90 Ρ

*

P J.90

'

q J,90

*

P J.82

'

4J,90

=

7 J p,J >on Jч, IQn = 580,0 · 1 + 1,10 · 200 + 1,60 • 46 + Σ

+ 16,0 · 16 + 3,20 · 4 + 15,80 · 5 + 2,40 • 9 = 1243,0, 7 Σ Pj

82

q^

go

= 560,0 • 1 + 1,40 · 200 + 1,30 · 46 + + 18,0 · 16 + 1,80 · 4 + 13,80 · 5 + 1,70 · 9 = 1279,3.

Somit 1st PP82,90

=

1279! 3

= 0,972

= 97,2

54

'

Theobald kann keine Erhöhung seiner Bezüge fordern, weil die Preise für seinen aktuellen Warenkorb Im Zeitraum von 1982 bis 1990 um durchschnittlich 2,8% gesunken sind. b) Mengenindex 7 J 4j.90'Pj,90 р^г.эо

=

7 J 4 J,82' P j,90

7 ^ J , 9 0 Pj,90 •

1243'°

( S

'

0 )

'

7 Σ 4

J

j 82 P J 90

=

1

'

580>° +

120

' 1.10 + 32 • 1,60 + 10 · 16,0 +

+ 8 · 3,20 + 7 · 15,80 + 14 · 2,40 = 1093,0 .

Mithin i s t Ρ°82,90 =

*·137 =

113·7

*

1. Beschreibende Statistik

149

Theobalds Verbrauch an (bestimmten) GUtern des täglichen Bedarfs hat also - gemessen mit dem Mengenindex nach ΡAASCHE - um durchschnittlich 13,7 7, zugenommen.

Lösung 82 a) Für das Land Ε χ ist: 5 P j.t 4 J.t 0 l

V о

=

^ T V T j

=

5PJ.f8«J.to 3

4

°

^

J.tQ J,tQ

L P t o ,t+8 = j о

j

=

5 6 0 :

P j t q j t

j.tQ j,tQ

entsprechendes gilt für Eg· Somit ist die Zunahme des Preisindex von t auf t+8 durch P L — ρt ,t+8 gegeben. Der Preisindex für die Lebenshaltung ist folglich L t ,t о im Laufe von 8 Jahren im Land E 1 von 100 im Jahre t auf 560/340 =

= 1,647 = 164,754 im Jahre t+8 und im Land Eg etwas stärker, nämlich von 100 auf 289/172 = 1,68 = 168'/. gestiegen. Der Unterschied beträgt etwa 3,3/i-Punkte oder - bezogen auf E^ - rd.

b) Die durchschnittliche Jährliche Zunahme des Preisindex ergibt sich aus

8

L t ,t+8 -p-5 L t ,t о

ΛΙ

und beträgt für das Land Ε

^1,647 = 1,0644, also rd. 6,44*/., und für das Land E 2 :

^JTref = 1,067, also rd. 6,7% .

Lösung 83 Vorbemerkung: Aus Vereinfachungsgründen wird t

= 0 und t. = 1 gesetzt.

150

1. Beschreibende Statistik

Σ P 1 1Ч1 1 U (i) 1=1 J ' J ' 1 a) Ц1 ' = = rri u, l г u0

, i=l,2,3

(Tankstelle).

j=iPj-°4j·0 U^11 = 126900 + 131400 = 258300 (DM), = 141900 + 133000 = 274900 (DM), Uq1^ = 1,064 = 106,4%; (2)

Ug

(2)

= 227200 (DM),

Uj ' = 213600 (DM),

= 0,940 = 94,0%; Ug

f 41 1

U0

= 202900

(DM),

=

87>2%

0,872

=

Uj

= 177000

(DM),

·

Die Umsatzveränderung beträgt also bei Tankestelle 2 -6,0% und bei Tankstelle 3

1

6,4%,

bei

и(1)+и(2)

Ь1 Ub ) U 0, 1 -

(3) 1 1 . 1 - 665500 _ и ( 1 ) + и ( 2 ) + и ( 3 ) - 6884ÖÖ -

Tankstelle -12,8% .

0,967

_ - 96,7/· '

also Verringerung des Gesamtumsatzes um 3,3%. c ) Es g i l t : „(1) „(1) _(1) u 0, 1 = L 0, 1 P O, 1 ·

u m 0 u0,l daß Т Ш .

so

=

n(l) P O, 1

·

L 0,1 = 235800/258300 = 0,9129; somit 1st pQg 1 ] = 1,064/0,9129 = 1,166 = 116,6% . Die Umsatzsteigerung von 100% auf 106,4% (um 6,4%) i s t zurückzuführen auf eine (durchschnittliche) Preissenkung um rd. 8,7% (gemessen mit und eine Zunahme der Abgabemenge - in Preisen von t^ - um 16,6% (gemessen

mit p Q ^ j ) ·

I. Beschreibende

Statistik

151

Ebenso gilt: „(1) _ .(1) . p (1) 0, 1 - L 0, 1 Ρ 0.1*

„_» u o,1 _ -(1) ~ J I T - L 0, 1 · Ρ 0,1

so daß

pPg 1 ^ = 274900/301100 = 0,913; somit 1st l^c/l

=

1

· 0 6 4 / 0 · 9 1 3 = 1.165 = 116,5% .

In diesem Beispiel unterscheiden sich die beiden Ergebnisse nur sehr geringfügig. Es 1st nämlich j P ^ J = 0,9129 = pQp 1 ] = 1,166 =

= 0,913

und

= 1,165, so daß

die Zerlegung der Umsatzänderung in die Mengen- und Preiskomponente fast eindeutig ist. Das ist im allgemeinen jedoch nicht der Fall. Lösung 84 Gegeben sind Subpreisindizes vom Typ LASPEYRES. 1 L p t ,t = * A ; t ,t'«h;t о h=l о о .

aJ

mit

* «h;t = h о

1 :

^ ^ i t :

(1) _ 0, 07598» 1, 126+0,05812Ί, 216 _ L t , t, 0,13410 o l = 0,15622/0,1341 = 1,165 = 116,5% . Der Preisindex der Grundstoffe aus der Land- und Fischerei hat Im Zeitpunkt ^ den Wert 116,5%.

. J

tQ

(2) L t ,t, о 1

=

Forstwirtschaft,

0,57261 · 1,352+0,29329· 1,584 _ 0,86590

= 1,23874/0,8659 = 1,431 = 143,1 %.

Der Preisindex der Grundstoffe aus dem Produzierenden Gewerbe hat im Zeitpunkt tj den Wert 143,1%. c) L P t

t

= 0.1341-1,165+0,8659.1,431

о' 1

=

^

_

1 3 g 5 %

'

Der Gesamtindex hat im Zeitpunkt tj den Wert 139,5%. d) Zum Zeitpunkt t hatte der Gesamtindex den Wert 1,395/1,011 = 1,3798 = = 138,0% .

152

l. Beschreibende

Statistik

Lösung 85 Gegeben sind SubpreisIndizes vom Typ LASPEYRES. 1 9 L P t ,t = Λ L P h;t ,t'«h;t : h = 1 ' 2 ^auptgruppen). о h=l о о h

a)

®h.t о

1 2 3 4 5 6 7 8 9

0,26672 0,08746 0,13327 0,04913 0,10010 0,14753 0,04316 0,07873 0,09390

Σ

1,00000

L p (2u.4);t , t, o l

=

LPh;t ,t, о 1 1,064 1,094 1,064 1,033 1,068 1,051 1,080 1,034 1,094

L P 2;t , t, ,8 2;t o l о

Ρ

L h; t ,t_ 0 2 1,255 1,325 1,264 1,710 1,293 1,309 1,317 1,182 1,375

+

L P 4;t ,t.*g4;t . O l о

Mit g* = g2/(g 2 +g 4 ) = 0,64031 und g* = i 4 /(g 2 +g 4 ) = 0,35969 ist „i ^ = 1,094-0,64031 + 1,033-0,35969 = L (2u.4):t ,t. о 1 = 0,7005 + 0,3716 = 1,0721 . Entsprechend ist für t^ i. .. = 1,325-0,64031 + 1,710-0,35969 = L (2u. 4);t , ίο 2 = 0,8484 + 0,6151 = 1,4635 . Die durchschnittliche Preissteigerung für die Güter der Hauptgruppen 2 und 4 betrug also von t bis t. rd. 7,2% und von t o l 46,4%.

bis t_ rd. o

d

9 b)

P

L t ,t0 о 2

=

Σ

. . L P h;t ,t *gh;t h=l о 2 о

= 1,255-0,26672 + 1,325-0,08746 +...+ 1,375-0,0939 =

1,305 =

= 130,5%. Der Preisindex für die Lebenshaltung aller privaten Haushalte stieg also von t auf t_ um rd. 30,5% . о 2

1. Beschreibende Statistik

153

с ) Entsprechend 1st f ü r t^:

LPt . t , = Д L?h;t . t ' K - . t = 1'°647 о 1 h=l o l о so

daß

die

Preise

Lebenshaltung

von

der

^

bis

Güter t2

^

106 5

und

'*

'

Dienstleistungen

für

um (1,305/1,0647=1,226=122,6'/.)

die 22,6%

g e s t i e g e n sind.

Lösung 86 a ) Gesucht

ist

Festlegung

die Kaufkraftparität des

Warenkorbs

zwischen L und H, KP. „ . Je nach L, rl e r h ä l t man f ü r KP. unterschiedliche Lt Η

Werte: Fall

I:

Wahl des LASPEYRES

Warenkorbs von L,

d.h.

Kaufkraft pari t a t

vom Typ

5 Σ

L

_ J=1 L,Η 5

P1 J'

Η 4i Τ J'

=

7,15»1,5+3,09-3+1,08»20+1,94-3+1,72-5 _ 7,88-1,5+3,24-3+1,18-20+2,19-3+1,88·5

A • Sffi • ·.·» · Der Warenkorb von L hat in dem betrachteten Monat in L 61,11 DM g e k o s t e t , in Η dagegen nur 56,02 DM. Er hat damit in Η 5,09 DM weniger oder nur 91,66% des Betrages gekostet, den e i n d u r c h s c h n i t t l i c h e r P r i v a t e r Haushalt f ü r diesen Warenkorb in L zahlen mußte. Damit war - gemessen anhand des Warenkorbs von L - d i e K a u f k r a f t i n Η um 8,34% höher a l s in L. Fall

II:

Wahl des Warenkorbs von H, PAASCHE

d.h.

Kaufkraftparität

vom Typ

5 Σ

=

PL,Η

j=l 5

P

1

Η

J'

j i , "J.b

Der Warenkorb g e k o s t e t , in L 9,38% b i l l i g e r a l s in L, wenn

q

1

Η

J'

5

_ 7,15-4+3,09-2+1,08-5+1,94-10+1,72-3 _ " 7,88-4+3,24-2+1,18-5+2,19-10+1,88-3

J."

von Η hat In dem betrachteten Monat i n Η 64,74 DM dagegen 71,44 DM. Er war damit in Η um 6,70 DM oder a l s in L. Somit war d i e Kaufkraft in Η um 9,38% höher man den Warenkorb von Η zugrunde l e g t .

1 Beschreibende Statistik

154

Fall III: Wahl des durchschnittlichen Warenkorbs von L und H, d.h. Kaufkraftparität vom Typ LOWE Durchschnittlicher Warenkorb 1

2

3

4

5

2,75

2,5

12,5

6,5

4

J

5 p

KP

LOWE

L,Η

j.H 4 J,H

5

7,15·2,75+3,09·2,5+1,08·12,5+1,94·6,5+1,72·4 7,88*2,75+3,24-2,5+1, 18Ί2,5+2, 19·6, 5+1, 88·4

=

60

• 3 7 7 5 = ио 9110 66,275 -а11и ·

Der durchschnittliche Warenkorb hat in dem betrachteten Monat in Η 60,38 DM und in L 66,28 DM gekostet. Er war damit in Η um 5,90 DM oder 8,9% billiger als in L, d.h. die Kaufkraft war in Η auf der Basis des durchschnittlichen Warenkorbs um 8,9% höher als in L. b) Teilaufgabe a) hat gezeigt, daß das Ausmaß der Kaufkraftunterschiede zwischen L und Η von der Wahl des Warenkorbs abhängt. Um die Abhängigkeit von den Warenkörben der durchschnittlichen Privaten Haushalte der beiden Städte auszuschalten, kann die Kaufkraftparität auf der Basis eines "Standardwarenkorbs" berechnet werden. Man erhält dabei eine Kaufkraftparitat vom Typ LOWE, allerdings mit dem Unterschied, daß der durchschnittliche Warenkorb durch den Standardwarenkorb ersetzt wird. Wählt man als Standardwarenkorb den Warenkorb von B, erhält man

5 KP LOWE L,H|B

=

L j 1 5 Д

P

J.H 4 J.B

P

J.L 4 j,B

_ 7. 15·2+3,09·2+1,08·10+1,94·6+1,72·4 _ 49,80 7,88·2+3,24>2+1,18·10+2,19·6+1,88·4 54,7

= ü

>al04·

1. Beschreibende Statistik

155

Der Standardwarenkorb hat in dem betrachteten Monat in Η 49,80 DM und in L 54,70 Μ gekostet. Er war damit in Η um 4,90 DM oder 8,96% billiger als in L; auf der Basis dieses Standardwarenkorbs war damit die Kaufkraft in Η um 8,96"/. höher als in L.

Lösung 87 a) Zunächst sind die Kosten des Urlaubswarenkorbs der Familie Weckermann in allen drei Regionen zu bestimmen: 5 Σ

WD = Bu

Kρ, D

*q. = 32000*24+2000*42+800·10+85000·1+1950000-1 = j,Bu \j = 2895000(13$) ,

WD = Br

W„ H =

Σ

p. _ *q , = 55*24+3*42+3,5·10+480·1+8550*1 = 10511 (BF) J. Br 4 j

Σ p. *q = 10*24+0,7·42+1,1·10+120·1+2800*1 = 3200,40 (DM) . j = 1 J·" J

Setzt man diese Kaufkraftparitäten durchschnittliche Weckermann ersetzt

Wertgrößen paarweise in Beziehung, erhält man vom Typ LOWE für jeweils 2 Regionen, bei der der Warenkorb durch den UrlaubsWarenkorb der Familie wurde:

L O v A u . B r = 2 Ш Ш 0 = °'°036 =

LOWE

Br.Bu

KP LOWE

=

3200

=

2895000

Bu,Η

KP LOWE

Η,Bu

KP LOWE

Br,Η

LOWE^H.Br

2895000 10511

• 4 = оU >0011 UU11 2895000

3200,4

. 3200,4 10511

=

•«ffl

105114 3200,4

= 904 574 aü4 b 4 - '

=

=

°,JÜ4b

3

P)

·2843

Von besonderer Bedeutung für Familie Weckermann sind

die

Kaufkraft-

paritäten, bei denen ein Vergleich zwischen den Kosten in der Heimatregion und

in einer der beiden Urlaubsregionen angestellt wird.

Beispielsweise gibt

low;*^ Br

= 3,2843

(бй)

an

'

daß der Warenkorb

in

/. Beschreibende Statistik

156

Brulandie in BF das gion

kostet,

3,2843-fache des Betrags In DM in der

d.h. Urlaubskosten

in Höhe von

Heimatre-

100,— DM entsprechen

einem Betrag von 328,43 BF in Brulandie. b) Für die Entscheidung der Familie Weckermann ist der Vergleich zwischen Kaufkraftparitäten und Wechselkurs entscheidend. Wenn

1000 Busitanien-Dollar

Weckermann für 100,— DM

1,40 DM kosten,

dann erhält

Familie

. ю о = 71428,6 BS. Für Urlaubsgüter und

-dienstleistungen in einem Wert von 100,— DM müßte sie Jedoch 90457,4 B$ zahlen, d.h. die Kaufkraft beträgt in Busltanien für güter

und

-dienstleistungen

der

Familie

die Urlaubs71428 6 Weckermann nur g 0 4 g 7 ' ^ =

= 0,7896 der Kaufkraft in ihrer Heimatregion. Für

100,—

DM

erhält

Familie

Weckermann

·

100

=

303,03

Brulandie-Francs. Für Urlaubsgüter und -dienstleistungen im Wert von 1 0 0 , — DM müßte sie 328,43 BF zahlen. Mithin beträgt die Kaufkraft in Brulandie Weckermann

für nur

die Urlaubsgüter und 303 03 -„ ' .„ = 0,9227, O/LO , 4J

Wechselkursunterschiede

besteht

für

-dienstleistungen d.h.

nach

Familie

Urlaub in Brulandie ein Kaufkraftverlust

der

Familie

Ausschaltung

Weckermnn

bei

der

einem

von 7,73%, der allerdings

deutlich geringer ist als in Busitanien. Familie Weckermann wird daher in Brulandie Urlaub machen.

Lösung 88 Merkmal: Blutalkoholgehalt von Brause in Promille (Y), metrisch; Merkmalsträger: Zeitpunkte. a) Die Bestimmung des (linearen) Trends nach der Methode der kleinsten Quadrate ist wegen x^ = t^ gleichbedeutend mit der Bestimmung einer ausg1e i chenden Regress i onsgeraden. y. = m. + u. , ι ι ι m. = а + a.t. , i=l,2 ι о Ii

η .

1. Beschreibende Statistik

i

ο а

- τγ = — =

i

y

V i

2 i

1 2 3 4 5 6

5 6 7 8 9 10

3,15 2,98 2,87 2,69 2,53 2,36

15,75 17,88 20,09 21,52 22,77 23,60

25 36 49 64 81 100

9,9225 8,8804 8,2369 7,2361 6,4009 5,5696

Σ

45

16,58

121,61

355

46,2464

6-121,61-45-16,58 _ η = = -О,1566 ,

sT а

y

157

6-355-45

= у - a t = 2,7633 + 0,1566-7,5 = 3,9378 .

Damit

ist

пи

=

3,9378

-

0,1566·^

(1=1,2

6)

die

geschätzte

(ausgleichende) Trendgerade. b) Bestimmtheitsmaß 2 2 • • S TY 2 -0,4566 г = = 0,997 , 1,7078-0,2681 Τ Y d.h. durch die Trendgerade werden - in diesem Modellbeispiel - 99,7/i der Varianz von Y erklärt. c) Für t.,, = 19.00 Uhr ist m,„ = 3,9378 - 0,1566-19 = 0,96 (Promille), lo 1э so daß Brause sicherlich nicht rechtzeitig im Nachbarort erscheint, zumal noch die Fahrtzeit zu berücksichtigen ist. Dabei wurde davon ausgegangen, daß der Blutalkoholgehalt von 10.00 Uhr bis 19.00 Uhr linear, gemäß m^, abnimmt, eine Annahme, die nicht in jedem Falle gerechtfertigt ist.

Lösung 89 Merkmal: Anzahl der täglichen Arbeitsunfälle in einem Industriebetrieb (Y), metrisch; Merkmalsträger: Tage. а) y. m. ι

mj + u^ , i=l,2,. a + a.t, о Ii

i=l,2

η .

158

1. Beschreibende Statistik

Es ist (vgl. Arbeitstabelle): S

TY

21'3430-231-326

=

-3276 · =

21.3311 W

^

a Q = Ρ - a t t = 326+0,2026*231 · Damit

ist nij =

17,75

=

.

- ° '

2 0 2 6

·

1?>75

- 0,2026't^

die

geschätzte

(ausgleichende)

Trendgerade. m 1 = 17,55 und m 2 1 = 13,50 (vgl. Abbildung 1) sind die Schätzwerte der Anzahl der täglichen Arbeltsunfälle am ersten und 21. Tag. Arbeitstabelle .2

4

y

y

i

2 i

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256 289 324 361 400 441

24 18 14 10 25 9 8 26 16 14 9 25 9 7 27 19 15 10 24 10 7

24 36 42 40 125 54 56 208 144 140 99 300 117 98 405 304 255 180 456 200 147

576 324 196 100 625 81 64 676 256 196 81 625 81 49 729 361 225 100 576 100 49

231

3311

326

3430

6070

A

y

17 55 17 35 17 14 16 94 16 74 16 54 16 33 16 13 15 93 15 73 15 52 15 32 15 12 14 92 14 71 14 51 14 31 14 11 13 90 13,70 13 50

rmi=ui 6,45 0,65 -3, 14 -6,94 8,26 -7,54 -8,33 9,87 0,07 -1,73 -6,52 9,68 -6, 12 -7,92 12,29 4,49 0,69 -4, 11 10, 10 -3,70 -6,50 -

b) Restkomponente Aus

= m^ + Uj und m^ = a Q + a ^

u^ = y^ - т^ , i=l,2,...,n ; u^

(1=1,2

n) folgt

ist die (geschätzte) Restkomponente

(vgl. Arbeitstabelle und Abbildung 1).

1. Beschreibende Statistik

159

Anmerkung: Offensichtlich folgt diese Zeitreihe - wegen 2 2 7,4286 г = = 0,0313 - keinem linearen Trend. Entscheidend 6,0553*6,9325 ist hier die Saison-(Tages-)Komponente, die noch in der Restkomponente enthalten ist. Ein Modell der Art y t = m1 + s 1 + Uj , i=l,2,

.n ,

mit s^ als Saisonkomponente wäre hier angebracht! c) Wie aus b) hervorgeht, folgen die Arbeitsunfälle einem Wochenrythmus, so daß ein 7-gliedriger gleitender Durchschnitt (k=3) den Daten angemessen ist: y

i

= (у

1-3 +У 1-2 +У 1-1 +У 1 +У 1 + 1 +У 1+2 +У 1 + 3 )/7 *

Arbeitstabelle

y

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

i

24 18 14 10 25 9 8 26 16 14 9 25 9 7 27 19 15 10 24 10 7

У

y

i" y i -

15 15 15 15 15 15 15 15 15 15 15 16 15 16 16

4 7 4 4 3 3 3 1 3 7 9 0 9 0 0

-5,4 9,3 -6,4 -7,4 10,7 0,7 -1,3 -6,1 9,7 -6,7 -8,9 11,0 3,1 -1,0 -6,0 -

Am Anfang und Ende der Reihe gehen Je drei Werte verloren. Restkomponente: u^ = y^ - y^ (siehe Arbeitstabelle). Anmerkung: Auch hier zeigt sich - wie nicht anders zu erwarten war der überragende EinfluB der Saison-(Teiges-)Komponente, der nur durch ein Modell der Art

160

1. Beschreibende Statistik

= irij + s i + Uj , 1=1,2

η

erfaßt werden kann. Hinwels:

Die

Saison-(Tages-)Komponente

s ^

sT

, T=l,2

7,

läßt

sich zum Beispiel wie folgt schätzen. Zunächst

wird

aus den Werten u^

= y^

- y^

Tageskomponente" Je Wochentag Τ (T=l,2

die

7) bestimmt.

d

4 =

d

Do

=

[(-5,4) + (-6,1) + (-6,0)]/3 = -5,83

5

s "

5

Fr

=

(9,3 + 9,7) /2

= +9,50

=

ä

Sa

=

[(-6,4) + (-6,7)1/2

= -6,55

5

7 =

5

So

=

[(-7,4) + (-8,9)]/2

= -8,15

ä

l

=

5

Mo

=

[10,7 + 11,01/2

= +10,85

5

2 =

5

Di

=

[0,7 + 3, 11/2

= +1.9 ,

5

Mi

=

[(-1,3) + (-1,0)1/2

= -1,15

S

=

"durchschnittliche

Dann wird der Durchschnitt d = (d

Die

+d

+ . ..+d

geschätzte

sT = dT - d Zeitreihe geschätzte

)/7 = 0,08

berechnet.

Saison-(Tages-)Komponente

s^.

ergibt

sich d a n n aus

(derart justiert ist Σ s T = 0 ) , so daß mit y^, - s T

(der y^)

wie

folgt

Restkomponente

"saisonbereinigt"

werden kann.

ergibt sich aus u_ = y_ - s_ - y_ .

die Die

1. Beschreibende Statistik

161

Arbeitstabelle

Aus

Τ

Wochentag

y*j·

S

1 2 3 4 5 6 7

Mo Di Mi Do Fr Sa So

24 18 14 10 25 S 8

10 1 -1 -5 9 -6 -8

77 82 23 91 42 63 23

13 23 16, 18 15, 23 15, 91 15 58 15, 63 16 23

0 -0 0 0

51 12 23 83

1 2 3 4 5 6 7

Mo Di Mi Do Fr Sa So

26 16 14 9 25 9 7

10 1 -1 -5 9 -6 -8

77 82 23 91 42 63 23

15 23 14, 18 15 23 14, 91 15 58 15 63 15 23

-0 -1 -0 -0 0 -0 -0

07 12 07 19 28 07 67

1 2 3 4 5 6 7

Mo Di Mi Do Fr Sa So

27 19 15 10 24 10 7

10 1 -1 -5 9 -6 -8

77 82 23 91 42 63 23

16 17 16 15 14 16 15

0 1 0 -0

23 28 23 09

der

Arbeitstabelle

geht

yT

T

Ут

23 18 23 91 58 63 23

hervor, . daß

-

wie

erwartet

-

die

Zeitreihe durch eine starke Saison-(Tages-)Komponente gekennzeichnet ist (zum Beispiel s 1 = +10,77, Montag; s ? = -8,23, Sonntag). Die saisonbereinigte

Reihe

variiert

nur

noch

im

Intervall

[13,23;17,18], die Restkomponente u^ enthält nur noch "irreguläre" Schwankungen (vgl. auch Abbildung 2).

162

1. Beschreibende Statistik

1. Beschreibende Statistik

Abbildung 2

>-

163

164

1. Beschreibende Statistik

Lösung 90 Merkmal: (durchschnittliche) Eigenkapitalquote der Unternehmen Bundesrepublik Deutschland (Y), metrisch; Merkmalsträger: Jahre.

In der

b) Linearer Trend nach der Methode der kleinsten Quadrate: y i = mi + u i > mi = a Q + a j t j , 1=1,2

n,

t 1 = 1967; t 2 = 1968;... Anmerkung: Aus Vereinfachungsgründen 1st eine 1 ine are Transformation der äquidistanten Zeitpunkte sinnvoll: t^ = h C ^ - t ) , 1 t = η 4

n

Σ

i=1

t

1

1=1,2

η, η = 15, h = 1,

1 = ·== 29610 = 1974, 15

= t . - 1974, d.h. t l = -7, t 2 = -6

Es g i l t :

t 1 5 = +7 .

I. Beschreibende Statistik

165

Arbeitstabeile

Vi

ti -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 Σ

ti

31, 4 30, 6 28, 4 26,7 25, 9 24, 6 24,0 23,7 23, 7 23, 1 22, 9 22, 4 21,7 19, 8 18,7

0

367,68

У1

-219,8 -183,6 -142,0 -106,8 -77,7 -49,2 -24,0 0 23,7 46,2 68, 7 89, 6 108,5 118, 8 130,9 -216,7

tf

yf

49 36 25 16 9 4 1 0 1 4 9 16 25 36 49

985,96 936,36 806,56 712,89 670,81 605,16 576,00 561,69 561,69 533,61 524,41 501,76 470,89 392,04 349,69

280

9189,52

Somit ist ai = - 216,7/280 = -0,77393, αό = 367,6/15 = 24,51, so daß mi = 24,51 - 0,77393 t- . Rücktransformation: %

= 24,51 - 0,77393 (ti - t) = = 24,51 - 0,77393 (ti - 1974) = = 1552,2 - 0,77393 ti

(linearer Trend),

iri! = 29,9, m 1 5 ^ 19,0 (siehe Abbildung) . c) Eine geeignete Maßzahl ist das Bestimmtheitsmaß r 2 . Es ist n - Z t i

г 1 η 1L =

У±

-

9 erfüllt ist? b) Stellen Sie die zu a) gefundene Beziehung graphisch dar und kommentieren Sie die Graphik! Aufgabe 50 Für ein neu entwickeltes Mittel gegen Fußpilz wird vom Hersteller angegeben, daß es mit einer Wahrscheinlichkeit von π = 0,85 zum Behandlungserfolg führt. In einem klinischen Großversuch werden 800 zufällig ausgewählte Personen damit behandelt. Wie groß ist die Wahrscheinlichkeit dafür, daß höchstens 82% der Behandelten vom Fußpilz befreit werden, wenn die Behauptung des Herstellers richtig ist? Aufgabe 51 Man nimmt an, daß die Anzahl der zwischen 13.55 Uhr und 14.00 Uhr an der Kasse eines Supermarkts ankommenden Kunden POISSONverteilt ist. Es wurde festgestellt, daß in diesem Zeitabschnitt im Mittel 3,5 Kunden eintreffen. Wie groß ist die Wahrscheinlichkeit dafür, daß in diesem Zeitabschnitt a) keine Kunden, b) mehr als drei Kunden, c) mehr als einer, aber weniger als fünf Kunden an der Kasse ankommen? Betrachtet werden nun 30 zufällig und mit Zurücklegen ausgewählte Arbeitstage. Welcher Verteilung folgt die Anzahl der Zeitabschnitte (zu je 5 min.), in denen keine Kunden an der Kasse eintreffen? Aufgabe 52 In einer Mensa wird regelmäßig Suppe mit Einlage angeboten. Bei der Zubereitung werden der Grundsubstanz 500 Fleischstückchen zu je etwa 5 g zugegeben und gut umgerührt, so daß sich 125 1 Suppe ergeben. Dann

187

2. Schließende Statistik

werden - tinter ständigem Umrühren - P o r t i o n e n zu j e einem v i e r t e l ausgegeben.

Liter

Bestimmen S i e d i e Wahrscheinlichkeit d a f ü r , daß s i c h i n e i n e r P o r t i o n a ) k e i n und b) mehr a l s d r e i Fleischstückchen b e f i n d e n . Was ergäbe s i c h Fleischstückchen

zu a ) , wenn an einem enthielten?

Tage

die

125

1 Suppe

nur

400

Aufgabe 53 Luxus-Student Brause, 29, kauft s i c h von seinem durch Z e i t a b l a u f s e l b s t v e r d i e n t e n Taschengeld einen vornehmen D i p l o m a t e n - K o f f e r mit Kombinat i o n s s c h l o ß zum Transport s e i n e r S k r i p t e n . Nach wenigen Tagen hat e r d i e Nummer des Kombinationsschlosses vergessen; e r weiß nur, daß d i e Nummer 4 - s t e l 1 i g i s t , d i e Z i f f e r n 1, 8 und 2 vorkommen und e i n e Z i f f e r 2 mal vorkommt. W i e v i e l Z i f f e r n f o l g e n muß er höchstens durchprobieren, b i s e r seinen K o f f e r ö f f n e n kann?

Aufgabe 54 Bestimmen S i e d i e Wahrscheinlichkeit d a f ü r , daß beim g l e i c h z e i t i g e n Werfen von z w ö l f i d e a l e n Würfeln j e d e Augenzahl genau zweimal vorkommt!

Aufgabe 55 Herta, 29, Studentin der T r o p h o l o g i e im 16. Fachsemester,sorgt f ü r den Winter vor und k o n s e r v i e r t Obst und Gemüse in Kilo-Dosen. An einem s t a r k e n Wochenende s c h a f f t s i e 60 Dosen: 25 Obstkonserven (10 Kirschen, 10 Pflaumen, 5 Birnen) und 35 Gemüsekonserven (15 Bohnen, 10 Erbsen, 5 Rote B e e t e , 5 Tomaten) und s t a p e l t s i e z u f ä l l i g und l i e b e v o l l im K e l l e r . A l s s i e im Winter ans Eingemachte geht, muß s i e f e s t s t e l l e n , daß s i e vergaß, d i e Dosen zu e t i k e t t i e r e n . Wie groß i s t d i e Wahrscheinlichkeit dafür, daß s i e z u f ä l l i g genau d i e b e n ö t i g t e n Dosen ihrem Bestand entnimmt, wenn s i e f ü r e i n S p e z i a l g e r i c h t a ) genau 3 Dosen Rote Beete, b ) 2 Dosen Kirschen, 2 Dosen Bohnen und 1 Dose Tomaten braucht?

Aufgabe 56 Bei der Ausarbeitung eines Vortrages bedient sich nachfolgenden "halbautomatischen S c h n e i l f o r m u l i e r s y s t e m s Broughton".

Brause des nach P h i l i p

"Wer e i n e F l o s k e l sucht, mit der er s e i n e Zuhörer oder Leser b e e i n drucken oder einschüchtern kann, der denke sich eine beliebige

188

2. Schließende

Statistik

dreistellige Zahl und suche sich nach ihr aus der Tabelle die Elemente seiner Imponiervokabel zusammen; zum Beispiel 759: "synchrone Flukt uat i onskont i ngenz". 0. 1. 2: 3. 4. 5. 6. 7. 8. 9.

konzentrierte integrierte permanente systematisierte progressive funktionelle orientierte synchrone qualifizierte ambivalente

0. 1. 2. 3. 4. 5. 6. 7. 8. 9.

0. 1. 2. 3. 4. 5. 6. 7. 8. 9.

FührungsOrganisat ionsIdentifikationsDr i ttgenerat i onsKoalitionsFluktuationsÜbergangsWachstumsAktionsInterpretations-

-struktur -flexibilität -ebene -tendenz -Programm i erung -konzeption -phase -potenz -Problematik -коntlngenz

Quelle: Wolf Schneider, Deutsch für Profis, Hamburg 1984, S.27 a) Wieviel (unterschiedliche) System ableiten?

Imponiervokabeln kann Brause aus

diesem

b) Wie groß ist die Wahrscheinlichkeit dafür, daß er zufällig die Imponiervokabel "permanente Interpretationsproblematik" konstruiert? Aufgabe 57 Welche der folgenden vier Tabellen können als Tabellen bedingter Wahrscheinlichkeitsfunktionen interpretiert werden? a)

\X2 X

11

X

12

X

c)

13

\X2 l\ X

11

X

12

X

13

b) X

21

x

22

\ x„ xx V i \

0,8

0,2

X

0,5

0,6

11

X

0,3

0,2

12

X

X

x

13

X

21

X

22

0,3

0,7

0,9

0,1

0,5

0,5

d) 21

22

\

X

2

0,2

0,1

0,2

0,2

X

12

0,1

0,2

X

13

x

n

X

21

X

22

0,3

0,3

0,2

0,2

0,5

0,5

2. Schließende Statistik

189

Aufgabe 58 Zu welcher der vier in Aufgabe 57 genannten Tabellen gehören stochastisch unabhängige Zufallsvariable Xj und X^? Geben Sie die Werte von zwei zugehörigen gemeinsamen Wahrscheinlichkeitsfunktionen an!

Aufgabe 59 Welche der vier in Aufgabe 57 genannten Tabellen können als Tabellen gemeinsamer Wahrscheinlichkeitsfunktionen interpretiert werden?

Aufgabe 60 Ein Unternehmen hat 689 Mitarbeiter, die sich wie folgt auf die einzelnen Unternehmensbereiche verteilen:

Unternehmens- X^Geschlecht bereich

männlich

weiblich

Verwaltung Produktion Absatz

24 314 27

12 261 51

a) Zur Organisation des jährlichen Betriebsausflugs wird ein Mitarbeiter zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit dafür, daß a^) der Mitarbeiter in der Produktion arbeitet? a^) der Mitarbeiter weiblich ist? a^) der Mitarbeiter in der Produktion arbeitet und weiblich ist? b) Bestimmen Sie die Wahrscheinlichkeit dafür, daß ein zufällig ausgewählter Verwaltungsmitarbeiter männlich ist! c) Bestimmen Sie die Wahrscheinlichkeit dafür, daß eine ausgewählte Mitarbeiterin im Bereich Absatz tätig ist!

zufällige

d) Hängt die Aufteilung der Mitarbeiter auf die einzelnen Unternehmensbereiche vom Geschlecht ab oder nicht?

Aufgabe 61 Nach dem dritten (vergeblichen) Versuch, das Vordiplom in Statistik zu erwerben, macht sich Brause selbständig. Er versucht, sich als Glücksspieler eine sichere Existenz aufzubauen. Wohlgerüstet mit dem Instrumentarium der Wahrscheinlichkeitstheorie bietet er gegen einen Einsatz von Jeweils 1 , — DM die beiden folgenden Spiele an:

190

2. Schließende Statistik

a) Würfeln mit 4 (idealen) Pfennigen ausbezahlt.

Würfeln.

Das

Produkt

der

Augen

wird

in

b) Würfeln mit 4 (idealen) Würfeln. Die 8-fache Summe der Augen wird in Pfennigen ausbezahlt. Müßte sich Brause um seine Zukunft sorgen? Aufgabe 62 Die

zweidimensionale

Verteilung

Zufallsvariable

(X^,)^)

besitze

die

folgende

(Wahrscheinlichkeitsfunktion): \X2 1 2

1

2

3

0,1 0,1

0,3 0,1

0,2 0,2

Bestimmen Sie a) den Erwartungswert und die Varianz von Xj und X^, b) den Erwartungswert und die Varianz sowie die Verteilung der Summe X

1

+

X



c) den Erwartungswert und die Varianz sowie die Verteilung des Produkts V

V

Aufgabe 63 Geben Sie zu Aufgabe 17 a) scheinlichkeitsfunktion an!

und

b)

die

Jeweils

zugehörige

Wahr-

* Aufgabe 64 Die stetige zweidimensionale Zufal1svariable gerneinsame Wahrscheinlichkei tsdichtef unkt ion: Г x+y , f

X,Y

(x,y)

=

Ι (_ 0

(X,Y) habe die

folgende

falls 0 s x, у s 1 sonst .

Sind X und Y stochastisch unabhängig? Aufgabe 65 Eine Kaffeerösterei bietet eine bestimmte Kaffeemischung in 250 g- und 500 g-Paketen an. Vor der Auslieferung einer Wochenproduktion an den

2. Schließende Statistik

Einzelhandel vorgesehenen

2

σ^=12 g

2

wird anhand Soll-Gewichte

2

von Zufallsstichproben (μ^=251 g, μ^=501 g bei

191

geprüft, ob einer Varianz

die von

2

bzw. 0 und τ) < 1 ist der Stichprobenumfang η so zu bestimmen, p(

Ι^η-μχΙ-ε) *

1_η

daß

gilt!

Aufgabe 69 Mit einer Maschine werden 0,7 1-Flaschen abgefüllt. Aus der Gesamtheit 3 aller in einem Monat abgefüllten Flaschen - mit Mittelwert μ χ = 710 cm und Varianz 2 = 6400 (cm 3 )2 - soll eine einfache Stichprobe vom Umfang n=256 gezogen werden. In welchem zentralen Schwankungsintervall ist mit einer Wahrscheinlichkeit von (approximativ) 0,95 der Stichprobenmittelwert zu erwarten?

Aufgabe 70 Der Betreiber einer Mensa überlegt sich, die Warteschlangen an den Kassen dadurch zu verkürzen, daß alle Rechnungsbeträge auf jeweils ganze DM gerundet werden, so daß die Zeit für das Herausgeben des "Kleingelds" entfällt. Diese Rundung führt zu Fehlern. Allerdings gleichen sich Auf- und Abrundungsfehler mit zunehmender Anzahl von Rechnungen aus, so daß die Summe der Rundungsfehler einer hinreichend großen Anzahl von Rechnungen im allgemeinen in einem relativ kleinen Intervall liegt. a) Bestimmen Sie - approximativ - ein symmetrisches Intervall für die Summe der Rundungsfehler von 200 Rechnungen, dessen Grenzen in nur 5% aller Fälle über- oder unterschritten werden! Nehmen Sie dabei an, daß die Rundungsfehler der einzelnen Rechnungen voneinander unabhängig und im Intervall [0,5 DM; +0,5 DM] rechteckverteilt sind!. b) Teilaufgabe a) enthält zwei wesentliche Annahmen. Nehmen Sie zu beiden kritisch Stellung!

Aufgabe 71 Ein

Vertreter

besucht

täglich

seine

Kunden.

Dabei

legt er im 2 Durchschnitt 140 km zurück mit einer Varianz von 2304 (km ). Wie groß ist die Wahrscheinlichkeit dafür, daß der Wert des arithmetischen Mittels einer einfachen Stichprobe vom Umfang n=16 um höchstens 36 (km) vom Tagesdurchschnitt abweicht?

2. Schließende Statistik

193

Aufgabe 72 Der durchschnittliche Rechnungsbetrag eines Handwerksbetriebes (ohne Bauleistungen) ist μ^ = 150,— DM. Aus den Rechnungen des vergangenen Geschäftsjahres werden zufällig - und mit Zurücklegen - 16 Rechnungen ausgewählt. a) Wie groß ist mindestens die Wahrscheinlichkeit, daß der durchschnittliche Rechnungsbetrag dieser 16 Rechnungen um nicht mehr als 40,— DM vom durchschnittlichen Rechnungsbetrag aller Rechnungen 2 2 abweicht, wenn als Varianz der Rechnungsbeträge σ^ = 25600,— (DM) angenommen wird? b) Wie wäre Frage a) zu beantworten, wenn der Stichprobenumfang um 34 Rechnungen erhöht würde?

Aufgabe 73 Die Dauer eines Herreneinzels (ein Match, drei Gewinnsätze) bei den Internationalen Französischen Tennismeisterschaften in Paris (French Open) beträgt - wie man aus langjähriger Erfahrung weiß - durchschnittlich 2 Stunden und 45 Minuten bei einer Standardabweichung von 58 Minuten. Für die Planung eines Turniers müssen die folgenden Fragen beantwortet werden. a) Mit welcher Wahrscheinlichkeit wird das arithmetische Mittel der Spieldauern von 25 zufällig ausgewählten Herreneinzeln der letzten Jahre um höchstens eine halbe Stunde von der durchschnittlichen Spieldauer abweichen? b) Wie breit muß das zentrale Schwankungsintervall zu Teilaufgabe a) wenigsten sein, damit das Ergebnis sinnvoll ist?

* Aufgabe 74 2 Aus einer Grundgesamtheit mit Mittelwert μ^ und Varianz σ χ wird eine einfache Stichprobe vom Umfang η gezogen. Gesucht ist die Wahrscheinlichkeit, daß der Wert des arithmetIschen Mittels der Stichprobe nicht mehr als das Zweifache des Standardfehlers (2σ^) vom Mittelwert der Gesamtheit abweicht! Nehmen Sie an, daß a) die Gesamtheit normalverteilt ist, b) die Verteilung der Gesamtheit beliebig und η < 40 ist, c) die Verteilung der Gesamtheit beliebig und η = 400 ist!

* Aufgabe 75 Aus Realisationen von stochastlsch unabhängigen, im Intervall [0;1] rechteckverteilten Zufallsvariablen sind Realisationen von approximativ standardnormalverteilten Zufallsvariablen abzuleiten! Veranschaulichen Sie Ihre Überlegungen anhand der Realisationen von n=24 rechteckverteilten Zufallsvariablen!

194

2. Schließende Statistik

Aufgabe 76 Wie o f t muß e i n e i d e a l e Münze mindestens geworfen werden, damit mit e i n e r Wahrscheinlichkeit von 0,9 d i e D i f f e r e n z zwischen der r e l a t i v e n Häufigkeit (X*/n) der Kopfwürfe und π = 0,5 k l e i n e r oder höchstens g l e i c h 0,01 i s t ?

Aufgabe 77 η Zufallsvariable

X^,

1=1,2

n,

seien

stochastisch

unabhängig

und

2

identisch v e r t e i l t sein,

mit Mittelwert μ und Varianz er

= 36. Wie groß muß η

damit d i e Wahrscheinlichkeit dafür, daß X von μ um nicht mehr a l s

0,5 abweicht,

g l e i c h 0,99 i s t ?

* Aufgabe 78 Aus

einer

Gesamtheit entnommen.

mit

2 σ^

=

900

und unbekanntem

Mittelwert

normalvertei1ten

werden Stichproben (mit Zurücklegen) vom Umfang Für e i n e Punktschätzung des M i t t e l w e r t s μ^ werden

n=3 die

Schät zfunkt i onen (St i chprobenmi t t e 1 w e r t e ) -(1) х з -

X +X

l

2+X3

vorgeschlagen.

und

-(2) 1 1 з = ίχι + К

х

+

1 5X3

Welche d i e s e r Schätzfunktionen würden S i e vorziehen?

Aufgabe 79 Die Wareneingangskontrolle eines A u t o m o b i l h e r s t e l l e r s hat u.a. d i e Aufgabe, g e l i e f e r t e Glühlampen auf ihre Funktionsfähigkeit und Verwendbarkeit zu überprüfen. Hierzu werden Merkmale wie L i c h t l e i s t u n g , Brenndauer und auch Abmessungen e r f a ß t . Eine Überprüfung a l l e r g e l i e f e r t e n Glühlampen kommt schon wegen der zerstörenden Brenndauerprüfung nicht in Betracht. Den Lieferungen werden dalier Z u f a l l s s t i c h p r o b e n entnommen, und aufgrund der Stichprobenergebnisse wird entschieden, ob d i e L i e f e r u n g angenommen werden s o l l oder nicht. Eine solche L i e f e r u n g bestehe aus 1000 Glühlampen, d i e auf zehn P a l e t t e n in zehn Reihen zu j e w e i l s zehn Stück angeordnet sind. Beschreiben S i e e i n g e e i g n e t e s Verfahren, wie man aus d i e s e r L i e f e r u n g eine e i n f a c h e und uneingeschränkte Z u f a l l s s t i c h p r o b e vom Umfang η ziehen kann!

2. Schließende Statistik

195

Aufgabe 80 Herkömmliche Batterien haben eine m i t t l e r e Leistung von Wattstunden j e kg. Neuartige Aluminiumbatterien brachten Leistungen: Leistungen von . . . bis unter . . . Wattstunden j e kg 275 285 295 305 315

- 285 295 - 305 - 315 - 325

etwa 50 folgende

Anzahl 20 80 200 80 20

a) Unter welchen Bedingungen lassen sich aus diesen Daten eine Punktund eine Intervallschätzung für d i e unbekannte m i t t l e r e Leistung dieses Typs von Batterien ableiten? b) Nehmen Sie an, die unter a) zu nennenden Bedingungen seien e r f ü l l t und führen Sie eine Punkt- und eine Intervallschätzung durch! Aufgabe 81 a) In einem Vorort mit N^ = 10000 Haushalten s o l l der Anteil der Haushalte mit mehr als einem PKW geschätzt werden. In einer Stichprobe von n^ = 400 Haushalten (Auswahl mit Zurücklegen) befinden sich 140 Haushalte mit mehr a l s einem PKW. Bestimmen Sie ein 95/4-Konfidenzintervall f ü r den wahren Anteil iij der Haushalte in diesem Vorort mit mehr a l s einem PKW! b) Die g l e i c h e Aufgabe s o l l f ü r das gesamte Wohngebiet mit N,, = 1 Mio. Haushalten gelöst Stichprobenumfang

werden. Berechnen Sie daher den n^ (Auswahl mit Zurücklegen)

95%-Konfidenzintervall

notwendigen für ein

der Länge 0,04 f ü r den wahren Anteil

πder

Haushalte im gesamten Wohngebiet mit mehr a l s einem PKW f ü r den F a l l , Ы ) daß das Stichprobenergebnis aus a) Vorstichprobe betrachtet werden kann,

als

Anteilswert

einer

b2) daß d i e Bevölkerungsstruktur des gesamten Wohngebietes sich so von der des Vorortes unterscheidet, daß d i e Stichprobe aus a) nicht a l s Vorstichprobe dienen kann! Erklären Sie den Unterschied der Ergebnisse aus Ы ) und Ь2)!

196

2. Schließende Statistik

Aufgabe 82 Wie groß ist der größte erforderliche (Mindest-) Stichprobenumfang für die Schätzung des Parameters π einer zweipunktverteilten Gesamtheit mit einem maximalen (absoluten) Zufallsfehler von с = 0,02?

Aufgabe 83 Stichprobenerhebungen sind in der amtlichen Statistik von großer Bedeutung. Ein Beispiel aus der Wirtschaftsstatistik ist die Kostenstrukturerhebung im Bergbau und im Verarbeitenden Gewerbe (Industrie und Verarbeitendes Handwerk). Ziel dieser Erhebung 1st unter anderem die Erfassung der Vorleistungsstruktur der Unternehmen in diesem Bereich. Zu diesem Zweck wird eine Zufallsstichprobe (Auswahl ohne Zurücklegen) von rd. 39% aus allen rd. 37000 Unternehmen mit wenigstens 20 Beschäftigten dieses Bereichs gezogen. a) Nehmen Sie an, der Wert des durchschnittlichen Verbrauchs aller Unternehmen in der Stichprobe an Roh-, Hilfs- und Betriebsstoffen hätte in einem Jahr 15 Mio. DM betragen ( =

n



zu

vollenden,

wenn

man

46400 = 100000 = о 464

ist die Wahrscheinlichkeit, das (45. und) 75. Lebensjahr zu vollenden, wenn man das 10. Lebensjahr vollendet hat. Schließlich ist P(E 2 |E 1 ) = P(E 2 nE 1 )/P(E 1 ) = P(E2)/P(E1) =

0 464

= 0,490

die Wahrscheinlichkeit, das 75. Lebensjahr zu vollenden, Bedingung, daß das 45. Lebensjahr vollendet wurde.

unter

der

Lösung 13 Die Stromversorgung ist unterbrochen, wenn Teil Nr. 1 defekt ist (Ereignis Ej mit Ρ(Ε χ ) = 0,005) oder alle Teile Nr. 2 bis 5 defekt sind

(Ereignis E 2 = E ^ n E ^ n E ^ n E ^ mit P(E^) =

=

Ρ(Ε

21)·Ρ(Ε22)·Ρ(Ε23,·Ρ(Ε24) =

Ρ(Ε

2.)4)·

Somit ist das Ereignis G (Unterbrechung der Stromversorgung): G = E^uEg. P(G) soll £ 0,01 sein. Es ist P(G) = P(E^) + P(E 2 ) - P(E лЕ2), mit PtEjnE^ > 0 .

Wegen der Unabhängigkeit von E^ und E^ gilt: 0,01 £ 0,005 + P(E„ ) 4 - (0,005·Ρ(E_ ) 4 ) . 2·

0,005 г P(E ) 4 (1-0,005) 2* 0,005 0,995

4

>

P(E 2 .)



° · 0 0 5 - 0,2662 . 0,995



232

2. Schließende Statistik

Die A u s f a l l w a h r s c h e i n l i c h k e i t Wert 0,2662 n i c h t

Jedes d e r T e i l e Nr.

2 b i s 5 darf

also

den

übersteigen.

Lösung 14 Sei

E i das E r e i g n i s ,

Dann i s t P t E ^

daß das i - t e Kühlsystem ( i = l , 2 , 3 )

= 0 , 1 für

ausfällt.

1=1,2,3.

Sowohl b e i ' T e i l a u f g a b e a ) a l s auch b e i T e i l a u f g a b e b )

i s t Р(Е1лЕ2пЕ3)

zu

bestimmen. a)

Bei

Annahme d e r s t o c h a s t i s c h e n Unabhängigkeit

der d r e i

E r e i g n i s s e E^

gilt: PCEj^nEg) = Ρ(Ε1)·Ρ(Ε2)·Ρ(Ε3) Die

Ausfallwahrscheinlichkeit

= 0 , 1 · 0 , 1 · 0 , 1 = 0,001 . des

gesamten Kühlsystems

beträgt

also

0,001.

b ) Unter den g e ä n d e r t e n Annahmen i s t P(E^) = 0,1 f ü r 1=1,2,3 . P ( E ^ I Ε . ) = 0 , 3 f ü r i * j und P ( E . lE.nE ) = 0 , 7 f ü r i , j , k paarweise ι j к Damit

verschieden,

ist

рсе^ле^ае^)

=

ρ(ε

1

)·ρ(ε

2

ιε

1

)·ρ(ε

3

ιε

2

λε

1

)

= 0 , 1 · 0 , 3 · 0 , 7 = 0,021 . Die A u s f a l l w a h r s c h e i n l i c h k e i t b e t r ä g t 0,021 und i s t a l s o aufgrund d e r g e ä n d e r t e n Annahmen d e u t l i c h g e s t i e g e n .

Lösung 15 Eine Betrachtung T u t o r r e c h t hat.

der

Elementarereignisse

zeigt

unmittelbar,

daß

der

2. Schließende Statistik

Elementarereignis (mit Berücksichtigung der Reihenfolge)

Ρ(ω)

Elementarereignis (ohne Berücksichtigung der Reihenfolge)

233

Ρ(ω' )

ω' (W,W, W) (W,W, Z) (W,Z,W) (Z,W,W) (W,Z,Z) (Z,W,Z) (Z,Z,W) (Ζ,Ζ,Ζ)

1/8 1/8·. 1/8 1/8-1 1/8-j 1/8 1/8-1 1/8

{W,W,W>

1/8

{W,W,Z>

3/8

{W,Z,Z>

3/8

{Z,Z,Z>

1/8

Also ist P({W,W,W} υ {Ζ,Ζ,Ζ}) = 2/8 = 1/4 . Brauses Überlegungen sind diffiziler. Richtig ist, daß P({Anzahl Wappen ϊ 2} и {Anzahl Zahl г 2}) = P({Anzahl Wappen £2}) + + P({Anzahl Zahl ί 2})

= i + i

1 ist (s.o. ).

Falsch ist hingegen die Annahme, daß die Wahrscheinlichkeit für einen "Wappen-(Zahl-)Wurf" bei der dritten Münze, wenn (unter der Bedingung, daß) die beiden anderen Münzen Wappen (Zahl) zeigen, gleich 1/2 ist. Begründung: Wie der obigen Tabelle zu entnehmen ist, zeigen nur in einem von 4 Fällen alle Münzen Wappen (Zahl), wenn man die Betrachtung auf jene Elementarereignisse (ω) beschränkt, in denen wenigstens 2 Münzen Wappen (Zahl) zeigen, d.h. die Wahrscheinlichkeit beträgt nicht, wie Brause vermutet, jeweils 1/2, sondern nur jeweils 1/4. Damit erhält man P({W,W,W,}u{Z,Z,Z>) = P({W,W,W})+P({Z,Z,Z})

1 1 2*4

1 1 2*4

=

1 4

Lösung 16 Sei E., i=l,2

10, das zufällige Ereignis, daß der i-te Mann aus der

Gruppe innerhalb eines Jahres stirbt. Die

Ej

sind stochastisch unabhängig,

und es ist

P(Ej) = 0,00475

alle i. Dann ist a) P(A) = Ρ ί Ε ^ η . . ·πΕ 10 ) = Ρ(Ε χ )-Р(Ё 2 ) ·. . . ·Ρ(Ε 10 ) = = (1-0,00475)

10 ·

= 0,9535

für

234

2. Schließende

Statistik

die Wahrscheinlichkeit dafür, daß keiner der 10 Männer im Alter von 45 bis 46 Jahren stirbt; b) P(B) = P[ (EjnEgnE^. . .nE 10 ) и ^лЕ^лЁдП. . .

. .

. . .и(Ё 1 пЁ 2 пЁ 3 п..·ηΕ 10 1 = 10·(1-0,00475)9·0,00475 = 0,0455 die Wahrscheinlichkeit dafür, daß genau (irgend-)einer der 10 Männer im Alter von 45 bis 46 Jahren stirbt; c) P(C) = P(AuB) = P(A) + P(B) = 0,9535 + 0,0455 = 0,999 die Wahrscheinlichkeit dafür, daß nicht mehr als einer, d.h. keiner oder genau einer der 10 Männer im Alter von 45 bis 46 Jahren stirbt; d) P(D) = 1 - P(C) = 1 - 0,999 = 0,001 die Wahrscheinlichkeit dafür, daß mehr als einer der 10 Männer im Alter von 45 bis 46 Jahren stirbt; e) P(E) = 1 - P(A) = 1 - 0,9535 = 0,0465 die Wahrscheinlichkeit dafür, daß mindestens einer der 10 Männer im Alter von 45 bis 46 Jahren stirbt.

Lösung 17 a) Sei G das Ereignis "Kfz-Kennzeichen hat gerade Endziffer" und U das Ereignis "Kfz-Kennzeichen hat ungerade Endziffer". Die Familie kann jeden Tag Auto fahren, wenn der Alfa eine gerade und der Fiat eine ungerade Endziffer hat oder umgekehrt. Man kann (wohl) davon ausgehen, daß die Zuteilung von Kfz-Kennzeichen mit gerader bzw. ungerader Endziffer zufällig und unabhängig erfolgt mit P(G) = = P(U) = 0,5. Dann ist die Wahrscheinlichkeit für die Kombination (G, U) oder (U,G), d.h. dafür, daß die Familie an Jedem Tag im Stadtgebiet fahren kann, gleich P(G)-P(U) + P(U)-P(G) = 2·0,25 = 0,5. b) Wenn die Familie noch ein drittes Auto besäße, ist die Wahrscheinlichkeit dafür, daß sie ал jedem Tag im Stadtgebiet fahren kann, gleich 1 - [P(G)-P(G)-P(G)] - [P(U)-P(U)*P(U)] = 1 - (1/2)3 3 - (1/2) = 0,75, so daß die unter a) berechnete Wahrscheinlichkeit um 50% steigen würde.

2. Schließende Statistik

235

Lösung 18 a) Anzahl der Elementarereignisse, Stichprobenraum al) Sei

=

J=l,2

j,

wenn

der

i-te

Würfel

j

Augen

zeigt

(i=l,2,3;

6).

Dann läßt sich jedes Ergebnis eines Wurfes mit 3 unterscheidbaren Würfeln als Elementarereignis ω = (.ω^,ω^,ω^) beschreiben. Da jedes ьл die Werte j=l,2

6 annehmen kann, gibt es 6·6·6 = 216

solche Elementarereignisse. Der Stichprobenraum Ω besteht also unter Berücksichtigung der Reihenfolge - aus 216 Elementarereignissen. a2) Jetzt wird nicht mehr zwischen den 3 Würfeln unterschieden, so daß beispielsweise die Elementarereignisse (1,1,2), (1,2,1) und (2,1,1) aus al) - also mit Berücksichtigung der Reihenfolge - zu einem neuen Elementarereignis ω' = (2-1-1) - ohne Berücksichtigung der Reihenfolge - zusammengefaßt werden. Es gibt nun - 6 Elementarereignisse ω' der Form ω' = (ω^-ω^-ω^), zum Beispiel (1-1-1),

(2-2-2)

- 30 Elementarereignisse ω' der Form ω' = (ω^-ω^-α^), zum Beispiel (2-2-1),(2-2-3), .. .

und

- 20 Elementarereignisse ω' der Form ω'= (ω^-ω^-ω^), zum Beispiel (3-2-1), (4-2-1),... (mit ω ^ ω ^ ω ^ , ω.=1,2,... oder 6), so daß der Stichprobenraum Ω' - ohne Berücksichtigung der Reihenfolge - aus 6+30+20=56 Elementarereignissen ω' besteht. b) Wahrscheinlichkeiten der Elementarereignisse Ы ) Sei E^ das Ereignis, daß der i-te Würfel j Augen zeigt. Dann gilt P(E^) = 1/6 (1 = 1,2,3; j=l,2

6), da es sich um ideale Würfel

handelt. 1 Γ Die Ereignisse E^ und E'r, sind stochastisch unabhängig, Augenzahl eines Würfels (l£i2) = {(ь^.ь^.ь^), (ω^,ω^,ω^),

(ü^.WJ.i^)}, zum Beispiel

(2-2-1) = {(2,2,1),

ist. Somit

(2,1,2),

(1,2,2)},

ist für

diese

30 Elementarereignisse ω' jeweils Ρ(ω') = 3/216. Ist ω'νοη der Form ω' = (ω^,ω^,ω^), zum Beispiel ω' = (3-2-1), so gibt es genau sechs Elementarereignisse ωεΩ, so daß u>' = = (ωΓω2-ω3) = { « ^ , ω ^ ) , (ω^,ω.,). (ω,,,ω^). (»^,«^), (ω3,ω1,ω2), (3,1,2),

(ь^.ь^.о^)},

(2,3,1),

zum

Beispiel

(2,1,3), (1,3,2),

(3-2-1)

(1,2,3)},

=

{(3,2,1),

ist. Somit ist für

diese 20 Elementarereignisse ω' jeweils Ρ(ω') = 6/216. N.B.: Die Elementarereignisse ω'εΩ' werden dabei als Ereignisse in Ω aufgefaßt, die dort aber nicht notwendig auch elementar sein müssen. cl) Bestimmung der Wahrscheinlichkeit für die Augensumme 11 (vgl. b)

ω'

Ρ(ω' )

6-4-1 6-3-2 5-5-1 5-4-2 5-3-3 4-4-3

6/216 6/216 3/216 6/216 3/216 3/216

Σ

27/216

2. Schließende Statistik

237

c2) Bestimmung der Wahrscheinlichkeit für die Augensumme 12 (vgl. b)

ω' 6-5-1 6-4-2 6-3-3 5-5-2 5-4-3 4-4-4 Σ

Ρ(ω' ) 6/216 6/216 3/216 3/216 6/216 1/216 25/216

Der Grund für die Beobachtung des Spielers, daß die Augensumme 11 häufiger auftritt als die Augensumme 12, liegt also darin, daß die Wahrscheinlichkeit, mit 3 Würfeln 11 Augen zu werfen, größer ist als die Wahrscheinlichkeit, 12 Augen zu werfen. d) Sei X die Augensumme beim Werfen von 3 Würfeln. Dann kann X die Werte χ = 3,4,...,18 annehmen. Mit Ρ(X=x) := Ρ({ω·|Χ(ω" ) = x, ω'εΩ'}), zum Beispiel P(X=11) : = := Ρ({ω'|Χ(ω') = 11, ω' εΩ'}), vgl. cl), ergibt sich die folgende Wahrscheinlichkeitsfunktion.

χ 3 4 5 6 7 δ 9 10 11 12 13 14 15 16 17 18 Σ

Ρ(Χ=χ) = ί χ (χ) 1/216 3/216 6/216 10/216 15/216 21/216 25/216 27/216 27/216 25/216 21/216 15/216 10/216 6/216 3/216 1/216 1

238

2. Schließende Statistik

Lösung 19 Eine W a h r s c h e i n l i c h k e i t s f u n k t i o n f ^ ( x ) hat d i e а ) 0 £ f x ( x ) s 1 und

Eigenschaften:

b ) Σ f " x ( X j ) = 1.

Daher können f

( x ) wegen Σ j i \ ( x J, )

f4(x)

> 1

und

wegen f 4 ( 3 ) = - 0 , 2 5

keine Wahrscheinlichkeitsfunktionen

sein.

f „ ( x ) , f _ ( x ) und f _ ( x ) können W a h r s c h e i n l i c h k e i t s f u n k t i o n e n tL J b s i e d i e oben angegebenen E i g e n s c h a f t e n b e s i t z e n .

sein,

weil

f_(x) kann e i n e W a h r s c h e i n l i c h k e i t s f u n k t i o n s e i n , ö 0 s с £ 0 , 5 . A n d e r e n f a l l s s i n d zwei F u n k t i o n s w e r t e n e g a t i v .

wenn

Die Funktion gilt:

N. B. : f g ' O tritt

ist

e i n e sogenannte E i n - P u n k t - V e r t e i l u n g .

mit W a h r s c h e i n l i c h k e i t

1 ein;

f

3

(l)

Das E r e i g n i s X = 1

= P ( X = 1 ) = 1.

Lösung 20 Χ-μ Es i s t

Χ* =

σχ

ν_ = ί-Ε

,

so das Ε ( Χ * ) = ε ί ^ Ι = - Ε ( Χ - μ ) = - = £ ( μ - μ ) = 0 L σ J σ

j=l,2

6 .

b ) Χ = Augenzahl beim e i n m a l i g e n Wurf mit dem v e r f ä l s c h t e n

Würfel.

2. Schließende Statistik

239

Die Wahrscheinlichkeitsfunktion lautet: 0,065 0,050 0, 100 0,074 0,620 0,091 0

f x (x) =

für x=l für x=2 für x=3 für x=4 für x=5 für x=6 sonst

Die Verte i1 ungsfunkt ion lautet:

Γ

χ

(ξ)

=

0 o, 065 0, 115 0, 215 0, 289 0, 909 1. 0

für für für für für für für

1 2 3 4 5 6

з s s 3 S s

ξ ζ ξ ξ ξ ξ ξ

< 1

< 2

2

ist die Konstante c^ gemäß der Normierungsbedingung zu

bestimmen. C

1= S (2+c x)dx = 0 ^

2x +

2X

12 + 18c. 2 '

daraus folgt с 2 = -11/18. Mit c 2 = -11/18 ist aber f 2 (x) nicht im gesamten Intervall [0;B] positiv, so daß es keine Zufallsvariable X gibt, die f 2 als Dichte hat. b2) Somit erübrigt sich die Verteilungsfunktion F^.

Frage

nach

E(X),

Var(X)

und

Lösung 23 a) P(0,5 2

ist Fx(l,5) = 0,65625 und Εχ(0,5) = 0,15625, so daß P(0,5105) ^ 0,025 . A n a l o g T e i l a u f g a b e a ) e r g i b t s i c h dann

105-μγ λ

1,96

105 - μ χ μ ί Χ

3,92 101,08 .

Der M i t t e l w e r t ( g ) betragen.

darf

u n t e r den genannten Bedingungen höchstens

101,08

2. Schließende Statistik

247

с) Zu bestimmen ist с unter der Voraussetzung, daß P(100-ciXil00+c) = = 0,95, μ χ = 100 (g) und σ χ = 2 (g). '100-c-iЦу A

P(100-c£Xil00+c) = Ρ

m

ppOO-c-lOO

s и

s

100+c-100j

ЮО+с-μ^' < U s

=

=

Daraus folgt F ^ ) = 0,975, | = 1,96

ar^l).!

= 0>95

.

und с = 3,92 (g).

Damit ist P(96,08sXsl03,92) = 0,95, d.h. unter den genannten Bedingungen wird eine zufällig ausgewählte 100 g Tafel mit Wahrscheinlichkeit 0,95 ein Gewicht zwischen 96,08 g und 103,92 g aufweisen und daher nicht als Ausschuß angesehen werden.

Lösung 31 a) Die Zufallsvariable X (Preis eines Medikaments in der Apotheke) folgt einer (zunächst) unbekannten Verteilung mit Mittelwert μ χ = 10 und 2 Varianz σ = 12,25 . X Zu bestimmen ist P(4,75sXsl5,25). Da die Verteilung der Gesamtheit unbekannt ist, kann diese Wahrscheinlichkeit nur mit Hilfe der Ungleichung von TSCHEBYSCHEFF abgeschätzt werden. Es gilt

Ρ(μχ-οσ·χ:£Χ2) = P(X'=3) + + P(X'=4) zu bestimmen. Dabei ist zu berücksichtigen, welche der Motoren ausfallen können. Werden die η = 4 Motoren in beliebiger Reihenfolge durchnumeriert (1,2,3,4), dann können entweder die Motoren (1-2-3), (1-2-4), (1-3-4), (2-3-4) oder (1-2-3-4) ausfallen. Die zugehörigen 3 4 Wahrscheinlichkeiten sind jeweils π (l-тг) bzw. π (stochastische Unabhängigkeit). Somit ist P(X'>2) = 4·π 3 (1-π) + π 4 = 4·0,1 3 ·0,9 + 4 + 0,1 = 0,0037, so daß ein Flug mit einem viermotorigen Flugzeug vorzuziehen ist. Die vorangegangen Überlegungen machen deutlich, daß Χ'~Β(η,π)verteilt ist. Für das viermotorige Flugzeug hätte P(X'>2) also auch wie folgt bestimmt werden können: P(X'>2) =

n-x'

Σ χ' >2

3

11

[з]0, 1 ·0,9

+

ю

,0 0,1 4 ·0,9° = 0,0037.

b) Mit π = 0,4 ergibt sich für das zweimotorige Flugzeug: P(X'=2) =

2 0 0,4 ·0,6 = 0,16 und für das viermotorige Flugzeug

251

2. Schließende Statistik

P(X' >2)

[з]О . ^ - О . б

1

+

ffl

0 , 4 4 · 0 , 6 ° = 0,1336 + 0,0256 = 0,1792 ,

so daß nun das zweimotorige Flugzeug vorzuziehen i s t . Lösung 35 a) Sei X1 (1=1,2

6) die Z u f a l l s v a r i a b l e mit

1, f a l l s der Student d i e i - t e Aufgabe lösen kann, 0

sonst.

Es i s t P(X.=1) = 9/15 und es werden η = 6 Aufgaben, die verschiedenen Themenbereichen entstammen ( a l s o ohne Zurücklegen), Themenbereichen ausgewählt.

Der Student kann N^ = 9

aus den

N = 15

Themenbereiche

e r f o l g r e i c h und N-N^ = 6 Themenbereiche ohne E r f o l g bearbeiten. 6

Somit i s t X' = η = 6 ,

Σ X, hypergeometrisch v e r t e i l t mit Parametern: i=l N = 15 und Nj = 9 .

Zu bestimmen i s t d i e Wahrscheinlichkeit - P(X'=1) - P(X'=2) = 1 - F x , ( 2 | 6 ; 1 5 ; 9 ) .

P(X'£3) = 1 - P(X'=0) -

Damit i s t Р ( Х ' г З ) = 1 - 0,1189 = 0,8811 die Wahrscheinlichkeit dafür, daß der Student die Diplom-Vorprüfung bestehen wird. b) Wenn der Student mit Sicherheit d i e Diplom-Vorprüfung bestehen w i l l , muß er sich auf 12 Themenbereiche vorbereiten, da er dann noch im ungünstigsten Fa,ll - wenn nämlich Aufgaben aus den drei nicht vorbereiteten Themenbereichen gestellt werden mit drei v o r b e r e i t e t e n Themenbereichen die Vorprüfung besteht.

252

2. Schließende Statistik

Lösung 36 Sei 1, falls die i-te Frau IMOL kennt, X. = ι

0, falls die i-te Frau IMOL nicht kennt.

Dann ist P i X ^ l ) = 0,8 = π und Ρ ί Χ ^ Ο ) = 0,2 = l-π . a) D a e s s i c h hier um eine zweipunktverteilte Gesamtheit handelt, kann die Zufallsvariable X'= Σ X , die zufällige Anzahl der Frauen, die i IMOL kennen, sowohl der Binomialverteilung (bei einer Auswahl mit Zurücklegen) als auch der hypergeometrischen Verteilung (bei einer Auswahl ohne Zurücklegen) folgen. E(X') ist für beide Verteilungen als E(X') = μ^, = ηπ definiert. Die zu erwartende Anzahl a n Frauen in der Stichprobe, die IMOL kennen, beträgt 400*0,8 = 320. Somit ist die zu erwartende Anzahl an Frauen in der Stichprobe, die IMOL nicht kennen gleich 400 - 320 = 80. b) Bei

einer

einfachen

Zufallsstichprobe

sind

die

X^

(1=1,2

n)

stochastisch unabhängig, so daß PtX^lrvX^OnX^ln. . . ) = P t X ^ U - P t X ^ O b P U ^ l ) · . . . = = π( l-π) ·π· (l-π). . . = π 5 0 ( 1 - π ) 5 ° = 0 , 8 5 0 · 0 , 2 5 ° = (N.B.: Es gibt 50

Nullen

=

vorkommen;

^ g^j Stichproben, jede

dieser -40

Wahrscheinlichkeit von 1,607·10

1.607Ί0-40.

in denen genau 50 Einsen und

Stichproben

wird

mit

einer

realisiert),

c) Ja, natürlich! Nur ist die Wahrscheinlichkeit für ein solches Ereigκ klein, ιι · - П К gleich ι i к (l-π) ri ,1000 = 0,2 - „1000 =· 0n . m s sehr nämlich Lösung 37 Sei

X^

eine

repräsentiert.

Zufallsvariable, Dann

ist

die

(weil

interessiert) die Realisation

den

die

i-ten Anzahl

Mikrochip der

(i=l,2,...,10)

defekten

Mikrochips

(Ausprägung)

1, falls der i-te Mikrochip nicht voll funktionsfähig ist, x. = ι 0, falls der i-te Mikrochip voll funktionsfähig ist, oder kurz:

2. Schließende Statistik

253

sei 1, falls der 1-te Microchip nicht voll funktionsfähig 1st, X

i = 0, falls der i-te Mikrochip voll funktionsfähig ist.

Die zugrundeliegende Gesamtheit besteht aus allen Mlkrochips einer Lieferung. Sie ist zweipunktverteilt mit Parameter

π=0,05. Da eine Auswahl

mit Zurücklegen vorliegt, sind die Stichprobenvariablen X , i=l,2,...,10, stochastlsch unabhängig und identisch zwelpunktverteilt mit π=0,05. 10

Mithin ist die Zufallsvariable X* =

Σ 1=1

X

, die Anzahl der defekten

1

Mlkrochips in der Stichprobe vom Umfang n=10, binomialverteilt mit Parametern n=10 und π=0,05, d.h. X'- B(10;0,05). a) Die Wahrscheinlichkeit dafür, da£ eine Lieferung angenommen wird, P(Annahme), kann wie folgt bestimmt werden. Sei Xj (X^) die Anzahl der defekten Mlkrochips in der ersten (zweiten) Stichprobe. Dann ist Ρ(Annahme) = P(X^=0) + P(X^=1) • P(X^=0), weil die Lieferung genau dann angenommen wird, wenn Xj = 0 oder wenn Xj = 1 und Xj, = 0 ist. X^ und X^ sind B(10;0,05)-verteilt. Folglich ist P(Annahme) = f ,(0110;0,05) + f , (1110;0,05) · f . (0110;0,05) = Ä Λ 1 1 2 = 0,5987 + 0,3151 · 0,5987 = 0,7874 . Eine Lieferung mit einem Anteil von 5% defekten Mlkrochips wird also mit einer Wahrscheinlichkeit von 0,7874 angenommen. b) Durchschnittliche Anzahl der zu überprüfenden Mlkrochips Die erste Stichprobe (n=10) muß in Jedem Fall gezogen werden. Die zweite Stichprobe wird nur dann gezogen, wenn sich in der ersten Stichprobe genau ein defekter Mikrochip befand. Die Wahrscheinlichkeit für dieses Ereignis ist gleich P(X^=1) = 0,3151. Mit einer Wahrscheinlichkeit von 0,3151 werden also der Lieferung weitere n=10 Mlkrochips entnommen.

254

2. Schließende Statistik

Im Durchschnitt (Erwartungswert) werden von den zu Lieferungen (mit и=0,05) jeweils

kontrollierenden

10 + 0,3151 · 10 = 13.151 Mikrochips überprüft. Z u dem selben Ergebnis kommt man aufgrund der folgenden Überlegungen. Die Anzahl der zu überprüfenden Mikrochips ist eine Zufallsvariable Y, welche die Werte y^ = 10 und у^ = 20 annehmen kann. Mit einer Wahrscheinlichkeit von 0,3151 wird eine zweite Stichprobe gezogen und mit einer Wahrscheinlichkeit von 0,6849 nicht. Somit hat Y die Wahrscheinlichkeitsfunktion:

f Y (y) =

' 0,6849

für у = 10 ,

0,3151

für у = 20 ,

0

sonst.

Der Mittelwert (Erwartungswert) von Y, d.h. die durchschnittliche Anzahl der zu überprüfenden Mikrochips ist der Erwartungswert E(Y) = 0,6849 · 10 + 0,3151 · 20 = 13,151 . Lösung 38 Sei 1, falls die i-te Frage richtig beantwortet wird, X

i = '

0

sonst.

a) Die X^ sind unabhängig und identisch zweipunktverteilt mit P(X,=1)

= it = 0,25.

Dann

ist X' =

η Π i=l

, die Anzahl

der

richtig

beantworteten Fragen, B(n,it)-vertellt mit η = 20 und π = 0,25. Ρ ( | ^ 0 , 4 5 ] = P(X't9) = 0,0271 + 0,0099 + 0,0030 + 0,0008 + 0,0002 + + 0,0000 + ... = 0 , 0 4 1 . Die Wahrscheinlichkeit, daß der Kandidat ohne Vorbereitung Zufall - die Klausur besteht, 1st 0,041.

- durch

b) Die Χ^ sind unabhängig und identisch zweipunktverteilt mit P(X^=1) = η Σ X., die Anzahl der richtig i=l Fragen, B(20;0,5)-verteilt und P(X*9) = 0,7483 ist. = я = 0,5, so daß X' =

beantworteten

2. Schließende

Statistik

255

с) D a π = 0 , 5 u n d nir(l-ir) = n/4 v e r m u t l i c h größer als 9 s e i n w i r d (d.h. η n>36), k a n n d a v o n a u s g e g a n g e n werden, daß X' = Σ X. approximativ i=l Ν(ηπ; ηπ( 1-тг))-, also N(0, 5n; 0, 25n)-verteiIt

ist. Also gilt a p p r o x i m a -

tiv P C X ' ^ 0 , 4 5 n ) = l-P(X'£0,45n-l) =

1 - F,

1 - F,

0,45n-l+0,5-0,5n •η·0,5·0,5' -0,05n-0,5

= 0,9 .

•η·0,25'

D a r a u s folgt mit λ -0,05n-0,5

=

_

0, 1

-1,28:

1 2 8

0, 5ι/η 0,0025η

+2-0.05·0,5·η+0,25 0,25η

1,6384

0,0025η

+ 0,05η + 0,25 = 0,4096η

0,0025η

- 0,3596η + 0,25 = 0

_ 0,3596 ±

νΌ^ 3596 - 4 · 0 , 0 0 2 5 · 0 , 2 5 2·0,0025

1,2

1,2 η

_ 0 , 3 5 9 6 + 0,3561 0,005

= 143,14 = 144

η 2 = 0,7 = 1 Es m ü ß t e n also (etwa) 144 F r a g e n gestellt werden.

L ö s u n g 39 Sei X^ (i=l,2

n) eine Z u f a l 1 s v a r i a b l e

(i-ter Münzwurf), die die W e r -

te 0 (falsche Kennzeichnung) u n d 1 (richtige K e n n z e i c h n u n g ) annimmt, für d i e Р ( Х А = 0 )

= PiX^l)

= 0,5

ist. Es

ist gerechtfertigt

und

anzunehmen,

d a ß d i e X^, 1=1,2,...,η (die Miinzwürfe), s t o c h a s t i s c h u n a b h ä n g i g sind.

256

2. Schließende Statistik

Daraus folgt, daß X" =

π Σ X, , die Anzahl der richtigen Kennzeichnungen, 1=1

einer Β(η,π) = B(n;0,5) folgt. Die Wahrscheinlichkeit für genau x' richtige Kennzeichnungen ist somit fx.(x'|n;O.S) = £ , ] ο . 5 χ ' ο , 5 ( η - χ , )

= (χ·]°·5η · a) Die Wahrscheinlichkeit, diesen Prüfungsteil zu bestehen, wenn mehr als 75% der Aussagen richtig gekennzeichnet sein müssen, ergibt sich aus - XЬ>1—*· п И 0 1· 4

5

" *

Für η = 10 ist P(X' >7,5) = P(X'£8) = 0,0547 (Tabelle),

und

für η = 30 ist PCX'>22,5) = PCX'£23) = 0,0026 (Tabelle) die gesuchte Wahrscheinlichkeit, diesen Prüfungsteil zu bestehen. Diese Ergebnisse zeigen unmittelbar, daß diese Wahrscheinlichkeit abnimmt, wenn die Anzahl der Aussagen vergrößert wird. D.h. mit zunehmender Schwierigkeit (75% von einer größeren Anzahl an Aussagen) nimmt die Wahrscheinlichkeit (zufällig) zu bestehen ab. b) Die B(n;0,5) ist eine symmetrische Verteilung. Wegen der zusätzlichen Voraussetzung, daß η ungerade ist, gibt es keinen mittleren Wert x' = = n/2. Somit ist (mehr als die Hälfte) P(X'>|n) = i = P(X' 0, so daß - wenn das Ereignis "16 Treffer" eingetreten ist - die Leistungsfähigkeit nicht streng "bewiesen" ist. c) Gesucht ist x' aus 20 1 X ' 0 , 9 ( 2 0 _ X ' } = 0,0025 .

Ρ(Χ'£χ· |20;0,1) = Σ Es ist P(X'=7I20;0,1) = 0,0020 , P(X'=8|20;0,1) = 0,0004 , P(X'=9|20;0, 1) = 0,0001 , P(X'£10|20;0,1) = 0

und somit

P(X'£7|20;0, 1) = 0,0025 = 0,25·/., so daß die Anzahl der Treffer auf mindestens 7 und die Trefferquote mindestens (7/20) · 100 = 35% hätte festgesetzt werden müssen.

auf

d) Das ist nicht möglich, weil es mit zunehmendem η (und gleichem π=0,1) immer schwieriger (unwahrscheinlicher) wird, eine Trefferquote von mindestens 80% zu erzielen. Das liegt daran, daß in

P(X'i0,8.n|n;0,l)

=

η der Faktor 0 , 1 ^ ' 8 Faktor

[θ,8·η]

gr

Σ ^ n

jj.Jo, 1 ( 0 '8 ' n ) 0 , 9 ( n " 0 , 8 ' n )

^0,9^n

mit

zunehmendem

schneller sehr klein wird als der

°ß-

Für η = 20 und x' = 16 ist ζ. B. 4845 P

und

O . l 1 6 · 0 , 9 4 = 6,561

17

;

-

für η '= 30 und x' = 24 ist 593775

und

0 , l 2 4 · 0,96 = 5,314_25

Lösung 45 Sei Y

_ i ~ '

1, falls der i-te Haushalt, der einen Katalog erhält, Waren im Werte von mindestens 7 0 , — DM bestellt, 0, sonst

und

η X* = ,Σ , X.ι .

2. Schließende Statistik

262

Dann ist P(Xi = l) = 0,18 = π. Die X±, i = 1,2, ...,n, sind approximativ stochastisch unabhängig (kleiner Auswahlsatz), so daß X 1 , die Anzahl der Bestellungen im Wert von mindestens 7 0 , — DM, binomial verteilt ist mit e(x') = ηπ = 18000 und Var(x') = = ηπ(ΐ - π) = 14760 . A)

Zu erwartende Mindestbestellsumme: E(X') · 70,0 DM = 1260000,0 DM .

b)

Die в(ю0000;0,18)

kann durch die N(I8000;14760)

approximiert

werden, da 0,1 < π = 0,18 < 0,9 und ηπ(ΐ - π) = 14760 > 9. Einer Mindestbestellsumme von 1274980,— DM entsprechen (: 70) 18214 Bestellungen, so daß / ч / \ f 18214 + 0,5 - 18000"! P(X' >18214) = 1 - P(X' < 18214) = 1 - F 0 [ -щщ J = = 1 - F0(l,77) = 1 - 0,9616 = 0,0384 die Wahrscheinlichkeit über 1274980,— DM ist.

für

eine

Mindestbestellsumme

von

Lösung 46 Sei f 1, falls die i - te geborene Maus weiblich ist, X- = \ 1 I 0, falls die i - te geborene Maus männlich ist η und X' = Σ Xi . i=l Es ist π = 0,47, 1 - π = 0,53 und η = 800 . Die X ± sind identisch zweipunktverteilt mit Parameter π und stochastisch unabhängig, weil die Geburt einer weiblichen oder männlichen Maus nicht davon abhängt, daß eine andere weibliche oder männliche Maus geboren wird. Somit ist X', die Anzahl der weiblichen Mäuse, ß(n, π) = в(800;0,47) - verteilt . a) Mithin ist ρ ( χ ' > 3 5 θ ) = 1 - ρ ( χ ' < 3 5 θ ) = 1 - F x ,(35o|n, π) . Wegen

0,1 < π = 0,47 9

Hilfe der

Ν(ηπ; ηπ(ΐ - π)), also

kann der

N(37 6;199,28) (Stetigkeitskorrektur) : F„ Ч

(350 + 0,5 - 37 6"| , = F„(—1,81) = 0,0351 и л/199,28 )

approximiert werden. Damit ist ρ ( χ ' > 3 5 θ ) = 1 - 0,0351 = 0,9649 die Wahrscheinlichkeit dafür, daß unter 800 neugeborenen Mäusen mehr als 350 weibliche Mäuse sind.

2. Schließende Statistik

263

b) Aus Teilaufgabe a) folgt, daß π aus der Beziehung 400+0,5-0,47n

= Fyi-1,64) = 0,05

•n-0,47-0,53' ι. τ .i .i. ... abzuleiten ist. Wird so ergibt

sich

400+0,5-0,47n , „. . „ ... . — - — - j — — ' — — = -1,64 nach η aufgelost, •n-0,47-0,53 '

als Lösung (der quadratischen Gleichung) n^ = 802,8

und Og = 904,5 . Es mUssen also rd. 905 №Luse geboren werden.

Lösung 47 Sei 1, falls der i-te befragte Teilnehmer der Veranstaltung EDV-Kenntnisse hat, X

i =

0

sonst.

Aus der zweipunktverteilten Gesamtheit wird eine Stichprobe - Auswahl η ohne Zurücklegen - vom Umfang η gezogen. Die Zufallsvariable X' = Σ X, i=l folgt somit einer H(n,N,N ). a) η = 10;

N = 15;

ί^ = Ν·π = 15-0,6 = 9; Χ'~H(10;15;9).

al) P(X'S6) = 1 - P(X't7) = 1 - [P(X'=7) + P(X'=8) + P(X'=9) + + P(X*=10)] = 1 - [f x ,(7110,15,9) + f ,(8|10,15,9) + + f x ,(9110,15,9) + f x ,(10110, 15,9)] =

= 1 -

= 1 -

M.M.ffiäj 36,20

+

3003

+

165) = 1 - P(X's65) = 1 - F x ,(65) = 1 - Fy

65+0,5-42 •14,592'

= 1 - Fjj(6,15) = 1 - 1 = 0 , so daß die Wahrscheinlichkeit, daß mehr als 65 der 70 befragten Studenten über EDV-Kenntnisse verfügen (fast) Null ist.

Lösung 48 Die der Untersuchung zugrunde1iegende Gesamtheit mit Parameter π = 0,125.

ist zweipunktverteilt

Sei Χ^ eine Zufallsvariable (Stichprobenvariable), die die Werte x^ = 1 (falls das i-te Kind Linkshänder ist) und Xj = 0 (falls das i-te Kind nicht Linkshänder ist) annehmen kann. Dann ist η X' = Σ X. die zufällige Anzahl der Linkshänder in der Stichprobe vom i=l 1 Umfang n. a) Der Gesamtheit vom Umfang N = 16 wird eine Stichprobe vom Umfang η = = 6 entnommen. Es ist anzunehmen, daß "ohne Zurücklegen" gezogen wurde. Somit ist X' hypergeometrisch verteilt mit Parametern η = 6, N = 16 und Nj = Ν · π = 16 · 0,125 = 2 , d.h. X'~ H(6;16;2) . Damit ist

Fl P41 6 J

a x ) P(X = 1) = f v , (1 |6; 16; 2) = ^ { [ g ^ = 0,!

die Wahrscheinlichkeit dafür, daß sich unter den 6 auszuwählenden Kindern genau ein Linkshänder befindet und a 2 ) P(X'>2) = P(X'£3) = 0 die Wahrscheinlichkeit dafür, daß sich in der Stichprobe vom Umfang η = 6 mehr als zwei Linkshänder befinden. Da in der zugehörigen Gesamtheit nur zwei Kinder Linkshänder sind, können in der Stichprobe nicht mehr als zwei Linkshänder sein (unmögliches Ereignis). b) Für die "größere Untersuchung" gelten die gleichen Bedingungen wie oben, d.h. zweipunktverteilte Gesamtheit mit π = 0,125 und Auswahl ohne Zurücklegen.

2. Schließende Statistik F o l g l i c h 1st - mit

N^ = Ν · jt = 1000 · 0,125 = 125 - d i e

265

zufällige

Anzahl X'der linkshändigen Kinder H ( 9 1 j 1 0 0 0 ; 1 2 5 ) - v e r t e i l t . Die Wahrscheinlichkeit P ( X ' s l l ) = P(X'=0) + P(X'=1) + . . .

+ P(X*=11)

i s t aber schwer zu berechnen, so da6 es zweckmäßig e r s c h e i n t , diese Wahrscheinlichkeit zu approximieren. Eine Approximation der H(91;1000;125) durch d i e B(91;0,125) i s t nicht z u l ä s s i g , weil n/N = = 91/1000 = 0,091 > 0,05, der Auswahlsatz also zu groß i s t . Eine Approximation der H(91; 1000; 125) durch d i e NormalVerteilung Jedoch möglich, denn d i e Approximationsbedingungen

ist

0,1 s π = 0,125 s 0,9 und ηπ(1-π)^ργ = 91

0,125 · 0,875

sind e r f ü l l t . Somit g i l t

1000-91

9,056 > 9

1000-1

approximativ

Χ' - Ν^ηπ;ηπ(1-π)ίργ| = N( 11,375; 9,056),

P ( X ' s l l ) = F x , ( 1 1 ) = Fy

11+0,5-11,375

und

= Fy(0,042) = Fy(0,04) = 0,516

-19,056 i s t - approximativ - d i e Wahrscheinlichkeit dafür, daß unter den 91 Kindern höchstens 11 Linkshänder sind.

Lösung 49 a ) η ь 9/[it( 1 - π ) ]. b) Abbildung 200

180 160 -

140 120 П 100 -

80 -

60 40 20 0

I ' I 1 I ' I ' I ' I ' I 1 I ' I •I 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

2. Schließende Statistik

266

Der schraffierte Bereich enthält alle zulässigen n. Das Minimum liegt bei π = 1-π = 0 , 5 (Symmetrie). N.B. : Bei sehr kleinem (großem) τι (π0,9) liefert diese Bedingung keine hinreichenden Stichprobenumfänge!

Lösung 50 Sei 1, falls das Fußpilzmittel beim i-ten Behandelten zum Behandlungserfolg führt, X. = ι

X' =

0

sonst.

η Σ X. i=l 1

und π = P(X =1) = 0,85. 1

Stichprobe (ohne Zurücklegen) vom Umfang η = 800 aus einer Gesamtheit, deren Umfang N unbekannt ist, von dem aber angenommen werden kann, daß er größer als 16000 ist, so daß der Auswahlsatz n/N s 0,05 ist. Die Zufallsvariable X', die Anzahl der geheilten Personen, ist H(800; Ν;Ν·0,85)-verteilt. Die hypergeometrische Verteilung kann durch die Binomial Verteilung approximiert werden, da der Auswahlsatz klein ist. Die B(800;0,85) kann durch die Normalverteilung approximiert werden, da 0,1 ί π = 0,85 s 0,9 und ηπ(Ι-π) = 800-0,85·0,15 = 102 > 9 . D.h.: Χ' ~ Ν(ηπ;ηπ(1-π)) und ist somit approximativ N(680;102)-verteilt. Damit ist p j g ^ * 0,82] = P(X's656) = F u [ 6 5 6 ^ " 6 8 0 ] = Fy(-2,33) = 0,0099 die Wahrscheinlichkeit, daß höchstens 82% geheilt werden, wenn die Behauptung des Herstellers richtig ist.

Lösung 51 Zufallsvariable X: Anzahl der Zeitraum von 13.55-14.00 Uhr.

ankommenden

Kunden

an

der

Kasse

im

X folgt einer POISSON-Verteilung mit Parameter μ = 3,5 . χ a) Ρ(X=0) = ί χ (0|3,5) = ^ e

μ

=

e Die Wahrscheinlichkeit, daß kein Kunde in diesem Zeitabschnitt an die Kasse kommt, beträgt etwa 3%.

267

2. Schließende Statistik

b) P(X>3) = 1 - P(Xs3) = 1 - f x (0|3,5) + f x (l|3,5) + ί χ (2|3,5) + + f x (3|3,5) = = 1 - (0,0302+0,1057+0,1850+0,2158) = = 1 - 0,5367 = 0,4633 . c) P(1 9 und

, n=300 und N=4000 e r f ü l l t .

298

2. Schließende Statistik

b) Stichprobenumfang Anteil der Befürworter: p 1 = ρ = 0,6, ε = 0,03. n

.

λ

Ια/2Ρ(1-*»

. 1,96 2 .0,6.Q,4 ·

1024

0,03 Z

с

D a eine Auswahl ohne Zurücklegen gezogen wird, (Mindest-)Stichprobenumfang auf n

. _ η - ^

_ -

N

1024 1

· -8

1 5

reduziert

sich der

·

4000

Lösung 90 Zufallsstichprobe vom Umfang η = 49 aus einer Gesamtheit vom Umfang N = = 258. Die Zufallsvariable X ist der tägliche Milchbedarf eines Kleinkindes. Es ist anzunehmen, daß die Stichprobe nach dem Prinzip einer Auswahl ohne Zurücklegen gezogen wurde. Der Auswahlsatz n/N = 49/258 = = 0,19 > 0,05 kann bei den weiteren Überlegungen nicht werden.

vernachlässigt

Die Verteilving der Gesamtheit ist nicht bekannt. Stichprobenmittel: χ = 0,5 1/Tag bzw. 75 g/Tag. a) Konfidenzintervall für den Mittelwert, Konfidenzniveau:

1-a = 0,9545 -»

= 2; 1 5 · 0 · 85 2 J Щ -

82944

= 0,973[0,1639-0,0611] = 0 , 1 0 , t

144

=

° ' 9 7 3 [ 0 · 1 6 3 9 + 0 , 0 6 1 1 ] = 0,22 .

Somit ist [0,10;0,22] das empirische Konfidenzintervall denzniveau 1-a = 0,9545 für den Antellswert. Die Approximationsbedingungen sind erfüllt, Interval1grenze

zum

Konfi-

da schon für die

untere

n t U ( l - t U ) = 1 4 4 Ό , 1·0,9 = 12,96 > 9 und 0, 1 з t U £ 0,9 gilt. Das Konfidenzintervall für die Anzahl der (erwachsenen) Teilnehmer der geplanten Demo ergibt sich durch Multiplikation der Interval 1 grenzen für den Anteilswert mit der Anzahl der erwachsenen Einwohner der Stadt und dem Anteil der Grünen (bzw. Sympathisanten), die a n einer Demo teilnehmen. Somit sind 0,1·50000·0,8 = 4000 Teilnehmer und 0,22-50000«0,8 = 8800 Teilnehmer die Intervallgrenzen denzniveau 0,9545.

des

gesuchten

Konfidenzintervalls

zum

Konfi-

b) Die Einnahmen der grünen Kasse liegen mit einem Konfidenzniveau von 95,45% im Intervall [0,8 DM ·4000;0,8 DM ·8800] = [3200 DM;7040 DM],

Lösung 92 Gegeben ist eine zweipunktverteilte Gesamtheit erwachsener Personen, die einen bestimmten privaten Fernsehsender empfangen können (Frühstücksfernseher - keine Frühstücksfernseher) mit unbekanntem Parameter π. Dieser Gesamtheit wird eine Stichprobe vom Umfang η = 420 - wohl nach dem Prinzip einer Auswahl ohne Zurücklegen - entnommen. Es kann davon ausgegangen werden, daß der Umfang der Gesamtheit größer als 8400 ist, so daß der Auswahlsatz n/N = 420/N < 0,05 ist und die Stichprobe wie eine einfache Stichprobe (Auswahl mit Zurücklegen) interpretiert werden kann. Sei X

die Stichproben-(Zufalls-)variable,

die die Werte

(Realisationen)

301

2. Schließende Statistik

1, falls die 1-te Person die Weltmeisterschaft im Frühstücksfernsehen ansieht, X

i =

0

sonst,

annimmt. Kurz: falls die i-te Person die Weltmeisterschaft im Frühstücksfernsehen ansieht, sonst. Dann ist 420 Σ X die zufällige Anzahl der "Frühstücksfernseher" i=l probe und x'= 60 die zugehörige Realisation. X' =

a) Eine ist

Punktschätzfunktion

Ρ =

420 60 420

Ρ = 420

für den wahren,

aber

in der Stich-

unbekannten Anteil

und

0,143 ist der gesuchte Schätzwert.

b) Da der Stichprobenumfang η > 400 ist, gilt näherungsweise λ

0,98 =

ρ[ρ _

2

·°

2,Ο5

π



1-α/2

5):

J H E E I < π < Ρ + 2,05 j m ^ Z

] = 0, 96 .

Mit ρ = 0,143 (s.o.) ergibt sich: 0,143 - 2,05

Ρ

4 3

' 0 · 420

8 5 7

ί π ϊ 0,143 + 2,05 " 4

,143·0,857 420

Γ-

0,143 - 2,05 · 0,017 ί ι ί 0,143 + 2,05 · 0,017 0,143 - 0,035 ί и s 0,143 + 0,035 0,108 i n s

0,178 .

Das (approximative) empirische Konfidenzinterval1 zum Konfidenzniveau 1-a = 0,96 ist also [0,108; 0,178]. Ob der wahre Parameter π tatsächlich innerhalb der Grenzen 0,108 und 0,178 liegt, ist unbekannt. Der Parameter π ist e i n fester Wert. Entweder liegt er innerhalb dieser Grenzen oder nicht. Weil aber 96% aller Stichproben vom Umfang η = 420 aus dieser Gesamtheit Konfidenzintervalle liefern, deren Grenzen den wahren Parameter einschließen, kann m a n "zu 96%" davon überzeugt sein, daß die oben berechneten Intervallgrenzen den wahren Parameter π einschließen.

2. Schließende Statistik

302

Lösung 93 Die Länge des Konfldenzlntervalls ist - ceteris paribus - proportional zu 1/Vn. Mithin muß, soll die Länge des Intervalls halbiert werden, der Stichprobenumfang vervierfacht werden: с = λ·σ · — ; Λ /—" vn

daraus folgt | = λ · σ ν · | · — 1 = λ·σ ν — . ώ Λ £ ί— A /. < vn v4n

Lösung 94

Sei

1, falls i-ter Studierender in psychiatrischer Behandlung ist,

=

0

sonst.

Somit folgt die Gesamtheit einer Zwei-Punkt-Verteilung. N = 4100, η = 200, η/Ν < 0,05; ρ = 30/200 = 0,15; 1-α = 0,9545 . Es fehlt zwar eine Angabe über die Art der Zufallsauswahl der Studierenden, da jedoch der Auswahlsatz klein ist, kann zumindest annähernd von einer Auswahl mit Zurücklegen ausgegangen werden. Da η < 400 ist, ergeben sich mit = 2 die folgenden Intervallgrenzen für den wahren, aber unbekannten Anteilswert in der Gesamtheit der Studierenden, die sich in psychiatrischer Behandlung befinden.

l

200 - - V

»

* ά

-

· -rsfeöö ] - ·•

200

= - V

[°· 15

+

ш

+

V

0

-

^

* -Пmro }

-

200

Somit ist [0,1064;0,2073] das empirische Konfidenzintervall für den Anteilswert der behandelten Studierenden, [436; 850] das empirische Konfidenzintervall für die Anzahl Bamberger Studierender, die in psychiatrischer Behandlung sind, und [5232h;10200h] das empirische Konfidenzintervall für den Bedarf an psychiatrischen Behandlungsstunden (jeweils bei einem Konfidenzniveau von 1-α = 0,9545). Die Approximationsbedingungen sind erfüllt.

Lösung 95 Zufallsvariable:

^

_ 1

1, falls der Mechaniker sich zum i-ten Zeitpunkt mit der Beschaffung von Ersatzteilen beschäftigt, 0

sonst.

2. Schließende Statistik

d.h. d i e Gesamtheit folgt einer

303

Zwei-Punkt-Vertellung.

Z u f a l l s s t i c h p r o b e v o m U m f a n g η = 144 (Auswahl o h n e Zurücklegen) aus einer k o n t i n u i e r l i c h e n Gesamtheit der Länge 50 S t u n d e n (5 Arbeitstage z u je 10 Stunden). Die S t i c h p r o b e n v a r i a b l e n k ö n n e n als s t o c h a s t i s c h u n a b h ä n g i g a n g e s e h e n werden, w e n n m a n s i c h vorstellt, daß Brause d i e B e o b a c h t u n g s z e i t p u n k t e im v o r g e g e b e n e n B e o b a c h t u n g s z e i t r a u m zufällig auswählt, d.h. eine e i n fache S t i c h p r o b e v o m U m f a n g η = 144 zieht. Ρ . = N ,/n, j=l,2,3,4 ist eine S c h ä t z f u n k t i o n für it., d e n w a h r e n J J J der j - t e n Tätigkeit a n der Gesamtzeit (den 50 Stunden). a) Für die T ä t i g k e i t "Ersatzteile beschaffen"

Anteil

(j=2) ist f o l g l i c h

P 2 = n 2 / n = 36/144 = 0 , 2 5 = 25% e i n PunktSchätzwert für d e n Anteil

und

P 2 ' 5 0 = 0 , 2 5 - 5 0 = 12,5 (h) e i n P u n k t S c h ä t z w e r t für die Wochenstunden, die auf d i e T ä t i g k e i t "Ersatzteile beschaffen"

entfällt.

b) Für die B e s t i m m u n g eines Konfidenzintervalls für π ist z u beachten, daß der U m f a n g N der Gesamtheit u n e n d l i c h ist. Damit ist n/N 400),

so

daß

die

Binomialverteilung durch die Normalverteilung approximiert werden kann. Da λ 2 / η , λ 2 / 4 η 2 und λ 2 / 2 η "klein" sind, gilt: рГр-л j m ^ (_ Ι-α/2 -I η

a

j

t

a

P

x

+

Ш ] : , . , . l-a/2 - I n J

Es ist ρ = 258/578 = 0,4464, und λ, = λ„ „ „ = 1,96 . l-a/2 0,975 Damit ist 1

578 =



[°·4464 -

= 0,48693

1,96 j ° ' 4 4 6 g 7 3 ' 5 — j = 0,4464 - 0,0405277 = 0,40587,

und 0,406 £ π £ 0,487

das (approximative) Parameter π.

empirische

Konfidenzintervall

für

den

unbekannten

Mit einem Konfidenzniveau von 95% liegt die Wahrscheinlichkeit, daß ein neugeborenes Bamberger Kind ein Mädchen ist, im Intervall [0,406;0,487]. Bei der Interpretation ist zu beachten, daß das empirische Konfidenzintervall auf dem Geburtenverhältnis des Jahres 1983 beruht und sich dieses Verhältnis im Zeitablauf ändert.

Lösung 99 Sei X i die ideale Rocklänge bei der i-ten Stadtbewohnerin

mit Konfektions-

größe 42; Yj die Ideale Rocklänge

bei der j-ten Landbewohnerin

mit Konfektions-

größe 42. X^ und Y j folgen jeweils einer unbekannten Verteilung. Aus beiden Gesamtheiten werden jeweils einfache, voneinander unabhängige Stichproben vom Umfang η = 40 (Stadtbewohnerinnen) bzw. m = 52 (Landbewohnerinnen) gezogen. In beiden Stichproben geht es um den Mittelwert der idealen Rocklängen. Beide Stichprobenmittelwerte sind vor der Ziehung der Stichproben Zufallsvariable. D a beide Stichprobenumfänge mit η = 40 und m = 52 hinreichend groß (größer gleich 40) sind, folgen die Stichprobenfunktionen

1 X = -

n

1 Σ X, und Υ = -

m

Σ Y.

jeweils approximativ

306

2. Schließende Statistik

2

e i n e r Normal v e r t e i lung mit μ^ und Gesucht μχ -

ist

μγ.

ein Konfidenzintervall

Grundlage

für

Zufallsvariable X -

Y,

die

(Τ2 Χ 2 = — bzw. μ^ und 32000 ist, so daß, wegen n/N < 1600/32000 < 0,05, die Endlichkeitskorrektur bei einer Auswahl ohne Zurücklegen vernachlässigt werden kann: η = n' . b) Konfidenzintervall für den Anteilswert. Sei X. = ι

1, falls der i-te erwachsene Bundesbürger Kreditkarten verwendet, 0

sonst.

Dann ist X' =

Σ X i=l

bei einer Auswahl mit Zurücklegen B(n, ir)-vertei lt

und bei einer Auswahl ohne Zurücklegen, wegen des kleinen Auswahlsatzes, approximativ B(n,n)-verteilt. Weil der Stichprobenumfang hinreichend groß ist und die Approximationsbedingungen erfüllt sind, kann die Β(η,π) durch die Ν(ηπ, nir( l-π)) approximiert werden, so daß ein approximatives Konfidenzintervall für it mit Hilfe der Normal Verteilung bestimmt werden kann. 2 2 2 2 Wegen n/N < 0,05 und weil λ /η, λ /4п , vor allem aber λ /2п (=0,00125) wegen η > 400 klein sind, gilt (auch bei einer Auswahl ohne Zurücklegen) näherungsweise:

J

3

?

1

« · • ' • » „ / , F F

1

]

Daraus ergibt sich mit λ^ ^ ^ = 2 und ρ = 0,17:

^1600 =

0

.



P

S

F



s

316

2. Schließende Statistik

t u - " · ™ · 1 4 3 ^

= °·1888 -

so daß [0,1512,0,1888] das empirische Konfidenzintervall i s t , welches mit einem Konfidenzniveau von 0,9545 den unbekannten Parameter π (den Anteil von Kreditkartennutzern) einschließt. Lösung 110 Sei X. = ι

1, f a l l s i - t e r Einwohner der Änderung zustimmt, 0

=» X i s t

sonst. zweipunktverteilt.

a) Auswahl ohne Zurücklegen, aber n/N = 400/50000 = 0,008 < 0 , 0 5 . Annahme: 0,1 s π ^ 0,9 . Aus

η =

λ?-α/2Ρ(1-Ρ)

^

folgt

с C =

IP(l-P)' , l-a/2 J - й — = I " -

Es i s t XQ

D, pl

= 1,96, so daß sich mit ρ = 0,1 und η = 400

g75

und mit ρ = 0,5 und η = 400

с = 0,049 e r g i b t .

с = 0,0294

O f f e n s i c h t l i c h i s t es

nicht möglich, π auf ± 2%-Punkte (=0,02) genau zu schätzen. b) π ί 0,2; ητι(Ι-π) = 64; Approximation durch die Normalverteilung, U =

P-ir

d.h.

· ~ N(0; 1) .

I ii(l-Jt)'

Daraus f o l g t mit λ = λ^

Ρ(-λ * U *

+λ)

= 1-α,

α /2 :

ρ[π - λ

£ Ρ < π + λ

Mit λ = 2 (1-α=0,9545) i s t λ | π ( 1 ~ π ) = 2 •J η Ί der Anteil

400

] 1 χ-«.

= 0,04, so daß

der zustimmenden Einwohner mit Wahrscheinlichkeit

in den Grenzen 0,16 ί Ρ ί 0,24 zu erwarten i s t . c ) Es i s t πл £ 0,2 ' und гρ = 0,3. '

0,9545

2. Schließende Statistik Mit

diesem

position,

Stichprobenergebnis

(p=0,3)

höchstens 20% der Einwohner

ist

die

Annahme

(71^0,2) würden der

der

317 Op-

geplanten

Änderung zustimmen, nicht widerlegt. Auch wenn π^ ί 0,2 richtig ist, kann

ρ

=

0,3

(oder

größer)

sein,

obwohl

jedoch

P(P£0,3|π=0,2)


9 ist, ist die Prüffunktion о о Χ'-ηπ Τ =

/ π г νηπ (1-π ) о о

unter Η0 approximativ standardnormalverteiIt.

Η ist zu verwerfen, falls t £ λ, = λ„ __ = 1,64 ist. ο 1-α 0,95 Mit η = 1000, χ' =

1000 Σ χ

= 300 und π

1=1

t = 300 125 _ jg y ) •109,375'

so

= 0,125 ergibt sich °

jjgß jj z u verwerfen ist. Es gibt also °

einen Grund anzunehmen, daß Hq nicht richtig ist. Das Stichprobenergebnis steht im Widerspruch zur Nullhypothese. Die Behauptung des Abgeordneten wird wohl richtig sein.

Lösung 114 Unter

Hq

ist

Τ

standardnormalvertei It,

so

daß

die

aufgrund

einer

Stichprobe berechnete Realisation t für eine Entscheidung lediglich mit einem Quantil der Standardnormalverteilung (kritischer Wert) verglichen werden muß. Dabei wird das Quantil (zum Beispiel λ^) der jeweiligen Nullhypothese festgelegt.

und dem

gewünschten Signifikanzniveau

(α) entsprechend

320

2. Schließende Statistik

Wird X a l s

P r ü f f u n k t i o n verwendet,

zum B e i s p i e l

c^,

mit

dem dann d i e

so muß zunächst d e r k r i t i s c h e Realisation

χ

zu

Wert,

vergleichen

ist,

b e r e c h n e t werden. Mit λ ^ i s t zum B e i s p i e l с

α

0,8 Promille

( R 2 ) und

(2) die

( v o r l ä u f i g e ) Entscheidung d e r K o n t r o l l e

(E),

a) Blutalkoholanteil

gemäß A l k o h o l - T e s t s 0 , 8 P r o m i l l e

(Ej),

b) Blutalkoholanteil

gemäß A l k o h o l - T e s t > 0 , 8 P r o m i l l e

(E2).

Nach d e r f o l g e n d e n Ü b e r s i c h t sind zwei F e h l e n t s c h e i d u n g e n

E1

R1

R2

-

le,

E2

r#

f12

г

f21

der Fehler e r s t e r Art

möglich.

Kontrolle entscheidet > 0,8

obwohl ϊ 0 , 8 P r o m i l l e r i c h t i g i s t

Promil-

( f a l s c h e Entscheidung zu U n g u n -

s t e n des F a h r e r s ) , -

der

Fehler

Promille,

zweiter

obwohl

zugunsten des

>

Art 0,8

d i e

Promille

K o n t r o l

richtig

ist

l

e

entscheidet (falsche

ί

0,8

Entscheidung

Fahrers).

Hinweis: Aus diesem B e i s p i e l wird d i e Forderung v e r s t ä n d l i c h , daß d i e W a h r s c h e i n l i c h k e i t f ü r e i n e n F e h l e r 1. A r t g l e i c h d e r W a h r s c h e i n l i c h k e i t f ü r e i n e n F e h l e r 2. A r t s e i n s o l l t e !

2. Schließende Statistik

321

Lösimg 116 Es kann angenommen werden, daß die Füllgewichte X^ der 500 g Packungen approximativ

N(500;225)-verteilt

sind

und

daß

die

Prüffunktion

X

approximativ N(500;2,25)-verteilt ist. a) Es handelt sich hier um einen Test für den Mittelwert bei bekannter 2 Varianz der Gesamtheit. Es liegt eine große Stichprobe (n=100>40) aus

einer beliebigen

Gesamtheit vor.

ohne Zurücklegen gezogen.

Vermutlich wurde eine Auswahl

Man kann Jedoch von einem kleinen Auswahl-

satz ^2000j ausgehen. Für den einseitigen Test H Q : μ г 500 g gegen Hj.- μ < 500 g ergibt Slch w

0,05

aus

P(T 6K |H ) = α = 0,05, P(Xsw. ηκ |μ=500) = 0,05, F 5 (w n „ ) = 0,05, η ос о 0,05 Χ 0, Ob f w o OR" 5 0 0 ! fJ

ι5

-1,64 = (wQ

= 0,05 und daraus folgt mit A Q 05-500)/l,5

und w Q

Q5

Q5

= -1,64

= 500 - 1,64-1,5 = 497,54 (g).

H q ist folglich (auf dem Niveau α = 0,05) zu verwerfen, wenn für eine konkrete Stichprobe χ s 497,54 g ist. Der kritische Bereich K Q

Q5

umfaßt das Intervall (-»; 497,54]. Weil die x i s 0 sind, ist hier [0;497,54] der kritische Bereich. b) Die Gütefunktion gl μ) bestimmt werden. Ρ ( Χ ^ 0 5 ,μ) = β ( μ ,

kann mit

und

Hilfe

Г„( Щ * )

von P C T ^ K J m )

-

=

αίμ)

= «(μ) ,

so daß - für eine Skizze - in diesen Ausdruck lediglich ganzzahlige Werte von μ für μ < 500 einzusetzen und die Werte von Γ^ίζ) für die entsprechenden ξ aus der Tabelle abzulesen sind. Beispielsweise ist für μ = 499:

F

u[497'i?54"]

= F

u ( "°' 9 7 )

=

8(499)

=

^M

4

" ) = °· 17 ·

322

2. Schließende Statistik

Somit ergeben sich die folgenden Werte der GtltefunktIon:

μ

β(μ)

500 499 498 497 496 495 494

0,05 0,17 0,38 0,64 0,85 0,95 0,99

c) Aus b) folgt, daß die Wahrscheinlichkeit dafür, daß Hq verworfen wird, wenn H ^

μ = 495 g richtig 1st, gleich Ρ(Χ*497,54|μ=495) =

= g(495) = 0,95 ist. Mithin ist l-g(495) = ß(495) = 0,05 die Wahrscheinlichkeit dafür, daß Hn nicht verworfen wird, wenn H1: μ = 495 g richtig ist. d) 1.0

0.8

0.6 9(μ)

0.4

0.2 0.0

494

495

496

497

498

499

500

Die GUtefunktlon g ^ ) gibt in Abhängigkeit von μ die Wahrscheinlichkeit dafür an, daß Hq: μ г 500 g verworfen wird.

Lösung 117 a) Wenn α = β sein soll, muß der kritische Wert w. In der Mitte 1-α zwischen μ = 0 und μ. = 1, also bei 0,5, liegen.

323

2. Schließende Statistik

Aus w„ = μ + λ, · — f o l g t mit μ = 0, η = 16, σ = 2 und 1-α 'о l - α y^j о w. = 0,5: 1-α 0,5 = 0 + λ , ·2/4 und daraus λ , = 1. 1-α 1-α Aus d e r T a b e l l e

i s t abzulesen,

α = 0,159

Somit

ist.

auch β = 0,159

ist

daß λ_ = 1, so daß l - α = 0,841 und 0,841

α auf 0,159 f e s t z u l e g e n

(daraus f o l g t ,

daß

ist).

b ) Aus a ) f o l g t mit λ

=

95

λο

=

1 , 6 4 :

0 , 5 = 0 + 1 , 6 4 · — und daraus η = ( 1 , 6 4 · 4 ) 2 = 43,03 = 44, Vn probenumfang, f ü r den α = β = 0,05 .

der

Stich-

Lösung 118 a ) Ob e i n e D i f f e r e n z d e r A r t bedingten

Differenz

die

bedingte

Wahrscheinlichkeit

Wahrscheinlichkeit

entscheidenden

n,

Ungleichung (zumindest

-

bei

sich

TSCHEBYSCHEFF einer

Daraus f o l g t daß

|*ε|Η ) = α, О1 'О

ε 0,4 zu testen, mit dem Ziel, Η zu verwerfen, & о 1 о η Prüffunktion ist Τ = Σ X,, die - unter Η - B(20;0,4)-verteiIt ist. i=l 1 Η ist zu verwerfen, falls t £ w. ist; dabei wird zunächst (diskrete ο 1-α Prüfverteilung) α auf etwa 0,05 gesetzt. Es ist t = 9 und (vgl. Tabelle der P(T£13|H

Q

)

=

P(Tiw0

9 7 8 G

)

=

0,0211

B ( 2 0 ; 0 , 4 ) ) :

sowie

P(Til2|HQ) = P(Tiw 0>9434 ) = 0,0566, so daß H q

noch nicht einmal auf dem Signifikanzniveau α = 0,0566

verworfen werden kann.

2. Schließende Statistik

327

Für die konkrete Stichprobe ist P(Tat|Hq) = P(T£9|π=0,4) = 0,4044, d.h. die Wahrschelnlichkeit dafür, daß in einer Stichprobe vom Umfang η = 20 9 oder mehr Erwachsene mit Plattfüßen vorgefunden werden, wenn die Nullhypothese richtig ist (daß höchstens 40% aller Erwachsenen Plattfüße haben), ist mit rd. 0,4 recht hoch. Es gibt folglich keinen Grund, sin der Nullhypothese (ns0,4) zu zweifeln.

Lösung 122 a) Sei

X

1, 2, 3, 4,

i

falls falls falls falls

das das das das

1-te 1-te i-te i-te

Gummibärchen Gummibärchen Gummibärchen Gummibärchen

Dann ist die Zufallsvariable

rot ist, weiß ist, gelb ist, grün ist.

X i 4-Punkt-verteilt mit Hj = P(X.=1) =

0,4, ir2 = Р С Х ^ г ) = 0 , 3 und π 3 = Р С Х ^ З ) = 0,1 . Der Gesamtheit vom Umfang N = 20 werden η = 10 Gummibärchen zufällig und nach dem Prinzip einer Auswahl ohne Zurücklegen ("auf einmal") entnommen. Sei Yj die Anzahl der Gummibärchen in der Stichprobe mit der Eigenschaft

(1=1,2,3,4).

Dann

folgt

die

(3-dimensionale)

Zufalls-

variable (Υ^,Υ^,Υ^) einer multihypergeometrischen Verteilung mit den Parametern η = 10, N = 20, ^

= 8, N 2 = 6 und N 3 = 2 .

Somit gilt:

mmί 1ί 1 2 4

4

P(Y

r4;Y2=3:Y3=1) =

3 [l1 [2J 2 20T 10

=

70·20·2'6 70-20-2-6 184756

=

16800 = 0,0909 184756

Mit einer Wahrscheinlichkeit von rd. 9,1% entsprechen die Farbanteile in der Stichprobe den Farbanteilen in der Gesamtheit. b) In dieser Teilaufgabe schränkt roten Gummibärchen ein.

Ernst

E.

die

Betrachtung

auf

die

Daher ist 1, falls das i-te Gummibärchen rot ist, Z

i = 0, sonst.

Die Zufallsvariable Z^ folgt einer Zwel-Punkt-Verteilung mit Parameter π = P(Xj=l), dessen Wert allerdings unbekannt ist.

328

2. Schließende Statistik

Aus der Gesamtheit aller Gummibärchen werden zufällig und nach dem Prinzip einer Auswahl ohne Zurücklegen ("eine Riesenpackung") η = 400 ausgewählt. Da davon ausgegangen werden kann, d a ß die Gesamtheit aller Gummibärchen größer als N = 8000 ist, d.h. n/N s 0,05, k a n n approximativ eine Auswahl mit Zurücklegen angenommen werden. Somit ist die Zufallsvariable Ζ' = Σ Ζ, , die Anzahl der Gummibärchen i in der Stichprobe, approximativ binomialverteilt mit den Parametern η = 400 und π . Aufgrund des großen Stichprobenumfangs (n=400) ist eine (weitere) Approximation durch die NormalVerteilung möglich; d.h. es gilt approximativ Z'~ Ν(ηπ; ηπ( 1-π)) = Ν(400ιτ; 400π( 1-π)). Die Approximation gilt als gut, da η a 400 ist. Es ist z u überprüfen, ob es einen hinreichenden Grund gibt anzunehmen, daß der Anteil der roten Gummibärchen in der Gesamtheit mehr als 40% beträgt. Somit ist Η : π £ 0,4 gegen Η.: π > 0,4 zu testen mit dem Ziel, Η zu verwero А о fen. Prüfmaß für d e n Test von Η Ρ-π Τ =

о

ist

Ζ'-ηπ

2 = π (1-π )' о о

; Ιηπ (1-π )' "I ο ο

unter H q ist Τ approximativ standardnormalverteilt. Stichprobenergebnis: z'= 166, ρ = 166/400 = 0,415 . Mit η = 400 u n d π ο = 0,4 ergibt sich

t —

0,415 - 0,4

Ρ



4(0,6)' 400

166-400·0,4

— ü.blei

.

Ί400·0,4·0, 6'

Entscheidung: Ho

ist z u verwerfen, falls t г

=

λ

ο 95

=

1,64

lst

"

D a s

ist

a b e r

nicht der Fall. H q kann nicht verworfen werden. Somit gibt es keinen Grund anzunehmen,

daß der Anteil der roten Gummibärchen

in der

Ge-

2. Schließende Statistik

samtheit größer a l s 40% i s t . Ernst E. wird wohl In Zukunft auf g e l i e b t e n Gummibärchen verzichten müssen.

329

seine

Lösung 123 Sei Xj (1=1,2

3729) eine Stichprobenvariable,

die die Werte

= 1,

f a l l s der i - t e Befragte d i e d e r z e i t i g e Sendehäufigkeit mit "gerade r i c h t i g " b e u r t e i l t , und x^ = 0 in a l l e n anderen Fällen annimmt. Es i s t x^ = = 0 also genau dann, wenn der 1 - t e Befragte die d e r z e i t i g e Sendehäufigk e i t mit "zu v i e l " oder mit "weiß nicht"

beurteilt.

X. i s t zwe1punktverteilt mit P(X^=1) = π ; dabei i s t π unbekannt. Es wurde eine Stichprobe vom Umfang η = 3729 aus der Gesamtheit a l l e r (erwachsenen) Bundesbürger (vermutlich) nach dem Modell einer Auswahl ohne Zurücklegen gezogen. Weil aber der Auswahlsatz klein ist (n/N 1,64 = A Q

74,5

I

2

44

30,533 g5

ist, wird H q verworfen.

Es gibt also

einen

Grund zur Annahme, daß H q : π S 0,5 wohl nicht richtig ist. Das Ergebnis stützt die Vermutung der Tochter, daß mehr als 50% der Bundesbürger mit der Sendezeit zufrieden sind.

Lösung 124 Es ist anhand des gegebenen Stichprobenergebnisses z u untersuchen, ob wohl zwischen der Antriebsart eines PKW und dem Risiko, in einen "Schneeunfall" verwickelt zu werden, e i n Zusammenhang besteht. Somit ist die Hypothese zu testen, daß der Anteil π der hinterradangetriebenen PKW in der Gesamtheit aller an Schneeunfällen beteiligten PKW genauso groß ist wie in der Gesamtheit aller PKW. Setzt man

χ

1, falls der i-te an einem Schneeunfall beteiligte PKW Hinterradantrieb hat,

_ 1

0

sonst, X zweipunktverteilt mit P(X^=1) = π .

so ist

Da der Anteil der 42 (beobachteten) PKW an der Gesamtheit aller PKW, die in Schneeunfälle verwickelt waren, sehr gering ( 9 und 0,1 s π s 0,9 gilt, kann die Verteilung о о о von X' (unter Η ) durch die NormalVerteilung approximiert werden:

331

2. Schließende Statistik

P(X'£38|H ) = 1 - PCX's37,5|H ) = 1 о о Χ'-ηπ = 1 - Ρ Vxm (1-π )' о о

37,5-21 3,24

1 - 1 = 0

= 1 - Fu(5,09)

Damit ist H q auf jedem sinnvollen Signifikanzniveau zu verwerfen. Die in der Aufgabe beschriebene Beobachtung

ist wohl kaum durch d e n Zufall

zu

erklären.

Lösung 125 1, falls die i-te geimpfte Person erkrankt, a) Sei X i = 0, falls die i-te geimpfte Person nicht erkrankt. Dann ist P(X.=1) = π und zu testen ist Η : π £ 0,2 ι о zu

verwerfen,

Wirkung wie

d.h.

(тг^О,2),

ohne

H^:

Grippeschutzimpfung

es erkranken mit

Impfung.

Stichprobe.

die

Informationen

π


9) Ρ - Ν(π ;π (1-π )/η) = ο ο ο = N(0,2;0,0001), so daß sich mit α = 0,025 der Annahmebereich seitiger Test):

к Κ

(ein-

f I« (1-π ) Ι = Jp η - λ, J— < Ρ , d.h. α 1 ο 1-α Ί η

0 025

ergibt.

=



Ι 0 · 2 " 1.96·0,01 < Ρ} = {Ρ 10,1804 < Ρ>

Hq

wird

also

nicht

verworfen

für

alle

P,

die

0,1804 sind. Wegen ρ = 0,16 < 0,1804 (p€K„ „ „ ) U,Όέо

ist Η z u verwerfen. О

größer

als

332

2. Schließende Statistik

Es gibt bei dem gegebenen Signifikanzniveau (0,025) Grund zur Annaihme, daß d i e Impfung einen positiven E f f e k t hat. d) Wegen t = - ^ s — = —π г w (1-я ) о о

0.01

= -4 < -1,96

i s t - wie zu erwarten war - Η zu verwerfen. о e ) Man begeht einen Fehler 2.Art, Η о

falsch

ist.

Die

wenn Η

nicht verworfen wird, obwohl

Wahrscheinlichkeit

für

einen

Fehler

2. Art

PCI^eKJH ) = β kann nur bei einfachen Alternativhypothesen bestimmt werden und nimmt - c e t e r i s paribus - zu, wenn α abnimmt.

In diesem

F a l l e bedeutet e i n Fehler 2.Art, daß eine Grippeschutzwirkung besteht (H falsch), jedoch z u f ä l l i g PeK a о ° а Nullhypothese nicht verworfen wird.

ist,

so

daß

die

falsche

f ) P(T «K 1|HJ = Ρ(PeK 1In =0,17) = β . η α 1 α 1 Mithin i s t 0,1804-π P(0,18042 = ш -

falls t £ F „ VyVpl-aSZ

l-a/2 = 0,975 i s t F ^ .

ist

mit

1 = 160 F r e i h e i t s g r a d e n .

1 6 Q . Q> g ? 5

oder

= 1,38 und F ^

7 г F t i>2>

, . l-a/2

1 4 Q ; Q> g ? 5

A l s Wert des Prüfmaßes e r g i b t s i c h t = 5 , 8 / 4 , 5 = 1,29 (und ί daß H q n i c h t

v e r w o r f e n werden kann.

d i e - unbekannten - V a r i a n z e n g l e i c h

= 1,38.

= 0,78),

Es d a r f a l s o angenommen werden,

so daß

sind.

Damit i s t e i n e w e i t e r e Voraussetzung des T e s t s f ü r d i e D i f f e r e n z d e r M i t t e l w e r t e b e i unbekannten V a r i a n z e n ( w o h l ) e r f ü l l t und e s kann nun ( a u f d e r Grundlage d e r b e i d e n ( H a u p t - ) S t i c h p r o b e n ) H q : μ^ = μ^ g e g e n H^: μ^ * ßy g e t e s t e t Prüffunktion ist

werden. Χ-Ϋ

Τ =

,

d i e unter

Η

t-verteilt

ist

mit

ν = η +

" ΓΓΤ σ -+Ίη m + m - 2 = 300 F r e i h e i t s g r a d e n . Η ist о

zu v e r w e r f e n , f a l l s I t l ' I i

at,

1-α/2,ν

ist.

Weil ν = 300 > 120 i s t , kann das Quanti 1 d e r t - V e r t e i l u n g durch das e n t s p r e c h e n d e Quanti1 d e r S t a n d a r d n o r m a l v e r t e i l u n g a p p r o x i m i e r t werden: 'S-α/2 =

λ0,975

= ^

'

Mit χ = 11, у = 13, η = 121, m = 181 und

; 2

=

ergibt

+

sich

t

Ы

'1)а^\ -2

35Ö(624+720)

=

= g 1 1 7 Ό 1174

=

s o

=

4 , 4 8

(mg2)

v e r w o r

f

e n

wird.

Mittelwertdifferenz ist (statistisch) hoch signifikant. Es anzunehmen, daß s i c h d i e beiden Zigarettenmarken hinsichtlich Kondensatgehalts unterscheiden. Hinweis:

Die ist des

In d i e s e r Aufgabe wurden d i e E r g e b n i s s e von zwei s e p a r a t e n Voi—

S t i c h p r o b e n verwendet, um d i e G l e i c h h e i t der V a r i a n z e n zu ü b e r p r ü f e n . Weil e s g e r e c h t f e r t i g t i s t anzunehmen, daß d i e unbekannten V a r i a n z e n g l e i c h s i n d , konnte - mit den E r g e b n i s s e n der b e i d e n ( H a u p t - ) S t i c h proben - ü b e r p r ü f t werden, ob d i e M i t t e l w e r t d i f f e r e n z s t a t i s t i s c h s i g n i fikant ist.

2. Schließende Statistik

346

Wenn angenommen werden kann, daß die beiden Gesamtheiten (aus denen die beiden Vor- und Hauptstichproben stammen) normalverteilt sind, ist die Ziehung von zwei Vorstichproben (für den Varianzentest) nicht unbedingt erforderlich. Es können nämlich Varianzen- und Mittelwerttest nur mit den Ergebnissen der beiden Hauptstichproben, d.h. nur mit einem Datensatz, durchgeführt werden. Der wesentliche Unterschied zwischen den beiden Vorgehensweisen liegt darin, daß im einen Falle zwei Nullhypothesen mit zwei Datensätzen getrennt getestet werden und im anderen Falle ein "kombinierter Test" zweier Teil-Hypothesen mit nur einem Datensatz durchgeführt wird, und das hat Konsequenzen für des Signifikanzniveau. Wird

(bei nur einem Datensatz, d.h. nur aufgrund der beiden Haupt-

stichproben) die Gleichheit der Varianzen auf dem Niveau a^ und die Mittelwerte auf dem Niveau α

getestet, dann kann man zeigen, daß die

Wahrscheinlichkeit dafür, beide Nullhypothesen nicht zu verwerfen, wenn s o cia

sie richtig sind, gleich (1-α^) (l-otg) α

des

"kombinierten

Tests",

also

®

die

das

Signifikanzniveau

Wahrscheinlichkeit

dafür,

mindestens eine Nullhypothese zu verwerfen, wenn beide richtig sind, gleich α ι

+ a

2 ~ α1α2

Es ist allerdings zu beachten, daß der Einsatz von zwei Tests bei nur einem Datensatz im allgemeinen nicht zulässig ist. Daß dies hier möglich ist, läßt sich darauf zurückführen, daß bei normalverteilten Gesamtheiten die Prüffunktionen des Varianzentests und des Mittelwertdifferenzentests stochastlsch unabhängig sind.

Lösung 137 Sei X^ (i=l,2, . . . ,n) das i-te Teil in der Stichprobe aus der Produktion der ersten Maschine und Yj (J=l,2

m) das J-te Teil in der Stichprobe

aus der Produktion der zweiten Maschine mit den Realisationen 1, falls i-tes Teil von Maschine 1 Ausschuß ist, X

i

=

' 0

falls nicht

und 1, falls J-tes Teil von Maschine 2 Ausschuß ist, 0

falls nicht

oder kurz: 1, falls i-tes (j-tes ) Teil von Maschine 1 (2) Ausschuß ist,

X. (Y.) = ι J 0

falls nicht (sonst).

2. Schließende Statistik

347

Die beiden Grundgesamthelten der von beiden Maschinen produzierten Teile sind jeweils zweipunktverteilt

mit den unbekannten

Scharparametern

und jig . Es ist davon auszugehen, daß die beiden Auswahlsätze klein sind 0,05

und

(^ s

S s 0,05), so daß die beiden Stichproben, auch wenn "ohne ZuN

rücklegen" gezogen wurde, zumindest approximativ als einfache ben betrachtet

Stichpro-

werden können. Die Stichproben sind voneinander unabhän-

gig, weil die zugrundeliegenden Gesamtheiten disjunkt sind. Ρ. = - Σ X. ist der zufällige Ausschußanteil in der ersten, Ρ = - Σ Y. 1 η j i 2 m j j der zufällige Ausschußanteil in der zweiten Stichprobe. Zu testen ist die zweiseitige Hypothese ("unterschiedliche" anteile) π

V

ΐ = π2

mit

dem

gegen

Ziel,

Hq

H

Ausschußan-

l : "l * π 2 · ZU

verwerfen.

Gelingt

dies,

gibt

es

einen

Grund

anzunehmen, daß die Vermutung des Produktionsleiters wohl richtig ist. Prüffunkt ion ist Ρ Τ =

1

- Ρ

2

; dabei ist

Ρ eine Schätzfunktion für den

unbekann-

' " - » I M ten Parameter π unter H q : ir^ = π^ = π , deren Wert ρ mit p

Ρ κ =

ln + p2m η + m

zu bestimmen ist. Wegen η = m = 500 sind die Approximationsbedingungen erfüllt, so daß die Prüffunktion approximativ standardnormalverteilt ist. H q ist zu verwerfen, falls |t| ь ^χ-χ/Σ

= λ

0 975

=

1,96

ist

Mit Pj = 0,10 und p 2 = 0,13 sowie η = m = 500 ergibt sich:

P

=

0,10·500 + 0,13*500 . = 500 + 500 °'115 '

so daß

·

2. Schließende Statistik

348

t _

0,10 - 0.13 _ 0,03 _ I ~ ~ F T " " 070202 f l Jo, 115.0,885 [ g j ö + g B o J

·

Well t = I — 1,4851 < 1,96 i s t , kann d i e Nullhypothese auf dem S i g n i f i kanzniveau α = 0,05 nicht verworfen werden. Aus s t a t i s t i s c h e r Sicht g i b t es keinen Grund anzunehmen, daß d i e Ausschußanteile der beiden Maschinen verschieden sind. Lösung 138 Sei X i

(1=1,2,...,n)

d i e Meinung des i - t e n Befragten der Stichprobe

in

Deutschland mit den Realisationen 1, f a l l s die i - t e Person d i e Tötung a l l e r Kampfhunde befürwortet, Xi

=

0, f a l l s nicht

und Yj

(J=l,2, . . . , m )

die

Meinung des

J-ten

Befragten

der

Stichprobe

In

Großbritannien mit den Realisationen 1, f a l l s die j - t e Person die Tötung a l l e r Kampfhunde befürwortet, yJ

=

0, f a l l s nicht.

Die beiden Grundgesamtheiten der deutschen bzw. britischen

Bevölkerung

sind zweipunktvertei l t mit den (unbekannten) Scharparametern it^ und π^ . Es liegen zwei einfache Stichproben vor ( v g l . Aufgabentext), die voneinander unabhängig sind, weil die zugrundeliegenden Gesamtheiten disjunkt sind. Die Z u f a l l s v a r i a b l e (Stichprobenfunktion) Personen an, d i e sich bei der Kampfhunde

ausgesprochen

= j Σ X j g i b t den Anteil der

Umfrage Deutschland

f ü r die Tötung a l l e r

haben. Das b r i t i s c h e Pendant hierzu i s t

Ρ^ =

= m i z v ,J . j Zu testen i s t d i e Hypothese V

*1 * " 2

mit dem Z i e l ,

gegen

HA:

"l


5,99,

5 ) 2

+

l10).

ist.

=

0

077

+ 5>0

+

18>0

Es kann also

= 23

davon

077

>

ausgegangen

werden (es gibt einen Grund zur Annahme), daß sich die Marktanteile geändert haben. Lösung 141 Xj = bevorzugte Kaffeemarke des j - t e n Kunden. a) Es wird vermutet, daß sich die Nachfrage gleichmäßig auf d i e v i e r Marken v e r t e i l t , daß der Anteil der Kunden, die eine bestimmte Marke bevorzugen, f ü r a l l e Marken g l e i c h , f ü r d i e v i e r Marken also j e w e i l s g l e i c h 0,25 i s t . 2 Ein geeigneter Test i s t f o l g l i c h der χ -Anpassungstest, der Test der Anpassungshypothese Η : f „ ( x ) = f (χ|θ) f ü r a l l e χ e IR о Χ о 1 gegen Η.: f „ ( x ) * f (χ|θ) f ü r mindestens e i n χ e IR; I X о 1 dabei

ist

f

( x l e ) die Wahrscheinlichkeitsfunktion der o 1 lung mit dem Parametervektor e = (тг^, π^, n^).

Gleichvertei-

b) Entscheidende Voraussetzung f ü r die Durchführung dieses Tests i s t , daß es sich bei den gegebenen Daten um eine konkrete einfache Zufallsstichprobe handelt. Die Zufallsvariablen X^, j = l , 2 η = = 1000, dürfen nur die Werte А, В, С und D annehmen. Anmerkung: Unter diesen Voraussetzungen i s t n^, d i e Anzahl der Kunden, die d i e i - t e Marke bevorzugen (1=1,2,3,4), f a l l s v a r i a b l e n N..

R e a l i s a t i o n der Zu-

352

2. Schließende Statistik

с ) Die

durch

die

i=l,2,3,4,

Nullhypothese

s i n d bekannt:

spezifizierten

π° = 0 , 2 5 f ü r

Wahrscheinlichkeiten

ji°,

1=1,2,3,4.

Die P r ü f f u n k t i o n

Τ =

4 Σ i=l

(Nj-nir®)2

2

i s t unter Η

approximativ χ - v e r t e i l t

ν = k-1 = 4-1 = 3 Freiheitsgraden. erfüllt,

da ηπ? > 10 f ü r a l l e ι

Es e r s c h e i n t zweckmäßig, fen,

falls t * *2 ^

Mit ηπ°

mit

niij

+

α = 0 , 0 5 zu s e t z e n .

(230-250)2 250

zu v e r w e r f e n

(Gleichverteilung)

Somit i s t Η

zu verwei—

= 7,81 .

i ergibt

(210-250)2 250

+

= 1,6 + 1 , 6 + 6 , 4 + 6 , 4 = 16 > 7 , 8 1 = χ 2 so daß Η о

sind

i.

= 1000·0,25 = 250 f ü r a l l e

_ (270-250)2 250

D i e Approximationsbedingungen

ist.

nicht

Es g i b t

richtig

sich (290-250)2 _ 250

+

g 5

3

,

e i n e n Grund anzunehmen,

ist,

daß

also

einzelne

daß Η

о

Marken

s t ä r k e r a l s andere n a c h g e f r a g t werden. Lösung 142 Х^ = Anzahl d e r A u s f ä l l e d e r EDV-Anlage am j - t e n

Tag.

2

Ein g e e i g n e t e r T e s t i s t der χ - A n p a s s u n g s t e s t . S e i n e Voraussetzungen s i n d e r f ü l l t : Laut Text handelt e s s i c h um e i n e Z u f a l l s s t i c h p r o b e nach dem P r i n z i p einer Auswahl mit Zurücklegen (einfache Stichprobe). Außerdem werden sechs d i s j u n k t e " A u s f a l l k l a s s e n " u n t e r s c h i e d e n . Zu t e s t e n i s t

d i e Anpassungshypothese H q :

gegen H^: Dabei

= Εο(ξ|μ) für a l l e

ξεΚ,

* F q ( ξ | μ ) f ü r mindestens e i n ξ 6 IR .

ist

Parameter μ,

Fq

die

Verteilungsfunktion

der

POISSON-Vertei lung

der n i c h t bekannt und daher aus der S t i c h p r o b e

zu

mit

schätzen

ist. Ein g e e i g n e t e r S c h ä t z w e r t = 2, der

so

daß d i e

folgenden

für μ ist

x = ^ щ ( 0 · 17+1 · 2 0 + 2 · 2 7 + 3 · 18+4· 18) =

Überlegungen

Wahrscheinlichkeitsfunktion

für

die

POISSON-Vertei lung

mit

2. Schließende Srarisrik

,

f^(x|2) =

2

e

-2

, χ = 0,1,2,..., durchgeführt werden.

Die Prüffunktion Τ =

к (Nj-nP®)2 Σ 1=1

mit i> = k -

353

2

ist unter Η

approximativ χ -verteilt

nP°

l - r = 5 - l - l = 3 Freiheitsgraden, r = 1 ist die Anzahl

der aus der Stichprobe geschätzten Parameter; die Klassen

"4 Ausfälle"

und "5 und mehr Ausfälle" werden wegen np° < 10 zu einer neuen Klasse "4 und mehr Ausfälle" zusammengefaßt, so daß sich die Anzahl der Klassen von 6 auf 5 verringert. Die Approximationsbedingungen sind dann erfüllt. 2 2 Η ist zu verwerfen, falls t а у = у = 7 81 . ο 1-α, ι> 0,95;3 Die geschätzten hypothetischen Wahrscheinlichkeiten P° werden gemäß P° = P(X=x.|Fx(?) = F q (?|m)) = f x (x i |2) bestimmt. Sie können der Tabelle der PV(2) entnommen werden.

2 о, (ηΓηΡι) t

χ

0 1 2 3 4 u. m. Σ

Weil

η. 1 17 20 27 18 18 100

2 t = 3,706 < χ g 5

3

0 0 0 0 0

о P i

о nPj

1353 2707 2707 1804 1428

13,53 27,07 27,07 18,04 14,28

1

100

о пр. 0,890 1,847 0,000 0,000 0,969 t=3,706

= 7,81 ist, kann die Nullhypothese nicht ver-

worfen werden. Es kann wohl davon ausgegangen werden, daß die Anzahl der täglichen Ausfälle der EDV-Anlage approximativ einer POISSON-Verteilung (mit μ=2) folgt.

2. Schließende Statistik

354

Lösung 143 Xj = Anzahl der nachgefragten Produkte am j-ten Tag. Zu prüfen 1st, ob die angegebene Verteilung zur Familie der POISSON2 Verteilungen gehören kann. Hierfür eignet sich der χ -Anpassungstest. Seine Voraussetzungen sind erfüllt: Laut Text handelt es sich um eine einfache Stichprobe. Außerdem werden sieben disjunkte (Nachfrage-) Klassen von Anzahlen unterschieden. Folglich ist H q : Γ χ (ξ) = F q (?|μ) für alle ξ € R gegen H ^

Ρ χ (ξ) * Κο(ξ|μ) für mindestens ein ξ e F zu te-

sten; dabei ist Fq(C||i) die Verteilungsfunktion der POISSON-Verteilung mit

unbekanntem

(und

daher aus der Stichprobe zu schätzendem) Parame-

ter μ . -

7

!

Als Schätzwert für μ ergibt sich χ = -

Σ χ. η. = 1,8, so daß ein n i=l Anpassungstest auf PV(1,8) durchzuführen ist. Die Prüffunkt ion

Τ =

к (Nj-nPj)2 2 Σ ist unter Η approximativ χ -verteilt mit υ = k-l-r 1=1 nP° °

Freiheitsgraden. Zur Erfüllung der Approximationsbedingung, np° £ 10, müssen die drei letzten Klassen zusammengefaßt werden (siehe Tabelle). Die Verteilung

der Prüffunktion hat

somit

ν = k-l-r = 5-1-1 = 3

Fre1he i tsgrade. 2 Η ist zu verwerfen, falls t a χ. Λ ; setzt man α = 0,05, o „ 1-α,ν hält man ^ д д . з = 7,81.

so er-

Die geschätzten hypothetischen Wahrscheinlichkeiten P° können der Tabelle der PV(1,8) entnommen werden. Arbeitstabelle

i

χ

n

i

о p i

0 np i

, o.2 (n^npj)

. o,2 (nrnPl) np

1 2 3 4 5 6 7

0 1 2 3 4 5 6+

Σ

-

17 31 25 15 6 • 6 0 100

0,1653 0,2975 0,2678 0,1607 0,0723 ' 0,0260 0,0104 1

о i

16,53 29,75 26,78 16,07

0,2209 1,5625 3,1684 1,1449

0,0134 0,0525 0,1183 0,0712

10,87

1,2769

0,1175

100

-

0,3729

2. Schließende Statistik

Weil t = 0,3729 < 7,81 =

3

355

ist, kann die Nullhypothese nicht

verworfen werden. Es gibt keinen Grund anzunehmen, daß die POISSON-Verteilung (mit μ=1,8) kein angemessenes Nachfrage-Modell ist.

Lösung 144 ' 0,

falls der i-te Patient keine Schmerzen hat,

a) Es sei X ^ = . 1. falls der i-te Patient Schmerzen hat, • 0,

und

*2i =

falls der i-te Patient vom Arzt gespritzt wird,

. 1. falls der i-te Patient von einer Arzthelferin gespritzt wird

Zu testen ist die Vermutung, daß das Auftreten von Schmerzen davon abhängt, wer die Spritzen gibt, also die Unabhängigkeitshypothese = f

Ho:

^(Xj.^)

H1: ί χ

χ^ί*!»3^) *

fUr

X

f x

^ x i^* f x 2 ( x 2 )

für

alle

€ R

»indestens

ein

(x

2 Segen i« x 2 5

e

,2

2 Ein geeigneter Test 1st der χ -Unabhängigkeitstest. Die Voraussetzungen für diesen Test sind erfüllt: Laut Text liegt eine einfache Stichprobe aus einer zweidimensionalen Verteilung mit zwei zweipunktverteilten Randverteilungen vor. Die Voraussetzung disjunkter, nicht-leerer Klassen A^, A^ und B^, B,, ist ebenfalls erfüllt. 2

Ν, N Prüffunkt ion ist

Τ =

к 1 (Ν 1J Σ Σ 1=1 J=1

J

* ) n

,

1· »J

weil die hypothetischen Wahrscheinlichkeiten ir°j durch о P^j =

Ν, Ν , i· · ι

aus der Stichprobe geschätzt werden müssen.

Unter H q ist Τ approximativ *2-verteilt mit ν = (k-l)(l-l) = 1 Freiheitsgrad. (Es werden

r=k+l-2 = 4-2 = 2 Parameter aus der Stichprobe

gescl geschätzt.) Die Approximation gilt als gut, weil i.J. 2 H o 1st abzulehnen, falls t fc ^ ggg.j = 10,83.

n

P°j

10

für alle

2. Schließende Statistik

356

Arbeitstabelle

Damit ist (63-36) 2 36

+

(37-64)2 64

+

(117-144)2 144

+

(283-256)2 256

= 20,25 + 11,39 + 5,06 + 2,85 = 39,55, so daß Η auf dem Niveau о α = 0,001 zu verwerfen ist. Es ist anzunehmen, daß die Schmerzen nicht unabhängig vom Ausführenden sind. Das bedeutet jedoch nicht zwingend, daß die Arzthelferinnen eher schmerzfrei spritzen können als der Arzt. 0, falls die Venen leicht zugänglich sind, b) x

n

= 1, falls die Venen schwer zugänglich sind;

zu X2_ vgl. a). Zu testen ist die Vermutung, daß ein Zusammenhang zwischen der Venenlage und dem Ausführenden besteht. Zu testen ist also erneut eine Unabhängigkeitshypothese. Hinsichtlich Voraussetzungen, Prüfmaß, Prüfverteilung und Approximationsbedingungen gilt das zu a) Gesagte analog. 2 Η ist zu verwerfen, falls t £ χ = 6,63 . Arbeitstabelle

2. Schließende

Damit

Statistik

357

ist

(12 - 36,5)2

(38 - 13,5)2 +

36,5

13,5

q34 - 109,5)2 +

(16 - 40,5)2 +

109,5

40,5

= 16,445 + 44,463 + 5,482 + 14,821 = 81,211 , so daß H 0 zu v e r w e r f e n ist. E s ist w o h l a n z u n e h m e n , daß s i c h die A r z t h e l f e r i n n e n P a t i e n t e n m i t g u t e r V e n e n l a g e aussuchen. Lösung

145

E i n g e e i g n e t e r Test ist der x 2 - U n a b h ä n g i g k e i t s t e s t , w e i l d i e V e r m u t u n g ü b e r p r ü f t w e r d e n soll, daß d a s P r ü f u n g s e r g e b n i s v o n d e r F a c h r i c h t u n g a b h ä n g t . Die S t i c h p r o b e v o m U m f a n g η = 691 ist e i n e e i n f a c h e S t i c h p r o b e . Die V o r a u s s e t z u n g d i s j u n k t e r , n i c h t l e e r e r K l a s s e n Αι, A , bzw. Bxf B2f B3 ist erfüllt. Zu t e s t e n ist die H

o:

f

xi ,x 2
12) = 0,0176 ist. Somit ist,

wegen

=

w

Q gg24 =

=

^o


5 ist, ist nicht

2. Ist r2 = +1, so ist dies ein Beweis dafür, daß zwischen den betrachteten metrischen Merkmalen eine kausale Beziehung besteht. 3. Zwei nominale/klassifikatorische (ordinale/komparative) Merkmale Α und В heißen statistisch unabhängig, wenn f^j = fi.4j für alle i und j gilt. 4. Bei nominalen Merkmalen ist die Berechnung relativer Häufigkeiten aus methodischen Gründen unzulässig. 5. Die Eigenschaft der Varianz, große Abweichungen vom arithmetischen Mittel stärker als kleine zu gewichten, wird bei der Standardabweichung durch die Berechnung der Wurzel nicht ausgeschaltet. 6. Beim Preisindex nach PAASCHE muß für jede Berichtsperiode ein neuer Warenkorb bestimmt werden. 7. Das Kontingenzmaß von GOODMAN/KRUSKAL mißt nur lineare Beziehungen zwischen komparativen Merkmalen. 8. Korrelationskoeffizient und Kovarianz stimmen stets überein. 9. Regressionslinie und Regressionsgerade sind immer identisch.

366

3. Überprüfen Sie Ihre Statistik-Kenntnisse

10. Der KorrelationskoeffIzient mißt die kausale (und lineare) Beziehung zwischen zwei metrischen Merkmalen. 11. Bei klassierten metrischen Merkmalen ist das arithmetische Mittel von der Festsetzung der Klassengrenzen offener Randklassen abhängig. 12. Bei klassierten metrischen Merkmalen können Mittelwert und Varianz nur approximativ bestimmt werden. 13. Auch wenn der Umfang der Teilgesamtheiten bekannt ist, kann der Gesamt-Median nicht aus den Medianen der Teilgesamtheiten abgeleitet werden. 14. Klassierte metrische Merkmale werden als klassifikatorische Merkmale bezeichnet. 15. Der Median kann niemals Werte kleiner als Null annehmen, da er durch F„(x„ _) г 0,5 definiert ist, und die Werte der Verteiл U, о lungsfunktion stets positiv sind. 16. Bewegungsmassen werden im Gegensatz zu Bestandsmassen für einen bestimmten Zeitraum erfaßt. Deshalb ist die Dimension stets "Einheiten je Periode". 17. Die approximierende Verteilungsfunktion stimmt mit der empirischen Verteilungsfunktion nur an den Klassenmitten überein. 18. Wegen seiner Konstruktion gibt ein Preisindex nach LASPEYRES nicht nur Preis-, sondern auch Mengenänderungen wieder. 19. Bedingte Verteilungen lassen sich immer als Quotienten aus den entsprechenden Randverteilungen bestimmen. 20. Die statistische Unabhängigkeit zweier komparativer Merkmale läßt sich auch mit Hilfe ihrer bedingten Verteilungen feststellen. 21. Ist das Maß у von GOODMAN/KRUSKAL gleich Null, so folgt nicht zwingend, daß U und V statistisch unabhängig sind.

daraus

22. Der Median einer Verteilung ändert sich nicht bei linearen Transformationen (b*l und/oder a*0) des zugrunde liegenden Merkmals. 23. Das Maß vom Typ HERFINDAHL basiert auf der Entropie und kann daher sowohl mit Hilfe absoluter als auch mit Hilfe relativer Häufigkeiten bestimmt werden. 24. Aus der statistischen Unabhängigkeit metrischer Merkmale folgt ihre Unkorre1ierthe i t. 25. Die Varianz linear transformierter Merkmalswerte unterscheidet sich stets von der Varianz der ursprünglichen Werte. 26. Wenn r = +1 ist, dann besteht ein vollständiger kausaler Zusammenhang zwischen den betrachteten Merkmalen.

3. Überprüfen Sie Ihre

Statistik-Kenntnisse

367

27. Bel klassifikatorlsehen Merkmalen spielt die Reihenfolge der Merkmalsausprägungen keine Rolle. 28. Die Varianz wird stets größer, wenn der Umfang der zu beschreibenden Gesamtheit erhöht wird. 29. Der Median ist kleiner, größer oder genau so groß wie das entsprechende arithmetische Mittel. 30. Der Median 1st ein Maß der zentralen Tendenz nicht nur für stetige metrische Merkmale, sondern auch für diskrete metrische und komparative Merkmale. 31. Das Verhältnis der Zeitmengenfläche zur Länge der Periode gibt den Wert des durchschnittlichen Bestands an. 32. Die Kovarianz ist das gewichtete arithmetische Mittel von interner und externer Varianz. 33. Der Umfang einer Bestandsmasse wird nur für Zeitpunkte erfaßt. 34. KlassifIkatorische Merkmale können durch geeignete tionen in komparative Merkmale umgewandelt werden.

Transforma-

35. Der Wert des arithmetischen Mittels aus klassierten Werten hängt entscheidend von der Einteilung der Werte in Klassen ab. 36. Die TransInformation zweier klassifikatorischer Merkmale Α und В gibt an, wieviel Information von Merkmal Α in Merkmal В enthalten ist und umgekehrt. 37. Statistische Unabhängigkeit ist für alle Merkmalstypen definiert. 38. In

der Regel sind die 2 sionsbeziehung Γγ|χ und

Maße für die Stärke 2 verschieden.

der linearen

Regres-

39. Die Preisindizes nach LASPEYRES und PAASCHE unterscheiden sich unter anderem durch das zugrunde liegende Gewichtsschema. 40. Veränderungen der Häufigkeitsverteilung eines metrischen Merkmals wirken sich nur dann auf den Wert des arithmetischen Mittels aus, wenn sich diese Veränderungen auf Merkmalsausprägungen beziehen, die kleiner als der Wert des arithmetischen Mittels sind. 41. Für die Häufigkeitsdichte f χ (ξ) gilt, wie auch für die relative Häufigkeit f,, 0 * f v (?) s 1. J л 42. Wenn zwei Merkmale U und V statistisch unabhängig sind, dann sind die bedingten Verteilungen gleich den Randverteilungen.

368

3. Überprüfen Sie Ihre

Statistik-Kenntnisse

43. Das Produkt aus dem Preisindex nach LASPEYRES

(LPt ) und dem o' Preisindex nach PAASCHE ( Ρ ) ergibt den Umsatzindex U t to' o*

44. Statistische Unabhängigkeit bzw. vollständige statistische Abhängigkeit ist nur bei metrischen Merkmalen definiert. 45. Daus arithmetische Mittel wird im Gegensatz zum Median von Extremwerten (Ausreißern) beeinflußt. 46. Die Entropie ist aufgrund ihrer Eigenschaften geeignet, die Streuung/Variabilität klassifikatorischer Merkmale zu messen. 47. Merkmale mit nur einer Ausprägung sind für empirische Untersuchungen von besonderer Bedeutung. 48. Häufigkeitsverteilungen metrischer Merkmale lassen sich stets durch das arithmetische Mittel und die Varianz eindeutig beschreiben. 49. Die Standardabweichung läßt sich nicht in eine interne und eine externe Komponente zerlegen. 50. Wenn die individuellen Verweildauern nicht bekannt sind, läßt sich der Durchschnittsbestand nur approximativ bestimmen. 51. Die arithmetischen Mittel aus klassierten und Werten stimmen stets exakt überein.

nicht-klassierten

52. Bei zweidimensionalen Häufigkeitsverteilungen werden jeweils Paare von Merkmalsträgern betrachtet, im Gegensatz zu eindimensionalen Häufigkeitsverteilungen, bei denen nur Ausprägungen an einzelnen Merkmalsträgern betrachtet werden. 53. Für Korrelationstabellen gilt stets: ftx^y^) = f i x ^

für alle i

und j. 54. Ausgleichende Regressionsgeraden können nur bei metrischen Merkmalen sinnvoll angegeben werden. 55. Umsatzindizes können als Produkt geeigneter Preis- und Mengenindizes berechnet werden. 56. Bei einer vollständigen linearen Beziehung zwischen zwei metrischen Merkmalen gilt für den Korrelationskoeffizienten r = -1 oder г = +1. 57. Bei einem Mengenindex wird mit Mengen, bei einem Preisindex mit Preisen und bei einem Umsatzindex mit Umsätzen gewichtet. 58. Umsatzindizes und -meßzahlen sind sachlich identisch. 59. Ein Umsatzindex läßt sich (wenn geeignete zusätzliche Informationen gegeben sind) in einen Preisindex und einen Mengenindex zerlegen. 60. Bei komparativen Merkmalen ist das Verhältnis zweier Ausprägungen nicht sinnvoll interpretierbar.

3. Überprüfen Sie Ihre Statistik-Kenntnisse

369

61. Assoziationskoeffizienten für klassifikatorische Merkmale ändern ihren Wert, wenn in der zugehörigen Kontingenztabelle Zeilen und Spalten vertauscht werden. 62. Relative Streuungsmaße - wie zum Beispiel der Variationskoeffizient - ermöglichen den Vergleich unterschiedlicher Verteilungen von Merkmalen verschiedenen Typs. 63. Die Standardabweichung mißt den durchschnittlichen Merkmalswerte vom zugehörigen arithmetischen Mittel.

Abstand

der

64. Sind zwei Merkmale statistisch unabhängig, so kann ihre gemeinsame relative (zweidimensionale) Häufigkeitsverteilung als Produkt der beiden Randverteilungen bestimmt werden. 65. Nimmt γ, das Kontingenzmaß von GOODMAN/KRUSKAL, den Wert Null an, so folgt daraus, daß die betrachteten (komparativen) Merkmale statistisch unabhängig sind. 66. Die Indizes nach PAASCHE, LASPEYRES und LOWE unterscheiden sich unter anderem durch das Gewichtungsschema. 67. Mit Hilfe der approximierenden Verteilungsfunktion lassen sich exakte Aussagen über die kumulierten relativen Häufigkeiten nur an den Klassengrenzen treffen. 68. Empirische Verteilungsfunktionen sind im Gegensatz zu den Summenfunktionen immer stetig. 69. Die

Berechnung der

relativen

durchschnittlichen

Abweichung v^ =

= d(x. „)/x„ _ ist auch für ordinal skalierte Merkmale sinnvoll, и, ь u,ö weil der Median für dieses Skalenniveau sinnvoll definiert ist. 70. Die Varianz der Verteilung eines metrischen Merkmals X ist stets positiv, es sei denn, es gilt: x^ < 0 für alle ν . 71. Jede Standardisierung kehrt .

ist eine

lineare Transformation

und

umge-

72. Die ausgleichenden Regressionsgeraden Y(X) und X(Y) schneiden sich immer im Punkt (x,y). 73. Die Summe der Häufigkeitsdichten über alle Klassen eines klassierten metrischen Merkmals ist gleich 1. 74. Die Frage nach der statistischen Unabhängigkeit zweier komparativer Merkmale kann durch den Vergleich der Mediane ihrer Randvei— teilungen beantwortet werden: Stimmen die beiden Mediane überein, sind die beiden Merkmale statistisch unabhängig. 75. Aus dem Bestimmtheitsmaß läßt sich ohne weitere Information Korrelationskoeffizient nach BRAVAIS/PEARSON ableiten.

der

370

3. Überprüfen Sie Ihre Statistik-Kenntnisse

76. Häufigkeitsdichte und r e l a t i v e Häufigkeit haben den gleichen Wertebereich. 77. Die Werte der Häufigkeitsdichte sind s t e t s kleiner g l e i c h 1. 78. Die Richtung eines Zusammenhangs zwischen metrischen Merkmalen wird durch d i e Kovarianz determiniert. 79. Aus r = О kann nicht geschlossen werden, daß d i e beiden Merkmale s t a t i s t i s c h unabhängig sind. 80. Für eine um Null symmetrische Verteilung i s t s t e t s

= ^χ^"^·

81. Komparative Merkmale können nur linear transformiert werden, da nur hierdurch die Ordnungsrelationen zwischen den Merkmalsausprägungen erhalten bleiben. 82. Bei v o l l s t ä n d i g e r Assoziation zwischen zwei k l a s s i f i k a t o r i s c h e n Merkmalen mit k=l Ausprägungen läßt sich d i e zugehörige Kontingenztabelle s t e t s so gestalten, daß nur d i e T a b e l l e n f e l d e r der Hauptdiagonalen besetzt sind. 83. Adäquate Darstellungsformen f ü r Häufigkeitsverteilungen Stabdiagramm bzw. das Histogramm.

sind

das

84. Der geeignete Mittelwert für Meßzahlen 1st das harmonische M i t t e l . 85. Die Indizes nach LASPEYRES und PAASCHE sind s t e t s darstellbar arithmetisches Mittel von Meßzahlen.

als

86. Gegen eine Berechnung des Modus f ü r metrische Merkmale sprechen keine methodischen Gründe, sondern l e d i g l i c h der mögliche Informationsverlust. 87. Der lineare Zusammenhang zweier metrischer Merkmale i s t s t e t s p o s i t i v , wenn der Regressionskoeffizient p o s i t i v 1st. 88. Die Bestimmung empirischer RegressIonsbeziehungen i s t vor allem dann von V o r t e i l , wenn für d i e Art der Beziehung kein s p e z i e l l e s Modell (zum Beispiel e i n lineares Modell) angegeben werden kann. 89. Mit dem Korrelationsverhältnis kann auch die Stärke n i c h t - l i n e a r e r Beziehungen zwischen metrischen Merkmalen gemessen werden. 90. Der P r e i s eines Gutes s t e i g t innerhalb von 10 Jahren von 1,— DM auf 4 , — DM, d.h. um 300%. Damit beträgt die durchschnittliche j ä h r l i c h e Wachstumsrate 300%/10=30%. 91. Wenn zwei Merkmale s t a t i s t i s c h unabhängig sind, dann g i l t n x j y j ) = n y j x j ) f ü r a l l e i und j . 92. Die durchschnittliche lineare (absolute) Abweichung 1st f ü r den Modus minimal.

3. Überprüfen Sie Ihre Statistik-Kenntnisse

371

93. Zwei Merkmale sind nicht statistisch unabhängig, wenn für die zugehörige zweidimensionale Verteilung f^j * f ^ f ^ j für irgendein Paar i,j gilt. 94. Die Berechnung des Medians einer Verteilung setzt voraus, daß die Differenzen zwischen den Merkmalswerten sinnvoll definiert sind. 95. Im Gegensatz zu klassifikatorischen Merkmalen ist bei komparativen Merkmalen die Berechnung kumulierter Häufigkeiten sinnvoll. 96. Im Gegensatz zum Korrelationskoeffizienten mißt das Kontingenzmaß у von GOODMAN/KRUSKAL Stärke und Richtung auch nicht-linearer Beziehungen zweier Merkmale. 97. Eine exakte zeitliche Verkettung von Indizes nach LASPEYRES oder PAASCHE ist nicht möglich. 98. Zeitvergleiche von PAASCHE-Indizes sind aufgrund der ständig wechselnden Gewichtung wenig sinnvoll. 99. Eine Einteilung in Klassen ist nur bei stetigen metrischen Merkmalen von praktischer Bedeutung. 100. Die statistische Unabhängigkeit zweier Merkmale ist eine Eigenschaft zweidimensionaler Verteilungen, die für Merkmale aller Merkmalstypen definiert ist. 101. Ausgleichende Regressionsgeraden schneiden sich wie auch die Regressionslinien stets im Punkt (0;0). 102. Korrelationsverhältnis und Bestimmtheitsmaß messen den durch die Regression bzw. Regressionsgerade erklärten Teil der Varianz. 103. Häufigkeitsverteilungen, die hinsichtlich des arithmetischen Mittels und der Varianz identisch sind, sind auch hinsichtlich aller weiteren Momente identisch. 104. Bei einer Teilerhebung interessiert nur ein Teil Merkmalsausprägungen des untersuchten Merkmals. 105. Summenfunktion und empirische sich nur durch einen Faktor.

Verteilungsfunktion

der

möglichen

unterscheiden

106. Der Modus ist nicht für jede Verteilung eindeutig bestimmbar. 107. Der Durchschnittsbestand ist ein arithmetischer Mittelwert. 108. Bei der Berechnung gleitender Durchschnitte muß die Anzahl der Glieder stets ungerade sein, weil anderenfalls eine eindeutige Zuordnung zu den Zeltpunkten nicht möglich ist. 109. Die Berechnung gleitender Durchschnitte hat den Nachteil, daß den Zeitpunkten am Anfang und Ende der Zeitreihe keine Durchschnittswerte zugeordnet werden können. 110. Gleitende Durchschnitte können nur für metrische Merkmale berechnet werden.

372

3. Überprüfen Sie Ihre

Statistik-Kenntnisse

111. Bedingte Verteilungen können nur bei zwei- und mehrdimensionalen Verteilungen berechnet werden. 112. Ein negativer Wert des Korrelationsverhältnisses deutet auf die Existenz eines negativen Zusammenhangs zwischen zwei metrischen Merkmalen hin. 113. Durch die Berechnung der relativen Entropie wird unter anderem erreicht, daß ein Streuungsvergleich von Verteilungen von Merkmalen mit unterschiedlich vielen Ausprägungen sinnvoll wird. 114. Für empirische RegressIonsbeziehungen gilt stets 0 5 Н

Х | У = 4 | Х * !·

115. Die mit Hilfe der Momente definierten Maße für die Schiefe und Wölbung einer Verteilung lassen sich auch für klasslfikatorische Merkmale berechnen. 116. Wenn ein Merkmal X ursächlich von einem Merkmal Y abhängt, dann hängt auch Y ursächlich von X ab. 117. Wachstumsraten sind spezielle Indizes. 118. Die Summe aus der Anzahl der konkordanten Paare und der diskordanten Paare ergibt den Umfang der Gesamtheit. 119. Maße wie zum Beispiel die TransInformation, mit denen man Beziehungen zwischen klassifikatorischen Merkmalen beschreibt, werden auch als Beziehungszahlen bezeichnet. 120. Die relativen Häufigkeiten einer zweidimensionalen empirischen Häufigkeitsverteilung werden durch f^j = n ^ n ^ / n berechnet. 121. Es gibt Verteilungen von Merkmalen mit einer Standardabweichung von -4 und einer Varianz von +16. 122. Wenn X und Y statistisch unabhängig sind, dann ist г = 0. 123. Verteilungen komparativer Merkmale können auch durch Quantile beschrieben werden, weil es zulässig ist, Häufigkeiten komparativer Merkmale zu kumulieren. 124. Eine Gesamtheit sei

In zwei Tellgesamtheiten

Dann ist stets χ = [x^+x

)/2

(1 und 2) zerlegt.

das arithmetische Mittel der

Gesamt-

heit. 125. Randverteilungen können nur bei zwei- und mehrdimensionalen Verteilungen berechnet werden. 126. Das Kennzeichen relativer Streuungsmaße wie zum Beispiel der relativen Entropie oder des Variationskoeffizienten ist ihr Wertebereich, das Intervall [0;1].

3. Überprüfen Sie Ihre

Statistik-Kenntnisse

373

127. Die Summenfunktion an der Stelle ξ ο gibt die Anzahl der Merkmalswerte an, die kleiner oder höchstens gleich ξ^ sind. 128. Die charakteristische Eigenschaft komparativer Merkmale läßt sich an folgender Aussage zeigen: Die Note 4 ist doppelt so schlecht wie die Note 2. 129. Alle nicht binären Merkmale sind häufbare Merkmale. 130. Beispiele für Bewegungsmassen sind die Gesamtheit lebendgeborener Kinder in einem KalenderJahr und die Gesamtheit von eintreffenden Museumsbesuchern im Laufe eines Tages. 131. Der Preis eines Gutes steigt in drei Jahren von DM 8 0 , — auf DM 106,48. Dann beträgt die durchschnittliche jährliche Preissteigerungsrate genau 10%. 132. Eine Partei hat bei einer Landtagswahl 12% der Stimmen auf sich vereinigt; vier Jahre später sind es - bei gleicher Wahlbeteiligung - nur noch 9,6%. Die Partei hat also insgesamt 2,4% ihrer Stimmen verloren. 133. Der Preisindex für die Lebenshaltung aller privaten Haushalte kann nicht auf der Basis von Subindizes berechnet werden. 134. Beim sogenannten "Nullwachstum" ist der Wachstumsfaktor gleich 0. 135. Die Parameter der ausgleichenden Regressionsgeraden werden nach der Methode der kleinsten Quadrate bestimmt. 136. Bei dreidimensionalen Verteilungen metrischer Merkmale ist jeder Merkmalsträger durch ein Tripel von Merkmalswerten, zum Beispiel durch gekennzeichnet. 137. In der amtlichen Statistik der Bundesrepublik Indizes nach LOWE von untergeordneter Bedeutung.

Deutschland

sind

138. Der Durchschnittsbestand eines Lagers in einem bestimmten Beobachtungszeitraum läßt sich stets exakt berechnen. 139. Standardisierte Merkmale sind Merkmale, für die gilt: 2 χ = 1 und s = 0 . 140. Metrische werden.

Merkmale können

in komparative

Merkmale

transformiert

141. Beim Wertindex nach LASPEYRES stammen die Gewichte aus der Basisperiode, beim Wertindex nach PAASCHE aus der Berichtsperiode. Daher unterscheiden sich die Werte der Wert Indizes nach LASPEYRES und nach PAASCHE in aller Regel. 142. Die empirische Verteilungsfunktion eines diskreten metrischen Merkmals kann durch eine Treppenfunktion graphisch dargestellt werden.

374

3. Überprüfen Sie Ihre

Statistik-Kenntnisse

143. Gegeben sei die ausgleichende Regressionsgerade Y(X) = 1 + 9,5 X. Da die Steigung a^ = 9,5 deutlich größer als 1 ist, besteht ein starker funktionaler Zusammenhang zuIschen den Merkmalen X und Y . 144. Der Modus kann nur bei Häufigkeitsverteilungen klassifikatorischer Merkmale unbestimmt sein. 145. Die gerne Ins Eime Verteilungsfunktion zweier komparativer Merkmale ei— gibt sich stets als Produkt der entsprechenden Werte der Randverteilungsfunktionen. 146. Der Vergleich von zwei Werten der Entropie ist nur sinnvoll, wenn die Anzahlen der Ausprägungen der betrachteten Merkmale gleich sind oder die Werte der Entropie relativiert werden. 147. Die Transinformation gibt die Richtung des Zusammenhangs zwischen den klassifikatorischen Merkmalen Α und В an. 148. Auch aufgrund des Wertebereichs der Varianz bereitet ihre Interpretation häufig Schwierigkeiten. 149. Zu den Maßen der zentralen Tendenz gehören neben Modus und Median auch die durchschnittliche Abweichung und die Varianz. 150. Folgende Merkmale gehören zum Typ der komparativen Merkmale: Klausurnoten, Punktzahl im Turnwettkampf, Rückennummer der Fußballspieler, Temperatur gemessen in Grad Fahrenheit. 151. Der Index nach LASPEYRES ist ein gewogenes arithmetisches Mittel von Meßzahlen mit einem Gewichtungsschema aus der Berichtsperiode. 152. Zu jeder Häufigkeitsverteilung existiert ein arithmetisches Mittel. 153. Die durchschnittliche lineare Abweichung unterscheidet sich von der Varianz vor allem durch die fehlende Quadrierung der Abstände vom jeweiligen Mittelwert. 154. In einer Korrelationstabelle sind Korrelationskoeffizienten tabel1iert. 155. Ein Zusammenhangs maß Ζ (OsZsl) nehme den Wert 1 ал. Daraus ist zu schließen, daß zwischen den betrachteten Merkmalen ein vollständiger kausaler Zusammenhang besteht. 156. Ein Preisindex nach PAASCHE der Art

Ρ

läßt sich weder berech' о

nen noch sinnvoll interpretieren. 157. Die mittlere Verweildauer ist definiert als das arithmetische Mittel der beobachteten individuellen Verweildauern. 158. Mittlere Aufbauzeit stets gleich.

und mittlere

Abbauzeit

eines

Bestands

sind

159. Durch Bewegungsmassen ändert sich der Umfang des Bestands im Verlauf der Zeit.

375

3. Überprüfen Sie Ihre Statistik-Kenmnisse

160. Von Ausnahmen abgesehen, stimmen d i e Werte der bedingten V e r t e i lungen z w e i e r metrischer Merkmale X und Y nicht überein. Es g i l t also: f ( χ I y Q ) * f(y|xQ). 161. Unter einem Quart i i s a b s t a n d v e r s t e h t man in der S t a t i s t i k Abstand zwischen der 4. Merkmalsausprägung und dem M i t t e l w e r t .

den

162. Die Entropie läßt s i c h sowohl mit r e l a t i v e n H ä u f i g k e i t e n a l s mit absoluten H ä u f i g k e i t e n berechnen.

auch

163. Die r e l a t i v e n H ä u f i g k e i t e n e i n e r bedingten V e r t e i l u n g s i c h (abgesehen von Rundungsfehlern) s t e t s zu 1 a u f : к Σ f ( А , |B.) = 1. J 1=1

summieren

164. Die Wertbereiche der Entropie und der Maßzahl von H e r f i n d a h l men überein.

stim-

165. Der V a r i a t i o n s k o e f f i z i e n t V = s/x h ä l t n i s s k a l i e r t e Merkmale, welches der Merkmale unabhängig i s t .

i s t e i n Streuungsmaß f ü r v e r von der j e w e i l i g e n Meißeinheit

166. Sei

i - t e n Ausprägung e i n e s

n^ d i e absolute H ä u f i g k e i t

fikatorischen Dann g i l t

der

Merkmals und f ^ d i e zugehörige

relative

klassi-

Häufigkeit.

s t e t s f . £ n. . 1 1

167. Die Wertebereiche tisch.

absoluter

und r e l a t i v e r

Häufigkeiten sind

iden-

168. Der Anfangsbestand B q und der Endbestand B^ stimmen i n einem F o r t schreibungsmodell

in jedem F a l l e

überein.

169. Voraussetzung f ü r d i e Berechnung e i n e s Durchschnittsbestands d i e Übereinstimmung von Anfangs- und Endbestand.

ist

170. I s t d i e Bestimmung der ausgleichenden Regressionsgeraden Y ( X ) zwei metrische Merkmale X und Y s i n n v o l l , so i s t s t e t s auch

für die

Berechnung sinnvol1.

der

anderen

171. Für den M i t t e l w e r t g i l t

ausgleichenden

stets:

x.

Regressionsgeraden

. s χ s χ

172. Die H ä u f i g k e i t s d i c h t e i s t wie f o l g t d e f i n i e r t :

X(Y)

..

ίχ(ξ)

= ί^'Δίχ^.

173. Die Ausprägungen komparativer Merkmale werden s t e t s mit O r d i n a l zahlen b e z e i c h n e t , w e i l man mit Symbolen bzw. Buchstaben nicht rechnen kann. 174. Die K a l e n d e r z e i t und d i e geographische Höhe sind Merkmale.

intervallskalierte

376

3. Überprüfen Sie Ihre

Statistik-Kenntnisse

175. Die Berechnung konkordanter und diskordanter Paare s i f i k a t o r i s c h e n Merkmalen unzulässig.

ist

bei

klas-

176. Die Volkszählung i s t ein Beispiel f ü r eine Primärstatistik. 177. Die

Regressionskonstante

aQ

läßt

sich

stets

sinnvoll

interpre-

tieren. 178. Für χ

V

= a + bz

V

i s t d ( x „ „ ) = |b|d(z n _). 1 1 и, э u,o

179. Im additiven Modell lyse

kann d i e

y^ = m^ + u^ (1=1,2,. . . , n )

glatte

Komponente

m^ mit

Hilfe

der Zeitreihenanagleitender

Durch-

schnitte geschätzt werden. 180. Für eine eindeutige Zuordnung von Häufigkeiten zu Klassen von d i s kreten metrischen Merkmalen muß s t e t s d i e Obergrenze der Klasse i - 1 g l e i c h der Untergrenze der Klasse i sein. 181. Die Häufigkeitsdichte i s t wie f o l g t d e f i n i e r t : ί χ ( ξ ) = f i / n i 182. Bei k l a s s i f i k a t o r i s c h e n Merkmalen i s t Häufigkeiten unzulässig.

die

Berechnung

·

kumulierter

183. Das geometrische M i t t e l ist ein geeigneter Mittelwert f ü r Meßzahlen mit v a r i a b l e r Bezugszeit. 184. Die Parameter a Q und bQ der beiden ausgleichenden

Regressionsge-

raden Y(X) und X(Y) haben s t e t s das g l e i c h e Vorzeichen. 185. Bei k l a s s i f i k a t o r i s c h e n Merkmalen s p i e l t d i e Reihenfolge der Merkmalsausprägungen keine Ro 11e. 186. Der Stimmanteil der Partei XYZ f i e l bei den l e t z t e n Landtagswahlen um 1,3 Prozent punkte von 18,7 auf 17,4 Prozent der abgegebenen Stimmen. 187. Der Median i s t e i n geeignetes Lagemaß f ü r komparative und metrische Merkmale. 188. Eine ausgleichende Regressionsgerade beschreibt die durchschnittl i c h e monotone Abhängigkeit eines metrischen Merkmals von einem anderen metrischen Merkmal. 189. Eine geeignete graphische Darstellungsform f ü r die empirische Verteilungsfunktion eines stetigen Merkmals i s t das Histogramm. 190. Bei

zweidimensionalen

Häufigkeitsverteilungen k l a s s i f i k a t o r i s c h e r к Merkmale i s t die Summe der Randhäufigkeiten Σ η, immer g l e i c h der i=l

377

3. Überprüfen Sie Ihre Statistik-Kenntnisse

S u m m e der R a n d h ä u f i g k e i t e n

1 Σ η , , J=1

'

wobei

к d i e Anzahl

der

Zeilen

J

u n d 1 die Anzahl der S p a l t e n der K o n t i n g e n z t a b e l l e

sind.

191. D i e Festlegung der Klassenobergrenze d e r o b e r s t e n K l a s s e eines k l a s s i e r t e n m e t r i s c h e n Merkmals wirkt s i c h im a l l g e m e i n e n nicht a u f d a s Quantil zur O r d n u n g ρ = 0 , 2 5 aus. 192. D e r M e d i a n eines k o m p a r a t i v e n M e r k m a l s U ist d e f i n i e r t

durch

wobei к - die Anzahl der M e r k m a l s a u s p r ä g u n g e n - u n g e r a d e ist. 193. D a s M a ß v o n C R A M E R ist e i n Z u s a m m e n h a n g s m a ß f ü r Merkmale.

klassifikatorische

194. Bestimmt m a n Indizes n a c h LASPEYRES, d a n n lassen s i c h - im G e g e n s a t z z u d e n Indizes n a c h P A A S C H E - n e b e n d e n P r e i s i n d i z e s a u c h M e n g e n i n d i z e s bestimmen. 195. D i e Spannweite k l a s s i f i k a t o r i s c h e r Merkmale ist definiert a l s f e r e n z z w i s c h e n d e m g r ö ß t e n und k l e i n s t e n Merkmalswert. 196. D e r F a m i l i e n s t a n d einer P e r s o n deutscher Nationalität b a r e s Merkmal.

Dif-

ist e i n h ä u f -

197. Die Entropie u n d d a s S t r e u u n g s m a ß v o m T y p H E R F I N D A H L s i n d s i n n v o l l e M a ß e der Variabilität k l a s s i f i k a t o r i s c h e r Merkmale. 198. D i e K o v a r i a n z S ^ y mißt die gemeinsame lineare S t r e u u n g der M e r k m a l e X u n d Y. 199. D i e Merkmale Höhe des Haushaitseinkommens, H a u s h a l t s g r ö ß e d e s Einkommens (Einkunftsart) h a b e n zumindest ordinales niveau.

u n d Art Skalen-

200. Die Güte einer linearen B e z i e h u n g ist a l l e i n a n h a n d des K o r r e l a t i o n s k o e f f i z i e n t e n n a c h B R A V A I S / Ρ Ε A R S O N sinnvoll interpretierbar. 201. D i e a b s o l u t e n H ä u f i g k e i t e n n^ eines M e r k m a l s u n t e r s c h e i d e n s i c h v o n d e n r e l a t i v e n H ä u f i g k e i t e n fj n u r d u r c h e i n e n Faktor. 202. D i e S t a n d a r d a b w e i c h u n g e i n e s s t e t i g e n m e t r i s c h e n M e r k m a l s k a n n s o wohl für E i n z e l w e r t e als a u c h für klassierte W e r t e b e r e c h n e t w e r den. 203. Eine Beziehungszahl ist e i n Quotient aus zwei s a c h l i c h vers c h i e d e n e n Größen, die in s i n n v o l l e r B e z i e h u n g stehen, wobei d i e s e G r ö ß e n zumindest o r d i n a l e s S k a l e n n i v e a u a u f w e i s e n müssen. 204. K l a s s i f i k a t o r i s c h e Merkmale s i n d invariant g e g e n ü b e r u m k e h r b a r e i n d e u t i g e n T r a n s f o r m a t i o n e n (Umbenennungen, Vertauschungen).

378

3. Überprüfen Sie Ihre

Statistik-Kenntnisse

205. Das Kontingenzmaß ц von GOODMAN/KRUSKAL mißt die Stärke und Richtung einer monotonen Beziehung zwischen zwei komparativen Merkmalen in einer Kontingenztabelle. 206. Die ausgleichende Regressionsgerade kann sowohl auf der Grundlage von Einzelwerten als auch (approximativ) auf der Basis von klassierten Werten berechnet werden. 207. Bei Kenntnis des Anfangsbestands sowie der Zugänge und Abgänge im Beobachtungszeitraum kann eine Bestandsmasse fortgeschrieben werden. 208. Das Stabdiagramm ist eine geeignete Darstellungsform für die Häufigkeitsverteilung eines diskreten metrischen Merkmals. 2 2 209. Das Bestimmtheitsmaß г hat den Wertebereich - 1 s г s + 1 . 210. In der beschreibenden Statistik versteht man unter der Standardabweichung eine Varianz von eins. 211. Die Körpergröße X ist ein verhältnisskaliertes Merkmal. 212. Die Gewichte eines Preisindex nach LASPEYRES bestehen aus Preisund Mengenangaben der Berichtszeit. 213. Der Median x^ ^ eines komparativen oder metrischen Merkmals X wird auch als das Quantil zur Ordnung 0,5 bezeichnet. 214. Die л

graphische

Darstellung

der

eines klassif ikatorischen

empirischen Merkmals

Verteilungsfunktion

ist üblicherweise

eine

Treppenfunkt ion. 215. Die Breite der Medianklasse eines (klassierten) metrischen Merkmals ist für die Berechnung des Medians irrelevant. 216. Das Merkmal Beruf ist ein häufbares Merkmal. 217. Die Kovarianz mißt die gemeinsame Merkmale.

lineare Streuung

komparativer

218. Das Streuungsmaß auf der Basis der Entropie für komparative Merkmale nimmt seinen maximalen Wert an für f. = f, = 1/2 und nicht für 1 к den Fall der Gleichverteilung. 219. Voraussetzung für die graphische Darstellung der empirischen Verteilungsfunktion eines stetigen metrischen Merkmals ist die Berechnung der Häufigkeitsdichte. 220. Zwei Merkmale Α und В heißen statistisch unabhängig,wenn η. η . η = 1 ' ' J für alle 1=1,2 к und j=l,2 1 .

3. Überprüfen Sie Ihre

Statistik-Kenntnisse

379

2 221. Das Maß von CRAMER ist ein Zusammenhangsmaß auf der Basis von χ für klassifikatorische Merkmale. 222. Die Varianz eines metrischen Merkmals X wird auch schnittliche Abweichung des Merkmals X bezeichnet.

als

durch-

223. Ein Merkmal X heißt stetig, wenn X abzählbar unendlich viele Ausprägungen hat. 224. Bei komparativen Merkmalen mationen zulässig.

sind

alle

rangerhaltenden

Transfor-

225. Der Wert des BestimmtheitsmaBes zweier standardisierter Merkmale stimmt mit dem Wert des Bestimmtheitsmaßes der zugehörigen nichtstandardisierten Merkmale überein.

380 3 . 3

3. Überprüfen

Sie Ihre

Statistik-Kenntnisse

L ö s u n g e n

1. 2. 3. 4. 5.

R F R F R

46. 47. 48. 49. 50.

R F F R R

91. 92. 93. 94. 95.

F F R F R

136. 137. 138. 139. 140.

R R F F R

181. 182. 183. 184. 185.

F R R F R

6. 7. 8. 9. 10.

R F F F F

51. 52. 53. 54. 55.

F F F R R

96. 97. 98. 99. 100.

R R R F R

141. 142. 143. 144. 145.

F R F F F

186. 187. 188. 189. 190.

R R F F R

11. 12. 13. 14 . 15.

R R R F F

56. 57. 58. 59. 60.

R F R R R

101. 102. 103. 104 . 105.

F R F F R

146. 147. 148. 149. 150.

R F R F F

191. 192. 193. 194. 195.

R F R F F

16. 17. 18. 19. 20.

R F F F R

61. 62. 63. 64. 65.

F F F R F

106. 107. 108. 109. 110.

R R F R R

151. 152. 153. 154. 155.

F F R F F

196. 197. 198. 199. 200.

F R R F F

21. 22. 23. 24 . 25.

R F F R F

66. 67. 68. 69. 70.

R R F F F

111. 112 . 113. 114 . 115.

R F R F F

156. 157. 158. 159. 160.

F R F R R

201. 202. 203. 204. 205.

R R F R R

26. 27. 28 . 29. 30.

F R F R R

71. 72. 73. 74. 75.

F R F F F

116. 117 . 118. 119. 120.

F F F F F

161. 162. 163. 164. 165.

F R R F R

206. 207. 208. 209. 210.

R R R F F

31. 32. 33. 34 . 35.

R F R F R

76. 77. 78. 79. 80.

F F R R F

121. 122. 123. 124 . 125.

F R R F R

166. 167. 168. 169. 170.

R F F F F

211. 212. 213. 214. 215.

R F R F F

36. 37. 38. 39. 40.

R R F R F

81. 82. 83. 84. 85.

F R R F F

126. 127 . 128 . 129. 130.

F R F F R

171. 172. 173. 174. 175.

R F F R R

216. 217. 218. 219. 220.

R F R F R

41. 42. 43. 44 . 45.

F R F F R

86. 87 . 88. 89. 90.

R R R R F

131. 132 . 133. 134 . 135.

R F F F R

176. 177. 178. 179. 180.

R F R R F

221. 222. 223. 224 . 225.

R F F R R

381

3. Überprüfen Sie Ihre Statistik-Kenntnisse

3.4 Aussagen zur schließenden Statistik 1. Wenn eine Gesamtheit zweipunktverteilt ist (zum Beispiel männlich/weiblich) , dann folgt - unter der Voraussetzung einer Auswahl mit Zurücklegen - der Anteil X'/n = Ρ der Stichprobeneinheiten mit der Eigenschaft Α (zum Beispiel männlich) einer Binomialverteilung. 2. Man begeht keinen Fehler zweiter Art, wenn die Prüffunktion einen Wert des Annahmebereichs annimmt. 3. Ist die Zufallsvariable X stetig und symmetrisch verteilt, so ist die Wahrscheinlichkeit Ρ (χ = μ) gerade gleich 0,5. 4. Der Begriff "Wahrscheinlichkeitsdichtefunktion" ist eigentlich irreführend, weil die Werte dieser Funktion keine Wahrscheinlichkeiten sind. 5. Der Wert der Stichprobenvarianz der Umfang der Stichprobe ist.

ist um so

kleiner,

je

größer

6. Stetigkeitskorrekturen sind nur bei der Approximation diskreter Verteilungen durch stetige Verteilungen vorzunehmen. 7. Disjunkte kehrt.

Ereignisse

sind

stochastisch

unabhängig

und

umge-

8. Ein aufgrund einer konkreten Stichprobe berechnetes Konfidenzintervall enthält mit einer vorgegebenen Wahrscheinlichkeit von (1 - α ) den wahren - zu schätzenden - Parameter. 9. In der schließenden Statistik versucht man stets von den bekannten Parametern einer Gesamtheit auf die unbekannten Parameter einer einzelnen Stichprobe zu schließen. 10.Intervallschätzungen können nicht nur für unbekannte Parameter der Gesamtheit, sondern auch für unbekannte Parameter von Stichproben durchgeführt werden. 11.Der Begriff einer "einfachen" Stichprobe beinhaltet unter anderem die stochastische Unabhängigkeit der betrachteten Zufallsvariablen. 12. Kann bei einem Test H0 nicht verworfen werden, so ist H0 richtig. 13.Die Anzahl der Freiheitsgrade bei x 2 -Tests hängt ab von der Anzahl der aus der Stichprobe geschätzten Parameter. 14.Mit Hilfe statistischer Tests können Hypothesen in aller Regel weder verifiziert noch falsifiziert werden. 15.Kann bei einem Test H 0 verworfen werden, so ist Hx richtig. 16.Systematische Fehler haben auch bei zunehmendem fang keine Ausgleichstendenz.

Stichprobenum-

382

3. Überprüfen Sie Ihre Statistik-Kenntnisse

17. Bedingte und unbedingte Wahrscheinlichkeiten nehmen nur Werte des Intervalls [0,1] an. 18. Identisch verteilte Zufallsvariable sind stochastisch unabhängig. 19. Wahrscheinlichkeitsdichtefunktionen können Werte größer als 1 annehmen. 20. Bei einer einfachen Zufallsstichprobe strebt die Wahrscheinlichkeit dafür, wenigstens einmal den Wert χ der stetigen Zufallsvariablen X zu erhalten, mit zunehmendem Stichprobenumfang η gegen 1. 21. Eine Nullhypothese werde auf dem Signifikanzniveau α verworfen. Dann wird diese Hypothese auch auf jedem Signifikanzniveau α' > α verworfen. 22. Eine Zufallsvariable X heißt standardnormalverteilt, falls E(X) = 0 und Var(X) = 1. 23. Die Wahrscheinlichkeit, daß eine symmetrisch verteilte diskrete Zufallsvariable einen Wert χ s μ^ annimmt, ist stets gleich 0,5.

2 24. Aus Var(aX) = a Var(X) für alle а с IR folgt, daß die Verteilungen von X und -X die gleiche Varianz haben. 25. Durch eine lineare Transformation der Art Y = aX + b läßt sich die Zufallsvariable X in eine standardnormalverteilte Zufal1svariable Y überführen. 26. Bei normal- und t-verteilten (v £ 2) Zufallsvariablen X stimmen Median und E(X) überein. 27. Führt der Test einer Hypothese zu ihrer Ablehnung, so ist damit bewiesen, daß diese Hypothese falsch ist. 28. Die Genauigkeit einer PunktSchätzung wächst im allgemeinen mit zunehmendem Umfang der einfachen Stichprobe. 29. Aus der Tatsache, daß der Korrelationskoeffizient r zweier Zufallsvariablen X und Y den Wert 0 Einnimmt, kann nicht geschlossen werden, daß X und Y stochastisch unabhängig sind. 30. Der Fehler erster Art kann durch Vorgabe eines Signifikanzuniveaus auf α begrenzt werden. 31. Bei einer Voll- oder Totalerhebung werden alle Merkmale der Merkmalsträger erhoben. 32. Wahrscheinlichkeiten zufälliger Ereignisse sind stets (echt) größer als 0 und (echt) kleiner als 1. 33. Der Begriff der "einfachen" Zufallsstichprobe beinhaltet auch die identische Verteilung der betrachteten Zufallsvariablen. 34. Die absoluten Häufigkeiten in Stichproben aus zweipunktverteilten Gesamtheiten sind stets binomialverteilt.

3. Überprüfen Sie Ihre Statistik-Kenntnisse

383

35. Der kritische Bereich eines Tests kann unter anderem auch durch das Signifikanzniveau variiert werden. 36. Mit der Ungleichung von TSCHEBYSCHEFF können auch dann Aussagen über den Parameter μ einer Gesamtheit getroffen werden, wenn ihre Verteilung dem Typ nach unbekannt ist. 37. Bei der Approximation der Binomialverteilung durch die POISSONVerteilung ist keine Stetigkeitskorrektur durchzuführen, da beide Verteilungen diskret sind. 38. Eine Zufallsvariable wird als stetig bezeichnet, wenn sie abzählbar unendlich viele Werte annehmen kann. 39. Der statistische Test einer wahren Hypothese führt immer zu ihrer Annahme. 40. Jede normalverteilte Zufallsvariable kann durch Transformation in eine standardnormalverteilte überführt werden.

eine geeignete Zufallsvariable

41. Die Vereinigung disjunkter (unvereinbarer) Ereignisse ist stets das unmögliche Ereignis. 42. Bei hinreichend großem Umfang η einer einfachen Stichprobe ist das arithmetische Mittel X^ einer beliebig verteilten Zufallsvariablen X approximativ normalverteilt. 43. Jede Punktschätzung ist erwartungstreu. 44. Um die Standardabweichung des Schätzers X bei einfachen Stichproben zu halbieren, muß (bei bekanntem

der Stichprobenumfang verdop-

pelt werden. "2

45. Die Stichprobenvarianz σ ν kann mit zunehmendem Λ abnehmen.

Stichprobenumfang

2 46. Beim χ -Unabhängigkeitstest können die Zeilen und/oder Spalten der gegebenen Kontingenztabelle permutiert werden, ohne daß sich der Wert des Prüfmaßes dadurch ändert. 47. Eine Stichprobenerhebung hat gegenüber einer Totalerhebung bei gleichem Fragenprogramm den Vorteil geringerer Kosten und größerer Aktualität. 48. Eine Zufallsstichprobe hat gegenüber jenen Stichproben, die nicht auf dem Zufallsprinzip beruhen, den Vorteil, daß allenfalls Zufallsfehler vorkommen können. 49. Das Konfidenzintervall für den unbekannten Mittelwert einer Gesamtheit wird bei bekanntem σ γ und unter sonst gleichen Bedingungen mit

384

3. Überprüfen Sie Ihre Statistik-Kenntnisse

zunehmendem Stichprobenumfang kleiner. 50. Unkorrelierte unabhängig.

normalverteilte

Zufallsvariablen

sind

stochastisch

51. Ein Beispiel für eine Zufallsauswahl ist die willkürliche Auswahl. 52. Je öfter man einen unverfälschten Würfel wirft, desto lassen sich die Ergebnisse im Einzelfall vorhersagen.

sicherer

53. Der statistische Test einer falschen Hypothese führt immer zu ihrer Ablehnung. 54. Die Approximation einer B(n, ir)-verteilten Zufallsvariablen durch die Normal verte i lung ist dann besonders gut, wenn π nahe bei 1 liegt. 55. Nimmt eine Zufallsvariable nur einen Wert an, so ist ihre Varianz gleich Null. 56. Ist die Zufallsvariable X stetig und symmetrisch, so gilt Ρ(Χ=μ χ ) * * 0,5. 57. Die Werte f^ix) einer Wahrscheinlichkeitsdichtefunktion

sind

nur

dann Wahrscheinlichkeiten, wenn 0 s f^(x) - 1 für alle χ ε К ist. 58. Bei der Bemessung von Wahrscheinlichkeiten ist es nicht erfordei— lieh vorauszusetzen, daß die Menge der Elementarereignisse endlich und die Elementarereignisse selbst gleichmöglich sind. 59. Die Axiome von K0LM0G0R0FF 1i chke i t en anwendbar.

sind

auch

auf

bedingte

Wahrschein-

60. Ist ein Testergebnis statistisch signifikant, so ist es damit auch realwissenschaftlich relevant (bedeutsam). 61. Durch eine hinreichende Vergrößerung der Stichprobenumfänge läßt sich bei einem Mittelwert-Differenzen-Test stets erreichen, daß auch beliebig kleine (praktisch bedeutungslose) Unterschiede zwischen den Mittelwerten statistisch signifikant sind. 62. Für eine empirische Untersuchung kann die Behauptung, daß 90% aller Beamten schwarze Schuhe tragen, eine (statistische) Hypothese sein. 63. Für eine Punktschätzung des Mittelwerts

μ^ einer Gesamtheit

ist

Ρ(Χ=μ χ ) = 1. 64. Wenn für zwei Zufallsvariablen X und Y die Cov(X.Y) = 0 ist, so sind X und Y stochastisch unabhängig. 65. Für eine Dichtefunktion gilt stets: 00

0 £ f x (x) — 1

und

J· f x (x)dx = 1.

3. Überprüfen Sie Ihre Statistik-Kenntnisse

385

66. Die Verteilungsfunktion F^ einer Z u f a l l s v a r i a b l e n X g i b t f ü r jede r e e l l e Zahl b die Wahrscheinlichkeit P(Xsb) an. 67. Bei Zufallsstichproben treten nur Z u f a l l s f e h l e r auf. 68. Mit Tests s t a t i s t i s c h e r ( N u l l - ) Hypothese r i c h t i g

Hypothesen ist.

wird

festgestellt,

ob

69. Der Erwartungswert einer s t e t i g e n Z u f a l l s v a r i a b l e n i s t s t e t s tiv.

eine posi-

70. Das Integral einer Wahrscheinlichkeitsdichtefunktion über das I n t e r v a l l [a,+m] kann a l s Wahrscheinlichkeit i n t e r p r e t i e r t werden. 71. Sind zwei Zufallsvariablen stochastisch unabhängig, so i s t ihre Kovarianz g l e i c h Null. 72. Wegen der Symmetrieeigenschaft stets F ( - λ ) = 1 - F (λ).

der

Standardnormalverteilung

gilt

73. Für zwei stochastisch unabhängige Z u f a l l s v a r i a b l e n X und Y Var(X-Y) = Var(X) + Var(Y) .

gilt:

74. Für eine Z u f a l l s v a r i a b l e X und eine b e l i e b i g e r e e l l e Zahl a g i l t : Var(aX) = a · Var(X). 75. Für

stochastisch

unabhängige

Ereignisse

E^und

E^

stimmen

die

bedingten Wahrscheinlichkeiten Ρ(Ε^|Ε£) und PiE^IE^) immer überein. 76. Ein Fehler zweiter Art wird begangen, verworfen wird, obwohl s i e r i c h t i g i s t .

wenn eine

77. Die Verteilung einer Prüffunktion Τ kann Eingegeben werden, daß Hq r i c h t i g i s t .

unter

Nullhypothese der

Bedingung

78. A l l e s t e t i g e n eindimensionalen Verteilungen sind durch den Mittelwert μ und die Standardabweichung x° . Der Anteil der Bolzen mit einer Länge von höchstens 50,00 mm ist der Wert der approximierenden Verteilungsfunktion an der Stelle 50,00. Da es sich hierbei um eine Klassengrenze handelt, ist der Wert gleich dem der empirischen Verteilungsfunktion an der Stelle 50 und somit ein exakter Wert. Fx(50,00) = Fx(50,00) = 0,523 . Der Anteil der Bolzen mit einer Länge von höchstens 50,00 mm beträgt exakt 52,3%. Der Anteil der Bolzen mit einer Länge über 50,15 mm ist 1 minus dem Wert der approximierenden Verteilungsfunktion an der Stelle 50,15. Da 50,15 zwischen den Klassengrenzen liegt, ist der berechnete Anteil ein approximativer Wert.

4. Ergänzungen

406

129 1 - Fx (δ 0,1 δ) = 1 -0,851 + (50,15 - 50,ΙΟ) · — —

ид *1000

= 1 - 0,9155 = 0,0845 . Der Anteil der Bolzen mit einer Länge von über 50,15 mm beträgt approximativ 8,45%. Der Anteil der Bolzen mit einer Länge zwischen 49,742 mm und 50,258 mm ist die Differenz der entsprechenden Werte der approximierenden Verteilungsfunktion. F*(50,258) - F*(49,742) =

0,980 + (50,258 - 50,2θ) ·

19

0,1 · 1000

0,002 + (49,742 - 4 9,70)

26

0,1 · 1000

= 0,99102 - 0,01292 = 0,9781. Der Anteil der Bolzen mit einer Länge zwischen 49,742 mm und 50,258 mm beträgt approximativ 97,81%. Die Werte wären dann exakt, wenn eine Gleichverteilung der Bolzen innerhalb der Klassen vorläge. Es muß also die Annahme der Gleichverteilung der Bolzen innerhalb der Klassen getroffen werden. b) Aus den Klassenmittelwerten wird das arithmetische Mittel gebildet: 1 k χ = - Σ " i-1

·ηι

=

(50,05 · 500 + 49,97 · 1500 + 49,99 · 1000 + 50,04 · 2000) 5000 v ' = 50,01. Standardabweichung: 2 2 2 s _- s int + с ext s2

11

ν

k

2

int = Γ L· s i ' n i = ηi =1 1 (o,ll2 · 500 + 0,082 · 1500 + 0Д02 • 1000 + 0Д22 · 2000) 5000 = 0,01089 ,

1 k 2 Sext = - Σ (*i - *) ' "i " i=l = ^ ^ |(50,05 - 50,Ol)2 · 500 + (49,97 - 50,Ol)2 · 1500 + + (49,99 - 50,Ol)2 · 1000 + (50,04 - 50,Ol)2 · 2000| = 0,00108 ,

4. Ergänzungen

407

s2 = 0,01089 + 0,00108 = 0,01197 , s =

= 0,1094075 .

Für alle mit den vier Maschinen an dem betrachteten Tag produzierten Bolzen ergibt sich ein Mittelwert von χ = 50,01 mm und eine Standardabweichung von s = 0,1094 mm. Die Ergebnisse sind exakt, weil die Klassenmittelwerte und die Klassenstandardabweichungen exakt vorgegeben sind bzw. aus den Einzelwerten berechnet wurden.

Aufgab« 3.3 Um herauszufinden, wie sich die Präsentation statistischer Ergebnisse auf die Bereitschaft von Unternehmen auswirkt, einen Zulieferer mit der Lieferung eines bestimmten Produkts zu beauftragen, wurden 200 Unternehmen die folgenden beiden Texte vorgelegt: 1. "Die Ausfallrate eines Bauteils konnte durch die Verwendung des Produkts ZI von 1,5% auf 1,2% verringert werden. Die Reduktion von 0,3 Prozent war statistisch signifikant." 2. "Die Verwendung des Produkts Z2 führte zu einer Abnahme der Ausfallrate eines Bauteils um 20%. Die Reduktion war statistisch signifikant." 190 der befragten Unternehmer würden das Produkt Z2 einsetzen. Wie würden Sie entscheiden? Warum? Löaqng 3.3 Die beiden Produkte sind gleichwertig! Die Formulierung in Text 1 bezüglich der Reduktion ist falsch. Eine Veränderung in Prozentpunkten (0,3 Prozentpunkte) wird fälschlicherweise mit einer prozentualen Veränderung gleichgesetzt . Durch die Verwendung von Produkt ZI konnte die Ausfallrate um 1

12%

0 012

— = 1 = 1 - 0,8 = 0,2 = 20% verringert werden. Die 1,5% 0,015 Reduktion der Ausfallrate ist demnach bei beiden Produkten gleich groß.

408

4. Ergänzungen

Zu FS, Kapitel 5: Mafia und Verfahren zur Charakterisierung zweidimensionaler Häufigkeitsverteilungen Aufgabe 5.1 Der Korrekturaufwand für eine Diplomvorprüfungsklausur hängt im wesentlichen von der Anzahl der Klausurteilnehmer ab. Die Assistenten des Lehrstuhls für Statistik versuchen, diesen Aufwand mit Hilfe eines geeigneten Modells abzuschätzen. Es ist bekannt, daß die angehenden Wirtschaftswissenschaftler und Wirtschaftsinformatiker i.d.R. in ihrem ersten Fachsemester einen Leistungsnachweis im Fach "Mathematik für Wirtschaftswissenschaftler I" zu erwerben versuchen, bevor sie nach dem dritten Fachsemester zur Diplomvorprüfung im Fach "Statistik" antreten. An dieser Diplomvorprüfung nehmen auch die angehenden Soziologen teil, die den Leistungsnachweis in "Mathematik I" nicht erbringen müssen. Die Vermutung liegt nahe, daß zwischen der Anzahl der Klausurteilnehmer in "Mathematik I" und der Anzahl der Teilnehmer an der Diplomvorprüfungsklausur im Fach "Statistik" ein Jahr später ein Zusammenhang besteht. Dieser Zusammenhang soll durch ein lineares Modell beschrieben werden. Für die vergangenen Jahre liegen die folgenden Daten vor. Scheinklausur Mathematik I

Diplomvorprüfung im Fach Statistik

Semester

Anzahl der Teilnehmer

Semester

Anzahl der Teilnehmer

WS 85/86

304

WS 86/87

257

WS 86/87

461

WS 87/88

403

WS 87/88

608

WS 88/89

484

WS 88/89

664

WS 89/90

523

WS 89/90

399

WS 90/91

386

WS 90/91

515

WS 91/92

449

a) Bestimmen Sie zunächst die Merkmalsträger, die Merkmale und Merkmalstypen! Geben Sie ein Beispiel für einen Merkmalsträger ! b) Berechnen und interpretieren Sie für das oben beschriebene Modell die Parameter einer sinnvollen ausgleichenden Regressionsgeraden! Welche inhaltliche Bedeutung könnte die Regressionskonstante haben, wenn zu Recht unterstellt werden kann, daß die ausgleichende Regressionsgerade für alle Werte des unabhängigen Merkmals, die > 0 sind, gültig ist? c) Berechnen Sie ein geeignetes Zusammenhangsmaß und interpretieren Sie die Stärke des Zusammenhangs!

409

4. Ergänzungen d)

Mit Hilfe des aufgestellten linearen Modells soll der Korr e k t u r a u f w a n d für d i e S t a t i s t i k - D i p l o m v o r p r ü f u n g n a c h d e m W S 9 2 / 9 3 a b g e s c h ä t z t w e r d e n . A n d e r K l a u s u r in " M a t h e m a t i k I" n a c h d e m W S 9 1 / 9 2 h a b e n 435 K a n d i d a t e n t e i l g e n o m m e n . Für die Korrektur einer Diplomvorprüfungsklausur im Fach " S t a t i s t i k " w i r d e i n e K o r r e k t u r z e i t z w i s c h e n 50 u n d 70 M i n u t e n b e n ö t i g t . In w e l c h e m I n t e r v a l l l i e g t d i e g e s a m t e K o r rekturzeit? W e l c h e A n n a h m e m ü s s e n Sie treffen, um die Ber e c h n u n g d u r c h f ü h r e n zu k ö n n e n ?

Lösung

5.1

a) M e r k m a l s t r ä g e r : P a a r e v o n P r ü f u n g e n " M a t h e m a t i k d i p l o m Statistik zwei Semester später";

I und

Vor-

M e r k m a l e : A n z a h l d e r T e i l n e h m e r a n e i n e r M a t h e - K l a u s u r (X), Anzahl der Teilnehmer an der Statistik-Klausur zwei Semester s p ä t e r (Y); M e r k m a l s t y p : j e w e i l s m e t r i s c h . B e i s p i e l für e i n e n M e r k m a l s t r ä g e r : D a s P a a r " K l a u s u r in M a the I im WS 85/86 und Klausur in Statistik im WS 86/87". b)

Sinnvolle Regressionsgerade Y(X) = a 0 + a ^ a0

= у - a ^

ax = — j Sx

ist

(nur):

mit (der R e g r e s s i o n s k o n s t a n t e n )

(dem

und

Regressionskoeffizienten).

Arbeitstabelle: i-tes Paar von Klausuren

x

i

У±

1 2 3 4 5 6

304 461 608 664 399 515

257 403 484 523 386 449

92416 212521 369664 440896 159201 265225

Σ

2951

2502

1539923

Daraus ergibt

ή

xf

66049 162409 234256 273529 148996 201601 1086840

χ

ίΥί

78128 185783 294272 347272 154014 231235 1290704

sich:

1 1 χ = - X Xi = - · 2 9 5 1 = 491,8333 , n 6 i=i 1 n 1 У = - Σ У± = 7 ·2 П 6 i=l

5 0 2

= 417,0000,

1 n 1 s | = - X x? - χ 2 = - · 1 5 3 9 9 2 3 - 491,83333 2 = η 6 i-i

14753,8056,

4. Ergänzungen

410

1 n XY = Σ n i=i

S

a, 1 =

1 - xy = -6 · 1290704 - 205094 = 10022,8333,

10022,8333 = 0,6793 und 14753,8056

a 0 = 417,0 - 0,6793 · 491,8333 = 82,8785. Interpretation: ax:

Für einen zusätzlichen Teilnehmer an der Klausur in "Mathe I" gibt es zwei Semester später im Durchschnitt rund 0,68 zusätzliche Teilnehmer an der Diplomvorprüfungsklausur im Fach "Statistik".

a 0 : Die Regressionskonstante a0 kann i.a.R. nur dann sinnvoll interpretiert werden, wenn der Stützbereich (des unabhängigen Merkmals) den Wert 0 einschließt. Wird zu Recht angenommen (vgl. Teilaufgabe b) ) , daß die Regressionsgerade auch für χ = 0 gilt, dann bedeutet a 0 = 83, daß bei 0 Teilnehmern an der Mathe-Klausur dennoch rund 83 Studierende an der Statistik-Klausur zwei Semester später teilnehmen. Inhaltlich könnte das bedeuten (vgl. Aufgabentext), daß im Mittel an einer VD-Klausur im Fach "Statistik" rund 83 angehende Soziologen und Politologen teilnehmen. c) Ein geeignetes Zusammenhangsmaß für die Richtung und die Stärke eines linearen Zusammenhangs zwischen metrischen Merkmalen ist der Korrelationskoeffizient nach BRAVAIS/PEARSON:

Mit s XY = 10022,8333 , s x = 4 sY r =

ι Л, Σ У1 - У 2 = iTi = 85,1529 ergibt =

n

753,8056 = 121,4652 ,

ι ~ •2502 6 sich

4172

= 7251,00 und

10022,8333 : = 0,9690 . 121,4652 · 85,1528

Wegen -1 < r < +1 ist der lineare Zusammenhang zwischen den beiden Merkmalen positiv und wegen 0 < r 2 = 0,939 < 1 ist er sehr stark ausgeprägt. Rund 94% der Varianz des abhängigen Merkmals Y werden durch die Regressionsgerade, d.h. durch die lineare Beziehung zwischen den beiden Merkmalen erklärt. d) Gesucht ist zunächst: Y (x = 435) = 82,8785 + 0,67 93 • 435 = 378,374 . Für die Diplomvorprüfungsklausur im Fach 92/93 ist mit 379 Teilnehmern zu rechnen.

Statistik

im

WS

4. Ergänzungen

411

Die zur Korrektur dieser Klausuren erforderliche Zeit wird zwischen 50-379 = 18950 min = 316 h und 70-379 = 26530 min = 442 h liegen. Voraussetzung für diese Abschätzung ist, daß das lineare Modell, d.h. die oben aufgestellte Regressionsgleichung, auch für das WS 92/93 gilt. M.a.W., das WS 92/93 muß im Geltungsbereich des linearen Modells liegen. Aufgabe 5.2 Brause arbeitet in einer Fabrik, die unter anderem Doppelkekse mit Schokoladencremefüllung herstellt. Seine Aufgabe besteht in der Zubereitung und dem Abschmecken der Schokoladencreme. Für den Geschmack der Creme ist der Kakaoanteil entscheidend. Da von Tag zu Tag erhebliche Geschmacksunterschiede bei den produzierten Keksen auftreten und Brause bekanntermaßen gerne und ausgiebig dem Bier zuspricht, vermutet A. Feuerblick, Qualitätsinspektorin, einen Zusammenhang zwischen der von Brause am jeweiligen Vorabend getrunkenen Menge Bier und dem Kakaoanteil der Schokoladencreme am darauffolgenden Tag. Um diesem auf die Spur zu kommen, ermittelt sie an sieben Tagen die Anzahl der von Brause am Vorabend geleerten Seidia1 Bier und den Kakaoanteil der Schokoladencreme am folgenden Tag.

Tag

Anzahl der am Vorabend konsumierten Seidia Bier

1 2 3 4 5 6 7

2 5 0 1 3 4 6

Kakaoanteil der Schokoladencreme in % 6,4 2,8 11, 3 10, 1 5, 8 6, 5 2,9

a) Berechnen und interpretieren Sie die Parameter einer sinnvollen ausgleichenden Regressionsgeraden! b) Berechnen Sie ein geeignetes Zusammenhangsmaß und interpretieren Sie die Stärke des Zusammenhangs! c) Wieviel ganze Seidia Bier dürfte Brause bei Gültigkeit der linearen Beziehung höchstens trinken, wenn der Kakaoanteil im Mittel nicht unter 7% sinken soll?

1) Im Fränkischen gebräuchlicher diminutiver Ausdruck mit einem Fassungsvermögen von einem halben Liter.

für einen Bierkrug

412

4. Ergänzungen

d) Welcher Kakaoanteil ist gemäß der linearen Beziehung bei Genuß von zehn Seidia Bier zu erwarten, und wie ist dieses Ergebnis zu interpretieren? Lösung 5.2 Merkmalsträger: sieben Tage; Merkmale: Anzahl der konsumierten Seidia Bier (X, metrisch), Kakaoanteil der Schokoladencreme (Y, metrisch). a) Sinnvolle ausgleichende Regressionsgerade ist: Ϋ (x) = a0 + ajX mit a

o

=



У_

s

_ a

i

x

'

=

xy

—Г s

'



1

X =

ν

n

x

— X

-

n

V

' У =

1

-

n

v=i

V

L·, У ν ' V=1

n

1 1 = - X x v - X 2 und s xy = - £ x v y v - xy . П

v-l

П

v=l

Arbeitstabelle:

V

Xv

xvyv

Уу

x2v

y2v

1

2

6,4

12,8

4

2

5

2,8

14,0

25

40, 96 7,84

3

0

11,3

0,0

0

127,69

4

1

10,1

10,1

1

102,01

5

3

5,8

17,4

9

3 3 , 64

6

4

6,5

26,0

16

42,25

7

6

2,9

17,4

36

8,41

Σ

21

45,8

97,7

91

362,80

Daraus ergibt sich: 21 45,8 , 91 , Χ = γ = 3, y = — = 6,5429, Sx = — - 32 = 4 , 97,7 s XY = -γ- - 3 • 6,5429 = -5,6716, 1 а, = - 5,6716 = -1,4179 4 so daß

und

Y(x) = 10,7966 - 1,4179X ist. Das bedeutet:

an = 6,5429 + 1,4179 • 3 = 10,7966,

4. Ergänzungen

413

-

W e n n Brause am V o r a b e n d kein Bier g e t r u n k e n hat, dann hat die Schokoladencreme am Tag darauf einen durchschnittlic h e n K a k a o a n t e i l v o n r d . 1 0 , 8 % (a 0 ) ;

-

bei jedem zusätzlich konsumierten Seidia Bier sinkt der Kakaoanteil im Durchschnitt um rd. 1,4 Prozentpunkte Ui) .

b) E i n g e e i g n e t e s M a ß zur M e s s u n g d e r S t ä r k e Zusammenhangs ist das Bestimmtheitsmaß: r2

Mit

=

S

Ί

XY

S B

Υ

lsxsyJ 1

n

N

? /

s|

V



2

Y

362,8 о - 6,5429 = 9,0190 = — —

Rechenergebnissen erhält τ

,

=

- 5,6716 2 4 · 9,0190

(linearen)

2 XY

Χ

V

eines

und

den

man

= 0,8916.

F a s t 90% d e r V a r i a n z d e s a b h ä n g i g e n M e r k m a l s Y w e r d e n d u r c h die lineare Regression erklärt. W e g e n 0 < r2 < 1 ist der lineare Zusammenhang zwischen den beiden Merkmalen "stark". c) Da d e r K a k a o a n t e i l i m M i t t e l n i c h t u n t e r 7% s i n k e n s o l l , ist x, d i e A n z a h l d e r S e i d i a , w i e f o l g t a u s d e r R e g r e s s i o n s g e r a den Y(X) = 10,7966 - 1,4179X 7 < 10,7966 - 1,4179X zu b e s t i m m e n . E s e r g i b t s i c h : χ < 2, 6 7 7 6 , so d a ß B r a u s e V o r a b e n d h ö c h s t e n s 2 (ganze) S e i d i a B i e r t r i n k e n d a r f . d) M i t χ = 10

am

ist

Υ ( ΐ θ ) = 10,7966 - 1,4179 · 10 = -3,3824. E i n n e g a t i v e r m i t t l e r e r K a k a o a n t e i l ist u n s i n n i g . 10 S e i d i a Bier liegen außerhalb des Geltungsbereichs des linearen Mod e l l s . Ü b e r d e n zu e r w a r t e n d e n m i t t l e r e n K a k a o a n t e i l l a s s e n sich daher keine Aussagen machen.

Aufgabe

5.3

E i n W a s c h m a s c h i n e n h e r s t e l l e r w i r b t für e i n e s s e i n e r Produkte u.a. damit, daß sich die Schleuderdrehzahl der Waschmaschine z w i s c h e n 600 u n d 1500 U m d r e h u n g e n p r o M i n u t e (U/min) i n A b s t ä n d e n v o n 100 U / m i n e i n s t e l l e n l ä ß t . V o n d e r S c h l e u d e r d r e h z a h l e n t s c h e i d e n d a b h ä n g i g i s t d e r T r o c k n u n g s g r a d d e r W ä s c h e . Der H e r s t e l l e r w i l l d e n T r o c k n u n g s g r a d in A b h ä n g i g k e i t von der S c h l e u d e r d r e h z a h l abbilden. Der T r o c k n u n g s g r a d der Wäsche wird

414

4. Ergänzungen

dabei durch deren Restfeuchtegehalt nach dem Schleudern gemessen. Gewaschen werden Handtücher, die im trockenen Zustand 4 kg und im nassen, d.h. ungeschleuderten Zustand 8 kg wiegen. Bei vier Waschvorgängen mit verschiedenen Schleuderdrehzahlen ergaben Messungen des Gewichts der Handtücher nach dem Schleudern folgendes Ergebnis.

Schleuderdrehzahl [U/min]

Gewicht der Handtücher nach dem Schleudern in kg

600

5, 84

900

5,52

1200

5, 32

1400

5,24

a) Im nassen, d.h. ungeschleuderten Zustand wiegt die Wäsche 8 kg, und ihr Restfeuchtegehalt beträgt 100%, im trockenen Zustand wiegt sie 4 kg, und ihr Restfeuchtegehalt beträgt 0%. Bestimmen Sie unter Berücksichtigung dieser Angaben zunächst den Restfeuchtegehalt der Wäsche in Prozent bei den angegebenen Schleuderdrehzahlen! b) Berechnen Sie mit den Ergebnissen aus Teilaufgabe a) und ausgehend von den Schleuderdrehzahlen 0, 600, 900, 1200 und 1400 die Parameter der ausgleichenden Regressionsgeraden, die den Zusammenhang zwischen der Schleuderdrehzahl und dem Restfeuchtegehalt der Wäsche beschreibt! Interpretieren Sie die berechneten Parameter! Bei der Interpretation des Steigungsparameters der Regressionsgeraden ist zu berücksichtigen, daß sich die Schleuderdrehzahl der Waschmaschine nur in Abständen von 100 U/min variieren läßt. c) Bestimmen und interpretieren Sie den Wert einer geeigneten Maßzahl zur Beschreibung der Güte der linearen Beziehung zwischen der Schleuderdrehzahl und dem Restfeuchtegehalt! d) Welcher Restfeuchtegehalt und welches Gewicht der Handtücher ergibt sich bei Gültigkeit der linearen Beziehung bei einer Schleuderdrehzahl von 1000 ö/min? Nehmen Sie zu dem berechneten Wert kurz Stellung! e) Auf welche Schleuderdrehzahl muß man die Waschmaschine mindestens einstellen, um bei Gültigkeit der linearen Beziehung einen Restfeuchtegehalt der Wäsche von höchstens 36,5% zu erreichen? f) Bei welcher Schleuderdrehzahl wäre gemäß der ziehung die Wäsche vollständig trocken?

linearen

Be-

4. Ergänzungen

415

Iiöaong 5.3 Merkmalsträger: Waschvorgänge, Merkmale a)

Schleuderdrehzahl (metrisch), Restfeuchtegehalt in % (metrisch)

G sei das Gewicht der Handtücher nach dem Schleudern in kg. G -4 - · 100% .

Y =

b)

X: Y:

Schleuderdrehzahl [U/min]

Gewicht der Handtücher nach dem Schleudern in kg

Restfeuchtegehalt in %

600 900 1200 1400

5, 84 5, 52 5, 32 5,24

46 38 33 31

— / \ Y (XJ = a0 + аг · X mit

О уγ = — γ - und a0 = у - а1 · χ s2x 1 А У = ;n Е У У / v=1

1 А χ = - Σ χ ν 11 ν=1 1 n 2 sX = - Σ (x v - x ) n

°der

s

v=l

v=l

1 n S x x XY = ~ n Σ ( v - ) (yv - у) v=1 Arbeitstabelle: V 1 2 3 4 5 Σ

xv 0 600 900 1200 1400 4100

yv

672400 48400 6400 144400 336400 1208000

4100 χ = — — = 820, Ь 7

six = s XY =

1208000 = 241600 5 - 58560

1 n Sxy = -n Σ хуУу V=1

Oder

Xy

(xv - χ)2

100 46 38 33 31 248

1 n x = ~П Σ xv - X 2 / x

У •

(xv - x)(yv - y)

ХуУу

-41328 792 -928 -6308 -10788 -58560

0 27600 34200 39600 43400 144800

0 360000 810000 1440000 1960000 4570000

248 у = — = 49,6, Э oder

2 si

= -11712 oder s XY =

4570000 5 144800

л

2

820z = 241600 ,

820 · 49,6 = -11712,

4. Ergänzungen

416

a

- 11712 i = >>л-,гпп = -0,04848, a 0 = 49,6 + 0,04848 · 820 = 89,35. 241600

Erhöht man die Schleuderdrehzahl um 100 U/min, dann nimmt der Restfeuchtegehalt der Wäsche im Durchschnitt um 4,8 Prozentpunkte ab. Aus dem linearen Modell ergibt sich ein Restfeuchtegehalt von 89,35% für ungeschleuderte Wäsche. Dieser Wert ist unrealistisch, da für die ungeschleuderte Wäsche der Restfeuchtegehalt von 100 % festgelegt wurde. c) Eine geeignete Maßzahl zur Beschreibung der Güte der linearen Beziehung ist das Bestimmtheitsmaß s2 2 XY r = —2 γ ; dabei ist sx · sy n

2 4 =1 -ν=1Σ (yv У)

n

oder

41 ν=1 = ~ Σ У ν - У2·

П

η

Arbeitstabelle: V

Уу

(Уу - У)2

1

100

2540,16

2

46

3

38

134,56

1444

4

33

275,56

1089

5

31

345,96

961

Σ

248

3309,20

15610

, 3309,2 Sy = j—^ = 661,84

oder

2 r =

12, 96

2

15610 = —

Уу 10000 2116

, 49,62 = 661,84 .

(- 11712)2 241600 · 661,84

= 0,8579 .

85,79% der Varianz des Restfeuchtegehalts werden durch das lineare Modell erklärt. Daher liegt eine relativ stark ausgeprägte lineare Beziehung zwischen der Schleuderdrehzahl und dem Restfeuchtegehalt der Wäsche vor. d) Durch Einsetzen in die Gleichung der Regressionsgeraden erhält man Y(1000) = 89,35 - 0,04848 · 1000 = 40,87, G(lOOO) = 4 + 4 · 0,4087 = 5,6348. Gemäß der linearen Beziehung ergibt sich ein Restfeuchtegehalt von 40,87% und damit ein Gewicht von 5,63 kg bei einer Schleuderdrehzahl von 1000 U/min. Diese Werte widersprechen

4. Ergänzungen

417

den vorliegenden Daten, weil bereits bei 900 U/min der Restfeuchtegehalt schon 38% bzw. das Gewicht 5,52 kg beträgt. e) Durch Einsetzen in die Gleichung der Regressionsgeraden erhält man Y(X) = 36,5 89,35 - 0,04848 · X = 36,5 36,5 - 89,35 ί X = —£ — = 1090,14 . - 0,04848 Man muß die Schleuderdrehzahl der Waschmaschine mindestens auf 1100 U/min einstellen, um bei Gültigkeit der linearen Beziehung einen Restfeuchtegehalt der Wäsche von höchstens 36,5% zu erreichen. f) Durch Einsetzen in die Gleichung der Regressionsgeraden erhält man

Y(X) = 0 89,35 - 0,04848 · X = 0 - 89,35 ί X = = 1843,03 . - 0,04848 Bei einer Schleuderdrehzahl von 1843,03 U/min wäre gemäß der linearen Beziehung die Wäsche vollständig trocken. Mit dem beschriebenen Gerät kann diese Schleuderdrehzahl allerdings nicht erreicht werden. Aufgabe 5.4 In einer wissenschaftlichen Untersuchung wird behauptet, daß sich durch den Aufenthalt im Krankenhaus der Intelligenzquotient der Patienten verändert. Es wird vermutet, daß der Intelligenzquotient mit länger werdendem Aufenthalt tendenziell abnimmt. Ein Doktorand der Medizin möchte diese Behauptung empirisch untersuchen. Hierfür wählt er zwanzig Patienten eines Krankenhauses aus und stellt mit deren Einwilligung und einem allgemein anerkannten Verfahren deren Intelligenzquotienten zu Beginn und zum Ende ihres Krankenhausaufenthalts fest. Durch seine Erhebung stehen ihm die auf der folgenden Seite angegebenen Daten zur Verfügung. Fassen Sie die zur Verfügung stehenden Daten zu einer Kontingenztabelle zusammen! Berechnen und interpretieren Sie eine geeignete statistische Maßzahl zur Beschreibung des vermuteten Zusammenhangs!

4. Ergänzungen

418

Liegezeit: 1 bis 3 Tage Veränderung des Intelligenzquotienten Zunahme Patient Nr.

10 6 20 19 4 15

Abnahme um 1 bis 5 Punkte

6 bis 10 Punkte

11 bis 20 Punkte

Uber 20 Punkte

• • • • • •

Liegezeit: 4 bis 7 Tage Veränderung des Intelligenzquotienten Abnahme um

Zunahme Patient Nr.

1 bis 5 Punkte

6 bis 10 Punkte

11 bis 20 Punkte

Uber 20 Punkte



17 9 7 14

• • •

Liegezeit: 8 bis 14 Tage Veränderung des Intelligenzquotienten Abnahme um

Zunahme Patient Nr.

1 bis 5 Punkte

12 13 18 16 8



6 bis 10 Punkte

11 bis 20 Punkte

Uber 20 Punkte

• • • •

Liegezeit: über 14 Tage Veränderung des Intelligenzquotienten Abnahme um

Zunahme Patient Nr.

2 3 5

1 bis 5 Punkte

6 bis 10 Punkte

11 bis 20 Punkte

• • • •

11 1

Uber 20 Punkte



4. Ergänzungen

419

Lösung 5.4 Merkmalsträger: 20 Patienten, Merkmale: Liegezeit im Krankenhaus (U), metrisch klassiert, Veränderung des Intelligenzquotienten (V) ' Ordinal. Ein geeignetes Zusammenhangsmaß für ordinale Merkmale bei Vorhandensein von Bindungen ist das Kontingenzmaß von GOODMAN/KRUSKAL γ. Kontingenztabelle: V

и

Zunahme

Abnahme um 1 bis 5 Punkte

Abnahme Abnahme um um 6 bis 10 11 bis 20 Punkte Punkte

3

2

1

2

2

1

2

Abnahme um über 20 Punkte

\

1 bis 3 Tage 4 bis 7 Tage 8 bis 14 Tage über 14 Tage

1

1 2

3

nk = 3·13 + 2·10 + 1·6 + 2·8 + 2·6 + 1·5 + 1·5 + 2·5 + 1·3 = 116 , nd = 1 · 7 + 1·3 + 2·1 = 12, nk - nri nk + n d

116 - 12 116 + 12

104 = 0,8125 . 128

Wegen -1 < γ < +1 besteht zwischen den beiden Merkmalen eine relativ stark ausgeprägte monoton positive Beziehung. Bei den untersuchten Patienten bewirkt demnach eine Zunahme der Liegezeit im Krankenhaus mit starker Tendenz eine Abnahme ihres Intelligenzquotienten. Aufgabe 5.5 Dem Hypochonder Brause ist folgendes zu Ohren gekommen: Der Arzt Dr. Buse behauptet, die häufige subkutane Verabreichung von Bienengift (z.B. in Form kontrolliert zugefügter Bienenstiche) reduziere die Häufigkeit von Erkältungen. Zur Untermauerung dieser These führt er ins Feld, daß Imker von allen Beruf sgruppen am seltensten von Erkältungen belästigt werden. Da Brause Ärzten grundsätzlich mißtraut, führt er in seinem Bekanntenkreis eine Vollerhebung durch. Hier ist das Ergebnis:

420

4. Ergänzungen

Häufigkeit der Erkältungen gering gemäß Selbstauskunft ->

mittel

hoch

Beruf 4Imker

8

4

1

Gerichtsvollzieher

8

5

6

Anlageberater

6

3

4

a) Berechnen Sie für beide Merkmale jeweils ein Lagemaß und ein Streuungsmaß! b) Berechnen Sie für obige Tabelle den Wert eines Zusammenhangsmaßes!

geeigneten

c) Nennen Sie Gründe, die für das folgende alternative Vorgehen sprechen: Die obige Tabelle wird zu der untenstehenden VierFelder-Tafel zusammengefaßt, für die GOODMAN/KRUSKALs γ berechnet wird. (Zur Erinnerung: Es soll überprüft werden, ob die These "Häufige Verabreichung von Bienengift senkt die Häufigkeit von Erkältungen" für Brauses Bekanntenkreis zutrifft.)

Häufigkeit der Erkältungen gemäß Selbstauskunft

gering bis mittel

hoch

Beruf i Imker

12

1

"Nicht-Imker"

22

10

Lösung 5.5 Merkmalsträger: Brauses Bekannte, Merkmale: Beruf / Häufigkeit der Erkältungen, Merkmalstyp: nominal (klassifikatorisch)/ordinal

(komparativ),

a) Lagemaß: Merkmal "Beruf". Da es sich um ein nominales Merkmal delt, kommt hier nur der Modus in Frage. Arbeitstabelle: i

Beruf

1 Imker

13

2 Gerichtsvollzieher

19

3 Anlageberater

13

han-

4. Ergänzungen

421

Kein einzelner Beruf ist in Brauses Bekanntenkreis so häufig vertreten wie der des Gerichtsvollziehers. Merkmal "Häufigkeit der Erkältungen". Das für ordinale Merkmale geeignete Lagemaß ist der Median. Arbeitstabelle: i

Häufigkeit

fi

Fi

1

gering

0,4889

0,4889

2

mittel

0,2667

0,7556

3

hoch

0,2444

1,0000

-

1,0000

Σ

Der Median des Merkmals "Häufigkeit der Erkältungen" ist "mittel", d.h. mindestens fünfzig Prozent von Brauses Bekannten sind mit mittlerer Häufigkeit oder seltener erkältet, und mindestens fünfzig Prozent sind mit mittlerer Häufigkeit oder öfter erkältet. Streuungsmaß: Merkmal "Beruf". Für nominale Merkmale gibt es hier zwei Möglichkeiten, erstens die Entropie und zweitens das Maß vom Typ HERFINDAHL. Entropie: 3

H(A) = - X ^ ld ^ . i=l ArbeitStabelie: i

ГЧ

fi

- ^ ld ^

1

13

0,2889

0,5175

2

19

0,4222

0,5252

3

13

0,2889

0,5175

45

1,0000

1,5602

Σ

Wegen 0 £ h ( a ) = 1,5602 < ld к = 1,585 liegt hier eine sehr hohe Streuung vor (nahezu eine Gleichverteilung). Ergänzung: Relative Entropie als Normierung der Entropie , . H(Ä) 1,5602 r(a) = = = 0,9844 . ld к 1,5850

422

4. Ergänzungen

Maß vom Typ HERFINDAHL: Arbeitstabelle:

i

fi

1

0,2889

0,0835

2

0,4222

0,1783

3

0,2889

0,0835

Σ

1,0000

0,3453

3

K H (A) = Σ fi = 0,3453 , i=l S h (A) = 1 - K h (A) = 0,6547. Wegen

0 < S H (A) = 0,6547 < 1 - - = 0,6 liegt hier к hohe Streuung vor (nahezu Gleichverteilung).

eine

sehr

Ergänzung: Normiertes Streuungsmaß , . к · S H (A) SH(A)„o™. = k _ ! =

3 · 0,6547 J "

0,9821

'

Merkmal "Häufigkeit der Erkältungen". Ein Streuungsmaß für ordinale Merkmale ist das Maß auf der Basis der Entropie. k-i . . S(u) = Σ Η ( Α : ) 5=1

mit

H(A3) = -(fj(1 Id fjA + fji2 Id fj(2), j = 1,2

к - 1.

Arbeitstabelle:

A

- fj,i ld fj(i

3

fjA

AL

0,5111

0,4950

A2

0,2444

0,4966

-

-

s(u) Wegen vor.

- fj/2 ld fj,2

H(Aj)

0,4889

0,5047

0,9997

0,7556

0,3051

0,8017

-

1,8014

fj,2

-

0 < S(u) = 1,8014 < к - 1 = 2

liegt

eine

hohe

Streuung

4. Ergänzungen

423

с) A l s Z u s a m m e n h a n g s m a ß ist e i n M a ß zu w ä h l e n , d a s f ü r d a s n i e d r i g e r e S k a l e n n i v e a u a n g e w e n d e t w e r d e n k a n n . In d i e s e m F a l l e a l s o e i n e s für n o m i n a l e M e r k m a l e . H i e r g i b t e s zwei Möglichkeiten, erstens den Assoziationskoeffizienten auf der Basis v o n χ2

und zweitens die

Assoziationskoeffizient

Σ Σ ^

i=ij=i n i. n .j

Transinformation.

auf der Basis v o n χ2 :

- 1

Arbeitstabelle: 1

j i

2

n

i.

\ 1

64

2

64

0,1026

36

"•j

0,1722

0,0577

0,1119

12

Die Felder im Inneren der T a b e l l e

Daraus ergibt sich für

13

16

9 0,1259

19

36 0,1096

22

13 0,0070

25 0,1531

3

1

16 0,2238

χ2

3

11

sind wie folgt

45

besetzt:

χ2:

= 45 · (θ,2238 + 0,1531 + ··· 0,1119 - l) = 45 · 0,0638 = 2,871 .

Wegen 0 < χ 2 < η · min{(k - l),(m - l)} = 45 · 2 = 90 liegt hier eine äußerst geringe statistische Abhängigkeit zwischen dem Beruf u n d der Häufigkeit der Erkältungen in Brauses Bekanntenkreis vor.

4. Ergänzungen

424

Ergänzung: Maß von CRAMER V =

Ι γ} I j—* γ = \ η • min{(k - l),(m - 1)}

/2,871

= 0,1786.

V 90

Transinformation: τ(α, в) = η(α) + Н(в) - η(α, в); dabei ist 3

3

h(a) = - Σ fi· l d fi. ' H(B) = - Σ f.j l d f.j i=l i=l 3

h(a,

und

3

Β) = -ΣΣΪ,

ld f

ij ·

i-lj=l Arbeitstabelle: 2

1

3

fi. ld f

y ^ f 1

0,178

0, 089 0,4432

2

0,178

0,111 0,4432

3

0, 133

·:

0,5253

0,3871 0, 089

0,2613 0,267

0,489

0,5176 0,422

0,133

0, 067

0,289

0,1211

0,3520

0,3871 f

0, 022

0,3106

i.

0,3106

0,289 0,5176

0,244 -

- f.j ld f.j

0,5047

0,5087

0,4966

Die Felder im Inneren der Tabelle sind wie folgt besetzt:

H(A) = 0,5176 + 0,5253 + 0,5176 = 1,5605, Н(В) = 0,5047 + 0,5087 + 0,4966 = 1,5100, H(A,B) = 0,4432 + ... + 0,3106 = 3,0162, t(A,B) = 1,5605 + 1,5100 - 3,0162 = 0,0543.

4. Ergänzungen

425

Wegen 0 < t(a,b) = 0,0543 < тл.п{н(А),н(в)} = 1,51 liegt hier eine sehr schwache statistische Abhängigkeit vor. Ergänzung: Für die normierte Transinformation ergibt sich: l I\ 0,0543 C(A,B|BJ = 1 5 1 = 0,036. c) -

Es geht um die Häufigkeit der Bienenstiche - hierin unterscheidet sich nur (so wird für die Aufgabe unterstellt) der Beruf des Imkers von den anderen Berufen. Daher lassen sich die "Nicht-Imker" zu einer Ausprägung zusammenfassen. Es wird (in der These) lediglich zwischen "häufiger" und "seltener" unterschieden. Zudem kann bei nunmehr zwei Berufen auch eine dritte Ausprägung bei den Häufigkeiten keinen Informationsgewinn bringen (wenn sich die Ausprägungen inhaltlich sinnvoll zusammenfassen lassen). Da alle Nicht-Imker zusammengefaßt werden, sind beide Merkmale ordinal (Häufigkeit der Bienenstiche, Häufigkeit der Erkältungen), γ läßt sich also berechnen.

Aufgabe 5.6 Ein Sozialwissenschaftler vermutet, daß ein Zusammenhang zwischen dem erreichten Ausbildungsniveau und dem monatlichen Nettoeinkommen als Berufsanfänger besteht. Eine Untersuchung bei hundert Personen führte zu folgendem Ergebnis: Qualifikation vor dem Hauptschul- Mittlere Abitur Berufseintritt —> abschluß Reife Nettoeinkommen als Berufsanfänger ^ unter 1.000 DM

10

7

3

1.000 DM bis 2.000 DM

17

33

20

über 2.000 DM

0

3

7

a) Stellen Sie die bedingten Verteilungen der Nettoeinkommen dar und interpretieren Sie zwei der von Ihnen berechneten Werte! b) Welches Problem entsteht bei der Charakterisierung der Nettoeinkommensverteilung durch das arithmetische Mittel? Nennen Sie zwei wichtige Lagemaße, die dieses Problem umgehen! Wie umgehen diese Maße dieses Problem? Welches dieser beiden Maße halten Sie hier für besser geeignet? Warum? (Es sind keine Berechnungen verlangt!)

426

4. Ergänzungen

с) M e s s e n S i e d i e S t ä r k e des s t a t i s t i s c h e n Hilfe einer geeigneten Maßzahl!

Lösung

mit

5.6

Merkmale: Nettoeinkommen Schulabschluß Merkmalsträger:

100

U:

Hauptschule,

U2:

Mittlere

U3:

Abitur,

(klassiert),

Reife,

Xi: b i s 1 0 0 0

DM,

X2:

1000 b i s 2 0 0 0

X3:

über 2000

DM,

DM.

Häufigkeitsverteilung: f

-(*ik) = V '

(U).

ordinal,

Uj:

Bedingte

(X),

Personen.

Merkmalstyp: X: metrisch

a)

Zusammenhangs

( X i' ü j) '/ г ' Ф:)

i': = г ' 2 ' 3 ·

Arbeitstabelle: i

f(xih)

ψί|"2)

φι|θ3)

1

— = 0,3704 27

— = 0,1628 43

— = од 30

2

17 — = 0,6296 27

33 — = 0,7674 43

20 ^^ — = 0,6 30

3

0

— = 0,0698 43

7 — = 0,23 30

Σ

1,0000

1,0000

1,0000

Interpretation der eingerahmten E t w a 63 P r o z e n t d e r H a u p t s c h ü l e r m e n z w i s c h e n 1000 u n d 2000 DM.

Werte: haben

ein

Einstiegseinkom-

4. Ergänzungen

10 P r o z e n t d e r A b i t u r i e n t e n h a b e n ein E i n s t i e g s e i n k o m m e n 1000 DM. b)

427

bis

X3 w ä r e w i l l k ü r l i c h zu s e t z e n . S e i n e W a h l h ä t t e E i n f l u ß a u f d e n W e r t v o n χ . Dieses P r o b l e m w i r d v o n M o d u s u n d M e d i a n u m g a n g e n . Zur B e r e c h n u n g b e i d e r M a ß e w e r d e n die A u s p r ä g u n g e n n i c h t v e r w e n d e t . Der M e d i a n ist h i e r b e s s e r g e e i g n e t , d a er I n f o r m a t i o n e n ü b e r die R a n g f o l g e d e r A u s p r ä g u n g e n verwertet.

c) Es ist e i n Z u s a m m e n h a n g s m a ß für o r d i n a l e M e r k m a l e zu w ä h len. In d i e s e m Fall e x i s t i e r e n B i n d u n g e n , a l s o w i r d das Kontingenzmaß von GOODMAN/KRUSKAL berechnet. - nd + nd

=

mit der Anzahl der konkordanten n

n k = Σ Σ ij · V ir] κ ι ,:'

und der Anzahl der diskordanten n

d = Σ

κι

Σ

n

Paare

Paare

ij · n i· ,· ·

n k = 10 · (33 + 20 + 3 + 7) + 7 · (20 + 7) + 17 · (3 + 7) + 33 · 7 = 10 · 63 + 7 · 27 + 17 · 10 + 33 · 7 = 630 + 189 + 170 + 231 = 1220 , nd

= 3 · (17 + 33 + 3) + 7 · (17) + 20 · (З) = 3 · 53 + 7 · 17 + 20 · 3 = 159 + 119 + 60 = 338 ,

ν = '

1220 - 338 1220 + 338

=

882 1558

= 0,57 .

W e g e n - 1 < γ = 0,57 < +1 liegt e i n m ä ß i g a u s g e p r ä g t e r , m o n o t o n n i c h t f a l l e n d e r Z u s a m m e n h a n g vor, d . h . m i t der S c h u l b i l d u n g s t e i g t t e n d e n z i e l l das N e t t o e i n s t i e g s e i n k o m m e n .

A u f g a b e 5.7 E i n S t r e i t p u n k t b e i d e r R e g i e r u n g s k o n f e r e n z der E u r o p ä i s c h e n U n i o n , die i m D e z e m b e r 2000 in N i z z a i h r e n A b s c h l u ß fand, w a r die S t i m m e n g e w i c h t u n g im Rat d e r E U bei a l l e n Fragen, die m i t q u a l i f i z i e r t e r M e h r h e i t e n t s c h i e d e n w e r d e n m ü s s e n . Im f o l g e n d e n

428

4. Ergänzungen

finden Sie die Anzahl der Stimmen und die Einwohnerzahl der einzelnen Mitgliedstaaten für die aktuelle Situation und die zukünftigen Verhältnisse nach dem Beitritt von 12 weiteren Staaten gegenübergestellt. EU-Mitglieder und ihre Stimmen im Rat der Europäischen Union Zukünftiger Stand gemäß dem Aktueller Stand Vertrag von Nizza (15 Mitgliedstaaten) (27 Mitgliedstaaten)

Deutschland Großbritannien Frankreich Italien Spanien Niederlande Griechenland Belgien Portugal Schweden Österreich Dänemark Finnland Irland Luxemburg

Einwohner Stimmen in Mio. 82,0 10 59, 3 10 59,0 57, 6 39, 4 15, 8 10, 5 10,2 10, 0 8,8 8,1 5,3 5,2 3,7 0,4

10 10 8 5 5 5 5 4 4 3 3 3 2

Deutschland Großbritannien Frankreich Italien Spanien Polen Rumänien Niederlande Griechenland Tschechien Belgien Ungarn Portugal Schweden Bulgarien Österreich Slowakei Dänemark Finnland Irland Litauen Lettland Slowenien Estland Zypern Luxemburg Malta

Einwohner Stimmen in Mio. 82, 0 29 59,3 29 59,0 57, 6 39,4 38,7 22,5 15, 8 10,5 10, 3 10,2 10, 1 10,0 8,8 8,2 8,1 5,4 5,3 5,2 3,7 3,7 2,4 2,0 1,4 0,8 0,4 0,4

29 29 27 27 14 13 12 12 12 12 12 10 10 10 7 7 7 7 7 4 4 4 4 4 3

a) Welche Werte nimmt GOODMAN/KRUSKALs γ als Maß für einen monotonen Zusammenhang zwischen der Anzahl der Stimmen und der Einwohnerzahl der Mitgliedstaaten jeweils an? (Hinweis: Zur Beantwortung dieser Frage ist das Erstellen von Kontingenztabellen nicht notwendig!)

4. Ergänzungen

429

b) Als Faustregel galt bisher, daß die Anzahl der Stimmen der einzelnen Staaten annähernd linear mit der Quadratwurzel der Einwohnerzahl wachsen sollte. Bestimmen Sie für die aktuelle und die zukünftige Situation im Europäischen Rat jeweils eine geeignete Regressionsgerade, und vergleichen Sie die Güte der beiden Geraden! c) Welche Bedingungen müßten die Parameter der Regressionsgeraden und das Bestimmtheitsmaß erfüllen, damit man von einer direkten Proportionalität zwischen den Größen "Anzahl der Stimmen" und "Quadratwurzel der Einwohnerzahl" sprechen könnte?

Lösung 5.7 Merkmalsträger:

Staaten der EU (15 bzw. 27);

Merkmale:

Einwohnerzahl in Mio. (X), Anzahl der Stimmen im Rat (Y);

Merkmalstyp:

jeweils metrisch.

a) Aus den Tabellen ist ersichtlich, daß die Länder sowohl nach Einwohnern als auch nach Anzahl der Stimmen absteigend sortiert sind. Es gibt also einen vollständigen (positiven) monotonen Zusammenhang zwischen diesen beiden Merkmalen, und zwar für die aktuelle wie auch für die zukünftige Situation im Rat der Europäischen Union. Damit gilt in beiden Fällen: γ = 1. b) Eine geeignete Regressionsgerade ist: у (Vx) = a 0 + aj^Vx , mit a 0 = у - aj^-v/x und a x = •

S2Л

Für die aktuelle Situation (n = 15) ergibt sich damit:

У =

=

15

87 15

=

-7= У Jx~ 64,826 Vi = = = 4,3217, 15 15 2 l^-i "7=2 S r = — · У Xi - Vx vx 15 ^

=

375,3 9 - 4,3217 15

η = ^ - IVir-yi-Vi-y ^ SV

Vx

=

7*923 6,3429

=

482 372 = — -

= 6,3429,

5,8 · 4,2317 = 7,0923 ,

430

4. Ergänzungen

a 0 = у - ax • -Ух = 5,8 - 1,1181 · 4,3217 = 0,9679. Regressionsgerade ist somit: y(Vx) = 0,97 + 1,12 · Vx . •

Für die zukünftige Situation

(n = 27) erhält man:

345 У = — = 12Л78, 27 η= 94,962 Vx = = 3,517, 27 Svx,y r = 2

12,778 . 3,517 = 20,346,

481^2 _ 27

=

a-i =

17 62 729 27-

г

=

54529

20,34 6 — = 3,731, 5,4529

a 0 = 12,778 - 3,731 · 3,517 = -0,344 Regressionsgerade ist somit:

y(Vx) = -0,34 + 3,73 · Vx .

Interpretation für die zukünftige Situation:

a 0 = -0,34: Ein Land mit 0 Einwohnern hätte -0,34 Stimmen zu erwarten. Diese Aussage ist unsinnig; zudem ist χ = 0 weit außerhalb des Stützbereichs. a-L = 3,73:

Pro 1000, um die die Quadratwurzel der Einwohnerzahl eines Landes größer ist als die eines anderen Landes, ist die Anzahl der Stimmen im Rat im Mittel um 3,73 größer.

Ein geeignetes Maß für die Güte der Regressionsgeraden das Bestimmtheitsmaß: r

2 _

Vx,y Sy vx ' У



Für die aktuelle Situation erhält man mit

Sy = ^ r2

=

Σ У2 - У 2 = ^ 7,0923*

_

· %

627

- 5'82

=

8

'16'

_

6,3429 • 8,16 •

Für die zukünftige Situation ergibt sich mit

ist

4. Ergänzungen

431

2 6541 , Sγ2 = = 12,По = 78,982, 27 2 τ =

2 0,3 4 62 = 96,12% . 5,4529 · 78,982

Beide Regressionsgeraden liefern also einen fast vollständigen linearen Zusammenhang zwischen der Anzahl der Stimmen im Rat und der Wurzel der Einwohnerzahl. Aktuell werden z.B. über 97% der Varianz der Anzahl der Stimmen über das lineare Modell durch die Wurzel der Einwohnerzahl erklärt. Dieser Wert verschlechtert sich in der zukünftigen Situation nur geringfügig! c) Direkte Proportionalität bedeutet, daß alle Punkte auf einer Ursprungsgeraden liegen. Bei direkter Proportionalität müßte daher an = 0 und r2 = 1 sein.

Zu FS, Kapitel 6: Bestands- und Bewegungsmassen Aufgabe 6.1 Für einen Artikel Α verfügt die Lagerverwaltung über folgende Daten: Lagerbestand Artikel А Quartal

Bestand Quartalsbeginn

Zugang im Quartal

1/1997

570 Stck.

2180 Stck.

11/1997

480 Stck.

3560 Stck.

III/1997

500 Stck.

2640 Stck.

IV/1997

310 Stck.

2780 Stck.

Die Inventur zum 31.12.1997 ergab einen Bestand von 570 Einheiten. Bestimmen Sie den Durchschnittsbestand und die mittlere Verweildauer in Monaten! Schätzen Sie die jährlichen Lagerkosten, wenn pro Stück monatliche Kosten in Höhe von 0,50 DM entstehen! Wieviel Lagerkosten entfallen im Durchschnitt auf ein Stück? Lösung 6.1 a) Da die individuellen Verweildauern unbekannt sind, kann unter den Annahmen keine Fehlmengen (erfüllt), - äquidistante Beobachtungszeitpunkte (erfüllt).

432

4. Ergänzungen

-

lineare Zu- und Abgänge (fraglich).

der Durchschnittsbestand mit Hilfe von

B0 n = ' me! ) .

geschätzt werden

η

(n=4 Zeiträu-

570 570 — + 480 + 500 + 310 + — 18б0 Βο,η = ^ = — = 465. 570 = 0,5 Уgilt: 2-570

Wegen λ = У 2Β

d =

0,η ' to,η

2 · 465 · 4 3720 = 2- — — — = —— = 0,1 6 Quartale = 0,5 Monate. o,n + o,n ' 11160 23320

z

A

Arbeitstabelle: Quartal

Bestand

Zugang

Abgang

1

570

2180

2270

2

480

3560

3540

3

500

2640

2830

4

310

2780

2520

5

570

-

-

Der geschätzte Durchschnittsbestand beträgt 465 Stück, die geschätzte mittlere Verweildauer 0,5 Monate. Lagerkosten pro Artikel und Monat: 0,5 DM. Für 4 65 Artikel und zwölf Monate ergeben sich Lagerkosten von 0,5 -12-465 = 2790 DM pro Jahr . Durchschnittliche Lagerkosten pro Artikel: -

0 Verweildauer · Kosten je Artikel = 0,5-0,5 = 0,25DM. 2790

- Alternativ:

DM Jahr

11160 — Jahr

nM

= 0,25

DM

st

.

'

Die Lagerkosten für 1997 betragen 2790 DM (geschätzt). Die durchschnittlichen Lagerkosten pro Artikel betragen dann 25 Pf.

4. Ergänzungen

433

Aufgabe 6 . 2 Der Bestand einer Artikelgruppe (A-Artikel) in einem Lager beträgt zum Jahresanfang 1800 Stück. Am Ende des jeweiligen Quartals werden 2400, 3000, 2800 und 3200 Stück gezählt. a) Wie viele A-Artikel befanden sich durchschnittlich auf Lager? Auf wieviel DM belaufen sich die jährlichen Lagerkosten für die A-Artikel, wenn pro Artikel und Monat 0,128 DM Lagerkosten berechnet werden? b) Am Jahresende wird die durchschnittliche Lagerzeit der AArtikel mit 5 Tagen angegeben! Bestimmen Sie den Zugang und Abgang an A-Artikeln während des Jahres! (1 Jahr = 365 Tage)

Lösung 6 . 2 a) Die Voraussetzung B0, B n > 0 ist erfüllt. Die Beobachtungszeitpunkte sind äquidistant. Unter der Annahme einer linear approximierten Zu- und Abgangsfunktion läßt sich der Durchschnittsbestand schätzen. B0 B4 — + B, + B, + B·, + — 1 2 3 в, --2 '0,4 4 =

900 + 2400 + 3000 + 2800 + 1600 = 2675. 4

Bei diesem Durchschnittsbestand an A-Artikeln betragen die jährlichen Lagerkosten für diese Artikelgruppe

, , -τ b) d =

B

o,4 ' ten λ · Z0#4 + (1 - λ) · A0>4 '

B0 + Z0>4 - A0j4 = B4 , A

0,4 = Z0,4 ~ (B4 ~ Βθ)' B

d =

0,4 ' tp,4 λ · Z0,4 + (1 - λ) · z0(4 - (1 - λ) · (в4 - B 0 ) B

0,4 - tp,«

Z0>4 - (1 - λ) · (в4 - B 0 ) ' z0(4 - (1 - λ) · (в4 - B 0 ) = z0(4 =

+

D

α - λ). (в4 - Во).

434

4. Ergänzungen

λ wird geschätzt durch λ = 0,4 ' ^0,4 ί В0 = — я — + [i - i ^ J

B0 — B 0 + В4 Ι ( \ · (в, - в„)

2675 · 365 ( 1800 800 + 11 5: V 1800т ш = 195275 + 896 = 196171

Z0,4 =

^ )

. ·

(

3

2

0

0

-

1

8

0

0

)

А0>4 = 196171 - (3200 - 1800) = 194771 . Der Zugang an A-Artikeln betrug im betrachteten Jahr 196171 Stück und der Abgang 194771 Stück.

Zu F S , Kapitel 7: Zeitliche M e B z a h l e n , Indizes, kraftpari täten

Kauf-

Aufgabe 7.1 Die beiden folgenden Meßzahlenreihen beschreiben die Entwicklung des bundesdeutschen Exportwerts in den Jahren 1981 bis 1990. Bezugszeit der ersten Meßzahlenreihe ist das Jahr 1981; für die zweite Meßzahlenreihe wurde das Jahr 1987 als Bezugszeit gewählt. Jahr

Meßzahl

Jahr

Meßzahl

1981

1,0000

1985

1,0186

1982

1,0777

1986

0,9981

1983

1,0891

1987

1,0000

1984

1,2301

1988

1,0764

1985

1,3534

1989

1,2155

1986

1,3262

1990

1,2188

a) Bestimmen Sie für jedes Jahr des Zeitraums 1982 bis 1990 die prozentuale Veränderung des bundesdeutschen Exportwerts gegenüber dem Vorjahr! b) Berechnen Sie die Meßzahl für das Wachstum des bundesdeutschen Exportwerts zwischen 1983 und 1990! c) Berechnen Sie die durchschnittliche jährliche Wachstumsrate für den gesamten Beobachtungszeitraum von 1981 bis 1990! d) Im Jahr 1981 betrug der Wert der bundesdeutschen Exporte 396.898 Mio. DM. Berechnen Sie mit Hilfe der gegebenen Meßzahlen für jedes Jahr im Zeitraum 1982 bis 1986 den Wert der bundesdeutschen Exporte!

4. Ergänzungen

435

Lösung 7.1 a) Gesucht sind Meßzahlen mit variabler Bezugszeit (Vorjahr): xt Mt-i,t = > t=2, 3, . . ., η. *t-i können aus den gegebenen Meßzahlen mit konDiese Meßzahlen stanter Bezugszeit durch Umbasieren bestimmt werden: M

Mt- i,t

t0,t M•tJt0,t-1

Die prozentuale Veränderung des bundesdeutschen Exportwerts gegenüber dem Vorjahr ergibt sich aus (Mt_1 V M

= n"^/Mti,tn -

89,94

=

1

=

89,94 -

1

=

V

1

'

1 5 3 4

-

1

= 0Ό29, mit

M

89,90 ' M90,91 ' M91,92 ' M92,93 ' M93,94 = 1,021 · 1,019 • 1,028 · 1,032 · 1,045 = 1,1534 .

Die gesamte Preissteigerung von 1989 bis 1994 betrug 15,34% und die durchschnittliche jährliche Preissteigerung 2,9%.

438

4. Ergänzungen

b) Preisindex nach LASPEYRES (Ausgabenanteile der fünf Güter in der Bezugsperiode 1993): ^ Ρ* LPt0,t

=

9j,t0 mit den Gewichten: gj>t



j=i Pit0

=

Ρ* 4* ' ^ — ] tp

k

Σ

Pi,t 0 M 0 > 7

1,1699 · (1 + x)3 > 1,4368 ,

1,4368

43

(1 +

X)

-

1 + χ >

1Д699 1,2281 = 1,071.

D e r zu v e r h a n d e l n d e Z i n s s a t z m u ß a l s o m i n d e s t e n s 7,1% pro Jahr b e t r a g e n , damit die B u n d e s s c h a t z b r i e f e nicht die b e s s e re A l t e r n a t i v e sind.

446

4. Ergänzungen

4.2 Schließende Statistik Zu FS, Kapitel 10: Grundlagen der Wahrscheinlichkeitstheorie Aufgabe 10.1 Zum Streichen seiner neuen Wohnung kauft der Assistent M.E. nicht die feste Farbe bei Farben-Leicht, sondern eine billige Dispersionsfarbe aus dem Sonderangebot von OBI. In seiner Wohnung wird ein in ideeller Hinsicht wertvoller, kreisrunder Teppich mit einer im selben Baumarkt erworbenen quadratischen Plastikplane abgedeckt.

Beim Streichen der Zimmerdecke treten folgende Probleme auf: Die Plane erweist sich für ihren Zweck als zu klein. erreicht mit ihren Ecken gerade den Teppichrand.

Sie

Die Farbe tropft von der Decke! Mit welcher Wahrscheinlichkeit trifft ein Tropfen Farbe, der sich senkrecht über dem Teppich von der Zimmerdecke löst, auf die freiliegenden Teile des Teppichs? Gehen Sie bei Ihrer Berechnung davon aus, daß sich der Tropfen an jeder beliebigen Stelle über dem Teppich von der Zimmerdecke lösen kann!

Lösung 10.1 Kreisfläche: К = r2 · π ; Fläche der Plane (Quadrat): Q = s 2 , dabei ist s die Seitenlänge. Nach dem Satz von Pythagoras (a2 + b 2 = с 2 ) ist 2 s2 = (2 r)2 also s2 = 2 r2 = Q . Somit ist К - Q = (π - 2)r2 die Fläche des Teppichs, auf die zufällig ein oder mehrere Tropfen Farbe fallen können.

4. Ergänzungen

447

Die Wahrscheinlichkeit dafür, daß ein Tropfen Farbe auf die freiliegenden Teile des Teppichs trifft, ist gleich dem entsprechenden Flächenanteil, also К - Q _ (π - 2)r2

π -2

Aufgabe 10.2 Ein Unternehmer verkauft sein Produkt an zwei verschiedenen Orten (Α-Stadt und B-Stadt). Aufgrund von Marktuntersuchungen schätzt er seine Absatzchancen für jeden beliebigen Tag außer Sonntag (im weiteren "Geschäftstag") durch folgende Wahrscheinlichkeitsfunktionen ab. A-Stadt: Absatz [Stück]

0

1

2

3

Wahrscheinlichkeit

0,05

0,10

0, 65

0,20

B-Stadt: Absatz [Stück]

0

1

2

Wahrscheinlichkeit

0,10

0, 80

0,10

Die Absatzzahlen in den beiden Städten sind voneinander unabhängig. a) Der Unternehmer möchte gerne wissen, welche mittlere geschäftstägliche Verkaufszahl er für jede der beiden Städte auf lange Sicht erwarten kann. Beantworten Sie ihm diese Frage! b) Weiterhin ist der Unternehmer an einer aggregierten Betrachtung interessiert. Ermitteln Sie die Wahrscheinlichkeiten dafür, daß an einem Geschäftstag in beiden Städten zusammen kein, ein bzw. zwei Stück verkauft werden! (Falls Sie diese Aufgabe nicht lösen können, nehmen Sie im folgenden an, daß jede der möglichen Absatzzahlen gleichwahrscheinlich ist!) c) Der Artikel wird zu 100,- DM/Stück verkauft. Der Unternehmer hat in beiden Städten zusammen fixe Kosten von 100,DM/Geschäftstag (d.h. diese Kosten entstehen unabhängig vom Absatz). In Abhängigkeit vom Absatz entstehen weitere Kosten von 50,- DM/Stück. Wie groß ist die Wahrscheinlichkeit, daß der Unternehmer an einem beliebigen Geschäftstag Gewinn (größer als 0,00 DM) macht? Lösung 10.2 Definition der Zufallsvariablen.·

448

4. Ergänzungen

X A = Absatz in Stück in Α-Stadt an einem zufällig ausgewählten Geschäftstag, X B = Absatz in Stück in B-Stadt an einem zufällig ausgewählten Geschäftstag. a) Die mittleren Verkaufszahlen ergeben sich als Erwartungswerte dieser Zufallsvariablen: E(Xa) = 1 · 0,1 + 2 · 0,65 + 3-0,2 = 0,1 + 1,3 + 0,6 = 2 , E(xb) = 1 · 0,8 + 2 · 0,1 = 1. Die langfristige mittlere geschäftstägliche Absatzzahl für Α-Stadt beträgt 2 Stück und für B-Stadt 1 Stück. b) Sei die Zufallsvariable X der Absatz in Stück an einem zufällig ausgewählten Tag in beiden Städten zusammen: X = XA + XB. Da die Absatzzahlen in beiden Städten lt. Angabe voneinander unabhängig sind, sind die Zufallsvariablen stochastisch unabhängig und es gilt: p(xA = x A η X B = x B ) = p(xA = x A ) · p(xB = x B ) . Die gesuchten Wahrscheinlichkeiten folgt ermitteln:

lassen

sich

damit

wie

ρ(χ = o) = p(xA = 0 η X B = o) = K x a = o) · p(xB = o) = 0,05 · 0,1 = 0,005 , Wegen disjunkter Ereignisse ist p(x = l) = p([xA = ο η X B = l] υ [xA = 1 η x B = o]) = p(xA = o) · p(xB = l) + p(xA = l) · p(xB = o) = 0,05 · 0,8 + 0,1 · 0,1 = 0,05 und p(x = 2) = p([xA = 0 η X B = 2] и [xA = 1 η x B = l] υ [xA = 2 η xB = 0]) = p(*A = 0) · p(xB = 2) + p(xA = 1) · p(xB = 1) + p(xA = 2) · p(xB = 0) = 0,05 · 0,1 + 0,1 · 0,8 + 0,65 · 0,1 = 0,15 . Die Wahrscheinlichkeiten für einen Gesamtabsatz oder 2 Stück betragen 0,5%, 5% und 15%.

von

0, 1

c) Zunächst ist die Mindestanzahl an verkauften Artikeln zu ermitteln, die für einen Gewinn des Unternehmers nötig ist:

4. Ergänzungen

449

Gewinn = Erlös - Kosten Erlös

= 100 X,

Kosten

= 100 + 50 X,

Gewinn

= 100 X - (100 + 50 X).

Forderung:

Gewinn = 100 X - 100 - 50 X > 0 50 X > 100 X > 2.

Es müssen also mehr als zwei Artikel pro Geschäftstag verkauft werden. p(Gewinn > θ) = p(x > 2) = 1 - p(x < 2) = 1 - [p(x = 0) + p(x = 1) + p(x = 2)] = 1 - (0,005 + 0,05 + 0Д5) = 1 - 0,205 = 0,795 . Die Wahrscheinlichkeit für einen Gewinn beträgt 7 9,5%.

Zu FS, Kapitel 11: Zufallsvariable und eindimensionale Wahrscheinlichkeitsverteilungen Aufgabe 11.1 Geben Sie einige Beispiele für linkssteile empirische Häufigkeitsverteilungen, deren Wertebereich größer als Null ist, und die gegebenenfalls durch eine Lognormalverteilung approximiert werden können! Für die empirische Einkommensverteilung einer bestimmten Personengruppe ist χ = 2680 DM der Mittelwert und s2 = 595000 DM2 die Varianz. a) Bestimmen Sie die Werte der geschätzten Parameter μ und σ 2 der zugehörigen Lognormalverteilung! b) Welcher Wert der Lognormalvariablen X wird mit einer Wahrscheinlichkeit von 0,05 überschritten? Lösung 11.1 Beispiele für linkssteile empirische Häufigkeitsverteilungen mit Merkmalswerten größer als Null sind Einkommens- und Vermögensverteilungen, die Verteilung von Unternehmen nach Größe oder Umsatz, die Verteilung landwirtschaftlicher Betriebe nach Nutzfläche oder Viehbesatz, die Verteilung bestimmter Lebensdauern und dergleichen.

4. Ergänzungen

450

a) Es gilt: μ = In

—2 χ —2 2 X + sx,

V

und

σ 2 = In 1 +

х2У

Mit χ = 2680 und s' = 595000 ergibt sich: - 2

χ —2 , 2 X + sx

In

= In

7182400 ,^7182400 + 595000

7,8538

und

( σ = In

1 +

к

s x2> dr - i n V χ ;

595000 -I = 0,07 96 . 7182400.\J

b) Der Wert der Lognormalvariablen X, der mit einer Wahrscheinlichkeit von 0,05 überschritten wird, ergibt sich wie folgt: x0,95 = β μ+λ°'95σ = e7'8538+1'64 0'2821 = 4090,6 Der Betrag von 4090,6 DM wird mit einer Wahrscheinlichkeit von 0,05 überschritten und mit einer Wahrscheinlichkeit von 0,95 nicht überschritten. Die folgende Abbildung der zugehörigen Lognormalverteilung soll zur Veranschaulichung beitragen. LN(7,8538;0,0796)

2000

4000

6000

8000

4. Ergänzungen

451

Aufgabe 1 1 . 2 In den Fahrstühlen des Universitätsgebäudes F21 befindet sich der Hinweis "Tragfähigkeit 600 kg oder 8 Personen". Nehmen Sie an, daß die Körpergewichte der Fahrstuhlbenutzer voneinander unabhängig und normalverteilt sind mit Mittelwert 65 kg und Standardabweichung 12 kg. a)Bestimmen Sie die Wahrscheinlichkeit dafür, daß der Fahrstuhl überlastet ist, wenn er mit 8 Personen besetzt ist! b) Der Fahrstuhl sei mit sieben Personen besetzt. Ein Student, höheres Semester, mit einem Lebendgewicht von 110 kg steigt ein. Wie groß ist die Wahrscheinlichkeit dafür, daß dadurch der Fahrstuhl überlastet wird? Lösung 1 1 . 2 Zufallsvariable: Xf : Gewicht der i-ten Person im Fahxstuhl in kg Xi~ N(65;144) 8

a) Ρ

8

X x ± > 600 M-l

= ι - ρ X Xi < 600 i=l

z = Σ x± . i=l Gemäß dem Additionssatz für Varianzen und Mittelwerte ist: σ2

μζ

= 8 · σ | = 8 · 144 = 1152 Ο σ ζ = 33,94, = 8 · μ χ = 520 und damit Ζ ~ Ν(520;1152).

1 - ρ(ζ < 600) = 1 - Fz(600) (600 - 52θ"\

,

ч

= 1 - 0,9909 = 0,0091 . Mit einer Wahrscheinlichkeit acht Personen überladen.

von 0,91% ist der Aufzug bei

7

b) γ =

Σχί i=l

Additionssatz für Varianzen und Mittelwerte: σγ = 7 · 144 = 1008 »

σ γ = 31,75,

4. Ergänzungen

452

μ γ = 7 · 65 = 455 , Υ ~ Ν(455;1008) . Ρ(Υ + 110 > 600) = 1 - Ρ(Υ + 110 < 600) = 1 - Fy(490) = 1 - Fö(l,102) = 1 - 0,8643 = 0,1357 . Mit einer Wahrscheinlichkeit von 13,57% wird der Aufzug nach dem Zusteigen der achten Person überlastet sein.

Zu FS, Kapitel 12: Einige spezielle Stichprobenverteilungen : Verteilungen für Häufigkeiten Aufgabe 12.1 Ein fränkischer Bauer betreibt neben seiner Landwirtschaft auch Fischerei im Main und in der Regnitz. In jedem der beiden Flüsse legt er jeweils am Morgen und an der gleichen Stelle eine Reuse aus, die er nach zwölf Stunden (= ein Tag) wieder einholt. Er weiß, daß er im Main im Durchschnitt pro Tag 7,5 Fische mit seiner Reuse fängt, während es in der Regnitz im Durchschnitt 12 Fische pro Tag sind. a) Wie groß ist die Wahrscheinlichkeit, daß der Bauer im Main an einem zufällig ausgewählten Tag 1)genau fünf Fische, 2)mehr als drei Fische mit der Reuse fängt? b) Berechnen Sie außerdem die Wahrscheinlichkeit dafür, daß er an einem zufällig ausgewählten Tag weniger als 15 Fische mit seiner Reuse in der Regnitz fängt!

Lösung 12.1 Seien X n die zufällige Anzahl der Fische, die am i-ten Tag mit einer Reuse im Main gefangen werden, und X.j2 die zufällige Anzahl der Fische, die am j-ten Tag mit einer Reuse in der Regnitz gefangen werden. Beide Zufallsvariable folgen einer POISSON-Verteilung, weil die zufälligen Ereignisse (Fangen der Fische) stochastisch unabhängig sind und in einem begrenzten zeitlichen Kontinuum (einem Tag) eintreten. a) X n ~ PV(7,5).

4. Ergänzungen

453

1) ρ(χ η = δ) = fXii(5;7,5) = 0Д094 (Tabelle) . Die Wahrscheinlichkeit dafür, daß an einem Tag fünf Fische mit der Reuse im Main gefangen werden, beträgt 0,1094. 2) p(xu > з) = 1 - p(xn < з) = 1 - (о,0006 + 0,0041 + 0,0156 + 0,0389) = 1 - 0,0592 = 0,9408 (Tabelle). Die Wahrscheinlichkeit dafür, daß an einem Tag mehr als drei Fische mit der Reuse im Main gefangen werden, beträgt 0,9408. b) X j2 ~ PV(12) . Diese

Verteilung

ist

nicht

tabelliert.

Weil

aber μ = 12 > 9 ist, kann die POISSON-Verteilung durch die Normalverteilung approximiert werden. Es gilt also: X j2 ~ Ν(μ,μ) = N(l2,12). Daraus ergibt sich mit Stetigkeitskorrektur: / \ (14 + 0,5 - 12"| , ч p(x < 14) = F„[ J = Fu(o,72) = 0,7642 . Die Wahrscheinlichkeit, an einem Tag weniger als 15 Fische mit der Reuse in der Regnitz zu fangen, beträgt approximativ 0,7 642 . Aufgabe 12.2 Nach dem Konzert einer legendären irischen Rockgruppe im Münchner Olympiastadion fahren die meisten Besucher mit der UBahn Linie U2 zum Hauptbahnhof. Erfahrungsgemäß lösen 10% der Fahrgäste keine Fahrkarte. Die Fahrgäste werden durch Bedienstete der Öffentlichen Verkehrsbetriebe folgendermaßen kontrolliert. In einem U-Bahnwagenabteil mit 20 Fahrgästen werden bei einer ersten Kontrolle zunächst fünf zufällig ausgewählte Personen überprüft. Befindet sich unter ihnen kein Schwarzfahrer, wird auf eine weitere Kontrolle verzichtet. Anderenfalls werden in einer zweiten Kontrolle drei weitere Personen überprüft. a) Berechnen Sie die Wahrscheinlichkeit dafür, daß in diesem Wagenabteil zwei Kontrollen durchgeführt werden! Gehen Sie dabei davon aus, daß sich in dem Wagenabteil die zu erwartende Anzahl von Schwarzfahrern befindet! b) Wieviel Personen werden bei dieser Vorgehensweise in solchen Abteilen im Durchschnitt kontrolliert? Erläutern Sie kurz Ihre Berechnung!

454

4. Ergänzungen

с) In e i n e m U - B a h n z u g befinden sich 1000 Fahrgäste, von d e n e n jeder fünfte kontrolliert wird. Wie groß ist die Wahrs c h e i n l i c h k e i t dafür, daß m e h r als 15 Schwarzfahrer b e i der Kontrolle entdeckt werden, w e n n d e r A n t e i l an Schwarzfahrern 10% b e t r ä g t ? L ö s u n g 12.2

x

Г 1, w e n n die i - te Person schwarz fährt, i1 = ί[ л0 s o n s t .

Die G e s a m t h e i t der U-Bahnfahrer ist zweipunktverteilt mit π = 0,1. A u s d e r G e s a m t h e i t w e r d e n η = 5 F a h r g ä s t e ohne Z u r ü c k l e g e n a u s g e w ä h l t . D a r a u s folgt, daß d i e S t i c h p r o b e n v a r i a b l e n nicht s t o c h a s t i s c h u n a b h ä n g i g sind. E s gilt somit:

x

η

' = iΣ= l i x

~

m i t η = 5, N = 20 u n d N x = Ν · π = 20 · 0,1 = 2. 4

(2\ /Ί8 !

a) P(X' > 0) = 1 - P(X' = 0) = 1 -

, ..

= 1 - 0,5526 = 0,4474.

UJ M i t e i n e r Wahrscheinlichkeit v o n 0,4474 w i r d m i n d e s t e n s e i n S c h w a r z f a h r e r erwischt und somit eine zweite Kontrolle d u r c h geführt . b) In jedem Falle w e r d e n n x = 5 Personen u n d m i t einer W a h r s c h e i n l i c h k e i t von 0,4474 drei w e i t e r e Personen kontrolliert. A l s o w e r d e n im Durchschnitt 5 + 3 · 0,4474 = 6,34 Personen kontrolliert. c) Jetzt ist N = 1000 u n d η = 200. Weil

ч

0,1 < π = 0,1 < 0,9 u n d ηπ(ΐ - π)

die h y p e r g e o m e t r i s c h e Verteilung a p p r o x i m i e r t werden, d.h. es gilt:

Ν - η N - 1 durch

= 14,41 > 9 die

folglich

P(X' > 15) = 1 - P(X' < 15) = 1 - F„

'l5 + 0,5 - 20

= 1 - F„(- 1,19) = 1 - 0,117 = 0,883 .

V i 4,41

kann

Normalverteilung

X' * N(20;14,4I). Mit S t e t i g k e i t s k o r r e k t u r ist

ist,

4.

Ergänzungen

455

Mit einer Wahrscheinlichkeit von approximativ 0,883 werden bei der Kontrolle mehr als 15 Schwarzfahrer entdeckt.

Aufgabe 1 2 . 3 Ein besorgter Vater versucht des öfteren und zufällig über den Tag verteilt, seine in Karlsruhe studierende Tochter telefonisch zu erreichen. Meist ohne Erfolg! Nach einer Reihe von nur gelegentlich erfolgreichen Versuchen gewinnt er den Eindruck, die Wahrscheinlichkeit für einen "Treffer" sei nur 0,05. a) Wie groß ist die Wahrscheinlichkeit dafür, daß erst beim 10. Versuch ein Gespräch zustande kommt? b) Wie oft muß der Vater versuchen, seine Tochter zu erreichen, damit die Wahrscheinlichkeit, mit seiner Tochter zu sprechen, mindestens 0,9 ist?

Lösung 1 2 . 3 Sei X eine Zufallsvariable, die die Anzahl der vergeblichen Versuche vor dem "Treffer" beschreibt. Dann folgt X einer geometrischen Verteilung mit Parameter π. Hier ist π = 0,05. a) Beim 10. Versuch kommt ein Gespräch zustande. Das bedeutet, daß auf χ = 9 Fehlversuche ein "Treffer" folgt. Mithin ergibt sich die gesuchte Wahrscheinlichkeit aus: fx(x|t) = (l - π)χ · π , 0,959 · 0,05 = 0,032.

f, -x

Die Wahrscheinlichkeit dafür, daß erst beim 10. Versuch ein Gespräch zustande kommt, beträgt also rd. 0,032. b) Wenn sich der Vater vornimmt, (höchstens) x-mal bei seiner Tochter anzurufen, kann er sie beim ersten, zweiten, ..., xten Versuch antreffen. Für die Wahrscheinlichkeit, die Tochter zu erreichen, soll nun gelten: ίχ(θ|π) + £χ(ΐ|π) +. . - + fx(x - l|π) > 0,9 . π·

x-l X (1 - π)1 i=l endliche geometrische Re ihe

:> 0,9

456

4. Ergänzungen

π·

> 0,9 1 - (l - π)χ ^ 0,9 (1 - π)χ < 0,1 χ · 1η (1 - π) < 1η 0,1 χ >

1η 0,1 In (1 - π)

1η 0,1 = 44,9. 1η 0,95

Der Vater muß sich also vornehmen, (höchstens) 45mal bei seiner Tochter anzurufen, damit die Wahrscheinlichkeit, mit ihr zu sprechen, mindestens 90% ist. Alternativer Ansatz (über Gegenwahrscheinlichkeit): Wenn die Wahrscheinlichkeit, mit der Tochter zu sprechen, bei χ Versuchen mindestens 90% betragen soll, ist die Wahrscheinlichkeit, bei χ Versuchen keinen Erfolg zu haben, höchstens 10%. Damit erhält man unmittelbar (1 - π)χ < 0,1; die weitere Rechnung erfolgt wie oben. Aufgabe 12.4 Der Ausschußanteil einer größeren Menge von Produkten beträgt 0,3. Für eine Untersuchung der Ursachen, die zu einem so hohen Ausschußanteil geführt haben, werden fünf defekte Stücke benötigt. Daher werden zufällig und nacheinander Stücke ausgewählt, und zwar so lange, bis sich unter den ausgewählten Stücken genau fünf defekte befinden. Wie groß ist die Wahrscheinlichkeit dafür, daß insgesamt Stücke zufällig und nacheinander ausgewählt werden müssen?

20

Lösung 12.4 Die Zufallsvariable X kennzeichnet die Anzahl der ausgewählten nicht defekten Stücke vor dem r-ten defekten Stück. π = 0,3 ist die Wahrscheinlichkeit für das Ziehen eines defekten Stücks, 1 - π = 0,7 die Wahrscheinlichkeit für das Ziehen eines nicht defekten Stücks. Wenn 20 Stücke zufällig und nacheinander ausgewählt werden, bis genau r = 5 defekte Stücke gezogen sind, dann muß das letzte gezogene Stück defekt sein. Unter den verbleibenden 19 Stücken

4. Ergänzungen

457

befinden sich somit genau (r-1) = 4 defekte und χ = 15 nicht defekte Stücke in zufälliger Reihenfolge. X folgt einer negativen Binomialverteilung mit den Parametern π = 0,3 und r = 5. Somit ergibt sich die gesuchte Wahrscheinlichkeit aus = (Χ+^-1)πΓ(ΐ-π)*.

fx(*M

Mit χ = 15, r = 5 und π = 0,3 ist fx(l5|0,3;5) = ( 1 5 ^

^ 0,350,715 = 0,0447 .

Die Wahrscheinlichkeit dafür, daß insgesamt wählt werden müssen, beträgt somit 0,0447.

20

Stücke

ausge-

Aufgabe 12.5 Der Kaffeeautomat einer kleineren Universität sondert nach Einwurf von einer DM - je nach Laune (d.h. zufällig) - entweder einen Becher -

Kaffee

(π Β = 0,12) oder

(π κ = 0,08) oder

einen Becher und Kaffee -

gar nichts

(πΒK

= 0,75) oder

(л д = 0,05) ab.

Ein BWL-Student steht mit Aktenkoffer und souveränem Managerblick vor dem Kaffeeautomaten. Mit welcher Wahrscheinlichkeit kann er damit rechnen, bei nur zwei Versuchen für sich und seinen Freund jeweils einen Becher, der mit Kaffee gefüllt ist, zu bekommen? Lösung 12.5 X· =

fl, wenn i - ter Automatenkunde Kaffee und Becher erhält, 10 sonst .

η X' = Σ x i ~ b(2;0,75) i=l πχ'(ΐ - π)η-χ', falls x' = 0,l,2,...,n, fx,(x'|n,7t) = 0 sonst

458

4. Ergänzungen

• 0,752 · (l - 0,75)° = 0,5625 . Der BWL-Student kann mit einer Wahrscheinlichkeit von 56,25% damit rechnen, bei beiden Versuchen einen Becher mit Kaffee für sich und seinen Freund zu erhalten.

Zu FS, Kapitel 15: Parametrische Schätzverfahren Aufgabe 15.1 Um sich mit der Marktwirtschaft nicht nur theoretisch, sondern auch praktisch zu befassen, beabsichtigen zwei "Erstsemester" einer Fachhochschule in Sachsen, einen PC-Verleih zu gründen. Zur Beurteilung ihrer Erfolgsaussichten wollen sie abschätzen, wie viele der 2000 Fachhochschüler einen PC mieten würden, und befragen 150 zufällig ausgewählte Kommilitonen. Sie ermitteln 105 Interessenten, 41 "eingefleischte High-Tech-Gegner" und 4 Kommilitonen, die grundsätzlich solche kapitalistisch-ausbeuterischen Aktivitäten nicht unterstützen. Führen Sie eine Intervallschätzung durch für die Anzahl der Fachhochschüler, die als potentielle Kunden für die Jungunternehmer in Frage kommen! ( 1 - a = 0,9545)

Lösung 15.1 Sei 1, falls der i - te Befragte Interessent ist, 0, falls der i - te Befragte kein Interessent ist. Aus der zweipunktverteilten Gesamtheit von N = 2000 Fachhochschülern wurde eine Zufallsstichprobe vom Umfang η = 150 nach dem Prinzip einer Auswahl ohne Zurücklegen gezogen. Nach einem zentralen Grenzwertsatz kann die hypergeometrische Verteilung durch die Normalverteilung approximiert werden; dabei ist wegen des großen Auswahlsatzes von n/N = 0,075 der Korrekturfaktor für endliche Gesamtheiten zu berücksichtigen. Wenn die Approxi. . Ν - η mationsbedingungen 0,1 < π < 0,9 und ηπ(1 - π) > 9 erfüllt N — 1 sind, gilt für den Anteil der interessierten Fachhochschüler

Das Konfidenzintervall für den Anteil der Interessenten ist

'S)

ТГ < π < Τ

= Ι"«'"

4. Ergänzungen

459

dabei ist T„ =

Ρ +



И ) "



Μ )

1 + -— il - -1 η V Ν/ T„ =

Ρ + 1

+

η V

Ρ(1 - ρ) λ2 + η 4η—

+ λ

Ρ(1 - ρ) + λ2 ~ η 4η

1 -

-U

Ν.

und λ = λ ι—

2

Mit Ν = 2000, η = 150, ρ ergibt sich: t„ = t: =

1,02466

105/150, 1-α = 0, 9545 und λ

2,0

[θ,7 + 0,01233 - 2,0-^0,0014 + 0,000041^0,925] = 0,6239,

_1 [θ,7 + 0,01233 + 2,0 -у/0,0014 + 0,000041^0,925] = 0,7664. 1,02466

Durch Multiplikation der Intervallgrenzen mit der Anzahl der Fachhochschüler insgesamt (N = 2000) erhält man [1248;1533] als empirisches Konfidenzintervall zum Konfidenzniveau 1 - α = 0,9545 für die wahre, aber unbekannte Anzahl der Fachhochschüler, die als potentielle PC-Mieter in Frage kommen. Die Approximationsbedingungen für die Verteilung der Stichprobenfunktion Ρ sind für beide Grenzen des Konfidenzintervalls und somit auch für alle Werte im Konfidenzintervall erfüllt, denn es gilt: ntun(l - c j ^ - r f = 0,1
1 0 für a l l e i, j η t i o n s b e d i n g u n g e n für d e n T e s t e r f ü l l t . (272 - 225,14)2 (80 - 58,29)2 t = — + ··· + — 225,14 58,29

sind

die

Approxima-

=

= 9,75 + 13,00 + 6,51 + 8,67 + 6,07 + 8,09 = 52,09 . Entscheidung: Wegen

t = 52,09 > Xq,995;2 = Ю/60

Signifikanzniveau α = 0,005

wird

die

Nullhypothese

auf

dem

verworfen.

Interpretation: Die v o r l i e g e n d e S t i c h p r o b e b i e t e t h i n r e i c h e n d G r u n d zu d e r A n n a h m e , d a ß s i c h d i e V e r t e i l u n g e n d e r S c h u l a b s c h l ü s s e in b e i d e n Bildungssystemen unterscheiden. Es k ö n n t e j e d o c h e i n F e h l e r e r s t e r A r t v o r l i e g e n , d . h . H 0 w u r de v e r w o r f e n , o b w o h l H 0 r i c h t i g i s t . F a l l s H 0 r i c h t i g ist, f ü h r e n 5% a l l e r m ö g l i c h e n S t i c h p r o b e n zu e i n e r f a l s c h e n E n t scheidung, d.h. zum Verwerfen. Das Fehlentscheidungsrisiko b e t r ä g t a l s o 5%.

4. Ergänzungen

475

Aufgabe 16.2 Ein Fußballfan und Hobby-Statistiker vermutet, daß die Anzahl der Tore in einem Fußballspiel POISSON-verteilt ist. Eine einfache Zufallsstichprobe erbrachte folgendes Ergebnis: Anzahl der Tore pro Begegnung Anzahl der Begegnungen 0 1 2 3 4 5 6 und mehr

29 36 86 44 55 24 26

Insgesamt fielen 870 Tore in den 300 zufällig ausgewählten Begegnungen. Überprüfen Sie die Vermutung des Fußballfans mit Hilfe eines geeigneten statistischen Tests (α = 0,05)! Lösung 16.2 Sei Xi die Anzahl der Tore im i-ten Spiel der Zufallsstichprobe vom Umfang η = 300. Testauswahl: Ein geeigneter Test zur Überprüfung der Vermutung ist der χ2Anpassungstest, dessen Voraussetzungen erfüllt sind: - Es liegt eine einfache Stichprobe vor. - Es werden к = 7 disjunkte, nicht-leere Klassen unterschieden. Hypothesen: Auf dem Signifikanzniveau α = 0,05 wird die Nullhypothese H0: fx(x) = ί0(χ|μ) für alle χ e SR gegen die Alternativhypothese H1: fx(x) * ί0(χ|μ) für mindestens ein χ 6 94 getestet. ί0(χ|μ) ist die Wahrscheinlichkeit

der POISSON-Verteilung

mit

dem Parameter μ, der nicht bekannt und daher aus der Stichprobe zu schätzen ist.

476

4. Ergänzungen

Ein geeigneter Schätzwert für μ ist χ =

= 2,9, so daß die 300 folgenden Überlegungen für die POISSON-Verteilung mit der Wahrscheinlichkeitsfunktion f0(x|2,9) =

- e -

durchgeführt werden. Die Prüffunktion: T

f fc - nr°f " i-i

nP°

ist unter Ho approximativ χ2-verteilt mit ν = 5 Freiheitsgraden. Es wird ein Parameter (μ) aus der Stichprobe geschätzt. Entscheidungsregel: Η0 wird verworfen, wenn t > Xi_a;v = Xo,95;s = 11,07 ist. Berechnung: Arbeitstabeile

i

p° = f0(x|2,9)

nPi0

0 1 2 3 4 5 >6

29 36 86 44 55 24 26

0,0550 0,1596 0,2314 0,2237 0,1622 0,0940 0,0741

16,50 47,88 69,42 67,11 48, 66 28,20 22,23

(ni - nP?)2 0 nPi 9,4697 2,9477 3,9599 7,9582 0,8261 0,6255 0,6394

Σ

300

1

300

26,4268

X

n

Da np° > 10 für alle i, sind die Approximationsbedingungen für die Prüfverteilung hinreichend erfüllt. Entscheidung: Wegen

t = 26,43 > χ\_α.ν = Xo,95;s =

1:L 07

'

wird

die

auf dem Signifikanzniveau α = 0,05 verworfen.

Nullhypothese

4. Ergänzungen

477

Interpretation: Es gibt einen Grund, daran zu zweifeln, daß die Anzahl der Tore in einem Fußballspiel einer POISSON-Verteilung folgt. Es könnte jedoch ein Fehler erster Art vorliegen, d.h. H 0 wurde verworfen, obwohl H0 richtig ist. Falls H0 richtig ist, führen 5% aller möglichen Stichproben zu einer falschen Entscheidung, d.h. zum Verwerfen von H 0 . Das Fehlentscheidungsrisiko beträgt also 5%. Aufgabe 16.3 Für die Funktionsfähigkeit von Zündkerzen ist der Elektrodenabstand entscheidend. In einem Fertigungsbetrieb werden statistische Verfahren zur Überwachung dieses Elektrodenabstands in der Zündkerzenproduktion eingesetzt. Aus langjähriger Erfahrung weiß man, daß bei einer bestimmten Zündkerzensorte (WR6DC) der Elektrodenabstand eine (approximativ) normalverteilte Zufallsgröße ist. Außerdem ist bekannt, daß die Standardabweichung des Elektrodenabstands bei dieser Zündkerzensorte 0,01 mm beträgt. a) Mit welchem Ausschußanteil muß man bei der Produktion dieser Zündkerzensorte rechnen, wenn der durchschnittliche Elektrodenabstand seinem Sollwert 0,75 mm entspricht und der Elektrodenabstand einer Zündkerze um höchstens 0,03 mm vom Sollwert abweichen darf? b) Aus der Tagesproduktion dieser Zündkerzensorte werden 12 Zündkerzen nach dem Zufallsprinzip entnommen. In dieser Stichprobe ergibt sich ein mittlerer Elektrodenabstand von 0,7480 mm. Schätzen Sie den durchschnittlichen Elektrodenabstand der Tagesproduktion dieser Zündkerzensorte! Interpretieren Sie das Schätzergebnis! (1 — α = 0,95). c) Zur laufenden Kontrolle der Fertigung wird der Elektrodenabstand dieser Zündkerzensorte mit Hilfe eines geeigneten statistischen Tests überwacht. Mit diesem Test soll überprüft werden, ob der durchschnittliche Elektrodenabstand dem Sollwert 0,75 mm entspricht. Dazu werden jedem produzierten Los von 1000 Zündkerzen zufällig 10 Zündkerzen entnommen und der Stichprobenmittelwert bestimmt. Welche Testentscheidungen sind bei den folgenden Losen zu treffen (α = 0,01)? Interpretieren Sie die Testentscheidungen ! Los

Stichprobenmittelwert in mm

А

0,7532

В

0,7611

С

0,7489

478

4. Ergänzungen

d) Bestimmen Sie den Ablehnungsbereich des statistischen Tests aus Teilaufgabe c) in Einheiten des Stichprobenmittelwerts, so daß die Entscheidung ohne weitere Rechnung auf der Basis des Stichprobenmittelwerts getroffen werden kann!

Lösung 16.3 a) Xj^ = Elektrodenabstand der i-ten Zündkerze in der Stichprobe. Der Elektrodenabstand ist (approximativ) normalverteilt mit einer Standardabweichung von 0,01 mm. X ~ N(0,75;0,012) p(|x - μχ| > 0,03) = 1 - p(|x - μχ| < 3 · σ χ ) = 1 - [F0(3) - F„(- 3)] = 1 - 0,9973 = 0,0027.

Der zu erwartende Ausschußanteil beträgt 0,27%. b) Die Tagesproduktion dürfte hinreichend groß sein, so daß n/N < 0,05 ist und somit die stochastische Abhängigkeit der Stichprobenvariablen, die aus der Auswahl ohne Zurücklegen resultiert, vernachlässigt werden kann. Es gilt 2 0,012' Ηχ' χ = -"5Jσ

— σχ X 12 ~ ^Ι-α/2 ' Mit

-

_ - X12

σχ + λ

=

1-α/2 "

1

x12 = 0,7480, σ χ = 0,01, η = 12 und λ1_α/2 = λ 0 9 7 5 = 1,96

ergibt sich 0,7480 - 1,96 ·

0,01

< μ χ < 0,7480 + 1,96 ·

0,01

0,7480 - 0,0057 < μ χ < 0,7480 + 0,0057 0,7423 < μ χ < 0,7537 . Der durchschnittliche Elektrodenabstand der Zündkerzen aus der betrachteten Tagesproduktion liegt schätzungsweise zwischen 0,7423 und 0,7537 mm. Die Sicherheit der Schätzaussage basiert auf der Konstruktionsvorschrift für das Konfidenzintervall, gemäß der (1-α)·100% = 95% aller nach dem gleichen Prinzip ziehbaren Stichproben Schätzintervalle liefern, die den wahren Mittelwert enthalten. Somit kann man bei einem kleinen Wert von α recht sicher sein, eine richtige Schätzaussage getroffen zu haben.

4. Ergänzungen

479

с) Da η/Ν = 0,01, können die stochastischen Abhängigkeiten der Stichprobenvariablen, die aus der Auswahl ohne Zurücklegen resultieren, vernachlässigt werden. H :

o ^x = Mo = °'75'

Ηχ: μ χ * 0,75 . —

Die

Prüffunktion

μ 0 ι— ^η

ist unter χ tiv) standardnormalverteilt. Die Nullhypothese wird verworfen, wenn |t| >

^ =

Τ =

σ

H0

(approxima-

= λ 0 9 9 5 = 2,58 ist. 0,7532 - 0,75 ,— Κ7Γ, № 0,01

= 1'0119'

0,7611 - 0,75 -Д0 = 3,5101, 0,01 0,7489 - 0,75 0,01

JlÖ = -0,3479 .

Gemäß der Entscheidungsregel wird die Nullhypothese bei Los В verworfen, sonst nicht verworfen. Da eine richtige Nullhypothese nur in α·100% = 1% aller Fälle (= Stichproben) verworfen wird, hat man beim Los В aus statistischer Sicht berechtigten Grund zu der Annahme, daß der durchschnittliche Elektrodenabstand nicht dem Sollwert 0,75 mm entspricht. Bei den Losen Α und С widerspricht das Testergebnis zumindest nicht der Vermutung, daß der durchschnittliche Elektrodenabstand dem Sollwert 0,75 mm entspricht. Hier ist jedoch das Fehlentscheidungsrisiko (ß-Fehler) unbekannt. d) |t| = L ^ i L — ^ σ χ

> X1_a/2 = λ 0 9 9 5 = 2,58 ,

σ χ 4.0 < μ 0 - Хг_а/2 •

01 „.,^ - 2,58 · °' = 0,75 - щ

σχ

0,01

χ10 > μ 0 + λ1_α/2

• - ρ = 0,75 + 2,58 ·

= 0,75 - 0,0082 = 0,7418 ,

= 0,75 + 0,0082 = 0,7582 .

Die Nullhypothese wird abgelehnt, wenn der Stichprobenmittelwert kleiner oder gleich 0,7418 mm oder größer oder gleich 0,7582 mm ist. Aufgabe 16.4 Ein bestimmter PKW-Typ mit Otto-Motor verbraucht nach Werksangaben 11 Liter Benzin/100 km. Eine Werkstatt behauptet, durch

480

4. Ergänzungen

den Einbau einiger weniger Teile den Benzinverbrauch dieses PKW um mindestens 15% senken zu können. Ein Automobil-Club bezweifelt diese Behauptung. Um nachzuweisen, daß sie falsch ist, bestimmt er aufgrund einer Zufallsstichprobe den Benzinverbrauch von einigen Fahrzeugen, die entsprechend umgebaut wurden. Welche Nullhypothese hat der Automobil-Club zu testen? Lösung 16.4 Die Behauptung der Werkstatt 100

lautet

μ < 0,85 · 11 = 9,35 Liter/

km.

Wenn es dem Automobil-Club gelingt, die Nullhypothese H0: μ < 9,35 zu verwerfen, dann hat er Grund zur Annahme, daß wohl die Alternativhypothese Hj^: μ > 9,35 richtig und somit die Behauptung der Werkstatt wohl falsch ist. Aufgabe 16.5 πΒ bzw. π ΗΗ seien in Bayern bzw. in Hamburg die Anteile der wahlberechtigten Personen, die mit dem "Kruzifix-Urteil" des Bundesverfassungsgerichts vom August 1995 unzufrieden sind. Ein Meinungsforschungsinstitut will nachweisen, daß die Anteile π Β und π ΗΗ verschieden sind. Zur Durchführung des entsprechenden Tests werden in Bayern n B = 480 und in Hamburg n HH = 520 Wahlberechtigte zufällig ausgewählt und befragt. Es ergeben sich die Stichprobenanteile pB = 0,8 und p HH = 0,5 . Welche der folgenden Aussagen sind bei einem Signifikanzniveau von α = 0,05 richtig? a) Die Nullhypothese H0: π Β = π ΗΗ wird verworfen! b) Mit dem Testergebnis ist bewiesen, daß π Β * π ΗΗ ist! c) Der beobachtete Unterschied zwischen p B und p HH kann nicht nur durch die zufällige Auswahl der Befragten erklärt werden ! Lösung 16.5 Definition der Zufallsvariablen: [ 1, wenn i - ter Befragter im Bundesland j unzufrieden ist, X

>

i

1 0 sonst;

(j = В, HH).

4. Ergänzungen

Σ xj,i A n z a h l d e r u n z u f r i e d e n e n B e f r a g t e n i m B u n d e s l a n d i=l

Xj =

481

j,

Testauswahl: Test der Differenz

zweier

Anteilswerte

Voraussetzungen: Die stochastische Abhängigkeit ist vernachlässigbar, n / N < 0,05 ( B a y e r n h a t m e h r a l s 9600 E i n w o h n e r , H a m b u r g m e h r a l s 10400 E i n w o h n e r ) . Die Stichproben

sind voneinander

Die Gesamtheiten sind

unabhängig.

zweipunktverteilt.

Die Stichprobenumfänge weils größer als 400.

sind

mit

n B = 480

und

n H H = 520

Hypothesen: H0: π Β

= πΗΗ

g e g e n Ηχ: π Β

* πΗΗ .

Prüfmaß: Τ

wobei P R n B + Pнн"нн HH n,

Ρ

Τ ist unter

H0

approximativ

standardnormalverteilt.

Entscheidungsregel: H0

wird verworfen,

wenn

|t| > λ

α

= λ 0 ι 9 7 5 = 1,96

Berechnung: Ρ P

==

0,8 · 480 + 0,5 · 520 _ 644 644 480 + 520

~

da hat

1000

0,644,

ist.

je-

482

4. Ergänzungen

"

0,8 - 0,5

0,3

Ι Γ Ί TT J0,644 · 0,356 + V V480 520/

~ 0,0303 ~

9,90

·

Entscheidung: Da t = 9,90 > 1,96 = λ 0/975 ist, wird H 0

verworfen.

Interpretation: Auf einem Signifikanzniveau von 1 - α = 0,95 besteht ein Grund, daran zu zweifeln, daß die Anteile der Unzufriedenen in Bayern u n d Hamburg g l e i c h sind. Es könnte jedoch ein Fehler erster Art vorliegen, d.h. H 0 wird verworfen, obwohl H 0 richtig ist. Falls H 0 richtig ist, führen 5% aller m ö g l i c h e n Stichproben zu einer falschen Entscheidung, d.h. zum V e r w e r f e n von H 0 . Das Fehlentscheidungsrisiko beträgt also 5%. A u s s a g e a) ist somit richtig. Die A u s s a g e n b) u n d c) sind falsch, da die getroffene Entscheidung m i t e i n e m Fehlerrisiko behaftet ist. A u f g a b e 16.6 Bei m u n d g e b l a s e n e m Glas läßt es sich nur schwer vermeiden, daß w ä h r e n d d e s Herstellungsvorgangs L u f t b l a s e n in den Glaskörper gelangen. a) Welches plausibel Verwenden folgenden

Verteilungsgesetz (welche Modellverteilung) ist für die Anzahl der Luftblasen in einem Glaskörper? Sie dieses Verteilungsgesetz zur Beantwortung der Fragen!

b) Im Durchschnitt werden je 100g Glas 0,8 Luftblasen b e o b a c h tet. Mit welcher Wahrscheinlichkeit b e f i n d e n sich in einem Glas mit e i n e m Gewicht von 250g keine

Luftblasen,

-

ein oder zwei Luftblasen

-

mehr als zwei Luftblasen?

c) Ein weiterer Glasbläser soll eingestellt werden, wenn ein geeignetes statistisches T e s t v e r f a h r e n den Schluß zuläßt, daß er im Durchschnitt bei Gläsern m i t einem Gewicht von 250 g w e n i g e r als zwei Luftblasen v e r u r s a c h t . Bei e i n e m Einstellungstest ergaben zehn voneinander gige V e r s u c h e folgendes Ergebnis: i

1

2

3

4

5

6

7

8

9

10

Σ

2

5

0

1

0

3

2

0

1

0

14

unabhän-

4. Ergänzungen

483

Wird der Glasbläser eingestellt? Lösung 16.6 X = Anzahl Luftblasen in 250g Glas. a)

Die POISSON-Verteilung ist ein plausibles Modell. Es geht hier um das Auftreten von Ereignissen (Luftblasen) in einem begrenzten räumlichen Kontinuum (250g Glas). Die stochastische Unabhängigkeit der Ereignisse kann wohl unterstellt werden.

bi) Im Durchschnitt gibt es in 100g Glas 0,8 Luftblasen, also gibt es in 250g durchschnittlich 2,5 · 0,8 = 2 Luftblasen. Somit ist: X ~ PV(2). j· exp(- μ) für χ = 0,1,2,3,...; μ > 0, c(»W = 0 sonst. 2°

1

ρ ( χ = 0) = £х(о|г) = — e x p ( - 2) = - · 0 , 1 3 5 3 = 0 , 1 3 5 3 .

Mit einer Wahrscheinlichkeit von Glas keine Luftblasen enthalten.

13,53%

werden

die

250g

werden

die

250g

werden

die

250g

b2) P(x = 1) + P(X = 2) = fx(l|2) + fx(2|2) 21 22 = — exp(- 2) + — exp(- 2) = 2 · 0,1353 + 2 · 0,1353 = 0,5412.

Mit einer Wahrscheinlichkeit von 54,12% Glas eine oder zwei Luftblasen enthalten. b3) P(X > 2) = 1 - (P(X = 1) + P(X = 2) + P(X = θ)) = 1 - (0,5412 + 0,1353) = 0,3235 .

Mit einer Wahrscheinlichkeit von 32,35% Glas mehr als zwei Luftblasen enthalten. c)

Sei = Anzahl Luftblasen in 250g Glas beim i-ten Versuch. Testauswahl: Approximativer Test für den Mittelwert einer POISSON-Verteilung. Voraussetzungen:

4. Ergänzungen

484

-

1U X = Σ Yi i s t POISSON-verteilt mit dem Parameter μ χ . i=l

-

μ χ0 = 10 · μ Υ 0 = 10 · 2 = 20 > 9.

Damit der Glasbläser eingestellt wird, muß er - im langfristigen Mittel - weniger als μ γ0 = 2 Blasen je Versuch verursachen. Er muß also - im langfristigen Mittel - bei zehn Versuchen weniger als μχ0 = 20 Blasen verursachen. Hypothesen: H0: μ χ ^ μ χ 0 = 20 gegen

μ χ < 20 .

Prüfmaß: x T =

+ Ο'5 - μ χ0

Unter H 0 ist Τ approximativ standardnormalverteilt. Entscheidungsregel: H 0 wird verworfen, wenn t £ λ α . Das Signifikanzniveau wird auf 0,05 festgelegt, so daß λ α = λ 0 05 = -1,64 . Berechnung: t =

14 + 0,5 - 20 - 5,5 4= = — = -1,2298. J2Ö 4,4721

Entscheidung: t = -1,2298 > λ 0 0 0 5 = -1,64 , also wird H0 nicht verworfen. Antwort: Es gibt keinen Grund, daran zu zweifeln, daß der Glasbläser bei 250g Glas im Mittel mindestens 2 Luftblasen verursacht. Der Glasbläser wird wohl nicht eingestellt. Es könnte ein Fehler zweiter Art vorliegen, d.h. H 0 wurde nicht verworfen, obwohl H 0 falsch ist (ß-Fehler). Das Fehlentscheidungsrisiko ist nicht quantifizierbar. Aufgabe 16.7 Bei einer Befragung machten 1000 zufällig ausgewählte Berufstätige aus der Bundesrepublik Deutschland über ihre Berufsgruppe und ihre sportliche Betätigung folgende Angaben:

4. Ergänzungen

sportliche Betätigung

485

nie

gelegentlich

regelmäßig

Arbeiter

250

128

72

Angestellter

170

98

92

Beamter

40

48

32

Landwirt

47

15

8

Berufsgruppe

Überprüfen Sie mit Hilfe eines geeigneten Tests, ob die Ergebnisse der Befragung die Annahme stützen, daß die Häufigkeit der sportlichen Betätigung von der Zugehörigkeit zu einer Berufsgruppe abhängt (α = 0,05) ! Runden Sie bei Ihren Berechnungen stets auf zwei Nachkommastellen! Lösung 16.7 Zufallsvariable: Berufsgruppe des i-ten ausgewählten Berufstätigen; Y^

Häufigkeit der sportlichen Betätigung des i-ten ausgewählten Berufstätigen.

Testauswahl: Da überprüft werden soll, ob eine Abhängigkeit vorliegt,

kommt

2

der χ -Unabhängigkeitstest in Betracht. Voraussetzungen: -

Es liegt eine Auswahl ohne Zurücklegen vor. Da es jedoch mehr als N = 20000 Berufstätige in der Bundesrepublik Deutschland gibt, so daß n/N = 1000/N < 0,05 erfüllt ist, sind die Stichprobenvariablen ( , Y ± ) zumindest approximativ stochastisch unabhängig. Die identische Verteilung der (X ± , Y ± ) ist gegeben, da aus einer Gesamtheit nach dem Zufallsprinzip gezogen wird.

-

Die Gesamtheit ist zweidimensional verteilt.

-

Es liegen vor.

к =

4 und m

=

3 disjunkte,

nicht-leere

Hypothesen: «o^Xi.Yii*!»^) = f x ± ( x i) ' fYi(xz)

für

alle

( х 1' х г)

6

'

Klassen

486

4. Ergänzungen

Hj^: f X i < Y i (x 1 , x 2 ) φ f x (xi) · £у ± ( х г)

f ü r

m i n d e s t e n s e i n (хг, x 2 ) e SR 2 .

Prüffunktion: Da die hypothetischen Wahrscheinlichkeiten =

= Pi.P.j a u s d e r S t i c h p r o b e

durch

zu s c h ä t z e n sind,

ist

_ Nj>N.jV к m l N ij _ Τ = Ζ-, У У L* Ν. Ν · i=lj=l *3 η unter Η0 approximativ Freiheitsgraden.

χ2-verteilt

mit

ν = (4 - l) · (3 - l) = 6

D i e A p p r o x i m a t i o n g i l t a l s gut, da f ü r a l l e i,j

nie

Arbeiter

250

gelegentlich

128

Beamter

40

Landwirt

47

360

32

48

120 24, 48

34, 68

70

8

15

14,28

20,23

35,49 507

1000

204

289

Die Felder im I n n e r e n der Tabelle sind w i e folgt

besetzt:

Entscheidungsregel: H0

wird verworfen,

2

wenn t > χ1_α;ν

2

i.

73,44

104,04

60, 84

n

91, 80 92

182,52

ist.

450

130,05 98

170

regelmäßig

72

228,15 Angestellter

ηρ° ή > 10

= Xo95;6

=

12,59

ist.

4. Ergänzungen

487

Berechnung: _ (250 - 228,1б)2 (8 - 14,2 θ)2 228,15 14^8 = 2,09 + 0,03 + 4,27 + 0,86 + 0,35 + 4,69 + 7,14 + 5,12 + 2,31 + 3,73 + 1,35 + 2,76 = 34,71. Entscheidung: Da t = 34,71 > 12,59 = Xo,95;6< wird H0 verworfen. Interpretation: Auf einem Signifikanzniveau von α = 0,05 liefert die Stichprobe einen Grund, daran zu zweifeln, daß die Berufsgruppe und die Häufigkeit der sportlichen Betätigung voneinander unabhängig sind. Möglicher Fehler: H0 wurde verworfen, obwohl H0 richtig ist (Fehler erster Art). Falls H 0 richtig ist, führen 5% aller möglichen Stichproben zu einer falschen Entscheidung, d.h. zum Verwerfen von H 0 . Das Fehlentscheidungsrisiko beträgt also 5%. Aufgabe 16.8 Bei einem Sachbearbeiter einer Versicherungs-AG gehen an einem Arbeitstag (= acht Stunden) im Durchschnitt zwei Kfz-Schadensanzeigen ein. a) Welches Wahrscheinlichkeitsmodell ist geeignet, die Wahrscheinlichkeit dafür zu bestimmen, daß bei dem Sachbearbeiter an einem bestimmten Arbeitstag genau χ = 0,1,2,... Schadensanzeigen eingehen? Nehmen Sie an, daß die Schadensanzeigen stochastisch unabhängig und für alle Wochentage identisch verteilt sind! b) Bestimmen Sie mit dem Wahrscheinlichkeitsmodell aus Teilaufgabe a) die Wahrscheinlichkeit dafür, daß bei dem Sachbearbeiter bi) an einem bestimmten Tag genau zwei, Ьг) an einem bestimmten Tag mehr als zwei, Ьз) innerhalb von vier Tagen genau acht Kfz-Schadensanzeigen eingehen! c) Bei der Versicherungs-AG gehen je Arbeitstag im Durchschnitt 20 Kfz-Schadensanzeigen ein. Mit welcher Wahrscheinlichkeit sind es an einem bestimmten Arbeitstag mehr als 25 Schadensanzeigen? d) Überprüfen Sie Ihr Wahrscheinlichkeitsmodell aus Teilaufgabe a) mit einem geeigneten Test (α = 0,05) und interpretieren Sie das Testergebnis!

488

4. Ergänzungen

Für den Test stehen Ihnen die folgenden Daten einer einfachen Zufallsstichprobe zur Verfügung.

Anzahl der eingehenden Kfz-Schadensanzeigen X

Anzahl der Arbeitstage, an denen χ Kfz-Schadensanzeigen eingehen

0 1 2 3 4 5 und mehr

22 60 52 30 22 14

Lösung 16.8 a) Ein Arbeitstag von acht Stunden Dauer ist ein "begrenztes zeitliches Kontinuum", in dessen Grenzen zu jedem beliebigen Zeitpunkt eine Schadensanzeige eingehen kann. Da die Schadensanzeigen voneinander stochastisch unabhängig sind, folgt die Zufallsvariable X, die zufällige Anzahl der an einem Tag eingehenden Schadensanzeigen, einer POISSON-Verteilung mit Mittelwert μ χ , d.h. X ~ PV(2). b) Wahrscheinlichkeiten für bi) genau zwei Schadensanzeigen an einem bestimmten Tag: P(X = 2) = fx(2| 2) = 0,2707 ; b2) mehr als zwei Schadensanzeigen an einem bestimmten Tag: p(x > 2) = 1 - p(x < 2)

= 1 - Σ£χ(Φ) x=0

= 1 - (o,1353 + 0,2707 + 0,2707) = 0,3233 .

Ъз) Bezeichnet Y die zufällige Anzahl der Schadensanzeigen innerhalb von vier Tagen, so gilt μ γ = 4 · μ χ = 8 und damit Y ~ PV(8) . Somit ergibt folgt:

sich

die

gesuchte

Wahrscheinlichkeit

wie

8s P(Y = 8) = fY(8|8) = — · e 8 = 0,1396 .

c) X, die Anzahl der bei der Versicherungs-AG je Arbeitstag eingehenden Kfz-Schadensanzeigen, folgt einer PV(20).

4. Ergänzungen

489

Da die POISSON-Verteilung für μ > 9 durch die Normalverteilung Ν(μ;μ) approximiert werden kann, gilt approximativ: λ

P(X > 25) = 1 - P(X < 25) = 1 - Fu

25 + 0,5 - 2θ' V2Ö

= 1 - Fu(l,23) = 0,1093 . Die Wahrscheinlichkeit für mehr als 25 Schadensanzeigen an einem bestimmten Arbeitstag beträgt also approximativ 0,1093. d) Gegeben ist die Realisation einer einfachen Stichprobe vom Umfang η = 200. Der Wertebereich der Zufallsvariablen X ist in к = 6 disjunkte, nicht-leere Klassen eingeteilt. Ein geeigneter Test ist der %2-Anpassungstest. Hypothesen: H0: fx(x) = ί0(χ|μ = 2) für alle χ e 5R , Hi:fx(x) * fg(x| μ = 2) für mindestens ein χ ε 5R . Prüfmaß:

ηπ

i-1 ist

unter

1 H0

approximativ

χ2-verteilt

mit

ν = к- 1 = 5

Freiheitsgraden. Die π° sind durch die PV(2) vorgegeben und müssen nicht aus der Stichprobe geschätzt werden. Entscheidungsregel: H0 verwerfen, falls t >

xl_a;v

= Xq,95,-5

= 13*07

ist.

0 ηπ ±

N
10

Entscheidung: 2 Weil

χ0,95;5 = 11,07

ist,

kann

die

Nullhypothese

gnifikanzniveau α = 0,05 nicht verworfen

auf

dem

Si-

werden.

Interpretation: Es g i b t k e i n e n G r u n d , a n d e r R i c h t i g k e i t d e r N u l l h y p o t h e s e zu z w e i f e l n . D a s S t i c h p r o b e n e r g e b n i s s t e h t n i c h t im W i d e r s p r u c h zu d e r V e r m u t u n g , daß d i e A n z a h l d e r a n e i n e m T a g a n gezeigten Kfz-Schäden einer POISSON-Verteilung mit Mittelw e r t μ = 2 f o l g t . E s k ö n n t e j e d o c h e i n F e h l e r 2. A r t v o r l i e g e n . D a s F e h l e n t s c h e i d u n g s r i s i k o ist n i c h t q u a n t i f i z i e r b a r . Aufgabe

16.9

Sie stehen als Mitarbeiter einer staatlichen Spielbankkontrollkommission vor der Aufgabe, einen Würfel auf seine Unv e r f ä l s c h t h e i t zu ü b e r p r ü f e n . I h n e n s t e h e n a l s T e s t v e r f a h r e n ein Mittelwerttest, ein Anteilswerttest oder ein Anpassungstest zur V e r f ü g u n g . D e f i n i e r e n S i e für j e d e n T e s t g e e i g n e t e Z u f a l l s v a r i a b l e , f o r m u l i e r e n S i e j e w e i l s s i n n v o l l e H y p o t h e s e n , u n d e r l ä u t e r n Sie, w e l c h e E i g e n s c h a f t des Würfels damit überprüft w e r d e n kann! Welcher Test erscheint Ihnen am geeignetsten?

Lösung a)

16.9

Mittelwerttest Sei

die Augenzahl beim i-ten Würfeln,

Ist d e r W ü r f e l u n v e r f ä l s c h t , / E

\

(Xi)=

1 6 -

1 1 +

Zu t e s t e n i s t HQ: μ χ

6 -

1 2 +

6 -

so g i l t für d e n

1 3 +

6 -

i =

1 4 +

6 -

Ι,.,.,η. Erwartungswert:

1 5 +

6 '

6

=

3

'5·

somit:

= 3,5 g e g e n H r · μ χ

* 3,5 .

Überprüft werden kann lediglich der Erwartungswert des W ü r f e l s . W i r d H 0 v e r w o r f e n , i s t d i e s e i n I n d i z für e i n e n v e r fälschten Würfel. Allerdings kann auch ein Würfel mit korr e k t e m M i t t e l w e r t e i n v e r f ä l s c h t e r W ü r f e l s e i n (z.B. 1 u n d 6 mit der Wahrscheinlichkeit 0,5). Daher ist dieser Test nicht gut geeignet, die Unverfälschtheit zu prüfen. b)

Anteilswerttest Es g i b t v i e l e M ö g l i c h k e i t e n , d e n A n t e i l zu p r ä z i s i e r e n , z. B. A n t e i l e e i n z e l n e r A u g e n z a h l e n , A n t e i l e d e r g e r a d e n A u g e n zahlen, A n t e i l e der kleinen A u g e n z a h l e n usw.

491

4. Ergänzungen Sei x

z.B.

Γ 1, f a l l s b e i m i - t e n W u r f e i n e 6 f ä l l t i1 = \ η [ 0 s o n stt

Ist der Würfel unverfälscht, von

i = 1, 2,

so g i l t für d e n

. . ., n .

Erwartungswert

XcHi :. * = e ( x J = ± . 6

Die Hypothesen lauten

also:

1 1 H 0 : π = — u n d Η·^ π * — . 6 6 Überprüft w e r d e n kann mit d e m Test dieser Hypothesen, ob die 6 w i r k l i c h m i t e i n e r W a h r s c h e i n l i c h k e i t v o n 1/6 f ä l l t , o d e r o b s i e s e l t e n e r (oder h ä u f i g e r ) g e w o r f e n w i r d . Wird fel

H0 hin.

sein,

deutet

Allerdings

wenn

geworfen mit

verworfen, die

wird

kann

dies ein

6 tatsächlich (z.B.

1 mit

der Wahrscheinlichkeit

auf

mit

der

der

verfälschten

auch

dann

1/6).

Wür-

manipuliert

Wahrscheinlichkeit

Wahrscheinlichkeit

teilswerttest nicht gut geeignet c)

einen

Würfel

Hieraus

folgt,

5/6

daß

1/6

und

der

6

An-

ist.

Anpassungstest Sei

Xj^ d i e A u g e n z a h l b e i m i - t e n W u r f ,

Ist

der

Würfel

unverfälscht,

hat

XL

i = 1, 2,

...,n.

folgende

Wahrschein-

lichkeitsfunktion: f0(l) = f0(2) = f0(3) = f0(4) = f0(5) = f0(6) =

l, b

f 0 (x) = 0 s o n s t . Die Hypothesen lauten

also:

H 0 : f x (x) = f 0 (x), f ü r a l l e x

Η χ : f x (x) * fo( ) '

χ ε Я

und

mindestens ein

χ e 91 .

Überprüft werden kann mit diesem Test die gesamte der X L .

Verteilung

Die d u r c h H 0 spezifizierte V e r t e i l u n g ist gerade die Defin i t i o n d e r U n v e r f ä l s c h t h e i t e i n e s W ü r f e l s . S o m i t ist d e r A n passungstest der am besten geeignete Test für die Beantwortung der gestellten Frage.

A u f g a b · 16.10 Seit 1955 w i r d in der B u n d e s r e p u b l i k " L o t t o a m Samstag" gespielt. Dabei w e r d e n in jeder Ziehung sechs Zahlen aus den von 1 b i s 49 n u m e r i e r t e n K u g e l n o h n e Z u r ü c k l e g e n g e z o g e n (weitere

492

4.

Ergänzungen

gezogene Kugeln wie Zusatzzahl, Superzahl o.ä. werden im folgenden von der Betrachtung ausgeschlossen). In den insgesamt 2360 Ziehungen bis zum Jahresende 2000 wurde die Zahl 13 dabei 235 Mal gezogen. Die Sekretärin Sieglinde W. vermutet, daß die 13 eine Unglückszahl ist und glaubt daher, daß sie bisher viel zu selten gezogen worden ist. a)Nehmen Sie zunächst an, daß jede Zahl bei jeder Ziehung mit gleicher Wahrscheinlichkeit gezogen wird! Wie groß ist unter dieser Voraussetzung die Wahrscheinlichkeit, daß die 13 im Laufe einer Ziehung gezogen wird? b)Beurteilen Sie mit einem geeigneten Verfahren die Hypothese der Sekretärin, daß die 13 im Gegensatz zu allen anderen Kugeln nicht mit gleicher, sondern mit kleinerer Wahrscheinlichkeit gezogen wird! (α = 0,05)

Lösung 16.10 c) Definition der Zufallsvariablen:

{

1, „ falls beim i - ten Zug die 13 gezogen wird, 0 sonst,

für i = 1,...,6. Da die sechs Kugeln einer Ziehung ohne Zurücklegen gezogen werden, sind die X± stochastisch abhängig. Die sind identisch verteilt, weil die Kugeln aus einer "Urne" (Gesamtheit) gezogen werden. 6

Damit

folgt

Verteilung

die

Summe

X' = ^ i=l

einer

hypergeometrischen

н(б,49д).

Die Wahrscheinlichkeit, daß in einer Ziehung die 13 gezogen wird, ist daher:

• Alternative Lösung: Wird jede Zahl mit gleicher Wahrscheinlichkeit gezogen und sind die Xi identisch verteilt, so ist die Wahrscheinlichkeit dafür, daß beim i-ten Zug der Ziehung die 13 gezogen wird, jeweils gleich. Es gilt also:

4. Ergänzungen

P(Xi = 1) = —

493

für alle i.

Da es sich hierbei u m disjunkte Ereignisse handelt, ergibt sich die Wahrscheinlichkeit für die Vereinigung der Ereignisse (daß im Laufe einer Ziehung die 13 gezogen wird) wie folgt: P((X! = 1) и (X2 = 1) и . . . и (X6 = 1)) = P(Xx = 1) + P(X2 = 1) + . . . + P(X6 = 1) = — · 49 d) Da jetzt die Ziehungen als Ganze betrachtet werden, ist eine andere Definition der Zufallsvariablen als in a) erforderlich: 1, falls beim j - ter Ziehung die 13 gezogen wird, 0 sonst, für j = 1, . . .,2360. Die Xj sind stochastisch unabhängig, da die einzelnen Ziehungen zeitlich getrennt stattfinden und sich nicht beeinflussen können. Die Xj sind identisch verteilt, weil die einzelnen Ziehungen stets unter gleichen Bedingungen ablaufen. Sei π = P(Xj = 1) . Wird jede Zahl mit muß gelten:

gleicher Wahrscheinlichkeit

gezogen,

so

6 Ρ(Χή = 1) = — für alle j (H 0 ) . J ΔQ Die Hypothese der Sekretärin werttests überprüft werden. •

kann mit Hilfe

eines

Anteils-

Voraussetzungen: -

Eine einfache Zufallsstichprobe liegt vor

-

die Zufallsvariablen sind 0/1-verteilt;

-

0,1 < π 0 = — < 0,9; 49

-

ηπ0(1 - π0) = 2360 · —

43 · —

= 254 > 9 .

Alle Voraussetzungen sind damit erfüllt! Hypothesen: 6 H0 : π > — 49

gegen Η, : π