Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler : Theorie, Aufgaben und Lösungen [1. Aufl. 2019] 978-3-658-26147-4, 978-3-658-26148-1

Das Arbeitsbuch liefert eine kurze theoretische Rekapitulation aller relevanten Themengebiete der grundlegenden Statisti

535 75 19MB

German Pages XV, 645 [654] Year 2019

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler : Theorie, Aufgaben und Lösungen [1. Aufl. 2019]
 978-3-658-26147-4, 978-3-658-26148-1

Table of contents :
Front Matter ....Pages I-XV
Mathematische Grundlagen (Jens K. Perret)....Pages 1-44
Grundlagen Statistik (Jens K. Perret)....Pages 45-123
Wahrscheinlichkeitsrechnung (Jens K. Perret)....Pages 125-149
Verteilungen (Jens K. Perret)....Pages 151-305
Punkt- und Intervallschätzung (Jens K. Perret)....Pages 307-324
Testtheorie (Jens K. Perret)....Pages 325-410
Zusammenhänge und Regression (Jens K. Perret)....Pages 411-525
Zeitreihen (Jens K. Perret)....Pages 527-542
Markow-Ketten (Jens K. Perret)....Pages 543-551
Ergänzungen (Jens K. Perret)....Pages 553-625
Excel Befehlsreferenz (Jens K. Perret)....Pages 627-630
Wann verwendet man was? (Jens K. Perret)....Pages 631-634
Back Matter ....Pages 635-645

Citation preview

Jens K. Perret

Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler Theorie, Aufgaben und Lösungen

Arbeitsbuch zur Statistik für Wirtschaftsund Sozialwissenschaftler

Jens K. Perret

Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler Theorie, Aufgaben und Lösungen

Jens K. Perret International School of Management Köln, Deutschland

ISBN 978-3-658-26147-4 ISBN 978-3-658-26148-1 (eBook) https://doi.org/10.1007/978-3-658-26148-1 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer Gabler © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Springer Gabler ist ein Imprint der eingetragenen Gesellschaft Springer Fachmedien Wiesbaden GmbH und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Abraham-Lincoln-Str. 46, 65189 Wiesbaden, Germany

Vorwort

Ich freue mich, dass Sie sich entschieden haben, das vorliegende Arbeitsbuch im Rahmen Ihres Studium bzw. zur Vorbereitung einer Lehrveranstaltung zu verwenden. Um Ihnen die Arbeit zu erleichtern, möchte ich direkt zu Beginn die Möglichkeit nutzen und ein paar Worte über die Struktur des Buches und der einzelnen Kapitel zu verlieren. Das Buch entstand ursprünglich, um Studierenden der ISM in Köln zusätzlich Aufgaben zu den wichtigsten Themenbereichen der Statistik an die Hand zu reichen, wie sie in Einführungsveranstaltungen in nahezu allen wirtschaftswissenschaftlichen Studiengängen behandelt werden. Da in unterschiedlichen Universitäten und Hochschulen mitunter abweichende Themen behandelt werden und dies auch auf variierenden Schwierigkeitsstufen, kann es durchaus vorkommen, dass Sie in dem Buch auch Aufgaben finden, die vom Anspruch her stark von den Aufgaben abweichen, die Ihnen aus Ihren Veranstaltungen bekannt sind. An dieser Stelle setzt ansatzweise auch Abschn. 8.2 an, in dem nicht nur beschrieben wird, wie Sie sich selbst eigene Aufgaben und dazu passende Lösungen konzipieren können, sondern auch wie die Aufgaben im vorliegenden Buch in Bezug auf ihrem Schwierigkeitsgrad hin modifiziert werden können. Jeder Themenbereich besteht aus fünf Hauptbestandteilen: Theoretische Grundlagen Hier werden die Grundlagen der jeweiligen Thematik kurz und knackig dargestellt, sodass nicht nur die im Buch verwendete Notation verständlich wird, sondern auch die wichtigsten Formeln und Vorgehensweisen kompakt vorliegen und während des Arbeitens nachgeschlagen werden können. Die Theorieteile erheben keinen Anspruch auf Vollständigkeit oder mathematische Beweise und Herleitungen; sie dienen alleine der dokumentierten Rekapitulierung der wichtigsten Themenbereiche und richten sich an den in dem Buch besprochenen Aufgaben aus. Realisierungen in Excel Hier werden die, im Rahmen des entsprechenden Themenblocks, wichtigen Excel-Befehle vorgestellt und es wird illustriert, wie diese zur Lösung entsprechender Probleme verwendet werden können. Aufgaben Hier finden sich die eigentlichen Aufgaben. Die Aufgaben und die jeweils zugehörigen Lösungen sind in der elektronischen Variante direkt miteinander verlinkt, sodass zwischen beiden hin- und hergesprungen werden kann. Inhaltlich gliedern sich V

VI

Vorwort

die Aufgaben in einen Verständnisteil in Form eines Quick-Checks aus wahren und falschen Aussagen, einem mathematischen Rechenteil und einem praktischen Excelteil. Lösungen Analog zu den Aufgaben sind auch die Lösungen strukturiert. Sollte Ihnen die Printversion des Buchs vorliegen, können Sie die, zu einer Lösung gehörende Aufgabe aus dem Titel der Lösung entnehmen oder vice versa. Die Lösungen wurden so ausführlich wie sinnvollerweise möglich gehalten, was zum Teil trotz allem bedeutet, dass nicht jeder einzelne Schritt dokumentiert wurde. Wiederholungsfragen Diese Fragen dienen dazu zu reflektieren, ob die zentralen Inhalte des jeweiligen Kapitels verstanden wurden. Da sie allgemeiner gehalten sind als die Quick-Check-Fragen zu Beginn der Aufgabenkapitel und die Multiple-Choice-Fragen in den Dozentensheets werden keine gesonderten Lösungen hierzu bereitgestellt. Ergänzend zu den Theorien, Aufgaben und Lösungen enthält das Arbeitsbuch eine Einführung in die, im Rahmen des Buches, verwendete Mathematik. Hier wurden die jeweils wichtigsten Themen ausgewählt und von Grund auf zumindest motiviert. Auch zu diesem Teil finden Sie geeignete Aufgaben im Verlauf des entsprechenden Kapitels. Darüber hinaus werden die Theorie-, Excel- und die Aufgabenkapitel durch Onlinevideos ergänzt, auf die über entsprechende QR-Codes zugegriffen werden kann. Die Gesamtheit aller Videos ist im Rahmen der folgenden Playlists einzusehen:

Playlist: Aufgaben und Theorie

Playlist: Excel Auch nach Erscheinen des Arbeitsbuchs werden weitere Inhalte bereitgestellt. Der Zugriff hierauf ist über die entsprechende Playlist zu Aufgaben und Theorie bzw. den YouTube-Kanal des Autors möglich. Sollten Sie die im Rahmen dieses Buchs vorgestellten Methoden im Rahmen professioneller statistischer Datenauswertung anwenden wollen, so finden Sie im Folgenden eine

Vorwort

VII

Playlist mit Videos zur Einführung in das Statistikpaket SPSS. Diese Einführung deckt allerdings nicht alle Inhalte dieses Arbeitsbuches ab, da nicht alle Methoden entsprechend in SPSS implementiert sind. Anderseits enthält die Einführung in SPSS auch Methoden, die jenseits des Spektrums dieses Arbeitsbuches stehen:

Playlist: SPSS Neben dem Leitfaden zur Modifikation bestehender Aufgaben und der Erstellung eigener neuer Aufgaben umfasst Kap. 10 auch größere Case Studies, in denen mehrere der Ansätze aus dem Buch verwendet werden müssen, um die Case Study erfolgreich zu bearbeiten. Auf diese Weise können Sie die im Buch erlernten Methoden direkt in einem praktischen Rahmen anwenden. Ebenfalls in Kap. 10 finden Sie ein Baukastensystem für Klausuren. Jede Aufgabe ist mit einer Punktzahl versehen, die zum einen Auskunft darüber gibt, wie anspruchsvoll die Aufgabe ist, aber auch darüber, wie viel Zeit für jede Aufgabe aufgewendet werden sollte. Hierauf aufbauend wird im zweiten Unterkapitel von Kap. 10 dargestellt, wie auf Basis dieser Angaben eine sowohl inhaltlich als auch in Bezug auf den Anspruch ausgewogene Klausur konzipiert werden kann. Während sich dieses Kapitel zentral an Dozenten richtet, kann es auch problemlos von Studierenden zur Erstellung von Übungs- und Probeklausuren genutzt werden. Darüber hinaus enthält Kap. 10 für Dozenten speziell ausgearbeitete Vorlesungsblätter, die nicht nur weitere Aufgabenvorschläge und Multiple-Choice-Fragen enthalten, sondern zugleich eine Beispielstrukturierung für Vorlesungen zu den Inhalten dieses Arbeitsbuch liefern. Hierbei richten sich die Empfehlungen für die Statistik 1- und die Statistik 2-Vorlesung an einer Reihe von Standardlehrplänen an deutschen Hochschulen aus. Die Statistik 3-Vorlesungsstruktur greift die zusätzlich vertiefenden und ergänzenden Inhalte dieses Arbeitsbuchs auf. Schließlich findet sich in dem Kapitel auch ein Vorgehensschema, in welchem Themenkomplex eine spezielle Aufgabe einzuordnen ist und bezugnehmend auf den Excelteil des Buchs, ein Glossar der relevanten Excel-Befehle. Im Anhang des Arbeitsbuchs finden sich noch Anmerkungen, wie die Tabellen zu den wichtigsten Verteilungen in Excel generiert werden können bzw. ebenso die Tabellen selbst. Abschließend möchte ich als Autor noch die Möglichkeit nutzen, um mich bei all den Personen zu bedanken, die auf die eine oder andere Art zum Entstehen dieses Buches beigetragen haben. In Bezug auf die sprachliche und inhaltliche Korrektur

VIII

Vorwort

der ersten Rohfassung des Buchs, geht ein besonderer Dank an Lena Rügamer. Aber ebenso danke ich auch allen Studenten an der ISM, die dieses Buch im Rahmen ihrer Studienvorbereitung getestet haben und mir wertvolles Feedback haben zukommen lassen. Alle verbleibenden Fehler liegen allein in meinem Verantwortungsbereich. Viel Spaß beim Lernen Wuppertal, Deutschland 29. Januar 2019

Jens K. Perret

Inhaltsverzeichnis

1

Mathematische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.3 Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.4 Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.5 Lineare Gleichungssysteme und das Gauß-Verfahren . . . . . . . . . . 1.2 Realisierung in Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Gleichungen lösen mittels Zielwertsuche . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Exponentialfunktion und Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Arbeiten mit Summen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.4 Arbeiten mit Matrizen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.5 Fakultäten und Binomialkoeffizienten . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Rechenaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2 Excel Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Rechenaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Excel Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1 1 1 8 16 19 27 31 31 31 32 32 33 34 34 37 37 37 43 44

2

Grundlagen Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Formen der Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 Quantitative und qualitative Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Diskrete und stetige Größen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.4 Skalenniveaus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.5 Häufbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.6 Häufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45 45 46 47 47 48 49 50

IX

X

Inhaltsverzeichnis

2.1.7 Lagemaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.8 Streuungsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.9 Verteilungsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.10 Boxplots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.11 Klassierte Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Realisierung in Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Häufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Maximum, Minimum und Spannbreite . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Lagemaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.4 Streuungs- und Verteilungsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.5 Zusätzliche Mittelwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Statistik Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Lage- und Streuungsparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Lage- und Streuungsparameter klassierter Daten . . . . . . . . . . . . . . . 2.3.4 Excel-Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.5 Aufgaben mit Erklärvideos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Statistik Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Lage- und Streuungsparameter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.3 Lage- und Streuungsparameter klassierter Daten . . . . . . . . . . . . . . . 2.4.4 Excel Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

52 57 60 61 62 65 65 66 66 67 67 68 69 72 79 82 82 101 101 104 116 122 123

3

Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.2 Von der Mengenlehre zur Wahrscheinlichkeitstheorie . . . . . . . . . 3.2 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Wahrscheinlichkeitsrechnung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Aufgaben mit Erklärvideos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.2 Wahrscheinlichkeitsrechnung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

125 125 125 129 132 133 135 139 143 143 145 149

4

Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.2 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.3 Bernoulli-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

151 151 151 156 157

2.2

2.3

2.4

2.5

Inhaltsverzeichnis

4.2

4.3

4.4

4.1.4 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.5 Hypergeometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.6 Geometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.7 Poisson-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.8 Gleichverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.9 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.10 Normalverteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.11 Annäherung von Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.12 Stochastische Ungleichungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.13 Methodenwahl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Realisierung in Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Hypergeometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.3 Poisson-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.4 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.5 Normalverteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.3 Hypergeometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.4 Geometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.5 Poisson-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.6 Stetige Verteilungen – Allgemein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.7 Mehrdimensionale Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.8 Gleichverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.9 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.10 Normalverteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.11 Verteilungen gemischt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.12 Annäherung von Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.13 Stochastische Ungleichungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.14 Excel Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.15 Aufgaben mit Erklärvideos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.2 Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.3 Hypergeometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.4 Geometrische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.5 Poisson-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.6 Stetige Verteilungen – Allgemein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.7 Mehrdimensionale Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.8 Gleichverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.9 Exponentialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

XI

158 159 159 160 161 162 163 164 165 166 167 167 167 168 168 169 169 170 172 174 178 179 181 183 186 187 189 193 198 199 201 208 220 221 222 229 236 239 244 250 253 256

XII

Inhaltsverzeichnis

4.4.10 Normalverteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.11 Verteilungen gemischt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.12 Annäherung von Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.13 Stochastische Ungleichungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.14 Excel-Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

260 271 283 286 287 305

Punkt- und Intervallschätzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 Konfidenzintervalle für den Mittelwert . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.2 Konfidenzintervalle für die Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Realisierung in Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Konfidenzintervall bei bekannter Varianz . . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Konfidenzintervall bei unbekannter Varianz . . . . . . . . . . . . . . . . . . . . 5.2.3 Konfidenzintervall für die Varianz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Konfidenzintervalle für den Mittelwert bei bekannter Varianz . 5.3.2 Konfidenzintervalle für den Mittelwert bei unbekannter Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.3 Konfidenzintervalle für die Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.4 Excel-Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.5 Aufgaben mit Erklärvideos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1 Konfidenzintervalle für den Mittelwert bei bekannter Varianz . 5.4.2 Konfidenzintervalle für den Mittelwert bei unbekannter Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.3 Konfidenzintervalle für die Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.4 Excel-Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

307 307 307 309 310 310 310 311 311 311

4.5 5

6

Testtheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.2 Parametrische Tests – Mittelwerttests . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.3 Verteilungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Realisierung in Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Mittelwerttest und t-Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Verteilungstests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

314 316 318 318 320 320 321 322 323 324 325 325 325 327 331 334 334 335

Inhaltsverzeichnis

6.3

Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Gauß-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.3 Mittelwerttests bei bekannter Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.4 Mittelwerttests bei unbekannter Varianz . . . . . . . . . . . . . . . . . . . . . . . . 6.3.5 Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.6 Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.7 Homogenitätstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.8 Excel Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.9 Aufgaben mit Erklärvideos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Gauß-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.3 Mittelwerttests bei bekannter Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.4 Mittelwerttests bei unbekannter Varianz . . . . . . . . . . . . . . . . . . . . . . . . 6.4.5 Unabhängigkeitstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.6 Anpassungstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.7 Homogenitätstest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.8 Excel-Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

335 336 339 342 345 347 352 355 359 359 367 367 372 378 379 382 393 400 407 410

Zusammenhänge und Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Assoziationsmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.2 Lineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.3 Loglineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Realisierung in Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Ränge und Spearmans Korrelationskoeffizient . . . . . . . . . . . . . . . . . 7.2.2 Kovarianzen und Korrelationskoeffizienten . . . . . . . . . . . . . . . . . . . . . 7.2.3 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 χ 2 -Statistik und Kontingenzkoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.2 Spearmans Rangkorrelationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.3 Pearsons Korrelationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.4 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.5 Loglineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.6 Multiple lineare Regression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.7 Gemischte Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.8 Excel-Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.9 Aufgaben mit Erklärvideos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

411 411 411 417 423 423 423 424 425 426 427 431 435 438 443 445 449 450 453

6.4

6.5 7

XIII

XIV

Inhaltsverzeichnis

7.4

Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.1 χ 2 -Statistik und Kontingenzkoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.2 Spearmans Rangkorrelationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.3 Pearsons Korrelationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.4 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.5 Loglineare Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.6 Multiple lineare Regression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.7 Gemischte Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.8 Excel-Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

469 470 484 488 493 502 508 514 515 525

8

Zeitreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 Allgemein. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.2 Gleitende Durchschnitte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.3 Exponentielle Glättung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Realisierung in Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.1 Gleitende Durchschnitte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.2 Exponentielle Glättung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.3 Aufgaben mit Erklärvideos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4 Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Gleitende Durchschnitte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4.2 Exponentielle Glättung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.5 Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

527 527 527 528 529 531 531 531 533 535 537 537 540 542

9

Markow-Ketten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1 Theoretische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Realisierung in Excel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.1 Aufgaben mit Erklärvideos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.5 Wiederholungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

543 543 545 546 548 549 551

10

Ergänzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1 Case Studies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.1 Case 1 – Umfrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.2 Case 1 – Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.3 Case 2 – Unternehmensdaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.4 Case 2 – Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.5 Case 3 – Marktforschung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.6 Case 3 – Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

553 553 553 555 556 558 559 560

7.5

Inhaltsverzeichnis

10.1.7 Case 4 – Studentenerhebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.8 Case 4 – Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.9 Case 5 – Marktforschung zu Finanzprodukten . . . . . . . . . . . . . . . . . 10.1.10 Case 5 – Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.11 Case 6 – Marktforschung zum Serienkonsum . . . . . . . . . . . . . . . . . . 10.1.12 Case 6 – Lösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Baukasten für eigene Übungsaufgaben. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Baukasten für eigene Übungsklausuren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Optimale Klausurvorbereitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Dozentenvorlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.1 Statistik 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.2 Statistik 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.5.3 Statistik 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

XV

562 563 565 566 567 569 570 570 571 572 572 594 612

11

Excel Befehlsreferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627

12

Wann verwendet man was? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 631

Symbol- und Variablenverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 635 Wichtige Tabellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637 Stichwortverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643

1

Mathematische Grundlagen

Inhalte • • • • • • •

Grundrechenarten, Wurzeln und Potenzen Exponential- und Logarithmusfunktionen Summenzeichen Differentialrechnung Integralrechnung Matrizen Lineare Gleichungssysteme

1.1

Theoretische Grundlagen

1.1.1

Grundlagen

Als Bemerkung vorab sei angemerkt, dass im Folgenden für alle Variablen und Parameter implizit angenommen wird, dass es sich um reelle Zahlen handelt. Die Praxis sieht allerdings derart aus, dass meistens streng positiv rationale oder natürliche Zahlen verwendet werden. Daher wird auch auf die gesonderte Kennzeichnung von Definitionslücken, die zwar theoretisch, aber nicht praktisch vorliegen, verzichtet. Ferner wird für alle verwendeten Funktionen implizit unterstellt, dass sie im gesamten Definitionsbereich stetig und differenzierbar sind. Abweichungen von diesen Annahmen, werden, sofern notwendig, besonders gekennzeichnet.

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 J. K. Perret, Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler, https://doi.org/10.1007/978-3-658-26148-1_1

1

2

1 Mathematische Grundlagen

1.1.1.1 Umformen von Gleichungen Addition Y = C+I

|+G

Y +G = C+I +G

Multiplikation y = c+g

|∗a

ay = ac + ag

Dividieren Y = C+I

|:L

Y C I = + L L L Ersetzen Y C I = + L L L y = c+3

mit

Y C I = y, = c und = 3 L L L

Ausmultiplizieren a(C + I ) = aC + aI −(C + I ) = −C − I (−1) ∗ (−a) = a −(C − I ) = −C + I

Erweitern f f f y f y =1 = = x x xy yx

1.1 Theoretische Grundlagen

3

Rechenbeispiel Berechne den Wert für a: (−2)(3 − 4) + a = 4

| Ausmultiplizieren

(−2)3 − (−2)4 + a = 4 −6 − (−8) + a = 4 −6 + 8 + a = 4 2+a = 4

| Zusammenfassen | −2

a = 4−2 a=2 Alternativ: (−2)(3 − 4) + a = 4

| Zusammenfassen

(−2)(−1) + a = 4 2+a = 4

| −2

a=2

1.1.1.2 Wurzeln √ Den Ausdruck a x nennt man auch a-te Wurzel von x. Alternativ kann man hierfür auch 1 x a schreiben.1 Das bedeutet, dass man mit Wurzeln wie mit Potenzen rechnen kann. Zum Teil hat es sich in der Mathematik eingebürgert, dass anstelle von Wurzelausdrücken oder Kombinationen von Potenzen und Wurzeln alleine mit Potenzen gearbeitet wird. Statt



1−b

b

x b schreibt man x 1−b

Für solche Potenzen gelten die folgenden Rechenregeln: x −a =

1 xa

x0 = 1 1 Der wohl bekanntere Ausdruck √x stellt nichts anderes dar als die zweite Wurzel von x und wird

bisweilen auch als die Quadratwurzel von x bezeichnet. Da hier nur mit reellen Zahlen gearbeitet wird sei stets x ∈ R+ .

4

1 Mathematische Grundlagen

x a+b = x a · x b x a−b =

xa xb

x ab = (x a )b = (x b )a Rechenbeispiele  √ 2 2 2 4 = 4 = 22 = 2 2 = 21 = 2  √ 3 3 3 8 = 23 = 2 3 = 21 = 2   √ √ √ √ √ √ 2√ 2 2 2 2 2 2 2 18 = 18 = 2 ∗ 9 = 32 ∗ 2 = 32 ∗ 2 = 3 2 2 = 31 2 = 3 2



Anwendungsbeispiel Aus dem Rechnen mit Brüchen sollte der Satz: „Durch einen Bruch teilt man, indem man mit dem Kehrwert multipliziert“ noch einigermaßen bekannt sein. Dass dies tatsächlich stimmt, kann man mit obigen Regeln und ein wenig Bruchrechnen auch nachweisen. f 1 f y f 1 f  y −1 f (y)−1 f x : = y =  1 = = = y x y x y y y x y (x)−1 yy x

Macht man das Ganze mit Zahlen, so gilt zum Beispiel: 2 1 2 4 2 : = ∗  1 = ∗ 3 6 3 3 4

 −1 4 12 2 4−1 2 6 =1 = ∗ −1 = ∗ = 6 3 6 3 4 12

6

1.1.1.3 Logarithmus und Exponentialfunktion Man spricht von einer allgemeinen Exponentialfunktion, wenn die Funktion die Form: f (x) = a x hat. Hierbei nennt man a Basis und x Exponenten. Im klassischen Fall gilt a = e = 2,71 . . . e nennt man auch Eulersche Zahl. Die Umkehrfunktion zu einer allgemeinen Exponentialfunktion nennt man Logarithmus und sie hat die Gestalt: f (x) = loga (x)

;

x ∈ R+ .

Man sagt hierzu auch Logarithmus zur Basis a mit a ∈ R+ \{1}. Betrachtet man den Logarithmus zur Basis e, so spricht man von dem natürlichen Logarithmus und schreibt: f (x) = ln(x).

1.1 Theoretische Grundlagen

5

Diese beiden Typen von Logarithmusfunktionen hängen wie folgt zusammen: loga (x) =

ln(x) ln(a)

Das heißt man benötigt lediglich Rechenregeln für den natürlichen Logarithmus. Da wir weiter oben den Logarithmus als Umkehrfunktion der Exponentialfunktion beschrieben haben, gelten die folgenden Eigenschaften: ln(ex ) = x x = eln(x)

mit x > 0.

Die zweite Aussage muss auf x > 0 eingeschränkt werden, da man in den Logarithmus nur Werte größer als null einsetzen darf. Insbesondere gelten für den Logarithmus noch die folgenden Regeln: ln(1) = 0 ln(e) = 1 ln(a ∗ b) = ln(a) + ln(b) a  = ln(a) − ln(b) ln b ln(a b ) = b ∗ ln(a).

1.1.1.4 Binomische Formeln Auch wenn es nur eine überschaubare Anzahl von Anwendungen für die binomischen Formeln in der Statistik gibt, gehören sie doch zu dem Handwerkszeug eines jeden, der sich auch nur ansatzweise mit Formeln und Ähnlichem beschäftigt. Aus diesem Grund seien sie hier kurz angegeben: I (a + b)2 = a 2 + 2ab + b2 II (a − b)2 = a 2 − 2ab + b2 III (a + b)(a − b) = a 2 − b2 III

a 2 − b2 b2 (a + b)(a − b) = =a− a a a

Insbesondere die modifizierte Formel III ist ein einfaches Maß für die Volatilität. Rechenbeispiel (3 + 4y)2 = 32 + 2 ∗ 3 ∗ 4y + (4y)2 = 9 + 24y + 16y 2

6

1 Mathematische Grundlagen

1.1.1.5 Fakultät und Binomialkoeffizient Die Fakultät n! sagt aus, dass alle ganzen Zahlen bis zu dem Wert n aufmultipliziert werden. Der Ausdruck wird uns später im Rahmen der Kombinatorik erneut begegnen. Hauptsächlich wird er allerdings dazu benötigt, den sogenannten Binomialkoeffizien  ten nk zu bestimmen. Mathematisch ist der Binomialkoeffizient über die Fakultät bestimmt:   n n! = k k! · (n − k)! Da die Fakultätsfunktion allerdings sehr schnell sehr große Werte annehmen kann, ist es einfacher bei der Berechnung des Binomialkoeffizienten direkt von Beginn an zu kürzen oder auf einen Taschenrechner zurückzugreifen. Die meisten Taschenrechner verfügen über eine Funktion nCr. Hier ist zunächst n einzugeben, dann nCr und danach k. Auch der Binomialkoeffizient wird uns sowohl in der Kombinatorik als auch im Rahmen der Binomialverteilung wieder begegnen. Bei einer Reihe von Berechnungen im Umgang mit dem Binomialkoeffizienten kann durch die folgenden Formeln sehr viel Zeit und Rechenaufwand gespart werden:     n n = =0 0 n     n n = =n 1 n−1     n n = k n−k Es ist zu bemerken, dass sowohl Fakultät als auch Binomialkoeffizient immer nur ganzzahlige Ergebnisse ausgeben. Rechenbeispiel 6! = 1 · 2 · 3 · 4 · 5 · 6 = 720   5 5! 120 = = = 10 3 3! · 2! 6·2

1.1.1.6 Summenzeichen Steht man in der Mathematik vor dem Problem, dass eine große Menge an Zahlen aufaddiert werden muss, die alle einem erkennbaren funktionalen Zusammenhang folgen, so vereinfacht man sich das Leben dadurch, dass man diese Summe von Zahlen kompakter aufschreibt. Die Art und Weise, wie man hierbei vorgeht, findet sich in dem sogenannten

1.1 Theoretische Grundlagen

7

Summenzeichen (). Das folgende Beispiel veranschaulicht die Verwendung von Summenzeichen. Beispiel Betrachtet man die Summe 1+4+9+16+25, so erkennt man sehr schnell, dass dies nichts anderes ist, als alle Quadratzahlen von 1 bis 5 zu addieren. Der funktionale Zusammenhang hierbei ist somit durch die Funktion f (x) = x 2 gegeben. Mithilfe des Summenzeichens  kann diese Summe wie folgt kompakter notiert werden: 1 + 4 + 9 + 16 + 25 =

5

i2

i=1

Die Variable hier ist nicht mehr x, sondern i. Aber der funktionale Zusammenhang, wie auch hinter dem Summenzeichen angegeben, ist immer noch die Funktion f (i) = i 2 . Die Information unter dem Summenzeichen i = 1 macht uns darauf aufmerksam, dass der erste Wert, der für i einzusetzen ist, die 1 ist. Der Teil unter dem Summenzeichen markiert somit den Beginn der Summe. Die Information über dem Summenzeichen 5 gibt uns die Information, bis zu welchem Wert Zahlen in die Funktion hinter dem Summenzeichen einzusetzen sind. In dem obigen Beispiel sind alle ganzen Zahlen von 1 bis 5 in die Funktion einzusetzen und aufzuaddieren. Linearität Der große Vorteil des Summenzeichens besteht darin, dass es eine lineare Transformation darstellt. Das bedeutet, dass die folgenden beiden Regeln gelten:

· xi = a · ni=1 xi

n

n

n i=1 xi ± yi = i=1 xi ± i=1 yi

n

i=1 a

Die erste Regel sagt aus, dass Konstanten, die an die Funktion multipliziert werden, vor das Summenzeichen geschrieben werden können. Weiter oben haben wir diesen Vorgang als Ausmultiplizieren kennengelernt. Die zweite Regel schließlich sagt aus, dass Summen bzw. ihre Funktionen in Teile zerlegt werden können, solange sie durch + oder − miteinander verbunden sind. Darüber hinaus lässt sich auch die folgende Regel für konstante Terme (nicht zu verwechseln mit dem Konstanten von der ersten Regel oben, die dranmultipliziert wurden) herleiten: i = 1n a = a · n

8

1 Mathematische Grundlagen

Translation Möchte man, dass die Summe bei einem bestimmten Wert beginnt oder endet, so können entsprechende Verschiebungen/Translationen an den Summen vorgenommen werden. Die folgende Regel fasst dies zusammen: n

xi =

i=1

n+a

xi−a

i=1+a

Doppelsummen Doppelsummen sind Summen, bei denen zunächst für eine Variable alle Werte eingesetzt werden und danach für die andere Variable. Doppelsummen treten zum Beispiel auf, wenn man alle Einträge einer Matrix aufaddieren möchte: Zunächst werden alle Elemente einer Zeile addiert, danach springt man in die nächsten Zeile und addiert wieder der Reihe nach (aufsteigende Spaltenzahl) alle Elemente auf usw. In diesem Fall beschreibt das innere Summenzeichen die jeweilige Spalte und das äußere Summenzeichen die Zeile. Das folgende Beispiel veranschaulicht dieses Vorgehen. Beispiel Es ist die folgende Doppelsumme zu berechnen: 3 2 i=1 j =1

i·j =

2

(i · 1 + i · 2 + i · 3) = 1 · 1 + 1 · 2 + 1 · 3 + 2 · 1 + 2 · 2 + 2 · 3

i=1

= 1 + 2 + 3 + 2 + 4 + 6 = 18 Der Vorteil von Doppelsummen ist, dass es egal ist, in welcher Reihenfolge die Summenzeichen ausgewertet werden. (Man kann es dadurch erklären, dass es egal ist, ob man bei einer Matrix die Werte zunächst zeilen- oder spaltenweise aufaddiert). Dies wird durch die folgende Regel zusammengefasst: m n i=1 j =1

1.1.2

xi,j =

n m

xi,j

j =1 i=1

Differentialrechnung

1.1.2.1 Grenzwerte Es gibt Situationen in denen kann ein bestimmter Wert nicht in eine Funktion eingesetzt werden. Dies kann entweder der Fall sein, wenn mit diesem Wert nicht gerechnet werden kann bzw. darf, wie es zum Beispiel bei ∞ der Fall ist. Anderseits gibt es Funktionen wie f (x) = x1 , in die einzelne Werte – hier der Wert 0 – nicht eingesetzt werden

1.1 Theoretische Grundlagen

9

dürfen. Allerdings ist trotz allem von Interesse, wie sich diese Funktionen in der Nähe des verbotenen Wertes verhalten. Hierzu benutzt man das Konzept des Grenzwerts. Der Grenzwert beschreibt, wie sich eine Funktion verhält, wenn man sich dem verbotenen Wert beliebig weit nähert. Schreiben lässt sich der Grenzwert für eine Funktion f (x) mit einem verbotenen Wert von x0 in der folgenden Form: lim f (x)

x→x0

Beispiel Betrachtet man die Funktion f (x) = x1 , so kann man den folgenden Grenzwert bestimmen: lim

x→∞

1 =0 x

Da sich die Funktion immer mehr dem Wert 0 annähert, je größer die Werte werden, die für x eingesetzt werden, wird der Kehrwert immer kleiner und nähert sich null, bleibt aber stets positiv. Betrachtet man die gleiche Funktion allerdings an der Stelle 0, so zeigt sich, dass es einen Unterschied gibt, ob man sich der Null von links oder von rechts nähert. Daher kann man hierzu zusätzlich die Begriffe des links- und des rechtsseitigen Grenzwerts einführen. Für den linksseitigen Grenzwert gilt: lim

x→0−

1 = −∞. x

Entsprechend gilt für den rechtsseitigen Grenzwert: lim

x→0+

1 = ∞. x

Ein Grenzwert ist eindeutig bestimmt, wenn links- und rechtsseitiger Grenzwert übereinstimmen. In diesem Fall gilt: lim f (x) = lim f (x) = lim f (x).

x→x0−

x→x0+

x→x0

Beispiel Im volkswirtschaftlichen Kontext kann man sich das folgende Beispiel vor Augen führen. Betrachten wir ein beliebiges Land A. In diesem Land A liegt eine Arbeitslosenrate von 20 % vor. Um etwas gegen diese hohe Arbeitslosigkeit zu unternehmen, verabschiedet die Regierung des Landes einige Verordnungen, die zur Folge haben, dass

10

1 Mathematische Grundlagen

die Arbeitslosenquote sich in jedem Jahr verringert. Ökonomen haben den Einfluss der Verordnungen auf die Arbeitslosigkeit untersucht und dabei festgestellt, dass die Arbeitslosigkeit u auf die folgende Art und Weise von der Zeit t abhängt: u(t) =

15 +5 t

Zu dem Zeitpunkt t1 = 1, der bei uns der Startzeitpunkt ist, liegt entsprechend eine Arbeitslosenrate von u(1) = 15 + 5 = 20 vor. Ein Jahr später, im Zeitpunkt t2 = 2, zeigen die staatlichen Verordnungen erste Wirkungen und die Arbeitslosenrate liegt bei nur noch u(2) = 7,5 + 5 = 12,5. Die Frage, die allerdings in dieser Hinsicht am meisten interessiert, ist danach, welche Wirkung die Verordnungen auf lange Sicht erreichen können; auf welchen Wert kann die Arbeitslosenquote höchstens gesenkt werden. Hierfür ist es notwendig, sich für t einen sehr weit entfernten, unendlich weit entfernten Zeitpunkt zu denken und zu bestimmen, welchen Wert die Arbeitslosenrate zu diesem Zeitpunkt annimmt. Setzt man in die Formel für u immer größere Werte ein, so erhält man: u(10) = u(1000) =

15 + 5 = 6,5 10

15 + 5 = 5,015 1000

u(100) =

15 + 5 = 5,15 100

u(10000) =

15 + 5 = 5,0015 10000

Man erkennt also, dass sich u(t) immer mehr dem Wert 5 annähert. Würde man für t den Wert ∞ einsetzen, so würde man als Ergebnis 5 erhalten. In einem solchen Fall sagt man auch, dass 5 der Grenzwert von u(t) für t → ∞ ist. An dieser Stelle ist festzuhalten, dass eine Folge2 stets nur maximal einen Grenzwert besitzen kann. In diesem Fall sagt man auch, dass die entsprechende Folge gegen den Grenzwert konvergiert. Die Funktion u(t) konvergiert für t gegen unendlich gegen den Wert 5. Damit allerdings nicht jedes Mal ein entsprechend langer Antwortsatz zu schreiben ist, benutzt man die folgende kompaktere Schreibweise: lim u(t) = 5.

t→∞

Besitzt die Folge keinen Grenzwert bzw. bekommt man ∞ als Ergebnis oder ist der Grenzwert nicht eindeutig, so sagt man, dass die Folge divergiert. Bekommt man ∞ als Ergebnis, so schreibt man beispielsweise auch: lim t = ∞.

t→∞

2 Eine Folge kann man sich wie eine Funktion vorstellen, in die man nur positive ganze Zahlen einsetzt. u(t) ist eine Folge, da t größer als 0 ist und nur ganze Zahlen als Zeitpunkte benutzt werden.

1.1 Theoretische Grundlagen

11

Bevor wir auf weitere Anwendungsbeispiele eingehen werden, sollen zuerst die meist verwendeten Regeln zur Grenzwertberechnung angegeben werden. lim c

t→∞

1 = 0, mit c ∈ R t

lim ct = ∞, mit c ∈ R+

t→∞

lim ceat+b = ∞, mit b, c ∈ R und a ∈ R+

t→∞

lim ce−at+b = 0, mit b, c ∈ R und a ∈ R+

t→∞

lim f (t) + g(t) = lim f (t) + lim g(t)

t→∞

t→∞

t→∞

Weiterhin wollen wir noch Grenzwerte der folgenden Form berechnen: lim

t→∞

f (t) g(t)

Hierbei sind f (t) und g(t) Polynome. Ferner sei v der Grad3 von f (t) und w der Grad von g(t). Dann kann man drei Fälle unterscheiden. Im ersten Fall ist v > w, dann gilt: lim

f (t) =∞ g(t)

lim

f (t) =0 g(t)

t→∞

Im zweiten Fall ist v < w, dann gilt

t→∞

Der dritte Fall, bei dem v = w ist, ist etwas schwieriger. Hierbei muss man den Wert, der vor dem Term mit dem größten Exponenten in f (t) und den Wert, der vor dem Term mit dem größten Exponenten in g(t) steht, betrachten. In dem Beispiel: t 2 − 3t t→∞ 3 − 3t 2 lim

ist sowohl der Grad von f (t) als auch der Grad von g(t) gerade 2. Der Ausdruck mit dem höchsten Exponenten in f (t) und in g(t) ist t 2 und vor dem t 2 steht in f (t) eine 1 und

3 Der Grad eines Polynoms ist der größte vorkommende Exponent. Zum Beispiel hat f (x) = x 3 + x 4 + 3x den Grad 4.

12

1 Mathematische Grundlagen

in g(t) eine −3. Der Grenzwert der gesamten Folge ergibt sich, indem man den Wert aus f (t) (1) durch den Wert aus g(t) (−3) teilt. Es gilt also: t 2 − 3t 1 1 = =− . 2 t→∞ 3 − 3t −3 3 lim

1.1.2.2 Differenzieren Differenzieren als solches bezieht sich darauf, die Steigung einer gegebenen Funktion f an einer Stelle x0 zu bestimmen. Zu diesem Zweck erinnert man sich daran, dass die Steigung einer Geraden der Form: f (x) = mx + c gerade m ist. Sind zwei Punkte (x0 , y0 ) und (x1 , y1 ) vorgegeben, durch die die Gerade verlaufen soll, so kann man die Steigung auch berechnen als: m=

y1 − y0 x1 − x0

Diese Darstellung der Steigung, die man auch Punktsteigungsform nennt, motiviert dazu, den Differentialquotienten einzuführen, durch welchen die Steigung f  (x0 ) einer Funktion f an der Stelle x0 bestimmt werden kann. Der Differentialquotient hat die Form: f  (x0 ) = lim

x→x0

f (x) − f (x0 ) x − x0

Mit einer derartigen Beschreibung der Steigung kann man praktisch allerdings meist wenig anfangen, daher benutzt man andere Wege, die zwar alle auf dem Differentialquotienten basieren, ihn allerdings nicht explizit benutzen.

1.1.2.3 Ableitungen In diesem Abschnitt soll ein Überblick über die verschiedenen Grundtypen von Funktionen gegeben werden und wie ihre Ableitungen lauten. Um komplizierte Ausdrücke behandeln zu können, müssen diese mithilfe der weiter unten angegebenen Ableitungsregeln in die Grundtypen zerlegt werden, sodass die hierfür geltenden Ableitungen verwendet werden können. Bevor auf die eigentlichen Ableitungsregeln eingegangen wird, ist zuvor noch eine Erklärung der verschiedenen Schreibweisen vonnöten. Berechnet man die erste Ableitung einer Funktion f , die alleine von der Variablen x abhängig ist, so kann man dies auf verschiedene Arten schreiben. f  (x) = fx (x) =

∂f (x) df (x) = dx ∂x

1.1 Theoretische Grundlagen

13

Berechnet man eine Funktion mit mehr als einer Variablen, zum Beispiel die Funktion f (x, y) mit den Variablen x und y, so lässt sich die Ableitung nach x auf die folgende Art schreiben: fx (x, y) =

df (x, y) ∂f (x, y) = dx ∂x

Unter Berücksichtigung dieser Hintergrundinformationen kann man sich die ersten Ableitungsregeln anschauen. Im Folgenden beschränken wir uns auf die nachstehenden Standardfunktionen: f (x) = ax n ⇒ f  (x) = anx n−1 , n = 0 f (x) = a ⇒ f  (x) = 0 f (x) = exp(x) ⇒ f  (x) = exp(x) f (x) = ln(x) ⇒ f  (x) =

1 x

f (x) = sin(x) ⇒ f  (x) = cos(x) f (x) = cos(x) ⇒ f  (x) = − sin(x) Da diese Funktionen in ihrer reinen Form wenig direkte wirtschaftswissenschaftliche Relevanz besitzen, wollen wir uns als Nächstes damit auseinandersetzen, auf welche Arten solche Funktionen kombiniert werden können und wie es dann mit ihren Ableitungen aussieht. Insbesondere gelten für zusammengesetzte Funktionen die folgenden Regeln: Linearität : f (x) = g(x) + h(x) ⇒ f  (x) = g  (x) + h (x) Linearität : f (x) = ag(x) ⇒ f  (x) = ag  (x) Produktregel : f (x) = g(x) ∗ h(x) ⇒ f  (x) = g  (x) ∗ h(x) + g(x) ∗ h (x) Quotientenregel : f (x) =

g(x) h(x)

⇒ f  (x) =

g  (x) ∗ h(x) − g(x) ∗ h (x) h(x)2

Kettenregel : f (x) = g(h(x)) ⇒ f  (x) = h (x) ∗ g  (h(x))

14

1 Mathematische Grundlagen

1.1.2.4 Maximierung und Minimierung Eine Anwendung der Ableitungen findet sich darin eine optimale Situation zu beschreiben bzw. Bedingungen zu benennen, die für das Erreichen dieser optimalen Situation notwendig sind. Aber was heißt eigentlich optimale Situation? In einer optimalen Situation sollen negative Größen wie zum Beispiel die Arbeitslosigkeit oder die Inflation möglichst gering sein. Alternativ sollen Größen wie das Pro-Kopf-Einkommen oder der Kapitalbestand möglichst groß werden. Man verfolgt also stets das Ziel, eine oder mehrere Größen zu maximieren oder zu minimieren. Sonderfälle finden sich zum einen dann, wenn mehrere Größen gleichzeitig maximiert und/oder minimiert werden sollen. 1.1.2.5 Lokale Extremwerte Zu diesem Zweck unterscheidet man zwischen einer notwendigen Bedingung, die bisweilen auch als first order condition bezeichnet wird und einer hinreichenden Bedingung bzw. second order condition. Notwendige Bedingung Die notwendige Bedingung dient dazu, potenzielle Maxima und Minima (oder zusammenfassend Extrema) zu bestimmen. Zu diesem Zweck verdeutlicht man sich, dass ein Extremum dadurch gekennzeichnet ist, dass an der Stelle des Extremums, sprich an dem jeweiligen Scheitelpunkt der Funktion, genau eine Steigung von 0 vorliegt. Dies macht insoweit Sinn, als dass eine Funktion zum Beispiel vor einem Maximum steigt, also eine positive Steigung hat und nach einem Maximum fällt, also eine negative Steigung hat. Somit muss sie im Maximum eine Steigung von 0 haben. Aus dem letzten Abschnitt wissen wir aber, dass die Steigung einer Funktion hinsichtlich einer einzelnen Variablen durch ihre erste Ableitung bzgl. dieser Variablen gegeben ist. Die erste Ableitung einer Funktion muss somit an der Stelle des Extremums 0 sein. Berechnet man entsprechend alle Stellen, an denen die erste Ableitung einer Funktion 0 wird, so erhält man alle möglichen Extrema. Bei einer Funktion, die von mehreren Variablen abhängt, müssen die Ableitungen bzgl. aller Variablen gleich 0 sein. Während man bei einer Funktion der Form f (x) nur eine erste Ableitung und somit nur die notwendige Bedingung df dx = 0 hat, besteht die notwendige Bedingung der Funktion f (x, y) aus den zwei Gleichungen df df dx = 0 und dy = 0. Da es allerdings noch Punkte der Funktion geben kann, in denen die erste Ableitung 0 ist, die aber keine Extrema der Funktion sind, benötigt man noch eine hinreichende Bedingung. Hinreichende Bedingung Um entscheiden zu können, ob es sich bei einem Punkt, der die notwendige Bedingung erfüllt, tatsächlich um ein Extremum handelt, gibt es mehrere Möglichkeiten. Die Variante, die hier benutzt wird, ist allerdings die bekannteste. Man bestimmt zuerst die zweite Ableitung und setzt in diese die möglichen Extrema ein. Ist das Ergebnis positiv, so handelt es sich um ein Minimum, ist das Ergebnis negativ,

1.1 Theoretische Grundlagen

15

so handelt es sich um ein Maximum. Sollte als Ergebnis 0 rauskommen, so kann man keine Aussage treffen und muss auf eine andere Alternative ausweichen. Für Funktionen mit einer Variablen ist diese Alternative verhältnismäßig einfach gestaltet. Es wird ein Wert gewählt, der etwas kleiner ist als das mögliche Extremum sowie ein Wert, der etwas größer ist als das mögliche Extremum. Beide Werte werden in die erste Ableitung eingesetzt. Liefert der kleinere Wert ein negatives und der größere Wert ein positives Ergebnis, so liegt ein Minimum vor. Liefert der kleinere Wert ein positives und der größere Wert ein negatives Ergebnis, so liegt ein Maximum vor. In allen anderen Fällen liegt kein Extremum vor, sondern ein sogenannter Sattelpunkt. Im Rahmen dieses Buchs betrachten wir zusätzlich nur noch eine Regel für Variablen mit zwei Variablen, da in den meisten Fällen bereits im Vorhinein bekannt ist, ob ein Maximum oder Minimum vorliegt und sich lediglich die Frage stellt, an welcher Stelle sich dieses Extremum befindet. Für eine Funktion mit zwei Variablen bestimmt man die zweiten Ableitungen von f . Diese lauten: fxx , fyy , fxy und fyx , wobei die letzten beiden für differenzierbare 2 > 0, so liegt ein Minimum Funktionen übereinstimmen. Gilt fxx > 0 und fxx · fyy − fxy 2 vor. Gilt hingegen fxx < 0 und fxx · fyy − fxy > 0, so liegt ein Maximum vor. In allen anderen Situationen liegt ein Sattelpunkt vor. Beispiel Betrachten wir, losgelöst von praktischen Gesichtspunkten, die folgende Funktion: f (x, y) = x 2 + y 2 + xy 2 Die ersten Ableitungen bestimmen sich wie folgt: ∇f (x, y) =

2x + y 2 2y + 2xy



Diese ersten Ableitungen setzen wir gleich 0 und formen sie um.

2x 0

=

−y 2 y(2x + 2)



Man erkennt an der zweiten Gleichung, dass entweder y = 0 oder x = −1 sein muss. Für y = 0 folgt als Lösung direkt, dass auch x = 0 ist. Für x = −1 lautet die erste 2 2 Gleichung: −2 √ = −y und somit √ gilt: y = 2. Dies bedeutet aber, dass es zwei Lösungen gibt: y1 = 2 und y2 = − 2. Zu überprüfen ist noch, ob es sich bei den bestimmten möglichen Extrema tatsächlich um solche handelt und sollte dies der Fall sein, ob Maxima oder Minima vorliegen.

16

1 Mathematische Grundlagen

Hierzu bestimmen wir die zweiten Ableitungen der Funktion und setzen in diese die potenziellen Extremstellen ein.



2 2y Hf (x, y) = 2y 2 + 2x 20 Hf (0, 0) = 02 Da sowohl der linke obere Eintrag dieser Matrix sowie die Determinante positiv sind, ist die Matrix positiv definit (im Fall von mehr als einer Variablen ist stets mit der Definitheit einer Matrix zu arbeiten, weshalb dies an dieser Stelle nur angerissen wird) und es liegt ein Minimum vor. √ √ 2 2 2 √ Hf (−1, 2) = 2 2 0 Hier ist das linke obere Element positiv und die Determinante negativ. Aufgrund dieser Tatsache ist die Matrix indefinit, es liegt also kein Extremum vor. √ Hf (−1, − 2) =



√ 2 −2 2 √ −2 2 0

Hier sind wieder sowohl das linke obere Element als auch die Determinante positiv und somit ist die Matrix positiv definit. Es liegt also an der gerade betrachteten Stelle ebenfalls ein Extremum, insbesondere ein Minimum, vor.

1.1.3

Integralrechnung

Im Kapitel zur Differentialrechnung haben wir die Idee hinter dem Rechnen mit Grenzwerten kennengelernt. Auf diese Idee werden wir an dieser Stelle zurückkommen. Zentral beschäftigen wir uns aber mit der Integralrechnung, um die Fläche unter einer Funktion zu berechnen, da in einem späteren Kapitel motiviert wird, dass die Fläche unter der Wahrscheinlichkeits- bzw. Dichtefunktion die Wahrscheinlichkeit eines Ereignisses angibt. Möchte man die Fläche unter einer Funktion beschreiben, bietet es sich an, diese durch eine Reihe von Rechtecken anzunähern. Die Abbildung unten veranschaulicht dieses Vorgehen (Abb. 1.1). Wie man sich vorstellen kann, wird die Fläche unter der gegebenen Funktion umso besser angenähert, umso kleiner die Breite der Rechtecke angesetzt wird. Dies ist vergleichbar mit dem immer kleiner werdenden Abstand bei der Berechnung der Ableitung. Es ist somit möglich auf eine ähnliche Art und Weise vorzugehen wie bei den Ableitungen

1.1 Theoretische Grundlagen

17

Abb. 1.1 Annäherung der Fläche unter einer Funktion

und die tatsächliche Fläche immer besser anzunähern, indem der Grenzwert (gegen 0) der Breite der Rechtecke verwendet wird. Wird dieser Schritt praktisch durchgeführt, so erhält man als Ergebnis, dass die sogenannte Stammfunktion F (x) einer Funktion f (x) Auskunft über die Fläche zwischen der Funktion und der x-Achse gibt. Das Bestimmen der Stammfunktion (Integrieren) ist dabei das Gegenteil des Ableitens (Differenzieren) einer Funktion, sodass mitunter statt von Integrieren auch von Aufleiten gesprochen wird. Ferner ergibt sich hieraus, dass die Stammfunktion der ersten Ableitung wieder die Ausgangsfunktion ergibt und ebenso ergibt auch die Ableitung der Stammfunktion wieder die Ausgangsfunktion. Formal schreibt sich das Ganze wie folgt: F  (x) =

dF = f (x) = dx

f  (x)dx

Unter Benutzung der Stammfunktion ist es so dann möglich, die Fläche unter einer Funktion für den Bereich von a bis b für x zu bestimmen. Formal schreibt sich dies wie folgt:

a

b

f (x)dx = [F (x)]ba = F (b) − F (a)

Die zentrale Frage besteht darin, wie die Stammfunktionen bestimmt werden können. Hierzu fasst die folgende Tabelle die wichtigsten Funktionen und ihre Stammfunktionen zusammen (Tab. 1.1). Es ist zu beachten, dass, wie auch im Kontext der Differentialrechnung, die Linearitätsregel bestehen bleibt, das Integral entsprechend aufgeteilt werden kann und konstante Koeffizienten ausgeklammert werden können. Ferner ist zu beachten, dass Konstanten in Form eines absoluten Terms im Gegensatz zum Ableiten nicht wegfallen. Vielmehr ist es so, dass bei dem Bestimmen der Stammfunktion nicht gesichert ist, dass die Stammfunktion tatsächlich als absoluten Term eine

18

1 Mathematische Grundlagen

Tab. 1.1 Integrationsregeln

Funktion

Stammfunktion

a a · xb

ax + c a b+1 + c b+1 x

1 x

exp(x) sin(x)

ln(x) + c exp(x) + c − cos(x) + c

Null aufweist. Somit ist bei der expliziten Bestimmung der Stammfunktion stets eine Konstante c hinzuzufügen. Welchen Wert diese Konstante tatsächlich annimmt, hängt von zusätzlichen Angaben, wie zum Beispiel Randwerten, ab. Für das Berechnen der Fläche unter einer Funktion auf einem Intervall mit festen Grenzen, kann auf die Angabe der Konstante verzichtet werden (Tab. 1.1). Beispiel Bestimmen Sie die Fläche unter der Funktion f (x) = 3x 2 − 1 in dem Intervall x ∈ [0; 2].

0

2



3 1 x 2+1 − x 0+1 3x − 1dx = 2+1 1+1

2

2

 2 = x3 − x

0

0

= 23 − 2 − 03 + 0 = 6 Es ist an dieser Stelle darauf hinzuweisen, dass im Gegensatz zur Differentialrechnung, wo für alle differenzierbaren Funktionen eine Ableitungsfunktion explizit berechnet werden kann, im Rahmen der Integralrechnung für einige Funktionen zwar nachgewiesen werden kann, dass sie integrierbar4 sind, eine Stammfunktion allerdings nicht explizit berechnet werden kann. Das wohl bekannteste Beispiel ist die Gaußsche Normalverteilung, auf die auch im weiteren Verlauf dieses Buchs Bezug genommen wird. In Analogie zur Produkt- und Kettenregel, die aus der Differentialrechnung bekannt sind, existieren im Rahmen der Integralrechnung die Regel der partiellen Integration und die Substitutionsregel.

1.1.3.1 Partielle Integration Die Regel der partiellen Integration ergibt sich direkt aus dem Integrieren der Produktregel:



f (x) · g (x)dx =

f  (x) · g(x)dx − f (x) · g(x)

4 Eine Definition von Integrierbarkeit erfolgt an dieser Stelle nicht. Der interessierte Leser findet genauere theoretische Hintergründe hierzu in ausgewählten Büchern zur Differentialrechnung.

1.1 Theoretische Grundlagen

19

Entsprechend ist die zu integrierende Funktion in zwei Teile aufzuteilen. Der erste Teil f (x) sollte sich durch Ableiten vereinfachen lassen. (Dies ist zum Beispiel bei einem Polynom der Fall.) Der zweite Teil g  (x) sollte eine möglichst einfache Stammfunktion haben. (Dies ist zum Beispiel bei der Exponentialfunktion oder bei Polynomen der Fall.) Beispiel Gegeben ist die Funktion f (x) = x · exp(x). Die zugehörige Stammfunktion bestimmt sich sodann als:

F (x) = x · exp(x)dx = x · exp(x) − 1 · exp(x)dx = x · exp(x) − exp(x) + c = (x − 1) exp(x) + c. In diesem Beispiel waren f (x) = x und g  (x) = exp(x) wobei sich hieraus ergab, dass f  (x) = 1 und g(x) = exp(x).

1.1.3.2 Substitutionsregel Wie auch bei der partiellen Integration findet sich der Hintergrund der Substitutionsregel in den Ableitungsregeln, insbesondere der Kettenregeln, auch wenn dies nicht direkt derart offensichtlich ist wie bei der partiellen Integration. Die Substitutionsregel ist gegeben als:

g  (x)f (g(x))dx =

f (z)dz = F (z) = F (g(x))

Beispiel Gegeben ist die Funktion f (x) = 2x · exp(x 2 ). Es ist zu erkennen, dass sich eine Substitution mit g(x) = x 2 und f (z) = exp(z) anbietet und entsprechend wie folgt gerechnet wird:

F (x) =

1.1.4

2x · exp(x )dx = 2

exp(z)dz = exp(z) + c = exp(x 2 ) + c

Matrizen

1.1.4.1 Einführung Unter einer m × n-Matrix versteht man ein Zahlenschema in der folgenden Form: ⎛

a1,1 a1,2 ⎜ ⎜ a2,1 a2,2 A=⎜ .. ⎜ .. ⎝ . . am,1 am,2

⎞ · · · a1,n ⎟ · · · a2,n ⎟ . ⎟ .. ⎟ . .. ⎠ · · · am,n

20

1 Mathematische Grundlagen

Wenn man mit Matrizen arbeitet, spricht man oft auch von den Spalten bzw. Zeilen der Matrix. Ferner heißen die Werte a1,1 , am,n usw. Einträge oder Elemente der Matrix A, insbesondere die Einträge, bei denen der erste und der zweite Index gleich sind, nennt man Diagonalelemente z. B. a1,1 , a5,5 oder am,m . Einen Vektor in der normalen Schreibform: ⎛ ⎞ v1 ⎜ ⎟ ⎜ v2 ⎟ ⎟ v=⎜ ⎜ .. ⎟ ⎝ . ⎠ vn kann man auch als 1 × n Matrix auffassen. Eine Matrix, in der alle Elemente außer den Diagonalelementen null sind, nennt man auch Diagonalmatrix. Eine Matrix, in der sämtliche Elemente null sind, heißt Nullmatrix. Ferner nennt man eine Matrix, die die gleiche Anzahl an Spalten wie Zeilen besitzt, quadratisch.

1.1.4.2 Matrizenaddition Zwei Matrizen können nur dann addiert werden, wenn beide die gleiche Anzahl an Zeilen und die gleiche Anzahl an Spalten aufweisen. Ist diese Voraussetzung erfüllt, so wird die Addition wie folgt komponentenweise durchgeführt. ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ b1,1 · · · b1,n a1,1 + b1,1 · · · a1,n + b1,n a1,1 · · · a1,n ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ . . .. .. .. ⎟ ⎜ . . . .. ⎟ + ⎜ .. . . . .. ⎟ = ⎜ . . . ⎠ ⎝ . . ⎠ ⎝ . ⎠ ⎝ . am,1 · · · am,n bm,1 · · · bm,n am,1 + bm,1 · · · am,n + bm,n 1.1.4.3 Matrizenmultiplikation Multiplikation einer Matrix A mit einer Zahl k ⎛ ⎞ ⎛ ⎞ a1,1 · · · a1,n k ∗ a1,1 · · · k ∗ a1,n ⎜ . . ⎟ ⎜ . ⎟ .. .. .. ⎟ ⎜ ⎟ k∗A=k∗⎜ . . . ⎝ .. . . .. ⎠ = ⎝ ⎠ am,1 · · · am,n k ∗ am,1 · · · k ∗ am,n Dies bedeutet, dass bei dieser Art der Matrizenmultiplikation jeder Eintrag der Matrix mit der entsprechenden Zahl k multipliziert wird. Multiplikation einer Matrix A mit einem Vektor v ⎛ ⎞ ⎛ ⎞ ⎛ a1,1 · · · a1,n v1 a1,1 ∗ v1 + · · · + a1,n ∗ vn ⎜ . . ⎟ ⎜ ⎟ ⎜ .. ⎜ . . . .. ⎟ ∗ ⎜ .. ⎟ = ⎜ . ⎠ ⎝ . ⎠ ⎝ . ⎝ . am,1 · · · am,n

vn

am,1 ∗ v1 + · · · + am,n ∗ vn

⎞ ⎟ ⎟ ⎠

1.1 Theoretische Grundlagen

21

Multiplikation von zwei Matrizen A und B Um zwei Matrizen miteinander multiplizieren zu können (also A ∗ B auszurechnen), muss die Anzahl der Spalten von Matrix A mit der Anzahl der Zeilen von Matrix B übereinstimmen. Insbesondere gilt hier für die Matrix C = A · B, dass C die gleiche Anzahl von Zeilen hat wie Matrix A und die gleiche Anzahl von Spalten wie Matrix B. Betrachtet man A · B mit A als m × n · n × k. Die Werte in der Mitte müssen identisch sein. Die Werte außen beschreiben die Ergebnismatrix. Besonders muss man bei der Multiplikation von zwei Matrizen darauf achten, dass für beliebige Matrizen A und B die Produkte A · B und B · A meist nicht gleich sind. Es gilt also: A · B = B · A Für diese Rechenregeln sind keine direkten wirtschaftlichen Anwendungen außerhalb der linearen Regression vorhanden. Im Rahmen von späteren Abschnitten werden die hier angesprochenen Regeln allerdings benötigt.

1.1.4.4 Determinanten Genauso wie die Matrixmultiplikation im letzten Kapitel, haben auch Determinanten keine direkte Anwendungsmöglichkeit in der Wirtschaftswissenschaft. Determinanten können allerdings als Hilfsmittel oder Indikatoren in verschiedenen Bereichen zur Anwendung kommen. Bevor man allerdings die Anwendungsmöglichkeiten von Determinanten besprechen kann, ist zuerst zu klären, wie eine Determinante überhaupt berechnet wird. Wir benutzen hier der Vereinfachung wegen nicht die mathematische Schreibweise, sondern beschreiben die tatsächliche praktische Anwendung. Man beginnt mit dem einfachen Fall einer Matrix mit 2 Zeilen und 2 Spalten. det

ab cd

= ad − bc

Beispiel det

43 76

= 4 ∗ 6 − 3 ∗ 7 = 24 − 21 = 3

Anstatt nun für jede mögliche Größe von Matrizen eine Formel aufzustellen, soll geklärt werden, wie man größere Matrizen so umformen kann, dass am Ende immer nur Determinanten von 2 × 2-Matrizen zu berechnen sind. Hierbei kann man ein einfaches Verfahren nutzen, um die Determinante einer n×n-Matrix als mehrere Determinanten von (n − 1) × (n − 1)-Matrizen zu schreiben. Dieses Verfahren, auch bekannt als Laplacescher Entwicklungssatz, soll hier angegeben werden:

22

1 Mathematische Grundlagen

(a) Wähle eine Spalte oder Zeile aus, in der möglichst viele Nullen stehen. Bei der Matrix: ⎛ ⎞ 0 0 −2 ⎜ ⎟ A = ⎝ 2 −6 3 ⎠ 8 3 1 wäre dies zum Beispiel die erste Zeile, da diese zwei Nullen enthält. (b) Als nächstes müssen alle Einträge dieser Spalte oder Zeile mit einem Vorzeichen multipliziert werden, das sich aus dem folgendem Schema entnehmen lässt: +1 −1 +1 −1 +1 −1 +1 −1 +1 Dieses Schema lässt sich für beliebig große und kleine Matrizen anpassen, wobei lediglich zu beachten ist, dass links oben immer eine +1 steht und +1 und −1 sich abwechseln. Betrachtet man zum Beispiel die obige Matrix A, so ist der −2 aus der ersten Zeile ein +1-Vorzeichen zugeordnet oder der 3 aus der dritten Spalte ist ein −1-Vorzeichen zugeordnet. (c) Die mit 1 oder (−1) multiplizierten Werte der gewählten Spalte bzw. Zeile werden im darauffolgenden Schritt aufaddiert. Für das Beispiel ergibt sich: (+1) ∗ 0 + (−1) ∗ 0 + (+1) ∗ (−2) Schließlich muss an jedes Element eine gekürzte Determinante multipliziert werden. Diese gekürzte Determinante für ein Element ai,j ergibt sich, indem aus der ursprünglichen Determinante die Zeile i und Spalte j gestrichen werden, in der das jeweilige Element steht. Für das Beispiel bedeutet dies: detA = (+1) ∗ 0 ∗ det

−6 3 3 1

+(+1) ∗ (−2) ∗ det



+ (−1) ∗ 0 ∗ det

2 −6 8 3

23 81



Die erste gekürzte Determinante ist entstanden, indem die erste Zeile und erste Spalte der Ausgangsdeterminante entfernt wurden. Dies geschah, da die 0, die zu dieser Determinante gehört, in der Ausgangsdeterminante in der ersten Zeile und zweiten Spalte stand. Entsprechend entsteht die dritte gekürzte Determinante, indem die erste Zeile und dritte Spalte der Ausgangsdeterminante entfernt wurden, da die −2 in der ersten Zeile und dritten Spalte stand.

1.1 Theoretische Grundlagen

23

Da es wieder null ergibt, wenn man eine Zahl mit null multipliziert, können alle Teile, in denen 0 in der Ausgangsdeterminante stand, weggelassen werden. Unser Beispiel wird damit zu: 2 −6 detA = (+1) ∗ (−2) ∗ det 8 3 Hieran wird ersichtlich, warum man eine Zeile oder Spalte mit möglichst vielen Nullen wählen sollte: Es ist entsprechend später weniger zu berechnen. Weiterhin sieht man, dass die Ausgangsdeterminante die Determinante einer 3 × 3-Matrix war, und dass das Ergebnis Determinanten von 2 × 2-Matrizen sind. Hat man nun aber größere Matrizen, so muss man das obige Verfahren möglicherweise mehrmals nacheinander anwenden. So reduziert man bei einer 4 × 4-Matrix die Ausgangsdeterminante zuerst auf Determinanten von 3 × 3-Matrizen und reduziert dann in einem zweiten Schritt jede Determinante einer 3 × 3-Matrix auf Determinanten von 2 × 2-Matrizen. Mathematisch lässt sich der Laplacesche Entwicklungssatz auch durch die folgende Formel beschreiben, bei der detAi,J die Determinante der um die i-te Zeile und j -te Spalte gekürzten Matrix A ist. Der Index ist i in dem Fall, dass eine Spalte gewählt wird und j in dem Fall, dass eine Zeile gewählt wird. det(A) =

n

ai,j · (−1)i+j · det(Ai,j )

i,j =1

Beispiel ⎛

1 ⎜ ⎜0 B=⎜ ⎝0 2

2 3 1 −1

⎞ 34 ⎟ 2 7⎟ ⎟ 3 2⎠ 04

Zur Berechnung der Determinante wählt man zuerst diejenige Zeile oder Spalte mit den meisten Nullen. In diesem Fall ist das unter anderem die erste Spalte. Entsprechend kann man schreiben: ⎞ ⎛ 1 2 34 ⎟ ⎜ ⎜0 3 2 7⎟ detB = det ⎜ ⎟ ⎝0 1 3 2⎠ 2 −1 0 4 ⎞ ⎛ ⎞ ⎛ 234 3 27 ⎟ ⎜ ⎟ ⎜ = (+1) ∗ 1 ∗ det ⎝ 1 3 2 ⎠ + (−1) ∗ 2 ∗ det ⎝ 3 2 7 ⎠ 132 −1 0 4

24

1 Mathematische Grundlagen

Da die 1 aus der ersten Spalte in der ersten Zeile steht, hat sie gemäß dem obigen Vorzeichenschema eine (+1) als Vorzeichen. Ferner werden in der gekürzten Determinante die erste Zeile und Spalte entfernt. Da die 2 in der Spalte in der vierten Zeile steht, hat sie gemäß dem Vorzeichenschema eine (−1) als Vorfaktor und die vierte Zeile und erste Spalte wurden in der folgenden Determinante gestrichen. Die restlichen Ausdrücke fallen weg, da der entsprechende Eintrag in der Ausgangsdeterminante 0 war. Auf jede der zwei entstandenen 3 × 3-Determinanten wendet man das Schema nun erneut an. 1. Fall

⎞ 3 27 ⎟ ⎜ detB1 = det ⎝ 1 3 2 ⎠ −1 0 4 ⎛



27 32

= (+1) ∗ (−1) ∗ det



32 13

+ (+1) ∗ 4 ∗ det

= −(4 − 21) + 4(9 − 2) = 17 + 28 = 45 wenn man die dritte Zeile zum Bearbeiten wählt. 2. Fall

⎞ 234 ⎟ ⎜ detB2 = det ⎝ 3 2 7 ⎠ 132 ⎛

= (+1) ∗ 2 ∗ det

+(+1) ∗ 4 ∗ det





27 32

+ (−1) ∗ 3 ∗ det





37 12

32 13

= 2(4 − 21) − 3(6 − 7) + 4(9 − 2) = 34 + 3 + 28 = 65 wenn man die erste Zeile zum Entwickeln wählt. Diese beiden Ergebnisse setzt man dann in die Ausgangsrechnung ein und erhält: detB = (+1) ∗ 1 ∗ 45 + (−1) ∗ 2 ∗ 65 = 45 − 130 = −85

1.1 Theoretische Grundlagen

25

Die Frage, die man sich im Zusammenhang mit Determinanten häufig stellt, ist diejenige, ob eine Determinante gleich null oder ungleich null ist.

1.1.4.5 Inverse Matrizen Zu Beginn des Kapitels haben wir gelernt, dass Brüche genutzt werden können, um die Multiplikation umzukehren. Da im vorhergehenden Abschnitt die Multiplikation von zwei Matrizen eingeführt wurde, besteht die Frage, ob es ein, dem Kehrwert (Bruch) entsprechendes Pendant auch für Matrizen gibt. Dieses Pendant findet sich in den sogenannten inversen Matrizen. Für den Kehrwert a −1 einer Zahl a gilt: a · a −1 = 1 Die zu einer gegebenen Matrix M inverse Matrix M −1 kann analog definiert werden, wobei die 1 auf der rechten Seite durch eine Einheitsmatrix I (Matrix, bei der auf der Diagonalen Einsen stehen und sonst überall Nullen) ersetzt wird: M · M −1 = I = M −1 · M Während es bei der bekannten Division verboten war, durch null zu teilen, besteht ein entsprechendes Verbot auch für Matrizen. Hier ist es jedoch nicht alleine die Nullmatrix, die nicht invertierbar ist, sondern alle Matrizen mit einer Determinante von 0 können nicht invertiert werden. Darüber hinaus lässt sich aus der letzten Gleichung erkennen, dass es für die inverse Matrix unerheblich ist, ob diese von rechts oder von links an die Ausgangsmatrix multipliziert wird. Dies ist allerdings nur dann möglich, wenn beide Matrizen quadratisch sind und die gleiche Anzahl an Zeilen und Spalten aufweisen. Sind diese beiden Anforderungen erfüllt, bestimmt sich die Inverse zu einer Matrix verhältnismäßig einfach über das folgende Schema: Es werden zunächst die Ausgangsmatrix und die entsprechende Einheitsmatrix in ein gemeinsames Schema geschrieben: (M|I) Im weiteren Verlauf wird das Schema über die folgenden drei Schritte (dies sind die drei Schritte, die auch im folgenden Kapitel beim Gauß-Verfahren zum Lösen linearer Gleichungssysteme verwendet werden) solange modifiziert, bis auf der linken Seite die Einheitsmatrix steht. Die entsprechende Matrix auf der rechten Seite gibt die zur Ausgangsmatrix M gehörende inverse Matrix M −1 an. • Zwei Zeilen können vertauscht werden. • Zwei Zeilen können addiert werden. • Eine Zeile kann mit einer beliebigen Zahl (ungleich 0) multipliziert werden.

26

1 Mathematische Grundlagen

Kombiniert man die letzten beiden Schritte, so erhält man die zusätzliche Option: • Von jeder Zeile kann ein Vielfaches einer anderen Zeile abgezogen werden. Beispiel Die Matrix M ist gegeben als:

52 21

M=

Das hierzu gehörende Arbeitsschema ergibt sich somit als:

5210 2101

Die zweite Zeile kann mit (−2) multipliziert werden:

5 2 1 0 −4 −2 0 −2

Im nächsten Schritt kann die zweite Zeile zur ersten addiert werden: 1 0 1 −2 −4 −2 0 −2 Im nächsten Schritt wird das Vierfache der ersten Zeile zur zweiten addiert: 1 0 1 −2 0 −2 4 −10 Abschließend wird die zweite Zeile durch (−2) geteilt:

1 0 1 −2 0 1 −2 5



Die inverse Matrix zu M ergibt sich entsprechend als: M −1 =

1 −2 −2 5

Nachrechnen zeigt, dass in der Tat gilt: M · M −1



1.1 Theoretische Grundlagen

1.1.5

27

Lineare Gleichungssysteme und das Gauß-Verfahren

Im letzten Kapitel, im Rahmen der Extremwertberechnung, war es bereits notwendig, Gleichungssysteme zu lösen. Dort wurde implizit unterstellt, dass der Leser bereits in der Lage ist, mit Gleichungssystemen umzugehen. Während das Lösen von beliebigen Gleichungssystemen nicht einheitlich zu beschreiben ist und lediglich Anweisungen wie Auflösen nach einer Variablen und Gleichsetzen gegeben werden können, gibt es für lineare Gleichungssysteme (LGS) ein einfaches Verfahren zu ihrer Lösung. Bei diesem Verfahren handelt es sich um das sogenannte Gauß-Verfahren. Theoretisch betrachtet besteht das Gauß-Verfahren aus einer geeigneten Abfolge der nachfolgenden drei Schritte: • Vertausche zwei Zeilen. • Multipliziere eine Zeile mit einer Zahl (die ungleich 0 ist.) • Addiere zwei Zeilen. Kombiniert man die letzten beiden Schritte, so erhält man die zusätzliche Option: • Von jeder Zeile kann ein Vielfaches einer anderen Zeile abgezogen werden. Um sich die Arbeit zu vereinfachen, wird das Gleichungssystem zunächst derart umgeformt, dass sich auf der linken Seite alle Ausdrücke befinden, die sich aus den Unbekannten der Gleichungssysteme ergeben. Auf der rechten Seite aller Gleichungen befinden sich dann nur noch Ausdrücke, die keine der unbekannten Variablen enthält. Dieses Gleichungssystem kann dann in Matrix-Vektor-Schreibweise dargestellt werden. A·x =b Die Matrix A enthält die Koeffizienten der linken Seite des Gleichungssystems. Besteht das Gleichungssystem aus n Variablen und m Gleichungen, so handelt es sich bei A um eine m × n-Matrix. Hierbei ist zu beachten, dass in Zeile i von Matrix A als erster Eintrag der Koeffizient steht, der zu der in Vektor x zuerst genannten Variablen gehört. Der Eintrag in der zweiten Spalte gehört entsprechend zu der zweiten in x aufgeführten Variablen. Der Vektor b enthält die Ausdrücke, die sich auf der rechten Seite des Gleichungssystem finden. Aus dem folgenden LGS:5 a1,1 x1 + a1,2 x2 + a1,3 x3 = b1 a2,1 x1 + a2,2 x2 + a2,3 x3 = b2 a3,1 x1 + a3,2 x2 + a3,3 x3 = b3

5 Beispielhaft betrachten wir nur ein Gleichungssystem mit drei Gleichungen und drei Variablen.

28

1 Mathematische Grundlagen

wird in Matrixschreibweise: ⎛

⎞⎛ ⎞ ⎛ ⎞ a1,1 a1,2 a1,3 b1 x1 ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎝ a2,1 a2,2 a2,3 ⎠ ⎝ x2 ⎠ = ⎝ b2 ⎠ a3,1 a3,2 a3,3 x3 b3 Im weiteren Verlauf werden die vier oben genannten Operationen verwendet, um die Matrix A derart zu transformieren, dass sie im oberen Teil der Einheitsmatrix entspricht, was bedeutet, dass alle Diagonalelemente di,i entweder 0 oder 1 werden.6 In allen anderen Einträgen enthält die Matrix nur noch Nullen. Die Idealsituation sieht wie folgt aus: ⎞⎛ ⎞ ⎛ ⎞ v1 x1 d1,1 0 0 ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎝ 0 d2,2 0 ⎠ ⎝ x2 ⎠ = ⎝ v2 ⎠ 0 0 d3,3 x3 v3 ⎛

Welche Werte die Zahlen di,i und vi annehmen und ob sie ungleich 0 sind, lässt sich im Vorhinein nicht sagen. Sollte es allerdings möglich sein, eine Diagonalmatrix zu konstruieren, so kann die Lösung des Gleichungssystem direkt auf der rechten (v1 , v2 , v3 ) abgelesen werden. Tritt der Fall auf, dass einzelne Spalten nach der Transformation keine 1 enthalten, so besitzt das lineare Gleichungssystem unendlich viele Lösungen. Wie diese bestimmt und dargestellt werden können, ist allerdings im Rahmen dieses Buches nicht relevant. Besitzt Matrix A nach der Transformation Zeilen, die alleine Nullen enthalten, so ist zu prüfen, ob die zugehörigen Werte auf der rechten Seite ebenfalls Nullen sind. Ist dies nicht der Fall, so das lineare Gleichungssystem nicht lösbar. Beispiel Im Folgenden werden wir das Gauß-Verfahren anwenden, wie es standardgemäß durchgeführt wird. Dies kann an einigen Stellen zu einem zusätzlichen Arbeitsaufwand führen, gewährleistet aber einen Arbeitsablauf, der auch auf andere Probleme in der gleichen Art angewendet werden kann. Wir betrachten das folgende LGS: ⎞⎛ ⎞ ⎛ ⎞ 0 x1 047 ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎝ 2 2 4 ⎠ ⎝ x2 ⎠ = ⎝ 2 ⎠ 3 x3 369 ⎛

6 Im Idealfall entsteht eine Einheitsmatrix. Es kann allerdings auch vorkommen, dass in einzelnen Spalten keine 1 zu finden ist.

1.1 Theoretische Grundlagen

29

Man beginnt damit, das LGS so umzustellen, sodass alle Zeilen, die mit einer Null beginnen, als letzte Zeilen in dem LGS stehen. Entsprechend werden die erste und die dritte Zeile vertauscht. ⎞⎛ ⎞ ⎛ ⎞ x1 3 369 ⎟⎜ ⎟ ⎜ ⎟ ⎜ = 2 2 4 x ⎠⎝ 2 ⎠ ⎝2⎠ ⎝ 0 047 x3 ⎛

Anschließend wird die erste Zeile durch den Wert des ersten Elements (in diesem Fall die 3) geteilt. Dies ergibt: ⎛

⎞⎛ ⎞ ⎛ ⎞ 123 1 x1 ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎝ 2 2 4 ⎠ ⎝ x2 ⎠ = ⎝ 2 ⎠ x3 047 0 Hierauf folgend wird von den nachfolgenden Zeilen die erste Zeile so oft abgezogen, bis jeweils eine 0 an erster Stelle steht. In dem vorliegenden Fall wird die erste Zeile zweimal von der zweiten Zeile abgezogen, da an der ersten Stelle der zweiten Zeile eine 2 steht. Von der dritten Zeile wird die erste Zeile nicht weiter abgezogen, da hier an der ersten Stelle bereits eine 0 steht. Führt man diese Rechnung durch, so erhält man: ⎞⎛ ⎞ ⎛ ⎞ 1 12 3 x1 ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎝ 0 −2 −2 ⎠ ⎝ x2 ⎠ = ⎝ 0 ⎠ 0 x3 04 7 ⎛

Nun wechselt man zu der zweiten Zeile und betrachtet das zweite Element. Da dieses Element (−2) nicht 0 ist, muss diese Zeile nicht verschoben werden. Stattdessen kann die Zeile direkt durch dieses Element geteilt werden, sodass das LGS die folgende Gestalt annimmt. ⎞⎛ ⎞ ⎛ ⎞ x1 123 1 ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎝ 0 1 1 ⎠ ⎝ x2 ⎠ = ⎝ 0 ⎠ 047 0 x3 ⎛

Wie im Schritt zuvor wird ausgehend von der zweiten Zeile von jeder folgenden Zeile entsprechend viel abgezogen, sodass unterhalb der zweiten Zeile in der zweiten Spalte nur Nullen stehen. Für unser Beispiel heißt dies, dass von der dritten Zeile viermal die zweite abgezogen wird.

30

1 Mathematische Grundlagen

⎞⎛ ⎞ ⎛ ⎞ x1 1 123 ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎝ 0 1 1 ⎠ ⎝ x2 ⎠ = ⎝ 0 ⎠ 0 003 x3 ⎛

Im nächsten Schritt wird die dritte Zeile durch drei geteilt und von der ersten Zeile wird zweimal die zweite Zeile abgezogen. ⎞⎛ ⎞ ⎛ ⎞ x1 101 1 ⎜ ⎟⎜ ⎟ ⎜ ⎟ = ⎝ 0 1 1 ⎠ ⎝ x2 ⎠ ⎝ 0 ⎠ 001 0 x3 ⎛

Im letzten Schritt wird die dritte Zeile von der ersten und der zweiten abgezogen, sodass sich das folgende Ergebnis einstellt. ⎞⎛ ⎞ ⎛ ⎞ x1 1 100 ⎟⎜ ⎟ ⎜ ⎟ ⎜ ⎝ 0 1 0 ⎠ ⎝ x2 ⎠ = ⎝ 0 ⎠ 0 001 x3 ⎛

Man erkennt, dass die Matrix auf der linken Seite der Einheitsmatrix entspricht. Somit ist das Ziel des Gauß-Verfahrens erreicht und das lineare Gleichungssystem besitzt eine eindeutige Lösung. Die Lösung kann direkt auf der rechten Seite abgelesen werden und lautet: x1 = 1, x2 = 0 und x3 = 0

1.1.5.1 Lineare Gleichungssysteme und Matrizen Zu Beginn dieses Kapitels haben wir motiviert, dass ein lineares Gleichungssystem in Matrix-Vektor-Schreibweise notiert werden kann. Entsprechend kann auch auf Matrixoperationen zurückgegriffen werden, wenn es um die Lösung von linearen Gleichungssystemen geht. Wie weiter oben dargestellt, hat ein lineares Gleichungssystem entweder keine, eine oder unendlich viele Lösungen. Betrachtet man ein Gleichungssystem in MatrixVektor-Notation der Form Ax = b, so kann man für den Fall, dass es sich bei der Matrix A um eine quadratische Matrix handelt, Determinanten nutzen, um eine Aussage über die Lösbarkeit des Gleichungssystems zu treffen. Besitzt Matrix A eine Determinante, die ungleich null ist, so besitzt das lineare Gleichungssystem genau eine eindeutige Lösung. Beträgt die Determinante null, so ist das Gleichungssystem entweder nicht lösbar oder es besitzt unendlich viele Lösungen. Hierbei ist zu beachten, dass jedes Gleichungssystem, bei dem die Spaltenanzahl von A größer als die Zeilenanzahl von A ist, unendlich viele Lösungen besitzt. Im Gegensatz dazu kann jedes Gleichungssystem, bei dem die Spaltenanzahl von A kleiner als die Zeilenanzahl ist, so umgeformt werden, dass sich eine quadratische Matrix A ergibt.

1.2 Realisierung in Excel

1.2

31

Realisierung in Excel

Ünter diesen QR-Code finden Sie ein Video, das die folgenden Abschnitte praktisch veranschaulicht.

1.2.1

Gleichungen lösen mittels Zielwertsuche

Excel bietet mit der Zielwertsuche eine Möglichkeit, Gleichungen mit einer Unbekannten zu lösen. Das Verfahren ist allerdings zum Teil recht eingeschränkt. Zum einen ist es nur möglich, Gleichungen mit einer Variablen zu betrachten. Darüber hinaus präsentiert das Verfahren auch nur eine einzige Näherungslösung, die zudem abhängig vom Startwert der Suche ist. Dies bedeutet, dass für eine Gleichung mit mehr als einer Lösung nicht gesichert ist, dass immer die gleiche Lösung generiert wird. Die Zielwertsuche hilft aber einen ersten Eindruck von den Lösungen einer Gleichung zu erlangen. Aufgerufen wird die Zielwertsuche ab Excel 2007 über das Menü Daten und dort den Punkt Was-wäre-wenn-Analyse. Der zugehörige Dialog erfordert drei Eingaben. Am einfachsten geht man derart vor, dass zunächst eine Zelle bestimmt wird, die die Werte der veränderlichen Variablen annimmt (hier A1). Dieser Zelle kann man den Namen x geben. Die zu lösende Gleichung (in Abhängigkeit von x) wird derart umgestellt, sodass eine Seite der Gleichung 0 wird. In einer anderen Zelle (hier A2) wird die zu lösende Gleichung als Funktion von x notiert. Die drei Felder des Dialogs enthalten dann zunächst die Zelle mit der zu lösenden Gleichung (Zielzelle / hier A2). Das zweite Feld (Zielwert) enthält den Wert 0 und das dritte Feld (veränderbare Zelle) enthält die Zelle der Variablen (hier A1).

1.2.2

Exponentialfunktion und Logarithmus

Logarithmen und Exponentialfunktionen sind in Excel in zwei Kontexten realisiert. Beginnt man mit den Exponentialfunktionen, so stellt die Funktion EXP(.) die typische Exponentialfunktion bereit. Für Potenzfunktionen zu einer allgemeinen Basis a lautet die Funktion POTENZ(a;.). Für den Logarithmus sind die folgenden drei Funktionen LOG(.), LOG10(.) und LN(.) realisiert, wobei die Funktionen LOG(.) und LOG10(.) die gleiche Funktion bereitstellen. Während LOG(.) den Logarithmus zur Basis 10 berechnet, berechnet LN(.) den natürlichen Logarithmus zur Basis e. Für Logarithmen zu einer anderen Basis ist die folgende Formel zum Basiswechsel zu verwenden, wobei loga (x) den Logarithmus zur Basis a darstellt: loga (x) =

ln(x) ln(a)

(1.1)

Als Beispiel lassen sich logarithmische Wachstumsraten in Excel über den Befehl =LN(Yneu )-LN(Yalt ) berechnen.

32

1.2.3

1 Mathematische Grundlagen

Arbeiten mit Summen

Zum Aufaddieren einer Reihe von Zahlenwerten kann die Funktion SUMME(Bereich) verwendet werden. Der Bereich bezeichnet hierbei diejenigen Zellen, die aufaddiert werden sollen. Der Vorteil der Summenfunktion ist, dass Zellen ohne Inhalt und solche, die keinen Zahlenwert als Inhalt haben, direkt ausgeblendet werden. Befinden sich alle Werte, die addiert werden sollen in Spalte E, die allerdings auch weitere Textkommentare enthält, kann trotz allem die Summe wie folgt berechnet werden: =SUMME(E:E) Soll anstelle des reinen Aufaddierens ein Skalarprodukt von zwei Zeilen oder Spalten berechnet werden (z. B. Funktionswerte und Gewichte), so kann die Funktion SUMMENPRODUKT(Bereich 1; Bereich 2) verwendet werden. Hierbei ist zu beachten, dass die beiden Bereiche zum einen gleich groß sein müssen und es muss sich bei beiden Bereichen entweder um Zeilen oder bei beiden um Spalten handeln. Eine Mischung der beiden Darstellungsweisen führt zu einem Fehler. Übernimmt man beispielsweise in eine Spalte die Werte: 1 3 5 (A1:A3) und eine andere Spalte die Werte: 4 6 7 (B1:B3), dann berechnet die Funktion SUMMENPRODUKT(A1:A3;B1:B3): 1 · 4 + 3 · 6 + 5 · 7 = 57.

Erklärungen Excel: Grundlagen

1.2.4

Arbeiten mit Matrizen

Zur Art mit Matrizen stellt Excel drei Funktionen zur Verfügung, die besonders interessant sind, wobei zunächst anzumerken ist, dass eine Formel für die Matrizenaddition nicht implementiert wurde, allerdings problemlos mit der normalen Addition realisiert werden kann. Die Funktion MDET(Bereich) berechnet ausgehend von einer Matrix, die in dem Bereich steht, die zugehörige Determinante. Da eine Determinante nur für quadratische Matrizen bestimmt werden kann, führt ein Bereich, der nicht quadratisch ist, zu einer Fehlermeldung. Sollen zwei Matrizen miteinander multipliziert werden, so kann dies mittels der Funktion MMULT(Bereich 1; Bereich 2) realisiert werden, wobei Bereich 1 die linke und Bereich 2 die rechte Matrix enthält. Entsprechend erfordert die Funktion, dass die Spaltenanzahl von Bereich 1 mit der Zeilenanzahl von Bereich 2 übereinstimmt. Das entsprechende Ergebnis ist dann eine Matrix mit der Zeilenanzahl von Bereich 1 und der Spaltenanzahl von Bereich 2. Dies bedeutet aber, dass es sich bei MMULT(.) um eine

1.2 Realisierung in Excel

33

Matrixformel handelt. Das wiederum heißt, dass zunächst der gesamte Bereich, auf den die Formel angewendet werden soll, auszuwählen ist. Dann ist in die Funktionszeile zu klicken und die Formel einzugeben. Anstelle zum Abschluss Enter zu drücken sind bei einer Matrixformel die Tasten Steuerung und Umschalt bzw. Shift gedrückt zu halten und erst dann ist die Entertaste zu drücken. Die Formel wird dann direkt auf den gesamten ausgewählten Bereich angewendet. Hierzu ist direkt auch anzumerken, dass ein Teil einer Matrixformel im Nachhinein nicht geändert werden kann und auch das Vergrößern und Verkleinern einer Matrixformel nicht direkt möglich ist. Sollte allerdings ein Bereich ausgewählt werden, der größer oder kleiner ist als der erforderliche Bereich, ist dies für die Formel an sich kein Problem. Es wird für die überflüssigen Felder eines größeren Bereichs ein Fehler ausgegeben und sollte der Bereich zu klein sein, wird nur ein Teil des tatsächlichen Ergebnisses ausgegeben, aber der restliche Bereich wird korrekt bestimmt. Die dritte Funktion, die man an dieser Stelle ansprechen kann, ist die Funktion MINV(Bereich) mit deren Hilfe die, zu der im Bereich definierten Matrix zugehörige inverse Matrix bestimmt wird. Wie auch die Determinante kann die Inverse nur von einer quadratischen Matrix bestimmt werden, deren Determinante nicht 0 ist. Sollte eine dieser Bedingungen nicht erfüllt sein, so generiert die Formel einen Fehler. Auch bei der Funktion MINV(.) handelt es sich um eine Matrixformel, deren Outputbereich, in Bezug auf seine Größe, mit dem Inputbereich übereinstimmt.

Erklärungen Excel: Matrizen

Über den folgenden QR-Code gelangen Sie auf ein Video, das die zuvor dargestellten Operationen praktisch veranschaulicht.

1.2.5

Fakultäten und Binomialkoeffizienten

Benötigt man die Fakultät einer Zahl n!, so kann diese in Excel mittels der Funktion FAKULTÄT(Wert) berechnet werden. Hierbei ist zu beachten, dass der Inputwert immer ganzzahlig und positiv sein muss. Während Excel über nicht ganzzahlige Inputs hinwegsieht und stets abrundet, führt ein negativer Wert zu einer Fehlermeldung. Ausgehend von den Fakultäten kann der Binomialkoeffizient berechnet werden. Dies ist in Excel entweder indirekt über die Verwendung der Fakultätsfunktion möglich oder direkt mittels der Funktion KOMBINATIONEN(Wert 1; Wert 2). Hierbei gibt Wert 1 den   größeren Wert an und Wert 2 den kleineren. Betrachtet man nk , so stellt Wert 1 das n und Wert 2 das k dar.

34

1 Mathematische Grundlagen

1.3

Aufgaben

1.3.1

Rechenaufgaben

Aufgabe A 1-1: (44 Punkte Punkte) Zur Lösung L 1-1 Lösen Sie die folgenden Gleichungen nach der Variablen x auf: (a) (4 Punkte) 8 = 2 · 62x+1 (b) (4 Punkte) 2 exp(3x 2 − 1) = 1 √ (c) (4 Punkte) 4 1 + x 2 = 8 (d) (4 Punkte) 2x − 3 = x 2 (e) (4 Punkte) (f) (4 Punkte) (g) (4 Punkte) (h) (4 Punkte)

log(21−x ) = 3x 1−x 2 x +2x 1+x = 3 + x 1 =3 1−x 2 1√ =2 1−2 x 1 − x 3 = 2x 3 − 2

(i) (4 Punkte) √ (j) (4 Punkte) (1 − x)3 = 8 (k) (4 Punkte) exp(1 − x 3 ) = 1

Aufgabe A 1-2: (30 Punkte) Zur Lösung L 1-2 Berechnen Sie die folgenden Binomialkoeffizienten. (a) (3 Punkte) (b) (3 Punkte) (c) (3 Punkte) (d) (3 Punkte) (e) (3 Punkte) (f) (3 Punkte) (g) (3 Punkte) (h) (3 Punkte) (i) (3 Punkte) (j) (3 Punkte)

5 317 83 211 85 39 737 73 411 2  15 11

Aufgabe A 1-3: (20 Punkte) Zur Lösung L 1-3 Addieren Sie die folgenden Matrizen. 12 57 (a) (2 Punkte) + 34 73

1.3 Aufgaben

35

⎞ ⎞ ⎛ 25 13 ⎟ ⎟ ⎜ ⎜ (2 Punkte) ⎝ 5 4 ⎠ + ⎝ 7 1 ⎠ 53 72 ⎞ ⎞ ⎛ ⎛ 257 101 ⎟ ⎟ ⎜ ⎜ (2 Punkte) ⎝ 0 1 0 ⎠ + ⎝ 3 1 9 ⎠ 432 101 184 102 (2 Punkte) + 532 010 15 −2 5 (2 Punkte) − 67 3 6 −3 5 −5 1 (2 Punkte) − 1 −2 2 3 1 −1 −1 1 (2 Punkte) + −1 1 2 2 ⎛ ⎞ ⎛ ⎞ 1 2 1 7 ⎜ ⎟ ⎜ ⎟ (2 Punkte) ⎝ 0 −1 ⎠ + ⎝ 1 5 ⎠ −5 3 8 −2 58 11 (2 Punkte) − 23 21 ⎞ ⎛ ⎞ ⎛ 147 523 ⎟ ⎜ ⎟ ⎜ (2 Punkte) ⎝ 8 1 2 ⎠ + ⎝ 2 5 8 ⎠ 369 017 ⎛

(b)

(c)

(d) (e) (f) (g)

(h)

(i)

(j)

Aufgabe A 1-4: (40 Punkte) Zur Lösung L 1-4 Berechnen Sie die folgenden Matrixprodukte. 12 43 (a) (4 Punkte) · 34 21 ⎞ ⎛ 12 341 ⎟ ⎜ (b) (4 Punkte) ⎝ 5 2 ⎠ · 235 32 27 32 (c) (4 Punkte) · 34 73 ⎞ ⎛ 23 834 ⎟ ⎜ (d) (4 Punkte) · ⎝5 7⎠ 273 24

36

1 Mathematische Grundlagen



(e)

(f)

(g) (h)

(i)

(j)



32 (4 Punkte) · 73 ⎞ ⎛ 12 123 ⎟ ⎜ (4 Punkte) · ⎝3 4⎠ 456 56 52 36 (4 Punkte) · 43 40 20 03 (4 Punkte) · 05 20 ⎛ ⎞ 13 011 ⎟ ⎜ (4 Punkte) ⎝ 7 5 ⎠ · 101 28 ⎞ ⎞ ⎛ ⎛ 010 101 ⎟ ⎟ ⎜ ⎜ (4 Punkte) ⎝ 0 1 0 ⎠ · ⎝ 1 0 1 ⎠ 010 101 53 42

Aufgabe A 1-5: (39 Punkte) Zur Lösung L 1-5 Leiten Sie die folgenden Funktionen nach der Variablen x ab. (a) (3 Punkte) f (x) = 5 ln(x) − x 2 (b) (3 Punkte) f (x) = exp(−rx) (c) (3 Punkte) f (x) = x 3 − x 2 + 5x (d) (3 Punkte) f (x) = x 2 exp(x 2 ) (e) (3 Punkte) f (x) = (f) (3 Punkte) f (x) =

log(x) x x 2y

(g) (3 Punkte) f (x) = y x √ (h) (3 Punkte) f (x) = 3 x 3 − exp(x 3 ) (i) (3 Punkte) f (x) = 2x 4 + (j) (3 Punkte) f (x) = (k) (3 Punkte) f (x) = (l) (3 Punkte) f (x) = (m) (3 Punkte) f (x) =

1 1−x

1+x 1−x 1 1+x 2 1 exp(x)−x 2 x 1−x 2

Aufgabe A 1-6: (40 Punkte) Zur Lösung L 1-6 Berechnen Sie die folgenden bestimmten Integrale. 1 (a) (4 Punkte) 0 x exp(x)dx 2 √ (b) (4 Punkte) 0 3 x 3 dx

1.4 Lösungen

(c) (4 Punkte) (d) (4 Punkte) (e) (4 Punkte) (f) (4 Punkte) (g) (4 Punkte) (h) (4 Punkte) (i) (4 Punkte) (j) (4 Punkte)

1.3.2

37

0

−1 x

2

2

− exp(x)dx

2 2 1 (x − 1) − x dx 2 2 1 x ydx 3 x 0 3 − 2dx 1 4 0 3x − 2dx 1 1 0 2−x dx 1√ 1 − x 2 dx 0 1 0 exp(x − 3)

Excel Aufgaben

Aufgabe A 1-7: (Je 3 Punkte) Zur Lösung L 1-7 Nutzen Sie Excel-interne Formeln und Funktionen zur Lösung von Aufgabe A 1-1. Aufgabe A 1-8: (Je 2 Punkte) Zur Lösung L 1-8 Nutzen Sie Excel-interne Formeln und Funktionen zur Lösung von Aufgabe A 1-2. Aufgabe A 1-9: (Je 2 Punkte) Zur Lösung L 1-9 Nutzen Sie Excel-interne Formeln und Funktionen zur Lösung von Aufgabe A 1-3. Aufgabe A 1-10: (Je 4 Punkte) Zur Lösung L 1-10 Nutzen Sie Excel-interne Formeln und Funktionen zur Lösung von Aufgabe A 1-4.

1.4

Lösungen

1.4.1

Rechenaufgaben

Lösung L 1-1: (44 Punkte)

Zur Aufgabenstellung A 1-1

(a) (4 Punkte) 8 = 2 · 62x+1

|:2

4 = 62x+1

| ln(.)

ln(4) = (2x + 1) · ln(6) ln(4) − 1 = 2x ln(6) x=

ln(2) 1 − 3 · ln(6) 2

| : ln(6) − 1 |:2

38

1 Mathematische Grundlagen

(b) (4 Punkte) 2 · exp(3x 2 − 1) = 1 exp(3x 2 − 1) = 0,5 3x 2 − 1 = − ln(2) 1 − ln(2) 3  1 − ln(2) x=± 3

x2 =

|:2 | ln(.) |+1:3 √ | .

(c) (4 Punkte) 4·

 

1 + x2 = 8

|:4

1 + x2 = 2

|x 2

1 + x2 = 4

|−1

x2 = 3

√ x=± 3

√ | .

(d) (4 Punkte) (1 − x) log(2) log(21−x ) = 1−x 1−x = log(2) = 3x x=

|:3

log(2) 3

(e) (4 Punkte) x 2 + 2x =3+x 1+x

| · (1 + x)

x 2 + 2x = 3 + x + 3x + x 2 2x = −3 x = −1,5

|:2

1.4 Lösungen

39

(f) (4 Punkte) 1 =3 1 − x2

| · (1 − x 2 )

1 = 3 − 3x 2

| + 3x 2 − 1

2 = 3x 2

|:3

2/3 = x 2  x=±

√ | . 2 3

(g) (4 Punkte) 1 √ =2 1−2 x

√ 1=2−4 x √ 1=4 x √ 0,25 = x x=

√ | · (1 − 2 x) √ |−1+4 x |:4 |x 2

1 16

(h) (4 Punkte) 1 − x 3 = 2x 3 − 2

| + 2 + x3

3x 3 = 3

|:3

x3 = 1

√ |3.

x=1 (i) (4 Punkte) √ x)3 = 8 √ 1− x =2 √ −1 = x

(1 −

x=1

√ |3. |−2+ |x 2

√ x

40

1 Mathematische Grundlagen

(j) (4 Punkte) exp(1 − x 3 ) = 1

| ln(.)

1 − x3 = 0

| + x3 √ |3.

x3 = 1 x=1 Lösung L 1-2: (30 Punkte) (a) (3 Punkte) (b) (3 Punkte) (c) (3 Punkte) (d) (3 Punkte) (e) (3 Punkte) (f) (3 Punkte) (g) (3 Punkte) (h) (3 Punkte) (i) (3 Punkte) (j) (3 Punkte)

5

5! 4·5 3 = 3!2! = 2 = 10 17 17! 15·16·17 = 680 3 = 3!14! = 2·3 8 8! 7·8 2 = 2!6! = 2 = 28 11 11! 7·8·9·10·11 5 = 5!6! = 2·3·4·5 = 462 8 8! 6·7·8 3 = 3!5! = 2·3 = 56 9 9! 8·9 7 = 7!2! = 2 = 36 37 37! 35·36·37 = 7770 3 = 3!34! = 2·3 7 7! 5·6·7 4 = 4!3! = 2·3 = 35 11 11! 10·11 2 = 2!9! = 2 = 55 15 15! 12·13·14·15 = 1365 11 = 11!4! = 2·3·4

Lösung L 1-3: (20 Punkte)

(a)

(b)

(c)

(d) (e)

Zur Aufgabenstellung A 1-2





Zur Aufgabenstellung A 1-3

57 6 9 (2 Punkte) + = 73 10 7 ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ 3 8 25 13 ⎟ ⎟ ⎜ ⎟ ⎜ ⎜ (2 Punkte) ⎝ 5 4 ⎠ + ⎝ 7 1 ⎠ = ⎝ 12 5 ⎠ 12 5 53 72 ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ 358 257 101 ⎟ ⎟ ⎜ ⎟ ⎜ ⎜ (2 Punkte) ⎝ 0 1 0 ⎠ + ⎝ 3 1 9 ⎠ = ⎝ 3 2 9 ⎠ 533 432 101 184 102 286 (2 Punkte) + = 532 010 542 15 −2 5 30 (2 Punkte) − = 67 3 6 31 12 34

1.4 Lösungen

41



(f) (g)

(h)

(i)

(j)





−5 1 2 3

Lösung L 1-4: (40 Punkte)

(a)

(b)

(c)

(d)

(e)

(f)

(g) (h)





2 4 (2 Punkte) − = −1 −5 1 −1 −1 1 00 (2 Punkte) + = −1 1 2 2 31 ⎞ ⎞ ⎛ ⎛ ⎞ ⎛ 29 1 7 1 2 ⎟ ⎟ ⎜ ⎜ ⎟ ⎜ (2 Punkte) ⎝ 0 −1 ⎠ + ⎝ 1 5 ⎠ = ⎝ 1 4 ⎠ 31 8 −2 −5 3 58 11 47 (2 Punkte) − = 23 21 02 ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ 147 6 6 10 523 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ (2 Punkte) ⎝ 8 1 2 ⎠ + ⎝ 2 5 8 ⎠ = ⎝ 10 6 10 ⎠ 369 3 7 16 017 −3 5 1 −2



Zur Aufgabenstellung A 1-4



8 5 (4 Punkte) · = 20 13 ⎞ ⎞ ⎛ ⎛ 7 10 11 12 341 ⎟ ⎟ ⎜ ⎜ = ⎝ 19 26 15 ⎠ (4 Punkte) ⎝ 5 2 ⎠ · 235 13 18 13 32 27 32 55 25 (4 Punkte) · = 34 73 37 18 ⎛ ⎞ 23 834 39 61 ⎜ ⎟ (4 Punkte) · ⎝5 7⎠ = 273 45 67 24 32 36 19 53 = (4 Punkte) · 73 26 14 42 ⎞ ⎛ 12 22 28 123 ⎟ ⎜ (4 Punkte) · ⎝3 4⎠ = 49 64 456 56 52 36 23 30 (4 Punkte) · = 43 40 24 24 20 03 0 6 (4 Punkte) · = 05 20 10 0 12 34

43 21

42

1 Mathematische Grundlagen

⎞ ⎛ ⎞ 31 4 13 011 ⎟ ⎜ ⎟ ⎜ = ⎝ 5 7 12 ⎠ (i) (4 Punkte) ⎝ 7 5 ⎠ · 101 8 2 10 28 ⎞ ⎞ ⎛ ⎞ ⎛ ⎛ 020 010 101 ⎟ ⎟ ⎜ ⎟ ⎜ ⎜ (j) (4 Punkte) ⎝ 0 1 0 ⎠ · ⎝ 1 0 1 ⎠ = ⎝ 1 0 1 ⎠ 020 010 101 ⎛

Lösung L 1-5: (39 Punkte) (a) (3 Punkte) f  (x) =

Zur Aufgabenstellung A 1-5 =

(k) (3 Punkte) f  (x) =

df dx df dx df dx df dx df dx df dx df dx df dx df dx df dx df dx

(l) (3 Punkte) f  (x) =

df dx

=

2 (1−x)2 2x − (1+x 2 )2 exp(x)−2x − exp(x)−x 2

(m) (3 Punkte) f  (x) =

df dx

=

1 1−x 2

(b) (3 Punkte)

f  (x)

=

(c) (3 Punkte) f  (x) = (d) (3 Punkte) f  (x) = (e) (3 Punkte) f  (x) = (f) (3 Punkte) f  (x) = (g) (3 Punkte)

f  (x)

=

(h) (3 Punkte) f  (x) = (i) (3 Punkte) f  (x) = (j) (3 Punkte) f  (x) =

= 3x 2 − 2x + 5 = (2x + 2x 3 ) exp(x 2 ) = =

(d) (e) (f) (g)

1−log(x) x2 2yx 2y−1

= log(y)y x √ = 4,5 x − 3x 2 exp(x 3 ) = 8x 3 + = =

1 (1+x)2

Zur Aufgabenstellung A 1-6

1

 1 = x exp(x) − exp(x) 0 = 1 √ 2  1,2x 2,5 0 = 4,8 2 (4 Punkte)  0 0 = − 23 + (4 Punkte) −1 x 2 − exp(x)dx = x1 x 3 − exp(x) −1 2  2 (4 Punkte) 1 (x − 1)2 − x 2 dx = −x 2 + x 1 = −2  3 2 2 = 73 y (4 Punkte) 1 x 2 ydx = yx3 1 3  3 26 −6 (4 Punkte) 0 3x − 2dx = log(3)31 x −2x = log(3) 0 1 4   1 (4 Punkte) 0 3x − 2dx = 0,6x 5 − 2x 0 = −2,4

(a) (4 Punkte)

(c)

− 2x

= −r exp(−rx)

Lösung L 1-6: (40 Punkte)

(b)

5 x

0 x exp(x)dx 2 √ 3 0 3 x dx =

1 e

1.4 Lösungen

43

1

 1 = − log(2 − x) 0 = log(2) 1  1√ (i) (4 Punkte) 0 1 − x 2 dx = − 23 (1 − x)1,5 = 23 0 1  1 (j) (4 Punkte) 0 exp(x − 3)dx = exp(x − 3) 0 = exp(−2) − exp(−3)

(h) (4 Punkte)

1.4.2

1 0 2−x dx

Excel Aufgaben

Lösung L 1-7: (Je 3 Punkte) Zur Aufgabenstellung A 1-7 Zur Bearbeitung der Aufgaben kann die sogenannte Zielwertsuche verwendet werden. Im ersten Schritt wird eine Zelle ausgewählt, der der Name x gegeben wird. Diese Zelle kann einen beliebigen Startwert annehmen. Danach wird die zu lösende Gleichung derart umgeformt, dass auf einer Seite nur noch 0 steht. Die Zielwertsuche ruft man über den Menüpfad: Daten/Datentools/Was-wäre-wenn-Analyse/Zielwertsuche auf. Das Feld zur Zielzelle bekommt die Koordinaten der Zelle, die die zu lösende Gleichung enthält. Das Feld zum Zielwert enthält den Wert 0 und das Feld zu Veränderbare Zelle bekommt die Koordinaten der Zelle, die zuvor x genannt wurde. Die Zielwertsuche bestimmt sodann näherungsweise eine Lösung der Gleichung. Hierbei gilt es zu beachten, dass nur eine einzige Lösung bestimmt wird. Besitzt die Gleichung mehr als eine Lösung, wird dies nicht gesondert angezeigt und die Bestimmung der anderen Lösungen ist nur durch Ändern des Startwerts von x möglich. Lösung L 1-8: (Je 2 Punkte) Zur Aufgabenstellung A 1-8 Zur Bearbeitung der Aufgaben kann die Funktion =KOMBINATIONEN(n; k) verwendet werden. n bezeichnet hierbei den oberen Wert des Binomialkoeffizienten und k den unteren Wert. Die einzelnen Lösungen der Aufgaben können oben abgelesen werden. Lösung L 1-9: (Je 2 Punkte) Zur Aufgabenstellung A 1-9 Die beiden Matrizen können in Excel eingegeben werden und das Ergebnis erhält man, indem für alle Zellen der Ergebnismatrix eine entsprechende Addition oder Subtraktion vorgenommen wird. Zeit kann man hierbei sparen, indem die Auto-Ausfüllen-Funktion von Excel verwendet wird. Lösung L 1-10: (Je 4 Punkte) Zur Aufgabenstellung A 1-10 Zur Matrizenmultiplikation kann die Funktion =MMULT(Bereich linke Matrix; Bereich rechte Matrix) verwendet werden. Hierbei ist zu beachten, dass beide Matrizen bzw. die Bereiche der beiden Matrizen die Voraussetzung der Matrizenmultiplikation erfüllen; die Spaltenanzahl der linken Matrix muss der Zeilenanzahl der rechten Matrix entsprechen. Ferner ist zu beachten, dass es sich bei MMULT um eine Matrixformel handelt. Dies bedeutet, dass das Ergebnis der Formel selbst wieder eine Matrix ist. Zur Eingabe der Formel ist zunächst der Bereich auszuwählen, in den das Ergebnis geschrieben

44

1 Mathematische Grundlagen

werden soll. Danach ist in die Formelzeile die vollständige Formel einzugeben. Damit die Formel auf alle Felder angewendet wird, müssen die STRG- und die UmschaltTaste (Shift) gedrückt gehalten werden und erst dann darf mit Enter die Formel bestätigt werden.

1.5

Wiederholungsfragen

• Wie lauten die drei binomischen Formeln? • Wie berechnet man den Binomialkoeffizienten? • Wie arbeitet man mit Summenzeichen? Was sagen die Zahlen unter und über dem Summenzeichen aus? • Wie berechnet sich die erste Ableitung einer Funktion f (x)? Welche besonderen Regeln kennt man hierbei? • Wie lautet die Produkt- und wie die Kettenregel? • Wie berechnet man lokale Extrema einer Funktion f (x)? • Wie bestimmt man die Stammfunktion einer gegebenen Funktion f (x)? • Wie berechnet sich der Wert eines Integrals? • Was sagt die Regel der partiellen Integration aus und was die Substitutionsregel? • Welche Voraussetzungen müssen zwei Matrizen A und B erfüllen, damit man das Produkt A · B berechnen kann? • Wie wird eine Matrix invertiert und wann ist sie überhaupt invertierbar? • Wie löst man ein lineares Gleichungssystem? • Welche Operationen sind beim Lösen eines linearen Gleichungssystems zulässig?

2

Grundlagen Statistik

Inhalte • • • • • •

2.1

Charakteristika von Daten Skalenniveaus und mathematische Operationen Häufigkeiten Lagemaße Streuungsmaße Klassierte Daten

Theoretische Grundlagen

Eine Darstellung der Grundbegriffe der Statistik findet sich auch in dem folgenden Video:

Theorie: Statistische Grundbegriffe

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 J. K. Perret, Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler, https://doi.org/10.1007/978-3-658-26148-1_2

45

46

2.1.1

2 Grundlagen Statistik

Formen der Statistik

Versucht man das breite Feld der Statistik gemäß der zugrunde liegenden Absicht der Datenanalyse zu unterteilen, so existieren die folgenden drei Unterformen der Statistik: Explorative Statistik: Die explorative Statistik wird auch als Hypothesen generierende oder analytische Statistik bezeichnet. Ihr Ziel besteht darin zur Untersuchung des Datenmaterials neue Erkenntnisse zu generieren und Vermutungen/Hypothesen über die Natur der zugrunde liegenden Daten herzuleiten. Gerade in den letzten Jahren hat sich vermehrt der Begriff des Data Minings für die Methoden der explorativen Statistik durchgesetzt. Im Rahmen des vorliegenden Buchs werden Methoden der explorativen Statistik lediglich in den Kap. 8 und 9 angerissen. Deskriptive Statistik: Ihrem Namen folgend handelt es sich bei der deskriptiven Statistik um beschreibende Statistik. Eigenschaften des zugrunde liegenden Datensatzes sollen herausgearbeitet werden. Dies gelingt primär durch Untersuchung der Lage- und Streuungsmaße bzw. der zugrunde liegenden Verteilung. Entsprechend beschäftigen sich im vorliegenden Buch die Kap. 1, 3, 4, 5 und Teile von Kap. 7 mit Methoden der deskriptiven Statistik. Induktive Statistik: Die induktive Statistik wird im Gegensatz zur explorativen Statistik auch als Hypothesen-testende, schließende oder Inferenz-Statistik bezeichnet. Die Gültigkeit zuvor formulierter Hypothesen wird unter Vorgabe einer Fehlerwahrscheinlichkeit überprüft und entweder bestätigt oder widerlegt. Im Rahmen dieses Buchs beschäftigen sich die Kap. 6 und 7 mit Ansätzen der induktiven Statistik. Ebenso ist es möglich die Statistik hinsichtlich der Anzahl der betrachteten Variablen aufzuteilen: Univariate Statistik: Wird lediglich eine einzelne Variable betrachtet, so spricht man von univariater Statistik. Die zentralen Fragen hierbei liegen darin, wie diese Variable verteilt ist und was der zentrale, der mittlere Wert dieser Verteilung ist. Der nachfolgende Teil von Kap. 2 greift die Standardansätze der univariaten Statistik auf. Bivariate Statistik: Liegen zwei Variablen vor und die Fragen besteht darin, wie stark diese beiden Variablen zusammenhängen bzw. ob ihre gemeinsame Verteilung eine vom Zufall abweichende Verteilung aufweist, so spricht man auch von bivariater Statistik. In Kap. 7 werden die Standardansätze der bivariaten Statistik dargestellt. Multivariate Statistik: Erweitert man den Ansatz der bivariaten Statistik auf mehr als zwei Variablen, so gelangt man zur multivariaten Statistik, bei der mehr als zwei Variablen gleichzeitig betrachtet werden. Die Ansätze der multivariaten Statistik lassen sich noch weiter in dependenzanalytische und interdependenzanalytische Ansätze unterteilen. Dependenzanalytische Ansätze beschäftigen sich gemäß dem Namen mit Zusammenhängen und Abhängigkeiten der Variablen untereinander. Ein Ansatz hierzu findet sich zum Beispiel im späteren Kap. 7 in Form der multiplen linearen Regression. Bei interdependenzanalytischen Ansätzen steht die Struktur des Zusammenhangs im

2.1 Theoretische Grundlagen

47

Vordergrund. Auf diesen Teilbereich der Statistik wird im Rahmen dieses Buchs nicht eingegangen.

2.1.2

Quantitative und qualitative Daten

Daten können in quantitativer oder qualitativer Form vorliegen. Der zentrale Unterschied besteht darin, dass quantitative Daten durch Zahlen bzw. einer Menge an Zahlen repräsentiert werden können. Dies ist bei rein qualitativen Daten nicht der Fall. Es gibt allerdings auch qualitative Daten, die durch eine geeignete Codierung in quantitative Daten transformiert werden können. Diesen Prozess bezeichnet man auch als Quantifizierung der Daten. In einem weiteren Abschnitt wird der Unterschied zwischen den einzelnen Skalenniveaus herausgearbeitet. Vorausschauend lässt sich bereits feststellen, dass qualitative Daten, die quantifiziert wurden, zumeist lediglich nominal skaliert sind. Da alleine quantitative Daten mathematisch und damit statistisch ausgewertet werden können, werden wir uns im weiteren Verlauf nur auf quantitative oder quantifizierte qualitative Daten beziehen. Beispiel Größe, Gewicht, Einkommen und Temperatur sind quantitative Daten, die auch direkt statistisch ausgewertet werden können. Geschlecht ist eine qualitative Größe. Diese Größe kann quantifiziert werden, indem zum Beispiel eine Zuordnung (Kodierung) der folgenden Form vorgenommen wird: Weiblich = 1 und Männlich = 0 Im Gegensatz dazu ist eine Quantifizierung einer Wahlkampfrede höchstens in Ansätzen möglich.

2.1.3

Diskrete und stetige Größen

Als erste recht oberflächliche Definition von diskreten und stetigen Größen kann festgehalten werden, dass es sich immer dann um eine diskrete Größe handelt, wenn lediglich eine endliche Anzahl an möglichen Ausprägungen vorliegt. Dies ist zum Beispiel der Fall bei der Augenzahl, die mit einem Würfel erwürfelt werden kann. Im Gegensatz dazu besitzen stetige Größen eine unendlich große Anzahl an möglichen Ausprägungen. Dies führt häufig zu der falschen Annahme, dass eine Größe stetig ist, sobald sie eine unendliche Anzahl an Ausprägungen aufweist. Diese Annahme ist allerdings inkorrekt, da unter anderem eine Größe, die alle natürlichen Zahlen {1; 2; 3; 4; 5; . . .} annehmen kann, zwar eine unendliche Anzahl an Ausprägungen aufweist, allerdings diskret ist. Gemäß einer genaueren Definition ist eine Größe genau dann diskret, wenn alle Werte wohlunterscheidbar sind, und stetig, wenn dies nicht der Fall ist. In diesem Kontext

48

2 Grundlagen Statistik

ist Wohlunterscheidbarkeit unter anderem dann nicht gegeben, wenn es sich bei den Ausprägungen um einen Teilabschnitt, ein Intervall, der reellen Zahlen handelt. Beispiel Wie oben angemerkt, ist ein Würfel ein ideales Beispiel für eine diskrete Größe mit einer endlichen Anzahl an Ausprägungen. Das Monatseinkommen ist eine weitere diskrete Größe mit theoretisch unendlich vielen Ausprägungen. Sie ist diskret, da Einkommen höchstens auf den Cent genau ausgezahlt wird. Entsprechend besteht ein Unterschied von mindestens einem Cent zum nächsthöheren Einkommen. Die Temperatur ist ein Beispiel für eine theoretisch stetige Größe. Auch wenn man in vielen Fällen nur ganzzahlige Werte betrachtet, kann die Temperatur doch beliebig detailliert bestimmt werden, somit stellt die Temperatur einen Teilbereich der reellen Zahlen dar. Da die Einteilung beliebig detailliert erfolgen kann, kann an einer beliebigen Stelle nicht gesagt werden, was der nächstgrößere Wert ist.

2.1.4

Skalenniveaus

Die folgenden Tabellen fassen die unterschiedlichen Skalenniveaus zusammen und geben darüber hinaus für jedes Skalenniveau an, welche mathematischen Operationen möglich sind und welche grundlegenden statistischen Lage- und Streuungsmaße bestimmt werden können. Intervall- und verhältnisskalierte Größen bezeichnet man häufig auch als metrisch oder kardinalskaliert. Die Tab. 2.1, 2.2 und 2.3 fassen zusammen, welche Besonderheiten die einzelnen Skalen aufweisen, welche mathematischen Operationen jeweils möglich sind und entsprechend welche statistischen Kennzahlen bestimmt werden können. Tab. 2.1 Skalenniveaus – Definition

Tab. 2.2 Skalenniveaus – Mathematische Operationen

Skala Nominalskala Ordinalskala Intervallskala Ratio-/Verhältnisskala

Beschreibung Einzelne Ausprägungen Anordnung möglich Differenzen sind tats. Distanz Referenzpunkt/Nullpunkt liegt vor

Skala

Erlaubte Operationen

Nominalskala Ordinalskala Intervallskala Ratio-/Verhältnisskala

Häufigkeiten +Anordnung +Addition und Subtraktion +Multiplikation und Division

2.1 Theoretische Grundlagen

49

Tab. 2.3 Skalenniveaus – Statistische Kennzahlen Skala

Erlaubte Kennzahlen

Nominalskala Ordinalskala Intervallskala Ratio-/Verhältnisskala

Modus +Median, Spannbreite, Interquartilabstand +Mittelwert, Varianz, Variationskoeffizient +Geom. und Harm. Mittel

Beispiele Geschlecht ist eine archetypisch nominalskalierte Größe. Es kann zwar für eine Stichprobe bestimmt werden, wie viele Männer und wie viele Frauen vertreten sind, aber es kann keine Größer-Kleiner- bzw. Mehr-Weniger-Einteilung vorgenommen werden. Wärmeempfinden (heiß, lauwarm, kalt), Schönheitsempfinden (schön, mittelmäßig, hässlich) oder Einkommensklassen sind typische ordinalskalierte Größen. Es können sowohl Häufigkeiten bestimmt werden wie auch eine Anordnung; so ist lauwarm wärmer als kalt, aber es kann nicht festgestellt werden, ob der Abstand z. B. zwischen heiß und lauwarm ebenso groß ist wie der Abstand zwischen lauwarm und kalt bzw. die Abstände können nicht exakt beziffert werden. Jahreszahlen sind eine intervallskalierte Größe. Es ist möglich sie auf- und absteigend anzuordnen und es kann auch der Abstand zwischen zwei Datenpunkten beziffert werden; so beträgt der Abstand zwischen 2001 und 2017 16 Jahre. Es fehlt allerdings ein natürlicher Nullpunkt. Der Nullpunkt im Jahr 0 wurde arbiträr gesetzt, daher ist es nicht möglich in Verhältnissen zu sprechen. Jemand, der im Jahr 1000 geboren ist, ist nicht doppelt so alt wie jemand, der im Jahr 2000 geboren ist. In Verbindung zum letzten Beispiel kann das Alter in Jahren als archetypisch verhältnisskalierte Größe angesehen werden. Der Abstand zwischen zwei Alterswerten kann beziffert werden. Es ist allerdings auch möglich zu sagen, dass jemand mit 40 doppelt so alt ist wie jemand mit 20 Jahren. Dies ist möglich, da ein natürlicher Nullpunkt, ein Referenzwert, bei einem Alter von 0 Jahren vorliegt.

2.1.5

Häufbarkeit

Bei der Frage, ob eine Größe häufbar ist, handelt es sich nicht mehr darum, welche Werte eine Größe annehmen kann, sondern ob sie auch mehr als eine Ausprägung annehmen kann. Wird mit einem Würfel gewürfelt, so kann dieser zu jedem Zeitpunkt lediglich eine einzige Ausprägung aufweisen. Betrachtet man allerdings die Kurse, die ein Student in einem Semester besucht, so kann diese Größe mehr als eine Ausprägung auf einmal aufweisen. In diesem Fall handelt es sich um eine häufbare Größe.

50

2.1.6

2 Grundlagen Statistik

Häufigkeiten

Eine Videoaufbereitung von Teilen dieses Abschnitts findet sich hier:

Theorie: Häufigkeiten

2.1.6.1 Relative und kumulierte Häufigkeiten Sobald eine Größe mindestens nominal skaliert ist, ist es möglich, Häufigkeiten durch Abzählen des Vorkommens einer Ausprägung zu bestimmen. Die auf diese Weise bestimmten Häufigkeiten bezeichnet man auch als absolute Häufigkeiten. Werden die absoluten Häufigkeiten ai einer Ausprägung durch die Summe aller Beobachtungen geteilt, ergeben sich die jeweiligen relativen Häufigkeiten ri . Lediglich bei nicht häufbaren Größen stimmt die Summe aller Beobachtungen mit der Summe aller Ausprägungen überein. Bei häufbaren Größen kann eine Beobachtung mehr als eine Ausprägung aufweisen und somit ist die Summe aller Ausprägungen potenziell größer als die Summe aller Beobachtungen. Entsprechend ist auch nur für nicht häufbare Größen gesichert, dass die Summe der relativen Häufigkeiten 1 ergibt. Für häufbare Größen ergibt die Summe 1 oder einen größeren Wert. Werden die Ausprägungen geordnet notiert (z. B. gemäß der inhärenten Anordnung einer Ordinalskala), so kann für jeden nächsten Schritt bestimmt werden, welcher Anteil der gesamten Häufigkeit bereits in allen bisherigen Schritten erreicht wurde. Hierzu werden die aktuelle Häufigkeit und alle vorherigen Häufigkeiten addiert. Die hieraus entstehenden Häufigkeiten bezeichnet man auch als kumulierte Häufigkeiten ci . Beispiel Farbwahl

Abs. H.

Rel. H.

Kum. Abs. H.

Kum. Rel. H.

Rot Blau Grün Gelb Pink Summe

4 8 6 9 3 30

0,13 0,27 0,2 0,3 0,1 1

4 12 18 27 30

0,13 0,4 0,6 0,9 1,0

2.1 Theoretische Grundlagen

51

2.1.6.2 Kontingenztabellen Betrachtet man nicht länger die Häufigkeiten der Ausprägungen einer einzelnen Variablen, sondern die Kombination von Ausprägungen eines Paares von Variablen, so nutzt man zur Darstellung dieser Häufigkeiten eine Kontingenztabelle oft auch als Kreuztabelle bezeichnet. Hierbei werden die Ausprägungen der ersten Variablen in den Zeilen der Tabelle vermerkt und die Ausprägungen der zweiten Variablen entsprechend in den Spalten. Die einzelnen Zellen der Tabelle enthalten die Häufigkeiten der Ausprägungskombinationen. Hier können durch Kontingenztabellen absolute ebenso wie relative Häufigkeiten dargestellt werden. Bei den relativen Häufigkeiten nutzt man zumeist einen Bezug auf die Gesamtanzahl aller Beobachtungen. Beispiel

jung alt

weiblich

männlich

15 41

23 55

Da eine derartige Tabelle allerdings keine lineare Struktur aufweist, wird von der Bestimmung kumulierter Häufigkeiten, wie sie aus dem Fall einer einzelnen Variablen bekannt sind, abgesehen. Ersatzweise bedient man sich der sogenannten Randhäufigkeiten. Hierzu werden alle Häufigkeiten einer Zeile oder Spalte aufaddiert und jeweils als letzte Zeile oder Spalte präsentiert. Ausgehend von einer Kontingenztabelle werden über Zeilen(ni;. ) und Spaltensummen (n.;j ) – die Randhäufigkeiten – sowie die Gesamtsumme (n) bestimmt. Die folgende Kontingenztabelle fasst diese Begriffe zusammen:

y1 ... yk 

x1

...

xm



n1;1 ... nk;1 n.;1

...

n1;m ... nk;m n.;m

n1;. ... nk;. n

... ...

Beispiel

jung alt Summe

weiblich

männlich

Summe

15 41 56

23 55 78

38 96 134

52

2.1.7

2 Grundlagen Statistik

Lagemaße

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Lagemaße

2.1.7.1 Modus Der Modus xM ist die häufigste Ausprägung einer Datenreihe; das Merkmal, das am häufigsten genannt wird. Sollten mehrere Werte die gleiche Häufigkeit aufweisen, ist entweder die Rede davon, dass kein Modus bzw. kein eindeutiger Modus existiert, oder alternativ besteht der Modus aus allen Merkmalen mit dem häufigsten Vorkommen. Im Rahmen dieses Buchs findet die zweite Variante Verwendung. Beispiel Gegeben ist die Datenreihe: 1; 1; 3; 4; 5; 2; 3; 1; 2; 1; 1 Der Wert, der am häufigsten vorkommt, ist die 1. Daher ist der Modus in diesem Fall xM = 1.

2.1.7.2 Median Wie weiter oben angemerkt, erfordert der Median mindestens eine Ordinalskala, es muss möglich sein alle Werte auf- oder absteigend anzuordnen. Nutzt man diese Eigenschaft, um eine geordnete Liste aller Werte zu erstellen (x1 , . . . , xn ), ergibt sich der Median x0,5 aus der geordneten Liste in Abhängigkeit davon, wie viele Elemente die Liste umfasst. Ist die Anzahl der Elemente ungerade, so ergibt sich der Median durch den Wert, der sich genau in der Mitte der Datenreihe befindet. Die Anzahl der Werte, die kleiner als dieser Median sind, entspricht der Anzahl der Werte, die größer als der Median sind. Mathematisch kann man dies wie folgt beschreiben: x0,5 = x n+1 2

Ist die Anzahl der Elemente gerade, so kann die Datenreihe in zwei Teile zerlegt werden. Der Median ergibt sich dann als Mittelwert der beiden Werte, die sich in der Mitte der Datenreihe befinden. Mathematisch kann man dies wie folgt beschreiben:

2.1 Theoretische Grundlagen

53

x0,5 =

 1 x n2 + x n2 +1 2

Beispiel Betrachten wir zunächst die folgende bereits geordnete Datenreihe: 1; 1; 2; 2; 2; 3; 3; 4; 4 Die Datenreihe besitzt neun und damit eine ungerade Anzahl an Elementen. Der Wert in der Mitte ist x5 = 2. Damit ergibt sich der Median als x0,5 = 2. Im zweiten Beispiel erweitern wir die Datenreihe wie folgt: 1; 1; 2; 2; 2; 3; 3; 4; 4; 4 Die Datenreihe besitzt nun zehn und damit eine gerade Anzahl an Elementen. Die beiden Werte in der Mitte sind x5 = 2 und x6 = 3. Der Mittelwert der beiden Werte ergibt den Median und somit gilt x0,5 = 2,5.

2.1.7.3 Quartile, Quantile und Perzentile Soll die Idee hinter dem Median verallgemeinert werden, so besteht der nächste Schritt darin, zu fragen, für welchen Wert xα ein bestimmter Prozentsatz α der Beobachtungen kleiner als der gegebene Wert ist und 1 − α % der Beobachtungen größer als der gegebene Wert sind. Diesen bezeichnet man auch als α-Quantil oder α-Perzentil. In dieser Sprechweise handelt es sich bei dem Median um das 50 %-Quantil. Von besonderem Interesse sind im weiteren Kontext insbesondere die sogenannten Quartile, die die Beobachtungen in 25 %-Schritte aufteilen. Neben dem Median sind dies das erste Quartil x0,25 und das dritte Quartil x0,75 . Das vierte Quartil stimmt mit dem Maximum der Beobachtungen überein. 2.1.7.4 Mittelwert Der Mittelwert μ einer Datenreihe mit n Elementen ergibt sich durch Addition aller Elemente xi der Datenreihe, jeweils multipliziert mit ihrer Eintrittswahrscheinlichkeit pi . Meistens wird angenommen, dass diese für alle Merkmale gleich groß ausfällt und 1 n beträgt. Im Gegensatz zum Median muss die Datenreihe zunächst nicht angeordnet werden. Mathematisch lässt sich der Mittelwert wie folgt beschreiben: μ=

n

xi · pi

i=1

Im weiteren Verlauf ist neben dem Mittelwert auch die Rede vom sogenannten arithmetischen Mittel x. Der Unterschied zwischen dem Mittelwert und dem arithmetischen Mittel besteht darin, dass der Mittelwert ein theoretischer Wert ist, der sich nur auf die möglichen Ausprägungen und theoretischen Eintrittswahrscheinlichkeiten ebendieser bezieht, während sich das arithmetische Mittel stets auf eine Stichprobe bezieht. Vergleichend kann noch festgehalten werden, dass sowohl der Modus als auch der Median unempfindlich gegenüber Ausreißern (sehr große oder sehr kleine Werte) sind, der Mittelwert hingegen nicht.

54

2 Grundlagen Statistik

Beispiel Betrachtet man zur Veranschaulichung einen sechsseitigen Würfel, so kann dieser Würfel genau sechs Ausprägungen annehmen und jede Ausprägung hat eine Eintrittswahrscheinlichkeit von 16 . Bestimmt man den Mittelwert eines sechsseitigen Würfels, so ergibt sich dieser als: μ=1·

1 1 1 1 1 1 + 2 · + 3 · + 4 · + 5 · + 6 · = 3,5 6 6 6 6 6 6

Dieser Wert ist für jeden sechsseitigen Würfel gleich und ändert sich nicht, unabhängig davon, wie häufig mit dem Würfel gewürfelt wird. Im Gegensatz dazu kann mit einem Würfel im Rahmen einer Stichprobe beliebig oft gewürfelt werden. Entsprechend kann sich zum Beispiel die folgende Stichprobe nach zehn Würfen ergeben: 2; 3; 4; 1; 6; 6; 5; 2; 3; 4 Das arithmetische Mittel ergibt sich durch Addition aller Ergebnisse, dividiert durch die Anzahl der Elemente in der Stichprobe: x = (2 + 3 + 4 + 1 + 6 + 6 + 5 + 2 + 3 + 4)/10 = 3,6 Allgemein lässt sich das arithmetische Mittel bezogen auf eine Stichprobe mit den Elementen x1 , . . . , xn mathematisch wie folgt bestimmen: 1 xi n n

x=

i=1

Stimmt die Stichprobe mit der Grundgesamtheit überein, so spricht man auch von einer Voll- oder Totalerhebung. In diesem Fall wird eine leicht abweichende Schreibweise für das arithmetische Mittel verwendet: 1 xi n n

X=

i=1

An dieser Stelle lässt sich mit Bezug auf das sogenannte Gesetz der großen Zahlen festhalten, dass mit steigender Größe der Stichprobe das arithmetische Mittel sich dem theoretischen Mittelwert annähert. Dies ist eine Erkenntnis, die besonders bedeutsam wird, wenn man sich mit Methoden der induktiven Statistik beschäftigt, die auf das arithmetische Mittel Bezug nehmen. Dies ist zum Beispiel der Fall bei der Bestimmung von Konfidenzintervallen oder der linearen Regression. Die Ergebnisse hierbei werden qualitativ hochwertiger, umso größer n und damit die Anzahl der Elemente in der Stichprobe wird.

2.1 Theoretische Grundlagen

55

2.1.7.5 Gewichteter Mittelwert Bei der Berechnung des Mittelwerts bzw. des arithmetischen Mittels, wie im letzten Abschnitt dargestellt, wurde vorausgesetzt, dass jedes Merkmal die gleiche Eintrittswahrscheinlichkeit besitzt, n1 . Sollte dies nicht mehr der Fall sein, so kann anstelle des Mittelwerts ein gewichteter Mittelwert Verwendung finden. Hier wird jedem Ereignis xi die Eintrittswahrscheinlichkeit wi zugeordnet. Das Mittel ergibt sich entsprechend als: xw =

n

wi · xi mit

i=1

n

wi = 1

i=1

Anstelle der letzten Bedingung können auch beliebige Gewichte verwendet werden. In diesem Fall lautet das gewichtete Mittel:

n i=1 wi · xi xw =

n i=1 wi

2.1.7.6 Geometrisches Mittel Während die Bestimmung des arithmetischen Mittels für die meisten Zwecke genügt, ist es unbrauchbar, wenn mit relativen Änderungen gearbeitet wird, sprich mit Wachstumsraten und eine durchschnittliche Wachstumsrate bestimmt werden soll. Da hierbei mit relativen Werten gearbeitet wird, erfordert das geometrische Mittel mindestens eine verhältnisskalierte Größe. Dieser Unterschied zwischen dem arithmetischen Mittel und dem geometrischen Mittel wird auch daran deutlich, dass beim Mittelwert die einzelnen Werte aufaddiert werden und durch die Anzahl der Fälle geteilt wird, während beim geometrischen Mittel die einzelnen Werte aufmultipliziert werden und aus dem Ergebnis eine Wurzel gezogen wird. Mathematisch bestimmt sich das geometrische Mittel wie folgt:   n  xg =  (1 + xi ) − 1 n i=1

Das große  funktioniert ähnlich wie das Summenzeichen, nur dass hierbei alle Werte aufmultipliziert und nicht aufaddiert werden; daher wird dieses Zeichen auch als Produktzeichen bezeichnet. Auch für das geometrische Mittel lässt sich eine Fassung angeben, bei der die Eintrittwahrscheinlichkeiten unterschiedlich ausfallen; ein gewichtetes geometrisches Mittel mit

n i=1 wi = w:

56

2 Grundlagen Statistik

x g,w

  n  =  (1 + xi )wi − 1 w i=1

Beispiel Gegeben sind für drei Jahre die Wachstumsraten x1 = 0,04, x2 = 0,03 und x3 = 0,06. Das geometrische Mittel berechnet sich entsprechend wie folgt: xg =

 3

1,04 · 1,03 · 1,06 − 1 = 1,0433 − 1 = 0,0433

2.1.7.7 Harmonisches Mittel Betrachtet man anstelle von absoluten Werten oder relativen Werten in Form von Wachstumsraten relative Werte in Form von Verhältniszahlen (Quotienten), wie z. B. Geschwindigkeiten, so können weder das arithmetische noch geometrische Mittel dabei helfen, einen sinnvollen Mittelwert zu bestimmen, daher wird hier auf das harmonische Mittel zurückgegriffen. Mathematisch bestimmt sich dieses als: n x h = n

1 i1 xi

Neben dem normalen harmonischen Mittel, wie oben angegeben, existiert auch eine gewichtete Variante. Diese findet zum Beispiel Berücksichtigung bei Fragen in Bezug auf die durchschnittliche Geschwindigkeit, wenn die jeweils zurückgelegten Strecken unterschiedlich lang sind. Das gewichtete harmonische Mittel berechnet sich mathematisch wie folgt:

n wi x h = i=1 n wi i1 xi

Hier sind die wi die Gewichte bzw. die Anteile der jeweils zurückgelegten Strecke. Beispiel Angenommen ein Autofahrer fährt auf dem Weg zur Arbeit über drei Autobahnen. Auf der ersten Autobahn kann er 10 km mit einer Geschwindigkeit von 120 km/h zurücklegen. Auf der zweiten Autobahn kann er 15 km mit einer Geschwindigkeit von 130 km/h zurücklegen und auf der dritten Autobahn kann er 15 km mit einer Geschwindigkeit von 70 km/h zurücklegen. Die Gewichte sind somit w1 = 10 und w2 = w3 = 15 Die durchschnittliche Geschwindigkeit berechnet sich dann wie folgt: xh =

40 10 + 15 + 15 = = 96,85 10/120 + 15/130 + 15/70 0,413

2.1 Theoretische Grundlagen

2.1.8

57

Streuungsmaße

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Streuungsmaße

2.1.8.1 Spannbreite Die Spannbreite beschreibt die Breite (Größe) des Intervalls, aus dem eine Datenreihe Werte annimmt. Entsprechend bestimmt sich die Spannbreite als Differenz des maximalen und des minimalen Wertes der vorliegenden Datenreihe. Mathematisch kann dies wie folgt geschrieben werden: SB = max xi − min xi i

i

Die Spannbreite kann bereits auf ordinalskalierte Daten angewendet werden. Beispiel Gegeben sei die folgende Datenreihe: 1; 3; 5; 3; 5; 6; 2; 4; 6; 2 Der größte vorkommende Wert und damit das Maximum der Datenreihe ist 6, während das Minimum, der kleinste Wert, 1 ist. Die Spannbreite berechnet sich somit als SB = 6−1=5

2.1.8.2 Interquartilabstand Während die Spannbreite lediglich ein sehr krudes Maß für die Streuung darstellt, nutzt der Interquartilabstand die Eigenschaften der Quartile aus, um nicht nur ein Streuungsmaß für ordinalskalierte Größen bereitzustellen, sondern darüber hinaus auch eins, das im Gegensatz zur Spannbreite und auch zur noch folgenden Varianz unabhängig von dem Vorliegen von Ausreißern ist. Dabei unterscheidet sich der Interquartilabstand nur geringfügig von der Spannbreite. Es wird der Abstand zwischen dem ersten und dem dritten Quartil bestimmt oder mathematisch formuliert: I QA = x0,75 − x0,25

58

2 Grundlagen Statistik

Beispiel Gegeben sei die folgende Datenreihe: 1; 3; 5; 3; 5; 6; 2; 4; 6; 2 Wird die Datenreihe geordnet, so ergibt sich: 1; 2; 2; 3; 3; 4; 5; 5; 6; 6 Hieran können das erste und das dritte Quartil abgelesen werden. Aus x0,25 = 2 und x0,75 = 5 ergibt sich der Interquartilabstand als I QA = 5 − 2 = 3

2.1.8.3 Standardabweichung und Varianz Während die Spannbreite lediglich eine Information darüber liefert, in welchem Bereich Werte angenommen werden, besteht der Vorteil bei der Nutzung der Varianz σ 2 bzw. der Standardabweichung σ (Wurzel der Varianz) darin, dass hierbei die Verteilung der Werte im Vergleich zum Mittelwert mit in die Statistik eingeht. Liegen die meisten Werte nahe beim Mittelwert, so wird die Varianz wesentlich geringer ausfallen, als wenn sich die meisten Werte weit entfernt vom Mittelwert befänden. Bei der Spannbreite würden beide Verteilungen zur gleichen Spannbreite führen. Mathematisch bestimmt sich die theoretische Varianz als: 1 (xi − μ)2 n n

σ2 =

i=1

Wie auch beim Mittelwert bezieht sich die Varianz auf die theoretische Verteilung. Soll die Varianz für eine Stichprobe bestimmt werden, so ist zunächst danach zu unterscheiden, ob die Stichprobe eine Teilerhebung oder eine Vollerhebung darstellt. Im Kontext einer Vollerhebung kann die obige Formel für die theoretische Varianz auch für die Stichprobenvarianz s 2 verwendet werden; in diesem Fall ist der Mittelwert μ durch das arithmetische Mittel x zu ersetzen. Man spricht bei s 2 auch von der sogenannten korrigierten Varianz. Findet eine Teilerhebung statt, so ist statt obiger Formel die folgende Formel zu verwenden: 1 (xi − x)2 n−1 n

s2 =

i=1

Bei Varianten der Varianz kann auch der sogenannte Verschiebungssatz angewendet werden, um die Varianz bei Berechnung per Hand einfacher bestimmen zu können. Hier gilt für die Varianz: 1 2 xi − μ2 n n

σ2 =

i=1

2.1 Theoretische Grundlagen

59

Entsprechend ergibt sich für die korrigierte Varianz die Formel: n s = n−1 2



1 2 xi − x 2 n n



i=1

Die Standardabweichung σ und entsprechend die Stichprobenstandardabweichung s ergibt sich als Wurzel der Varianz bzw. der Stichprobenvarianz. Die Standardabweichung weist wie auch der Mittelwert die Einheit der Datenpunkte xi auf. Varianz und Standardabweichung können nur für mindestens intervallskalierte Größen bestimmt werden. Beispiel Für den sechsseitigen Würfel berechnet sich die theoretische Varianz als σ 2 = (2,52 + 1,52 + 0,52 + 0,52 + 1,52 + 2,52 )/6 = 2,92. Entsprechend ergibt sich die theoretische Standardabweichung als σ = 1,71 Betrachtet man eine Stichprobe, bei der viermal gewürfelt wurde, mit dem folgenden Ergebnis, 3; 5; 2; 6 so muss im ersten Schritt das arithmetische Mittel als x = 4 bestimmt werden. Dieses kann sodann verwendet werden, um die Stichprobenvarianz zu bestimmen s 2 = (12 + 12 + 22 + 22 )/3 = 3,33. Die Stichprobenstandardabweichung ergibt sich entsprechend als s = 1,83. Es zeigt sich an dem Beispiel, dass die Stichprobenstandardabweichung ähnlich zu der theoretischen Standardabweichung ist. Ähnlich zu dem Kommentar im Kontext des Mittelwerts kann unter Bezug auf das Gesetz der großen Zahlen festgehalten werden, dass mit ansteigender Fallzahl der Stichprobe sich nicht nur das arithmetische Mittel dem Mittelwert annähert, sondern sich auch die Stichprobenvarianz der theoretischen Varianz annähert.

2.1.8.4 Variationskoeffizient Während Varianz und Standardabweichung etwas über die Streuung innerhalb einer Variablen aussagen, so ist es doch zumeist unmöglich, die Streuung von zwei unterschiedlichen Variablen miteinander zu vergleichen. Da die Körpergröße auf einer anderen Skala gemessen wird als das Einkommen, kann nur mittels der Standardabweichung keine Aussage darüber getroffen werden, welche der beiden Größen stärker streut und somit heterogener ist. An dieser Stelle schafft der sogenannte Variationskoeffizient Abhilfe. Dieser bestimmt sich relativ simpel als Quotient aus Standardabweichung und Mittelwert. Die Division durch den Mittelwert sorgt nicht nur dafür, dass der Variationskoeffizient einheitslos und somit bezogen auf die Skalierung universell vergleichbar mit anderen Variationskoeffizienten ist. Durch die Division wird ferner auch dafür gesorgt, dass die Streuung normiert wird und somit ein standardisiertes Maß für die Streuung vorliegt, dass Variablen übergreifend vergleichbar macht.

60

2 Grundlagen Statistik

Formal definiert sich der Variationskoeffizient wie folgt: V =

s σ bzw. V = μ x

Da der Variationskoeffizient auf der Standardabweichung aufbaut, benötigt auch er mindestens eine metrische Variable und variiert je nachdem, ob die Standardabweichung sich auf eine Stichprobe oder die Grundgesamtheit oder auf die theoretische Standardabweichung bezieht. Beispiel Für den sechsseitigen Würfel beträgt der Mittelwert μ = 3,5 und die Standardabweichung σ = 1,71. Es ergibt sich somit ein Variationskoeffizient von V = 1,71/3,5 = 0,4886

2.1.9

Verteilungsmaße

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Verteilungsmaße

Die Varianz gibt lediglich Auskunft darüber, wie stark die Werte vom Mittelwert abweichen. Einen Schritt weiter gehen die Schiefe und die Kurtosis. Die Schiefe S gibt an, ob sich die Mehrheit der Werte links (rechtsschief, K > 0) oder rechts (linksschief, K < 0) vom Mittelwert befinden, also ob verhältnismäßig viele Werte klein oder groß sind. Die Kurtosis W , auch Wölbung genannt, gibt schließlich Auskunft darüber, inwieweit die Abweichungen vom Mittelwert gleichmäßig verteilt sind. Hierbei bezeichnet W > 3 eine spitze Verteilung (spitzer als die Normalverteilung/leptokurtisch), während W < 3 eine flachgipflige Verteilung (platykurtisch) beschreibt. Eine Verteilung mit einer Kurtosis von W = 3 bezeichnet man auch als mesokurtisch. Mathematisch berechnen sich die Schiefe und Kurtosis wie folgt. K=

 n  1 xi − x 3 n s i=1

2.1 Theoretische Grundlagen

61

W =

 n  1 xi − x 4 n s i=1

Wie auch bei der Varianz spielt es eine Rolle, ob sich Schiefe und Kurtosis auf die theoretische Verteilung bzw. eine Vollerhebung oder auf eine Stichprobe beziehen. Für 1 zu ersetzen. eine Stichprobe sind die Gewichte n1 in obigen Formeln durch n−1 Da bei der Kurtosis der Bezug zur Normalverteilung hergestellt wird, betrachtet man manchmal auch den sogenannten Exzess. Dieser ergibt sich als Kurtosis − 3. Entsprechend besitzt eine leptokurtische Verteilung einen Exzess größer als 0 und eine platykurtische Verteilung einen Exzess von kleiner als 0. Beispiel Betrachten wir das Würfelbeispiel aus dem vorhergehenden Abschnitt mit arithmetischem Mittel x = 4, so ergibt sich eine Schiefe von S = ((−1/1,83)3 + (1/1,83)3 + (−2/1,83)3 + (2/1,83)3 )/3 = 0 und eine Kurtosis von W = ((1/1,83)4 + (1/1,83)4 + (2/1,83)4 + (2/1,83)4 )/3 = (0,1783 + 2,8533)/3 = 1,0105. Dieses Ergebnis zeigt, dass die Verteilung weder links- noch rechtsschief ist. Die 0 kennzeichnet eine symmetrische Verteilung. Die Kurtosis von 1,0105 zeigt, dass die Verteilung sehr spitzgipflig ist.

2.1.10 Boxplots Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Boxplots

Boxplots sind grafische Hilfsmittel, um die Streuung einer Datenreihe zu erfassen. Wie Abb. 2.1 zusammenfassend darstellt, besteht der Boxplot aus der Box und den Antennen. Die untere Begrenzung der Box ergibt sich aus dem ersten Quartil und die obere Begrenzung durch das dritte Quartil. (Die Höhe der Box ergibt sich somit aus dem Interquartilabstand.) Der mittlere Strich im Boxplot ist durch den Median und somit das zweite Quartil gegeben. Bisweilen wird auch der Mittelwert eingezeichnet. Die beiden Antennen ergeben sich aus dem Minimum (unten) und dem Maximum (oben) der Datenreihe. Besitzt der Boxplot relativ lange Antennen, so ist dies ein Anzeichen für das Vorliegen von Ausreißern. Eine relativ dünne Box mit kurzen Antennen hingegen ist ein

62

2 Grundlagen Statistik 7 6 5 4

obere Antenne = Maximum der Datenreihe 3. Quartil

Median

3 2 1

1. Quartil

untere Antenne = Minimum der Datenreihe

0

Abb. 2.1 Struktur eines Boxplots

Anzeichen für eine sehr schwach streuende Datenreihe, bei der sich alle Werte nahe dem Mittelwert sammeln. Eine breite Box mit kurzen Antennen hingegen kann ein Anzeichen sein für ein Clustering weit vom Mittelwert entfernt. Dies bedeutet, dass sich in diesem Fall die Datenreihe verhältnismäßig gut in zwei Gruppen aufteilen lässt.

2.1.11 Klassierte Daten Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Klassierte Daten

2.1.11.1 Klassierung von Daten Gerade bei stetigen oder quasi-stetigen Merkmalen ist die Erstellung einer Häufigkeitstabelle und die damit einhergehende Bestimmung von relativen und relativen kumulierten Häufigkeiten nur wenig erkenntnissteigernd. In dieser Situation kann es helfen, wenn die zugrunde liegenden Daten in Klassen zusammengefasst werden. Im Rahmen dieses

2.1 Theoretische Grundlagen

63

Prozesses werden die absoluten und ebenso die relativen Häufigkeiten aller Merkmale aufaddiert, die größer sind als die Klassenuntergrenze ui−1 und kleiner als die Klassenobergrenze ui . Wie der Fall geregelt wird, wenn ein Merkmal mit einer Klassengrenze übereinstimmt, hängt davon ab, ob es sich um eine inklusive Grenze [ oder ] handelt oder um eine exklusive Grenze ( oder ). Im ersten Fall ist das Merkmal Teil der Klasse, im zweiten Fall nicht. In unterschiedlichen Kontexten wird auch auf dem Klassenmittelwert mi Bezug genommen. Dieser ergibt sich als Mittelwert der Klassenuntergrenze und der Klassenobergrenze. Beispiel Gegeben ist die folgende Häufigkeitstabelle: Wert

Abs. Häufigkeit

1 2 3 4 5 6

12 3 4 7 2 6

Diese kann zum Beispiel wie folgt klassiert werden: Klasse

Abs. Häufigkeit

[1; 4) [4; 6]

19 15

2.1.11.2 Modus In Analogie zum Modus bei nicht klassierten Daten, bestimmt sich der Modus aus der Klasse, die die größte Häufigkeit aufweist. Diese Klasse bildet die sogenannte Modusklasse. Hierbei ist zu beachten, dass die Häufigkeit, die bei klassierten Daten betrachtet wird, nicht die absolute, sondern die relative Häufigkeit ist. Zur Bestimmung der relativen Häufigkeit einer Klasse wird die absolute Häufigkeit der Klasse durch die Klassenbreite geteilt. Der Modus selbst bestimmt sich letzten Endes als mittlerer Wert der Modusklasse, also als Mittelwert von Ober- und Untergrenze der Modusklasse.

64

2 Grundlagen Statistik

2.1.11.3 Median Um den Median im Kontext von klassierten Daten zu bestimmen, ist zunächst die sogenannte Medianklasse zu bestimmen. Die Medianklasse ist diejenige Klasse, die als erstes eine kumulierte Häufigkeit (Fi ) von mehr als 50 % aufweist. Für diese Medianklasse sind sowohl ihre untere (xi−1 ) als auch ihre obere (xi ) Grenze zu bestimmen. Ferner ist es notwendig zu wissen, wie groß die kumulierte Häufigkeit derjenigen Klasse ist, die direkt vor der Medianklasse liegt (Fi−1 ). Der Median berechnet sich sodann über die folgende Formel: x0,5 = xi−1 +

0,5 − Fi−1 (xi − xi−1 ) Fi − Fi−1

Man kann sich diese Berechnung so vorstellen, dass zu dem Beginn der Medianklasse noch ein Wert dazu addiert wird, der davon abhängt, wie weit die 50 % der kumulierten Häufigkeit von dem Beginn der Medianklasse entfernt ist. Hierzu wird die Breite der Medianklasse (xi − xi−1 ) multipliziert mit dem absoluten Wert, bezogen darauf, wie weit die Medianklasse bei ihrem Beginn von den 50 % bzw. von 0,5 entfernt war (0,5 − Fi−1 ) geteilt durch die relative Häufigkeit der Medianklasse (ihre Breite). Dieser letzte Bruch 0,5−Fi−1 Fi −Fi−1 gibt somit an, welcher Anteil der Medianklasse vor dem Medianwert liegt. Da dieser Bruch mit der Breite der Medianklasse multipliziert wird, wird der relative Anteil in einen absoluten Anteil umgerechnet. Beispiel Gegeben ist die folgende klassierte Datenreihe: Klasse

Abs. Häufigkeiten

Kum. rel. Häufigkeiten

[0; 1) [1; 2) [2; 4) [4; 5) [5; 9) Summe

4 5 5 4 2 20

0,20 0,45 0,70 0,90 1,00

An den kumulierten relativen Häufigkeiten sieht man, dass die Medianklasse durch die Klasse [2; 4) gegeben ist. Die Klassengrenzen sind xi−1 = 2 und xi = 4 und die kumulierte relative Häufigkeit der Medianklasse beträgt Fi = 0,7, während die kumulierte relative Häufigkeit der Vorgängerklasse Fi−1 = 0,45 beträgt. Entsprechend berechnet sich der Median wie folgt: x0,5 = 2 +

0,5 − 0,45 (4 − 2) = 2 + 0,2 · 2 = 2,4 0,7 − 0,45

2.2 Realisierung in Excel

65

2.1.11.4 Perzentile In Analogie zu unklassierten Daten können auch für klassierte Daten Perzentile und Quartile bestimmt werden. Das Vorgehen ist demjenigen der Bestimmung des Medians dabei nicht unähnlich. So ist zunächst die Perzentilklasse zu bestimmen, diejenige Klasse, deren kumulierte Wahrscheinlichkeit zum ersten Mal den Perzentilwert α überschreitet. Bleibt man bei der gleichen Notation wie beim Median, so ergibt sich das α-Perzentil als: xα = xi−1 +

α − Fi−1 (xi − xi−1 ) Fi − Fi−1

2.1.11.5 Mittelwert Den Mittelwert bzw. das arithmetische Mittel bei klassierten Daten zu bestimmen, ist nur unwesentlich schwieriger als bei nichtklassierten Daten. Für jede Klasse wird die Klassenmitte als Mittelwert der unteren (xi ) und oberen (xi+1 ) Grenze bestimmt. Diese Klassenmitten werden mit den relativen Häufigkeiten der jeweiligen Klasse (ri ) multipliziert und aufaddiert. Das Ergebnis gibt den Mittelwert. Mathematisch definiert sich der Mittelwert bzw. das arithmetische Mittel hierbei entsprechend als: x=

n (xi+1 − xi ) · ri i=1

Beispiel Geht man von der gleichen Häufigkeitentabelle aus wie im Beispiel zum Median, so bestimmt sich das arithmetische Mittel für diese Datentabelle wie folgt: x = 0,5 · 0,2 + 1,5 · 0,25 + 3 · 0,25 + 4,5 · 0,2 + 7 · 0,1 = 0,1 + 0,375 + 0,75 + 0,9 + 0,7 = 2,825

2.2

Realisierung in Excel

2.2.1

Häufigkeiten

Soll ausgehend von einer Datenreihe eine Häufigkeitstabelle erstellt werden, kann dies in Excel einfach über die Funktion HÄUFIGKEIT(Bereich 1, Bereich 2) realisiert werden. Hierbei enthält Bereich 1 die Datenreihe, die zusammengefasst werden soll. Bereich 2 enthält die Werte, für die die Häufigkeiten berechnet werden sollen. Wird die Funktion verwendet, um Daten zu klassieren, so enthält Bereich 2 die Obergrenzen der Klassen, in die die Daten geordnet werden sollen.

66

2 Grundlagen Statistik

Während es keine Anforderungen an die zwei Bereiche gibt, ist zu beachten, dass es sich bei der Funktion um eine Matrixformel handelt. Die Größe des Outputbereichs entspricht der Größe von Bereich 2.

Erklärungen Excel: Häufigkeiten

2.2.2

Maximum, Minimum und Spannbreite

Sollen Maximum oder Minimum einer Datenreihe bestimmt werden, so bietet Excel hierfür die Funktionen MAX(Bereich) und MIN(Bereich) an. Der Vorteil an beiden Funktionen ist, dass Zellen, die keine Zahlwerte enthalten, ausgeblendet werden. Soll mithilfe von Excel die Spannbreite einer Datenreihe berechnet werden, so kann dies mittels der Formel = MAX(Bereich) – MIN(Bereich) realisiert werden.

2.2.3

Lagemaße

Die drei klassischen Lagemaße lassen sich in Excel über die entsprechenden Funktionen MODUS(Bereich), MEDIAN(Bereich) bzw. MITTELWERT(Bereich) berechnen. Während der Modus theoretisch auch auf Daten angewendet werden kann, die keinen Zahlwert darstellen, ist er in Excel derart implementiert, dass er nur Zahlwerte auswertet. Zellen, die keine Zahlwerte enthalten, werden, wie auch beim Median und dem Mittelwert, ausgeblendet. Allen drei Funktionen ist ebenfalls gemein, dass leere Zellen ausgeblendet werden und sich gerade beim Mittelwert nicht auf die Berechnung auswirken.

Erklärungen Excel: Median, Quantile und Boxplots

2.2 Realisierung in Excel

2.2.4

67

Streuungs- und Verteilungsmaße

Bei den Streuungsmaßen ist zunächst zu unterscheiden, ob sich die Datenreihe, die ausgewertet wird, aus einer Grundgesamtheit oder aus einer Stichprobe ergibt. Für Datenreihen, die auf einer Grundgesamtheit basieren, finden die Funktionen STDABW.N(Wert), VARIANZ.P(Wert) und SCHIEFE.P(Wert) Anwendung, während es bei Datenreihen, die sich aus einer Stichprobe ergeben, die Funktionen STDABW.S(Wert), VARIANZ.S(Wert), SCHIEFE.S(Wert) und KURT(Wert) sind. Die Standardabweichung kann sowohl über die Funktionen STDABW.P(Wert) bzw. STDABW.S(Wert) als auch über die WURZEL(Wert) der beiden Varianzfunktionen berechnet werden. Beiden Funktionen, wie auch der Schiefe (SCHIEFE.P(Wert)/SCHIEFE.S(Wert)) und der Kurtosis (KURT(Wert)), ist gemein, dass sie wie auch die Lagemaße sowohl leere Zellen als auch Zellen ohne Zahlwerte ausblenden und die Berechnungen entsprechend nicht verzerrt werden. Zur Kurtosisfunktion in Excelversionen ab 2016 ist anzumerken, dass diese nicht die Kurtosis, sondern den Exzess berechnet. Dieser ergibt sich als Kurtosis −3. Ältere Versionen von Excel bieten darüber hinaus auch eine auf der Grundgesamtheit basierte Variante der Kurtosis an und unterscheiden die beiden Varianten analog zur Schiefe über die Endungen .P und .S.

Erklärungen Excel: Varianz und Standardabweichung

Erklärungen Excel: Verteilungsmaße

2.2.5

Zusätzliche Mittelwerte

Auch das geometrische und das harmonische Mittel können mithilfe von Excel direkt berechnet werden. Hierzu finden für das geometrische Mittel die Funktion GEOMITTEL(Bereich) und für das harmonische Mittel die Funktion HARMITTEL(Bereich)

68

2 Grundlagen Statistik

Anwendung, wobei die Bereiche jeweils die auszuwertenden Datenreihen enthalten. Beide Funktionen blenden leere Zellen und Zellen, die keine Zahlwerte enthalten, aus.

Erklärungen Excel: Mittelwerte

2.3

Aufgaben

Quick Check – Wahr oder Falsch?

Zur Lösung

• Die Intervallskala stellt stärkere Anforderungen an eine Zufallsvariable als die Ordinalskala. • Häufbare Variablen müssen notwendigerweise diskret sein. • Multiplikation erfordert eine Ratioskala. • Kardinalskala ist ein anderer Begriff für eine metrische Skala. • Jede Variable kann zu einer diskreten Variablen umgeformt werden. • Eine nominal skalierte Variable ist immer diskret. • Diskrete Variablen sind immer häufbar. • Eine Intervallskala erlaubt die Addition der Variablen. • Kardinalskalierte Variablen können quadriert werden. • Diskrete Variablen nehmen nur ganzzahlige Werte an. • Der Median ist immer kleiner als der Mittelwert. • Die Varianz ist die quadrierte Abweichung vom Mittelwert. • Der Median kann mit der größten oder der kleinsten Ausprägung einer Zufallsvariablen übereinstimmen. • Modus, Median und Mittelwert können nie den gleichen Wert annehmen. • Die Varianz bestimmt sich anders, wenn sie sich auf den Mittelwert bezieht, als wenn sie sich auf das arithmetische Mittel bezieht. • Der Modus ist immer ganzzahlig. • Der Median erfordert mindestens intervallskalierte Daten. • Die Spannbreite ist ein Vielfaches der Standardabweichung. • Es ist möglich, dass Mittelwert und Varianz übereinstimmen. • Das Minimum ist immer kleiner als das Maximum.

2.3 Aufgaben

2.3.1

69

Statistik Grundlagen

Aufgabe A 2-1: (25 Punkte) Zur Lösung L 2-1 Welche der folgenden Variablen sind diskret, welche stetig? (a) (b) (c) (d) (e) (f) (g) (h) (i) (j) (k) (l) (m) (n) (o) (p) (q) (r) (s) (t) (u) (v) (w) (x) (y)

(1 Punkt) Wassertemperatur (1 Punkt) Bleistifte pro Karton (1 Punkt) Softwareversionen (1 Punkt) Zeit bis zu einer Deadline (1 Punkt) Telefonnummern (1 Punkt) Geld auf dem Girokonto (1 Punkt) Luftfeuchtigkeit (1 Punkt) Textseiten in einem Buch (1 Punkt) Tankfüllung im Auto (1 Punkt) Gewicht von Kaffeetassen (1 Punkt) Atome in 1 l Wasser (1 Punkt) Länge einer Ländergrenze (1 Punkt) Sand am Meer (1 Punkt) Produktionskosten in e (1 Punkt) Wechselkurse Euro in US Dollar (1 Punkt) Gummibärchen pro Packung (1 Punkt) Menge Tee in einer Tasse (1 Punkt) Anzahl der Studenten an der ISM (1 Punkt) Abschlussnote des Studiums (1 Punkt) Dauer eines Kinofilms (1 Punkt) Ladezeit eines Akkus (1 Punkt) Geld auf dem Girokonto (1 Punkt) Anzahl der Urlaubstage im Jahr (1 Punkt) Gewicht einer Tafel Schokolade (1 Punkt) Uhrzeit

Aufgabe A 2-2: (9 Punkte) Zur Lösung L 2-2 Entscheiden Sie, ob es sich bei den folgenden Untersuchungen um eine deskriptive oder eine induktive Untersuchung handelt. (a) (b) (c) (d) (e) (f) (g)

(1 Punkt) Erhebung des Anteils der Fernsehzuschauer in den einzelnen Altersgruppen. (1 Punkt) Testen, ob Jüngere eher zur Primetime fernsehen. (1 Punkt) Relevanz von Einflussfaktoren auf den Erfolg einer Spin-off-Serie. (1 Punkt) Welche Kundentypen kaufen vormittags im Supermarkt ein? (1 Punkt) Frauen konsumieren signifikant mehr Bioprodukte als Männer. (1 Punkt) Pflanzen wachsen besser wenn man der Erde Kaffeesatz beimischt. (1 Punkt) Welche Internetseiten rufen Studenten relativ häufig auf?

70

2 Grundlagen Statistik

(h) (1 Punkt) Die drei Produkte mit den höchsten Verkaufszahlen bestimmen. (i) (1 Punkt) Wie reagieren Kunden auf die Lautstärke der Musik in Geschäften? Aufgabe A 2-3: (21 Punkte) Zur Lösung L 2-3 Welche der folgenden Daten sind quantitativer, welche qualitativer Natur? (a) (b) (c) (d) (e) (f) (g) (h) (i) (j) (k) (l) (m) (n) (o) (p) (q) (r) (s) (t) (u)

(1 Punkt) Buchtitel (1 Punkt) Postleitzahlen (1 Punkt) Kreditrate (1 Punkt) Zinssatz (1 Punkt) Temperatur (1 Punkt) Seitenzahlen eines Buchs (1 Punkt) Geburtstag (1 Punkt) Abendkleider (1 Punkt) Schuhgrößen (1 Punkt) Restakkulaufzeit (1 Punkt) Corporate-Design-Farbschema (1 Punkt) Speicherplatz auf USB-Stick (1 Punkt) Sand am Meer (1 Punkt) Geschmack einer Limonade (1 Punkt) Filmbewertung (1 Punkt) Autokennzeichen (1 Punkt) Lieblingsfarbe (1 Punkt) Schnitt einer Hose (1 Punkt) Handynummer (1 Punkt) Aktuelles Wetter (1 Punkt) Einkommen

Aufgabe A 2-4: (22 Punkte) Zur Lösung L 2-4 Bei welchen der folgenden Merkmale handelt es sich um häufbare Merkmale? (a) (b) (c) (d) (e) (f) (g) (h) (i) (j)

(1 Punkt) Handymarke (1 Punkt) Telefonnummer (1 Punkt) Einkommen (1 Punkt) Klausurnote (1 Punkt) Lieblingsbuch (1 Punkt) Gesehene Fernsehserie (1 Punkt) Studiengang (1 Punkt) Temperatur (1 Punkt) Autofarbe (1 Punkt) Füllmenge einer Tasse

2.3 Aufgaben

(k) (l) (m) (n) (o) (p) (q) (r) (s) (t) (u) (v)

(1 Punkt) Antwort auf eine E-Mail (1 Punkt) Ausgeliehene Bücher (1 Punkt) Büro (1 Punkt) Kleidergröße (1 Punkt) Freunde (1 Punkt) Ehepartner (nach deutschem Recht) (1 Punkt) Nummer des Reisepasses (1 Punkt) Nachname (1 Punkt) Art des Universitätsabschlusses (1 Punkt) Handynummer (1 Punkt) Geburtsort (1 Punkt) Wohnort

Aufgabe A 2-5: (25 Punkte) Zur Lösung L 2-5 Ordnen Sie den folgenden Merkmalen die Skala zu, auf der sie gemessen werden. (a) (b) (c) (d) (e) (f) (g) (h) (i) (j) (k) (l) (m) (n) (o) (p) (q) (r) (s) (t) (u) (v) (w) (x) (y)

(1 Punkt) Handytyp (1 Punkt) Microsoft Office Version (1 Punkt) Akkuladung eines Laptops (1 Punkt) Verwandtschaftsgrad bei Lebewesen (1 Punkt) Erreichte Punkte in einer Klausur (1 Punkt) Bewertung eines Films auf IMDB (1 Punkt) Speicherplatz eines USB-Sticks (1 Punkt) Modelle von USB-Sticks (1 Punkt) Einkommen aus selbstständiger Arbeit (1 Punkt) Uhrzeit (1 Punkt) Geschwindigkeit (1 Punkt) Anzahl erhaltener Strafzettel (1 Punkt) Bekannte Automarken (1 Punkt) Nachhaltigkeit von Lebensmitteln (1 Punkt) Dauer, die ein Radiosender gehört wird (1 Punkt) Gewicht in Tonnen (1 Punkt) Konfektionsgrößen (1 Punkt) Seitenlänge einer Zeitung (1 Punkt) Windows-Versionen (1 Punkt) Studiengänge an der Hochschule (1 Punkt) Richterskala für die Stärke von Erdbeben (1 Punkt) Intelligenzquotient (1 Punkt) Modedesigner (1 Punkt) Speicherplatz auf einer Festplatte (1 Punkt) Zeichen auf einer Buchseite

71

72

2.3.2

2 Grundlagen Statistik

Lage- und Streuungsparameter

Aufgabe A 2-6: (60 Punkte) Zur Lösung L 2-6 Ordnen Sie die folgenden Datenreihen aufsteigend an und fassen Sie sie in einer Häufigkeitstabelle zusammen. Bestimmen Sie jeweils auch die relativen und die relativen kumulierten Häufigkeiten. (a) (6 Punkte) 7

7

5

3

1

3

9

10

9

9

2

1

1

3

2

4

3

6

2

3

4

8

1

2

4

3

1 1

1 2

7

10

8

2

2

9

1

2

1

2

5

2

6

3

1

5

4

5

4

3

3

4

7

6

3

1

3

3

1

4

2

3

1

4

1 1

2 2

3 3

3 3

1 1

2 1

3 2

3 2

(b) (6 Punkte)

(c) (6 Punkte)

(d) (6 Punkte)

(e) (6 Punkte)

(f) (6 Punkte)

(g) (6 Punkte)

2.3 Aufgaben

73

(h) (6 Punkte) 5 3

6 2

6 1

7 6

6 6

1 5

6 3

7 2

3

3

5 4

6 3

7 2

1 3

2 6

8 4

4 5

6 7

5 2

3 3

1 4

2 2

3 1

6 3

5 1

4 1

2 3

3 5

5 5

6

(i) (6 Punkte)

(j) (6 Punkte)

Aufgabe A 2-7: (17 Punkte) Zur Lösung L 2-7 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 5

6

6

6

2

1

2

4

4

2

2

5

1

6

4

2

1

6

5

3

Aufgabe A 2-8: (17 Punkte) Zur Lösung L 2-8 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 4 8

11 10

3 11

6 11

12 13

6 7

12 4

3 10

25 3

3 6

Aufgabe A 2-9: (17 Punkte) Zur Lösung L 2-9 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 8

2

11

7

18

28

2

6

25

14

74

2 Grundlagen Statistik

Aufgabe A 2-10: (17 Punkte) Zur Lösung L 2-10 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 12

65

9

2

9

2

5

51

5

17

Aufgabe A 2-11: (17 Punkte) Zur Lösung L 2-11 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 46

5

13

6

4

7

16

21

11

4

Aufgabe A 2-12: (17 Punkte) Zur Lösung L 2-12 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 15

4

5

5

12

3

5

16

2

11

Aufgabe A 2-13: (17 Punkte) Zur Lösung L 2-13 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 3

3

11

2

5

9

4

8

16

14

Aufgabe A 2-14: (17 Punkte) Zur Lösung L 2-14 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 7

3

5

3

33

25

7

10

25

9

2.3 Aufgaben

75

Aufgabe A 2-15: (17 Punkte) Zur Lösung L 2-15 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 8

2

28

8

3

25

24

1

29

30

Aufgabe A 2-16: (17 Punkte) Zur Lösung L 2-16 Bestimmen Sie ausgehend von der folgenden Datenreihe den Modus, die ersten drei Quartile, das arithmetische Mittel, die Spannbreite sowie die Standardabweichung und die Varianz. Skizzieren Sie den zugehörigen Boxplot. 35

29

33

30

31

31

22

19

25

21

Aufgabe A 2-17: (2 Punkte) Zur Lösung L 2-17 Eine Finanzanlage erzielt die folgenden Renditen: 0,03

−0,02

0,085

0,10

0,055

−0,015

0,02

0,035

Bestimmen Sie unter Zuhilfenahme des geometrischen Mittels die durchschnittlich erzielte Rendite. Aufgabe A 2-18: (2 Punkte) Zur Lösung L 2-18 Das Wirtschaftswachstum in Deutschland lag in den letzten Jahren wie folgt: 0,005

0,02

0,015

0,03

0,025

0,02

0,015

−0,01

Nutzen Sie das geometrische Mittel, um das durchschnittliche Wachstum zu ermitteln. Aufgabe A 2-19: (2 Punkte) Zur Lösung L 2-19 Die Arbeitslosenquote in Deutschland wies in den letzten Jahren die folgenden Werte auf: 0,05

0,062

0,071

0,069

0,065

0,064

0,057

0,061

Nutzen Sie das geometrische Mittel, um das durchschnittliche Wachstum zu ermitteln.

76

2 Grundlagen Statistik

Aufgabe A 2-20: (2 Punkte) Zur Lösung L 2-20 Ein mittelständisches Unternehmens wies in den letzten Jahren die folgenden Kennzahlen das Unternehmenswachstum betreffend auf: 0,42

0,83

0,13

0,57

0,28

0,15

0,17

0,09

Nutzen Sie das geometrische Mittel, um die durchschnittliche Wachstumsrate zu ermitteln. Aufgabe A 2-21: (2 Punkte) Zur Lösung L 2-21 Der Absatz eines Unternehmens veränderte sich in den letzten Jahren mit den folgenden Raten: 0,05

0,08

0,07

0,06

0,03

−0,01

−0,02

0,02

Nutzen Sie das geometrische Mittel, um die durchschnittliche Änderungsrate des Absatzes zu bestimmen. Aufgabe A 2-22: (2 Punkte) Zur Lösung L 2-22 Die Lohnquote in Deutschland betrug drei Jahre lang 0,65, danach für zwei Jahre 0,63 und die letzten fünf Jahre 0,69. Bestimmen Sie mittels des harmonischen Mittels die durchschnittliche Lohnquote. Aufgabe A 2-23: (2 Punkte) Zur Lösung L 2-23 Ein Akkordarbeiter schafft in den ersten 3 Stunden 1100 Stück pro Stunde, dann für 5 Stunden jeweils 1000 Stück pro Stunde, für 2 Stunden jeweils 900 pro Stunde und schließlich 6 Stunden lang jeweils 1200 Stück pro Stunde. Bestimmen Sie seine durchschnittliche Produktivität mithilfe des harmonischen Mittels. Aufgabe A 2-24: (2 Punkte) Zur Lösung L 2-24 Ein Transporter fährt 120 km mit 80 km/h, danach 50 km mit 60 km/h und abschließend noch 140 km mit 75 km/h. Bestimmen Sie seine durchschnittliche Geschwindigkeit mithilfe des harmonischen Mittels. Aufgabe A 2-25: (2 Punkte) Zur Lösung L 2-25 Die EBIT-Marge (EBIT/Umsatz) betrug in den ersten vier Monaten 0,97, danach drei Monate lang 0,95 und den Rest des Jahres 0,98. Berechnen Sie die durchschnittliche EBITMarge mithilfe des harmonischen Mittels.

2.3 Aufgaben

77

Aufgabe A 2-26: (2 Punkte) Zur Lösung L 2-26 Die Einwohnerdichte einer Region (34.000 km2 ) beträgt 17,9 pro km2 . In zwei anderen Regionen (25.000 km2 und 53.000 km2 ) betragen die Einwohnerdichten jeweils 5,8 und 21,1 pro km2 . Bestimmen Sie unter Benutzung des harmonischen Mittels die durchschnittliche Einwohnerdichte. Aufgabe A 2-27: (2 Punkte) Zur Lösung L 2-27 Der folgende Datensatz beschreibt den täglichen Output eines Akkordarbeiters in den letzten zwei Wochen. 200 200

(a) (b) (c) (d) (e) (f) (g)

250 200

230 230

280 210

290 270

300 280

Bestimmen Sie den Modus der Datenreihe. Bestimmen Sie den Median der Datenreihe. Bestimmen Sie das arithmetische Mittel der Datenreihe. Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Aufgabe A 2-28: (2 Punkte) Zur Lösung L 2-28 Es wurde in einer Gruppe von Studenten das monatliche Einkommen aus Nebenjobs (in e) erhoben. Es ergab sich die folgende Datenreihe: 0

(a) (b) (c) (d) (e) (f) (g)

100

20

400

450

450

Bestimmen Sie den Modus. Bestimmen Sie den Median. Bestimmen Sie das arithmetische Mittel. Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

0

0

200

78

2 Grundlagen Statistik

Aufgabe A 2-29: (2 Punkte) Zur Lösung L 2-29 Auf die Frage, wie viele Stunden pro Woche genutzt werden, um Serien zu schauen, ergeben sich für eine Stichprobe von 10 Personen die folgenden Antworten:

(a) (b) (c) (d) (e) (f) (g)

2

0

12

24

4

3

0

10

3

31

Bestimmen Sie den Modus. Bestimmen Sie den Median. Bestimmen Sie das arithmetische Mittel. Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Aufgabe A 2-30: (2 Punkte) Zur Lösung L 2-30 Es wird eine Stichprobe an YouTube-Musikvideos betrachtet. Im Folgenden finden Sie die Anzahl der Viewer (in 10.000) von 10 ausgewählten Videos:

(a) (b) (c) (d) (e) (f)

20,7

213,4

107,1

8,5

0,3

1,8

24,1

15,0

74,3

9,6

Bestimmen Sie den Median. Bestimmen Sie das arithmetische Mittel. Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Aufgabe A 2-31: (2 Punkte) Zur Lösung L 2-31 Die erreichten Punktzahlen in der Klausur zu „Mathematische Grundlagen“ betrugen an den Standorten Köln und Stuttgart in diesem Semester: 82

94

58

51

87

(a) Bestimmen Sie den Median. (b) Bestimmen Sie das arithmetische Mittel. (c) Bestimmen Sie die Spannweite.

74

16

53

81

2.3 Aufgaben

79

(d) Bestimmen Sie den Interquartilabstand. (e) Bestimmen Sie die korrigierte Varianz. (f) Bestimmen Sie die korrigierte Standardabweichung. Aufgabe A 2-32: (2 Punkte) Zur Lösung L 2-32 Die Umsätze des Juweliers am heutigen Tag waren wie folgt:

(a) (b) (c) (d) (e) (f) (g)

300

500

250

70

500

700

400

1500

600

300

Bestimmen Sie den Modus. Bestimmen Sie den Median. Bestimmen Sie das arithmetische Mittel. Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

2.3.3

Lage- und Streuungsparameter klassierter Daten

Aufgabe A 2-33: (120 Punkte) Zur Lösung L 2-33 Fassen Sie die folgenden Datenreihen in Klassen der Breite 20 zusammen und geben Sie für jede Klasse sowohl die absoluten als auch die relativen kumulierten Häufigkeiten an. Bestimmen Sie ferner Mittelwert, Median und die Standardabweichung. (a) (12 Punkte) 71 57 53 40 42 23 8 51 10 40

(b) (12 Punkte) 63 64 8 17 23 27 23 48 37 31

(c) (12 Punkte) 3 13 17 8 27 9 17 23 7 19

80

2 Grundlagen Statistik

(d) (12 Punkte) 6 10 33 18 3 21 6 6 3 18

(e) (12 Punkte) 37 51 19 23 7 12 7 12 23 12

(f) (12 Punkte) 41 37 58 12 5 7 41 37 8 19

(g) (12 Punkte) 17 68 74 25 34 61 55 44 35 15 28 37 68 54

(h) (12 Punkte) 25 64 57 36 13 24 16 57 64 23 36 4 15

(i) (12 Punkte) 12 16 64 27 47 38 19 25 46 14 55 33 14

(j) (12 Punkte) 1 38 65 45 23 57 14 31 64 7 22 36

Aufgabe A 2-34: (10 Punkte) Zur Lösung L 2-34 Der tägliche Output aller Akkordarbeiter eines Unternehmens wurde erhoben und klassiert, sodass sich die folgende Tabelle ergibt:

2.3 Aufgaben

81

Klassen

Absolute Häufigkeiten

[0; 150) [150; 200) [200; 250) [250; 300) [300; 500)

3 34 76 41 15

(a) Bestimmen Sie die entsprechenden relativen und relativen kumulierten Häufigkeiten. (b) Berechnen Sie den Medianoutput. (c) Berechnen Sie den Durchschnittsoutput. Aufgabe A 2-35: (10 Punkte) Zur Lösung L 2-35 Es liegen die folgenden, in Bezug auf das monatliche Bruttoeinkommen, klassierten Daten vor: Klasse

Absolute Häufigkeiten

[0; 800) [800; 1200) [1200; 2500) [2500; 5000)

15 45 78 32

(a) Bestimmen Sie die entsprechenden relativen und relativen kumulierten Häufigkeiten. (b) Berechnen Sie den Medianoutput. (c) Berechnen Sie den Durchschnittsoutput. Aufgabe A 2-36: (10 Punkte) Zur Lösung L 2-36 Die Punktzahlen in der Klausur zu „Mathematische Grundlagen“ wurden über die letzten zwei Jahre gesammelt und, wie in der folgenden Tabelle dargestellt, klassiert: Klasse

Absolute Häufigkeiten

0–49 50–65 66–70 71–85 86–100

31 65 42 37 12

(a) Bestimmen Sie die entsprechenden relativen und relativen kumulierten Häufigkeiten. (b) Berechnen Sie den Medianoutput. (c) Berechnen Sie den Durchschnittsoutput.

82

2 Grundlagen Statistik

Aufgabe A 2-37: (10 Punkte) Zur Lösung L 2-37 Ein Juwelier fasst die Verkäufe des letzten Monats, gemäß dem erzielten Gewinn (in e), in der folgenden Tabelle zusammen: Klasse

Absolute Häufigkeiten

[0; 50) [50; 100) [100; 200) [200; 500) [500; 1000)

15 26 47 24 18

(a) Bestimmen Sie die entsprechenden relativen und relativen kumulierten Häufigkeiten. (b) Berechnen Sie den Medianoutput. (c) Berechnen Sie den Durchschnittsoutput.

2.3.4

Excel-Aufgaben

Aufgabe A 2-38: (je 8 Punkte) Zur Lösung L 2-38 Nutzen Sie Excel-interne Formeln und Funktionen zur Lösung der Aufgaben A 2-7 bis A 2-16.

2.3.5

Aufgaben mit Erklärvideos

2.3.5.1 Statistik Grundlagen Aufgabe A 2-39: (10 Punkte) Entscheiden Sie für die folgenden Merkmale, ob sie stetig oder diskret sind: (a) (b) (c) (d) (e) (f) (g) (h) (i) (j)

Sterne im Weltall Eis am Nordpol Länge eines Tesafilmstreifens Zigaretten pro Packung Star-Wars-Bücher Dauer eines YouTube-Videos Höhe eines Lottogewinns Dauer eines Telefongesprächs Lautstärke Preis einer Flasche Wasser

2.3 Aufgaben

83

Video zur Lösung der Aufgabe

Aufgabe A 2-40: (10 Punkte) Bestimmen Sie für jedes der folgenden Merkmale die zugehörige Skala: (a) (b) (c) (d) (e) (f) (g) (h) (i) (j)

Größe in Inch Brennweite eines Objektivs Hochzeitsdatum Familienstand Arbeitslosenquote Alter von Dinosaurierknochen Energydrinks Gelesene Bücher Urlaubstage Härteskala für Gesteine

Video zur Lösung der Aufgabe

Aufgabe A 2-41: (10 Punkte) Welche der folgenden Merkmale sind häufbar? (a) (b) (c) (d) (e) (f)

Absolvierter Studiengang Vorname Facebook-Profil Job Ehepartner Erbe

84

2 Grundlagen Statistik

Video zur Lösung der Aufgabe

Aufgabe A 2-42: (10 Punkte) Entscheiden Sie, ob es sich bei den folgenden Merkmalen um qualitative oder quantitative Merkmale handelt: (a) (b) (c) (d) (e) (f)

Vorname ISBN eines Buches Instagram-Follower Folien im Folienset Corporate Design Taschengeld

Video zur Lösung der Aufgabe

2.3.5.2 Häufigkeiten und Lagemaße Aufgabe A 2-43: (10 Punkte) Der folgende Datensatz beschreibt das Alter der Studenten eines Kurses. 20 25 23 28 29 30 20 20 23 21 27 28

(a) Erstellen Sie eine Häufigkeitstabelle. (b) Bestimmen Sie den Modus der Datenreihe.

2.3 Aufgaben

85

(c) Bestimmen Sie den Median der Datenreihe. (d) Bestimmen Sie das arithmetische Mittel der Datenreihe.

Video zur Lösung der Aufgabe

Aufgabe A 2-44: (10 Punkte) Hans besitzt eine Whiskysammlung. Im Folgenden ist das Alter der einzelnen Flaschen in seiner Sammlung zusammengestellt: 12 18 15 23 25 25 12 12 21

(a) (b) (c) (d)

Erstellen Sie eine Häufigkeitstabelle. Bestimmen Sie den Modus. Bestimmen Sie den Median. Bestimmen Sie das arithmetische Mittel.

Video zur Lösung der Aufgabe

Aufgabe A 2-45: (10 Punkte) Eine Umfrage unter Schülern, wie viele Stunden täglich aktiv im Internet verbracht werden, liefert das folgende Datenset:

86

2 Grundlagen Statistik

2 1 8 10 4 3 1 6 3 11

(a) (b) (c) (d)

Erstellen Sie eine Häufigkeitstabelle. Bestimmen Sie den Modus. Bestimmen Sie den Median. Bestimmen Sie das arithmetische Mittel.

Video zur Lösung der Aufgabe

Aufgabe A 2-46: (10 Punkte) Ein Instagram-Influencer betrachtet 10 zufällig ausgewählte Posts und stellt in der folgenden Tabelle die erhaltenen Likes (in hundert) zusammen: 19,7 31,4 27,1 8,7 0,8 2,4 22,1 12,2 24,3 10,6

Bestimmen Sie den Median und das arithmetische Mittel der Datenreihe.

Video zur Lösung der Aufgabe

2.3 Aufgaben

87

Aufgabe A 2-47: (10 Punkte) Im Rahmen einer Statistikklausur wurden die folgenden Punktzahlen erreicht: 87 99 55 37 93 67 6 42 83

Bestimmen Sie den Median und das arithmetische Mittel der Datenreihe.

Video zur Lösung der Aufgabe

Aufgabe A 2-48: (10 Punkte) Die Verkäufe eines Autohändlers in den letzten zehn Tagen sahen wie folgt aus: 2 4 1 0 4 6 3 7 5 2

(a) (b) (c) (d)

Erstellen Sie eine Häufigkeitstabelle. Bestimmen Sie den Modus. Bestimmen Sie den Median. Bestimmen Sie das arithmetische Mittel der Datenreihe.

Video zur Lösung der Aufgabe

88

2 Grundlagen Statistik

Aufgabe A 2-49: (10 Punkte) Der folgende Datensatz beschreibt das Alter der Studenten eines Kurses. 20 25 23 28 29 30 20 20 23 21 27 28

Konstruieren Sie zur Veranschaulichung der Verteilung des Datensatzes die Kennzahlen eines Boxplots.

Video zur Lösung der Aufgabe

Aufgabe A 2-50: (10 Punkte) Hans besitzt eine Whiskysammlung. Im Folgenden ist das Alter der einzelnen Flaschen in seiner Sammlung zusammengestellt: 12 18 15 23 25 25 12 12 21

Berechnen Sie ausgehend von der Datenreihe die Kennzahlen zur Konstruktion eines Boxplots.

Video zur Lösung der Aufgabe

2.3 Aufgaben

89

Aufgabe A 2-51: (10 Punkte) Eine Umfrage unter Schülern, wie viele Stunden täglich aktiv im Internet verbracht werden, liefert das folgende Datenset: 2 1 8 10 4 3 1 6 3 11

Berechnen Sie ausgehend von dem Datenset die Kennzahlen zur Konstruktion eines Boxplots.

Video zur Lösung der Aufgabe

Aufgabe A 2-52: (10 Punkte) Ein Instagram-Influencer betrachtet 10 zufällig ausgewählte Posts und stellt in der folgenden Tabelle die erhaltenen Likes (in hundert) zusammen: 19,7 31,4 27,1 8,7 0,8 2,4 22,1 12,2 24,3 10,6

Berechnen Sie ausgehend von dem Datenset die Kennzahlen eines Boxplot.

Video zur Lösung der Aufgabe

90

2 Grundlagen Statistik

Aufgabe A 2-53: (10 Punkte) Im Rahmen einer Statistikklausur wurden die folgenden Punktzahlen erreicht: 87 99 55 37 93 67 6 42 83

Berechnen Sie ausgehend von obiger Datenreihe die Rahmendaten zur Konstruktion eines Boxplots.

Video zur Lösung der Aufgabe

Aufgabe A 2-54: (10 Punkte) Die Verkäufe eines Autohändlers in den letzten zehn Tagen sahen wie folgt aus: 2 4 1 0 4 6 3 7 5 2

Berechnen Sie für das obige Datenset die Kennzahlen zur Konstruktion eines Boxplots.

Video zur Lösung der Aufgabe

2.3 Aufgaben

91

Aufgabe A 2-55: (10 Punkte) Berechnen Sie ausgehend von den folgenden Datensets das dritte Quartil sowie das 29 %und das 87 %-Perzentil: (a) 300 500

250

70

500

700 400 1500 600 300

(b) 82 94 58 51 85 74 16 53 81

(c) 20,7 213,4 107,1 8,5 0,3 1,8 24,1 15,0 74,3 9,6 241,8

(d) 54 0 12 24 4 3 0 10 3 31 32 2

(e) 0 100 20 400 450 450 0 0 200

(f) 200 250 230 280 290 300 200 200 230 210 270

Video zur Lösung der Aufgabe

92

2 Grundlagen Statistik

Aufgabe A 2-56: (10 Punkte) Berechnen Sie ausgehend von den folgenden klassierten Datensets das 1. Quartil sowie das 35 %- und das 57 %-Perzentil. (a) Klassen

Absolute Häufigkeiten

[0; 50) [50; 100) [100; 200) [200; 500) [500; 1000]

15 26 47 24 18

Klassen

Absolute Häufigkeiten

[0; 800) [800; 1200) [1200; 2500) [2500; 5000]

15 45 78 32

(b)

Video zur Lösung der Aufgabe

2.3.5.3 Streuungsmaße Aufgabe A 2-57: (10 Punkte) Der folgende Datensatz beschreibt das Alter der Studenten eines Kurses. 20 25 23 28 29 30 20 20 23 21 27 28

2.3 Aufgaben

(a) (b) (c) (d)

93

Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Video zur Lösung der Aufgabe

Aufgabe A 2-58: (10 Punkte) Hans besitzt eine Whiskysammlung. Im Folgenden ist das Alter der einzelnen Flaschen in seiner Sammlung zusammengestellt: 12 18 15 23 25 25 12 12 21

(a) (b) (c) (d)

Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Video zur Lösung der Aufgabe

94

2 Grundlagen Statistik

Aufgabe A 2-59: (10 Punkte) Auf die Frage, wie lange im Schnitt am Tag Social-Media-Plattformen genutzt werden (in Minuten), antwortet eine Stichprobe von 10 Jugendlichen wie folgt: 0 0 60 90 10 5 0 15 10 180

(a) (b) (c) (d)

Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Video zur Lösung der Aufgabe

Aufgabe A 2-60: (10 Punkte) Es wird eine zufällige Stichprobe von zehn Posts eines bekannten Instagram-Influencers und die erhaltenen Likes (in tausend) betrachtet: 5,8 9,3 9,2 3,4 0,7 2,1 6,9 4,8 8,1 3,6

(a) (b) (c) (d)

Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Video zur Lösung der Aufgabe

2.3 Aufgaben

95

Aufgabe A 2-61: (10 Punkte) Die Punkte, die die Schüler einer Klasse erzielen, verteilten sich wie folgt: 87 100 58 41 91 74 6 53 81

(a) (b) (c) (d)

Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Video zur Lösung der Aufgabe

Aufgabe A 2-62: (10 Punkte) Ein Bauer verkauft sein Gemüse auf einem Wochenmarkt. Seine Umsätze in den zehn Stunden des Marktes waren wie folgt: 300 400 250 200 400 600 400 800 600 300

(a) (b) (c) (d)

Bestimmen Sie die Spannweite. Bestimmen Sie den Interquartilabstand. Bestimmen Sie die korrigierte Varianz. Bestimmen Sie die korrigierte Standardabweichung.

Video zur Lösung der Aufgabe

96

2 Grundlagen Statistik

2.3.5.4 Verteilungsmaße Aufgabe A 2-63: (10 Punkte) Die Stabhöhe der Esel eines Streichelzoos liegen bei den folgenden Werten: 1,3

1,05 1,0 1,0 1,2

1,05

1,1

1,2 1,0

(a) Berechnen Sie die durchschnittliche Stabhöhe und die unkorrigierte Standardabweichung. (b) Berechnen Sie die unkorrigierte Schiefe und Kurtosis des Datensets. Interpretieren Sie die Ergebnisse.

Video zur Lösung der Aufgabe

Aufgabe A 2-64: (10 Punkte) Die Einkommen (Stundensätze) der Mitarbeiter einer lokalen Fleischerei verteilen sich wie folgt: 12 11 13 11 11 12 13 10 16 11

(a) Berechnen Sie das durchschnittliche Einkommen und die korrigierte Standardabweichung. (b) Berechnen Sie die korrigierte Schiefe und Kurtosis des Datensets. Interpretieren Sie die Ergebnisse.

Video zur Lösung der Aufgabe

2.3 Aufgaben

97

2.3.5.5 Klassierte Daten Aufgabe A 2-65: (10 Punkte) Das Alter der Teilnehmer einer Umfrage wurde in den folgenden Altersklassen erhoben: Altersklassen

Absolute Häufigkeiten

[18; 24) [24; 30) [30; 40) [40; 55) [55; 99]

38 27 14 16 9

(a) Bestimmen Sie die entsprechenden relativen und relativen kumulierten Häufigkeiten. (b) Berechnen Sie den Medianoutput. (c) Berechnen Sie den Durchschnittsoutput.

Video zur Lösung der Aufgabe

Aufgabe A 2-66: (10 Punkte) Die Handelserlöse eines Traders (in 1000e ) in den letzten 170 Handelstagen sind in der folgenden Tabelle zusammengestellt: Klasse

Häufigkeiten

[−100; 200) [200; 1000) [1000; 2000) [2000; 4000]

45 78 32 15

(a) Bestimmen Sie die relativen und relativen kumulierten Häufigkeiten. (b) Berechnen Sie das Medianeinkommen. (c) Berechnen Sie das Durchschnittseinkommen.

98

2 Grundlagen Statistik

Video zur Lösung der Aufgabe

Aufgabe A 2-67: (10 Punkte) Die Einstufung von zukünftigen Studenten erfolgt auf Basis eines Tests mit 100 Punkten. Das Abschneiden von 143 Studenten verteilt sich wie folgt: Notenstufen

Schüler

F (0–39) D (40–55) C (56–70) B (71–85) A (86–100)

7 23 68 27 18

(a) Bestimmen Sie die zugehörigen relativen und kumulierten relativen Häufigkeiten. (b) Bestimmen Sie die durchschnittliche Punktzahl. (c) Wie stark weicht die Medianpunktzahl von der durchschnittlichen Punktzahl ab?

Video zur Lösung der Aufgabe

Aufgabe A 2-68: (10 Punkte) Die HR-Abteilung eines Unternehmens fasst die Nettoeinkommen der Mitarbeiter (in e ) in der folgenden Tabelle zusammen:

2.3 Aufgaben

99

Klassen

Absolute Häufigkeiten

[0; 1200) [1200; 1800) [1800; 2000) [2000; 3500) [3500; 8000]

26 47 24 18 15

(a) Bestimmen Sie die entsprechenden relativen und die relativen kumulierten Häufigkeiten. (b) Bestimmen Sie den mittleren Gewinn. (c) Bestimmen Sie den Mediangewinn.

Video zur Lösung der Aufgabe

Aufgabe A 2-69: (10 Punkte) Berechnen Sie ausgehend von den folgenden klassierten Datensets die korrigierte Stichprobenvarianz und die zugehörige Standardabweichung (Abb. 2.2– 2.11): (a) Klassen

Absolute Häufigkeiten

[100; 150) [150; 200) [200; 600) [600; 900) [900; 2000]

26 47 24 18 15

100

2 Grundlagen Statistik

(b) Klassen

Absolute Häufigkeiten

[−100; 200) [200; 1000) [1000; 2000) [2000; 4000]

45 78 32 15

Video zur Lösung der Aufgabe

Aufgabe A 2-70: (10 Punkte) Berechnen Sie ausgehend von den folgenden klassierten Datensets die korrigierte Stichprobenvarianz und die zugehörige Standardabweichung: (a) Notenstufen

Schüler

F (0–39) D (40–55) C (56–70) B (71–85) A (86–100)

7 23 68 27 18

(b) Altersklassen

Absolute Häufigkeiten

[18; 24) [24; 30) [30; 40) [40; 55) [55; 99)

38 27 14 16 9

2.4 Lösungen

101

Video zur Lösung der Aufgabe

2.4

Lösungen

Lösung des Quick Checks • • • • • • • • • • • • • • • • • • • •

Zur Aufgabenstellung

wahr falsch wahr wahr falsch (in der Praxis meistens wahr) wahr falsch wahr wahr falsch falsch wahr wahr falsch wahr falsch falsch falsch wahr falsch

2.4.1

Statistik Grundlagen

Lösung L 2-1: (25 Punkte) (a) (1 Punkt) stetig (b) (1 Punkt) diskret

Zur Aufgabenstellung A 2-1

102

2 Grundlagen Statistik

(c) (d) (e) (f) (g) (h) (i) (j) (k) (l) (m) (n) (o) (p) (q) (r) (s) (t) (u) (v) (w) (x) (y)

(1 Punkt) diskret (1 Punkt) stetig (1 Punkt) diskret (1 Punkt) diskret (1 Punkt) stetig (1 Punkt) diskret (1 Punkt) stetig (1 Punkt) stetig (1 Punkt) diskret (1 Punkt) stetig (1 Punkt) stetig (Wenn es als Anzahl der Sandkörner interpretiert wird, dann diskret.) (1 Punkt) diskret (1 Punkt) diskret (da immer gerundet wird) (1 Punkt) diskret (1 Punkt) stetig (1 Punkt) diskret (1 Punkt) diskret/quasi-stetig (1 Punkt) stetig (1 Punkt) stetig (1 Punkt) quasi-stetig (1 Punkt) diskret (1 Punkt) stetig (1 Punkt) stetig

Lösung L 2-2: (9 Punkte) (a) (b) (c) (d) (e) (f) (g) (h) (i)

(1 Punkt) deskriptiv (1 Punkt) induktiv (1 Punkt) induktiv (1 Punkt) deskriptiv (1 Punkt) induktiv (1 Punkt) induktiv (1 Punkt) deskriptiv (1 Punkt) deskriptiv (1 Punkt) induktiv

Lösung L 2-3: (21 Punkte) (a) (b) (c) (d)

Zur Aufgabenstellung A 2-2

Zur Aufgabenstellung A 2-3

(1 Punkt) qualitativ (1 Punkt) quantitativ/qualitativ (abhängig von der Interpretation) (1 Punkt) quantitativ (1 Punkt) quantitativ

2.4 Lösungen

(e) (f) (g) (h) (i) (j) (k) (l) (m) (n) (o) (p) (q) (r) (s) (t) (u)

(1 Punkt) quantitativ (1 Punkt) quantitativ (1 Punkt) quantitativ (1 Punkt) qualitativ (1 Punkt) quantitativ (1 Punkt) quantitativ (1 Punkt) qualitativ (1 Punkt) quantitativ (1 Punkt) quantitativ (1 Punkt) qualitativ (1 Punkt) quantitativ/qualitativ (abhängig von der Art der Bewertung) (1 Punkt) quantitativ (1 Punkt) qualitativ (1 Punkt) qualitativ (1 Punkt) quantitativ (1 Punkt) qualitativ/quantitativ (1 Punkt) quantitativ

Lösung L 2-4: (22 Punkte) (a) (b) (c) (d) (e) (f) (g) (h) (i) (j) (k) (l) (m) (n) (o) (p) (q) (r) (s) (t) (u) (v)

103

(1 Punkt) nicht häufbar (1 Punkt) häufbar (1 Punkt) häufbar (1 Punkt) nicht häufbar (1 Punkt) nicht häufbar (1 Punkt) häufbar (1 Punkt) häufbar (1 Punkt) nicht häufbar (1 Punkt) häufbar (1 Punkt) nicht häufbar (1 Punkt) häufbar (1 Punkt) häufbar (1 Punkt) häufbar (1 Punkt) nicht häufbar (1 Punkt) häufbar (1 Punkt) nicht häufbar (1 Punkt) häufbar (1 Punkt) nicht häufbar (1 Punkt) häufbar (1 Punkt) häufbar (1 Punkt) nicht häufbar (1 Punkt) häufbar

Zur Aufgabenstellung A 2-4

104

2 Grundlagen Statistik

Lösung L 2-5: (25 Punkte) (a) (b) (c) (d) (e) (f) (g) (h) (i) (j) (k) (l) (m) (n) (o) (p) (q) (r) (s) (t) (u) (v) (w) (x) (y)

Zur Aufgabenstellung A 2-5

(1 Punkt) nominal (1 Punkt) ordinal (1 Punkt) verhältnis (1 Punkt) ordinal (1 Punkt) verhältnis (1 Punkt) verhältnis (1 Punkt) verhältnis (1 Punkt) nominal (1 Punkt) verhältnis (1 Punkt) intervall (1 Punkt) verhältnis (1 Punkt) verhältnis (1 Punkt) nominal (1 Punkt) ordinal (1 Punkt) verhältnis (1 Punkt) verhältnis (1 Punkt) ordinal (1 Punkt) verhältnis (1 Punkt) ordinal/nominal (1 Punkt) nominal (1 Punkt) ordinal (1 Punkt) intervall (1 Punkt) nominal (1 Punkt) verhältnis (1 Punkt) verhältnis

2.4.2

Lage- und Streuungsparameter

Lösung L 2-6: (60 Punkte)

Zur Aufgabenstellung A 2-6

(a) (6 Punkte) 1 2 3 3 5 7 7 7 8 10 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3 5 7 8 10

1 1 2 1 3 1 1

0,1 0,1 0,2 0,1 0,3 0,1 0,1

0,1 0,2 0,4 0,5 0,8 0,9 1,0

2.4 Lösungen

105

(b) (6 Punkte) 1 1 2 2 2 9 9 9 9 10 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 9 10

2 3 4 1

0,2 0,3 0,4 0,1

0,2 0,5 0,9 1,0

(c) (6 Punkte) 1 1 2 2 2 3 3 4 5 6 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3 4 5 6

2 3 2 1 1 1

0,2 0,3 0,2 0,1 0,1 0,1

0,2 0,5 0,7 0,8 0,9 1,0

(d) (6 Punkte) 1 2 3 3 4 4 4 5 5 6 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3 4 5 6

1 1 2 3 2 1

0,1 0,1 0,2 0,3 0,2 0,1

0,1 0,2 0,4 0,7 0,9 1,0

(e) (6 Punkte) 1 1 2 3 3 3 4 6 7 8 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3 4 6 7 8

2 1 3 1 1 1 1

0,2 0,1 0,3 0,1 0,1 0,1 0,1

0,2 0,3 0,6 0,7 0,8 0,9 1,0

106

2 Grundlagen Statistik

(f) (6 Punkte) 1 1 2 3 3 3 3 4 4 4 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3 4

2 1 4 3

0,2 0,1 0,4 0,3

0,2 0,3 0,7 1,0

(g) (6 Punkte) 1 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3

8 6 6

0,4 0,3 0,3

0,4 0,7 1,0

(h) (6 Punkte) 1 1 2 2 3 3 3 3 5 5 6 6 6 6 6 6 7 7 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3 5 6 7

2 2 4 2 6 2

0,11 0,11 0,22 0,11 0,33 0,11

0,11 0,22 0,44 0,56 0,89 1,0

(i) (6 Punkte) 1 2 2 2 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7 8 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3 4 5 6 7 8

1 3 4 3 3 3 2 1

0,05 0,15 0,20 0,15 0,15 0,15 0,10 0,05

0,05 0,20 0,40 0,55 0,70 0,85 0,95 1,00

2.4 Lösungen

107

(j) (6 Punkte) 1 1 1 1 2 2 2 3 3 3 3 4 4 5 5 5 5 6 6 Ausprägung

Abs. Häuf.

Rel. Häuf.

Kum. Häuf.

1 2 3 4 5 6

4 3 4 2 4 2

0,21 0,16 0,21 0,11 0,21 0,11

0,21 0,37 0,58 0,69 0,90 1,00

Lösung L 2-7: (17 Punkte)

7 6 5 4 3 2 1 0

Abb. 2.2 Boxplot Aufgabe 7

Zur Aufgabenstellung A 2-7 Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

6 4 2 5,5 3,65 5 3,6079 1,8994

108

2 Grundlagen Statistik

Lösung L 2-8: (17 Punkte)

Zur Aufgabenstellung A 2-8 Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

3 7,5 4 11 8,4 22 27,5158 5,2455

30

25

20

15

10

5

0

Abb. 2.3 Boxplot Aufgabe 8

Lösung L 2-9: (17 Punkte)

Zur Aufgabenstellung A 2-9 Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

2 9,5 6 18 12,1 26 82,5444 9,0854

2.4 Lösungen

109

30

25

20

15

10

5

0

Abb. 2.4 Boxplot Aufgabe 9

Lösung L 2-10: (17 Punkte)

70 60 50 40 30 20 10 0

Abb. 2.5 Boxplot Aufgabe 10

Zur Aufgabenstellung A 2-10 Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

9 9 5 17 17,7 63 482,9 21,975

110

2 Grundlagen Statistik

Lösung L 2-11: (17 Punkte)

Zur Aufgabenstellung A 2-11

Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

4 9 5 16 13,3 42 164,0111 12,8067

50 45 40 35 30 25 20 15 10 5 0

Abb. 2.6 Boxplot Aufgabe 11

Lösung L 2-12: (17 Punkte)

Zur Aufgabenstellung A 2-12

Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

5 5 4 12 7,8 14 26,8444 5,1812

2.4 Lösungen

111

18 16 14 12 10 8 6 4 2 0

Abb. 2.7 Boxplot Aufgabe 12

Lösung L 2-13: (17 Punkte)

18 16 14 12 10 8 6 4 2 0

Abb. 2.8 Boxplot Aufgabe 13

Zur Aufgabenstellung A 2-13

Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

3 6,5 3 11 7,5 14 24,2778 4,9272

112

2 Grundlagen Statistik

Lösung L 2-14: (17 Punkte)

Zur Aufgabenstellung A 2-14

Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

7 8 5 25 12,7 30 116,4556 10,7915

35 30 25 20 15 10 5 0

Abb. 2.9 Boxplot Aufgabe 14

Lösung L 2-15: (17 Punkte)

Zur Aufgabenstellung A 2-15 Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

8 16 3 28 15,8 29 152,4 12,345

2.4 Lösungen

113

35 30 25 20 15 10 5 0

Abb. 2.10 Boxplot Aufgabe 15

Lösung L 2-16: (17 Punkte)

Zur Aufgabenstellung A 2-16

Statistik

Wert

Modus Median x0,25 x0,75 Mittelwert Spannbreite Varianz Standardabweichung

31 29,5 22 31 27,6 16 30,0444 5,4813

40 35 30 25 20 15 10 5 0

Abb. 2.11 Boxplot Aufgabe 16

114

2 Grundlagen Statistik

Lösung L 2-17: (2 Punkte) Zur Aufgabenstellung A 2-17 Das geometrische Mittel der Rendite beträgt: xg = 0,0355 Lösung L 2-18: (2 Punkte) Zur Aufgabenstellung A 2-18 Das geometrische Mittel der Wachstumsraten lag bei: xg = 0,0149 Lösung L 2-19: (2 Punkte) Zur Aufgabenstellung A 2-19 Das geometrische Mittel der Arbeitslosenquote beträgt: xg = 0,0624 Lösung L 2-20: (2 Punkte) Zur Aufgabenstellung A 2-20 Das geometrische Mittel der Wachstumsraten beträgt: xg = 0,3096 Lösung L 2-21: (2 Punkte) Zur Aufgabenstellung A 2-21 Das geometrische Mittel der Änderungsraten beträgt: xg = 0,0344 Lösung L 2-22: (2 Punkte) Zur Aufgabenstellung A 2-22 Die mittlerer Lohnquote beträgt: 0,6651 Lösung L 2-23: (2 Punkte) Zur Aufgabenstellung A 2-23 Die durchschnittliche Produktivität beträgt: 1081,25 pro Stunde Lösung L 2-24: (2 Punkte) Zur Aufgabenstellung A 2-24 Die durchschnittliche Geschwindigkeit beträgt: 73,8095 km/h Lösung L 2-25: (2 Punkte) Zur Aufgabenstellung A 2-25 Die durchschnittliche EBIT-Marge beträgt: 0,9690 Lösung L 2-26: (2 Punkte) Zur Aufgabenstellung A 2-26 Die durchschnittliche Einwohnerdichte beträgt: 16,7133 Lösung L 2-27: (2 Punkte) Zur Aufgabenstellung A 2-27 Die Datenreihe wird zunächst aufsteigend angeordnet: 200 250

(a) (b) (c) (d) (e)

200 270

200 280

210 280

230 290

230 300

xM = 200 x0,5 = (230 + 250)/2 = 240 x = (200+200+200+210+230+230+250+270+280+280+290+300)/12 = 245 SB = 300 − 200 = 100 I QA = x0,75 − x0,25 = x([12·0,75]) − x([12·0,25]) = x(9) − x( 3) = 280 − 200 = 80

2.4 Lösungen

115

(f) s 2 = (3 · 2002 + 2102 + 2 · 2302 + 2502 + 2702 + 2 · 2802 + 2902 + 3002 )/11–(12/11) · 2452 = 1445,4545 (g) s = 38,0191 Lösung L 2-28: (2 Punkte) Zur Aufgabenstellung A 2-28 Die Datenreihe wird zunächst aufsteigend angeordnet: 0

(a) (b) (c) (e) (f) (g) (h)

0

0

20

100

200

400

450

450

xM = 0 x0,5 = x(0,5·(9+1)) = 100 x = (0 + 0 + 0 + 20 + 100 + 200 + 400 + 450 + 450)/9 = 180 SB = 450 − 0 = 450 I QA = x0,75 − x0,25 = x([9·0,75]) − x([9·0,25]) = x(7) − x( 3) = 400 − 0 = 400 s 2 = (3 · 02 + 202 + 1002 + 2002 + 4002 + 2 · 4502 )/8–(9/8) · 1802 = 40.092,5 s = 200,2311

Lösung L 2-29: (2 Punkte) Zur Aufgabenstellung A 2-29 Die Datenreihe wird zunächst aufsteigend angeordnet: 0 4

(a) (b) (c) (d) (e) (f) (g)

0 10

2 12

3 24

3 31

xM = 2 oder 3 x0,5 = (3 + 4)/2 = 3,5 x = (0 + 0 + 2 + 3 + 3 + 4 + 10 + 12 + 24 + 31)/10 = 8,9 SB = 31 − 0 = 31 I QA = x0,75 − x0,25 = x([10·0,75]) − x([10·0,25]) = x(8) − x( 3) = 12 − 2 = 10 s 2 = (2 · 02 + 22 + 2 · 32 + 42 + 102 + 122 + 242 + 312 )/9–(10/9) · 8,92 = 114,1 s = 10,6818

Lösung L 2-30: (2 Punkte) Zur Aufgabenstellung A 2-30 Die Datenreihe wird zunächst aufsteigend angeordnet: 0,3 1,8 8,5 9,6 15,0 20,7 24,1 74,3 107,1 213,4

(a) x0,5 = (15 + 20,7)/2 = 17,85 (b) x = (0,3 + 1,8 + 8,5 + 9,6 + 15,0 + 20,7 + 24,1 + 74,3 + 107,1 + 213,4)/10 = 47,48

116

(c) (d) (e) (f)

2 Grundlagen Statistik

SB = 213,4 − 0,3 = 213,1 I QA = x0,75 − x0,25 = x([10·0,75]) − x([10·0,25]) = x(8) − x( 3) = 74,6 − 8,5 = 65,8 s 2 = (2·02 +22 +2·32 +42 +102 +122 +242 +312 )/9–(10/9)·47,482 = 4598,7773 s = 67,8143

Lösung L 2-31: (2 Punkte) Zur Aufgabenstellung A 2-31 Die Datenreihe wird zunächst aufsteigend angeordnet: 16 51 53 58 74 81 82 87 94

(a) (b) (c) (d) (e) (f)

x0,5 = x0,5·(9+1) = 74 x = (16 + 51 + 53 + 58 + 74 + 81 + 82 + 87 + 94)/9 = 66,2222 SB = 94 − 16 = 78 I QA = x0,75 − x0,25 = x([9·0,75]) − x([9·0,25]) = x(7) − x( 3) = 82 − 53 = 29 s2 = s = (162 + 512 + 532 + 582 + 742 + 812 + 822 + 852 + 942 )/8–(9/8) · 662 = 581

Lösung L 2-32: (2 Punkte) Zur Aufgabenstellung A 2-32 Die Datenreihe wird zunächst aufsteigend angeordnet: 70 250 300 300 400 500 500 600 700 1500

xM = 300 oder 500 x0,5 = (400 + 500)/2 = 450 x = (70 + 250 + 300 + 300 + 400 + 500 + 500 + 600 + 700 + 1500)/10 = 362 SB = 1500 − 70 = 1430 I QA = x0,75 − x0,25 = x([10·0,75]) − x([10·0,25]) = x(8) − x( 3) = 600 − 300 = 300 s 2 = (702 +2502 +2·3002 +4002 +2·5002 +6002 +7002 +15002 )/9–(10/9)·3622 = 153.995,5556 (g) s = 392,4227

(a) (b) (c) (d) (e) (f)

2.4.3

Lage- und Streuungsparameter klassierter Daten

Lösung L 2-33: (120 Punkte) (a) (12 Punkte)

Zur Aufgabenstellung A 2-33

2.4 Lösungen

117

Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40 40–50 50–60 60–70 70–80

2 0 1 2 1 3 0 1

0,2 0,2 0,3 0,5 0,6 0,9 0,9 1,0 Modus:

54

Median: Mittelwert:

40 39

(b) (12 Punkte) Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40 40–50 50–60 60–70

1 1 3 2 1 0 1

0,1 0,2 0,5 0,7 0,8 0,8 1,0

Modus:

26,7

Median: Mittelwert:

30 34

(c) (12 Punkte) Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30

4 4 2

0,4 0,8 1,0

118

2 Grundlagen Statistik

Modus:

10

Median: Mittelwert:

12,5 13

(d) (12 Punkte) Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40

6 2 1 1

0,6 0,8 0,9 1,0

Modus:

6

Median: Mittelwert:

8,3 12

(e) (12 Punkte) Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40 40–50 50–60

2 4 2 1 0 1

0,2 0,6 0,8 0,9 0,9 1,0

Modus:

15

Median: Mittelwert:

17,5 21

2.4 Lösungen

119

(f) (12 Punkte) Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40 40–50 50–60

3 2 0 2 2 1

0,3 0,5 0,5 0,7 0,9 1,0

Modus:

7,5

Median: Mittelwert:

20 26

(g) (12 Punkte) Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40 40–50 50–60 60–70 70–80

0 2 2 3 2 2 3 1

0,00 0,13 0,27 0,47 0,60 0,73 0,93 1,00

Modus:

35; 63,3

Median: Mittelwert:

42,3 43,7

120

2 Grundlagen Statistik

(h) (12 Punkte) Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40 40–50 50–60 60–70

1 3 3 2 0 2 4

0,08 0,31 0,54 0,69 0,69 0,85 1,00

Modus:

63,3

Median: Mittelwert:

28,3 37,7

(i) (12 Punkte)

(j) (12 Punkte)

Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40 40–50 50–60 60–70

0 5 2 2 2 1 1

0,00 0,38 0,54 0,69 0,85 0,92 1,00

Modus:

16,3

Median: Mittelwert:

27,5 31,2

2.4 Lösungen

121

Klasse

Abs. Häufigkeit

Rel. kum. Häufigkeit

0–10 10–20 20–30 30–40 40–50 50–60 60–70

2 1 2 3 1 1 2

0,17 0,25 0,42 0,67 0,75 0,83 1,00

Lösung L 2-34: (10 Punkte)

Modus:

33,3

Median: Mittelwert:

30,2 34,2

Zur Aufgabenstellung A 2-34

(a) Klassen

Abs. Häuf.

Rel. Häuf.

Rel. Kum. Häuf.

[0; 150) [150; 200) [200; 250) [250; 300) [300; 500)

3 34 76 41 15

0,0178 0,2012 0,4497 0,2426 0,0888

0,0178 0,2190 0,6687 0,9113 1,0000

(b) x0,5 = 200 + 0,5−0,219 0,4497 · (250 − 200) = 231,24 (c) x = 75·0,0178+175·0,2012+225·0,4497+275·0,2426+400·0,0888 = 239,9625 Lösung L 2-35: (10 Punkte)

Zur Aufgabenstellung A 2-35

(a) Klasse

Abs. Häuf.

Rel. Häuf.

Kum. Rel. Häuf.

[0; 800) [800; 1200) [1200; 2500) [2500; 5000)

15 45 78 32

0,0882 0,2647 0,4588 0,1882

0,0882 0,3529 0,8117 1,0000

122

2 Grundlagen Statistik

(b) x0,5 = 1200 + 0,5−0,3529 · (2500 − 1200) = 1616,8047 0,4588 (c) x = 400 · 0,0882 + 1000 · 0,2647 + 1950 · 0,4588 + 3750 · 0,1882 = 1900,39 Lösung L 2-36: (10 Punkte)

Zur Aufgabenstellung A 2-36

(a) Klasse

Abs. Häuf.

Rel. Häuf.

Kum. Rel. Häuf.

0–49 50–65 66–70 71–85 86–100

31 65 42 37 12

0,1658 0,3476 0,2246 0,1979 0,0642

0,1658 0,5134 0,7380 0,9359 1,0000

(b) x0,5 = 49 + 0,5−0,1658 · (65 − 49) = 64,3824 0,3476 (c) x = 24,5 · 0,1658 + 57,5 · 0,3476 + 68 · 0,2246 + 78 · 0,1979 + 93 · 0,0642 = 60,7287 Lösung L 2-37: (10 Punkte)

Zur Aufgabenstellung A 2-37

(a) Klasse

Abs. Häuf.

Rel. Häuf.

Kum. Rel. Häuf.

[0; 50) [50; 100) [100; 200) [200; 500) [500; 1000)

15 26 47 24 18

0,1154 0,2000 0,3615 0,1846 0,1385

0,1154 0,3154 0,6769 0,8615 1,0000

(b) x0,5 = 100 + 0,5−0,3154 · (200 − 100) = 151,07 0,3615 (c) x = 25 · 0,1154 + 75 · 0,2 + 150 · 0,3615 + 350 · 0,1846 + 750 · 0,1385 = 240,595

2.4.4

Excel Aufgaben

Lösung L 2-38: (je 8 Punkte) Zur Aufgabenstellung A 2-38 Nach Eingabe der Daten in Spalte kann der Modus bestimmt werden über =MODALWERT(A:A). Das erste Quartil bestimmt sich über =QUARTIL(A:A;1) und entsprechend bestimmen sich der Median als =QUARTIL(A:A;2) bzw. =MEDIAN(A:A) und das dritte Quartil über =QUARTIL(A:A;3). Das arithmetische Mittel der Datenreihe bestimmt

2.5 Wiederholungsfragen

123

sich über =MITTELWERT(A:A). Die Spannbreite kann indirekt wie folgt bestimmt werden =MAX(A:A)-MIN(A:A). Schließlich bestimmt sich die Varianz über die Funktion =VAR.S(A:A) bzw. =VARIANZ(A:A), sofern es sich um Daten aus einer Stichprobe handelt und über die Funktion =VAR.P(A:A), sofern es sich bei den Daten um eine Vollerhebung handelt. Die Standardabweichung kann man als Wurzel der Varianz bestimmen über =WURZEL(VAR.S(A:A)) oder alternativ direkt über die Funktion =STABW.S(A:A) für Daten aus einer Stichprobe und =STABW.N(A:A) für die Grundgesamtheit.

2.5

Wiederholungsfragen

• Welche Teilbereiche der Statistik unterscheidet man? • Worin unterscheiden sich quantitative von qualitativen Daten und worin stetige von diskreten? • Welche Skalenniveaus gibt es? Welche Rechenoperationen erlauben sie jeweils? • Wann ist ein Merkmal häufbar? • Worin unterscheiden sich Rohdaten von klassierten Daten? • Was ist der Unterschied zwischen absoluten, relativen und relativen kumulierten Häufigkeiten? • Wie bestimmt sich der Modus einer Datenreihe? Was versteht man unter der Modalklasse? • Wie bestimmt sich der Median einer Datenreihe? Wie ändert sich die Bestimmung, wenn statt des Medians ein bestimmtes Quantil berechnet wird? • Wie berechnen sich der Mittelwert, ein gewichteter Mittelwert bzw. das geometrische und das harmonische Mittel? • Wie konstruiert man einen Boxplot? Welche Statistiken werden hierzu benötigt? • Wie bestimmt man die Spannweite einer Datenreihe und wie den Interquartilabstand? Inwieweit spiegeln sich die beiden Größen in einem Boxplot wider? • Was misst die Varianz und wie berechnet sie sich? • Worin besteht der Unterschied zwischen der korrigierten und der unkorrigierten Varianz? • Wie gelangt man von der Varianz zur Standardabweichung? • Was sagt die Standardabweichung einer normalverteilten Variablen über die Verteilung der Daten aus? • Was ist der Variationskoeffizient und wie bestimmt er sich? • Was versteht man unter der Schiefe eines Datensets und wie berechnet sich diese? • Was versteht man unter der Wölbung/Kurtosis eines Datensets und wie berechnet sich diese? • Was sagen die Werte der Schiefe und der Kurtosis über die Form der Wahrscheinlichkeitsfunktion/Dichtefunktion aus?

3

Wahrscheinlichkeitsrechnung

Inhalte • • • •

Mengenlehre Mengenoperationen Totale Wahrscheinlichkeit Satz von Bayes

3.1

Theoretische Grundlagen

3.1.1

Mengenlehre

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Mengenlehre

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 J. K. Perret, Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler, https://doi.org/10.1007/978-3-658-26148-1_3

125

126

3 Wahrscheinlichkeitsrechnung

Bevor über Mengenoperationen gesprochen werden kann, ist zunächst zu klären, was unter einer Menge zu verstehen ist. Hierzu kann die klassische Definition in Anlehnung an Descartes bemüht werden. Eine Menge ist eine Zusammenfassung wohlunterschiedener Elemente unserer Anschauung zu einem Ganzen. Diese Definition zeigt die zwei wichtigsten Aspekte einer Menge. Alle Elemente einer Menge sind einzigartig; eine Menge enthält kein Element doppelt. Ferner stellt man sich die Elemente einer Menge zwar häufig als Zahlen vor, allerdings kann eine Menge aus beliebigen Elementen konstruiert werden. Formal ist ein Obstkorb mit Äpfeln, Birnen und Pfirsichen eine Menge mit drei Elementen und damit formal ähnlich zu der Menge {1; 2; 3}. Man kann ihn sich auch vorstellen als eine Menge an Variablen, die die Werte Apfel, Birne oder Pfirsich annehmen können. Zur Veranschaulichung der üblichen Mengenoperationen werden meistens, wie auch hier, Mengendiagramme verwendet, in denen jedes Element der Menge durch einen Punkt gekennzeichnet wird. Darüber hinaus sind die Menge, und somit alle Elemente der Menge, deutlich von allen Elementen abgegrenzt, die nicht Teil der Menge sind. Betrachtet man alle möglichen Elemente: solche, die Teil der Menge sind, und solche, die nicht Teil der Menge sind, so erhält man den sogenannten Ereignisraum (auch mit dem Symbol  beschrieben), der alle möglichen Ereignisse, Werte, Elemente enthält, die denkbar sind. Im Marktforschungskontext kann man sich den Ereignisraum als Grundgesamtheit vorstellen. Es ist somit nicht möglich, ein Element in einer Menge zu finden, das nicht Teil des umgebenden Ereignisraums ist. Das Gegenteil des Ereignisraums, der alle Elemente enthält, ist die leere Menge ∅, die kein einziges Element enthält. Entsprechend kann die leere Menge auch als M = {} geschrieben werden.

3.1.1.1 Komplement Alle Werte, die nicht Teil der betrachteten Menge M sind, aber im umgebenden Ereignisraum  liegen, bezeichnet man als das Komplement von M bzw. die Komplementärmenge zu M. Das Komplement zur Menge M wird durch M C bezeichnet. Grafisch kann man das Komplement mithilfe eines Mengendiagramms wie in Abb. 3.1 sehr gut darstellen. Die Abbildung suggeriert auch direkt, dass sich der Ereignisraum aus der Menge M und der entsprechenden Komplementärmenge M C zusammensetzt. Es gibt somit kein Element im Ereignisraum, dass nicht entweder in der Menge M oder in ihrem Komplement liegt. 3.1.1.2 Vereinigungsmenge Erweitert man das Mengendiagramm um eine weitere Menge N , können drei neue Begriffe motiviert werden. Der erste Begriff ist die Vereinigungsmenge oder einfach ausgedrückt die Vereinigung der beiden Mengen M und N . Die Vereinigung von zwei Mengen stellt man mit dem Symbol ∪ dar. Entsprechend ergibt sich die Vereinigung von M und N als M ∪ N . Inhaltlich kann man sich die Vereinigungsmenge derart vorstellen, dass sie sowohl alle Werte aus M als auch alle Werte aus N enthält. Aufgrund der genutzten

3.1 Theoretische Grundlagen

127

Mengendefinition enthält die Vereinigungsmenge allerdings im Fall, dass sich ein Element sowohl in M als auch in N befindet, nur ein einziges Exemplar. Grafisch lässt sich die Vereinigungsmenge über das Mengendiagramm in Abb. 3.2 motivieren. Die Vereinigungsmenge lässt sich somit als diejenige Menge beschreiben, die alle Werte aus M und alle Werte aus N enthält, aber keines doppelt. Mit Rückgriff auf den letzten Abschnitt kann man festhalten, dass für den Ereignisraum gilt:  = M ∪ M C

Abb. 3.1 Komplement

Abb. 3.2 Vereinigungsmenge

128

3 Wahrscheinlichkeitsrechnung

Abb. 3.3 Schnittmenge

3.1.1.3 Schnittmenge Die Schnittmenge stellt das Gegenteil der Vereinigungsmenge dar. Die Schnittmenge ergibt sich als Menge aller Elemente, die sowohl in M als auch in N liegen. Das Symbol für die entsprechende Mengenoperation lautet: ∩. Die Schnittmenge von M und N ergibt sich somit als M ∩ N . Grafisch lässt sich die Schnittmenge wie in Abb. 3.3 veranschaulichen. Kombiniert man die Erkenntnisse aus dem letzten und aus diesem Abschnitt, so erkennt man, dass die Vereinigungsmenge M ∪ N sich aus allen Elementen in M und allen Elementen aus N zusammensetzt. Zählt man die Werte allerdings einfach zusammen, so würde man die Werte aus der Schnittmenge M ∩ N doppelt zählen. Das gleiche Argument gilt ebenso für die Anzahl der Elemente in der Vereinigungsmenge M ∪ N . Diese ergibt sich aus den Elementen in M, addiert zu den Elementen in N , reduziert um die Anzahl der Elemente in der Schnittmenge, da diese sonst doppelt gezählt werden. Sollten die beiden Mengen M und N disjunkt sein, was bedeutet, dass es keine Elemente gibt, die sich sowohl in M als auch in N befinden, so ist die Schnittmenge die leere Menge; es gilt: M ∩ N = ∅. 3.1.1.4 Differenzmenge Während man sich die Vereinigung zweier Mengen auch so vorstellen kann, dass die beiden Mengen zusammengefasst und damit quasi addiert werden, so existiert auch die gegensätzliche Operation. Diese realisiert sich in der Bildung der Differenzmenge. Betrachtet man die Differenzmenge M \ N , so bedeutet dies, dass alle Elemente, die sich sowohl in M als auch in N befinden, aus M entfernt werden. M wird somit um die Schnittmenge von M und N bereinigt. Grafisch lässt sich die Differenzmenge wie in Abb. 3.4 veranschaulichen.

3.1 Theoretische Grundlagen

129

Abb. 3.4 Differenzmenge

3.1.2

Von der Mengenlehre zur Wahrscheinlichkeitstheorie

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Wahrscheinlichkeitstheorie

Nach dieser kurzen Einführung in die Mengenlehre stellt sich sinnvollerweise die Frage, wie sich die Mengenlehre und die hierdurch gewonnenen Erkenntnisse auf die Statistik anwenden lassen. Hierzu kann man die LaPlace-Definition der Wahrscheinlichkeit bemühen. P (A) =

|A| ||

Hierbei bezeichnet P (A) die Wahrscheinlichkeit, dass Ereignis A eintritt bzw. dass ein Element die Eigenschaft, das Merkmal A, aufweist. Die Betragsstriche |.| geben, mit Bezug auf eine Menge, die Mächtigkeit der Menge und damit die Anzahl ihrer Elemente an. Entsprechend kann die Definition auch so gelesen werden, dass P (A) der relative Anteil aller möglichen Ereignisse (||) ist, der die Eigenschaft A aufweist.

130

3 Wahrscheinlichkeitsrechnung

Diese Definition zeigt uns direkt, dass die Wahrscheinlichkeit P (A) immer zwischen 0 und 1 liegen wird, mit P (∅) = 0 (unmögliches Ereignis) und P () = 1 (sicheres Ereignis) als Grenzen.

3.1.2.1 Bedingte Wahrscheinlichkeiten Erweitert man die Berechnung der Wahrscheinlichkeit um eine dynamische Dimension, so können zwei Ereignisse A und B betrachtet werden, wobei an dieser Stelle angenommen wird, dass das Ereignis B dem Ereignis A vorgelagert ist. Skizziert man die hieraus resultierenden Zusammenhänge, so erhält man den folgenden Entscheidungsbaum. Im ersten Schritt ist lediglich zu entscheiden, ob Ereignis B eintreten wird oder nicht. Es sind somit die Wahrscheinlichkeiten P (B) und P (B C ) zu unterscheiden. Der zweite Schritt schließlich hängt davon ab, welches Ereignis im ersten Schritt eingetreten ist. Das bedeutet, dass man im zweiten Schritt immer sogenannte bedingte Wahrscheinlichkeiten betrachtet. Unter der Bedingung, dass B oder B C eingetreten sind, wie groß ist dann die Wahrscheinlichkeit, dass A oder AC eintreten? Formal bezeichnet man die Wahrscheinlichkeit, dass A eintritt unter der Bedingung, dass B bereits eingetreten ist, mit P (A|B). Sind nach dem zweiten Schritt beide Ereignisse eingetreten, so sieht man, wie in Abb. 3.5 dargestellt, dass dies die Wahrscheinlichkeit der Schnittmenge von A und B ist; die Wahrscheinlichkeit ein Element zu finden, das sowohl Eigenschaft A aufweist (in Menge A liegt), als auch Eigenschaft B aufweist (in Menge B liegt). Um P (A ∩ B) und P (A|B) zu unterscheiden, kann man sich merken, dass bei P (A|B) Ereignis A noch nicht eingetreten ist, im Gegensatz zu P (A ∩ B), wo beide Ereignisse bereits eingetreten sind.

Abb. 3.5 Bedingte Wahrscheinlichkeiten im Baumdiagramm

3.1 Theoretische Grundlagen

131

3.1.2.2 Allgemeine Rechenregeln Unter Ausnutzung der oben eingeführten Mengenoperation können so dann die folgenden grundlegenden Formeln der Wahrscheinlichkeitsrechnung motiviert werden: Komplement: Multiplikationssatz:

P (AC ) = 1 − P (A) P (A ∩ B) = P (A|B) · P (B)

Bedingte Wahrscheinlichkeit:

P (A|B) = P P(A∩B) (B) P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

Vereinigung:

Sind die beiden Ereignisse (stochastisch) unabhängig voneinander, so sind die zugrunde liegenden Mengen disjunkt und weisen eine leere Schnittmenge auf. Entsprechend vereinfachen sich ein paar der Regeln bei stochastischer Unabhängigkeit zu: Multiplikationssatz: Bedingte Wahrscheinlichkeit: Vereinigung:

P (A ∩ B) = P (A) · P (B) P (A|B) = P (A) P (A ∪ B) = P (A) + P (B)

3.1.2.3 Totale Wahrscheinlichkeit Lässt sich der Ereignisraum in eine Reihe von Teilmengen Bi zerlegen, die paarweise disjunkt sind (je zwei der Menge sind disjunkt zueinander, weisen eine leere Schnittmenge auf), so gilt die folgende Regel: P (A) =

n

P (A|Bi ) · P (Bi )

i=1

Diese Regel bezeichnet man auch als das Gesetz der totalen Wahrscheinlichkeit. Praktisch kann man es sich wie einen gewichteten Mittelwert vorstellen, wobei die Gewichte aus den Wahrscheinlichkeiten P (Bi ) resultieren. Betrachtet man lediglich die Mengen A und B, so lässt sich der Ereignisraum in die disjunkten Mengen B und B C zerlegen und unter Anwendung des Gesetzes ergibt sich: P (A) = P (A|B) · P (B) + P (A|B C ) · P (B C )

3.1.2.4 Satz von Bayes Betrachtet man weiterhin einen Ereignisraum, der sich in die paarweise disjunkten Teilmengen Bi zerlegen lässt, so bietet der sogenannte Satz von Bayes eine Möglichkeit, bei einer bedingten Wahrscheinlichkeit P (A|B) die Bedingung umzudrehen zu P (B|A).

132

3 Wahrscheinlichkeitsrechnung

Grafisch kann man sich dies so vorstellen, dass der Ereignisbaum, der im Abschnitt zur bedingten Wahrscheinlichkeit dargestellt wurde, nicht von links nach rechts, sondern von rechts nach links durchlaufen wird. Mathematisch lautet der Satz von Bayes wie folgt: P (Bi ) · P (A|Bi ) P (Bi ) · P (A|Bi ) = P (Bi |A) = n P (A) k=1 P (Bk ) · P (A|Bk ) Sind lediglich die Mengen A und B gegeben, so lässt sich der Satz auf die folgende Form reduzieren: P (B|A) =

P (A|B) · P (B) P (A)

Ist die Wahrscheinlichkeit P (A) an dieser Stelle unbekannt, so kann sie, über die Zerlegung des Ereignisraums in B und B C , über das Gesetz der totalen Wahrscheinlichkeit bestimmt werden. P (A) = P (A|B) · P (B) + P (A|B C ) · P (B C )

3.1.2.5 DeMorgansche Regeln Bei der Arbeit mit Komplementärmengen können einem die sogenannten DeMorganschen Regeln Hilfe leisten und die Berechnung der entsprechenden Wahrscheinlichkeiten erleichtern. Bezogen auf Mengen lauten sie: (M ∩ N)C = M C ∪ N C (M ∪ N)C = M C ∩ N C

3.2

Aufgaben

Quick Check – Wahr oder Falsch?

Zur Lösung

• Der Satz der totalen Wahrscheinlichkeit sagt aus, dass mit zunehmender Beobachtungszahl das arithmetische Mittel sich dem theoretischen Mittelwert annähert. • Der Satz von Bayes kann genutzt werden, um P (A|B), ausgehend von P (B|A), zu bestimmen. • Die Wahrscheinlichkeitstheorie geht davon aus, dass höchstens eine Wahrscheinlichkeit von 100 % erreicht werden kann. • Der Ereignisraum ist die Vereinigung einer seiner Teilmengen mit ihrem Komplement. • Die bedingte Wahrscheinlichkeit P (A|B) und die Schnittmenge P (A ∩ B) stimmen stets überein.

3.2 Aufgaben

133

• Die Vereinigung ist kommutativ, dass heißt es gilt: P (A ∪ B) = P (B ∪ A). • Über Ereignisbäume lassen sich die Zusammenhänge der Schnittmenge P (A ∩ B) und der bedingten Wahrscheinlichkeit P (A|B) sowie der Werte der entsprechenden Komplemente AC und B C bestimmen. • Lässt sich der Ereignisraum 1 in die Teilmengen A und AC bzw. der Ereignisraum 2 in die Teilmengen B und B C zerlegen, so ergibt die Summe der bedingten Wahrscheinlichkeiten P (A|B), P (A|B C ), P (AC |B) und P (AC |B C ) gerade 100 %. • Die leere Menge enthält genau ein Element. • Vereinigt man zwei identische Mengen, so verdoppelt sich die Menge der Elemente in der Vereinigungsmenge im Vergleich zur Ausgangsmenge.

3.2.1

Mengenlehre

Aufgabe A 3-1: (6 Punkte) Zur Lösung L 3-1 Betrachten Sie die folgenden beiden Mengen A = {1; 2; 3; 5; 9} und B = {2; 4; 5; 7} und berechnen Sie die folgenden Ausdrücke: (a) (2 Punkte) A ∪ B (b) (2 Punkte) A ∩ B (c) (2 Punkte) A \ B Aufgabe A 3-2: (6 Punkte) Zur Lösung L 3-2 Betrachten Sie die folgenden beiden Mengen A = {1; 3; 5; 7; 9} und B = {0; 2; 4; 6; 8} und berechnen Sie die folgenden Ausdrücke: (a) (2 Punkte)  = A ∪ B (b) (2 Punkte) AC (c) (2 Punkte) AC \ B Aufgabe A 3-3: (7 Punkte) Zur Lösung L 3-3 Betrachten Sie die folgenden beiden Mengen A = {1; 2; 4; 7} und B = {4; 7; 8} und berechnen Sie die folgenden Ausdrücke: (a) (3 Punkte) AC ∪ B C (b) (2 Punkte) (A ∪ B)C (c) (2 Punkte) A ∩ B Aufgabe A 3-4: (6 Punkte) Zur Lösung L 3-4 Betrachten Sie die folgenden beiden Mengen A = {2; 3; 4; 5} und B = ∅ und berechnen Sie die folgenden Ausdrücke:

134

3 Wahrscheinlichkeitsrechnung

(a) (2 Punkte) A ∪ B (b) (2 Punkte) A \ B (c) (2 Punkte) B ∩ A Aufgabe A 3-5: (6 Punkte) Zur Lösung L 3-5 Betrachten Sie die folgenden beiden Mengen A = {1; 2; 3} und B = {3; 2; 1} und berechnen Sie die folgenden Ausdrücke: (a) (2 Punkte) A ∪ B (b) (2 Punkte) A ∩ B (c) (2 Punkte) A \ {1; 3; 4} Aufgabe A 3-6: (6 Punkte) Zur Lösung L 3-6 Betrachten Sie die folgenden beiden Mengen A = {0; 3; 5; 11} und B = N und berechnen Sie die folgenden Ausdrücke: (a) (2 Punkte) A ∩ B (b) (2 Punkte) A \ B (c) (2 Punkte) A ∪ B C Aufgabe A 3-7: (7 Punkte) Zur Lösung L 3-7 Betrachten Sie die folgenden beiden Mengen A = {1; 2; 3} und B = N \ {1; 3} und berechnen Sie die folgenden Ausdrücke: (a) (3 Punkte) A \ B (b) (2 Punkte) A ∪ B (c) (2 Punkte) B \ AC Aufgabe A 3-8: (8 Punkte) Zur Lösung L 3-8 Betrachten Sie die folgenden beiden Mengen A = {1; 3; 5} und B = {2; 3; 5} und berechnen Sie die folgenden Ausdrücke: (a) (2 Punkte) AC \ B (b) (3 Punkte) B C ∩ A (c) (3 Punkte) AC \ (A ∪ B C ) Aufgabe A 3-9: (9 Punkte) Zur Lösung L 3-9 Betrachten Sie die folgenden beiden Mengen A = {1; 3; 4; 7} und B = {4; 6} und berechnen Sie die folgenden Ausdrücke: (a) (3 Punkte) (AC ∪ B)C (b) (3 Punkte) (A ∩ B)C (c) (3 Punkte) (A ∩ B) \ {1; 4}

3.2 Aufgaben

135

Aufgabe A 3-10: (9 Punkte) Zur Lösung L 3-10 Betrachten Sie die folgenden beiden Mengen A = {1; 2; 3} und B = {4; 5; 6} und berechnen Sie die folgenden Ausdrücke: (a) (3 Punkte) (AC ∪ B)C (b) (3 Punkte) (A ∩ B)C (c) (3 Punkte) (A ∩ B) \ {1; 4}

3.2.2

Wahrscheinlichkeitsrechnung

Aufgabe A 3-11: (7 Punkte) Zur Lösung L 3-11 Dr. Paul unterrichtet ein Fach an drei Standorten. An den Standorten 1 und 2 sitzen jeweils 30 % seiner Studenten, während an Standort 3 40 % seiner Studenten sitzen. An Standort 1 lag die Bestehensquote der Klassen bei 50 %, an Standort 2 bei 60 % und an Standort 3 bei 90 %. (a) (3 Punkte) Wie viel Prozent der Studenten sind insgesamt durchgefallen? (b) (3 Punkte) Fragt man auf einem hochschulweiten Treffen einen Studenten, der angibt von Standort 1 zu sein, wie groß ist dann die Wahrscheinlichkeit, dass er die Klausur bestanden hat? (c) (1 Punkte) Angenommen man weiß, dass ein Student die Klausur bestanden hat, wie groß ist dann die Wahrscheinlichkeit, dass er von Standort 1 kommt? Aufgabe A 3-12: (8 Punkte) Zur Lösung L 3-12 100 Personen (männlich und weiblich) werden hinsichtlich zwei Produkten befragt. Von den Frauen bevorzugen 14 das erste Produkt. Insgesamt wird Produkt 1 von 22 % aller Befragten bevorzugt. Die Stichprobe teilt sich auf in 55 % Frauen und 45 % Männer. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass eine Frau Produkt 2 bevorzugt? (b) (2 Punkte) Sie treffen zwei Männer und eine Frau. Wie groß ist die Wahrscheinlichkeit, dass die Frau Produkt 1 und die beiden Männer Produkt 2 bevorzugen? (c) (3 Punkte) Sie treffen eine Person. Wie groß ist die Wahrscheinlichkeit, dass die Person entweder weiblich ist oder Produkt 2 bevorzugt? Aufgabe A 3-13: (7 Punkte) Zur Lösung L 3-13 In einer Studie werden insbesondere das Gewicht und die Körpergröße der Probanden erhoben. Es ist bekannt, dass 70 % entweder sehr klein oder übergewichtig sind oder beides. Ferner sind 40 % der Probanden sehr klein und 40 % normalgewichtig. (a) (3 Punkte) Sie wissen von einem Probanden nur, dass er übergewichtig ist. Wie groß ist dann die Wahrscheinlichkeit, dass er auch sehr klein ist?

136

3 Wahrscheinlichkeitsrechnung

(b) (2 Punkte) Sie wissen von einem Probanden nur, dass er sehr klein ist. Wie groß ist dann die Wahrscheinlichkeit, dass er auch übergewichtig ist? (c) (2 Punkte) Sie haben eine Gruppe von drei sehr kleinen Probanden. Wie groß ist die Wahrscheinlichkeit, dass alle drei auch übergewichtig sind? Aufgabe A 3-14: (5 Punkte) Zur Lösung L 3-14 Von 100 Probanden (65 Frauen und 35 Männer) zeigen 48 Symptome einer Krankheit, hiervon sind 19 Männer. (a) (3 Punkte) Sie treffen eine Frau, wie groß ist die Wahrscheinlichkeit, dass sie auch Zeichen der Krankheit zeigen wird? (b) (2 Punkte) Sie treffen einen Mann, wie groß ist die Wahrscheinlichkeit, dass er keine Zeichen der Krankheit zeigen wird? Aufgabe A 3-15: (6 Punkte) Zur Lösung L 3-15 Peter hat 13 Freunde. Diese teilen sich in drei Cliquen auf, die sich untereinander nicht kennen. In den ersten beiden Cliquen sind je 5 seiner Freunde und in der dritten sind 3. Aus der ersten Clique kennen 4 eine Serie, von der Peter erzählt. In Clique 2 kennen 2 die Serie und in Clique 3 kennen sie 3. (a) (3 Punkte) Wie viel Prozent von Peters Freunden kennen die Serie? (b) (3 Punkte) Wenn Sie einen Freund von Peter treffen, der die Serie nicht kennt, wie groß ist die Wahrscheinlichkeit, dass er aus Clique 2 stammt? Aufgabe A 3-16: (6 Punkte) Zur Lösung L 3-16 Im Rahmen einer klinischen Studie wird ein Medikament erprobt. 70 % der Probanden befinden sich in der Testgruppe (bekommen das Medikament) und 30 % in der Kontrollgruppe (bekommen ein Placebo). Bei 80 % der Testgruppe stellen sich positive Effekte ein, ebenso bei 5 % der Kontrollgruppe. (a) (3 Punkte) Wie viel Prozent von allen Probanden zeigen einen positiven Effekt? (b) (3 Punkte) Angenommen jemand bekommt das Medikament verabreicht, wie groß ist dann die Chance, dass er einen positiven Effekt zeigen wird? Aufgabe A 3-17: (7 Punkte) Zur Lösung L 3-17 70 % eines Jahrgangs bestehen ihren Bachelorabschluss. Hiervon entscheiden sich 30 % noch ein ergänzendes Masterstudium zu absolvieren, welches auch 90 % bestehen. (a) (4 Punkte) Wie viel Prozent eines Startjahrgangs verlassen die Uni mit einem Masterabschluss? (b) (3 Punkte) Sie treffen jemanden, der einen Masterabschluss hat. Wie groß ist die Wahrscheinlichkeit, dass er auch einen Bachelorabschluss hat?

3.2 Aufgaben

137

Aufgabe A 3-18: (9 Punkte) Zur Lösung L 3-18 Die Studenten eines Jahrgangs teilen sich wie folgt auf die drei möglichen Schwerpunkte des Studiengangs auf: 15 %, 35 %, 50 %. Von den Studierenden im ersten Schwerpunkt absolvieren 60 % noch ein Masterstudium, im zweiten Schwertpunkt 80 % und im dritten Schwerpunkt 20 %. (a) (3 Punkte) Wie viel Prozent eines Jahrgangs verlassen die Uni mit einem Masterabschluss? (b) (3 Punkte) Sie treffen jemanden, der einen Masterabschluss hat. Wie groß ist die Wahrscheinlichkeit, dass er den ersten Schwerpunkt gewählt hat? (c) (3 Punkte) Sie treffen drei ehemalige Studenten ohne Masterabschluss. Wie groß ist die Wahrscheinlichkeit, dass in der Gruppe jeweils einer aus jedem Schwerpunkt vorhanden ist? Aufgabe A 3-19: (2 Punkte) Zur Lösung L 3-19 70 % aller Studenten haben Serie 1 gesehen, während 80 % Serie 2 und 40 % Serie 3 gesehen haben. Wie groß ist die Wahrscheinlichkeit, dass jemand alle drei Serien gesehen hat? Aufgabe A 3-20: (3 Punkte) Zur Lösung L 3-20 30 % aller Studierenden absolvieren während ihres Auslandssemesters auch ein Praktikum. Es ist bekannt, dass ein Student, der im Ausland ein Praktikum absolviert, zu 70 % anschließend auch ein weiteres Praktikum im Inland absolviert. Wie viel Prozent aller Studenten absolvieren, sowohl im In- als auch im Ausland, ein Praktikum? Aufgabe A 3-21: (14 Punkte) Zur Lösung L 3-21 P (A) = 0,4, P (B) = 0,7, P (A ∩ B) = 0,25. (a) (b) (c) (d) (e)

(3 Punkte) P (A ∪ B) (2 Punkte) P (B C ) (3 Punkte) P (A ∩ B C ) (3 Punkte) P (A ∪ B C ) (3 Punkte) P (AC ∪ B C )

Aufgabe A 3-22: (15 Punkte) Zur Lösung L 3-22 P (A) = 0,5, P (B) = 1/3, P (A ∩ B) = 0,25 (a) (3 Punkte) P (A|B (b) (3 Punkte) P (B|A) (c) (3 Punkte) P (A ∪ B)

138

3 Wahrscheinlichkeitsrechnung

(d) (3 Punkte) P (AC |B C ) (e) (3 Punkte) P (B C |AC ) Aufgabe A 3-23: (3 Punkte) Zur Lösung L 3-23 Es wird mit zwei Würfen gewürfelt. Wie hoch ist die Wahrscheinlichkeit, dass die beiden Zahlen verschieden sind? Aufgabe A 3-24: (4 Punkte) Zur Lösung L 3-24 Bei einer Marktumfrage kennen 22 % aller Befragten das Produkt P1 , 30 % kennen das Produkt P2 und 40 % kennen mindestens eines der beiden Produkte. Wie viel Prozent der Befragten kennen beide Produkte? Aufgabe A 3-25: (5 Punkte) Zur Lösung L 3-25 Es seien A das Ereignis, mindestens ein Handy zu besitzen, und B das Ereignis, mindestens einen Laptop zu besitzen. Der Anteil von A beträgt 40 %, der Anteil von B ist 20 %. Ferner ist bekannt, dass der Anteil derer, die sowohl einen Laptop als auch ein Handy besitzen, 10 % beträgt. Berechnen und interpretieren Sie P (A ∪ B). Aufgabe A 3-26: (7 Punkte) Zur Lösung L 3-26 Zwei Anbieter bieten Urlaubsreisen an. Das erste Unternehmen bedient 70 % aller Kunden, das zweite die restlichen 30 % der Kunden. 30 % der Kunden des ersten Anbieters sind mit ihrem Urlaub zufrieden. Beim zweiten Anbieter sind es 60 %. (a) (3 Punkte) Wie viel Prozent sind insgesamt zufrieden? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass ein zufriedener Kunde beim ersten Anbieter gebucht hat? (c) (1 Punkte) Wie groß ist die Wahrscheinlichkeit, dass ein Kunde zufrieden ist und beim ersten Anbieter gebucht hat? Aufgabe A 3-27: (6 Punkte) Zur Lösung L 3-27 20 % aller Kunden eines Kabel-TV-Anbieters bekommen Kanal 1 und Kanal 2. Kanal 1 wird von insgesamt 75 % aller Kunden empfangen und Kanal 2 von 60 % aller Kunden. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit Kanal 2 zu empfangen, wenn bereits Kanal 1 empfangen wird? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit Kanal 1 zu empfangen, wenn bereits Kanal 2 empfangen wird? Aufgabe A 3-28: (6 Punkte) Zur Lösung L 3-28 Es finden zwei parallele VWL-Tutorien statt. 40 % aller Studenten besuchen das erste Tutorium und 60 % das zweite. Ein Student, der das erste Tutorium besucht, besteht zu

3.2 Aufgaben

139

80 % die Klausur. Ein Student, der das zweite Tutorium besucht, besteht zu 75 % die Klausur. (a) (3 Punkte) Wie viel Prozent der Studenten bestehen die Klausur? (b) (3 Punkte) Ein Student ist in der Klausur durchgefallen. Wie groß ist die Wahrscheinlichkeit, dass er das erste Tutorium besucht hat? Aufgabe A 3-29: (6 Punkte) Zur Lösung L 3-29 30 % aller Studenten beherrschen neben Englisch noch eine zweite Fremdsprache. Von diesen Studenten finden 80 % innerhalb von einem Monat nach Ende des Studiums einen Job. Bei den Studenten, die nur Englisch als Fremdsprache beherrschen, sind es nur 45 %, die innerhalb eines Monats einen Job finden. (a) (3 Punkte) Wie viel Prozent aller Studenten finden innerhalb eines Monats einen Job? (b) (3 Punkte) Ein Student hat einen Job. Wie groß ist die Wahrscheinlichkeit, dass er nur Englisch als Fremdsprache beherrscht?

3.2.3

Aufgaben mit Erklärvideos

Aufgabe A 3-30: (10 Punkte) An einer Hochschule studieren 48 % im Studiengang General Management (GM), 36 % im Studiengang Human Ressource Management (HRM) und 16 % Marketing (MA). 91 % der GM-Studenten findet direkt nach Studienende einen Job, bei den HRM-Studenten sind es 86 % und bei den MA-Studenten 79 %. (a) Bestimmen Sie die Wahrscheinlichkeit, direkt nach Studienende einen Job zu finden. (b) Angenommen Sie treffen einen Absolventen, der einen Job gefunden hat, wie groß ist die Wahrscheinlichkeit, dass er HRM studiert hat? (c) An der Hochschule studieren 4000 Studenten. Wie viele der Studenten studieren MA und wie viele davon werden direkt nach Studienende einen Job finden?

Video zur Lösung der Aufgabe

140

3 Wahrscheinlichkeitsrechnung

Aufgabe A 3-31: (10 Punkte) 41 % aller Studenten einer Elitehochschule bestehen den gesamten Einstufungstest. Dieser Test setzt sich aus einem fachlichen und einem persönlichen Teil zusammen. Den fachlichen Teil bestehen 61 % der Studenten. (a) Wie groß ist die Wahrscheinlichkeit, den persönlichen Teil zu bestehen, wenn der fachliche Teil bereits bestanden wurde? (b) Angenommen jemand hat den persönlichen Teil bestanden und die Wahrscheinlichkeit, diesen Teil zu bestehen, beträgt 46 %. Wie groß ist die Chance, dass die Person auch den fachlichen Teil bestanden hat? (c) Wie groß ist die Wahrscheinlichkeit, dass jemand mindestens einen der beiden Teile bestanden hat?

Video zur Lösung der Aufgabe

Aufgabe A 3-32: (10 Punkte) An einer Hochschule studieren die Studenten einen der drei Studiengänge NM, RBM oder PM. Die prozentualen Anteile an der Gesamtzahl der Studenten liegen bei 47 %, 31 % und 32 %. 19 % der NM-Studenten absolvieren ihr Auslandssemester in Spanien, während es bei RBM 62 % und bei PM 37 % sind. (a) Bestimmen Sie die Wahrscheinlichkeit, ein Auslandssemester in Spanien zu absolvieren. (b) Angenommen Sie treffen an einer Partneruniversität in Spanien einen der Studenten, wie groß ist die Wahrscheinlichkeit, dass er RBM studiert? (c) Welcher Anteil der Studenten studiert RBM oder studiert nicht in Spanien?

Video zur Lösung der Aufgabe

3.2 Aufgaben

141

Aufgabe A 3-33: (10 Punkte) Hans pendelt mit dem Auto zwischen Wuppertal und Dortmund. Hierbei kommt es regelmäßig zu Staus auf der Autobahn. Die Wahrscheinlichkeit, dass es morgens zu einem Stau kommt, beträgt 23 %, während die Wahrscheinlichkeit, dass er abends im Stau steht, 4 % beträgt. Die Wahrscheinlichkeit, sowohl auf der Hin- als auch auf der Rückfahrt im Stau zu stehen, beträgt 2,5 %. (a) Wie groß ist die Wahrscheinlichkeit, dass Hans morgens oder abends in einen Stau gerät? (b) Angenommen morgens gab es bereits einen Stau, wie groß ist die Wahrscheinlichkeit, dass es auch abends einen gibt? (c) Als Sie Hans abends treffen wollen, verspätet er sich aufgrund eines Staus. Wie groß ist die Wahrscheinlichkeit, dass er auch schon am Morgen im Stau stand?

Video zur Lösung der Aufgabe

Aufgabe A 3-34: (10 Punkte) Eine Hochschule hat drei Standorte, an denen Bachelor- und Masterstudiengänge angeboten werden. Die Quoten, ein angefangenes Studium abzubrechen, wurden in der folgenden Tabelle zusammengefasst: Standort/Studientyp

Bachelor

Master

Düsseldorf Berlin Hannover

15 % 20 % 28 %

19 % 19 % 25 %

Gehen Sie davon aus, dass von den Studenten (sowohl Bachelor als auch Master) 32 % in Düsseldorf, 51 % in Berlin und der Rest in Hannover studieren. (a) Wie hoch ist in diesem Fall die durchschnittliche Abbrecherquote der Bachelorstudenten? (b) Angenommen Sie treffen einen Bachelorstudenten, der sein Studium abgebrochen hat. Wie groß ist die Wahrscheinlichkeit, dass es sich um einen Studenten des Düsseldorfer Standorts handelt? (c) Wie groß ist die Wahrscheinlichkeit, dass ein zufällig ausgewählter Masterstudent entweder in Düsseldorf oder in Hannover studiert?

142

3 Wahrscheinlichkeitsrechnung

Video zur Lösung der Aufgabe

Aufgabe A 3-35: (10 Punkte) Ein Reisebüro bedient drei Reiseregionen: Europa (EUR), Fernost (FO) und Südamerika (SM). Die Kunden verteilen sich jeweils zu 41 %, 32 % und 27 % auf die drei Regionen. 72 % der EUR-Kunden buchen noch eine zweite Reise mit dem Reisebüro. Bei FOKunden beträgt diese Quote 56 % und bei SM-Kunden 81 %. (a) Berechnen Sie die Wahrscheinlichkeit, dass ein Kunde mehr als eine Reise bei dem Reisebüro bucht. (b) Sie treffen einen Kunden, der nur eine Reise gebucht hat. Wie groß ist die Wahrscheinlichkeit, dass er in Südamerika war? (c) 2018 bediente das Reisebüro 4000 Kunden. Wie viele dieser Kunden waren in Europa oder Fernost unterwegs? (Der Anteil derjenigen, die beide Regionen besuchten, beträgt 3 %.)

Video zur Lösung der Aufgabe

Aufgabe A 3-36: (10 Punkte) In dem Food Court eines Outlet-Centers gibt es drei Fast-Food-Restaurants. Das erste Restaurant frequentieren 21 % aller Besucher des Food Courts, während das zweite Restaurant von 49 % aller Besucher aufgesucht wird. Der Rest speist in dem dritten Restaurant. 82 % der Besucher des ersten und 89 % des zweiten Restaurants sind mit ihrem Essen zufrieden. Bei dem dritten Restaurant liegt die Zufriedenheit bei 61 %. (a) Wie groß ist die Wahrscheinlichkeit, dass ein Kunde nach Besuch des Food Courts zufrieden mit dem Essen ist?

3.3 Lösungen

143

(b) Wie groß ist die Wahrscheinlichkeit, dass ein unzufriedener Kunde nicht in einem der ersten beiden Restaurants gespeist hat? (c) Wie groß ist die Wahrscheinlichkeit, dass in dem ersten oder dem zweiten Restaurant gespeist wird, unter der Annahme, dass kein Kunde beide Restaurants aufsucht?

Video zur Lösung der Aufgabe

3.3

Lösungen

Lösung des Quick Checks • • • • • • • • • •

Zur Aufgabenstellung

falsch wahr wahr wahr falsch wahr wahr wahr falsch falsch

3.3.1

Mengenlehre

Lösung L 3-1: (6 Punkte)

Zur Aufgabenstellung A 3-1

(a) (2 Punkte) A ∪ B = {1; 2; 3; 4; 5; 7; 9} (b) (2 Punkte) A ∩ B = {2; 5} (c) (2 Punkte) A \ B = {1; 3; 9} Lösung L 3-2: (6 Punkte)

Zur Aufgabenstellung A 3-2

(a) (2 Punkte) A ∪ B = {0; 1; 2; 3; 4; 5; 6; 7; 8; 9} (b) (2 Punkte) AC = B = {0; 2; 4; 6; 8} (c) (2 Punkte) AC \ B = ∅

144

Lösung L 3-3: (7 Punkte)

3 Wahrscheinlichkeitsrechnung

Zur Aufgabenstellung A 3-3

(a) (3 Punkte) AC ∪ B C = {1; 2; 8} (b) (2 Punkte) (A ∪ B)C = ∅ (c) (2 Punkte) A ∩ B = {4; 7} Lösung L 3-4: (6 Punkte)

Zur Aufgabenstellung A 3-4

(a) (2 Punkte) A ∪ B = A = {2; 3; 4; 5} (b) (2 Punkte) A \ B = A = {2; 3; 4; 5} (c) (2 Punkte) B ∩ A = ∅ Lösung L 3-5: (6 Punkte)

Zur Aufgabenstellung A 3-5

(a) (2 Punkte) A ∪ B = {1; 2; 3} (b) (2 Punkte) A ∩ B = {1; 2; 3} (c) (2 Punkte) A \ {1; 3; 4} = {2} Lösung L 3-6: (6 Punkte)

Zur Aufgabenstellung A 3-6

(a) (2 Punkte) A ∩ B = {3; 5; 11} (b) (2 Punkte) A \ B = {0} (c) (2 Punkte) A ∪ B C = {0; 3; 5; 11} Lösung L 3-7: (7 Punkte)

Zur Aufgabenstellung A 3-7

(a) (3 Punkte) A \ B = {1; 3} (b) (2 Punkte) A ∪ B = N (c) (2 Punkte) B \ AC = N \ {1; 2; 3} Lösung L 3-8: (8 Punkte)

Zur Aufgabenstellung A 3-8

(a) (2 Punkte) AC \ B = ∅ (b) (3 Punkte) B C ∩ A = {1} (c) (3 Punkte) AC \ (A ∪ B C ) = AC = {2} Lösung L 3-9: (9 Punkte)

Zur Aufgabenstellung A 3-9

(a) (3 Punkte) (AC ∪ B)C = {1; 3; 7} (b) (3 Punkte) (A ∩ B)C = {1; 3; 6; 7} (c) (3 Punkte) (A ∩ B) \ {1; 4} = ∅

3.3 Lösungen

Lösung L 3-10: (9 Punkte)

145

Zur Aufgabenstellung A 3-10

(a) (3 Punkte) (AC ∪ B)C = {1; 2; 3} (b) (3 Punkte) (A ∩ B)C = {1; 2; 3; 4; 5; 6} (c) (3 Punkte) (A ∩ B) \ {1; 4} = {1; 2; 3; 4; 5; 6}

3.3.2

Wahrscheinlichkeitsrechnung

Lösung L 3-11: (7 Punkte) Zur Aufgabenstellung A 3-11 Gegeben: P (S1 ) = 0,3, P (S2 ) = 0,3, P (S3 ) = 0,4, P (D|S1 ) = 0,5, P (D|S2 ) = 0,6 und P (D|S3 ) = 0,9 (a) (3 Punkte) Gesucht: P(D) P (D) = 0,3 · 0,5 + 0,3 · 0,6 + 0,4 · 0,9 = 0,69 (b) (3 Punkte) Gesucht: P(DC |S1 ) P (D C |S1 ) = 1 − P (D|S1 ) = 1 − 0,5 = 0,5 (c) (1 Punkte) Gesucht: P(S1 |DC ) C (S1 ) P (S1 |D C ) = P (D P|S(D1 )·P = C) Lösung L 3-12: (8 Punkte) Gegeben:

0,5·0,3 0,31

= 0,4839

Zur Aufgabenstellung A 3-12

P1 P2 

M

W



8 37 45

14 41 55

22 78 100

(a) (3 Punkte) Gesucht: P(W ∩ P2) P (W ∩ P 2) = 0,41 (b) (2 Punkte) Gesucht: P(P1|W) · P(P2|M)2 2  1∩W ) P (P 2∩M) P (P 1|W ) · P (P 2|M)2 = P (P = P (W ) · P (M)

0,14 0,55

·



0,37 0,45

2

= 0,1721

(c) (3 Punkte) Gesucht: P(W ∪ P2) P (W ∪ P 2) = P (W ) + P (P 2) − P (W ∩ P 2) = 0,55 + 0,78 − 0,41 = 0,92

146

3 Wahrscheinlichkeitsrechnung

Lösung L 3-13: (7 Punkte) Zur Aufgabenstellung A 3-13 Gegeben: P (K) = 0,4; P (U E C ) = 0,4; P (K ∪ U E) = 0,7 ⇒ P (U E) = 0,6 (a) (3 Punkte) Gesucht: P(K|UE) E) P (K)+P (U E)−P (K∪U E) P (K|U E) = P P(K∩U = (U E) = 0,6 (b) (2 Punkte) Gesucht: P(UE|K) (U E) = P (U E|K) = P (K|UPE)·P (K)

0,5·0,6 0,4

0,4+0,6−0,7 0,6

= 0,5

= 0,75

(c) (2 Punkte) Gesucht: P(UE|K)3 P (U E|K)3 = 0,4219 Lösung L 3-14: (5 Punkte) Gegeben:

Zur Aufgabenstellung A 3-14

S SC 

W

M



29 36 65

19 16 35

48 52 100

(a) (3 Punkte) Gesucht: P(S|W) ) 0,29 P (S|W ) = PP(S∩W (W ) = 0,65 = 0,4462 (b) (2 Punkte) Gesucht: P(SC |M) C ∩M) 0,16 P (S C |M) = P (S P (M) = 0,35 = 0,4571

Lösung L 3-15: (6 Punkte) Zur Aufgabenstellung A 3-15 Gegeben: P (C1 ) = P (C2 ) = 5/13; P (C3 ) = 3/13; P (S|C1 ) = 0,8; P (S|C2 ) = 0,4 und P (S|C3 ) = 1 (a) (3 Punkte) Gesucht: P(S) 5 5 P (S) = 13 · 0,8 + 13 · 0,4 + (b) (3 Punkte) Gesucht: P(C2 P (C2 |S C ) =

3 13

|SC )

P (S C |C2 )·P (C2 ) P (S C )

=

· 1 = 0,6923

5 0,6· 13 1−0,6923

= 0,75

Lösung L 3-16: (6 Punkte) Zur Aufgabenstellung A 3-16 C Gegeben: P (T ) = 0,7; P (T ) = 0,3; P (P |T ) = 0,8 und P (P |T C ) = 0,05 (a) (3 Punkte) Gesucht: P(P) P (P ) = 0,7 · 0,8 + 0,3 · 0,05 = 0,575 (b) (3 Punkte) Gesucht: P(P|T) P (P |T ) = 0,8

3.3 Lösungen

147

Lösung L 3-17: (7 Punkte) Zur Aufgabenstellung A 3-17 Gegeben: P (BA) = 0,7; P (MB|BA) = 0,3 und P (MA|MB) = 0,9 (a) (4 Punkte) Es gilt zu bedenken, dass MB (Beginnt Masterstudium) eine Teilmenge von BA (Schließt Bachelor ab) ist, ebenso wie MA (Schließt Master ab) eine Teilmenge von MB (Beginnt Masterstudium) ist. Daher: Gesucht: P(MA) P (MA) = 0,7 · 0,3 · 0,9 = 0,189 (b) (3 Punkte) Gesucht: P(BA|MA) P (BA|MA) = 1, da der Bachelorabschluss eine Voraussetzung für das Masterstudium ist (MA ist eine Teilmenge von BA). Lösung L 3-18: (9 Punkte) Zur Aufgabenstellung A 3-18 Gegeben: P (S1 ) = 0,15; P (S2 ) = 0,35; P (S3 ) = 0,5; P (M|S1 ) = 0,6; P (M|S2 ) = 0,8 und P (M|S3 ) = 0,2 (a) (3 Punkte) Gesucht: P(M) ˙ + 0,35 · 0,8 + 0,5 · 0,2 = 0,47 P (M) = 0,150,6 (b) (3 Punkte) Gesucht: P(S1 |M) 1 )·P (S1 ) = 0,6·0,15 P (S1 |M) = P (M|S P (M) 0,47 = 0,1915 (c) (3 Punkte) Gesucht: P(S1 |MC ) · P(S2 |MC ) · P(S3 |MC ) C C C 1 )·P (S1 ) P (M |S2 )·P (S2 ) P (M |S3 )·P (S3 ) · · = P (S1 |M C )·P (S2 |M C )·P (S3 |M C ) = P (MP |S (M C ) P (M C ) P (M C ) 0,4·0,15 0,53

·

0,2·0,35 0,53

·

0,8·0,5 0,53

= 0,0113

Lösung L 3-19: (2 Punkte) Zur Aufgabenstellung A 3-19 Gegeben: P (S1 ) = 0,7; P (S2 ) = 0,8 und P (S3 ) = 0,4 Gesucht: P(S1 ∪ S2 ∪ S3 ) P (S1 ∪ S2 ∪ S3 ) = 0,7 · 0,8 · 0,4 = 0,224 Lösung L 3-20: (3 Punkte) Zur Aufgabenstellung A 3-20 Gegeben: P (P ) = 0,3 und P (I |P ) = 0,7 Gesucht: P(I ∩ P) P (I ∩ P ) = 0,3 · 0,7 = 0,21 Lösung L 3-21: (14 Punkte) (a) (b) (c) (d) (e)

Zur Aufgabenstellung A 3-21

(3 Punkte) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0,4 + 0,7 − 0,25 = 0,85 (2 Punkte) P (B C ) = 1 − 0,7 = 0,3 (3 Punkte) P (A ∩ B C ) = P (A) − P (A ∩ B) = 0,4 − 0,25 = 0,15 (3 Punkte) P (A ∪ B C ) = P (A) + P (B C ) − P (A ∩ B C ) = 0,4 + 0,3 − 0,15 = 0,45 (3 Punkte) P (AC ∪ B C ) = P ((A ∩ B)C ) = 1 − P (A ∩ B) = 1 − 0,25 = 0,75

148

3 Wahrscheinlichkeitsrechnung

Lösung L 3-22: (15 Punkte) (a) (3 Punkte) P (A|B) = (b) (3 Punkte) P (B|A) =

Zur Aufgabenstellung A 3-22

P (A∩B) P (B) P (A∩B) P (A)

= 0,75 = 0,5

(c) (3 Punkte) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0,5 + (d) (3 Punkte) P (AC |B C ) =

P (AC ∩B C ) P (B C )

=

1−P (A∪B) 1−P (B)

(e) (3 Punkte) P (B C |AC ) =

P (AC ∩B C ) P (AC )

=

7 1− 12 0,5

=

=

7 1− 12 2 3

1 3

− 0,25 =

7 12

= 0,625

10 12

Lösung L 3-23: (3 Punkte) Zur Aufgabenstellung A 3-23 Es gibt 6 Möglichkeiten, dass die Würfel die gleiche Augenzahl zeigen und 36 Möglichkeiten insgesamt. Somit gibt es 36−6 = 30 Möglichkeiten, dass das Ergebnis unterschiedliche Augenzahlen aufweist. Im Verhältnis zu allen Möglichkeiten ergibt sich: 30/36 = 0,8333 als Wahrscheinlichkeit, im Ergebnis unterschiedliche Augenzahlen zu haben. Lösung L 3-24: (4 Punkte) Zur Aufgabenstellung A 3-24 Gegeben: P (P1 ) = 0,22; P (P2 ) = 0,3 und P (P1 ∩ P2 ) = 0,4 Gesucht: P(P1 ∪ P2 ) P (P1 ∪ P2 ) = 0,22 + 0,3 − 0,4 = 0,12 Lösung L 3-25: (5 Punkte) Zur Aufgabenstellung A 3-25 Gegeben: P (A) = 0,4; P (B) = 0,2 und P (A ∩ B) = 0,1 Gesucht: P(A ∪ B) P (A ∪ B) = 0,4 + 0,2 − 0,1 = 0,5 Lösung L 3-26: (7 Punkte) Zur Aufgabenstellung A 3-26 Gegeben: P (A1 ) = 0,7; P (A2 ) = 0,3; P (Z ∩ A1 ) = 0,3 und P (Z ∩ A2 ) = 0,6 (a) (3 Punkte) Gesucht: P(Z) P (Z) = 0,7 · 0,3 + 0,3 · 0,6 = 0,39 (b) (3 Punkte) Gesucht: P(A1 |Z) 1 )·P (A1 ) = 0,3·0,7 P (A1 |Z) = P (Z|A P (Z) 0,39 = 0,5385 (c) (1 Punkte) Gesucht: P(Z|A1 ) P (Z|A1 ) = 0,3 Lösung L 3-27: (6 Punkte) Zur Aufgabenstellung A 3-27 Gegeben: P (K1 ) = 0,75; P (K2 ) = 0,6 und P (K1 ∩ K2 ) = 0,2 (a) (3 Punkte) Gesucht: P(K2 |K1 ) 0,2 1 ∩K2 ) P (K2 |K1 ) = P (K P (K1 ) = 0,75 = 0,2667

3.4 Wiederholungsfragen

149

(b) (3 Punkte) Gesucht: P(K1 |K2 ) 0,2 1 ∩K2 ) P (K1 |K2 ) = P (K P (K2 ) = 0,6 = 0,3333 Lösung L 3-28: (6 Punkte) Zur Aufgabenstellung A 3-28 Gegeben: P (V1 ) = 0,4; P (V2 ) = 0,6; P (B|V1 ) = 0,8 und P (B|V2 ) = 0,75 (a) (3 Punkte) Gesucht: P(B) P (B) = 0,4 · 0,8 + 0,6 · 0,75 = 0,77 (b) (3 Punkte) Gesucht: P(V1 |BC ) C (V1 ) P (V1 |B C ) = P (B P|V(B1 )·P = C)

(1−0,8)·0,4 1−0,77

= 0,3478

Lösung L 3-29: (6 Punkte) Zur Aufgabenstellung A 3-29 Gegeben: P (F ) = 0,3; P (J |F ) = 0,8 und P (J |F C ) = 0,45 (a) (3 Punkte) Gesucht: P(J) P (J ) = 0,3 · 0,8 + (1 − 0,3) · 0,45 = 0,555 (b) (3 Punkte) Gesucht: P(FC |J) C C P (F C |J ) = P (J |FP (J)·P) (F ) =

3.4

• • • • • • • •

0,45·0,7 0,555

= 0,5676

Wiederholungsfragen

Wie bildet sich die Vereinigungsmenge zweier Mengen? Wie bildet sich die Schnittmenge zweier Mengen? Was versteht man unter dem Ereignisraum? Was ist das Komplement einer Menge? Wann sind zwei Mengen disjunkt? Was sagen die DeMorganschen Regeln aus? Wie hängen Mengenlehre und Wahrscheinlichkeiten zusammen? Was versteht man unter einer bedingten Wahrscheinlichkeit? Wie berechnet sich diese? • Wie lautet der Multiplikationssatz der Wahrscheinlichkeitsrechnung? • Was versteht man unter dem Gesetz der totalen Wahrscheinlichkeit? Wann findet dies Einsatz? • Wie lautet der Satz von Bayes und in welchen Kontexten kann er Verwendung finden?

4

Verteilungen

Inhalte • • • • • • • • • • • •

Wahrscheinlichkeits-, Dichte- und Verteilungsfunktionen Mehrdimensionale Verteilungen Kombinatorik Binomialverteilung Geometrische Verteilung Hypergeometrische Verteilung Poisson-Verteilung Gleichverteilung Exponentialverteilung Normalverteilung Annährung von Verteilungen Stochastische Ungleichungen

4.1

Theoretische Grundlagen

4.1.1

Zufallsvariablen

Eine kurze Videoaufbereitung von Teilen dieses Abschnitts findet sich hier: Während es zum besseren Verständnis möglich ist, Wahrscheinlichkeiten über die Mengenlehre zu motivieren, so ist es doch für die weitere Analyse hilfreich, bei der Bestimmung der Wahrscheinlichkeit auf Funktionen abzustellen. Diese Aufgabe übernehmen

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 J. K. Perret, Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler, https://doi.org/10.1007/978-3-658-26148-1_4

151

152

4 Verteilungen

Theorie: Stetige Verteilungen

die sogenannten Zufallsvariablen. Mathematisch betrachtet ist eine Zufallsvariable X eine Abbildung der Form: X:→R Dies bedeutet, dass jedem Ereignis (jedem Element aus dem Ereignisraum) genau ein Wert (eine Wahrscheinlichkeit) zugeordnet wird. An dieser Stelle kann man auch wieder auf die Unterscheidungen zwischen stetig und diskret zurückgreifen. Eine Zufallsvariable ist diskret, wenn sie nur abzählbar unendlich viele Werte annimmt, und sie ist stetig, wenn ihr Wertebereich mit einem Teilbereich der reellen Zahlen übereinstimmt. Die Wahrscheinlichkeit, dass ein Ereignis a eintritt kann formal als P (X = a) geschrieben werden, mit X als zugrunde liegender Zufallsvariablen.

4.1.1.1 Wahrscheinlichkeits- und Dichtefunktionen Interpretiert man die Wahrscheinlichkeit P (X = a) als Funktion, die vom Ereignis a abhängt, so lässt sie sich schreiben als f (a) = P (X = a). Für diskrete Zufallsvariablen nennt man diese Funktion Wahrscheinlichkeitsfunktion. Stellt man diese Funktion grafisch dar, so ergibt sich ein Häufigkeitsdiagramm, welches man auch als Histogramm bezeichnet. Hierbei gilt zu beachten, dass sich Histogramme von reinen Häufigkeitsdiagrammen darin unterscheiden, dass nicht die Höhe der einzelnen Balken die jeweiligen Wahrscheinlichkeiten beschreibt, sondern die Fläche des Balkens (zur einfacheren Interpretation wird meist eine Balkenbreite von 1 angesetzt, sodass Fläche und Höhe übereinstimmen). Die folgende Abb. 4.1 veranschaulicht, wie ein solches Häufigkeitsdiagramm aussieht. Je mehr Werte die Zufallsvariable annehmen kann, umso schmaler werden die einzelnen Balken des Diagramms. Im stetigen Fall, in dem mit einer unendlichen, überabzählbar großen Menge an möglichen Ausprägungen die maximal detaillierteste Aufteilung erfolgt, wird das Histogramm zu einer stetigen Funktion, der sogenannten Dichtefunktion. Die Dichtefunktion, wie in Abb. 4.2 dargestellt, ist somit das stetige Pendant zur diskreten Wahrscheinlichkeitsfunktion. 4.1.1.2 Verteilungsfunktionen Beachtet man, dass gilt P () = 1, so wird deutlich, dass die Fläche unter der Wahrscheinlichkeitsfunktion gerade 1 ergeben muss, da die Fläche eines jeden Pfeilers des

4.1 Theoretische Grundlagen

153

0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00 1

2

3

4

5

6

7

8

9

10

11

12

Abb. 4.1 Histogramm 0.5

0.4

0.3

0.2

0.1

0

‐3

‐2

‐1

0

1

2

3

Abb. 4.2 Dichtefunktion

Histogramms die Häufigkeit des jeweiligen Ereignisses angibt (relative Häufigkeit). Bestimmt man nun die kumulierten Flächen unter den Pfeilern des Histogramms (kumulierte Häufigkeiten), so ergibt sich aus dem Histogramm eine ansteigende Treppenfunktion, die die grafische Darstellung der kumulierten Häufigkeiten ist. Diese Funktion nennt

154

4 Verteilungen 1.2

1

0.8

0.6

0.4

0.2

0 0

1

2

3

4

5

6

7

Abb. 4.3 Diskrete Verteilungsfunktion

man diskrete Verteilungsfunktion. Mathematisch ergibt sich die diskrete Verteilungsfunktion als Summe der einzelnen Wahrscheinlichkeit und somit als: F (k) = P (X ≤ k) =

k

P (X = i) =

i=0

k

f (i)

i=0

Grafisch lässt sie sich wie in Abb. 4.3 darstellen. Analog zu dem Übergang von der Wahrscheinlichkeitsfunktion zur Dichtefunktion ist auch beim Übergang von der diskreten zur stetigen Verteilungsfunktion die Breite der Pfeiler stetig zu verkleinern, wobei die Berechnung der kumulierten Häufigkeiten gleich bleibt (Abb. 4.4). Dieser Prozess wird etwas besser verständlich, wenn man sich überlegt, dass man in beiden Fällen die Fläche unter der Wahrscheinlichkeits- bzw. der Dichtefunktion berechnet. Hierzu weiß man allerdings, dass die Fläche unter einer stetigen Funktion durch die Stammfunktion beschrieben wird. Im stetigen Fall ergibt sich die Verteilungsfunktion somit als Stammfunktion der Dichtefunktion, was sich mathematisch wie folgt darstellen lässt:

x f (t)dt F (x) = P (X ≤ x) = −∞

Ist die Wahrscheinlichkeit dafür zu bestimmen, dass die Zufallsvariable Werte innerhalb eines bestimmten Intervalls [a; b] annimmt, so kann einfach das bestimmte Integral von a bis b über die entsprechende Dichtefunktion berechnet werden.

4.1 Theoretische Grundlagen

155

1.2

1

0.8

0.6

0.4

0.2

0

‐3

‐2

‐1

0

1

2

3

Abb. 4.4 Stetige Verteilungsfunktion

Aus dieser Erkenntnis ergeben sich die folgenden zwei Rechenregeln, die analog für stetige ebenso wie für diskrete Verteilungen gelten: P (X ≥ x) = 1 − P (X < x) = 1 − F (x) P (x ≤ X ≤ y) = P (X ≤ y) − P (X ≤ x) = F (y) − F (x) Darüber hinaus wird durch die zweite Regel deutlich, dass im stetigen Fall für eine konkrete Wahrscheinlichkeit P (X = x) P (X = x) = 0 gilt, da P (X = x) = P (x ≤ X ≤ x) = P (X ≤ x) − P (X ≤ x) = 0. Überträgt man dieses Wissen wieder zurück auf den diskreten Fall, so ist das Integral durch das Summenzeichen zu ersetzen. Hierbei ist noch wichtig zu beachten, dass im stetigen Fall P (X ≤ x) = P (X < x) + P (X = x) = P (X < x) gilt. Im diskreten Fall gilt dies nicht, da hier P (X = x) in den meisten Fällen verschieden von 0 ist.

4.1.1.3 Mehrdimensionale Zufallsvariablen Betrachtet man anstelle einer einzelnen Zufallsvariablen X einen Vektor von Zufallsvariablen χ = (X1 , . . . , Xn ), so besitzt der Vektor die Dichte- bzw. Wahrscheinlichkeitsfunktion f (x1 , . . . , xn ) und entsprechend die Verteilungsfunktion:



a1 −∞

...

an −∞

f (x1 , . . . , xn )dxn . . . dx1

(4.1)

Bei der diskreten Verteilungsfunktion ist das Integral- durch das Summenzeichen zu ersetzen. Neben der gemeinsamen Dichte- bzw. Wahrscheinlichkeitsfunktion existieren noch

156

4 Verteilungen

n Randdichtefunktionen bzw. Randdichten fX1 , . . . , fXn . Betrachtet man beispielhaft den zweidimensionalen Fall, so ergeben sich die Randdichtefunktionen als: fX1 (x1 ) = fX2 (x2 ) =

∞

−∞ f (x1 , x2 )dx2

(4.2)

−∞ f (x1 , x2 )dx1

(4.3)

∞

Die Randdichtefunktion für eine Zufallsvariable Xi im n-dimensionalen Fall ergibt sich somit durch Integration von f (x1 , . . . , xn ) nach allen Variablen außer xi , wobei über die gesamte reelle Achse hinweg integriert wird. Die Integralgrenzen sind −∞ und ∞ (praktisch werden diese durch die Grenzen der Dichtefunktion bestimmt). Analog zu den Randdichtefunktionen lassen sich auch Randverteilungsfunktionen FXi (xi ) bestimmen. Auch die Idee bedingter Wahrscheinlichkeiten lässt sich auf den Fall mehrerer Zufallsvariablen übertragen. Die bedingte Wahrscheinlichkeitsfunktion P (χ |Xi = a) bestimmt sich als: P (χ |Xi = a) =

f (x1 , . . . , xi−1 , a, xi+1 , . . . , xn ) fXi (a)

(4.4)

Die Randdichtefunktionen können auch genutzt werden, um eine Aussage über die stochastische Abhängigkeit der Zufallsvariablen zu treffen. Hier gilt, dass die Zufallsvariablen stochastisch unabhängig sind, wenn gilt: f (x1 , . . . , xn ) = fX1 (x1 , . . . , xn ) · · · · · fXn (x1 , . . . , xn )

4.1.2

(4.5)

Kombinatorik

In der Kombinatorik betrachten wir drei Perspektiven: Permutationen (Anordnungen), Variationen und Kombinationen.

4.1.2.1 Permutationen Besteht die Frage lediglich darin, wie viele Möglichkeiten existieren, dass n Objekte angeordnet werden, so ergibt sich diese Anzahl als n!. Erfolgt die Anordnung im Kreis, besitzt somit jedes Objekt einen linken und einen rechten Partner, so ergibt sich die Anzahl aller Permutationen als (n − 1)!. Schließlich ist es noch möglich, dass die n Objekte, die angeordnet werden sollen, sich nur in Hinsicht auf eine Eigenschaft unterscheiden und es mehrere Objekte gibt, die die gleiche Eigenschaft aufweisen. Zum Beispiel werden 50 Personen betrachtet, aber die Unterscheidung erfolgt danach, ob es sich um Männer (z. B. 20) oder Frauen (z. B. 30) handelt. In diesem Fall besitzt die Eigenschaft k = 2 Ausprägungen. Die

4.1 Theoretische Grundlagen

157

n! Anzahl der unterschiedlichen Anordnungen ergibt sich in einem solchen Fall über n1 !·····n . k! Angewendet auf das Beispiel würde sich hier die Anzahl der Anordnungen ergeben als 50! 20!·30! .

4.1.2.2 Variationen Bei Variationen und Kombinationen geht es darum, aus einer Menge von n Elementen eine Auswahl mit k Elementen zu treffen. Bei Variationen ist die Reihenfolge, in der die Elemente ausgewählt werden, relevant. Kann ein Element lediglich einmal ausgewählt werden, so ergibt sich die Anzahl aller n! Variationen als (n−k)! Kann im Gegensatz dazu ein Element beliebig oft ausgewählt werden, so ergibt sich die Anzahl aller Variationen als nk . Der zweite Fall findet zum Beispiel bei der Frage danach, wie viele Postleitzahlen theoretisch möglich sind, Verwendung (105 ). 4.1.2.3 Kombinationen Im Gegensatz zu Variationen spielt bei Kombinationen die Reihenfolge der Auswahl keine Rolle. Die Anzahl aller Kombinationen, wenn jedes Element maximal einmal ausgewählt   werden kann, beträgt nk , während die Anzahl aller Kombinationen, wenn jedes Element   beliebig oft ausgewählt werden kann, n+k−1 n−1 beträgt. Zu dem ersten Fall bietet Lotto mit seiner 6-aus-49-Auswahl das ideale Beispiel.

4.1.3

Bernoulli-Verteilung

Bei der Bernoulli-Verteilung sind lediglich zwei Ergebnisse möglich – die Zufallsvariable kann nur zwei Werte annehmen. Das erste Ergebnis ist jenes, das gewünscht ist, das zweite Ergebnis ist das unerwünschte Ergebnis. Die Wahrscheinlichkeit, dass das erwünschte Ereignis eintritt beträgt π . Wird die Bernoulli-Verteilung mehrfach nacheinander angewendet – man spricht auch davon, dass das Bernoulli-Experiment n-mal durchgeführt wird – so ergibt sich abhängig von der Rahmensituation und der zugrunde liegenden Frage entweder die Binomial-, die hypergeometrische oder die geometrische Verteilung. In allen drei Fälle wird die Bernoulli-Verteilung n-mal angewendet. Bei der Binomial- und der hypergeometrischen Verteilung besteht die Frage darin, wie viele der n Wiederholungen das erwünschte Ergebnis erbringen. Im Gegensatz dazu fragt die geometrische Verteilung, wann das erwünschte Ergebnis zum ersten Mal auftritt. Der Unterschied zwischen Binomial- und hypergeometrischer Verteilung schließlich liegt darin, ob die Eintrittswahrscheinlichkeit π während der n Wiederholungen konstant bleibt (Binomialverteilung) oder sich ändert (hypergeometrische Verteilung).

158

4.1.4

4 Verteilungen

Binomialverteilung

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Binomialverteilung

Bei der Binomialverteilung werden von N Elementen zufällig n Elemente in Form einer Stichprobe ausgewählt, wobei jedes Element nach der Auswahl wieder zurückgelegt wird und somit beliebig oft ausgewählt werden kann. Entsprechend wird die relative Häufigkeit der Elemente mit einer bestimmten Eigenschaft π nicht verändert (Diese Häufigkeit kann auch als Wahrscheinlichkeit interpretiert werden, zufällig ein Element mit der entsprechenden Eigenschaft auszuwählen.). Die Frage besteht darin, wie groß die Wahrscheinlichkeit ist, dass sich unter den n ausgewählten Elementen genau k Elemente befinden, die die gesuchte Eigenschaft aufweisen. Diese Wahrscheinlichkeit berechnet sich wie folgt über die Wahrscheinlichkeitsfunktion: P (X = x) =

  n · π x · (1 − π )n−x x

Besteht hingegen die Frage danach, dass mindestens oder höchstens eine bestimmte Anzahl die Eigenschaft haben soll, so ist die Frage nach den Wahrscheinlichkeiten P (X ≥ k) bzw. P (X ≤ k). Hierbei handelt es sich um die Verteilungsfunktion zur obigen Wahrscheinlichkeitsfunktion. Zur Berechnung dieser Wahrscheinlichkeiten sind entsprechend alle nachfolgenden bzw. vorhergehenden Wahrscheinlichkeiten zu berechnen und zu dem Gleichheitsfall hinzuzuaddieren. Alternativ kann eine Wahrscheinlichkeit auch in die andere umgewandelt werden via P (X ≥ k) = 1 − P (X < k) bzw. P (X ≤ k) = 1 − P (X > k). Betrachtet man zum Beispiel einen sechsseitigen Würfel und will die Wahrscheinlichkeit berechnen, mindestens eine Vier zu würfeln, so rechnet man P (X ≥ 4) = P (X = 4) + P (X = 5) + P (X = 6). Der Mittelwert bzw. Erwartungswert und die Varianz einer binomialverteilten Zufallsvariablen ergeben sich wie folgt: Erwartungswert: Varianz:

μ=n·π σ 2 = n · π · (1 − π )

4.1 Theoretische Grundlagen

4.1.5

159

Hypergeometrische Verteilung

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Hypergeometrische Verteilung

Die hypergeometrische Verteilung ist ähnlich zur Binomialverteilung. Der zentrale Unterschied besteht darin, dass sobald ein Element ausgewählt wurde, es nicht wieder zurückgelegt wird. Somit kann jedes Element maximal einmal ausgewählt werden. Entsprechend verändern sich nach jeder Auswahl die relativen Häufigkeiten. Dies spiegelt sich auch in der Wahrscheinlichkeitsfunktion wider: A N −A · P (X = k) = k N n−k n

Genauso wie bei der Binomialverteilung kann die Verteilungsfunktion P (X ≤ k) über die sukzessive Berechnung und Addition der Wahrscheinlichkeitsfunktion bestimmt werden. Erwartungswert und Varianz für die hypergeometrische Verteilung schließlich ergeben sich wie folgt: Erwartungswert: Varianz:

4.1.6

A μ=n· N

    A · 1 − A · N −n σ2 = n · N N N −1

Geometrische Verteilung

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Geometrische Verteilung

160

4 Verteilungen

Im Gegensatz zu den beiden vorangehenden Verteilungen beschäftigt sich die geometrische Verteilung nicht mit der Wahrscheinlichkeit, dass ein bestimmtes Auswahlmuster realisiert wird, sondern mit der Wahrscheinlichkeit, wann ein Ereignis zum ersten Mal eintritt. Im Detail ist nach der Wahrscheinlichkeit gefragt, dass ein Ereignis erst im k-ten Durchgang eintritt und die ersten k − 1 Durchgänge nicht eingetreten sind bzw. eintreten werden. Entsprechend bestimmt sich die Wahrscheinlichkeitsfunktion auch als: P (X = k) = π · (1 − π )k−1 Auch wenn die Grundidee verschieden von derjenigen der Binomial- und der hypergeometrischen Verteilung ist, so bestimmt sich doch die Verteilungsfunktion auf die gleiche Art und Weise. Allerdings kann man diese auch wesentlich einfacher bestimmen, wenn man die Formel für die geometrische Reihe nutzt. In diesem Fall gilt: P (X ≤ k) = 1 − (1 − π )k Erwartungswert und Varianz einer geometrisch verteilten Zufallsvariablen ergeben sich wie folgt:

4.1.7

Erwartungswert:

μ = π1

Varianz:

σ 2 = 12 − π1 π

Poisson-Verteilung

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Poisson-Verteilung

Ist die Eintrittswahrscheinlichkeit eines Ereignisses sehr gering und die Frage besteht nach der Wahrscheinlichkeit, dass eine bestimmte Anzahl eintreten wird, so bietet sich die Poisson-Verteilung an. Die zugehörige Wahrscheinlichkeitsfunktion ist gegeben als: P (X = k) = exp(−λ)

λk k!

4.1 Theoretische Grundlagen

161

Auch hier berechnet sich die Verteilungsfunktion analog wie für die Binomialverteilung. Für die Poisson-Verteilung stimmen Erwartungswert und Varianz beide mit dem Parameter λ überein. Erwartungswert: Varianz:

4.1.8

μ=λ σ2 = λ

Gleichverteilung

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Gleichverteilung

Mit der Gleichverteilung (im diskreten Fall auch als Rechteckverteilung bezeichnet) wird die erste stetige Verteilung vorgestellt. Die Gleichverteilung beschreibt die Situation, dass alle Ereignisse die gleiche Wahrscheinlichkeit haben einzutreten bzw. im stetigen Fall, dass die Dichtefunktion auf einem vorgegebenen Intervall [a; b] eine Waagerechte ist. Während die Gleichverteilung im Rahmen dieses Buchs lediglich für den stetigen Fall diskutiert wird, so kann sie auch als diskrete Verteilung auftreten (das Ergebnis beim Wurf eines normalen Würfels ist gleich verteilt, allerdings handelt es sich hierbei um eine diskrete Verteilung, da nur eine endliche Anzahl an Ergebnissen möglich ist). Die Dichtefunktion der Gleichverteilung lautet: f (x) =

für a ≤ x ≤ b 0 sonst

1 b−a

Integriert man diese Funktion, erhält man die zugehörige Verteilungsfunktion: ⎧ ⎪ ⎨ 0 für x < a F (x) = P (X ≤ x) = x−a b−a für a ≤ x ≤ b ⎪ ⎩ 1 für b < x

162

4 Verteilungen

Beide Funktionen sind lediglich auf dem zuvor definierten Intervall [a; b] gültig. Erwartungswert und Varianz ergeben sich hier wie folgt:

4.1.9

Erwartungswert:

μ = a+b 2

Varianz:

2 σ 2 = (b−a) 12

Exponentialverteilung

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Exponentialverteilung

Die Exponentialverteilung ist das stetige Pendant zur geometrischen Verteilung. Es soll hierbei bestimmt werden, wie groß die Wahrscheinlichkeit ist, bis ein Ereignis eintritt, wobei diese Wahrscheinlichkeit unabhängig vom Startzeitpunkt ist. Es ergibt sich die folgende Dichtefunktion für die Exponentialverteilung: f (x) =

λ · exp(−λ · x) für x ≥ 0 0 sonst

Wird die Dichtefunktion integriert, so ergibt sich die folgende Verteilungsfunktion: F (x) = P (X ≤ x) =

1 − exp(−λ · x) für x ≥ 0 0 sonst

Schließlich können noch der Erwartungswert und die Varianz bestimmt werden. Gerade an diesen beiden Größen erkennt man die Nähe zur geometrischen Verteilung. Erwartungswert:

μ = λ1

Median:

x0,25 = 0,693 λ

Varianz:

σ 2 = 12 λ

4.1 Theoretische Grundlagen

163

4.1.10 Normalverteilung Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Normalverteilung

Bei der Normalverteilung handelt es sich um die wichtigste Verteilung im Kontext der Statistik, da die meisten Sachverhalte in der Realität normalverteilt sind oder sich die ihnen zugrunde liegende Verteilung durch die Normalverteilung annähern lässt. In Bezug auf diese Relevanz weist die Normalverteilung einen großen Nachteil auf. Ihre Dichtefunktion kann zwar wie folgt problemlos angegeben werden: f (x) = φ(x) = √

1

  2 2π σ 2 · exp − (x−μ) 2σ 2

Zu dieser Funktion kann allerdings nicht auf normalem Weg eine Stammfunktion bestimmt werden, sodass die Verteilungsfunktion nur als Integral geschrieben werden kann:

F (z) = (z) =

z

−∞

 2 1 x dx · exp − √ 2 2π

Dieses Problem macht es erforderlich, dass die jeweils gesuchte Wahrscheinlichkeit stets in einer Tabelle nachgeschlagen werden muss. Dieses Problem verkompliziert sich dadurch, dass es abhängig von Mittelwert und Varianz theoretisch eine unendlich große Anzahl an Normalverteilungen gibt und entsprechend eine unendlich hohe Anzahl an Nachschlagewerken erforderlich wäre. Diesem Problem begegnet man, indem alle Werte x, für die eine Wahrscheinlichkeit der Form P (X ≤ x) berechnet werden soll, zunächst standardisiert und normalisiert werden. Dies bedeutet, dass die jeweils zugrunde liegende Normalverteilung so transformiert wird, dass die am Ende resultierende Normalverteilung stets einen Mittelwert von 0 und eine Varianz von 1 aufweist. Diese besondere Normalverteilung bezeichnet man als Standardnormalverteilung. Da alle Normalverteilungen in die Standardnormalverteilung transformiert werden können, genügt es alleine die Werte der Standardnormalverteilung zu tabellieren. Wie eine Variable standardisiert und normalisiert

164

4 Verteilungen

wird, ist in der Übersicht unten dargestellt, ebenso wie weitere Rechenregeln für die Standardnormalverteilung. Standardisierung:

  = (z) F (x) = x−μ σ

Symmetrie: Symmetrie: Symmetrie:

P (Z ≤ z) = P (Z ≥ −z) (−z) = 1 − (z)    P (|X − μ| ≥ c) = 2 1 − σc

4.1.11 Annäherung von Verteilungen Wie im Abschnitt zur Normalverteilung bereits angeregt, können fast alle wichtigen Verteilungen durch die Normalverteilung angenähert werden. Aber auch andere Verteilungen können verwendet werden, um einander zu approximieren. Im Folgenden wird zusammenfassend dargestellt, wie die jeweils benötigten Parameter aus den bekannten Informationen bestimmt werden können und welche Bedingungen gegeben sein müssen, damit die Annäherung möglich ist und die Abweichungen vom tatsächlichen Ergebnis innerhalb von vertretbaren Grenzen bleiben. Hypergeometrische Verteilung durch Binomialverteilung Benötigt wird die Eintrittswahrscheinlichkeit des Ereignisses. Diese bestimmt sich als A . π=N Die Binomialverteilung kann dann zur Annäherung der hypergeometrischen Verteilung herangezogen werden, wenn entweder die Anzahl der Elemente sehr groß oder die Stichprobe sehr klein ist. Mathematisch ausgedrückt muss die Bedingung Nn ≤ 0,05 erfüllt sein. Binomialverteilung durch Poisson-Verteilung Der Parameter λ und damit der Mittelwert und die Varianz der Poisson-Verteilung ergeben sich wie folgt über die Formel des Mittelwerts der Binomialverteilung λ = n · π . Damit die Binomialverteilung durch die Poisson-Verteilung angenähert werden kann, muss zum einen die Stichprobe groß genug sein, sprich n > 30. Ferner muss die Eintrittswahrscheinlichkeit des Ereignisses möglichst klein sein, sprich π ≤ 0,05. Binomialverteilung durch Normalverteilung Soll die Normalverteilung zur Approximation herangezogen werden, so sind zunächst Mittelwert und Varianz zu bestimmen. Dies ist einfach über die entsprechenden Formeln der Binomialverteilung möglich als μ = n · π und σ 2 = n · π · (1 − π ). Die Bedingung, wann die Approximation möglich ist, sieht mit n·π ·(1−π ) > 9 etwas kompliziert aus, sagt letzten Endes aber nur aus, dass die Stichprobe groß genug sein muss (n ≥ 50 wird oft als haltbare Vereinfachung angesehen).

4.1 Theoretische Grundlagen

165

Poisson-Verteilung durch Normalverteilung Da der Mittelwert und die Varianz direkt über den Parameter λ gegeben sind, können beide direkt entsprechend übernommen werden als μ = λ und σ 2 = λ. Die einzige Voraussetzung, die hierbei gestellt werden muss, ist, dass λ > 9 und somit Mittelwert und Varianz einen gewissen Mindestwert einhalten. Hypergeometrische Verteilung durch Normalverteilung Möchte man die hypergeometrische Verteilung durch die Normalverteilung annähern, so ergeben sich sowohl die entsprechenden Kennzahlen μ und σ , der Mittelwert und die   A A A . und σ = n · N · 1− N Varianz aus μ = n · N Auch die Anforderungen setzen sich aus den Anforderungen, erst die hypergeometrische durch die Binomialverteilung und die dann durch die Normalverteilung anzunähern,   A A > 9. Die Motivation hierzu ist entsprechend · 1− N zusammen als Nn ≤ 0,05 und n · N die gleiche wie in den beiden Einzelschritten.

4.1.12 Stochastische Ungleichungen Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Stochastische Ungleichungen

Zuweilen ist es notwendig, lediglich eine Abschätzung einer Wahrscheinlichkeit zu bekommen, gerade wenn die Berechnung der tatsächlichen Wahrscheinlichkeiten sehr anspruchsvoll wäre. Hierzu gibt es zwei hilfreiche Ansätze. Markow-Ungleichung Soll lediglich die Verteilungsfunktion abgeschätzt werden, so bietet sich die MarkowUngleichung an. Diese lautet wie folgt: P (|X| ≥ a) ≤

μ a

Tschebyscheff-Ungleichung Geht es dahingegen um eine Abschätzung der Abweichung a einer Zufallsvariablen vom Mittelwert, so kann die folgende Tschebyscheff-Ungleichung verwendet werden:

166

4 Verteilungen

P (|X − μ| ≥ a) ≤

σ2 a2

Bei der Tschebyscheff-Ungleichung ist zu beachten, dass eine Schätzung der Gegenwahrscheinlichkeit gemäß der folgenden Formel abzuschätzen ist: P (|X − μ| < a) ≥

σ2 a2

Zusammenfassend kann man festhalten, dass die Tschebyscheff-Ungleichung etwas genauere Ergebnisse liefert als die Markow-Ungleichung. Beide Ungleichungen können auch so umgeformt werden, dass das jeweilige Komplement bestimmt wird.

4.1.13 Methodenwahl Der folgende Entscheidungsbaum kann bei der Auswahl der passenden Wahrscheinlichkeit hilfreich sein (Abb. 4.5). Darüber hinaus können die folgenden allgemeinen Regeln dabei helfen, die richtige Verteilung auszuwählen: • Ist die Eintrittswahrscheinlichkeit eines Ereignisses sehr gering, handelt es sich wahrscheinlich um die Poisson-Verteilung. • Wird eine Stichprobe gezogen mit Zurücklegen, gilt die Binomialverteilung. Das Zurücklegen kann derart interpretiert werden, dass die Wahrscheinlichkeit, dass die betrachtete Eigenschaft auftritt, sich niemals ändert. Auch ist eine unendliche Anzahl an Wiederholungen möglich. Mehrere Wiederholungen? ja

nein Wahr. immer gleich?

Erstes Eintreten?

ja

Diskret?

ja

Geo‐ metrische Verteilung

ja

nein

Fixe Eintrittwahr.?

nein

Expo‐ nential‐ Verteilung

Abb. 4.5 Verteilungswahl

ja

Binomial Verteilung

nein

Hypergeo‐ metrische Verteilung

nein

diskret

ja

Rechteck Verteilung

diskret?

nein

Gleich Verteilung

ja

Poisson Verteilung

nein

Normal Verteilung

4.2 Realisierung in Excel

167

• Wird eine Stichprobe gezogen ohne Zurücklegen, gilt die hypergeometrische Verteilung. Da nicht zurückgelegt wird, wird sich die Wahrscheinlichkeit, dass die betrachtete Eigenschaft auftritt, mit jeder Wiederholung ändern. Auch ist nur eine endliche Anzahl an Wiederholungen möglich, insbesondere sind nur maximal N Wiederholungen möglich. • Spielt bei der Berechnung der Wahrscheinlichkeit die Vergangenheit keine Rolle; zum Beispiel, wie oft bereits eine Auswahl getroffen wurde oder wie lange eine Glühbirne bereits brennt, dann handelt es sich wahrscheinlich um die Exponentialverteilung.

4.2

Realisierung in Excel

4.2.1

Binomialverteilung

Sowohl die Werte der Wahrscheinlichkeits- als auch der Verteilungsfunktion der Binomialverteilung können mit der Hilfe von Excel berechnet werden. Hierzu findet die Funktion BINOM.VERT(x; n; π ; K) Anwendung. An dieser Stelle wurde direkt auf die Notation, die sich auch in den anderen Teilen des Buchs wiederfindet, abgestellt. Lediglich der Parameter K ist an dieser Stelle neu hinzugekommen. K kann die Werte W AH R oder F ALSCH annehmen. Wird der Wert F ALSCH verwendet, so berechnet Excel den Wert der Wahrscheinlichkeitsfunktion P (X = x). Wird der Wert W AH R verwendet, so berechnet Excel den Wert der Verteilungsfunktion P (X ≤ x).

Erklärungen Excel: Binomialverteilung

4.2.2

Hypergeometrische Verteilung

Sowohl die Werte der Wahrscheinlichkeits- als auch der Verteilungsfunktion der hypergeometrischen Verteilung können mit der Hilfe von Excel berechnet werden. Hierzu findet die Funktion HYPGEOM.VERT(x; n; A; N; K) Anwendung. An dieser Stelle wurde direkt auf die Notation, die sich auch in den anderen Teilen des Buchs wiederfindet, abgestellt. Lediglich der Parameter K ist an dieser Stelle neu hinzugekommen. K kann die Werte W AH R oder F ALSCH annehmen. Wird der Wert F ALSCH verwendet, so berechnet Excel den Wert der Wahrscheinlichkeitsfunktion P (X = x). Wird der Wert W AH R verwendet, so berechnet Excel den Wert der Verteilungsfunktion P (X ≤ x).

168

4 Verteilungen

Erklärungen Excel: Hypergeometrische Verteilung

4.2.3

Poisson-Verteilung

Sowohl die Werte der Wahrscheinlichkeits- als auch der Verteilungsfunktion der PoissonVerteilung können mit der Hilfe von Excel berechnet werden. Hierzu findet die Funktion POISSON.VERT(x; λ; K) Anwendung. An dieser Stelle wurde direkt auf die Notation, die sich auch in den anderen Teilen des Buchs wiederfindet, abgestellt. Lediglich der Parameter K ist an dieser Stelle neu hinzugekommen. K kann die Werte W AH R oder F ALSCH annehmen. Wird der Wert F ALSCH verwendet, so berechnet Excel den Wert der Wahrscheinlichkeitsfunktion P (X = x). Wird der Wert W AH R verwendet, so berechnet Excel den Wert der Verteilungsfunktion P (X ≤ x).

Erklärungen Excel: Poisson Verteilung

4.2.4

Exponentialverteilung

Sowohl die Werte der Dichte- als auch der Verteilungsfunktion der Exponentialverteilung können mit der Hilfe von Excel berechnet werden. Hierzu findet die Funktion EXPON.VERT(x; λ; K) Anwendung. An dieser Stelle wurde direkt auf die Notation, die sich auch in den anderen Teilen des Buchs wiederfindet, abgestellt. Lediglich der Parameter K ist an dieser Stelle neu hinzugekommen. K kann die Werte W AH R oder F ALSCH annehmen. Wird der Wert F ALSCH verwendet, so berechnet Excel den Wert der Dichtefunktion. Da es sich um eine stetige Verteilung handelt, gilt P (X = x) = 0 und P (X = x) stimmt nicht mit dem Wert der Dichtefunktion an der Stelle x überein. Wird der Wert W AH R verwendet, so berechnet Excel den Wert der Verteilungsfunktion P (X ≤ x).

4.3 Aufgaben

169

Erklärungen Excel: Exponentialverteilung

4.2.5

Normalverteilung

Sowohl die Werte der Dichte- als auch der Verteilungsfunktion der Normalverteilung können mit der Hilfe von Excel berechnet werden. Hierzu findet die Funktion NORM.VERT(x; μ; σ ; K) Anwendung. An dieser Stelle wurde direkt auf die Notation, die sich auch in den anderen Teilen des Buchs wiederfindet, abgestellt. Lediglich der Parameter K ist an dieser Stelle neu hinzugekommen. K kann die Werte W AH R oder F ALSCH annehmen. Wird der Wert F ALSCH verwendet, so berechnet Excel den Wert der Dichtefunktion. Da es sich um eine stetige Verteilung handelt, gilt P (X = x) = 0 und P (X = x) stimmen nicht mit dem Wert der Dichtefunktion an der Stelle a überein. Wird der Wert W AH R verwendet, so berechnet Excel den Wert der Verteilungsfunktion P (X ≤ x). Soll anstelle der allgemeinen Normalverteilung direkt die Standardnormalverteilung verwendet werden, so können entweder μ = 0 und σ = 1 in der obigen Funktion gesetzt werden. Alternativ kann die Funktion NORM.S.VERT(x; K) verwendet werden.

Erklärungen Excel: Normalverteilung

4.3

Aufgaben

Quick Check – Wahr oder Falsch?

Zur Lösung

• Die Wahrscheinlichkeit, dass ein Ereignis, im Kontext der hypergeometrischen Verteilung, eintritt, ist konstant. • Die Binomialverteilung ergibt sich, wenn das Bernoulli-Experiment n-mal in Folge ausgeführt wird.

170

• • • • • • • •

• • • • • • • • • •

4 Verteilungen

Die Poisson-Verteilung geht von einer geringen Eintrittswahrscheinlichkeit aus. Die Verteilungsfunktion einer diskreten Verteilung ist eine Treppenfunktion. Bei der Poisson-Verteilung stimmen Mittelwert und Varianz überein. Für großes N stimmen die Binomial- und die hypergeometrische Verteilung nahezu überein. Bei der Bernoulli-Verteilung werden n Beobachtungen ohne Zurücklegen getätigt. Histogramme sind das diskrete Pendant zur stetigen Dichtefunktion. Bei der Poisson-Verteilung spielt es eine Rolle, wie häufig ein Experiment durchgeführt wird. Die Binomialverteilung ist nichts anderes als die Summe aller Teilmengen, die die gewünschten Eigenschaften aufweisen, multipliziert mit ihren Eintrittswahrscheinlichkeiten. Die Normalverteilung ist die stetige Version der Poisson-Verteilung. Bei einer stetigen Verteilung beträgt die Wahrscheinlichkeit eines konkreten Ereignisses stets 0. Die Verteilungsfunktion ist die Stammfunktion der Dichtefunktion. Bei der Normalverteilung ist die Dichtefunktion leicht rechtsschief. Die Varianz der Standardnormalverteilung hängt von der Anzahl der Wiederholungen des Experiments ab. Die Dichtefunktion der Gleichverteilung besitzt genau ein Maximum. Das Maximum der Dichtefunktion der Normalverteilung liegt an der Stelle des Mittelwerts. Bei der Exponentialverteilung spielt die bisherige Entwicklung keine Rolle für die Bestimmung der Eintrittwahrscheinlichkeit. Die Poisson-Verteilung ergibt sich als Produkt zweier normalverteilter Zufallsvariablen. Die Normalverteilung ist linksschief.

4.3.1

Kombinatorik

Aufgabe A 4-1: (4 Punkte) Zur Lösung L 4-1 In einer Abteilung arbeiten 10 Personen. (a) (2 Punkte) Wie viele Anordnungen sind möglich, wenn sich alle Mitarbeiter an einen runden Tisch setzen? (b) (2 Punkte) Es soll ein Projektteam mit vier Mitarbeitern gebildet werden. Wie viele unterschiedliche Projektteams sind möglich? Aufgabe A 4-2: (3 Punkte) Zur Lösung L 4-2 Amazon verkauft Geschenkgutscheine, deren Code aus 14 Zeichen besteht. Jedes Zeichen kann entweder ein Großbuchstabe oder eine Zahl sein. Wie viele Geschenkgutscheine

4.3 Aufgaben

171

können gleichzeitig aktiv sein? (Beachten Sie, dass die Reihenfolge des Codes relevant ist.) Aufgabe A 4-3: (3 Punkte) Zur Lösung L 4-3 Ein Passwortgenerator erzeugt zufällig Passwörter unter Ausnutzung von Buchstaben, Zahlen und 28 Sonderzeichen. Bestimmen Sie, wie viele Möglichkeiten für ein vierstelliges Passwort existieren. Aufgabe A 4-4: (3 Punkte) Zur Lösung L 4-4 Aus 20 Abgeordneten wird ein Kabinett mit vier Ministern gebildet, wobei die Minister gemäß ihrer Verantwortung angeordnet werden können. Wie viele unterschiedliche Kabinettsbesetzungen sind denkbar? Aufgabe A 4-5: (3 Punkte) Zur Lösung L 4-5 Ein Produkt eines Unternehmens besteht aus fünf Bestandteilen, von denen beliebige Kombinationen erworben werden können. Wie viele unterschiedliche Bestellvarianten sind hierbei denkbar? Aufgabe A 4-6: (3 Punkte) Zur Lösung L 4-6 Aus einem Pool von zehn Softwarefeatures können sich die Kunden ihr eigenes Produkt zusammenstellen. Die Kunden müssen mindestens drei der Varianten zusammen bestellen. Wie viele Kombinationen sind theoretisch möglich? Aufgabe A 4-7: (3 Punkte) Zur Lösung L 4-7 Die fünf Fahrzeuge des Fuhrparks werden abends zufällig auf den fünf angemieteten Parkplätzen des Parkhauses abgestellt. Wie viele unterschiedliche Möglichkeiten existieren, dass die Autos abgestellt werden? Aufgabe A 4-8: (3 Punkte) Zur Lösung L 4-8 Der Fuhrpark eines Unternehmens umfasst vier Pkws und sechs Transporter. Diese werden auf den entsprechenden Parkplätzen abgestellt. Wie viele unterschiedliche Möglichkeiten existieren, dass die Autos abgestellt werden, wenn nur der Typ des Wagens eine Rolle spielt? Aufgabe A 4-9: (3 Punkte) Zur Lösung L 4-9 Wie viele Varianten gibt es einen Pkw zu produzieren, wenn er zehn Farben haben kann, es die Option eines Schiebedachs gibt, vier mögliche Soundsysteme und fünf verschiedene Varianten der Innenausstattung möglich sind? Aufgabe A 4-10: (3 Punkte) Zur Lösung L 4-10 Aus einem Pool von 30 Aufgaben entnimmt ein Dozent fünf Aufgaben, für eine Klausur. Wie viele unterschiedliche Klausuren sind theoretisch denkbar?

172

4.3.2

4 Verteilungen

Binomialverteilung

Aufgabe A 4-11: (6 Punkte) Zur Lösung L 4-11 Im städtischen Schwimmbad wurde festgestellt, dass jemand, der vom Beckenrand springt, sich mit einer 4 %-Wahrscheinlichkeit verletzt. (a) (4 Punkte) Bademeister Bob beobachtet, wie eine Gruppe von vier Jungen in das Becken springt. Wie groß ist die Wahrscheinlichkeit, dass mindestens drei der Jungen sich durch den Sprung verletzen werden? (b) (2 Punkte) Jeden Monat springen etwa 60 Kinder vom Beckenrand in das Becken. Wie viele Unfälle erwartet der Bademeister pro Monat? Aufgabe A 4-12: (7 Punkte) Zur Lösung L 4-12 Der Zug kommt mit einer Wahrscheinlichkeit von 30 % mindestens 2 Minuten zu spät. (a) (2 Punkte) Bob fährt in einer Woche fünfmal mit dem Zug. Wie groß ist die Wahrscheinlichkeit, dass der Zug nur einmal zu spät ankommt? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass der Zug mehr als einmal zu spät kommt? (c) (2 Punkte) Angenommen, Bob fährt jeden Monat 22-mal mit dem Zug. Wie groß ist die Wahrscheinlichkeit, genau zweimal zu spät zu sein? Aufgabe A 4-13: (8 Punkte) Zur Lösung L 4-13 Fast alle Süßigkeiten einer Packung (95 %) erfüllen die Formvorgaben des Herstellers. (a) (2 Punkte) Paul nimmt sich sieben Bonbons aus einer Packung. Wie groß ist die Wahrscheinlichkeit, dass drei davon nicht so aussehen, wie vom Hersteller gewollt? (b) (3 Punkte) Eine Tüte enthält 50 Bonbons. Wie groß ist die Wahrscheinlichkeit, dass mindestens ein Bonbon pro Packung nicht die gewünschte Form hat? (c) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass weniger als drei und mehr als ein Bonbon in einer Tüte nicht der Herstellerbeschreibung entsprechen? Aufgabe A 4-14: (10 Punkte) Zur Lösung L 4-14 Die Mortalitätsrate von Charakteren einer Fernsehserie beträgt 20 % pro Staffel. (a) (3 Punkte) Angenommen eine Staffel startet mit 12 Charakteren. Wie groß ist die Wahrscheinlichkeit, dass am Ende der Staffel noch alle am Leben sind? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass von 12 Charakteren zwei, drei oder vier im Rahmen einer Staffel sterben? (c) (3 Punkte) Wie viele der ursprünglichen 40 Hauptcharaktere werden nach sieben Staffeln noch übrig sein?

4.3 Aufgaben

173

Aufgabe A 4-15: (9 Punkte) Zur Lösung L 4-15 Die Chance, bei einem Gewinnspiel zu gewinnen, beträgt 1,2 %. (a) (2 Punkte) Bob nimmt neunmal an dem Gewinnspiel teil. Wie groß ist die Wahrscheinlichkeit, dass er nie gewinnt? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass er mindestens einmal gewinnt? (c) (4 Punkte) Bill nimmt auch neunmal teil. Wie groß ist die Wahrscheinlichkeit, dass sowohl Bob als auch Bill einmal gewinnen? Aufgabe A 4-16: (7 Punkte) Zur Lösung L 4-16 Die Fehlerquote einer Maschine beträgt 0,1 %. In zehn Tagen wird je ein Produktionsdurchlauf beobachtet. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass keiner dieser Durchläufe fehlerhaft verläuft? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mindestens ein Fehler dabei beobachtet wird? (c) (2 Punkte) Angenommen die Tagesproduktion liegt bei 2500. Wie viele dieser Teile sind voraussichtlich fehlerhaft? Aufgabe A 4-17: (7 Punkte) Zur Lösung L 4-17 Im Rahmen einer Untersuchung des Qualitätsmanagements entnehmen fünf Tester unabhängig voneinander je ein Teil, prüfen es und legen es dann zurück. An einem normalen Tag weisen etwa 5 von 1000 Teilen einen Fehler auf. (a) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass keiner der Tester einen Fehler entdeckt? Wie groß ist die Wahrscheinlichkeit, dass jeder einen Fehler entdeckt? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass ein oder weniger Fehler vorkommen? Aufgabe A 4-18: (6 Punkte) Zur Lösung L 4-18 Eine Maschine wählt zufällig eines von sechs Mustern zur Produktion aus, wobei alle Muster die gleiche Häufigkeit aufweisen. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass bei fünf Produkten einmal Muster 1 vorkommt? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mindestens zweimal Muster 2 vorkommt? Aufgabe A 4-19: (6 Punkte) Zur Lösung L 4-19 Eine Maschine weist fünf mögliche Fehlerquellen auf. Die Chance, dass ein Fehler an Position 1 oder 3 auftritt, beträgt 30 %.

174

4 Verteilungen

(a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass bei drei Fehlern an einem Tag alle drei an Stelle 1 auftreten? (b) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass kein Fehler an Stelle 3 auftritt? (c) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass ein Fehler an Stelle 1 und einer an Stelle 3 auftritt? Aufgabe A 4-20: (5 Punkte) Zur Lösung L 4-20 Bestimmen Sie die Wahrscheinlichkeit, dass von drei Produkten alle nach Markteinführung von den Konsumenten akzeptiert werden, wenn die Wahrscheinlichkeit der Akzeptanz 40 % beträgt? Wie groß ist die Wahrscheinlichkeit, dass mindestens zwei Produkte akzeptiert werden? Aufgabe A 4-21: (3 Punkte) Zur Lösung L 4-21 Zu Beginn einer Unterrichtsstunde wird zufällig einer der Schüler ausgelost, der eine Frage zum Thema der vorherigen Unterrichtsstunde beantworten muss. Es zeigt sich, dass 3/4 der Schüler die Frage korrekt beantworten können. In einem Halbjahr finden 20 Unterrichtsstunden statt. Wie groß ist die Wahrscheinlichkeit, dass in einem Halbjahr zwei oder mehr Schüler die Frage nicht beantworten können? Aufgabe A 4-22: (7 Punkte) Zur Lösung L 4-22 Sie lassen sich von Excel vier Zufallszahlen im Bereich 0 bis 49 generieren. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass alle vier Zahlen ungerade sind? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mindestens die Hälfte der Zahlen kleiner als 10 ist?

4.3.3

Hypergeometrische Verteilung

Aufgabe A 4-23: (9 Punkte) Zur Lösung L 4-23 Pro Stunde werden 22 Einheiten eines Gutes produziert. Aus Erfahrung weiß man, dass an einem durchschnittlichen Tag die Hälfte aller Einheiten direkt als Ersatzteile an Kunden ausgeliefert werden. Die Qualitätssicherung begutachtet jeweils zwei Einheiten eines jeden Stundensatzes. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass kein Teil als Ersatzteil verschickt wird? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mindestens eins der Teile als Ersatzteil verschickt wird? (c) (2 Punkte) Wie viele Ersatzteile werden an einem Tag mit zwei Acht-StundenSchichten im Durchschnitt produziert?

4.3 Aufgaben

175

Aufgabe A 4-24: (11 Punkte) Zur Lösung L 4-24 Hans besucht ein Whisky Tasting. Er weiß, dass ihm etwa die Hälfte aller Whiskys schmeckt. Aus einem Sortiment von 50 Whiskys wählt er fünf Whiskys aus, die er verkostet. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass ihm alle Whiskys schmecken? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mindestens ein Whisky nicht schmeckt? (c) (4 Punkte) Angenommen er führt das Tasting dreimal nacheinander durch und wählt jedes Mal andere Whiskys. Wie groß ist die Wahrscheinlichkeit, dass ihm drei Whiskys nicht schmecken? Aufgabe A 4-25: (7 Punkte) Zur Lösung L 4-25 Hans hat eine Sammlung mit 250 Filmen auf DVD zu Hause. Von diesen Filmen hat er 150 bereits gesehen. Für einen DVD-Abend wählt seine Freundin zwei Filme aus. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass Hans beide Filme bereits gesehen hat? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass er zumindest einen Film noch nicht kennt? Aufgabe A 4-26: (12 Punkte) Zur Lösung L 4-26 Die Chance, dass ein Produkt fehlerhaft ist, beträgt 5 %. Das Qualitätsmanagementteam entnimmt auf einmal fünf Teile und prüft ihre Qualität. Gehen Sie bei der Beantwortung davon aus, dass die Tagesproduktion 100 beträgt. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass alle Teile fehlerhaft sind? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass kein Teil fehlerhaft ist? (c) (6 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mindestens drei Teile fehlerhaft sind? Aufgabe A 4-27: (9 Punkte) Zur Lösung L 4-27 Die Chance, in den Betriebsrat gewählt zu werden, beträgt 6 %. In einer Abteilung des Unternehmens arbeiten fünf Mitarbeiter. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass keiner von ihnen in den Betriebsrat gewählt wird? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass zwei oder mehr von ihnen in den Betriebsrat gewählt werden? (c) (2 Punkte) Wie groß ist der Betriebsrat, wenn in dem Unternehmen insgesamt 500 Personen arbeiten?

176

4 Verteilungen

Aufgabe A 4-28: (10 Punkte) Zur Lösung L 4-28 In einem Unternehmen arbeiten 40 Mitarbeiter mit einem Masterabschluss und 10 mit einem Bachelorabschluss. Zur Bildung eines Projektteams werden zufällig vier Personen ausgewählt. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass alle Teammitglieder lediglich einen Bachelorabschluss haben? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass alle einen Masterabschluss haben? (c) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mindestens die Hälfte einen Masterabschluss hat? Aufgabe A 4-29: (11 Punkte) Zur Lösung L 4-29 Von 60 E-Mails, die Celine an einem Tag bekommt, sind im Durchschnitt 20 Spammails. Nach der Mittagspause kommt sie an ihren Rechner zurück und hat sechs neue Mails. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass dies alles Spams sind? (b) (5 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mindestens zwei normale Mails dabei sind? (c) (3 Punkte) Die durchschnittliche Spammail hat eine Größe von 60 KB. Wie viel Speicherplatz belegen die Spammails, die sich bei Celine in einem Jahr sammeln, wenn sie nie E-Mails löscht? Aufgabe A 4-30: (7 Punkte) Zur Lösung L 4-30 Jeden Monat nehmen von 100 Kunden 20 die Skontoregelung in Anspruch. Hans hat heute fünf Aufträge reinbekommen. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass genau einer die Skontoregelung in Anspruch nimmt? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mehr als einer die Regelung in Anspruch nimmt? Aufgabe A 4-31: (7 Punkte) Zur Lösung L 4-31 Von 50 Süßigkeiten in einer Packung sind 30 süß und der Rest sauer. Angenommen Hans isst fünf der Süßigkeiten. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass zwei oder weniger süß sind? (b) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass zwei oder weniger sauer sind? (c) (2 Punkte) Angenommen ein Karton enthält 20 Packungen. Wie viele süße Bonbon finden sich erwartungsgemäß pro Karton?

4.3 Aufgaben

177

Aufgabe A 4-32: (15 Punkte) Zur Lösung L 4-32 Die 45 Studenten eines Kurses müssen als Abschlussprüfung eine mündliche Prüfung absolvieren. Aufgrund der Erfahrung der letzten Jahre ist anzunehmen, dass 15 der Studenten durchfallen werden. Am ersten, wie auch an allen anderen Prüfungstagen, werden fünf Studenten geprüft. Die Prüfung kann nicht im gleichen Semester wiederholt werden. (a) (5 Punkte) Wie groß ist die Wahrscheinlichkeit, dass am ersten Tag höchstens ein Student durchfällt? (b) (5 Punkte) Wie groß ist die Wahrscheinlichkeit, dass vier oder mehr Studenten durchfallen? (c) (5 Punkte) Wie groß ist die Wahrscheinlichkeit, dass am ersten Termin alle Studenten durchfallen, am Folgetermin aber alle Studenten bestehen? Aufgabe A 4-33: (13 Punkte) Zur Lösung L 4-33 Beim Skatspiel erhält jeder der drei Spieler von den 32 Karten des Skatblattes 10 zufällig ausgewählte Karten. Mit welcher Wahrscheinlichkeit erhält bei einem Skatspiel: (a) (3 Punkte) ein bestimmter Spieler alle vier Buben? (b) (4 Punkte) irgendeiner der Spieler alle vier Buben? (c) (2 Punkte) Wie oft gelangen im Durchschnitt bei 20 Skatspielen alle Buben in eine Hand? (d) (4 Punkte) Wie groß ist die Wahrscheinlichkeit dafür, dass bei 20 Skatspielen wenigstens einmal alle Buben in eine Hand gelangen? Aufgabe A 4-34: (3 Punkte) Zur Lösung L 4-34 In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb. Es werden 10 Kugeln ohne Zurücklegen entnommen. Wie hoch ist die Wahrscheinlichkeit, dass genau vier der entnommenen Kugeln gelb sind? Aufgabe A 4-35: (7 Punkte) Zur Lösung L 4-35 Bob kauft sich eine Tüte Süßigkeiten. Von den 40 enthaltenen Süßigkeiten weiß Bob, dass ihm etwa 10 % nicht schmecken werden. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass Bob keine Süßigkeit schmeckt, wenn er zufällig drei Süßigkeiten aus der Tüte isst? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass ihm mindestens eine Süßigkeit schmeckt? Aufgabe A 4-36: (6 Punkte) Zur Lösung L 4-36 In einer Klasse werden zufällig Projektteams zu je 3 Personen gebildet. Von den 24 Schülern kennen sich fünf mit dem Thema der Projektarbeit gut aus.

178

4 Verteilungen

(a) (3 Punkte) Mit welcher Wahrscheinlichkeit findet sich ein Schüler, der keine Ahnung hat, in einer Gruppe mit zwei Leuten wieder, die sich beide gut auskennen? (b) (3 Punkte) Mit welcher Wahrscheinlichkeit kennt sich keiner der Schüler einer Gruppe mit dem Thema aus?

4.3.4

Geometrische Verteilung

Aufgabe A 4-37: (5 Punkte) Zur Lösung L 4-37 Die Wahrscheinlichkeit, dass ein Fehler bei der Erstellung eines Projektantrags auftritt, beträgt 8 %. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass das dritte Projekt, das erste fehlerhafte ist? (b) (3 Punkte) Bestimmen Sie die Wahrscheinlichkeit, dass der erste Fehler vor dem dritten Projekt auftritt. Aufgabe A 4-38: (5 Punkte) Zur Lösung L 4-38 Hans setzt beim Roulette immer auf Rot (Chance 18 aus 37). (a) (2 Punkte) Bestimmen Sie die Wahrscheinlichkeit, dass Hans erst beim dritten Spiel den ersten Gewinn verbuchen kann. (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass sich der erste Erfolg erst nach dem dritten Spiel einstellt? Aufgabe A 4-39: (5 Punkte) Zur Lösung L 4-39 Peter hat einen Programmierfehler in seinem Code. Die Wahrscheinlichkeit, dass der Fehler das Programm abstürzen lässt, beträgt 5 % pro Minute, die das Programm läuft. (a) (2 Punkte) Mit welcher Wahrscheinlichkeit tritt der Fehler erst in der fünften Minute auf? (b) (3 Punkte) Um erfolgreich alle Berechnungen durchzuführen, benötigt das Programm 10 Minuten. Wie hoch ist die Wahrscheinlichkeit, dass das Programm erfolgreich abschließt? Aufgabe A 4-40: (5 Punkte)

Zur Lösung L 4-40

(a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit beim Lotto nach genau 10 Spielen drei Richtige zu bekommen? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass sich der erste Gewinn erst nach dem fünften Spiel einstellt?

4.3 Aufgaben

179

Aufgabe A 4-41: (5 Punkte) Zur Lösung L 4-41 Ein Produktionsfehler hat pro Stunde eine Wahrscheinlichkeit von 4,5 %, um aufzutreten. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass der erste Fehler erst in der zweiten Hälfte einer 8-Stunden-Schicht auftritt? (b) (2 Punkte) Mit welcher Wahrscheinlichkeit tritt der erste Fehler in der dritten Stunde auf? Aufgabe A 4-42: (5 Punkte) Zur Lösung L 4-42 Die Wahrscheinlichkeit, dass ein Zug verspätet den Bahnhof verlässt, beträgt 3,6 %. (a) (2 Punkte) Bestimmen Sie die Wahrscheinlichkeit, dass der erste verspätete Zug der vierte ist, der aus dem Bahnhof abfahren soll. (b) (3 Punkte) Mit welcher Wahrscheinlichkeit ist der erste verspätete Zug bereits unter den ersten drei Zügen zu finden?

4.3.5

Poisson-Verteilung

Aufgabe A 4-43: (8 Punkte) Zur Lösung L 4-43 Dass eine Bank bankrott geht, kommt relativ selten vor. Im Durchschnitt passiert dies etwa einmal in fünf Jahren. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass in einem Jahr zwei Banken pleitegehen? (b) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass in einem Zeitraum von 10 Jahren 20 Banken pleitegehen? (c) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass in einem Jahr keine Bank pleitegeht? Aufgabe A 4-44: (5 Punkte) Zur Lösung L 4-44 In einem normalen Jahr kommt es zu keinem Stromausfall. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass in einem Jahr zwei Stromausfälle auftreten? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass in einem Jahr einer oder mehr Stromausfälle auftreten?

180

4 Verteilungen

Aufgabe A 4-45: (9 Punkte) Zur Lösung L 4-45 In einem Unternehmen sind in einer normalen Woche fünf Mitarbeiter im Urlaub. (a) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass in einer Woche zwei oder weniger Mitarbeiter im Urlaub sind? (b) (5 Punkte) Wie groß ist die Wahrscheinlichkeit, dass zwischen vier und sechs Mitarbeiter im Urlaub sind? Aufgabe A 4-46: (9 Punkte) Zur Lösung L 4-46 Im Durchschnitt ruft innerhalb einer Stunde ein Kunde bei einer Hotline an. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass zwei Kunden innerhalb einer Stunde anrufen? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass zwischen zwei und vier Kunden in einer Stunde anrufen? (c) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass weniger als zwei Kunden in einer Stunde anrufen? Aufgabe A 4-47: (9 Punkte) Zur Lösung L 4-47 Normalerweise kommt es etwa alle drei Schichten zu einem Produktionsstopp. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass weniger als zwei Stopps eingelegt werden müssen? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass drei oder mehr Stopps eingelegt werden müssen? (c) (4 Punkte) Angenommen jeder Stopp kostet das Unternehmen e10.000. Berechnen Sie für bis zu maximal fünf Stopps die durchschnittlichen Kosten durch Produktionsstopps. Aufgabe A 4-48: (5 Punkte) Zur Lösung L 4-48 Die Wahrscheinlichkeit, dass es während eines Monats zu keinem Netzwerkausfall kommt, beträgt 0,5 %. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass es in einem Monat zu genau einem Ausfall kommt? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass es zu mehr als zwei Ausfällen kommt? Aufgabe A 4-49: (8 Punkte) Zur Lösung L 4-49 Die Wahrscheinlichkeit, dass es innerhalb eines Jahres zu keinem Betriebsunfall kommt, beträgt 1,5 %. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass es zu einem Unfall kommt?

4.3 Aufgaben

181

(b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass es zwei Monate in Folge zu keinem Unfall kommt? (c) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass es zu zwei oder mehr Unfällen kommt? Aufgabe A 4-50: (6 Punkte) Zur Lösung L 4-50 Die Wahrscheinlichkeit, dass innerhalb eines Rechnungsjahres kein Kredit ausfällt, beträgt 2 %. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass genau ein Kredit ausfällt? (b) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass mehr als ein Kredit ausfällt? Aufgabe A 4-51: (9 Punkte) Zur Lösung L 4-51 Die Wahrscheinlichkeit, dass der Umsatz eines Unternehmensbereichs innerhalb einer Periode nicht geringer als 10.000.000 ausfällt, beträgt 25 %. (a) (3 Punkte) Wie groß ist die Wahrscheinlichkeit, dass ein einziger Bereich einen Umsatz größer als 10 Millionen erwirtschaftet? (b) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass genau zwei Bereiche einen derart hohen Umsatz erwirtschaften? (c) (4 Punkte) Wie groß ist die Wahrscheinlichkeit, dass weniger als drei Bereiche einen derart hohen Umsatz erwirtschaften? Aufgabe A 4-52: (7 Punkte) Zur Lösung L 4-52 Die Wahrscheinlichkeit, dass in einem Monat kein Unfall mit der Fahrzeugflotte passiert, beträgt 20 %. (a) (2 Punkte) Wie groß ist die Wahrscheinlichkeit, dass die Fahrzeugflotte drei Monate in Folge unfallfrei bleibt? (b) (5 Punkte) Wie groß ist die Wahrscheinlichkeit, dass drei oder mehr Unfälle in einem Monat vorkommen?

4.3.6

Stetige Verteilungen – Allgemein

Aufgabe A 4-53: (7 Punkte) Zur Lösung L 4-53 Bestimmen Sie ausgehend von der folgenden Dichtefunktion die Verteilungsfunktion sowie die Wahrscheinlichkeit P (x > 0,5). ⎧ ⎪ x 2,5) sowie P (2,5 < x < 3,5).

f (x) =

⎧ ⎪ ⎨0

x1 Aufgabe A 4-57: (15 Punkte) Zur Lösung L 4-57 Bestimmen Sie ausgehend von der folgenden Dichtefunktion die Verteilungsfunktion, den Erwartungswert, die Varianz sowie die Wahrscheinlichkeiten P (x < 1) sowie P (1 < x < 2). ⎧ ⎪ ⎨0 f (x) = − 19 x 2 + ⎪ ⎩ 0

2 3

x 3

4.3 Aufgaben

183

Aufgabe A 4-59: (15 Punkte) Zur Lösung L 4-59 Bestimmen Sie ausgehend von der folgenden Dichtefunktion die Verteilungsfunktion, den Erwartungswert, die Varianz sowie die Wahrscheinlichkeiten P (x > 2) und P (1 < x < 2). ⎧ ⎪ ⎨0 x < 1 f (x) = x1 1 < x < e ⎪ ⎩ 0 x>e Aufgabe A 4-60: (15 Punkte) Zur Lösung L 4-60 Bestimmen Sie ausgehend von der folgenden Dichtefunktion die Verteilungsfunktion, den Erwartungswert, die Varianz sowie die Wahrscheinlichkeiten P (x > 4) und P (1 < x < 2). f (x) =

0 x 3) P (X > 3) = 1 − P (X ≤ 3) = 1 − P (X = 1) − P (X = 2) − P (X = 3) =1−

18 18 · 19 − − 0,1283 37 37 · 37

= 1 − 0,4865 − 0,2498 − 0,1283 = 0,1354 Lösung L 4-39: (5 Punkte) Gegeben: π = 0,05

Zur Aufgabenstellung A 4-39

(a) (2 Punkte) Gesucht: P(X = 5) P (X = 5) = 0,05 · (1 − 0,05)4 = 0,0407 (b) (3 Punkte) Gesucht: P(X > 10) P (X > 10) = 1 − P (X ≤ 10) = 1 − 1 + 0,4013 = 0,4013 Lösung L 4-40: (5 Punkte) Zur Aufgabenstellung A 4-40 Bestimme π über die hypergeometrische Verteilung mit N = 49, A = 6, n = 6 und (6)·(43) a = 3: π = P (X = 3) = 3 49 3 = 0,0177 (6)

238

4 Verteilungen

(a) (2 Punkte) Gesucht: P(X = 10) P (X = 10) = 0,0177 · (1 − 0,0177)9 = 0,0151 (b) (3 Punkte) Gesucht: P(X > 5) P (X > 5) = 1 − P (X ≤ 5) = 1 − 1 + 0,98235 = 0,9146 Lösung L 4-41: (5 Punkte) Gegeben: π = 0,045

Zur Aufgabenstellung A 4-41

(a) (3 Punkte) Gesucht: P(X > 4) P (X > 4) = 1 − P (X ≤ 4) = 1 − 1 + 0,9554 = 0,8318 (b) (2 Punkte) Gesucht: P(X = 3) P (X = 3) = 0,045 · 0,9552 = 0,0410 Lösung L 4-42: (5 Punkte) Gegeben: π = 0,036

Zur Aufgabenstellung A 4-42

(a) (2 Punkte) Gesucht: P(X = 4) P (X = 4) = 0,036 · 0,9643 = 0,0323 (b) (3 Punkte) Gesucht: P(X ≤ 3) P (X ≤ 3) = 1 − 0,9643 = 0,1042

4.4 Lösungen

4.4.5

239

Poisson-Verteilung

Lösung L 4-43: (8 Punkte) Gegeben: λ = 0,2

Zur Aufgabenstellung A 4-43

(a) (2 Punkte) Gesucht: P(X = 2) P (X = 2) =

0,22 exp(−0,2) 2!

= 0,01637 (b) (4 Punkte) Problem lässt sich reduzieren zu zwei pro Jahr, daher ist gesucht: P(X = 2) P (X = 2) = 0,01637 (c) (2 Punkte) Gesucht: P(X = 0) P (X = 0) = 0,20 · exp(−0,2) = 0,8187 Lösung L 4-44: (5 Punkte) Gegeben: λ = 0

Zur Aufgabenstellung A 4-44

(a) (2 Punkte) Gesucht: P(X = 2) P (X = 2) =

02 exp(−0) 2!

=0 (b) (3 Punkte) Gesucht: P(X ≥ 1) P (X ≥ 1) = 1 − P (X = 0) =1− =0

00 exp(−0) 0!

240

4 Verteilungen

Lösung L 4-45: (9 Punkte) Gegeben: λ = 5

Zur Aufgabenstellung A 4-45

(a) (4 Punkte) Gesucht: P(X ≤ 2) P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) =

50 51 52 exp(−5) + exp(−5) + exp(−5) 0! 1! 2!

= 0,0067 + 0,0337 + 0,0842 = 0,1246 (b) (5 Punkte) Gesucht: 6

6

i=4 P(X

= i)

P (X = i) = P (X = 6) + P (X = 5) + P (X = 4)

i=4

=

55 54 56 exp(−5) + exp(−5) + exp(−5) 6! 5! 4!

= exp(−5) · (21,7014 + 26,0417 + 26,0417) = 0,4972 Lösung L 4-46: (9 Punkte) Gegeben: λ = 1

Zur Aufgabenstellung A 4-46

(a) (2 Punkte) Gesucht: P(X = 2) P (X = 2) =

12 exp(−1) 2!

= 0,1839 (b) (3 Punkte) Gesucht: 4

4

i=2 P(X

= i)

P (X = i) = P (X = 2) + P (X = 3) + P (X = 4)

i=2

= 0,1839 + = 0,2605

13 14 exp(−1) + exp(−1) 3! 4!

4.4 Lösungen

241

(c) (4 Punkte) Gesucht: P(X < 2) P (X < 2) = P (X = 0) + P (X = 1) =

11 10 exp(−1) + exp(−1) 0! 1!

= 0,7358 Lösung L 4-47: (9 Punkte) Gegeben: λ = 13

Zur Aufgabenstellung A 4-47

(a) (2 Punkte) Gesucht: P(X < 2) P (X < 2) = P (X = 0) + P (X = 1) =

11 10 exp(−1/3) + 1 exp(−1/3) · 0! 3 · 1!

30

= 0,9554 (b) (3 Punkte) Gesucht: P(X ≥ 3) P (X ≥ 3) = 1 − P (X < 2) − P (X = 2) = 1 − 0,9554 −

12 exp(−1/3) 32 · 2!

= 0,0048 (c) (4 Punkte) Gesucht: 5

5

n=1 P(X

= n) · n · 10.000

P (X = n) · n · 10.000 = 10.000 ·

11 exp(−1/3) 31 · 1!

+ 20.000 ·

12 exp(−1/3) 32 · 2!

n=1

+ 30.000 · + 40.000 · + 50.000 ·

13 exp(−1/3) · 3!

33

14 exp(−1/3) 34 · 4! 15 exp(−1/3) · 5!

35

= 2388,44 + 796,15 + 132,69 + 14,74 + 1,23 = 3333,25

242

4 Verteilungen

Lösung L 4-48: (5 Punkte) Zur Aufgabenstellung A 4-48 0 Gegeben: P (X = 0) = 0,5 ⇒ λ0! exp(−λ) = 0,5 ⇒ exp(−λ) = 0,5 ⇒ λ = 0,6931 (a) (2 Punkte) Gesucht: P(X = 1) 0,69311 exp(−0,6931) 1! 0,6931 · 0,5 = 1

P (X = 1) =

= 0,3466 (b) (3 Punkte) Gesucht: P(X > 2) P (X > 2) = 1 − P (X = 0) − P (X = 1) − P (X = 2) = 1 − 0,5 − 0,3466 −

0,69312 · 0,5 2!

= 0,0333 Lösung L 4-49: (8 Punkte) Zur Aufgabenstellung A 4-49 Gegeben: P (X = 0) = 0,015 ⇒ λ = 4,2 (a) (2 Punkte) Gesucht: P(X = 1) P (X = 1) =

4,21 exp(−4,2) 1!

= 0,063 (b) (3 Punkte) Gesucht: P(X = 0)2 P (X = 0)2 = (exp(−4, 2))2 = 0,0152 = 0,000225 (c) (3 Punkte) Gesucht: P(X ≥ 2) P (X ≥ 2) = 1 − P (X = 0) − P (X = 1) = 1 − 0,015 − 0,063 = 0,922

4.4 Lösungen

243

Lösung L 4-50: (6 Punkte) Zur Aufgabenstellung A 4-50 Gegeben: P (X = 0) = 0,02 ⇒ λ = 3,91 (a) (3 Punkte) Gesucht: P(X = 1) P (X = 1) =

3,911 exp(−3,91) 1!

= 0,0782 (b) (3 Punkte) Gesucht: P(X > 1) P (X > 1) = 1 − P (X = 0) − P (X = 1) = 1 − 0,02 − 0,0782 = 0,9018 Lösung L 4-51: (9 Punkte) Zur Aufgabenstellung A 4-51 Gegeben: P (X = 0) = 0,25 ⇒ λ = 1,39 (a) (3 Punkte) Gesucht: P(X = 1) P (X = 1) =

1,391 exp(−1,39) 1!

= 0,35 (b) (2 Punkte) Gesucht: P(X = 2) P (X = 2) =

1,392 exp(−1,39) 2!

= 0,24 (c) (4 Punkte) Gesucht: P(X < 3) P (X < 3) = P (X = 0) + P (X = 1) + P (X = 2) = 0,25 + 0,35 + 0,24 = 0,84

244

4 Verteilungen

Lösung L 4-52: (7 Punkte) Zur Aufgabenstellung A 4-52 Gegeben: P (X = 0) = 0,2 ⇒ λ = 1,61 (a) (2 Punkte) Gesucht: P(X = 0)3 P (X = 0)3 = 0,23 = 0,008 (b) (5 Punkte) Gesucht: P(X ≥ 3) P (X ≥ 3) = 1 − P (X < 3) = 1 − P (X = 0) − P (X = 1) − P (X = 2) = 1 − 0,2 − 0,322 −

1,612 exp(−1,61) 2!

= 1 − 0,2 − 0,322 − 0,259 = 0,219

4.4.6

Stetige Verteilungen – Allgemein

Lösung L 4-53: (7 Punkte) Zur Aufgabenstellung A 4-53 Nutzen der Substitutionsregel mit z = x 3 und z = 3x 2 erlaubt: P (X ≤ x) = F (x)

x 2 3t · exp(t 3 ) − 1 dt = e−1 0

z(x) 1 = exp(z)dz e−1 0 1 [exp(z)]z(x) 0 e−1 1 (exp(x 3 ) − 1) = e−1 =

Für die gesuchte Wahrscheinlichkeit ergibt sich: P (X ≤ 0,5) = F (0,5) =

1 (exp(0,53 ) − 1 − exp(03 ) + 1) e−1

= 0,1331

4.4 Lösungen

245

Lösung L 4-54: (12 Punkte) Zur Aufgabenstellung A 4-54 Da die Betragsfunktion als Dichtefunktion abschnittsweise definiert ist: ⎧ ⎪ 0 ⎪ ⎪ ⎨ −x f (x) = |x| = ⎪ x ⎪ ⎪ ⎩ 0

x < −1 x ≤ −1 < 0 0≤x 1,5) = 1 − P (X ≤ 1,5) = 1 − F (1,5) = 1 − 0,5 · 1,52 + 0,5 = 0,375 Lösung L 4-59: (15 Punkte)

Zur Aufgabenstellung A 4-59 P (X ≤ x) = F (x)

x 1 = dt 1 t = [ln(t)]x1 = ln(x)

248

4 Verteilungen

Für die gesuchten Wahrscheinlichkeiten ergibt sich: P (X > 2) = 1 − P (X ≤ 2) = 1 − F (2) = 1 − ln(2) = 0,3069

P (1 < X < 2) = P (X ≤ 2) − P (X ≤ 1) = ln(2) − ln(1) = 0,6931 Lösung L 4-60: (15 Punkte)

Zur Aufgabenstellung A 4-60 P (X ≤ x) = F (x)

x 1 = dt 2 1 t

x t −2 dt = 1

  1 x = − t 1 =−

1 +1 x

Für die gesuchten Wahrscheinlichkeiten ergibt sich: P (X > 4) = 1 − P (X ≤ 4) = 1 − F (4) = 1 + 0,25 − 1 = 0,25

P (1 < X < 2) = P (X ≤ 2) − P (X ≤ 1) = −0,5 + 1 + 1 − 1 = 0,5

4.4 Lösungen

249

Lösung L 4-61: (13 Punkte) Zur Aufgabenstellung A 4-61 Die Aufgabe kann angegangen werden durch Substitution mit z = 1 − t 2 und z = −2t: P (X ≤ x) = F (x)

x t = dt √ 1 − t2 0

z(x) 1 − √ dz = 2 · z 1 √ = [− z]z(x) 1  = [− 1 − t 2 ]x0  = − 1 − x2 + 1 Für die gesuchte Wahrscheinlichkeit ergibt sich: P (0,5 < X < 1,5) = P (0,5 < X < 1) = P (X ≤ 1) − P (X ≤ 0,5) = F (1) − F (0,5)  = 1 + 0,75 − 1 = 0,866.

Lösung L 4-62: (12 Punkte) Zur Aufgabenstellung A 4-62 Da die Dichtefunktion abschnittsweise definiert ist, ist auch die Verteilungsfunktion abschnittsweise definiert. Hierbei sind die einzelnen Teile getrennt voneinander zu bestimmen: P (X ≤ x) = F (x)

x = 0,5dt 0

= [0,5t]x0 = 0,5x, wenn 0 ≤ x < 0,5

250

4 Verteilungen

P (X ≤ x) = F (x)

= ,5x tdt 0

= [0,5t 2 ]x0,5



= 0,5x − 0,5 = 0,5x − 0,125, wenn 0,5 ≤ x < 2

3

2

7 2

Zusammen gefügt ergibt sich die Verteilungsfunktion als: ⎧ 0 ⎪ ⎪ ⎪ ⎨ 0,5x P (X ≤ x) = F (x) = ⎪ 0,5x 2 + 0,125 ⎪ ⎪ ⎩ 1

x 1,6) P (X > 1,6) = 1 − P (X ≤ 1,6)   1,6 − 1,5 =1− 0,05 = 1 − (2) = 1 − 0,9773 = 0,0227 (b) (4 Punkte) Gesucht: P(1,45 < X < 1,55) P (1,45 < X < 1,55) = P (X ≤ 1,55) − P (X ≤ 1,45)     1,55 − 1,5 1,45 − 1,5 = − 0,05 0,05 = (1) − (−1) = (1) − 1 + (1) = 0,8413 − 1 + 0,8413 = 0,6826 (c) (3 Punkte) Gesucht: P(X < 1,4) P (X < 1,4)

 =

1,4 − 1,5 0,05

= (−2) = 1 − (2) = 1 − 0,9773 = 0,0227



4.4 Lösungen

263

Gesucht: E(X) E(X) = 2000 · 0,0227 = 45,4 45,4 Flaschen sind defekt. Lösung L 4-96: (11 Punkte) Zur Aufgabenstellung A 4-96 Gegeben: μ = 4,7 und σ = 0,1 (a) (4 Punkte) Gesucht: P(4,9 < X < 5) P (4,9 < X < 5) = P (X ≤ 5) − P (X ≤ 4,9)     5 − 4,7 4,9 − 4,7 = − 0,1 0,1 = (3) − (2) = 0,9987 − 0,9773 = 0,0214 (b) (4 Punkte) Gesucht: P(X > 4,8) 

4,8 − 4,7 P (X > 4,8) = 1 − 0,1



= 1 − (1) = 1 − 0,8413 = 0,1587 (c) (3 Punkte) Gesucht: P(|X − 4,7| ≥ 0,2)  P (|X − 4,7| ≥ 0,2) = 2 ·

4,5 − 4,7 0,1

= 2 · (−2) = 2 − 2 · (2) = 2 − 2 · 0,9773 = 0,0454



264

4 Verteilungen

Gesucht: E(X) E(X) = 10.000 · 0,0454 = 454 454 Stück Ausschuss werden produziert. Lösung L 4-97: (9 Punkte) Zur Aufgabenstellung A 4-97 Gegeben: μ = 6000 und σ = 50 (a) (2 Punkte) Gesucht: P(X < 5700)  P (X < 5700) =

5700 − 6000 50



= (−6) = 1 − (6) = 1 − 0,999999 = 0,0000 < 10−9 (b) (3 Punkte) Gesucht: P(X > 6200) P (X > 6200) = 1 − P (X ≤ 6200)   6200 − 6000 =1− 50 = 1 − (4) = 1 − 0,99997 = 0,00003 (c) (4 Punkte) Gesucht: P(5900 < X < 6100) P (5900 < X < 6100) = P (X ≤ 6100) − P (X ≤ 5900)     6100 − 6000 5900 − 6000 = − 50 50 = (2) − 1 + (2) = 2 · 0,9773 − 1 = 0,9546

4.4 Lösungen

265

Lösung L 4-98: (12 Punkte) Zur Aufgabenstellung A 4-98 Gegeben: μ = 120 und σ = 0,5 (a) (3 Punkte) Gesucht: P(X > 125) P (X > 125) = 1 − P (X ≤ 125)   125 − 120 =1− 0,5 = 1 − (10) = 0,0 < 10−30 und entsprechend kann mit an Sicherheit grenzender Wahrscheinlichkeit davon ausgegangen werden. (b) (4 Punkte) Gesucht: P(119 < X < 121) P (119 < X < 121) = P (X ≤ 121) − P (X ≤ 119)     119 − 120 121 − 120 − = 0,5 0,5 = (2) − (−2) = (2) − 1 + (2) = 0,9773 − 1 + 0,9773 = 0,9546 (c) (3 Punkte) Gesucht: P(X > 122) P (X > 122) = 1 − P (X ≤ 122)   122 − 125 =1− 0,5 = 1 − (−6) = 1 − 1 + (6) = 0,0 < 10−9 (d) (2 Punkte) Gesucht: P(X < 118) 

118 − 125 P (X < 118) = 0,5



266

4 Verteilungen

= (−14) = 1 − (14) = 0,0 < 10−30 Lösung L 4-99: (8 Punkte) Gegeben: μ = 15 und σ = 3

Zur Aufgabenstellung A 4-99

(a) (2 Punkte) Gesucht: P(X ≤ 0)  P (X ≤ 0) =

0 − 15 3



= (−5) = 1 − (5) = 0,0 < 10−6 (b) (3 Punkte) Gesucht: P(X ≥ 20)  P (X ≥ 20) = 1 −

20 − 15 3



= 1 − (1,67) = 1 − 0,9525 = 0,0475 (c) (3 Punkte) Jeden Monat erhöht sich die Schneedecke um 15 cm−5 cm = 10 cm. Somit liegen nach drei Monaten 30 cm Schnee. Lösung L 4-100: (6 Punkte) Zur Aufgabenstellung A 4-100 Gegeben: μ = 1000 und σ = 200 (a) (3 Punkte) Gesucht: P(X ≥ 1500) 

1500 − 1000 P (X ≥ 1500) = 1 − 200 = 1 − (2,5) = 1 − 0,9938 = 0,0062



4.4 Lösungen

267

(b) (3 Punkte) Gesucht: P(X ≤ 500)  P (X ≤ 500) =

500 − 1000 200



= (−2,5) = 1 − 0,9938 = 0,0062 Lösung L 4-101: (11 Punkte) Gegeben: μ = 45 und σ = 10

Zur Aufgabenstellung A 4-101

(a) (3 Punkte) 95 % von 90 sind: 85,5, somit ist gesucht: P(X ≥ 85,5) P (X ≥ 85,5) = 1 − P (X ≤ 85,5)   85,5 − 45 =1− 10 = 1 − (4,05) = 1 − 0,999974 = 0,000026 (b) (4 Punkte) Gesucht: P(42 < X < 45) P (42 < X < 45) = P (X ≤ 45) − P (X ≤ 42)     45 − 45 42 − 45 = − 10 10 = (0) − (−0,3) = 0,5 − 1 + (0,3) = −0,5 + 0,6179 = 0,1179 (c) (4 Punkte) Gesucht: P(X ≤ 40)  P (X ≤ 40) =

40 − 45 10

= (−0,5)



268

4 Verteilungen

= 1 − (0,5) = 1 − 0,6915 = 0,3085 Lösung L 4-102: (8 Punkte) Zur Aufgabenstellung A 4-102 Gegeben: μ = 9,5 und σ = 1,5 (a) (2 Punkte) Gesucht: P(X < 5) 

5 − 9,5 P (X < 5) = 1,5



= (−3) = 1 − (3) = 1 − 0,9987 = 0,0013 (b) (2 Punkte) Gesucht: P(X < 2)  P (X < 2) =

2 − 9,5 1,5



= (−5) = 1 − (5) = 1 − 0,99999971 = 0,00000029 (c) (4 Punkte) Gegeben: μ = 12 und σ = 2,5 Gesucht: P(X < 2)  P (X < 2) =

2 − 12 2,5



= (−4) = 1 − (4) = 1 − 0,99997 = 0,00003 Somit trägt die zweite Anlage das geringere Risiko.

4.4 Lösungen

269

Lösung L 4-103: (13 Punkte) Gegeben: μ = 40 und σ = 2

Zur Aufgabenstellung A 4-103

(a) (2 Punkte) Gesucht: P(X ≤ 36)  P (X ≤ 36) =

36 − 40 2



= (−2) = 1 − (2) = 1 − 0,9773 = 0,0227 (b) (3 Punkte) Gesucht: P(X ≥ 42) P (X ≥ 42) = 1 − P (X ≤ 42)   42 − 40 =1− 2 = 1 − (1) = 1 − 0,8413 = 0,1587 (c) (4 Punkte) Gesucht: P(39 ≤ X ≤ 42) P (39 ≤ X ≤ 42)

 =

42 − 40 2



 −

= (1) − (−0,5) = 0,8413 − 1 + (0,5) = −0,1587 + 0,6915 = 0,5328 (d) (2 Punkte) Gesucht: x0,95 x0,95 = 40 + z0,95 · 2 = 40 + 1,6449 · 2 = 43,2898

39 − 40 2



270

4 Verteilungen

(e) (2 Punkte) Gesucht: x0,10 x0,10 = 40 − z0,90 · 2 = 40 − 1,2816 · 2 = 37,4368 Lösung L 4-104: (8 Punkte) Zur Aufgabenstellung A 4-104 Gegeben: μ = 1000 und σ = 20 (a) (2 Punkte) Gesucht: P(X < 950) 

950 − 1000 P (X < 950) = 20



= (−2,5) = 1 − (2,5) = 1 − 0,9938 = 0,0062 (b) (4 Punkte) Gegeben: n = 100  Gesucht: 1000 − z0,975 · √20 ≤ X ≤ 1000 + z0,975 · √20 100 100 Mit z0,975 = 1,96 ergibt sich [996,08 ≤ X ≤ 1003,92] (c) (2 Punkte) Gesucht: P(X < 900) 

900 − 1000 P (X < 900) = 20



= (−10) = 1 − (10) = 0,0 < 10−30 Entsprechend kann mit an Sicherheit grenzender Wahrscheinlichkeit ausgeschlossen werden, dass dieser Fall eintritt. Lösung L 4-105: (7 Punkte) Gegeben: μ = 15 und σ = 5

Zur Aufgabenstellung A 4-105

(a) (3 Punkte) Gesucht: P(X > 30)

4.4 Lösungen

271

P (X > 30) = 1 − P (X ≤ 30)   30 − 15 =1− 5 = 1 − (3) = 1 − 0,9987 = 0,0013 (b) (4 Punkte) Gesucht: [15 − z0,975 · 5 ≤ X ≤ 15 + z0,975 · 5] und mit z0,975 = 1,96 [5,2 ≤ X ≤ 24,8] Lösung L 4-106: (9 Punkte) Gegeben: μ = 0,5

Zur Aufgabenstellung A 4-106

(a) (3 Punkte) Gegeben: σ = 0,02 Gesucht: P(X > 0,55) P (X > 0,55) = 1 − P (X ≤ 0,55)   0,55 − 0,5 =1− 0,02 = 1 − (2,5) = 1 − 0,9938 = 0,0062 (b) (2 Punkte) Gesucht: E(X) E(X) = 5000 · 0,0062 = 31 (c) (4 Punkte) Gesucht: [0,5−z0,975 ·0,02 ≤ X ≤ 0,5+z0,975 ·0,02] und mit z0,975 = 1,96 [0,4608 ≤ X ≤ 0,5392]

4.4.11 Verteilungen gemischt Lösung L 4-107: (6 Punkte) Zur Aufgabenstellung A 4-107 Gegeben: μ = 75, n = 10 und N = 100

272

4 Verteilungen

(a) (3 Punkte) Normalverteilung mit σ = 1 Gesucht: P(|X − μ| > 2) 

2 P (|X − μ| > 2) = 2 · − σ



= 2 − 2 · (2) = 2 − 2 · 0,9773 = 0,0455 (b) (3 Punkte) Hypergeometrische Verteilung mit A = N · 0,0455 = 4,55 = 5 Gesucht: P(X = 1) 5 95 · P (X = 1) = 11009 10

= 0,3394 Lösung L 4-108: (5 Punkte) Zur Aufgabenstellung A 4-108 Normalverteilung mit μ = 80 und σ = 4 (a) (3 Punkte) Gesucht: P(X > 100) P (X > 100) = 1 − P (X ≤ 100)   100 − 80 =1− 4 = 1 − (5) = 0,287 · 10−6 (b) (2 Punkte) Nutze Poisson-Verteilung mit λ = n · p = 50 · 0,287 · 10−6 = 0,0000143 Gesucht: P(X = 1) P (X = 1) =

0,00001431 exp(−0,0000143) 1!

= 0,0000143 Lösung L 4-109: (5 Punkte) Zur Aufgabenstellung A 4-109 Poisson-Verteilung mit P (X = 0) = 0,001 ⇒ exp(−λ) = 0,001 ⇒ λ = 6,9078 (a) (2 Punkte) Gesucht: μ μ = λ = 6,9078

4.4 Lösungen

273

(b) (3 Punkte) Gesucht: P(X ≥ 1) P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − 0,001 = 0,999 Lösung L 4-110: (3 Punkte) Zur Aufgabenstellung A 4-110 Hypergeometrische Verteilung mit N = 10, A = 7 und n = 4 (Anmerkung: X = 0 ist per Definition unmöglich und somit gilt: P (X = 0) = 0) Gesucht: P(X ≥ 2) P (X ≥ 2) = 1 − P (X < 2) = 1 − P (X = 0) − P (X = 1) 7 3 · = 1 − 0 − 1103 4

=1−

7 210

= 0,9667 Lösung L 4-111: (6 Punkte) Zur Aufgabenstellung A 4-111 Hypergeometrische Verteilung mit N = 200, A = 10 und n = 15 (a) (4 Punkte) Gesucht: P(X ≥ 3) P (X ≥ 3) = 1 − P (X < 3) = 1 − P (X = 0) − P (X = 1) − P (X = 2) 10 190 10 190 10 190 · · · = 1 − 0 20015 − 1 20014 − 2 20013 15

15

= 1 − 0,45 − 0,3835 − 0,1365 = 0,03 (b) (2 Punkte) Gesucht: 0,035 0,035 = 0,243 · 10−7

15

274

4 Verteilungen

Lösung L 4-112: (3 Punkte) Zur Aufgabenstellung A 4-112 Hypergeometrische Verteilung mit: N = 30, n = 3 und P (X = 1) = 0,0053 Gesucht: π A π=N Es gilt: A 30−A · 0,0053 = 1 30 2 5

=

A · (30 − A)! · 5! · 25! ˙ 4! · (28 − A)!30!

=

A · (30 − A) · (29 − A) 285.012

1510,5636 = 870A − 59A2 + A3 A=2 π=

2 30

= 0,0667 Lösung L 4-113: (4 Punkte) Zur Aufgabenstellung A 4-113 Normalverteilung mit μ = 12 mm, σ 2 = 0,01 mm und P (|X − μ| > B) = 0,01 Es gilt:   B σ   B ⇒ =2· 0,1

0,01 = 2 ·

0,005 = (10B) ⇒ 1 (0,005) = 10B ⇒ 2,5758 = 10B ⇒ B = 0,2576 Entsprechend betragen die kritischen Grenzen 12 mm − 0,2576 mm = 11,7424 mm und 12 mm + 0,2576 mm = 12,2576 mm. Lösung L 4-114: (5 Punkte) Zur Aufgabenstellung A 4-114 Poisson-Verteilung mit μ = λ = σ und P (X = 0) = 0,13 ⇒ λ = 2,0402 Gesucht: P(X ≥ 2)

4.4 Lösungen

275

P (X ≥ 2) = 1 − P (X < 2) = 1 − P (X = 0) − P (X = 1) = 1 − 0,13 − 2,0402 · exp(−2,0402) = 1 − 0,13 − 0,2652 = 0,6048 Lösung L 4-115: (3 Punkte) Zur Aufgabenstellung A 4-115 Normalverteilung mit μ = 0,18 und P (12 ≤ X ≤ 18) = P (|X − μ| < 6) = 0,83 Gesucht: σ σ mit:   6 P (|X − μ| < 6) = 2 · −1 σ = 0,83 ⇒   6 ⇒ 1,83 = 2 · σ   6 ⇒ 0,915 = σ 6 ⇒ σ 6 σ = 1,3722

−1 (0,915) =

= 4,3725 Lösung L 4-116: (5 Punkte) Zur Aufgabenstellung A 4-116 Normalverteilung mit μ = 10 und σ 2 = σ = 1 (a) (3 Punkte) Gesucht: P(X ≤ c) P (X ≤ c) = 0,6   c − 10 = ⇒ 1 −1 (0,6) + 10 = c = 10,2533 (b) (2 Punkte) c = μ, da die Verteilung symmetrisch ist

276

4 Verteilungen

Lösung L 4-117: (4 Punkte) Gesucht c mit

Zur Aufgabenstellung A 4-117

P (X ≤ c) = 0,64 ⇒ F (c) = 0,64 ⇒ c = F −1 (0,64) = 0,8; da F (x) = x 2 gilt F −1 (y) = Lösung L 4-118: (4 Punkte)



y Zur Aufgabenstellung A 4-118 F (x) = 1 − exp(−x) ⇒ y = 1 − exp(−x) ⇒ x = F −1 (y) = − ln(1 − y)

Gesucht: P(X ≥ c) P (X ≥ c) = 0,19 ⇒ 1 − P (X ≤ c) = 0,19 ⇒ F (c) = 0,81 ⇒ c = F −1 (0,81) = − ln(1 − 0,81) = 1,6607 Lösung L 4-119: (3 Punkte) Zur Aufgabenstellung A 4-119 Binomialverteilung mit π = 15 = 0,3 und n = 5 50 Gesucht: P(X = 5)   5 P (X = 5) = · 0,35 · 0,70 5 = 0,35 = 0,00243

4.4 Lösungen

277

Lösung L 4-120: (4 Punkte) Zur Aufgabenstellung A 4-120 Gegeben: μ = 3σ und P (|X − μ| < c) = 0,75 Gesucht: μ μ mit P (|X − μ| < c) = 0,75 ⇒ c = 0,875 ⇒ σ c σ = −1 (1,1503) c ⇒ = 1,1503 μ = 2,608 · c Lösung L 4-121: (4 Punkte) Zur Aufgabenstellung A 4-121 Gegeben: μ = a · σ = 5 und P (|X − μ| < c) = 0,995 Gesucht:   2 2· − 1 = 0,995 ⇒ σ   2 = 0,9975 ⇒ σ 2 = −1 (0,9975) ⇒ σ 2 σ = 2,807 = 0,7125 ⇒ 5 = a · 0,7125 ⇒ a = 7,0175 Lösung L 4-122: (4 Punkte) Zur Aufgabenstellung A 4-122 Hypergeometrische Verteilung mit N = 50, A = 15 und n = 3 (a) (2 Punkte) Gesucht: P(X = 3) 15 35 · P (X = 3) = 3 50 0 3

= 0,0232

278

4 Verteilungen

(b) (2 Punkte) Gesucht: P(X ≥ 1) P (X ≥ 1) = 1 − P (X = 0) 15 35 · = 1 − 0 50 3 3

= 0,3339 Lösung L 4-123: (6 Punkte) Zur Aufgabenstellung A 4-123 Binomialverteilung mit π = 0,16 und n = 7 (a) (2 Punkte) Gesucht: P(X = 0)   7 P (X = 0) = · 0,160 · 0,847 0 = 0,2951 (b) (4 Punkte) Gesucht: P(X ≥ 2) P (X ≥ 2) = 1 − P (X = 0) − P (X = 1) = 1 − 0,2951 − 7 · 0,16 · 0,846 = 0,3114 Lösung L 4-124: (10 Punkte) Zur Aufgabenstellung A 4-124 Normalverteilung mit μ = 314 und σ = 3 (a) (2 Punkte) Gesucht: P(X ≤ 300)  P (X ≤ 300) =

300 − 314 3



= (−1,33) = 1 − (1,3333) = 1 − 0,9088 = 0,0912 (b) (4 Punkte) Gesucht: P(312 ≤ X ≤ 315) P (312 ≤ X ≤ 315) = P (X ≤ 315) − P (X ≤ 312)     315 − 314 312 − 314 = − 3 3

4.4 Lösungen

279

= (0,3333) − (−0,6667) = (0,3333) − 1 + (0,6667) = 0,3781 (c) (4 Punkte) Gesucht: (0,02 · (314 − z0,975 · 3); 0,02 · (314 + z0,975 · 3)) und damit (6,1624; 6,3976) Lösung L 4-125: (2 Punkte) 1 Poisson-Verteilung mit λ = 30 Gesucht: P(X ≥ 1)

Zur Aufgabenstellung A 4-125

P (X ≥ 1) = 1 − P (X = 0)   1 = 1 − exp 30 = 0,0339 Lösung L 4-126: (7 Punkte) Zur Aufgabenstellung A 4-126 Normalverteilung mit μ = 43 und σ = 1,25 (a) (3 Punkte) Gesucht: P(X ≥ 43,2) P (X ≥ 43,2) = 1 − P (X ≤ 43,2)   43,2 − 43 =1− 1,25 = 1 − (0,16) = 0,5636 (b) (4 Punkte) Gesucht: P(42 ≤ X ≤ 44,5) P (42 ≤ X ≤ 44,5) = P (X ≤ 44,5) − P (X ≤ 42)     44,5 − 43 42 − 43 = − 1,25 1,25 = (1,2) − (−0,8) = (1,2) − 1 + (0,8) = 0,6731

280

4 Verteilungen

Lösung L 4-127: (4 Punkte) Zur Aufgabenstellung A 4-127 Hypergeometrische Verteilung mit N = 120, A = 25 und n = 3 (a) (2 Punkte) Gesucht: P(X = 3) 25 95 · P (X = 3) = 31200 3

= 0,0082 (b) (2 Punkte) Gesucht: P(X ≤ 1) P (X ≤ 1) = P (X = 0) + P (X = 1) 25 95 · = 0,0082 + 11202 3

= 0,0082 + 0,3975 = 0,4057 Lösung L 4-128: (7 Punkte) Zur Aufgabenstellung A 4-128 Binomialverteilung mit π = 0,0114 und n = 14 (a) (2 Punkte) Nutze Poisson-Verteilung mit λ = 0,0114 Gesucht: P(X > 1) P (X > 1) = 1 − P (X = 0) = 1 − exp(−0,0114) = 0,0113 (b) (3 Punkte) Gesucht: P(X ≥ 1) P (X ≥ 1) = 1 − P (X = 0)   14 =1− · 0,01140 · 0,98861 4 0 = 1 − 0,8517 = 0,1483

4.4 Lösungen

281

(c) (2 Punkte) Gesucht: E(X) E(X) = 365 · 0,0114 = 4,161 Sie trifft während eines Jahres etwa vier Bären. Lösung L 4-129: (7 Punkte)

Zur Aufgabenstellung A 4-129

(a) Binomialverteilung mit π = 0,7 und n = 4 Gesucht: P(X = 4) P (X = 4) = 0,74 = 0,2401 (b) Die Kombinationen an bestandenen Klausuren, die dazu führen, dass das Semester bestanden ist, sind (1, 2, 3, 4); (1, 2, 3); (1, 2, 4); (1, 3, 4); (2, 3, 4); (2, 3); (2, 4); (3, 4). Damit existieren eine Lösung mit vier bestandenen Klausuren, vier Lösungen mit drei bestandenen Klausuren und drei Lösungen mit zwei bestandenen Klausuren. Die gesuchte Gesamtwahrscheinlichkeit ergibt sich somit als P (Semester bestehen) = 0,74 + 4 · 0,73 · 0,31 + 3 · 0,72 · 0,32 = 0,2401 + 0,4116 + 0,1323 = 0,784 (c) Da das Bestehen einer Klausur unabhängig vom Bestehen der anderen Klausuren ist, ergibt sich die gesuchte Wahrscheinlichkeit als P (Durchfallen in Klausur 4|bestehen der ersten drei Klausuren) = 0,3

Lösung L 4-130: (7 Punkte)

Zur Aufgabenstellung A 4-130

(a) Das arithmetische Mittel ergibt sich als x = 1,8 und die Stichprobenstandardabweichung als s = 1,3038. Entsprechend ergibt sich als Teststatistik temp = 1,8−1 1,3038 = 0,6136. Die zugehörige Referenzstatistik beträgt t0,9975;4 = 5,5976. Damit ist die Referenzstatistik größer als die Teststatistik und die H0 -Hypothese kann nicht verworfen werden. Die tatsächliche Anzahl an Ausfällen weicht signifikant von der seitens der Deutschen Bahn propagierten Anzahl ab. (b) Poisson-Verteilung mit λ = 1,8 Gesucht: P(X = 0) P (X = 0) =

1,80 exp(−1,8) 0!

= 0,1653

282

4 Verteilungen

(c) Gesucht: P(X > 1) P (X > 1) = 1 − P (X = 0) − P (X = 1) = 1 − 0,1653 −

1,81 exp(−1,8) 1!

= 1 − 0,1653 − 0,2975 = 0,5372 (d) Zunächst wird ein Konfidenzintervall für die Anzahl der Ausfälle bestimmt:   1,3038 1,3038 1,8 − t0,975;4 √ ≤ μ ≤ 1,8 + t0,975;4 √ 5 5 und damit (0,1811 ≤ μ ≤ 3,4189) Wird dieses Konfidenzintervall mit den Kosten pro Ausfall multipliziert, so ergibt sich das gesuchte Konfidenzintervall als (108.660 ≤ μ ≤ 2.051.340). Lösung L 4-131: (7 Punkte)

Zur Aufgabenstellung A 4-131

(a) Normalverteilung mit μ = 400 und σ = 45 Gesucht: P(X > 500) P (X > 500) = 1 − P (X < 500)   500 − 400 =1− 45 = 1 − (2,22) = 0,0131 (b) Zunächst Gesucht: P(X < 350)  P (X < 350) =

350 − 400 45

= 1 − (1,11) = 1 − 0,8667 = 0,1333 Binomialverteilung mit n = 12 und π = 0,1333



4.4 Lösungen

283

Gesucht: P (X < 1) = P (X = 0) + P (X = 1)     12 11 0 12 = 0,1333 · 0,8667 + 0,13331 · 0,866711 0 1 = 0,1796 + 0,3316 = 0,5112 (c) Gesucht: P(IPhone | 500 MB) P (IPhone|500 MB) = =

P (IPhone ∩ 500 MB) P (500 MB) 0,005 0,0131

= 0,3817

4.4.12 Annäherung von Verteilungen Lösung L 4-132: (3 Punkte) Zur Aufgabenstellung A 4-132 Gegeben: π = 0,01 und n = 10 ⇒ Nutze Poisson-Verteilung mit: μ = 0,01 · 10 = 0,1 = λ Gesucht: P(X ≥ 1) P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − exp(−0,1) = 0,0952 Lösung L 4-133: (3 Punkte) Zur Aufgabenstellung A 4-133 Gegeben: π = 0,15 und n = 50 ⇒ Nutze Poisson-Verteilung mit: λ = 0,15 · 50 = 7,5 Gesucht: P(X < 5) P (X < 5) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4)   7,53 7,54 7,52 + + = exp(−7,5) · 1 + 7,5 + 2 6 24 = exp(−7,5) · 238,7734 = 0,1321

284

4 Verteilungen

Lösung L 4-134: (3 Punkte) Zur Aufgabenstellung A 4-134 Gegeben: N = 75, A = 1 und n = 4 ⇒ Nutze Normalverteilung mit: μ = n · % 4 4 74 75 = 0,0133 und σ = 75 · 75 = 0,1147 Gesucht: P(X ≥ 1)

A N

=

P (X ≥ 1) = 1 − P (X ≤ 1) 4 1 − 75 =1− 0,1147 = 1 − (8,2534) < 10−30 Lösung L 4-135: (3 Punkte) Zur Aufgabenstellung A 4-135 Gegeben: n = 50 und π = 0,05 ⇒ Nutze Normalverteilung mit: μ = 50 · 0,05 = 2,5 √ und σ = 2,5 · 0,95 = 1,5411 Gesucht: P(X ≥ 5) P (X ≥ 5) = 1 − P (X ≤ 5)   5 − 2,5 =1− 1,5411 = 1 − (1,6222) = 1 − 0,9474 = 0,0526 Lösung L 4-136: (3 Punkte) Zur Aufgabenstellung A 4-136 Gegeben: μ = 4,3, N = 100 und n = 5, da die Verteilung symmetrisch ist (normalverteilt), gilt: A = 16 Gesucht: P(X ≥ 2) Nutze hypergeometrische Verteilung: P (X ≥ 2) = 1 − P (X < 2) = 1 − P (X = 0) − P (X = 1) 16 84 16 84 · · = 1 − 01005 − 11004 5

= 1 − 0,4101 − 0,4101 = 0,1798

5

4.4 Lösungen

285

Lösung L 4-137: (3 Punkte) Zur Aufgabenstellung A 4-137 Gegeben: π = 23 , N = 2000 und n = 20 ⇒ Nutze Normalverteilung mit: μ = 20 · 23 = % 13,33 und σ = 13,33 · 13 = 2,1082 Gesucht: P(X < 10)  P (X < 10) =

10 − 13,33 2,1082



= (−1,5795) = 1 − (1,5795) = 1 − 0,9429 = 0,0571

Lösung L 4-138: (3 Punkte) Zur Aufgabenstellung A 4-138 Gegeben: μ = 20, σ = 2 und unter Annahme einer symmetrischen Verteilung (Binomialverteilung) für die Umsätze gilt: P (X2 ≥ 20) = π = 0,5 ⇒ Nutze Binomialverteilung mit: n = 4 und π = 0,5 Gesucht: P(X ≥ 2) P (X ≥ 2) = P (X = 2) + P (X = 3) + P (X = 4)       4 4 4 + + = 0,54 2 3 4 = 11 · 0,54 = 0,6875 Lösung L 4-139: (3 Punkte) Zur Aufgabenstellung A 4-139 Gegeben: π = 0,03, N = 200 und n = 10 ⇒ Nutze Normalverteilung mit: μ = √ 10 · 0,03 = 0,3 und σ = 0,3 · 0,97 = 0,5394 Gesucht: P(X ≥ 5) P (X ≥ 5) = 1 − P (X ≤ 5)   5 − 0,3 =1− 0,5394 = 1 − (8,7134) < 10−30

286

4 Verteilungen

Lösung L 4-140: (3 Punkte) Zur Aufgabenstellung A 4-140 Gegeben: π = 0,01 und n = 20 ⇒ Nutze Binomialverteilung Gesucht: P(X ≥ 1) P (X ≥ 1) = 1 − P (X = 0)   20 =1− 0,010 · 0,9920 0 = 0,1821 Lösung L 4-141: (3 Punkte) Zur Aufgabenstellung A 4-141 Gegeben: π = 0,01, n = 365 ⇒ Nutze Poissonverteilung mit: λ = 0,01 · 365 = 3,65 Gesucht: P(X > 1) P (X > 1) = 1 − P (X ≤ 1) = 1 − P (X = 0) − P (X = 1) = 1 − exp(−3,65) − 3,65 · exp(−3,65) = 0,8791

4.4.13 Stochastische Ungleichungen Lösung L 4-142: (2 Punkte) Zur Aufgabenstellung A 4-142 Gegeben: μ = 150.000 und σ = 40.000 Gesucht: P(|X − 150.000| ≥ 60.000) P (|X − 150.000| ≥ 60.000) ≤

40.0002 60.0002

Lösung L 4-143: (2 Punkte) Gegeben: μ = 2500 Gesucht: P(X ≥ 3000) P (X ≥ 3000) ≤

2500 3000

=

5 6

=

4 9

= 0,4444

Zur Aufgabenstellung A 4-143

= 0,8333

Lösung L 4-144: (2 Punkte) Gegeben: μ = 4 Gesucht: P(X > 7) P (X > 7) ≤ 47 = 0,5714

Zur Aufgabenstellung A 4-144

Lösung L 4-145: (2 Punkte) Zur Aufgabenstellung A 4-145 Gegeben: μ = 2,1 und σ 2 = 0,25 Gesucht: P(|X − 2,1| ≥ 1) P (|X − 2,1| ≥ 1) ≤

0,25 1

= 0,25

4.4 Lösungen

287

Lösung L 4-146: (2 Punkte) Zur Aufgabenstellung A 4-146 Gegeben: μ = 2,5 und σ = 0,5 Gesucht: P(|X − 2,5| < 2,5) P (|X − 2,5| < 2,5) ≥ 1 −

0,25 2,52

= 0,96

Lösung L 4-147: (2 Punkte) Zur Aufgabenstellung A 4-147 Gegeben: μ = 1500 und σ = 200 Gesucht: P(|X − 1500| > 500) P (|X − 1500| > 500) ≤

40.000 5002

Lösung L 4-148: (2 Punkte) Gegeben: μ = 37,3 Gesucht: P(X > 47,3) P (X > 47,3) ≤

37,3 47,3

= 0,16 Zur Aufgabenstellung A 4-148

= 0,7886

Lösung L 4-149: (2 Punkte) Zur Aufgabenstellung A 4-149 Gegeben: μ = 6 und σ 2 = 1 Gesucht: P(|X − 6| ≥ 2) P (|X − 6| ≥ 2) ≤ 14 = 0,25 und aufgrund der Symmetrie folgt: P (X ≥ 2) ≤ 0,5 · 0,25 = 0,125 Alternativ mit der Markow-Ungleichung: P (X ≥ 8) ≤ 68 = 0,75 Lösung L 4-150: (2 Punkte) Gegeben: μ = 30 Gesucht: P(X > 40) P (X > 40) ≤

30 40

Zur Aufgabenstellung A 4-150

= 0,75

Lösung L 4-151: (2 Punkte) Zur Aufgabenstellung A 4-151 Gegeben: μ = 1,3 und σ 2 = 0,01 Gesucht: P(|X − 1,3| ≥ 0,15) P (|X − 1,3| ≥ 0,15) ≤

0,01 0,15

= 0,44

4.4.14 Excel-Aufgaben Lösung L 4-152: (2 Punkte)

Zur Aufgabenstellung A 4-152

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =FAKULTÄT(10-1). (b) (1 Punkte) Die Lösung bestimmt sich über die Funktion =KOMBINATIONEN(10;4).

288

4 Verteilungen

Lösung L 4-153: (2 Punkte) Zur Aufgabenstellung A 4-153 Die Lösung bestimmt sich über die Funktion =POTENZ(36;14). Lösung L 4-154: (2 Punkte) Zur Aufgabenstellung A 4-154 Die Lösung bestimmt sich über die Funktion =POTENZ(90;4). Lösung L 4-155: (2 Punkte) Zur Aufgabenstellung A 4-155 Die Lösung bestimmt sich über die Funktion =FAKULTÄT(10)/FAKULTÄT(10-4). Lösung L 4-156: (2 Punkte) Zur Aufgabenstellung A 4-156 Für eine einfache Lösung werden in die Zellen von A1 bis A5 die Zahlen von 1 bis 5 eingegeben. Die Zelle B1 enthält die Funktion =KOMBINATIONEN(5;A1). Mit der Auto-Ausfüllen-Funktion von Excel kann diese Formel dann auf alle Zellen von B1 bis B5 ausgeweitet werden. Die Lösung der Aufgabe ergibt sich dann über die Formel =SUMME(B1:B5). Lösung L 4-157: (2 Punkte) Zur Aufgabenstellung A 4-157 Analog zur vorhergehenden Aufgabe werden in die Zellen von A1 bis A8 die Zahlen von 1 bis 8 eingegeben. Die Zelle B1 enthält die Funktion =KOMBINATIONEN(10;A1). Mit der Auto-Ausfüllen-Funktion von Excel kann diese Formel dann auf alle Zellen von B1 bis B8 ausgeweitet werden. Die Lösung der Aufgabe ergibt sich dann über die Formel =SUMME(B1:B8). Lösung L 4-158: (2 Punkte) Zur Aufgabenstellung A 4-158 Die Lösung bestimmt sich über die Funktion =FAKULTÄT(5). Lösung L 4-159: (2 Punkte) Zur Aufgabenstellung A 4-159 Die Lösung bestimmt sich über die Funktion =KOMBINATIONEN(10;4). Lösung L 4-160: (2 Punkte) Zur Aufgabenstellung A 4-160 Die Lösung berechnet sich über die Funktion =10*2*4*5. Lösung L 4-161: (2 Punkte) Zur Aufgabenstellung A 4-161 Die Lösung bestimmt sich über die Funktion =KOMBINATIONEN(30;5).

4.4 Lösungen

Lösung L 4-162: (4 Punkte)

289

Zur Aufgabenstellung A 4-162

(a) (3 Punkte) Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(2;4;0,04;WAHR) oder alternativ über =BINOM.VERT(3;4;0,04; FALSCH)+BINOM.VERT(4;4;0,04;FALSCH). (b) (1 Punkte) Die Lösung berechnet sich über die Funktion =60*0,04. Lösung L 4-163: (4 Punkte)

Zur Aufgabenstellung A 4-163

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(1;5;0,3;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(1;5;0,3;WAHR). (c) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(2;22;0,3;FALSCH). Lösung L 4-164: (5 Punkte)

Zur Aufgabenstellung A 4-164

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(3;7;0,95;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(0;7;0,95;FALSCH). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(2;7;0,95;FALSCH) bzw. alternativ über =BINOM.VERT(2;7;0,95;WAHR)-BINOM.VERT(1;7;0,95;WAHR). Lösung L 4-165: (7 Punkte)

Zur Aufgabenstellung A 4-165

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(0;12;0,2;FALSCH). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(4;12;0,2;WAHR)-BINOM.VERT(1;12;0,2;WAHR). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =40*(1-0,2). Lösung L 4-166: (6 Punkte)

Zur Aufgabenstellung A 4-166

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(0;9;0,012;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(0;9;0,012;FALSCH). (c) (3 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(1;9;0,012;FALSCH)2 .

290

Lösung L 4-167: (4 Punkte)

4 Verteilungen

Zur Aufgabenstellung A 4-167

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(0;10;0,001;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(0;10;0,001;FALSCH). (c) (1 Punkte) Die Lösung bestimmt sich über die Funktion =0,001*2500. Lösung L 4-168: (5 Punkte)

Zur Aufgabenstellung A 4-168

(a) (3 Punkte) Die Lösungen bestimmen sich über die Funktionen =BINOM.VERT(0;5;0,005;FALSCH) und =BINOM.VERT(5;5;0,005;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(1;5;0,005;WAHR). Lösung L 4-169: (4 Punkte)

Zur Aufgabenstellung A 4-169

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(1;5;1/6;FALSCH). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(1;5;1/6;WAHR). Lösung L 4-170: (3 Punkte)

Zur Aufgabenstellung A 4-170

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(3;3;0,3;FALSCH). (b) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(0;3;0,3;FALSCH). (c) (1 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(2;3;0,3;FALSCH). Lösung L 4-171: (4 Punkte) Zur Aufgabenstellung A 4-171 Die Lösungen bestimmen sich über die Funktionen =BINOM.VERT(3;3;0,4;FALSCH) und =1-BINOM.VERT(1;3;0,4;WAHR). Lösung L 4-172: (2 Punkte) Zur Aufgabenstellung A 4-172 Die Lösung bestimmt sich über die Funktion =BINOM.VERT(17;20;0,75;WAHR).

4.4 Lösungen

Lösung L 4-173: (5 Punkte)

291

Zur Aufgabenstellung A 4-173

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =BINOM.VERT(4;4;0,5;FALSCH). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(1;4;0,5;WAHR). Lösung L 4-174: (5 Punkte)

Zur Aufgabenstellung A 4-174

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(0;2;11;22;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(0;2;11;22;FALSCH). (c) (1 Punkte) Die Lösung bestimmt sich über die Funktion =0,5*16*22. Lösung L 4-175: (6 Punkte)

Zur Aufgabenstellung A 4-175

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(5;5;25;50;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(4;5;25;50;WAHR). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(12;15;25;50;FALSCH). Lösung L 4-176: (4 Punkte)

Zur Aufgabenstellung A 4-176

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(2;2;150;250;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(1;2;150;250;WAHR). Lösung L 4-177: (8 Punkte)

Zur Aufgabenstellung A 4-177

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(5;5;5;100;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(0;5;5;100;FALSCH). (c) (4 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(2;5;5;100;WAHR).

292

Lösung L 4-178: (5 Punkte)

4 Verteilungen

Zur Aufgabenstellung A 4-178

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(0;5;6;100;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(1;5;6;100;WAHR). (c) (1 Punkte) Die Lösung bestimmt sich über die Funktion =0,06*500. Lösung L 4-179: (6 Punkte)

Zur Aufgabenstellung A 4-179

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(0;4;40;50;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(4;4;40;50;FALSCH). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(1;4;40;50;WAHR). Lösung L 4-180: (7 Punkte)

Zur Aufgabenstellung A 4-180

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(6;6;20;60;FALSCH). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(3;6;20;60;WAHR). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =365*20*60. Lösung L 4-181: (4 Punkte)

Zur Aufgabenstellung A 4-181

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(1;5;20;100;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(0;5;20;100;FALSCH). Lösung L 4-182: (5 Punkte)

Zur Aufgabenstellung A 4-182

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(2;5;30;50;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(1;5;30;50;WAHR). (c) (1 Punkte) Die Lösung bestimmt sich über die Funktion =30*20.

4.4 Lösungen

Lösung L 4-183: (7 Punkte)

293

Zur Aufgabenstellung A 4-183

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(1;5;15;45;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(3;5;15;45;WAHR). (c) (3 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(5;5;15;45;FALSCH) · HYPGEOM.VERT(0;5;15;45;FALSCH)8 . Lösung L 4-184: (6 Punkte)

Zur Aufgabenstellung A 4-184

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(4;10;4;32;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =200*HYPGEOM.VERT(4;10;4;32;FALSCH). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(0;4/32;FALSCH). Lösung L 4-185: (2 Punkte) Zur Aufgabenstellung A 4-185 Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(4;10;20;45;FALSCH). Lösung L 4-186: (4 Punkte)

Zur Aufgabenstellung A 4-186

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(3;3;4;40;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(0;3;4;40;FALSCH). Lösung L 4-187: (4 Punkte)

Zur Aufgabenstellung A 4-187

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(1;3;5;24;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(0;3;5;24;FALSCH). Lösung L 4-188: (6 Punkte)

Zur Aufgabenstellung A 4-188

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(2;0,2;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(2;0,2;FALSCH).

294

4 Verteilungen

(c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(0;0,2;FALSCH). Lösung L 4-189: (4 Punkte)

Zur Aufgabenstellung A 4-189

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(2;0;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(0;0;FALSCH). Lösung L 4-190: (4 Punkte)

Zur Aufgabenstellung A 4-190

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(2;5;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(6;5;WAHR)-POISSON.VERT(3;5;WAHR). Lösung L 4-191: (6 Punkte)

Zur Aufgabenstellung A 4-191

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(2;1;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(4;1;WAHR)-POISSON.VERT(1;1;WAHR). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(1;1;WAHR). Lösung L 4-192: (6 Punkte)

Zur Aufgabenstellung A 4-192

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(1;1/3;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(2;1/3;WAHR). (c) (2 Punkte) In die Zellen A1 bis A5 werden die Zahlen 1 bis 5 eingegeben. In Zelle B1 wird die Funktion POISSON.VERT(A1;1/3;FALSCH) eingegeben und über die Auto-Ausfüllen-Funktion auf die Zellen B2 bis B5 erweitert. Analog wird in C1 die Funktion A1*10.000 verwendet und auf die Zellen C2 bis C5 ausgeweitet. Die Lösung bestimmt sich über die Funktion =SUMMENPRODUKT(B1:B5;C1:C5). Lösung L 4-193: (4 Punkte)

Zur Aufgabenstellung A 4-193

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(1;0,6931;FALSCH).

4.4 Lösungen

295

(b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(1;0,6931;WAHR). Lösung L 4-194: (6 Punkte)

Zur Aufgabenstellung A 4-194

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(1;4,2;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(0;4,2;FALSCH)2 . (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(1;4;WAHR). Lösung L 4-195: (4 Punkte)

Zur Aufgabenstellung A 4-195

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(1;3,91;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(0;3,91;FALSCH). Lösung L 4-196: (6 Punkte)

Zur Aufgabenstellung A 4-196

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(1;1,39;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(2;1,39;FALSCH). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(2;1,39;FALSCH). Lösung L 4-197: (4 Punkte)

Zur Aufgabenstellung A 4-197

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(1;1,61;FALSCH). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(2;1,61;WAHR). Lösung L 4-198: (2 Punkte) Zur Aufgabenstellung A 4-198 Die Lösung bestimmt sich über die Funktion =(1/168)*8. Lösung L 4-199: (3 Punkte) Zur Aufgabenstellung A 4-199 Die Lösung bestimmt sich über die Funktion =(1/168)2 .

296

4 Verteilungen

Lösung L 4-200: (3 Punkte) Zur Aufgabenstellung A 4-200 Die Lösung bestimmt sich über die Funktion =1-(1/17)*5. Lösung L 4-201: (2 Punkte) Zur Aufgabenstellung A 4-201 Die Lösung bestimmt sich über die Funktion =(1/365)*59. Lösung L 4-202: (3 Punkte) Zur Aufgabenstellung A 4-202 Die Lösung bestimmt sich über die Funktion =(1/600)*300. Lösung L 4-203: (3 Punkte) Zur Aufgabenstellung A 4-203 Die Mittelwert bestimmt sich über die Funktion =(0+365)/2. Die Varianz bestimmt sich über die Funktion =(1/12)*(365-0)2 . Lösung L 4-204: (2 Punkte) Zur Aufgabenstellung A 4-204 Die Lösung bestimmt sich über die Funktion =(1/365)*62. Lösung L 4-205: (2 Punkte) Zur Aufgabenstellung A 4-205 Die Lösung bestimmt sich über die Funktion =1-3,3+2,5. Lösung L 4-206: (2 Punkte) Zur Aufgabenstellung A 4-206 Die Lösung bestimmt sich über die Funktion =(1/365)*30. Lösung L 4-207: (2 Punkte) Zur Aufgabenstellung A 4-207 Die Lösung bestimmt sich über die Funktion =(1/480)*10. Lösung L 4-208: (4 Punkte)

Zur Aufgabenstellung A 4-208

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =EXPON.VERT(24;1/48;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-EXPON.VERT(168;1/48;WAHR).

4.4 Lösungen

Lösung L 4-209: (4 Punkte)

297

Zur Aufgabenstellung A 4-209

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =EXPON.VERT(5;1/30;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-EXPON.VERT(240;1/30;WAHR). Lösung L 4-210: (4 Punkte)

Zur Aufgabenstellung A 4-210

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =EXPON.VERT(0,5;0,5;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-EXPON.VERT(7;0,5;WAHR). Lösung L 4-211: (4 Punkte)

Zur Aufgabenstellung A 4-211

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-EXPON.VERT(24;1/3;WAHR). (b) (2 Punkte) Die Varianz ergibt sich über die Funktion =(1/(1/3))2 und die Standardabweichung entsprechend =1/(1/3). Lösung L 4-212: (3 Punkte)

Zur Aufgabenstellung A 4-212

(a) (1 Punkte) Der Mittelwert ist durch den Kehrwert von λ bereits bestimmt. (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-EXPON.VERT(1;2;WAHR). Lösung L 4-213: (3 Punkte)

Zur Aufgabenstellung A 4-213

(a) (1 Punkte) Der Mittelwert ist durch den Kehrwert von λ bereits bestimmt. (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =EXPON.VERT(3;0,3;WAHR). Lösung L 4-214: (4 Punkte)

Zur Aufgabenstellung A 4-214

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =EXPON.VERT(7;2/7;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-EXPON.VERT(10;2/7;WAHR).

298

Lösung L 4-215: (3 Punkte)

4 Verteilungen

Zur Aufgabenstellung A 4-215

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-EXPON.VERT(50;0,01;WAHR). (b) (1 Punkte) Der Median bestimmt sich über die Funktion =0,693/0,01. Lösung L 4-216: (5 Punkte)

Zur Aufgabenstellung A 4-216

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-EXPON.VERT(50;0,04;WAHR). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =EXPON.VERT(30;0,04;WAHR) -EXPON.VERT(20;0,04;WAHR). Lösung L 4-217: (2 Punkte) Zur Aufgabenstellung A 4-217 Der Median bestimmt sich über die Funktion =0,693/10. Lösung L 4-218: (8 Punkte)

Zur Aufgabenstellung A 4-218

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(„14:10“;„14;10“;„00:02“;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(„14:12“;„14:10“;„00:02“;WAHR) - NORM.VERT(„14:10“;„14:10“;„00:02“;WAHR). (c) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(„14:15“;„14:10“;„00:02“;WAHR) - NORM.VERT(„14:05“;„14:10“;„00:02“;WAHR). (d) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(„14:15“;„14:10“;„00:02“;WAHR). Lösung L 4-219: (6 Punkte)

Zur Aufgabenstellung A 4-219

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(20;25;2;WAHR). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(24;25;2;WAHR)-NORM.VERT(20;25;2;WAHR). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(25;25;2;WAHR).

4.4 Lösungen

Lösung L 4-220: (7 Punkte)

299

Zur Aufgabenstellung A 4-220

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(1,6;1,5;0,05;WAHR). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(1,55;1,5;0,05;WAHR) -NORM.VERT(1,45;1,5;0,05;WAHR). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(1,4;1,5;0,05;WAHR). Lösung L 4-221: (8 Punkte)

Zur Aufgabenstellung A 4-221

(a) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(5;4,7;0,1;WAHR) -NORM.VERT(4,9;4,7;0,1;WAHR). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(4,8;4,7;0,1;WAHR). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(4,5;4,7;0,1;WAHR) + 1 - NORM.VERT(4,9;4,7;0,1;WAHR). Das Resultat ist dann noch mit 10.000 zu multiplizieren. Lösung L 4-222: (6 Punkte)

Zur Aufgabenstellung A 4-222

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(5700;6000;50;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(6200;6000;50;WAHR). (c) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(6100;6000;50;WAHR) - NORM.VERT(5900;6000;50;WAHR). Lösung L 4-223: (8 Punkte)

Zur Aufgabenstellung A 4-223

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(125;120;0,5;WAHR). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(121;120;0,5;WAHR) - NORM.VERT(119;120;0,5;WAHR). (c) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(122;120;0,5;WAHR). (d) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(118;120;0,5;WAHR).

300

Lösung L 4-224: (5 Punkte)

4 Verteilungen

Zur Aufgabenstellung A 4-224

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(0;15;3;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(20;15;3;WAHR). (c) (2 Punkte) Für die Antwort ist Excel nicht erforderlich. Lösung L 4-225: (4 Punkte)

Zur Aufgabenstellung A 4-225

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(1500;1000;200;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(500;1000;200;WAHR). Lösung L 4-226: (8 Punkte)

Zur Aufgabenstellung A 4-226

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(85,5;45;10;WAHR). (b) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(45;45;10;WAHR) - NORM.VERT(42;45;10;WAHR). (c) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(40;45;10;WAHR). Lösung L 4-227: (5 Punkte)

Zur Aufgabenstellung A 4-227

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(5;9,5;1,5;WAHR). (b) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(2;9,5;1,5;WAHR). (c) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(2;12;2,5;WAHR). Diese Lösung ist mit der Lösung aus Teil b) so dann zu vergleichen. Lösung L 4-228: (8 Punkte)

Zur Aufgabenstellung A 4-228

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(36;40;2;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(42;40;2;WAHR).

4.4 Lösungen

301

(c) (3 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(42;40;2;WAHR) -NORM.VERT(39;40;2;WAHR). (d) (1 Punkte) Die Lösung bestimmt sich über die Funktion =40+NORM.S.INV(0,95)*2. (e) (1 Punkte) Die Lösung bestimmt sich über die Funktion =40-NORM.S.INV(0,90)*2. Lösung L 4-229: (5 Punkte)

Zur Aufgabenstellung A 4-229

(a) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(950;1000;20;WAHR). (b) (3 Punkte) Die linke Seite des Intervalls ergibt sich über die Funktion =1000-NORM.S.INV(0,975)*20/WURZEL(100). Entsprechend ergibt sich die rechte Seite des Intervalls über die Funktion =1000+NORM.S.INV(0,975)*20/WURZEL(100). (c) (1 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(900;1000;20;WAHR). Lösung L 4-230: (5 Punkte)

Zur Aufgabenstellung A 4-230

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(30;15;5;WAHR). (b) (3 Punkte) Die linke Seite des Intervalls ergibt sich über die Funktion =15-NORM.S.INV(0,975)*5. Entsprechend ergibt sich die rechte Seite des Intervalls über die Funktion =15+NORM.S.INV(0,975)*5. Lösung L 4-231: (6 Punkte)

Zur Aufgabenstellung A 4-231

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(0,55;0,5;0,02;WAHR). (b) (1 Punkte) Die Lösung bestimmt sich über die Funktion =5000*0,0062. (c) (3 Punkte) Die linke Seite des Intervalls ergibt sich über die Funktion =0,5-NORM.S.INV(0,975)*0,02. Entsprechend ergibt sich die rechte Seite des Intervalls über die Funktion =0,5+NORM.S.INV(0,975)*0,02.

302

Lösung L 4-232: (4 Punkte)

4 Verteilungen

Zur Aufgabenstellung A 4-232

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =NORM.VERT(73;75;1;WAHR) + 1 - NORM.VERT(77;75;1;WAHR). (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =HYPGEOM.VERT(1;10;5;100;FALSCH). Lösung L 4-233: (3 Punkte)

Zur Aufgabenstellung A 4-233

(a) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(100;80;4;WAHR). (b) (1 Punkte) Die Lösung bestimmt sich über die Funktion =POISSON.VERT(1;0,0000143;FALSCH). Lösung L 4-234: (3 Punkte)

Zur Aufgabenstellung A 4-234

(a) (1 Punkte) Die Lösung bestimmt sich direkt aus der Informationen der Aufgabenstellung und dem Umstellen nach λ. (b) (2 Punkte) Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(0;6,9078;FALSCH). Lösung L 4-235: (2 Punkte) Zur Aufgabenstellung A 4-235 Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(1;4;7;10;WAHR). Lösung L 4-236: (4 Punkte)

Zur Aufgabenstellung A 4-236

(a) (3 Punkte) Die Lösung bestimmt sich über die Funktion =1-HYPGEOM(2;15;10;200;WAHR). (b) (1 Punkte) Die Lösung bestimmt sich über die Funktion =0,035 . Lösung L 4-237: (2 Punkte) Zur Aufgabenstellung A 4-237 Die Lösung bestimmt sich durch Auflösen der gegebenen Wahrscheinlichkeit nach der gesuchten Anzahl A. Dies kann in Excel näherungsweise mit der Zielwertsuche realisiert werden. Das Vorgehen hierzu wurde in Kapitel 1 ausführlich erläutert. Lösung L 4-238: (3 Punkte) Zur Aufgabenstellung A 4-238 Die Lösung bestimmt sich durch Auflösen der gegebenen Wahrscheinlichkeit nach der gesuchten Grenze B. Dies kann in Excel näherungsweise mit der Zielwertsuche realisiert werden. Das Vorgehen hierzu wurde in Kapitel 1 ausführlich erläutert.

4.4 Lösungen

303

Lösung L 4-239: (4 Punkte) Zur Aufgabenstellung A 4-239 Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(1;2,0402;WAHR). Lösung L 4-240: (2 Punkte) Zur Aufgabenstellung A 4-240 Die Lösung bestimmt sich durch Auflösen der gegebenen Wahrscheinlichkeit nach der gesuchten Standardabweichung. Dies kann in Excel näherungsweise mit der Zielwertsuche realisiert werden. Das Vorgehen hierzu wurde in Kapitel 1 ausführlich erläutert. Lösung L 4-241: (3 Punkte)

Zur Aufgabenstellung A 4-241

(a) (2 Punkte) Die Lösung bestimmt sich durch Auflösen der gegebenen Wahrscheinlichkeit nach dem gesuchten Parameter. Dies kann in Excel näherungsweise mit der Zielwertsuche realisiert werden. Das Vorgehen hierzu wurde in Kapitel 1 ausführlich erläutert. (b) (1 Punkte) Die Lösung ist direkt durch die Symmetrie der Normalverteilung gegeben. Lösung L 4-242: (3 Punkte) Zur Aufgabenstellung A 4-242 Die Lösung bestimmt sich durch Auflösen der gegebenen Wahrscheinlichkeit nach dem gesuchten Parameter. Dies kann in Excel näherungsweise mit der Zielwertsuche realisiert werden. Das Vorgehen hierzu wurde in Kapitel 1 ausführlich erläutert. Lösung L 4-243: (3 Punkte) Zur Aufgabenstellung A 4-243 Die Lösung bestimmt sich durch Auflösen der gegebenen Wahrscheinlichkeit nach dem gesuchten Parameter. Dies kann in Excel näherungsweise mit der Zielwertsuche realisiert werden. Das Vorgehen hierzu wurde in Kapitel 1 ausführlich erläutert. Lösung L 4-244: (2 Punkte) Zur Aufgabenstellung A 4-244 Die Lösung bestimmt sich über die Funktion =BINOM.VERT(5;5;15/50;WAHR). Lösung L 4-245: (3 Punkte) Zur Aufgabenstellung A 4-245 Die Lösung bestimmt sich durch Auflösen der gegebenen Wahrscheinlichkeit nach dem gesuchten Parameter. Dies kann in Excel näherungsweise mit der Zielwertsuche realisiert werden. Das Vorgehen hierzu wurde in Kapitel 1 ausführlich erläutert. Lösung L 4-246: (3 Punkte) Zur Aufgabenstellung A 4-246 Die Lösung bestimmt sich durch Auflösen der gegebenen Wahrscheinlichkeit nach dem gesuchten Parameter. Dies kann in Excel näherungsweise mit der Zielwertsuche realisiert werden. Das Vorgehen hierzu wurde in Kapitel 1 ausführlich erläutert.

304

Lösung L 4-247: (2 Punkte) Zur Aufgabenstellung A 4-247 Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(0;0,1;FALSCH). Lösung L 4-248: (2 Punkte) Zur Aufgabenstellung A 4-248 Die Lösung bestimmt sich über die Funktion =POISSON.VERT(4;7,5;WAHR). Lösung L 4-249: (2 Punkte) Zur Aufgabenstellung A 4-249 Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(1;0,0133;0,1147;WAHR). Lösung L 4-250: (2 Punkte) Zur Aufgabenstellung A 4-250 Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(5;2,5;1,5411;WAHR). Lösung L 4-251: (2 Punkte) Zur Aufgabenstellung A 4-251 Die Lösung bestimmt sich über die Funktion =1-HYPGEOM.VERT(1;5;16;100;WAHR). Lösung L 4-252: (2 Punkte) Zur Aufgabenstellung A 4-252 Die Lösung bestimmt sich über die Funktion =NORM.VERT(10;13,33;2,1082;WAHR). Lösung L 4-253: (2 Punkte) Zur Aufgabenstellung A 4-253 Die Lösung bestimmt sich über die Funktion =1-BINOM(1;4;0,5;WAHR). Lösung L 4-254: (2 Punkte) Zur Aufgabenstellung A 4-254 Die Lösung bestimmt sich über die Funktion =1-NORM.VERT(5;0,3;0,5394;WAHR). Lösung L 4-255: (2 Punkte) Zur Aufgabenstellung A 4-255 Die Lösung bestimmt sich über die Funktion =1-BINOM.VERT(0;20;0,01;FALSCH). Lösung L 4-256: (2 Punkte) Zur Aufgabenstellung A 4-256 Die Lösung bestimmt sich über die Funktion =1-POISSON.VERT(1;365;WAHR).

4 Verteilungen

4.5 Wiederholungsfragen

4.5

305

Wiederholungsfragen

• Was versteht man unter Zufallsvariablen? • Worin besteht der Unterschied zwischen Wahrscheinlichkeits- und Dichtefunktionen? • Wie können Wahrscheinlichkeitsfunktionen grafisch dargestellt werden? • Worin unterscheiden sich Histogramme von herkömmlichen Balkendiagrammen? • Was können Sie über die Fläche unter einer Dichtefunktion aussagen? • Was stellt die Verteilungsfunktion dar? Wie hängen Dichte- und Verteilungsfunktion zusammen? • Worin besteht der Unterschied zwischen Permutationen, Variationen und Kombinationen? • In welcher Situation findet die Binomialverteilung Verwendung? • In welcher Situation findet die hypergeometrische Verteilung Verwendung? • In welcher Situation findet die geometrische Verteilung Verwendung? Wie berechnet sich hierbei die Verteilungsfunktion? • Wann findet die Poisson-Verteilung Verwendung? • Welche Eigenschaft bringt die Exponentialverteilung mit? • Welche Nachteile weist die Normalverteilung auf? • Wie „berechnet“ man Werte der Verteilungsfunktion einer normalverteilten Zufallvariablen? • Was versteht man unter Standardisierung einer Variablen? • Welche Eigenschaften besitzt die Standardnormalverteilung? • Was sagt die Markow-Ungleichung aus? • Welche Abschätzung erlaubt die Tschebyscheff-Ungleichung?

5

Punkt- und Intervallschätzung

Inhalte • Konfidenzintervalle bei bekannter Varianz • Konfidenzintervalle bei unbekannter Varianz • Konfidenzintervalle für die Varianz

5.1

Theoretische Grundlagen

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Konfidenzintervalle

5.1.1

Konfidenzintervalle für den Mittelwert

Bei der Konstruktion eines Konfidenzintervalls um den Mittelwert geht man analog vor wie bei der Berechnung der Wahrscheinlichkeit einer Normalverteilung. Die einzigen © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 J. K. Perret, Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler, https://doi.org/10.1007/978-3-658-26148-1_5

307

308

5 Punkt- und Intervallschätzung

beiden Unterschiede in diesem Kontext sind, dass die Wahrscheinlichkeit bereits vorgegeben ist und man den Weg der Berechnung rückwärts durchläuft und dass die Wahrscheinlichkeit in Beziehung zu der Stichprobengröße gesetzt werden muss. Der Hintergrund gerade für den zweiten Unterschied ist, dass die Berechnung im Rahmen der Normalverteilung lediglich eine theoretische Wahrscheinlichkeit bestimmt. Hier wird allerdings eine Aussage aufgrund einer Stichprobe getätigt.

5.1.1.1 . . . bei bekannter Varianz Da die Varianz bekannt ist, kann von derselben Formel ausgegangen werden wie bei der Normalverteilung (verändert lediglich dadurch, dass die Varianz durch die Stichprobengröße zu teilen ist) und es ist, abhängig davon, ob ein einseitiges oder ein zweiseitiges Konfidenzintervall bestimmt werden soll, eine der folgenden Formeln zu verwenden. Der Unterschied zwischen einseitigen und zweiseitigen Intervallen besteht darin, dass bei einseitigen Intervallen lediglich die Wahrscheinlichkeit auf einer Seite des Intervalls festgelegt wird, während bei einem zweiseitigen Intervall die Wahrscheinlichkeit auf beiden Seiten festgesetzt wird. Dies bedeutet aber auch, dass bei einem einseitigen 95 %-Konfidenzintervall 5 % jenseits der beschränkten Seite liegen, während bei einem zweiseitigen 95 %-Konfidenzintervall jeweils 2,5 % auf jeder Seite jenseits der Intervallgrenze liegen. Entsprechend sind auch andere Werte aus der inversen Normalverteilung zu nutzen; z0,95 bei einem einseitigen Intervall und z0,975 bei einem zweiseitigen Intervall (schließlich liegen 97,5 % und nicht 95 % links der Obergrenze bzw. rechts der Untergrenze). Um dies zu verallgemeinern, spricht man meistens allgemein von einer Fehlerwahrscheinlichkeit α, die in diesem Beispiel 0,05 wäre. Die einseitigen Intervalle bestimmen sich dann wie folgt:   x − z1−α · √σn ≤ μ ≤ ∞   ∞ ≤ μ ≤ x − z1+α · √σn Das entsprechende zweiseitige Intervall ergibt sich als: 

σ σ x − z1−α/2 · √ ≤ μ ≤ x + z1−α/2 · √ n n



Man sieht, dass die Intervalle umso kleiner werden, je größer die Stichprobe wird. Dieses Phänomen lässt sich auf das Gesetz der großen Zahlen zurückführen, das in einem früheren Kapitel dargestellt wurde und das aussagt, dass sich mit steigendem Stichprobenumfang das arithmetische Mittel dem theoretischen Mittelwert immer mehr annähert.

5.1 Theoretische Grundlagen

309

5.1.1.2 . . . bei unbekannter Varianz Ist die Varianz unbekannt, so ist sie durch die Stichprobenvarianz s 2 anzunähern. Da für die Varianz lediglich ein Schätzwert bekannt ist, kann nicht länger auf die inverse Normalverteilung z1−α Bezug genommen werden und der entsprechende Term ist durch die inverse t-Verteilung zu ersetzen, sodass sich die einseitigen und zweiseitigen Konfidenzintervalle wie folgt ergeben:



  x − t1−α;n−1 · √sn ≤ μ ≤ ∞   ∞ ≤ μ ≤ x − t1+α;n−1 · √sn x − t1−α/2;n−1 ·

√s n

≤ μ ≤ x + t1−α/2;n−1 ·

√s n



Wie auch in Fall mit einer bekannten Varianz werden die Intervalle mit wachsendem Stichprobenumfang immer enger. Zusätzlich nähert sich die t-Verteilung aber auch der Normalverteilung an. Dies bedeutet, dass für eine hinreichend große Stichprobe (n > 30) auch wieder auf die Normalverteilung Bezug genommen werden kann und die Konfidenzintervalle sich in diesem Fall wie folgt bestimmen lassen:   x − z1−α · √sn ≤ μ ≤ ∞   ∞ ≤ μ ≤ x − z1+α · √sn

 x − z1−α/2 ·

5.1.2

√s n

≤ μ ≤ x + z1−α/2 ·

√s n



Konfidenzintervalle für die Varianz

Im Gegensatz zu den Konfidenzintervallen um den Mittelwert kann ein Konfidenzintervall für die Varianz σ 2 nicht direkt aus der Normalverteilung abgeleitet werden. Im Gegenteil ergibt es sich wie folgt:

(n − 1) · s 2 (n − 1) · s 2 2 ≤ σ ≤ 2 2 χ1−α/2;n−1 χα/2;n−1



Auch wenn es nicht so offensichtlich ist wie für die Konfidenzintervalle um den Mittelwert, auch das Konfidenzintervall für die Varianz wird mit zunehmender Stichprobengröße enger, da sich nach dem Gesetz der großen Zahlen auch die Stichprobenvarianz immer mehr der theoretischen Varianz annähert.

310

5 Punkt- und Intervallschätzung

5.2

Realisierung in Excel

5.2.1

Konfidenzintervall bei bekannter Varianz

Zur Berechnung des Konfidenzintervalls wird der Wert der inversen Standardnormalverteilung zu einer vorgegebenen Wahrscheinlichkeit (z1−α ) benötigt. Dieser lässt sich in Excel mithilfe der Funktion NORM.S.INV(Wert) berechnen, wobei Wert die entsprechende Wahrscheinlichkeit ist. Diese Funktion findet auch wieder Verwendung bei der Durchführung eines Mittelwerttests bei bekannter Varianz.

Erklärungen Excel: Normalverteilungstest

5.2.2

Konfidenzintervall bei unbekannter Varianz

Ist die Varianz unbekannt, so ist anstelle der inversen Standardnormalverteilung die inverse t-Verteilung zu verwenden. Auch diese Funktion stellt Excel über die Funktion T.INV(Wert 1; Wert 2) zur Verfügung. W ert1 beschreibt die entsprechende Wahrscheinlichkeit, zu der die Statistik bestimmt werden soll. W ert2 gibt die Freiheitsgrade an. Diese sind zunächst ausgehend von der zugrunde liegenden Datenreihe zu bestimmen. Dies ist zum Beispiel möglich über ANZAHL(A:A)-1, sofern die Datenreihe in Spalte A notiert ist. Die kombinierte Funktion ergibt sich dann als T.INV(Wert; ANZAHL(A:A)-1). Dies ist auch die Funktion, die zur Bestimmung der Referenzstatistik, im Rahmen der Signifikanztests für Koeffizienten bei der linearen Regression als auch bei Mittelwerttests bei unbekannter Varianz, wieder Verwendung findet.

Erklärungen Excel: T-Verteilung und -Test

5.3 Aufgaben

5.2.3

311

Konfidenzintervall für die Varianz

Im Rahmen der Bestimmung des Konfidenzintervalls für die Varianz wird die inverse χ 2 -Statistik benötigt. Diese kann in Excel über die Funktion CHIQU.INV(Wert 1; Wert 2) bestimmt werden. W ert1 beschreibt wieder die Wahrscheinlichkeit und W ert2 gibt die Anzahl der Freiheitsgrade an. Dies ist auch die Funktion, die zur Bestimmung der Referenzstatistik, im Kontext der im Rahmen diese Buchs vorgestellten Verteilungstests, Verwendung findet.

Erklärungen Excel: χ 2 -Verteilung und -Test

5.3

Aufgaben

5.3.1

Konfidenzintervalle für den Mittelwert bei bekannter Varianz

Aufgabe A 5-1: (4 Punkte) Zur Lösung L 5-1 Die Ergebnisse einer Partei bei den letzten Wahlen, gemäß der regionalen Aufteilung, sahen wie folgt aus. Geben Sie ein 95 %-Konfidenzintervall für das durchschnittliche Wahlergebnis an (angenommen jede Region hat den gleichen Anteil am Gesamtergebnis). Gehen Sie davon aus, dass die Standardabweichung des Wahlergebnisses 6,27 Prozentpunkte beträgt. 34,1

17,8

25,6

23,2

35,2

31,5

28,7

22,9

35,4

Aufgabe A 5-2: (4 Punkte) Zur Lösung L 5-2 Bestimmen Sie ein 90 %-Konfidenzintervall für die durchschnittliche Fehlerquote einer Maschine. Die Werte der letzten Woche betragen: 5,1

1,6

3,1

2,7

1,2

Es hat sich gezeigt, dass die Maschine mit einer Varianz von 2,34 arbeitet.

312

5 Punkt- und Intervallschätzung

Aufgabe A 5-3: (4 Punkte) Zur Lösung L 5-3 Die Umsätze der letzten sechs Monate waren wie folgt: 37

17

29

31

35

33

Geben Sie ein 95 %-Konfidenzintervall für die durchschnittlichen Umsätze an, wenn davon ausgegangen werden kann, dass die Umsätze mit einer Varianz von 50,67 schwanken. Aufgabe A 5-4: (4 Punkte) Zur Lösung L 5-4 Eine Maschine schafft den folgenden Output pro Tag: 110

120

105

110

115

Bestimmen Sie ein 95 %-Konfidenzintervall für den zu erwartenden Output, wobei eine Varianz von 32,5 unterstellt werden kann. Aufgabe A 5-5: (4 Punkte) Zur Lösung L 5-5 Die Konversionsraten der Marketingkampagnen der letzten Jahre waren wie folgt: 10,8

13,2

12,4

14

Bestimmen Sie ein 90 %-Konfidenzintervall für die mittlere Konversionsrate, bei einer Standardabweichung von 1,37. Aufgabe A 5-6: (4 Punkte) Zur Lösung L 5-6 Die Entwicklung der Facebook-Fans eines Unternehmens weist eine Standardabweichung von 0,51 auf und sah, in absoluten Zahlen, wie folgt aus: 5300

5850

6100

6300

6650

Bestimmen Sie ein 95 %-Konfidenzintervall für die mittlere Anzahl der neuen Facebook-Fans.

5.3 Aufgaben

313

Aufgabe A 5-7: (4 Punkte) Zur Lösung L 5-7 Ein Professor hat in den letzten Semestern die folgenden Durchschnittsnoten in seiner Mathevorlesung erreicht. 2,3

1,7

2,1

2,0

2,3

1,8

Bestimmen Sie ein 95 %-Konfidenzintervall für die zu erwartende Durchschnittsnote. Die Standardabweichung von 0,25 gilt als gegeben. Aufgabe A 5-8: (4 Punkte) Zur Lösung L 5-8 Hans hatte in den letzten Monaten die folgenden Handykosten (Standardabweichung: 1,68): 23,71

19,85

21,54

23,87

22,81

Beantworten Sie durch die Bestimmung eines 95 %-Konfidenzintervalls, ob sich für Hans die Anschaffung einer Flatrate für e22 lohnt. Aufgabe A 5-9: (4 Punkte) Zur Lösung L 5-9 Eine Zugverbindung zeigte in einer Woche die folgenden Verspätungen: 0

0

2

15

0

2

0

0

5

2

Bestimmen Sie ein 95 %-Konfidenzintervall für die mittlere Verspätung, wenn die Standardabweichung 4,65 Minuten beträgt. Aufgabe A 5-10: (4 Punkte) Zur Lösung L 5-10 Die Besucherzahlen eines Freizeitparks (in 10.000) in den letzten Tagen sahen wie folgt aus, wobei aus der Vergangenheit eine Standardabweichung von 0,5 bekannt ist. 4,3

5,1

5,4

4,7

4,9

5,7

5,9

Bestimmen Sie ein 95 %-Konfidenzintervall für die zu erwartenden Besucherzahlen.

314

5.3.2

5 Punkt- und Intervallschätzung

Konfidenzintervalle für den Mittelwert bei unbekannter Varianz

Aufgabe A 5-11: (5 Punkte) Zur Lösung L 5-11 Die Ergebnisse einer Partei bei den letzten Wahlen, gemäß der regionalen Aufteilung, sahen wie folgt aus. 34,1

17,8

25,6

23,2

35,2

31,5

28,7

22,9

35,4

Geben Sie ein 95 %-Konfidenzintervall für das durchschnittliche Wahlergebnis an (angenommen jede Region hat den gleichen Anteil am Gesamtergebnis). Aufgabe A 5-12: (5 Punkte) Zur Lösung L 5-12 Bestimmen Sie ein 90 %-Konfidenzintervall für die durchschnittliche Fehlerquote einer Maschine. Die Werte der letzten Woche betragen: 5,1

1,6

3,1

2,7

1,2

Aufgabe A 5-13: (5 Punkte) Zur Lösung L 5-13 Die Umsätze der letzten sechs Monate waren wie folgt: 37

17

29

31

35

33

Geben Sie ein 95 %-Konfidenzintervall für die durchschnittlichen Umsätze an. Aufgabe A 5-14: (5 Punkte) Zur Lösung L 5-14 Eine Maschine schafft den folgenden Output pro Tag: 110

120

105

110

115

Bestimmen Sie ein 95 %-Konfidenzintervall für den zu erwartenden Output. Aufgabe A 5-15: (5 Punkte) Zur Lösung L 5-15 Die Konversionsraten der Marketingkampagnen der letzten Jahre waren wie folgt: 10,8

13,2

12,4

14

Bestimmen Sie ein 90 %-Konfidenzintervall für die mittlere Konversionsrate.

5.3 Aufgaben

315

Aufgabe A 5-16: (5 Punkte) Zur Lösung L 5-16 Die Entwicklung der Facebook-Fans eines Unternehmens sah wie folgt aus: 5300

5850

6100

6300

6650

Bestimmen Sie ein 95 %-Konfidenzintervall für die mittlere Anzahl der neuen Facebook-Fans. Aufgabe A 5-17: (5 Punkte) Zur Lösung L 5-17 Ein Professor hat in den letzten Semestern die folgenden Durchschnittsnoten in seiner Mathevorlesung erreicht. Bestimmen Sie ein 95 %-Konfidenzintervall für die zu erwartende Durchschnittsnote. 2,3

1,7

2,1

2,0

2,3

1,8

Aufgabe A 5-18: (5 Punkte) Zur Lösung L 5-18 Hans hatte in den letzten Monaten die folgenden Handykosten: 23,71

19,85

21,54

23,87

22,81

Beantworten Sie durch die Bestimmung eines 95 %-Konfidenzintervalls, ob sich für Hans die Anschaffung einer Flatrate für e22 lohnt. Aufgabe A 5-19: (5 Punkte) Zur Lösung L 5-19 Eine Zugverbindung zeigte in einer Woche die folgenden Verspätungen: 0

0

2

15

0

2

0

0

5

2

Bestimmen Sie ein 95 %-Konfidenzintervall für die mittlere Verspätung. Aufgabe A 5-20: (5 Punkte) Zur Lösung L 5-20 Die Besucherzahlen eines Freizeitparks (in 10.000) in den letzten Tagen sahen wie folgt aus: 4,3

5,1

5,4

4,7

4,9

5,7

5,9

Bestimmen Sie ein 95 %-Konfidenzintervall für die zu erwartenden Besucherzahlen.

316

5.3.3

5 Punkt- und Intervallschätzung

Konfidenzintervalle für die Varianz

Aufgabe A 5-21: (5 Punkte) Zur Lösung L 5-21 Die Ergebnisse einer Partei bei den letzten Wahlen, gemäß der regionalen Aufteilung, sahen wie folgt aus. 34,1

17,8

25,6

23,2

35,2

31,5

28,7

22,9

35,4

Geben Sie ein 95 %-Konfidenzintervall für die Varianz des Wahrergebnisses an (angenommen jede Region hat den gleichen Anteil am Gesamtergebnis). Aufgabe A 5-22: (5 Punkte) Zur Lösung L 5-22 Bestimmen Sie ein 90 %-Konfidenzintervall für die Varianz der Fehlerquote einer Maschine. Die Werte der letzten Woche betragen: 5,1

1,6

3,1

2,7

1,2

Aufgabe A 5-23: (5 Punkte) Zur Lösung L 5-23 Die Umsätze der letzten sechs Monate waren wie folgt: 37

17

29

31

35

33

Geben Sie ein 95 %-Konfidenzintervall für die Varianz der Umsätze an. Aufgabe A 5-24: (5 Punkte) Zur Lösung L 5-24 Eine Maschine schafft den folgenden Output pro Tag: 110

120

105

110

115

Bestimmen Sie ein 95 %-Konfidenzintervall für die Varianz des Outputs. Aufgabe A 5-25: (5 Punkte) Zur Lösung L 5-25 Die Konversionsraten der Marketingkampagnen der letzten Jahre waren wie folgt: 10,8

13,2

12,4

14

Geben Sie ein 95 %-Konfidenzintervall für die Varianz der Konversionsraten an.

5.3 Aufgaben

317

Aufgabe A 5-26: (5 Punkte) Zur Lösung L 5-26 Die Entwicklung der Facebook-Fans eines Unternehmens sah wie folgt aus: 5300

5850

6100

6300

6650

Bestimmen Sie ein 95 %-Konfidenzintervall für die Standardabweichung der Anzahl der neuen Facebook-Fans. Aufgabe A 5-27: (5 Punkte) Zur Lösung L 5-27 Ein Professor hat in den letzten Semestern die folgenden Durchschnittsnoten in seiner Mathevorlesung erreicht. 2,3

1,7

2,1

2,0

2,3

1,8

Bestimmen Sie ein 95 %-Konfidenzintervall für die Varianz der Durchschnittsnoten. Aufgabe A 5-28: (5 Punkte) Zur Lösung L 5-28 Hans hatte in den letzten Monaten die folgenden Handykosten: 23,71

19,85

21,54

23,87

22,81

Bestimmen Sie ein 90 %-Konfidenzintervall für die Standardabweichung von Hans’ Handykosten. Aufgabe A 5-29: (5 Punkte) Zur Lösung L 5-29 Eine Zugverbindung zeigte in einer Woche die folgenden Verspätungen: 0

0

2

15

0

2

0

0

5

2

Bestimmen Sie ein 95 %-Konfidenzintervall für die Varianz der Verspätung. Aufgabe A 5-30: (5 Punkte) Zur Lösung L 5-30 Die Besucherzahlen eines Freizeitparks (in 10.000) in den letzten Tagen sahen wie folgt aus: 4,3

5,1

5,4

4,7

4,9

5,7

5,9

Bestimmen Sie ein 95 %-Konfidenzintervall für die Varianz der Besucherzahlen.

318

5.3.4

5 Punkt- und Intervallschätzung

Excel-Aufgaben

Aufgabe A 5-31: (3 Punkte) Zur Lösung L 5-31 Nutzen Sie Excel-interne Formeln und Funktionen zur Lösung von Aufgabe A 5-1 bis A 5-10. Aufgabe A 5-32: (3 Punkte) Zur Lösung L 5-32 Nutzen Sie Excel-interne Formeln und Funktionen zur Lösung von Aufgabe A 5-11 bis A 5-20. Aufgabe A 5-33: (3 Punkte) Zur Lösung L 5-33 Nutzen Sie Excel-interne Formeln und Funktionen zur Lösung von Aufgabe A 5-21 bis A 5-30.

5.3.5

Aufgaben mit Erklärvideos

5.3.5.1 Konfidenzintervalle für den Mittelwert Aufgabe A 5-34: (10 Punkte) Bestimmen Sie ein 95 %-Konfidenzintervall für den Mittelwert der Ergebnisse eines Assessment-Center-Tests, wenn Ihnen die folgenden Testwerte vorliegen: 107 103

74 130

129 91

55 73

110 98

Video zur Lösung der Aufgabe

Aufgabe A 5-35: (10 Punkte) Der Umfang (in A4-Seiten) von zehn ausgewählten Abschlussarbeiten ergab sich wie folgt: 44 45

51 45

47 48

48 50

50 47

5.3 Aufgaben

319

Bestimmen Sie ein 95 %-Konfidenzintervall für den durchschnittlichen Umfang einer Abschlussarbeit.

Video zur Lösung der Aufgabe

Aufgabe A 5-36: (10 Punkte) Für zehn Studenten wird die Note der Abschlussarbeit erhoben: 1,7 1,5

2,15 2,0

1,7 3,15

2,5 2,3

1,85 2,15

Bestimmen Sie ein 95 %-Konfidenzintervall für die tatsächliche mittlere Abschlussnote.

Video zur Lösung der Aufgabe

5.3.5.2 Konfidenzintervalle für die Varianz Aufgabe A 5-37: (10 Punkte) Die Stabhöhe der Esel eines Streichelzoos liegen bei den folgenden Werten: 1,3 1,05

1,05 1,1

1,0 1,2

1,0 1,0

1,2

(a) Berechnen Sie die unkorrigierte Stichprobenvarianz. (b) Bestimmen Sie ausgehend von dem Datenset und den Ergebnissen aus Teil a) ein 95 %Konfidenzintervall für die tatsächliche Varianz.

320

5 Punkt- und Intervallschätzung

Video zur Lösung der Aufgabe

Aufgabe A 5-38: (10 Punkte) Die Einkommen (Stundensätze) der Mitarbeiter einer lokalen Fleischerei verteilen sich wie folgt: 12 12

11 13

13 10

11 16

11 11

(a) Berechnen Sie die unkorrigierte Stichprobenvarianz. (b) Bestimmen Sie ausgehend von dem Datenset und den Ergebnissen aus Teil a) ein 95 %Konfidenzintervall für die tatsächliche Varianz.

Video zur Lösung der Aufgabe

5.4

Lösungen

5.4.1

Konfidenzintervalle für den Mittelwert bei bekannter Varianz

Lösung L 5-1: (4 Punkte) Zur Aufgabenstellung A 5-1 Das Konfidenzintervall ergibt sich mit n = 9, x = 28,2667 und σ = 6,27 als: [24,1703; 32,3631] Lösung L 5-2: (4 Punkte) Zur Aufgabenstellung A 5-2 Das Konfidenzintervall ergibt sich mit n = 5, x = 2,74 und σ = 1,5297 als: [1,6147; 3,8653]

5.4 Lösungen

321

Lösung L 5-3: (4 Punkte) Zur Aufgabenstellung A 5-3 Das Konfidenzintervall ergibt sich mit n = 6, x = 30,3333 und σ = 7,1183 als: [24,6376; 36,0290] Lösung L 5-4: (4 Punkte) Zur Aufgabenstellung A 5-4 Das Konfidenzintervall ergibt sich mit n = 5, x = 112 und σ = 5,7009 als: [107,0031; 116,9969] Lösung L 5-5: (4 Punkte) Zur Aufgabenstellung A 5-5 Das Konfidenzintervall ergibt sich mit n = 4, x = 12,6 und σ = 1,37 als: [11,4733; 13,7267] Lösung L 5-6: (4 Punkte) Zur Aufgabenstellung A 5-6 Das Konfidenzintervall ergibt sich mit n = 5, x = 6,040 und σ = 0,51 als: [6039,553; 6040,447] Lösung L 5-7: (4 Punkte) Zur Aufgabenstellung A 5-7 Das Konfidenzintervall ergibt sich mit n = 6, x = 2,0333 und σ = 0,25 als: [1,8333; 2,2334] Lösung L 5-8: (4 Punkte) Zur Aufgabenstellung A 5-8 Das Konfidenzintervall ergibt sich mit n = 5, x = 22,356 und σ = 1,68 als: [20,8834; 23,8286] Da das Konfidenzintervall die Kosten der Flatrate umfasst, lohnt sich die Anschaffung für Hans. Lösung L 5-9: (4 Punkte) Zur Aufgabenstellung A 5-9 Das Konfidenzintervall ergibt sich mit n = 10, x = 2,6667 und σ = 4,65 als: [−0,2154; 5,5487] Lösung L 5-10: (4 Punkte) Zur Aufgabenstellung A 5-10 Das Konfidenzintervall ergibt sich mit n = 7, x = 5,1429 und σ = 0,5 als: [4,7725; 5,5133]

5.4.2

Konfidenzintervalle für den Mittelwert bei unbekannter Varianz

Lösung L 5-11: (5 Punkte) Zur Aufgabenstellung A 5-11 Das Konfidenzintervall ergibt sich mit n = 9, x = 28,2667 und s = 6,2726 als: [23,4452; 33,0882]

322

5 Punkt- und Intervallschätzung

Lösung L 5-12: (5 Punkte) Zur Aufgabenstellung A 5-12 Das Konfidenzintervall ergibt sich mit n = 5, x = 2,74 und s = 1,5307 als: [1,2807; 4,1993] Lösung L 5-13: (5 Punkte) Zur Aufgabenstellung A 5-13 Das Konfidenzintervall ergibt sich mit n = 6, x = 30,3333 und s = 7,1181 als: [22,8634; 37,8033] Lösung L 5-14: (5 Punkte) Zur Aufgabenstellung A 5-14 Das Konfidenzintervall ergibt sich mit n = 5, x = 112 und s = 5,7009 als: [104,9214; 119,0786] Lösung L 5-15: (5 Punkte) Zur Aufgabenstellung A 5-15 Das Konfidenzintervall ergibt sich mit n = 4, x = 12,6 und s = 1,3663 als: [10,9924; 14,2077] Lösung L 5-16: (5 Punkte) Zur Aufgabenstellung A 5-16 Das Konfidenzintervall ergibt sich mit n = 5, x = 6,040 und s = 506,705 als: [5410,843; 6669,157] Lösung L 5-17: (5 Punkte) Zur Aufgabenstellung A 5-17 Das Konfidenzintervall ergibt sich mit n = 6, x = 2,0333 und s = 0,2503 als: [1,7706; 2,296] Lösung L 5-18: (5 Punkte) Zur Aufgabenstellung A 5-18 Das Konfidenzintervall ergibt sich mit n = 5, x = 22,356 und s = 1,6791 als: [20,2711; 24,4409] Lösung L 5-19: (5 Punkte) Zur Aufgabenstellung A 5-19 Das Konfidenzintervall ergibt sich mit n = 10, x = 2,6667 und s = 4,6476 als: [−0,658; 5,9913] Lösung L 5-20: (5 Punkte) Zur Aufgabenstellung A 5-20 Das Konfidenzintervall ergibt sich mit n = 7, x = 5,1429 und s = 0,5653 als: [4,6201; 5,6656]

5.4.3

Konfidenzintervalle für die Varianz

Lösung L 5-21: (5 Punkte) Zur Aufgabenstellung A 5-21 Das Konfidenzintervall ergibt sich mit n = 9 und s 2 = 39,345 als: [17,9509; 115,1855]

5.4 Lösungen

323

Lösung L 5-22: (5 Punkte) Zur Aufgabenstellung A 5-22 Das Konfidenzintervall ergibt sich mit n = 5 und s 2 = 2,343 als: [0,9878; 8,8114] Lösung L 5-23: (5 Punkte) Zur Aufgabenstellung A 5-23 Das Konfidenzintervall ergibt sich mit n = 6 und s 2 = 50,6667 als: [19,7415; 221,1598] Lösung L 5-24: (5 Punkte) Zur Aufgabenstellung A 5-24 Das Konfidenzintervall ergibt sich mit n = 5 und s 2 = 32,5 als: [11,6662; 182,9123] Lösung L 5-25: (5 Punkte) Zur Aufgabenstellung A 5-25 Das Konfidenzintervall ergibt sich mit n = 4 und s 2 = 1,8667 als: [0,599; 15,916] Lösung L 5-26: (5 Punkte) Zur Aufgabenstellung A 5-26 Das Konfidenzintervall ergibt sich mit n = 5 und s 2 = 256,750 als: [92.163,11; 1445,007] Lösung L 5-27: (5 Punkte) Zur Aufgabenstellung A 5-27 Das Konfidenzintervall ergibt sich mit n = 6 und s 2 = 0,0627 als: [0,0244; 0,2735] Lösung L 5-28: (5 Punkte) Zur Aufgabenstellung A 5-28 Das Konfidenzintervall ergibt sich mit n = 5 und s 2 = 2,8194 als: [1,012; 15,8677] Lösung L 5-29: (5 Punkte) Zur Aufgabenstellung A 5-29 Das Konfidenzintervall ergibt sich mit n = 10 und s 2 = 21,6 als: [10,2193; 58,4642] Lösung L 5-30: (5 Punkte) Zur Aufgabenstellung A 5-30 Das Konfidenzintervall ergibt sich mit n = 7 und s 2 = 0,3195 als: [0,1327; 1,1723]

5.4.4

Excel-Aufgaben

Lösung L 5-31: (3 Punkte) Zur Aufgabenstellung A 5-31 Zunächst werden die Werte in Spalte A, die Fehlerwahrscheinlichkeit in Zelle B1 und die Standardabweichung in Zelle C1 übernommen.

324

5 Punkt- und Intervallschätzung

Die linke Seite des Konfidenzintervalls bestimmt sich über die Funktion =MITTELWERT(A:A ) -NORM.S.INV(1-B1/2) * C1 / WURZEL(ANZAHL(A:A)). Die rechte Seite des Konfidenzintervalls bestimmt sich über die Funktion =MITTELWERT(A:A) + NORM.S.INV(1-B1/2) * C1 / WURZEL(ANZAHL(A:A)). Lösung L 5-32: (3 Punkte) Zur Aufgabenstellung A 5-32 Zunächst werden die Werte in Spalte A und die Fehlerwahrscheinlichkeit in Zelle B1 übernommen. Die linke Seite des Konfidenzintervalls bestimmt sich über die Funktion =MITTELWERT(A:A ) - T.INV(1-B1/2;ANZAHL(A:A)-1) * STABW.S(A:A) / WURZEL(ANZAHL(A:A)). Die rechte Seite des Konfidenzintervalls bestimmt sich über die Funktion =MITTELWERT(A:A) + T.INV(1-B1/2;ANZAHL(A:A)-1) * STABW.S(A:A) / WURZEL(ANZAHL(A:A)). Lösung L 5-33: (3 Punkte) Zur Aufgabenstellung A 5-33 Zunächst werden die Werte in Spalte A und die Fehlerwahrscheinlichkeit in Zelle B1 übernommen. Die linke Seite des Konfidenzintervalls bestimmt sich über die Funktion =(ANZAHL(A:A)-1) * VARIANZ.S(A:A) / CHIQU.INV(1-B1/2;ANZAHL(A:A)-1). Die rechte Seite des Konfidenzintervalls bestimmt sich über die Funktion =(ANZAHL(A:A)-1) * VARIANZ.S(A:A) / CHIQU.INV(B1/2;ANZAHL(A:A)-1).

5.5

Wiederholungsfragen

• Wofür werden Konfidenzintervalle benötigt? • Wie bestimmt sich ein Konfidenzintervall für den Mittelwert? • Worin unterscheidet sich ein Konfidenzintervall für den Mittelwert bei gegebener Varianz von einem, bei dem die Varianz nicht extern vorgegeben wird? • Wie bestimmt sich ein Konfidenzintervall für die Varianz?

6

Testtheorie

Inhalte • • • • • • • •

Grundlagen Testtheorie Einstichprobenmittelwerttest bei bekannter Varianz Einstichprobenmittelwerttest bei unbekannter Varianz Zweistichprobentest bei bekannter Varianz Zweistichprobentest bei unbekannter Varianz Unabhängigkeitstest Anpassungstest Homogenitätstest

6.1

Theoretische Grundlagen

6.1.1

Grundlagen

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Testtheorie © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 J. K. Perret, Arbeitsbuch zur Statistik für Wirtschafts- und Sozialwissenschaftler, https://doi.org/10.1007/978-3-658-26148-1_6

325

326

6 Testtheorie

6.1.1.1 Hypothesen Ein statistischer Test ist ein mathematisches Verfahren zur Überprüfung von Hypothesen. Ein solcher Test besteht aus einer Nullhypothese und einer Alternativhypothese, die sich gegenseitig ausschließen, aber alle möglichen Ergebnisse des Tests abdecken. Die Nullhypothese bezeichnet man auch als H0 -Hypothese und die Alternativhypothese als H1 -Hypothese. Auch wenn der Name etwas anderes suggeriert, enthält die Alternativhypothese die Aussage, die gezeigt werden soll bzw. die getestet werden soll. Im Gegensatz dazu ist die Nullhypothese diejenige, die widerlegt bzw. verworfen werden soll. Dies zeigt auch bereits die grundlegende Vorgehensweise bei jedem statistischen Test. Die Alternativhypothese wird nicht direkt nachgewiesen. Es erfolgt somit kein direkter Beweis der zu testenden Aussage. Stattdessen wird die Nullhypothese bei einer bestimmten Fehlerwahrscheinlichkeit verworfen. Dies bedeutet insbesondere, dass ein statistischer Test nie eine absolute Aussage liefert (und somit keinen Beweis), sondern stets eine fehlerbehaftete Annahme. Die Aufgabe besteht darin die möglichen Fehler so klein wie möglich zu halten. Hierzu ist allerdings zunächst zu klären, welche Fehlerarten es gibt und welche davon von zentralem Interesse sind. 6.1.1.2 Fehlerarten Da immer mit einer Null- und einer Alternativhypothese gearbeitet wird, sind die folgenden vier Ergebnisse denkbar (Tab. 6.1): Tab. 6.1 Fehlerarten Realität\Testergebnis H0 ist korrekt H1 ist korrekt

H0 ist korrekt Richtige Entscheidung Fehler 1. Art (α)

H1 ist korrekt Fehler 2. Art (β) Richtige Entscheidung

Die Tabelle zeigt, dass es zwei Möglichkeiten gibt, eine falsche Entscheidung zu treffen. Bei einem Fehler 1. Art (auch α-Fehler genannt) wird das zu zeigende Ergebnis bestätigt, obwohl es falsch ist. Im Gegensatz dazu wird bei einem Fehler 2. Art (auch β-Fehler genannt) das zu zeigende Ergebnis abgelehnt, obwohl es in Realität korrekt wäre. Es ist direkt ersichtlich, dass die Reduktion eines der beiden Fehlers zu einer Erhöhung des jeweils anderen Fehlers führt. Ferner lässt sich aber zeigen, dass für ein Fehlerniveau von 5 % beide Fehlerarten etwa ausgeglichen sind, sodass beim Testen zumeist eine Fehlerwahrscheinlichkeit von 5 % als Grenzwert angesetzt wird. In nahezu allen Testverfahren (so auch in diesem Buch) wird allerdings der α-Fehler in den Vordergrund gerückt, da hierbei eine falsche Entdeckung propagiert würde. Entsprechend wird die Akzeptanzgrenze zwar bei α = 0,05 = 5 % angesetzt; sollte dieser Wert aber geringer ausfallen, so wird dies als Vorteil interpretiert, da so die Irrtumswahrscheinlichkeit reduziert wird.

6.1 Theoretische Grundlagen

327

6.1.1.3 Testen und Beweisen Ein statistischer Test konzipiert sich in einer von zwei Ausprägungen. Im ersten Schritt ist in beiden Fällen eine Teststatistik zu berechnen. Im zweiten Schritt ist zu entscheiden, ob das Interesse darin besteht, dass ein vorgegebener α-Fehler oder in anderen Worten ein vorgegebenes Signifikanzniveau eingehalten wurde oder ob der genaue Wert des α-Fehlers bestimmt werden soll. Hierbei gestaltet sich der erste Ansatz erwartungsgemäß einfacher und stellt auch die Variante dar, die im Rahmen dieses Buchs Verwendung findet. Diese Form des Tests führt man durch, indem ein Referenzwert herangezogen wird, der bezogen auf die Verteilung der Teststatistik den Wert für den jeweils vorgegebenen α-Fehler darstellt. Ist die Teststatistik größer oder gleich dem Referenzwert, so kann die unterstellte H0 -Hypothese verworfen werden und die H1 -Hypothese wird angenommen. Liegt der Referenzwert oberhalb der Teststatistik, so kann die H0 -Hypothese nicht verworfen werden und muss als gültig angenommen werden. Der zweite Ansatz erfordert, dass aufbauend auf der Verteilung der Teststatistik der genaue α-Fehler berechnet wird, da dies allerdings per Hand zumeist sehr aufwendig ist, wird dieser Ansatz im Rahmen dieses Buchs nicht weiterverfolgt. Allerdings begegnet man im Kontext von Statistikprogrammen wie SPSS, Stata oder EViews diesem Ansatz wesentlich häufiger als den ersten Varianten, da man hierbei nicht auf ein zuvor festgelegtes Fehlerniveau angewiesen ist. Im Rahmen vieler Statistikprogramme wird der α-Fehler auch als p-Wert bezeichnet, wobei das p für die Wahrscheinlichkeit (probability) steht, dass die H0 -Hypothese die korrekte Annahme darstellt. Es gilt zu beachten, dass unabhängig von der gewählten Vorgehensweise weder die H0 noch die H1 -Hypothese bewiesen werden. Es kann lediglich gesagt werden, dass zu dem vorgegebenen Signifikanzniveau bzw. bei einer akzeptablen Fehlerwahrscheinlichkeit von α die H0 -Hypothese verworfen werden kann oder nicht.

6.1.2

Parametrische Tests – Mittelwerttests

Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Mittelwerttests

328

6 Testtheorie

Mittelwerttests können auf zwei Arten durchgeführt werden. In der einfachsten Variante wird in Analogie zum vorherigen Kapitel ein Konfidenzintervall um den Mittelwert konstruiert und geprüft, ob sich dieser in dem Intervall, dem Annahmebereich befindet. In der Alternativvariante wird aufbauend auf der Idee der Konfidenzintervalle eine Teststatistik bestimmt und mit einer entsprechenden Referenzstatistik verglichen. Unabhängig von dem verwendeten Testverfahren und der Varianz lauten die Testhypothesen: H0 -Hypothese: H1 -Hypothese:

Mittelwert und arithmetisches Mittel stimmen überein. Mittelwert und arithmetisches Mittel sind verschieden.

6.1.2.1 . . . bei bekannter Varianz/Gauß-Test Ähnlich wie bei den Konfidenzintervallen ist zu unterscheiden, ob die Varianz bekannt ist oder nicht. Bei bekannter Varianz kann der Gauß-Test durchgeführt werden. Unabhängig von der gewählten Variante wird hier zunächst die Variante des Tests dargestellt, bei der auf Ungleichheit getestet wird. Variante 1 Zunächst wird ein Konfidenzintervall um den Mittelwert bestimmt:   σ σ μ − z1−α/2 · √ ≤ x ≤ μ + z1−α/2 · √ n n Liegt das arithmetische Mittel außerhalb des Annahmebereichs, so kann bei einer Fehlerwahrscheinlichkeit von α die H0 -Hypothese verworfen werden. Liegt das arithmetische Mittel im Annahmebereich, so ist die H0 -Hypothese beizubehalten. Variante 2 Es wird die folgende Teststatistik bestimmt: zemp =

x−μ √ · n σ

Die zugehörige Referenzstatistik lautet: z1−α/2 Ist die Teststatistik größer als die Referenzstatistik, so kann die H0 -Hypothese verworfen werden. Ist die Referenzstatistik die größere der beiden Statistiken, so ist die H0 -Hypothese beizubehalten. Neben dem zweiseitigen Test bei dem lediglich auf Gleichheit oder Ungleichheit getestet wird, existieren auch einseitige Tests, bei denen auf Abweichungen nach oben oder unten getestet wird. Die entsprechenden Hypothesen ergeben sich als: H0 -Hypothese: Mittel. H1 -Hypothese:

Der Mittelwert ist größer/kleiner oder gleich dem arithmetischen Der Mittelwert ist kleiner/größer als das arithmetische Mittel.

6.1 Theoretische Grundlagen

329

Die zugehörigen Annahmebereiche ergeben sich somit als:   μ − z1−α · √σn ≤ x ≤ ∞   −∞ ≤ x ≤ μ + z1−α · √σn Da bei dem einseitigen Test lediglich eine Seite der Verteilung betrachtet wird, teilt sich die Fehlerwahrscheinlichkeit nicht länger auf einen linken und einen rechten Abschnitt auf, so dass die inverse Standardnormalverteilungsfunktion von 1 − α zu bestimmen ist.

6.1.2.2 . . . bei unbekannter Varianz/t-Test Ist die Varianz unbekannt, so wird der Gauß-Test durch einen t-Test ersetzt, wobei die Struktur des Tests gleich bleibt, daher gibt es auch hier zwei Varianten, den Test durchzuführen. Unabhängig von der gewählten Variante wird hier zunächst die Variante des Tests dargestellt, bei der auf Ungleichheit getestet wird. Variante 1 Zunächst wird ein Konfidenzintervall um den Mittelwert bestimmt:   s s μ − t1−α/2;n−1 · √ ≤ x ≤ μ + t1−α/2;n−1 · √ n n Liegt das arithmetische Mittel außerhalb des Annahmebereichs, so kann bei einer Fehlerwahrscheinlichkeit von α die H0 -Hypothese verworfen werden. Liegt das arithmetische Mittel im Annahmebereich, so ist die H0 -Hypothese beizubehalten. Variante 2 Es wird die folgende Teststatistik bestimmt: temp =

x−μ √ · n s

Die zugehörige Referenzstatistik lautet: t1−α/2;n−1 Ist die Teststatistik größer als die Referenzstatistik, so kann die H0 -Hypothese verworfen werden. Ist die Referenzstatistik die größere der beiden Statistiken, so ist die H0 -Hypothese beizubehalten. Analog zum Gauß-Test ergeben sich die Annahmebereiche eines einseitigen t-Tests aus:   μ − t1−α;n−1 · √sn ≤ x ≤ ∞   −∞ ≤ x ≤ μ + z1−α;n−1 · √sn

330

6 Testtheorie

6.1.2.3 Test auf einen vorgegebenen Wert Neben der Frage, ob Mittelwert und arithmetisches Mittel übereinstimmen, kann auch die Frage aufkommen, ob das arithmetische Mittel mit einem vorgegebenen Testwert a übereinstimmt. In diesem Fall kann der Test wie oben als t-Test durchgeführt werden, wobei sich die Teststatistik ergibt als: temp

& & &x − a √ & & · n&& =& s

Die zugehörige Referenzstatistik lautet: t1−α/2;n−1 Ist die Teststatistik größer als die Referenzstatistik, so kann die H0 -Hypothese verworfen werden. Ist die Referenzstatistik die größere der beiden Statistiken, so ist die H0 -Hypothese beizubehalten und das arithmetische Mittel stimmt mit dem Testwert überein. Soll ein einseitiger Test genutzt werden (x ≤ a oder x ≥ a), so ist zunächst die Teststatistik temp ohne Betragsstriche zu bestimmen. Im Weiteren ist zu testen, ob die entsprechende der unten stehenden Beziehungen erfüllt ist: temp ≤ t1−α;n−1

temp ≥ −t1−α;n−1

6.1.2.4 Zwei-Stichproben-Test bei bekannter Varianz In Ergänzung zum obigen Ein-Stichproben-Test kann es auch interessant sein, die arithmetischen Mittel zweier Stichproben miteinander zu vergleichen. Hierzu verwendet man den Zwei-Stichproben-Test. Die Hypothesen müssen in diesem Fall leicht modifiziert werden, da die Mittelwerte zweier Stichproben miteinander zu vergleichen sind. Die neuen Hypothesen lauten: H0 -Hypothese: überein. H1 -Hypothese: verschieden.

Mittelwert von Stichprobe 1 und Mittelwert von Stichprobe 2 stimmen Mittelwert von Stichprobe 1 und Mittelwert von Stichprobe 2 sind

Von der Struktur her sind diese Formen von Mittelwerttests den bisher besprochenen aber nicht unähnlich. Abhängig davon, ob die Varianz bekannt ist oder durch die Stichprobenvarianz geschätzt werden muss, wird zunächst eine Teststatistik bestimmt. Bei bekannter Varianz ergibt sich diese als: x1 − x2 zemp = % 2 σ1 σ22 n + m Die zugehörige Referenzstatistik ergibt sich als: z1−α/2 . Ist die Teststatistik größer als die Referenzstatistik, so kann die H0 -Hypothese verworfen werden. Ist die Referenzstatistik die größere der beiden Statistiken, so ist die H0 -Hypothese beizubehalten.

6.1 Theoretische Grundlagen

331

6.1.2.5 Zwei-Stichproben-Test bei unbekannter Varianz Wie auch bei einer bekannten Varianz ist zunächst eine Teststatistik zu bestimmen:  x1 − x2 n·m · temp = S n+m x1 und x2 sind die Mittel der beiden Stichproben, wobei in der ersten Stichprobe n und in der zweiten m Teilnehmer vorhanden sind. Der Wert für S bestimmt sich über die folgende Formel: S2 =

(n − 1) · sx2 + (m − 1) · sy2 n+m−2

Die zugehörige Referenzstatistik ergibt sich als: t1−α/2;n+m−2 Ist die Teststatistik größer als die Referenzstatistik, so kann die H0 -Hypothese verworfen werden. Ist die Referenzstatistik die größere der beiden Statistiken, so ist die H0 -Hypothese beizubehalten.

6.1.3

Verteilungstest

Bei den folgenden Verteilungstests wird kein Vergleich mit einem Lageparameter angestrebt, sondern es soll die jeweilige Verteilung getestet werden bzw. es sollen unterschiedliche Verteilungen verglichen werden. In diesem Kontext sind sich alle drei Tests vom Prinzip her ähnlich.

6.1.3.1 Unabhängigkeitstest Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Unabhängigkeitstest

Die Testhypothesen lauten hier: H0 -Hypothese: H1 -Hypothese:

Zeilen- und Spaltenvariable sind stochastisch unabhängig. Zeilen- und Spaltenvariable sind stochastisch abhängig.

332

6 Testtheorie

Ausgehend von einer Kontingenztabelle werden über Zeilen- (ni;. ) und Spaltensummen (n.;j ) die Randhäufigkeiten sowie die Gesamtsumme (n) bestimmt. Die folgende Kontingenztabelle fasst diese Begriffe zusammen: x1 n1;1 .. . nk;1 n.;1

y1 .. . yk 

... ...

... ...

xm n1;m .. . nk;m n.;m

 n1;. .. . nk;. n

Unter Benutzung der Randhäufigkeiten wird eine zweite Tabelle mit den erwarteten Häufigkeiten berechnet, wobei sich die erwarteten Häufigkeiten ei;j wie folgt ergeben: nˆ i;j =

ni;. · n.;j n

2 ergibt sich durch einen Vergleich der tatsächlichen und Die benötigte Teststatistik χemp der erwarteten Häufigkeiten durch die folgende Formel:

2 χemp

J I (ni;j − nˆ i;j )2 = nˆ i;j i=1 j =1

Hierbei sind I die Zeilen- und J die Spaltenanzahl. 2 Die zugehörige Referenzstatistik ergibt sich über χ1−α;(I −1)·(J −1) Ist die Teststatistik größer als die Referenzstatistik, so kann die H0 -Hypothese verworfen werden. Ist die Referenzstatistik die größere der beiden Statistiken, so ist die H0 -Hypothese beizubehalten.

6.1.3.2 Anpassungstest Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Anpassungstest

6.1 Theoretische Grundlagen

333

Die Testhypothesen lauten hier: H0 -Hypothese: H1 -Hypothese:

Die vorliegenden Daten folgen der vorgegebenen Verteilung. Die vorliegenden Daten folgen nicht der vorgegebenen Verteilung.

Ausgehend von der Datentabelle wird die Stichprobengröße n berechnet. Diese wird mit den relativen Häufigkeiten der einzelnen Kategorien pi (vorgegebene Verteilung) multipliziert, um die erwarteten Häufigkeiten ei = pi · n zu bestimmen. 2 ergibt sich dann durch einen Vergleich der tatsächlichen Die benötigte Teststatistik χemp und der erwarteten Häufigkeiten durch die folgende Formel: 2 = χemp

I (ni − nˆ i )2 nˆ i i=1

2 Die zugehörige Referenzstatistik ergibt sich über χ1−α;(I −1) Ist die Teststatistik größer als die Referenzstatistik, so kann die H0 -Hypothese verworfen werden. Ist die Referenzstatistik die größere der beiden Statistiken, so ist die H0 -Hypothese beizubehalten.

6.1.3.3 Homogenitätstest Eine kurze Videoaufbereitung dieses Abschnitts findet sich hier:

Theorie: Homogenitätstest

Die Testhypothesen lauten hier: H0 -Hypothese: H1 -Hypothese:

Die beiden Datenreihen weisen die gleiche Verteilung auf. Die beiden Datenreihen weisen unterschiedliche Verteilungen auf.

Ausgehend von der Datentabelle werden die Stichprobengrößen n und m berechnet. Diese ˆ i ) wie werden genutzt, um die erwarteten Häufigkeiten der beiden Stichproben (nˆ i und m folgt zu berechnen: ni + mi n+m ni + mi m ˆi = m· n+m nˆ i = n ·

334

6 Testtheorie

2 ergibt sich durch einen Vergleich der tatsächlichen und Die benötigte Teststatistik χemp der erwarteten Häufigkeiten über die folgende Formel:

2 = χemp

 I  (ni − nˆ i )2 ˆ i )2 (mi − m + nˆ i m ˆi i=1

2 Die zugehörige Referenzstatistik ergibt sich über χ1−α;(I −1) Ist die Teststatistik größer als die Referenzstatistik, so kann die H0 -Hypothese verworfen werden. Ist die Referenzstatistik die größere der beiden Statistiken, so ist die H0 -Hypothese beizubehalten.

6.2

Realisierung in Excel

6.2.1

Mittelwerttest und t-Tests

Soll ein t-Test nicht durch die explizite Berechnung einer Test- und einer Referenzstatistik durchgeführt werden,1 sondern durch Bestimmung der Fehlerwahrscheinlichkeit, des Signifikanzniveaus, so kann der in Excel implementierte t-Test über die Funktion T.TEST(Bereich 1; Bereich 2; Seiten; Typ) verwendet werden. Bereich1 beschreibt die Ausgangsdaten, während Bereich2 die entsprechend erwarteten Häufigkeiten bezeichnet. Entsprechend müssen beide Bereiche gleich groß sein. Seiten beschreibt, ob es sich um einen einseitigen (1) oder um einen zweiseitigen Test (2) handeln soll. T yp schließlich gibt eine Auskunft darüber, ob es sich um gepaarte Daten handelt (1) bzw. wenn nicht, ob Varianzgleichheit angenommen wird (2) oder nicht (3).

Erklärungen Excel: T-Verteilung und -Test

1 Wie die einzelnen inversen Normal- und t-Verteilungen bzw. die χ 2 -Verteilung in Excel bestimmt werden können, kann in Abschn. 5.2 nachgelesen werden.

6.3 Aufgaben

335

Erklärungen Excel: χ 2 -Verteilung und -Test

6.2.2

Verteilungstests

Auch der χ 2 -Test ist direkt in Excel implementiert. Dieser kann mittels der Funktion CHIQU.TEST(Bereich 1; Bereich 2) durchgeführt werden. Hierbei enthält Bereich1 die Ausgangsdaten, während Bereich2 die erwarteten Häufigkeiten enthält. Entsprechend müssen die beiden Bereiche auch gleich groß sein. Wie auch beim oben dargestellten t-Test ist das Ergebnis die Fehlerwahrscheinlichkeit bzw. das Signifikanzniveau.

6.3

Aufgaben

Quick Check - Wahr oder Falsch?

Zur Lösung

• Der Gauß-Test erfordert immer Kenntnis über die Varianz. • Der Unabhängigkeitstest erfordert, dass die zugrunde liegende Tabelle ausschließlich ganze Zahlen enthält. • Der Homogenitätstest kann auch genutzt werden, um drei Stichproben miteinander zu vergleichen. • Beim t-Test ist das Akzeptanzintervall umso breiter, je mehr Beobachtungen vorliegen. • Die t-Statistik zur Fehlerwahrscheinlichkeit α ist stets größer als die z-Statistik zur Fehlerwahrscheinlichkeit α. • Beim Anpassungstest muss die Verteilung in Form von relativen Werten vorgegeben sein. • Der Homogenitätstest vergleicht die Mittelwerte von zwei Variablen. • Der Anpassungstest geht von einer diskreten Verteilung aus. • Der Homogenitätstest beruht auf der Korrelation zwischen den zu testenden Zufallsvariablen. • Der Unabhängigkeitstest nutzt die χ 2 -Verteilung, da die zugrunde liegenden Variablen immer normalverteilt sein müssen.

336

6.3.1

6 Testtheorie

Gauß-Test

Aufgabe A 6-1: (5 Punkte) Zur Lösung L 6-1 Ein Unternehmen nutzt eine Befüllungsmaschine im Rahmen seiner Shampooproduktion. Im Durchschnitt ist jede Flasche mit 300 ml befüllt. Die Maschine arbeitet mit einer Standardabweichung von 3 ml. Im Rahmen der Qualitätssicherung werden neun Flaschen der aktuellen Produktion entnommen. Es ergeben sich die folgenden Füllmengen: 301

302

300

295

298

299

294

300

301

Bestimmen Sie, ob die Maschine bei einer Fehlerwahrscheinlichkeit von 5 % entsprechend der vorgegebenen Parameter arbeitet. Aufgabe A 6-2: (5 Punkte) Zur Lösung L 6-2 Ein Film wird im Durchschnitt mit 4,1 von 5 Punkten bewertet, bei einer Abweichung von 0,2. Vier Freunde bewerten den Film mit: 4,5; 4,0; 3,7 und 4,2. Sind diese Bewertungen bei einer Fehlerwahrscheinlichkeit von 5 % mit dem Durchschnitt vergleichbar? Aufgabe A 6-3: (5 Punkte) Zur Lösung L 6-3 Eine Studie ergab, dass der durchschnittliche Kunde pro Einkauf e45 ausgibt, bei einer Standardabweichung von e15. Eine Stichprobe von neun Kunden ergab die folgenden Ausgaben: 48

90

74

31

12

35

56

87

46

Ist die Stichprobe bei einer Fehlerwahrscheinlichkeit von 5 % mit der Studie vereinbar? Ist sie es auch bei einer Fehlerwahrscheinlichkeit von 1 %? Aufgabe A 6-4: (5 Punkte) Zur Lösung L 6-4 Der durchschnittliche Deutsche kennt zwei Lieder einer Band, bei einer theoretischen Varianz von 0,25. In einer Gruppe von vier Freunden kennt lediglich einer ein Lied der Band. Ist das Ergebnis der vier Freunde mit dem gesamtdeutschen Ergebnis bei einer Fehlerwahrscheinlichkeit von 5 % vereinbar? Aufgabe A 6-5: (10 Punkte) Zur Lösung L 6-5 Ein McDonalds-Mitarbeiter füllt Chicken McNuggets in Tüten zu je 6 McNuggets. Etwa jede zehnte Tüte besitzt 7 McNuggets. Vier Freunde kaufen jeder eine Tüte McNuggets und zwei von ihnen haben jeweils sieben Nuggets. (Die theoretische Varianz beträgt 0,09.)

6.3 Aufgaben

337

(a) (5 Punkte) Ist dieses Ergebnis mit der normalen Befüllungspraxis vereinbar? Gehen Sie von einer Fehlerwahrscheinlichkeit von 10 % aus. (b) (5 Punkte) Welches Ergebnis ist eher mit der normalen Befüllungspraxis vereinbar, dass zwei von vier Freunden je sieben McNuggets bekommen oder dass einer von vier Freunden acht McNuggets bekommt? Aufgabe A 6-6: (5 Punkte) Zur Lösung L 6-6 Bei einer Qualitätsprüfung wurden fünf Teile mit den folgenden Dicken entnommen: 5

4,5

4,3

5,1

4,8

Überprüfen Sie für eine Fehlerwahrscheinlichkeit von 10 %, ob eine mittlere Dicke von 4,6 bei einer Standardabweichung von 0,2 eingehalten wurde. Aufgabe A 6-7: (5 Punkte) Zur Lösung L 6-7 Angenommen die durchschnittliche Füllmenge beträgt 0,5 l. Wie groß muss die Standardabweichung sein, damit bei einer 5 %-Fehlerwahrscheinlichkeit die folgende Stichprobe mit der durchschnittlichen Füllmenge vereinbar ist? 0,52

0,6

0,48

0,53

Aufgabe A 6-8: (5 Punkte) Zur Lösung L 6-8 Vier Schüler einer Klasse wurden ausgewählt. Ihr Gewicht beträgt: 54 kg

43 kg

67 kg

51 kg

Ist die Schülerstichprobe bei einer Fehlerwahrscheinlichkeit von 5 % und bei einer Standardabweichung von 5 kg mit einem Durchschnittsgewicht von 51 kg vereinbar? Aufgabe A 6-9: (5 Punkte) Zur Lösung L 6-9 In der Klausur des letzten Semesters lag der Schnitt bei 2,4, bei einer Varianz von 0,25. Von den Studenten, die dieses Semester geschrieben haben, wird eine Stichprobe von vier Studenten gezogen, die die folgenden Noten erzielten: 1,3

2,7

3,0

2,0

338

6 Testtheorie

Kann, bei einer Fehlerwahrscheinlichkeit von 5 %, davon ausgegangen werden, dass es keine signifikanten Abweichungen zum Ergebnis des letzten Semesters gab? Aufgabe A 6-10: (5 Punkte) Zur Lösung L 6-10 Eine Maschine verbraucht normalerweise 5000 Watt, bei einer Varianz von 10.000. Bestimmen Sie bei einer Fehlerwahrscheinlichkeit von 10 %, ob die folgenden gemessenen Verbrauchswerte mit dem Normalverbrauch vergleichbar sind: 5500

4800

5100

5300

5400

5000

5100

Aufgabe A 6-11: (5 Punkte) Zur Lösung L 6-11 Eine Maschine produziert Metallteile mit einer Sollbreite von 11 mm. Der Mittelwert der aktuellen Produktionsreihe beträgt 10,5 mm mit einer Standardabweichung von 0,2 mm. Prüfen Sie, ob eine akzeptierte Fehlerwahrscheinlichkeit von 5 % die Sollbreite signifikant unterschreitet. Aufgabe A 6-12: (5 Punkte) Zur Lösung L 6-12 Der Koffeingehalt von AfriCola ist normalverteilt mit einem Mittelwert von 24 mg pro 100 ml und einer Standardabweichung von 0,5 mg pro 100 ml. Maximal darf in Deutschland ein Koffeingehalt von 25 mg pro 100 ml vorliegen. Überprüfen Sie, ob diese Grenze (bei einer akzeptablen Fehlerwahrscheinlichkeit von 1 %) im Schnitt eingehalten wird: Aufgabe A 6-13: (5 Punkte) Zur Lösung L 6-13 In einer Umfrage unter 100 Teilnehmer zur Qualität eines Servicedienstleisters wurde eine durchschnittliche Bewertung von 8 auf einer Skala von 1 bis 10 bestimmt. Testen Sie für eine Standardabweichung von 0,8, ob die Bewertung signifikant größer (α = 0,05) als die Zielvorgabe von 7,5 ist. Aufgabe A 6-14: (5 Punkte) Zur Lösung L 6-14 Das durchschnittliche Einkommen nach einem Masterstudium beträgt e41.000 bei einer Standardabweichung von e2000. Hans verdient e34.000. Liegt sein Gehalt bei einer akzeptablen Fehlerwahrscheinlichkeit von 5 % signifikant unter dem Durchschnittseinkommen? Aufgabe A 6-15: (5 Punkte) Zur Lösung L 6-15 Peter geht jede Woche neben seinem Studium durchschnittlich 15 Stunden arbeiten, wobei seine Arbeit von der aktuellen Auftragslage des Unternehmens abhängt und daher mit einer Standardabweichung von zwei Stunden schwankt. Er darf im Durchschnitt nicht mehr als 19 Stunden pro Woche arbeiten, um seinen Status als Vollzeitstudent nicht zu verlieren. Kann hieraus bei einer Fehlerwahrscheinlichkeit von 5 % ein Problem für Peter entstehen?

6.3 Aufgaben

6.3.2

339

t-Test

Aufgabe A 6-16: (6 Punkte) Zur Lösung L 6-16 Es wurden vier Dosen mit einem Sollgewicht von 3 kg entnommen. Überprüfen Sie, ob die tatsächlichen Füllmengen bei einer Fehlertoleranz von 5 %, mit dem Sollgewicht vereinbar sind. 3,05

3,2

2,95

2,97

Aufgabe A 6-17: (6 Punkte) Zur Lösung L 6-17 Normalerweise verbraucht eine Malerei in der Woche etwa 180l Farbe. In den letzten fünf Wochen lagen die Verbrauche wie folgt: 185l

182l

184l

181l

180l

Der Meister hält eine Fehlerwahrscheinlichkeit von 5 % für akzeptabel und bittet Sie zu prüfen, ob der Verbrauch signifikant von dem bisherigen Verbrauch abweicht. Aufgabe A 6-18: (6 Punkte) Zur Lösung L 6-18 Paul liest jedes Buch aus seiner Bibliothek im Durchschnitt genau einmal, nur etwa jedes zwanzigste Buch hat er zweimal gelesen. Gehen Sie von einer theoretischen Fehlerwahrscheinlichkeit von 10 % aus und beantworten Sie, ob es möglich ist, dass er von drei zufällig ausgewählten Büchern bereits eins doppelt gelesen hat. Aufgabe A 6-19: (6 Punkte) Zur Lösung L 6-19 Im Durchschnitt verbrachten Besucher im letzten Jahr zwei Stunden in einem Museum. In diesem Jahr vermutet der Direktor, dass die durchschnittlichen Besuchszeiten sich signifikant geändert haben (Signifikanzniveau von 95 %.) Zur Überprüfung wurde die folgende Stichprobe gezogen: 1,5

1,8

1,7

1,7

1,9

1,8

2,1

2,2

1,9

Aufgabe A 6-20: (12 Punkte) Zur Lösung L 6-20 Eine Studie findet heraus, dass durchschnittliche Kunden eines Bekleidungsgeschäfts 30 Minuten im Geschäft verbringen und e60 ausgeben. Der Filialleiter findet diese Zahlen unglaubwürdig und bittet einen Mitarbeiter sie durch eine Stichprobe zu validieren. Der Mitarbeiter nimmt eine Stichprobe von neun Personen, deren Werte unten angegeben sind.

340

6 Testtheorie

Ist die Skepsis des Filialleiters berechtigt, wenn eine Fehlerwahrscheinlichkeit von 5 % als akzeptabel angesehen wird? Zeit: Ausgaben:

32 100

25 12

26 50

15 43

23 50

36 75

45 80

18 20

31 90

Aufgabe A 6-21: (6 Punkte) Zur Lösung L 6-21 Im Durchschnitt hält ein Verschleißteil im Auto mindestens 1200 Tage und es wird auch entsprechend vermarktet. Da es eine Anfrage des Verbraucherschutzes beim Hersteller gab, entnimmt dieser eine Stichprobe aus der aktuellen Produktion um zu testen, ob die versprochene Lebensdauer des Produkts auch eingehalten wird. Eine Fehlerwahrscheinlichkeit von 1 % wird vom Verbraucherschutz als akzeptabel angesehen. Führen Sie einen Test ausgehend von den folgenden Daten zur Lebensdauer der getesteten Teile aus: 1100

1200

1150

1000

900

1500

1200

1100

1300

1200

Aufgabe A 6-22: (6 Punkte) Zur Lösung L 6-22 Eine Maschine befüllt Packungen mit einem Sollgewicht von 10 kg. Bei der letzten Qualitätsuntersuchung ist bei einer Stichprobe mit zehn Teilen aufgefallen, dass neun das Sollgewicht erfüllten, ein Teil allerdings ein Gewicht von lediglich 9 kg aufwies. Ist dies bei einer akzeptierten Fehlerwahrscheinlichkeit von 1 % eine signifikante Abweichung der Sollmenge? Aufgabe A 6-23: (6 Punkte) Zur Lösung L 6-23 Eine Maschine produziert jeden Tag 3000 Teile. Die automatische Qualitätskontrolle sortiert jeden Tag 50 Teile aus, weil diese ein Bauteil von insgesamt zehn zu wenig aufweisen. Ist davon auszugehen, dass die Maschine, bei einer akzeptierten Fehlerwahrscheinlichkeit von 1 %, innerhalb der gewünschten Parameter arbeitet? Aufgabe A 6-24: (6 Punkte) Zur Lösung L 6-24 Im Rahmen einer Klausur ergaben sich die folgenden Notengruppen: 1: 2: 3: 4: 5:

2 Klausuren 5 Klausuren 4 Klausuren 2 Klausuren 12 Klausuren

6.3 Aufgaben

341

Im letzten Semester wurde eine Durchschnittsnote von 3,0 erreicht. Gibt es dieses Semester eine signifikante Abweichung davon? Gehen Sie von einer Fehlerwahrscheinlichkeit von 5 % aus. Aufgabe A 6-25: (6 Punkte) Zur Lösung L 6-25 Ein Unternehmen produziert Metallteile mit einer Dicke von 5 mm, wobei eine Ausschusswahrscheinlichkeit von 1 % als akzeptabel angesehen wird. Es wurde eine Stichprobe von vier Teilen entnommen. 5,1 mm

5,2 mm

4,9 mm

5,1 mm

Gibt es hierbei eine signifikante Abweichung nach oben hin? Aufgabe A 6-26: (6 Punkte) Zur Lösung L 6-26 Eine Maschine produziert Metallteile mit einer Sollbreite von 11 mm. Die Maschine arbeitet mit einer automatischen Ausschleusung der Teile, sollte ein Teil eine Mindestbreite von 10,5 mm unterschreiten. Auch diese Ausschleusungsanlage arbeitet allerdings fehlerbehaftet. Aus diesem Grund wurde vom QM-Team eine Stichprobe von neun Teilen entnommen: 11

10,8

10,5

10,4

11,1

11,8

11,1

11,3

10,7

Prüfen Sie, ob für eine akzeptierte Fehlerwahrscheinlichkeit von 1 % die Ausschleusungsanlage verlässlich arbeitet. Aufgabe A 6-27: (6 Punkte) Zur Lösung L 6-27 Der Koffeingehalt von AfriCola ist normalverteilt mit einem Mittelwert von 24 mg pro 100 ml. Maximal darf in Deutschland ein Koffeingehalt von 25 mg pro 100 ml vorliegen. Überprüfen Sie, ob diese Grenze (bei einer akzeptablen Fehlerwahrscheinlichkeit von 1 %) im Schnitt durch die folgende Stichprobe eingehalten wird: 24,8

25,1

23,6

23,4

24,7

24,1

24,3

24,1

23,8

342

6 Testtheorie

Aufgabe A 6-28: (6 Punkte) Zur Lösung L 6-28 Hans’ bisherige Klausurnoten waren wie folgt: 1,3

2,7

2,0

1,7

2,7

2,7

2,3

2,0

1,7

2,3

Jetzt schreibt er eine 1,0. Ist diese Note (bei einer Fehlerwahrscheinlichkeit von 5 %) signifikant besser als seine bisherigen Noten? Aufgabe A 6-29: (6 Punkte) Zur Lösung L 6-29 Die Anzahl der neuen Erstsemester einer Hochschule zeigt über die letzten Semester hinweg den folgenden Verlauf: 1200

1100

1050

1100

1300

1000

1050

1000

1100

Dieses Semester beginnen 900 Studenten. Sind dies signifikant weniger als in den letzten Semestern? Aufgabe A 6-30: (6 Punkte) Zur Lösung L 6-30 Mit einem Dienstwagen wurden in den letzten Monaten die folgenden Strecken (in km) zurückgelegt: 3500

2000

1900

3000

2700

1500

3800

2400

2900

In diesem Monat wurden 4000 km gefahren. Liegt diese Strecke signifikant über dem Durchschnitt der letzten Monate?

6.3.3

Mittelwerttests bei bekannter Varianz

Aufgabe A 6-31: (6 Punkte) Zur Lösung L 6-31 2 Im Rahmen einer Studie erhebt eine Hotelkette die Servicequalität in zwei ihrer Hotels in München (M) und Rotterdam (R). Aus früheren Studien ist bekannt, dass die Standardabweichung bei 0,8 liegt. Testen Sie für eine Fehlerwahrscheinlichkeit von 5 %, ob es einen signifikanten Unterschied zwischen den beiden Hotels gibt.

2 In diesem und dem folgenden Abschnitt ist stets davon auszugehen, dass es sich um unverbundene Stichproben handelt, auch wenn der Aufgabentext etwas anderes suggeriert.

6.3 Aufgaben

343

Hotel

R

R

M

R

M

M

M

R

M

R

Note

1

2

4

2

5

3

3

1

4

2

Aufgabe A 6-32: (6 Punkte) Zur Lösung L 6-32 Hans (H) behauptet, dass seine schulische Leistung nicht signifikant (α = 0,05) von der seines Bruders Franz abweicht. Bis jetzt weisen die beiden jeweils eine Standardabweichung von σH = 0,8 und σF = 1,0 auf. Testen Sie die Behauptung von Hans, wenn die beiden die folgenden Noten nach Hause bringen. Person

H

F

H

F

H

F

H

F

H

F

Note

2,3

1,7

3,3

2,3

1,3

1,7

5

3,0

2,3

2,7

Aufgabe A 6-33: (6 Punkte) Zur Lösung L 6-33 Das City Marketing der Stadt Wuppertal (W) möchte wissen, ob die Eintrittskarten für Museen in Wuppertal signifikant (α = 5 %) von denen in der Referenzstadt Düsseldorf (D) abweichen. Hierzu ziehen sie die folgende Zufallsstichprobe von 10 Museen. Gehen Sie von theoretischen Standardabweichungen von σW = 0,5 und σD = 0,3 aus. Stadt

D

W

W

D

D

W

W

D

W

D

Preis

9

10

10

12

12

9

10

15

12

12

Aufgabe A 6-34: (6 Punkte) Zur Lösung L 6-34 Eine Studie soll untersuchen, ob deutsche (D) und französische (F) Filme sich signifikant, in Bezug auf ihre Länge, unterscheiden. Die Filmlänge ist normalverteilt und aus früheren Studien weiß man, dass die Standardabweichung etwa 10 Minuten beträgt. Testen Sie die Vermutung aufgrund der, im Rahmen eines Pretests erhobenen Daten, für eine Fehlerwahrscheinlichkeit von α = 0,05. Land

D

F

F

F

D

D

D

D

F

F

Länge

85

90

93

87

98

107

103

100

107

90

Aufgabe A 6-35: (6 Punkte) Zur Lösung L 6-35 In einem Blindtest soll überprüft werden, ob zwei Softdrinks (Cola und Pepsi), wie auch in einer früheren Studie untersucht, nicht voneinander zu unterscheiden sind. Die frühere

344

6 Testtheorie

Studie stellte eine Standardabweichung von σ = 0,6 fest. Testen Sie, ob dass Ergebnis auch unter Berücksichtigung der neu erhobenen Daten beibehalten werden kann. Marke

C

C

P

P

C

C

P

P

C

P

Bewertung

6

7

8

5

4

8

7

4

8

5

Aufgabe A 6-36: (6 Punkte) Zur Lösung L 6-36 Um zu testen, ob zwei wissenschaftliche Zeitschriften die gleiche Ablehnungsquote aufweisen, werden testweise fünf Artikel eingereicht, die angenommen (1) oder abgelehnt (0) werden. Es ist allgemein bekannt, dass die erste Zeitschrift eine Standardabweichung von σ1 = 0,1 und die zweite eine von σ2 = 0,2 aufweist. Prüfen Sie für eine Fehlerwahrscheinlichkeit von 5 %, ob die Zeitschriften eine vergleichbare Ablehnungsquote aufweisen. Zeitschrift

1

2

1

2

1

1

2

1

2

2

Resultat

0

1

1

0

1

1

1

0

0

0

Aufgabe A 6-37: (6 Punkte) Zur Lösung L 6-37 Ein Unternehmen hat Zulieferer in Tschechien (T) und Ungarn (U). Das Controlling fragt sich, ob die beiden Zuliefererstandorte eine vergleichbare Qualität liefern. Hierzu erheben sie für je fünf Monate die Ausschussraten. Eine normale Standardabweichung für Ausschussraten beträgt σ = 0,5. Liefern Sie dem Controlling eine Antwort, die signifikant bei einem Alphafehler von 5 % ist. Standort

T

T

T

T

T

U

U

U

U

U

Ausschuss

2

3

4

2

4

5

3

2

1

4

Aufgabe A 6-38: (6 Punkte) Zur Lösung L 6-38 Eine Maschine arbeitet mit einer Standardabweichung von 2 g in Bezug auf die Füllmenge eines Artikels. Es werden für zwei Wochen Füllmengen stichprobenartig erhoben. Prüfen Sie für eine Fehlerwahrscheinlichkeit von 5 %, ob die durchschnittlichen Füllmengen in den beiden Wochen signifikant voneinander abweichen.

6.3 Aufgaben

345

Woche

1

1

1

1

1

2

2

2

2

2

Füllmenge

253

248

250

251

252

255

251

253

254

255

Aufgabe A 6-39: (6 Punkte) Zur Lösung L 6-39 Während die Besucherzahlen eines Zoos statistisch mit einer Standardabweichung von σ = 700 schwanken, soll geprüft werden, ob die Besucherzahlen der letzten beiden Monate (4 und 5) signifikant voneinander abweichen (α = 0,05). Monat

4

5

4

5

4

5

4

5

4

5

Besucher (in Tsd.)

3,5

4,8

4,7

5,1

3,9

3,4

6

2,8

5,7

3,1

Aufgabe A 6-40: (6 Punkte) Zur Lösung L 6-40 Hans (H) und Peter (P) vergleichen, wie viele Kalorien sie zu sich nehmen. Dafür haben sie fünf Tage lang notiert, was sie zu sich genommen haben. Gehen Sie davon aus, dass eine natürliche Standardabweichung von σ = 100 Kalorien vorliegt, die für beide gleich gilt. Prüfen Sie, ob beide etwa gleich viel oder eine signifikant (α = 0,05) unterschiedliche Menge an Kalorien zu sich genommen haben.

6.3.4

Person

H

P

H

P

H

P

H

P

H

P

Kalorien (in Tsd.)

2,2

2,1

2,5

2,3

2,7

2,2

2,5

2,3

2,7

2,1

Mittelwerttests bei unbekannter Varianz

Aufgabe A 6-41: (6 Punkte) Zur Lösung L 6-41 Es wurden Daten über das Einkommen erhoben. Testen Sie für eine Fehlerwahrscheinlichkeit von 5 % und 10 %, ob das durchschnittliche Einkommen (in Tsd. e) von Männern (0) von dem der Frauen (1) abweicht. Geschlecht

1

0

1

1

0

0

0

1

0

Einkommen (in Tsd. e)

1,2

4,5

2,4

3,5

2,5

3,2

1,5

1,8

3,7

Aufgabe A 6-42: (6 Punkte) Zur Lösung L 6-42 Testen Sie, ob Kölner in Bezug auf die durchschnittliche Körpergröße von Düsseldorfern abweichen (akzeptable Fehlerwahrscheinlichkeit α = 0,05).

346

6 Testtheorie

Herkunft

K

K

D

K

D

D

D

K

D

K

Größe

1,5

1,7

1,65

1,75

1,9

1,8

1,5

1,9

1,6

1,85

Aufgabe A 6-43: (6 Punkte) Zur Lösung L 6-43 Testen Sie für eine Fehlerwahrscheinlichkeit von α = 0,05, ob die wöchentlichen Arbeitszeiten in Deutschland und Frankreich vergleichbar sind. Land

D

F

F

F

D

D

F

D

D

F

Zeit

40

35

36

34

39

37

35

38

40

37

Aufgabe A 6-44: (6 Punkte) Zur Lösung L 6-44 Es soll getestet werden, ob es einen signifikanten Unterschied zwischen Familienunternehmen (F) und anderen Unternehmensformen (S) in Bezug auf die Rendite, gibt. Form

F

S

F

F

F

S

S

S

S

F

Rendite

3,5

2,7

3,1

2,8

2,7

3,2

3,3

3,4

3,2

3,0

Aufgabe A 6-45: (6 Punkte) Zur Lösung L 6-45 Es wurden Daten über die Hochschulform (privat und öffentlich) und das Abschneiden bei einem IQ-Test zusammengestellt. HS-Form

P

P

P

P

Ö

Ö

Ö

P

P

Ö

IQ

102

105

99

104

105

101

98

101

104

105

Testen Sie, ob es einen signifikanten (α = 0,05), durch die Hochschulform motivierten Unterschied gibt. Aufgabe A 6-46: (6 Punkte) Zur Lösung L 6-46 Es wurden Einkommensdaten für Studenten der Wirtschafts- (W) und der Geisteswissenschaften (G) zusammengestellt. Testen Sie, ob es einen signifikanten Unterschied, in Bezug auf das nach dem Studium erzielte Monatseinkommen, gibt. Studiengang

W

G

G

G

G

W

W

W

W

G

G

Einkommen (in Tsd.)

2

1,9

2,9

3

1,5

4

3,5

3,2

3,2

2,2

2,5

6.3 Aufgaben

347

Aufgabe A 6-47: (6 Punkte) Zur Lösung L 6-47 Es soll für Hochschullehrer überprüft werden, ob es einen Unterschied in Bezug auf die Anzahl der Fachpublikationen hinsichtlich des Geschlechts gibt (Männer – 0/Frauen – 1). Geschlecht

M

M

W

W

W

M

W

M

W

W

Publikationen

3

10

4

5

15

17

8

10

15

7

Aufgabe A 6-48: (6 Punkte) Zur Lösung L 6-48 Testen Sie, ob es einen signifikanten Unterschied, in Bezug auf den Umsatz in Mio. Euro, gibt. Unterscheiden Sie zwischen Unternehmen der Beratungs- und der Werbebranche. Branche

B

W

W

W

B

B

B

W

W

B

Umsatz

19

120

90

50

75

65

28

40

25

85

Aufgabe A 6-49: (6 Punkte) Zur Lösung L 6-49 Prüfen Sie, ob sich das Alter von Studenten zum Zeitpunkt des ersten Hochschulabschlusses in Deutschland und Frankreich signifikant voneinander unterscheidet. Land

D

F

F

D

F

F

F

D

D

D

Alter

30

25

22

23

25

22

24

23

27

22

Aufgabe A 6-50: (6 Punkte) Zur Lösung L 6-50 Prüfen Sie, ob sich Verspätungen der Bahn am Morgen (M), in Bezug auf die Dauer, signifikant von denen am Abend (A) unterscheiden.

6.3.5

Tageszeit

A

A

M

A

M

M

M

M

A

A

Verspätung

0

5

10

5

0

0

5

10

15

10

Unabhängigkeitstest

Aufgabe A 6-51: (6 Punkte) Zur Lösung L 6-51 Über Kundenkarten wurden Verkaufsdaten gesammelt, um zu überprüfen, ob ein Zusammenhang zwischen der Produktwahl (Produkte P1, P2 und P3) und dem Geschlecht der

348

6 Testtheorie

Kunden vorliegt. Die Daten wurden in der folgenden Tabelle zusammengefasst. Prüfen Sie für α = 0,05, ob ein entsprechender Zusammenhang vorliegt.

P1 P2 P3

M

F

33 8 14

12 43 15

Aufgabe A 6-52: (6 Punkte) Zur Lösung L 6-52 Es soll überprüft werden, ob ein Zusammenhang zwischen dem Geschlecht und den abonnierten Zeitschriften gibt. Prüfen Sie die Hypothese für α = 0,05 aufgrund der folgenden Daten.

Vogue Men’s Health Hörzu

M

F

3 57 23

63 33 11

Aufgabe A 6-53: (7 Punkte) Zur Lösung L 6-53 Es soll überprüft werden, ob das Alter einen Einfluss auf das Schauen unterschiedlicher Serien hat. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

Lindenstraße Dexter Game of Thrones

50

3 7 24

6 23 17

43 2 5

Aufgabe A 6-54: (7 Punkte) Zur Lösung L 6-54 Eine Studie möchte herausfinden, ob ein Zusammenhang zwischen der Größe und dem Einkommen besteht. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

6.3 Aufgaben

349

2500

1,80

21 4 2

3 28 8

5 7 22

Aufgabe A 6-55: (7 Punkte) Zur Lösung L 6-55 Die Marketingabteilung möchte wissen, ob das Gewicht ihrer Kunden mit der Nachfrage nach den drei Produkten Schokolade, Süßigkeiten und Milch zusammenhängt. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

Schokolade Süßigkeiten Milch

90 kg

17 12 21

3 12 7

7 5 21

Aufgabe A 6-56: (7 Punkte) Zur Lösung L 6-56 Zur Untersuchung, ob verschiedene Produkte häufig zusammen in einem Warenkorb liegen, wurden die folgenden Daten darüber gesammelt wie häufig Produkte zusammen in einem Warenkorb liegen. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

Toilettenpapier Taschentücher Spülmittel

Müsli

Brot

Tütensuppe

17 3 4

23 18 6

17 21 19

Aufgabe A 6-57: (7 Punkte) Zur Lösung L 6-57 Zur Untersuchung, ob verschiedene Produkte häufig zusammen in einem Warenkorb liegen, wurden die folgenden Daten darüber gesammelt, wie häufig Produkte zusammen in einem Warenkorb liegen. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

Mineralwasser Tütensuppe

Müsli

Mineralwasser

50 33

– 17

350

6 Testtheorie

Aufgabe A 6-58: (5 Punkte) Zur Lösung L 6-58 Es soll untersucht werden, ob die Entscheidung eine private oder eine öffentliche Hochschule zu besuchen, vom Geschlecht abhängt. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

Privat Öffentlich

M

F

37 134

46 123

Aufgabe A 6-59: (5 Punkte) Zur Lösung L 6-59 Es soll überprüft werden, ob das Geschlecht einen Einfluss auf die Wahl des Haustieres hat. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

Hund Katze

M

F

38 23

27 52

Aufgabe A 6-60: (5 Punkte) Zur Lösung L 6-60 Es wurde postuliert, dass begabte Schüler vermehrt auf privaten Hochschulen zu finden sind. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch, ob es einen Zusammenhang zwischen dem IQ und der Hochschulform gibt.

Privat Öffentlich

130

33 111

2 4

Aufgabe A 6-61: (6 Punkte) Zur Lösung L 6-61 Es wurde behauptet, dass es einen Zusammenhang zwischen den besuchten Nachhilfestunden pro Woche und der Endnote in einem Schulfach gibt. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

0 Stunden 0–2 Stunden >2 Stunden

2,0

17 14 15

13 24 37

6.3 Aufgaben

351

Aufgabe A 6-62: (7 Punkte) Zur Lösung L 6-62 Es soll untersucht werden, ob es einen Zusammenhang zwischen der Branche, in der ein Unternehmen angesiedelt ist, und seinem Ranking gibt. Führen Sie einen entsprechenden Test mit einer Fehlerwahrscheinlichkeit α = 0,05 für die folgenden Daten durch.

Landwirtschaft Industrie Dienstleistungen

>A

A–BB

1,80



7,83 10,53 8,64 27

11,31 15,21 12,48 39

9,86 13,26 10,88 34

29 39 32 100

Teststatistik: 2 = χemp

(3 − 11,31)2 (5 − 9,86)2 (21 − 7,83)2 + + + 7,83 11,31 9,86 (4 − 10,53)2 (28 − 15,21)2 (7 − 13,26)2 + + + 10,53 15,21 13,26 (2 − 8,64)2 (8 − 12,48)2 (22 − 10,88)2 + + = 66,4894 8,64 12,48 10,88

Referenzstatistik: 2 χ0,95;2 = 9,4877

Da die Teststatistik größer als die Referenzstatistik ist, sind die Größe und das Einkommen stochastisch abhängig. Lösung L 6-55: (7 Punkte) Zur Aufgabenstellung A 6-55 Bestimmen der Randhäufigkeiten und der erwartete Häufigkeiten:

Schokolade Süßigkeiten Milch 

90



12,86 13,81 23,33 50

5,66 6,08 10,27 22

8,49 9,11 15,4 33

27 29 49 105

Teststatistik: 2 = χemp

(3 − 5,66)2 (7 − 8,49)2 (17 − 12,86)2 + + + 12,86 5,66 8,49

6.4 Lösungen

385

(12 − 6,08)2 (5 − 9,11)2 (12 − 13,81)2 + + + 13,81 6,08 9,11 (7 − 10,27)2 (21 − 15,4)2 (21 − 23,33)2 + + = 14,0218 23,33 10,27 15,4 Referenzstatistik: 2 χ0,95;2 = 9,4877

Da die Teststatistik größer als die Referenzstatistik ist, sind das Gewicht und die Produktwahl stochastisch abhängig. Lösung L 6-56: (7 Punkte) Zur Aufgabenstellung A 6-56 Bestimmen der Randhäufigkeiten und der erwartete Häufigkeiten:

Toilettenpapier Taschentücher Spülmittel 

Müsli

Brot

Tütensuppe



10,69 7,88 5,44 24

20,93 15,42 10,65 47

25,38 18,7 12,91 57

57 42 29 128

Teststatistik: 2 = χemp

(23 − 20,93)2 (17 − 25,38)2 (17 − 10,69)2 + + + 10,69 20,93 25,38 (18 − 15,42)2 (21 − 18,7)2 (3 − 7,88)2 + + + 7,88 15,42 18,7 (4 − 5,44)2 (6 − 10,65)2 (19 − 12,91)2 + + = 15,71 5,44 10,65 12,91

Referenzstatistik: 2 χ0,95;2 = 9,4877

Da die Teststatistik größer als die Referenzstatistik ist, besteht ein stochastischer Zusammenhang zwischen den Produkten.

386

6 Testtheorie

Lösung L 6-57: (7 Punkte) Zur Aufgabenstellung A 6-57 Bestimmen der Randhäufigkeiten:

Müsli Mineralwasser Tütensuppe 

Müsli

Mineralwasser

Tütensuppe



0 50 33 83

50 0 17 67

33 17 0 50

83 67 50 200

Bestimmen der erwartete Häufigkeiten:

Müsli Mineralwasser Tütensuppe 

Müsli

Mineralwasser

Tütensuppe



34,45 27,81 20,75 83

27,81 22,45 16,75 67

20,75 16,75 12,5 50

83 67 50 200

Teststatistik: 2 = χemp

(50 − 27,81)2 (33 − 20,75)2 (0 − 34,45)2 + + + 34,45 27,81 20,75 (50 − 27,81)2 (0 − 22,45)2 (17 − 16,75)2 + + + 27,81 22,45 16,75 (33 − 20,75)2 (17 − 16,75)2 (0 − 12,5)2 + + + 119,2951 20,75 16,75 12,5

Referenzstatistik: 2 χ0,95;2 = 9,4877

Da die Teststatistik größer als die Referenzstatistik ist, liegt ein Zusammenhang bei der Zusammensetzung des Warenkorbs vor. Lösung L 6-58: (5 Punkte) Zur Aufgabenstellung A 6-58 Bestimmen der Randhäufigkeiten und der erwartete Häufigkeiten:

6.4 Lösungen

387

Privat Öffentlich 

M

W



41,74 129,26 171

41,26 127,74 169

83 257 340

Teststatistik: 2 = χemp

(46 − 41,26)2 (134 − 129,26)2 (123 − 127,74)2 (37 − 41,74)2 + + + 41,74 41,26 129,26 127,74

= 1,435 Referenzstatistik: 2 χ0,95;2 = 3,8415

Da die Teststatistik kleiner als die Referenzstatistik ist, sind das Geschlecht und die Wahl der Hochschule unabhängig voneinander. Lösung L 6-59: (5 Punkte) Zur Aufgabenstellung A 6-59 Bestimmen der Randhäufigkeiten und der erwartete Häufigkeiten:

Hund Katze 

M

W



28,32 32,68 61

36,68 42,32 79

65 75 140

Teststatistik: 2 = χemp

(27 − 36,68)2 (23 − 32,68)2 (52 − 42,32)2 (38 − 28,32)2 + + + 28,32 36,68 32,68 42,32

= 10,9415 Referenzstatistik: 2 χ0,95;2 = 3,8415

Da die Teststatistik kleiner als die Referenzstatistik ist, sind das Geschlecht und die Wahl des Haustiers stochastisch abhängig.

388

6 Testtheorie

Lösung L 6-60: (5 Punkte) Zur Aufgabenstellung A 6-60 Bestimmen der Randhäufigkeiten und der erwartete Häufigkeiten:

Privat Öffentlich 

130



33,6 110,4 144

1,4 4,6 6

35 115 150

Teststatistik: 2 = χemp

(33 − 33,6)2 (2 − 1,4)2 (111 − 110,4)2 (4 − 4,6)2 + + + = 0,3494 33,6 1,4 110,4 4,6

Referenzstatistik: 2 χ0,95;2 = 3,8415

Da die Teststatistik kleiner als die Referenzstatistik ist, sind der IQ und die Wahl der Hochschule stochastisch abhängig. Lösung L 6-61: (6 Punkte) Zur Aufgabenstellung A 6-61 Bestimmen der Randhäufigkeiten und der erwartete Häufigkeiten:

0 0–2 >2 

2,0



11,5 14,57 19,93 46

18,5 23,43 32,07 74

30 38 52 120

Teststatistik: 2 = χemp

(13 − 18,5)2 (14 − 14,57)2 (17 − 11,5)2 + + + 11,5 18,5 14,57 (24 − 23,43)2 (15 − 14,57)2 (37 − 32,07)2 + + = 6,2813 23,43 14,57 32,07

Referenzstatistik: 2 χ0,95;2 = 5,9915

Da die Teststatistik größer als die Referenzstatistik ist, sind die Anzahl der Nachhilfestunden und die Endnote stochastisch abhängig.

6.4 Lösungen

389

Lösung L 6-62: (7 Punkte) Zur Aufgabenstellung A 6-62 Bestimmen der Randhäufigkeiten und der erwartete Häufigkeiten:

Landwirtschaft Industrie Dienstleistungen 

A

A-BB

BB



1,56 9,88 14,56 26

1,98 12,54 18,48 33

2,46 15,58 22,96 41

6 38 56 100

Teststatistik: 2 = χemp

(3 − 1,98)2 (1 − 2,46)2 (2 − 1,56)2 + + + 1,56 1,98 2,46 (7 − 9,88)2 (13 − 12,54)2 (18 − 15,58)2 + + + 9,88 12,54 15,58 (17 − 18,48)2 (22 − 22,96)2 (17 − 14,56)2 + + = 3,3159 14,56 18,48 22,96

Referenzstatistik: 2 χ0,95;2 = 9,4877

Da die Teststatistik kleiner als die Referenzstatistik ist, besteht kein Zusammenhang zwischen dem Sektor und dem Rating. Lösung L 6-63: (5 Punkte) Zur Aufgabenstellung A 6-63 Bestimmen der Randhäufigkeiten:

P1 P2 

M

W



55 45 100

25 75 100

80 120 200

W 40 60 100

 80 120 200

Bestimmen der erwartete Häufigkeiten:

P1 P2 

M 40 60 100

390

6 Testtheorie

Teststatistik: 2 = χemp

(25 − 40)2 (45 − 60)2 (75 − 60)2 (55 − 40)2 + + + = 18,75 40 40 60 60

Referenzstatistik: 2 χ0,95;2 = 3,8415

Da die Teststatistik größer als die Referenzstatistik ist, sind das Geschlecht und die Produktwahl stochastisch abhängig. Lösung L 6-64: (5 Punkte) Gegeben:

Zur Aufgabenstellung A 6-64

P K 

M

W



20 30 50

35 15 50

55 45 100

M

W



27,5 22,5 50

27,5 22,5 50

55 45 100

Bestimmen der erwarteten Häufigkeiten:

P K 

Berechnen der χ 2 -Statistik: 2 = χemp

(35 − 27,5)2 (20 − 27,5)2 + + 27,5 27,5 (30 − 22,5)2 (15 − 22,5)2 + 22,5 22,5

= 4,0909 + 5 = 9,0909 Referenzstatistik: 2 χ0,95;1 = 3,84

6.4 Lösungen

391

2 2 Da gilt χemp = 9,0909 > 3,84 = χ0,95;1 , ist die H0 -Hypothese zu verwerfen. Die beiden Variablen sind stochastisch abhängig.

Lösung L 6-65: (6 Punkte) Gegeben:

P1 P2 P3 P4 P5 P6 

Zur Aufgabenstellung A 6-65

Abs. Umsatz

Rel. Umsatzanteil

Verteilung

Erw. Häufigkeit

8 6 12 11 8 a = 7,9 45 + a = 52,9

– – – – – 0,15 1

1/6 1/6 1/6 1/6 1/6 1/6 1

8,82 8,82 8,82 8,82 8,82 8,82

Die Summe der absoluten Umsätze von P 1 bis P 5 beträgt 45. Der relative Umsatzanteil von P 1 bis P 5 beträgt 1 − 0,15 = 0,85. Da sich der relative Umsatzanteil auch als absoluter Umsatz 45, geteilt durch den Gesamtumsatz aller sechs Unternehmen (45+a) bestimmen lässt gilt: 45 = 0,85 45 + a

Auflösen nach a ergibt einen Wert von a = 7,9412. Berechnen der χ 2 -Statistik: 2 = χemp

(6 − 8,82)2 (12 − 8,82)2 (8 − 8,82)2 + + + 8,82 8,82 8,82 (11 − 8,82)2 (8 − 8,82)2 (7,9 − 8,82)2 + + 8,82 8,82 8,82

=24,9364 Referenzstatistik: 2 χ0,95;5 = 11,07 2 2 Da gilt χemp = 24,9364 > 11,07 = χ0,95;5 , ist die H0 -Hypothese zu verwerfen. Die Umsätze sind nicht gleichverteilt.

392

6 Testtheorie

Lösung L 6-66: (6 Punkte) Gegeben:

Zur Aufgabenstellung A 6-66

P1 P2 

M

W



31 5 36

14 10 24

45 15 60

M

W



27 9 36

18 6 24

45 15 60

Erwartete Häufigkeiten:

P1 P2 

Berechnen der χ 2 -Statistik: 2 χemp =

(14 − 18)2 (31 − 27)2 + + 27 18 (5 − 9)2 (10 − 6)2 + 9 6

=5,9259 Referenzstatistik: 2 χ0,95;1 = 3,84 2 2 Da gilt χemp = 5,9259 > 3,84 = χ0,95;1 , ist die H0 -Hypothese zu verwerfen. Die beiden Variablen sind stochastisch abhängig.

Lösung L 6-67: (6 Punkte) Gegeben:

Zur Aufgabenstellung A 6-67

P1 P2 

M

W



7 25 32

19 a 19 + a

26 25 + a 51 + a

6.4 Lösungen

393

Erwartete Häufigkeiten: M

W



494+26a 51+a 475+44a+a 2 51+a

26

P2

832 51+a 800+32a 51+a



32

P1

19 + a

25 + a 51 + a

Berechnen der χ 2 -Statistik (nach Zusammenfassen): 2 = χemp

(475 − 7a)2 · 51 + a



1 1 1 1 + + + 2 832 494 + 26a 800 + 32a a + 44a + 475



Referenzstatistik: 2 χ0,95;1 = 3,84

Der Wert für a, der zwischen Akzeptanz und Ablehnen der H0 -Hypothese entscheidet, 2 2 und χ0,95;1 . Numerisches Lösen der Gleichung, ergibt sich durch Gleichsetzen von χemp zum Beispiel durch Nutzen der Zielwertsuche aus Excel, ergibt einen kritischen Wert für a von a = 24,6419.

6.4.6

Anpassungstest

Lösung L 6-68: (7 Punkte) Gegeben:

1 2 3 4 

Zur Aufgabenstellung A 6-68

Verteilung

Ergebnisse

Erw. Ergebnisse

17 % 34 % 19 % 30 % 100 %

38 59 35 a 132 + a

22,44 + 0,17a 44,88 + 0,34a 25,08 + 0,19a 39,6 + 0,3a

Berechnen der χ 2 -Statistik: 2 = χemp

(14,12 − 0,34a)2 (9,92 − 0,19a)2 (39,6 − 0,7a)2 (15,56 − 0,17a)2 + + + 22,44 + 0,17a 44,88 + 0,34a 25,08 + 0,19a 39,6 + 0,3a

394

6 Testtheorie

Referenzstatistik: 2 χ0,95;3 = 7,81

Der Wert für a, der zwischen Akzeptanz und Ablehnen der H0 -Hypothese entscheidet 2 2 und χ0,95;3 . Numerisches Lösen der Gleichung, ergibt sich durch Gleichsetzen von χemp zum Beispiel durch Nutzen der Zielwertsuche aus Excel, ergibt einen kritischen Wert für a von a = 35,6515. Lösung L 6-69: (5 Punkte) Zur Aufgabenstellung A 6-69 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt: Vert. aus 2015 P1 P2 P3 P4 P5 

Tats. Werte 2016

Erw. Werte 2016

12.000 15.200 14.560 20.800 17.440 80.000

11.040 16.640 13.360 22.240 16.720 80.000

0,138 0,208 0,167 0,278 0,209 1

Berechnen der χ 2 -Test-Statistik: 2 = χemp

14402 12002 14402 7202 9602 + + + + = 440,1203 11.040 16.640 13.360 22.240 16.720

Referenzstatistik: 2 χ0,95;4 = 9,49 2 2 Da gilt χemp = 440,1203 < 9,49 = χ0,95;4 , ist die H0 -Hypothese zu verwerfen. Die Werte folgen nicht der vorgegebenen Verteilung.

Lösung L 6-70: (5 Punkte) Zur Aufgabenstellung A 6-70 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

Hans Klara Bernd Für Keinen 

Vert. Vorjahr

Werte akt. Jahr

Erw. Werte

0,31 0,27 0,15 0,27 100

108 112 68 112 400

124 108 60 108 400

6.4 Lösungen

395

Berechnen der χ 2 -Test-Statistik: 2 = χemp

162 42 82 42 + + + = 3,4275 124 108 60 108

Referenzstatistik: 2 χ0,95;3 = 7,81 2 2 Da gilt χemp = 3,4275 < 7,81 = χ0,95;3 , ist die H0 -Hypothese beizubehalten. Die Werte folgen der Vorjahres-Verteilung.

Lösung L 6-71: (5 Punkte) Zur Aufgabenstellung A 6-71 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

Bereich 1 Bereich 2 Bereich 3 Bereich 4 

Anlageschlüssel

Tats. Werte

Erw. Werte

0,21 0,17 0,37 0,25 1

22.000 18.000 33.000 27.000 100.000

21.000 17.000 37.000 25.000 100.000

Berechnen der χ 2 -Test-Statistik: 2 = χemp

10002 40002 20002 10002 + + + = 698,9 21.000 17.000 37.000 25.000

Referenzstatistik: 2 χ0,95;3 = 7,81 2 2 Da gilt χemp = 698,9 > 7,81 = χ0,95;3 , ist die H0 -Hypothese abzulehnen. Die Investitionen folgen nicht dem Anlageschlüssel.

Lösung L 6-72: (5 Punkte) Zur Aufgabenstellung A 6-72 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

396

6 Testtheorie

P1 P2 P3 

Geg. Vert. (Umsätze)

Tats. Vert. (Werbung)

Erw. Vert. (Werbung)

0,3 0,4 0,3 1

0,3333 0,3333 0,3333 100

0,3 0,4 0,3 100

Berechnen der χ 2 -Test-Statistik: 2 = χemp

0,66672 0,33332 0,33332 + + = 1,8515 0,3 0,4 0,3

Referenzstatistik: 2 χ0,95;2 = 5,99 2 2 Da gilt χemp = 1,8515 < 5,99 = χ0,95;2 , ist die H0 -Hypothese beizubehalten. Die Verteilung der Werbung folgt der vorgegebenen Verteilung der Umsätze.

Lösung L 6-73: (5 Punkte) Zur Aufgabenstellung A 6-73 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

P1 P2 P3 P4 P5 

Gleichvert.

Tats. Bestellungen

Erw. Bestellungen

0,2 0,2 0,2 0,2 0,2 1

30 25 30 27 25 137

27,4 27,4 27,4 27,4 27,4 137

Berechnen der χ 2 -Test-Statistik: 2 = χemp

2,42 2,62 0,42 2,42 2,62 + + + + = 0,9197 27,4 27,4 27,4 27,4 27,4

Referenzstatistik: 2 χ0,95;4 = 9,49

6.4 Lösungen

397

2 2 Da gilt χemp = 0,9197 < 9,49 = χ0,95;4 , ist die H0 -Hypothese beizubehalten. Die Bestellmengen sind mit einer Gleichverteilung vereinbar.

Lösung L 6-74: (6 Punkte) Zur Aufgabenstellung A 6-74 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

Variante 1 Variante 2 Variante 3 Variante 4 Variante 5

Theoretische Fehlerquoten

Tatsächliche Fehlerquoten

Erwartete Fehlerquoten

0,05 0,06 0,01 0,02 0,02

0,0450 0,0683 0,0143 0,0160 0,0250

0,05 0,06 0,01 0,02 0,02

Berechnen der χ 2 -Test-Statistik: 2 = χemp

0,52 0,832 0,432 0,42 0,52 + + + + = 0,4857 4,5 6,83 1,43 1,6 2,5

Referenzstatistik: 2 χ0,95;4 = 9,49 2 2 Da gilt χemp = 0,4857 < 9,49 = χ0,95;4 , ist die H0 -Hypothese beizubehalten. Die tatsächlichen Fehlerquoten folgen der vorgegebenen Verteilung theoretischer Fehlerquoten.

Lösung L 6-75: (5 Punkte) Zur Aufgabenstellung A 6-75 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

Quartal 1 Quartal 2 Quartal 3 Quartal 4

Theo. Fehlquoten

Tats. Fehlquoten

Erw. Fehlquoten

0,07 0,06 0,08 0,04

0,13 0,13 0,15 0,07

0,07 0,06 0,08 0,04

Berechnen der χ 2 -Test-Statistik: 2 = χemp

0,072 0,072 0,032 0,062 + + + = 0,1109 0,13 0,13 0,15 0,07

398

6 Testtheorie

Referenzstatistik: 2 χ0,95;3 = 7,81 2 2 Da gilt χemp = 0,1109 < 7,81 = χ0,95;3 , ist die H0 -Hypothese beizubehalten. Die tatsächlichen Fehlerquoten weisen die gleiche Verteilung auf wie die theoretisch erwarteten Fehlerquoten.

Lösung L 6-76: (5 Punkte) Zur Aufgabenstellung A 6-76 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

2500 

Vert. in DE

Tats. Werte (Köln)

Erw. Werte (Köln)

0,25 0,15 0,30 0,20 0,10 1

28 13 37 17 1 80.000

24 14,4 28,8 19,2 9,6 80.000

Berechnen der χ 2 -Test-Statistik: 2 = χemp

42 1,42 8,22 2,22 8,62 + + + + = 11,0938 24 14,4 28,8 19,2 9,6

Referenzstatistik: 2 χ0,95;4 = 9,49 2 2 Da gilt χemp = 11,0938 > 9,49 = χ0,95;4 , ist die H0 -Hypothese abzulehnen. Die Werte für Köln weichen signifikant von der gesamtdeutschen Verteilung ab.

Lösung L 6-77: (5 Punkte) Zur Aufgabenstellung A 6-77 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

CDU SPD Linke Grüne 

Vert. im BT

Ergebnis Stichprobe

Erw. Werte

0,49 0,31 0,10 0,10 1

23 22 2 5 52

25,48 16,12 5,2 5,2 52

6.4 Lösungen

399

Berechnen der χ 2 -Test-Statistik: 2 = χemp

2,482 5,882 3,22 0,22 + + + = 4,3631 25,48 16,12 5,2 5,2

Referenzstatistik: 2 χ0,95;3 = 7,81 2 2 Da gilt χemp = 4,3631 < 7,81 = χ0,95;4 , ist die H0 -Hypothese beizubehalten. Die Stichprobe spiegelt das Ergebnis im Bundestag wieder.

Lösung L 6-78: (5 Punkte) Zur Aufgabenstellung A 6-78 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

Quartal 1 Quartal 2 Quartal 3 Quartal 4 

Umsatzanteil

Umsatz 2016

Erw. Umsatz 2016

0,15 0,20 0,55 0,10 1

30 31 60 17 138

20,7 27,6 75,9 13,8 138

Berechnen der χ 2 -Test-Statistik: 2 = χemp

3,42 15,92 3,22 9,32 + + + = 8,67 20,7 27,6 75,9 13,8

Referenzstatistik: 2 χ0,95;3 = 7,81 2 2 Da gilt χemp = 8,67 > 7,81 = χ0,95;3 , ist die H0 -Hypothese zu verwerfen. Die Umsätze folgen nicht der vorgegebenen Verteilung.

Lösung L 6-79: (5 Punkte) Zur Aufgabenstellung A 6-79 Die vorgegebene Verteilung und die entsprechend erwarteten Werte ergeben sich wie folgt:

400

6 Testtheorie

Schwarz Rot Null 

Theo. Verteilung

Tats. Ergebnisse

Erw. Werte

0,4865 0,4865 0,0270 1

8 11 1 20

9,73 9,73 0,54 20

Berechnen der χ 2 -Test-Statistik: 2 = χemp

1,732 1,272 0,462 + + = 0,8652 9,73 9,73 0,54

Referenzstatistik: 2 χ0,95;2 = 5,99 2 2 Da gilt χemp = 0,8652 < 5,99 = χ0,95;2 , ist die H0 -Hypothese beizubehalten. Die Werte folgen der vorgegebenen Verteilung.

6.4.7

Homogenitätstest

Lösung L 6-80: (9 Punkte) Zur Aufgabenstellung A 6-80 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Köln Berlin 

Jan

Feb

Mär

Apr

Mai

Jun



108,80 196,20 305

110,58 199,42 310

98,09 176,91 275

87,39 157,61 245

90,96 164,04 255

89,18 160,82 250

585 1055 1640

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(110 − 110,58)2 (105 − 98,09)2 (100 − 108,8)2 + + + 108,8 110,58 98,09 (95 − 87,39)2 (85 − 90,96)2 (90 − 89,1)2 + + + 87,39 90,96 89,1 (200 − 199,42)2 (170 − 176,91)2 (205 − 196,2)2 + + + 196,2 199,42 176,91 (150 − 157,61)2 (170 − 164,04)2 (160 − 160,82)2 + + = 3,5168 157,61 164,04 160,82

6.4 Lösungen

401

Referenzstatistik: 2 χ0,95;5 = 11,07 2 2 Da gilt χemp = 3,5168 < 11,07 = χ0,95;5 , ist die H0 -Hypothese beizubehalten. Die Stichproben in Köln und Berlin weisen die gleiche Verteilung auf.

Lösung L 6-81: (9 Punkte) Zur Aufgabenstellung A 6-81 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Dozent 1 Dozent 2 

1

2

3

4

5



1,65 1,35 3

4,41 3,59 8

3,31 2,69 6

9,92 8,08 18

7,71 6,29 14

27 22 49

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(1 − 1,65)2 (5 − 4,41)2 (3 − 3,31)2 (10 − 9,92)2 (8 − 7,71)2 + + + + + 1,65 4,41 3,31 9,92 7,71 (2 − 1,35)2 (3 − 3,59)2 (3 − 2,69)2 (8 − 8,08)2 (6 − 6,29)2 + + + + 1,35 3,59 2,69 8,08 6,29

= 0,8329 Referenzstatistik: 2 χ0,95;4 = 9,49 2 2 Da gilt χemp = 0,8329 < 9,49 = χ0,95;4 , ist die H0 -Hypothese beizubehalten. Die beiden Dozenten weisen eine vergleichbare Notenverteilung auf.

Lösung L 6-82: (9 Punkte) Zur Aufgabenstellung A 6-82 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Woche 1 Woche 2 

Mo

Di

Mi

Do

Fr



2,05 2,45 4,5

1,82 2,18 4

1,36 1,64 3

1,36 1,64 3

0,91 1,09 2

7,5 9 16,5

402

6 Testtheorie

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(1,5 − 2,05)2 (2 − 1,82)2 (1 − 1,36)2 (2 − 1,36)2 + + + + 2,05 1,82 1,36 1,36 (3 − 2,45)2 (2 − 2,18)2 (2 − 1,64)2 (1 − 0,91)2 + + + + 0,91 2,45 2,18 1,64 (1 − 1,64)2 (1 − 1,09)2 + = 1,0272 1,64 1,09

Referenzstatistik: 2 χ0,99;4 = 13,28 2 2 Da gilt χemp = 1,0272 < 13,28 = χ0,99;4 , ist die H0 -Hypothese beizubehalten. Ausfallzeiten in beiden Wochen weisen eine vergleichbare Verteilung auf.

Lösung L 6-83: (9 Punkte) Zur Aufgabenstellung A 6-83 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Köln Düsseldorf 

CDU

SPD

FDP

Grüne

AfD



31,23 33,77 65

19,22 20,78 40

8,17 8,83 17

7,21 7,79 15

8,17 8,83 17

74 80 154

Berechnen der χ 2 -Test-Statistik: 2 χemp =

(17 − 19,22)2 (5 − 8,17)2 (12 − 7,21)2 (30 − 31,23)2 + + + + 31,23 19,22 8,17 7,21 (10 − 8,17)2 (35 − 33,77)2 (23 − 20,78)2 (12 − 8,83)2 + + + + 8,17 33,77 20,78 8,83 (3 − 7,79)2 (7 − 8,83)2 + = 9,8331 7,79 8,83

Referenzstatistik: 2 χ0,95;3 = 7,81 2 2 Da gilt χemp = 9,8331 > 7,81 = χ0,95;3 , ist die H0 -Hypothese abzulehnen. Die Stichproben in Köln und Düsseldorf weisen unterschiedliche Verteilungen auf.

6.4 Lösungen

403

Lösung L 6-84: (8 Punkte) Zur Aufgabenstellung A 6-84 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

München Hamburg 

Bin aktiv

Suche etwas

Kein Interesse

Sonstiges



9 9 18

28,5 28,5 57

55 55 110

7,5 7,5 15

100 100 200

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(25 − 28,5)2 (60 − 55)2 (5 − 7,5)2 (10 − 9)2 + + + + 9 28,5 55 7,5 (8 − 9)2 (32 − 28,5)2 (50 − 55)2 (10 − 7,5)2 + + + = 3,6576 9 28,5 55 7,5

Referenzstatistik: 2 χ0,95;3 = 7,81 2 2 Da gilt χemp = 3,6576 < 7,81 = χ0,95;3 , ist die H0 -Hypothese beizubehalten. Die Stichproben in München und Hamburg weisen die gleiche Verteilung auf.

Lösung L 6-85: (9 Punkte) Zur Aufgabenstellung A 6-85 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Werbung Umsätze 

Jan

Feb

Mär

Apr

189,02 1760,98 1950

213,26 1986,74 2200

127,95 1192,05 1320

126,01 1173,99 1300

Werbung Umsätze 

Mai

Jun



276,26 2573,74 2850

237,49 2212,51 2450

1170 10.900 12.070

404

6 Testtheorie

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(150 − 189,02)2 (200 − 213,26)2 (120 − 127,95)2 + + + 189,02 213,26 127,95 (350 − 276,26)2 (250 − 237,49)2 (100 − 126,01)2 + + + 126,01 276,26 237,49 (1800 − 1760,98)2 (2000 − 1986,74)2 (1200 − 1192,05)2 + + + 1760,98 1986,74 1192,05 (2500 − 2573,74)2 (2200 − 2212,51)2 (1200 − 1173,99)2 + + 1173,99 2573,74 2212,51

= 38,8499 Referenzstatistik: 2 χ0,95;5 = 11,07 2 2 Da gilt χemp = 38,8499 > 11,07 = χ0,95;5 , ist die H0 -Hypothese abzulehnen. Werbeausgaben und Umsätze weisen nicht die gleiche Verteilung auf.

Lösung L 6-86: (8 Punkte) Zur Aufgabenstellung A 6-86 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Privat Öffentlich 

Köln

Düsseldorf

Berlin

München



78,71 601,29 680

71,77 548,23 620

106,5 813,5 920

103,02 786,98 890

360 2750 3110

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(70 − 71,77)2 (120 − 106,5)2 (90 − 103,02)2 (80 − 78,71)2 + + + + 78,71 71,77 106,5 103,02 (600 − 601,29)2 (550 − 548,23)2 (800 − 813,5)2 + + + 601,29 548,23 813,5 (800 − 786,98)2 = 3,8695 786,98

6.4 Lösungen

405

Referenzstatistik: 2 χ0,95;3 = 7,81 2 2 Da gilt χemp = 3,8695 < 7,81 = χ0,95;5 , ist die H0 -Hypothese beizubehalten. Die Verteilungen der Absolventenzahlen an privaten und öffentlichen Hochschulen weisen die gleiche Verteilung auf.

Lösung L 6-87: (8 Punkte) Zur Aufgabenstellung A 6-87 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Filliale 1 Filliale 2 

1. Quartal

2. Quartal

3. Quartal

4. Quartal



238,10 761,90 1000

285,71 914,29 1200

95,24 304,76 400

130,95 419,05 550

750 2400 3150

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(200 − 238,1)2 (300 − 285,71)2 (100 − 95,24)2 + + + 238,1 285,71 95,24 (800 − 761,9)2 (900 − 914,29)2 (150 − 130,95)2 + + + 130,95 761,9 914,29 (300 − 304,76)2 (400 − 419,05)2 + = 12,8895 304,76 419,05

Referenzstatistik: 2 χ0,9;3 = 6,25 2 2 Da gilt χemp = 12,8895 > 6,25 = χ0,9;3 , ist die H0 -Hypothese abzulehnen. Die beiden Filialen weisen über die Quartale hinweg unterschiedliche Verteilungen auf.

Lösung L 6-88: (9 Punkte) Zur Aufgabenstellung A 6-88 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Hans Bernd 

Jan

Feb

Mär

Apr

Mai

Jun



23,02 26,98 50

25,32 29,68 55

16,11 18,89 35

18,41 21,59 40

20,71 24,29 45

41,43 48,57 90

145 170 115

406

6 Testtheorie

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(10 − 23,02)2 (25 − 25,32)2 (10 − 16,11)2 + + + 23,02 25,32 16,11 (30 − 20,71)2 (50 − 41,43)2 (20 − 18,41)2 + + + 18,41 20,71 41,43 (40 − 26,98)2 (30 − 29,68)2 (25 − 18,89)2 + + + 26,98 29,68 18,89 (15 − 24,29)2 (40 − 48,57)2 (20 − 21,59)2 + + = 27,6829 21,59 24,29 48,57

Referenzstatistik: 2 χ0,95;5 = 11,07 2 2 Da gilt χemp = 27,6829 > 11,07 = χ0,95;5 , ist die H0 -Hypothese abzulehnen. Hans und Bernd weisen signifikant unterschiedliche Verteilungen ihrer Mobilfunkkosten auf.

Lösung L 6-89: (9 Punkte) Zur Aufgabenstellung A 6-89 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Scores 2016 Scores 2017 

90



10 10 20

25 25 50

30 30 60

25 25 50

10 10 20

100 100 200

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(20 − 25)2 (30 − 30)2 (30 − 25)2 (10 − 10)2 + + + + 10 25 30 25 (10 − 10)2 (10 − 10)2 (30 − 25)2 (30 − 30)2 + + + + 10 10 25 30 (20 − 25)2 (10 − 10)2 + =4 25 10

Referenzstatistik: 2 χ0,95;4 = 9,49

6.4 Lösungen

407

2 2 Da gilt χemp = 4 < 9,49 = χ0,95;4 , ist die H0 -Hypothese beizubehalten. Die Scores weisen in beiden Jahren die gleiche Verteilung auf.

Lösung L 6-90: (8 Punkte) Zur Aufgabenstellung A 6-90 Die Randhäufigkeiten sowie die erwarteten Häufigkeiten sind wie folgt gegeben:

Rot Blau Grün Gelb 

München

Paris



50,74 39,62 18,84 5,8 115

54,26 42,38 20,16 6,2 123

105 82 39 12 238

Berechnen der χ 2 -Test-Statistik: 2 = χemp

(55 − 54,26)2 (40 − 39,62)2 (42 − 42,38)2 (50 − 50,74)2 + + + + 50,74 54,26 39,62 42,38 (20 − 18,84)2 (19 − 20,16)2 (5 − 5,8)2 (7 − 6,2)2 + + + = 0,3798 18,84 20,16 5,8 6,2

Referenzstatistiken: 2 2 χ0,95;3 = 7,91 und χ0,99;3 = 11,34 2 2 Da gilt χemp = 0,3798 < 7,91 = χ0,95;3 , ist die H0 -Hypothese beizubehalten. Die Stichproben in München und Paris weisen die gleiche Verteilung auf. Das Ergebnis ändert sich auch nicht, wenn die Fehlerwahrscheinlichkeit verkleinert wird, da auch gilt: 2 2 = 0,3798 < 11,34 = χ0,99;3 . χemp

6.4.8

Excel-Aufgaben

Lösung L 6-91: (4 Punkte) Zur Aufgabenstellung A 6-91 Zunächst werden die Werte in Spalte A, die Fehlerwahrscheinlichkeit in Zelle B1, die Standardabweichung in Zelle C1 und der Mittelwert in D1 übernommen. Der Akzeptanzbereich bestimmt sich dann analog zu einem Konfidenzintervall um den Mittelwert.

408

6 Testtheorie

Die linke Seite des Konfidenzintervalls bestimmt sich über die Funktion =MITTELWERT(A:A) - NORM.S.INV(1-B1/2) * C1 / WURZEL(ANZAHL(A:A)). Die rechte Seite des Konfidenzintervalls bestimmt sich über die Funktion =MITTELWERT(A:A) + NORM.S.INV(1-B1/2) * C1 / WURZEL(ANZAHL(A:A)). Liegt der Mittelwert im Akzeptanzbereich, ist die H0 -Hypothese beizubehalten. Dies kann über die folgende Funktion erfolgen =WENN(D1MITTELWERT(A:A) - NORM.S.INV(1-B1/2) * C1/ WURZEL(ANZAHL(A:A)); “H0-Hypothese beibehalten”; “H0-Hypothese ablehnen”); “H0-Hypothese ablehnen”). Lösung L 6-92: (4 Punkte) Zur Aufgabenstellung A 6-92 Zunächst werden die Werte in Spalte A, die Fehlerwahrscheinlichkeit in Zelle B1, die Standardabweichung in Zelle C1 und der Mittelwert in D1 übernommen. Der Akzeptanzbereich bestimmt sich dann analog zu einem Konfidenzintervall um den Mittelwert. Die linke Seite des Konfidenzintervalls bestimmt sich über die Funktion =MITTELWERT(A:A) - T.INV(1-B1/2;ANZAHL(A:A)-1) * C1/WURZEL (ANZAHL(A:A)). Die rechte Seite des Konfidenzintervalls bestimmt sich über die Funktion =MITTELWERT(A:A) + T.INV(1-B1/2;ANZAHL(A:A)-1) * C1/WURZEL (ANZAHL(A:A)). Liegt der Mittelwert im Akzeptanzbereich, ist die H0 -Hypothese beizubehalten. Dies kann über die folgende Funktion erfolgen =WENN(D1MITTELWERT(A:A) - T.INV(1-B1/2;ANZAHL (A:A)-1) * C1/WURZEL(ANZAHL(A:A)); “H0-Hypothese beibehalten”; “H0Hypothese ablehnen”); “H0-Hypothese ablehnen”). Lösung L 6-93: (8 Punkte) Zur Aufgabenstellung A 6-93 Zunächst werden die Werte in die Zellen A1 bis B3 übernommen. (Sollte keine 3 × 3-Kontingenztabelle vorliegen, sind die Zellenbezüge in unten stehender Formel entsprechend anzupassen.) Die Zellen C1 bis C4 und A4 bis C4 enthalten die Randhäufigkeiten, die mittels der Funktion z. B. =SUMME(A1:A3) bestimmt werden. In Zelle G1 wird die Fehlerwahrscheinlichkeit übernommen.

6.4 Lösungen

409

Im zweiten Schritt werden in den Zellen D1 bis E3 die erwarteten Häufigkeiten bestimmt. Dies erfolgt über die Funktion =A$4*$C1/$C$4 für Zelle D1, für alle anderen Zellen kann der Wert mittels der Auto-Ausfüllen-Funktion von Excel bestimmt werden. Der Test selbst erfolgt über die Funktion =WENN(CHIQU.TEST(A1:B3;D1:E3)A

A-BB

A

A-BB