Der Schluß auf die beste Erklärung [Reprint 2013 ed.] 9783110906844, 3110177218, 9783110177213

What is a "good" explanation? By what criteria is one argument more plausible, or "truer" than anoth

160 23 10MB

German Pages 365 [368] Year 2003

Polecaj historie

Leibniz : oder Die beste der möglichen Welten 9783644000032, 3644000034

Er war einer der bedeutendsten Universalgelehrten, die Deutschland jemals hatte: Gottfried Wilhelm Leibniz. Seine Korres

516 61 623KB Read more

Die Kriegsschauplätze auf der Balkanhalbinsel

547 128 7MB Read more

Die Bilanzen der Aktiengesellschaften und der Kommanditgesellschaften auf Aktien [Reprint 2018 ed.] 9783111526256, 9783111157955

187 38 16MB Read more

Die Kursbildung auf dem Devisenterminmarkt und die Devisenterminpolitik der Zentralbanken [Reprint 2019 ed.] 9783110836691, 9783110008609

169 54 14MB Read more

Die Förderung edler Volkserholung durch Staat, Kirche und Schule, die beste Waffe gegen die wachsende Vergnügungssucht: Ein Vortrag gehalten auf der am 25. Oktober 1899 zu Angersbach tagenden Synode des evangelischen Dekants Lautersbach [Reprint 2019 ed.] 9783111650654, 9783111267111

139 51 3MB Read more

Der Himmel ist nicht genug - Wissenschaft ist die beste Religion 3662674343, 9783662674345, 9783662674352

Die Naturwissenschaft beschäftigt sich mit denselben großen Fragen wie Religion und Philosophie. Dabei verlässt sie sich

171 16 4MB Read more

Der Angriff auf die Krim und der Kampf um Sebastopol

709 35 18MB Read more

Der Einfluss der griechischen Personennamen auf die Wortbildung 9783533026686, 353302668X

162 91 12MB Read more

Die mackabäische Erhebung: Vortrag auf der Rose zu Jena [Reprint 2021 ed.] 9783112394526, 9783112394519

163 53 2MB Read more

Die Statik der Gewölbe mit Rücksicht auf ihre Anwendung [Reprint 2022 ed.] 9783112628560

188 16 29MB Read more

Der Schluß auf die beste Erklärung [Reprint 2013 ed.]
9783110906844, 3110177218, 9783110177213

Author / Uploaded
Holger Klärner

Table of contents :
Einleitung
0.1 Schlüsse auf die beste Erklärung
0.2 Zur Rechtfertigung des Schlusses auf die beste Erklärung
0.3 Präzisierung der Redeweise vom Schluß auf die beste Erklärung
0.4 Erklärungen
0.5 Argumente für und gegen den Schluß auf die beste Erklärung
0.6 Wahrheit und Rechtfertigung – einige kurze Erläuterungen
Kapitel 1 Das covering law-Modell der Erklärung
1.1 Einleitung
1.2 Drei Typen von covering law-Erklärungen
1.3 Einwände gegen das covering law-Modell
1.4 Das covering law-Modell und der Schluß auf die beste Erklärung
Kapitel 2 Das Vereinheitlichungsmodell der Erklärung
2.1 Einleitung
2.2 Das Erklärungsmodell von Michael Friedman
2.3 Das Erklärungsmodell von Philip Kitcher
Kapitel 3 Das kausale Modell der Erklärung
3.1 Einleitung
3.2 Das Erklärungsmodell von David Lewis
3.3 Das Erklärungsmodell von Wesley Salmon
Kapitel 4 Argumente für und gegen den Schluß auf die beste Erklärung
4.1 Einleitung
4.2 Argumente für den Schluß auf die beste Erklärung
4.3 Argumente gegen den Schluß auf die beste Erklärung
Kapitel 5 Der Schluß auf die beste Erklärung und die Bayesianistische Erkenntnistheorie
5.1 Einleitung
5.2 Die Bayesianistische Erkenntnistheorie
5.3 Van Fraassens Argument
5.4 Einwände gegen van Fraassens Argument
5.5 Folgen von van Fraassens Argument für den Schluß auf die beste Erklärung
5.6 Appendix
Kapitel 6 Der Schluß auf die beste Erklärung und die Realismusdebatte in der Wissenschaftstheorie
6.1 Einleitung
6.2 Erklärungen für den empirischen Erfolg wissenschaftlicher Theorien
6.3 Die Verläßlichkeit des Schlusses auf die beste Erklärung
6.4 Abschließende Bemerkungen
Epilog
Danksagung
Literaturverzeichnis
Personenregister

Citation preview

Holger Klärner Der Schluß auf die beste Erklärung

w DE

G

Ideen & Argumente Herausgegeben von Wilfried Hinsch und Lutz Wingert

Walter de Gruyter · Berlin · New York

2003

Holger Klärner

Der Schluß auf die beste Erklärung

Walter de Gruyter · Berlin · New York 2003

© Gedruckt auf säurefreiem Papier, das die US-ANSI-Norm über Haltbarkeit erfüllt.

ISBN 3 - 1 1 - 0 1 7 7 2 1 - 8

Bibliografische

Information Der Deutschen

Bibliothek

Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar.

©

Copyright 2 0 0 3 by Walter de Gruyter G m b H & Co. KG, D - 1 0 7 8 5 Berlin

Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany Umschlaggestaltung: +malsy, kommunikation und gestaltung, Bremen

Meinen Eltern und Nadine Ott

Inhaltsverzeichnis

Einleitung

1

0.1 Schlüsse auf die beste Erklärung 0.2 Zur Rechtfertigung des Schlusses auf die beste Erklärung 0.3 Präzisierung der Redeweise vom Schluß auf die beste Erklärung 0.4 Erklärungen 0.5 Argumente für und gegen den Schluß auf die beste Erklärung 0.6 Wahrheit und Rechtfertigung - einige kurze Erläuterungen

1 7

Kapitel 1

Das covering /aw-Modell der Erklärung

1.1 Einleitung 1.2 Drei Typen von covering /aw-Erklärungen 1.2.1 Deduktiv-nomologische Erklärungen 1.2.2 Deduktiv-statistische Erklärungen 1.2.3 Induktiv-statistische Erklärungen 1.2.4 Übersicht 1.3 Einwände gegen das covering /aw-Modell 1.3.1 Einleitung 1.3.2 Der Gesetzesbegriff 1.3.3 Die Notwendigkeit der Bedingungen des covering /aw-Modells 1.3.4 Das Hinreichen der Bedingungen des covering /aw-Modells 1.3.5 Spezielle Probleme für IS-Erklärungen 1.4 Das covering /aw-Modell und der Schluß auf die beste Erklärung 1.4.1 Einleitung 1.4.2 Konsequenzen aus den Einwänden 1.4.3 GUtekriterien für covering /aw-Erklärungen

10 13 17 20 25 25 28 28 32 33 40 41 41 42 45 49 52 54 54 57 61

vili Kapitel 2

Inhaltsverzeichnis Das Vereinheitlichungsmodell der Erklärung

65

2.1 Einleitung 2.2 Das Erklärungsmodell von Michael Friedman 2.2.1 Die Grundidee von Friedmans Modell 2.2.2 Explikation der Grundidee 2.2.3 Einwände gegen Friedmans Modell 2.2.4 Friedmans Modell und der Schluß auf die beste Erklärung 2.3 Das Erklärungsmodell von Philip Kitcher 2.3.1 Die Grundidee von Kitchers Modell 2.3.2 Explikation der Grundidee 2.3.3 Einwände gegen Kitchers Modell 2.3.4 Kitchers Modell und der Schluß auf die beste Erklärung

121

Kapitel 3

129

Das kausale Modell der Erklärung

3.1 Einleitung 3.2 Das Erklärungsmodell von David Lewis 3.2.1 Einleitung 3.2.2 Lewis' Kausalitätsmodell 3.2.3 Einwände gegen Lewis' Kausalitätsmodell 3.2.4 Lewis'Erklärungsmodell 3.2.5 Einwände gegen Lewis' Erklärungsmodell und dessen Eignung als Basis für den Schluß auf die beste Erklärung 3.3 Das Erklärungsmodell von Wesley Salmon 3.3.1 Einleitung 3.3.2 Salmons ursprüngliches Kausalitätsmodell 3.3.3 Einwände gegen Salmons ursprüngliches Kausalitätsmodell und dessen Weiterentwicklung 3.3.4 Salmons Erklärungsmodell 3.3.5 Einwände gegen Salmons Erklärungsmodell und dessen Eignung als Basis für den Schluß auf die beste Erklärung

65 67 67 73 81 93 102 102 106 112

129 132 132 133 140 151

160 169 169 174 181 192

202

Inhaltsverzeichnis

Kapitel 4

Argumente für und gegen den Schluß auf die beste Erklärung

4.1 Einleitung 4.2 Argumente für den Schluß auf die beste Erklärung 4.2.1 Verteilung der Beweislast 4.2.2 Die Idee vom gewachsenen Zusammenhang 4.2.3 Ein evolutionstheoretisches Argument für den Schluß auf die beste Erklärung 4.3 Argumente gegen den Schluß auf die beste Erklärung 4.3.1 Ein empirisches Argument 4.3.2 Van Fraassens Argumente gegen den Schluß auf die beste Erklärung 4.3.3 Abschließende Bemerkungen Kapitel 5

Der Schluß auf die beste Erklärung und die Bayesianistische Erkenntnistheorie

5.1 Einleitung 5.2 Die Bayesianistische Erkenntnistheorie 5.2.1 Grundprinzipien der Bayesianistischen Erkenntnistheorie 5.2.2 Rechtfertigung der Grundprinzipien: Dutch books 5.2.3 Das Bayessche Theorem 5.2.4 Erfolge der Bayesianistischen Erkenntnistheorie 5.2.5 Probleme der Bayesianistischen Erkenntnistheorie 5.3 Van Fraassens Argument 5.3.1 Einleitung 5.3.2 Das Experiment 5.3.3 Eine probabilistische Version des Schlusses auf die beste Erklärung 5.3.4 Diachronisches Dutch book 5.3.5 Van Fraassens Folgerungen aus dem Argument 5.4 Einwände gegen van Fraassens Argument 5.4.1 Übersicht über die Einwände 5.4.2 Falsche Verteilung der Bonus-Wahrscheinlichkeiten 5.4.3 Ein vermeintlicher Fehler im Dutch bookArgument

ix

213 213 215 215 217 220 223 223 227 243

245 245 246 246 251 254 255 257 259 259 259 261 262 267 269 269 270 276

Inhaltsverzeichnis

χ

5.4.4 Unplausible Konzeption des Schlusses auf die beste Erklärung 5.4.5 Alternative Konzeption des probabilistischen Schlusses auf die beste Erklärung 5.5 Folgen von van Fraassens Argument für den Schluß auf die beste Erklärung 5.6 Appendix Kapitel 6

Der Schluß auf die beste Erklärung und die Realismusdebatte in der Wissenschaftstheorie

281 286 291 296

299

6.1 Einleitung 6.1.1 Wissenschaftlicher Realismus und das Wahrheitsargument 6.1.2 Wissenschaftlicher Antirealismus und Einwände gegen das Wahrheitsargument 6.2 Erklärungen für den empirischen Erfolg wissenschaftlicher Theorien 6.2.1 Die Selektionserklärung 6.2.2 Die Erklärung über empirische Adäquatheit 6.2.3 Die Wahrheitserklärung - eine gute Erklärung des empirischen Erfolgs wissenschaftlicher Theorien? 6.3 Die Verläßlichkeit des Schlusses auf die beste Erklärung 6.4 Abschließende Bemerkungen

299

317 322 326

Epilog

329

Danksagung

335

Literaturverzeichnis

337

Personenregister

353

299 303 306 306 311

Einleitung 0.1

Schlüsse auf die beste Erklärung

Ein Spaziergänger geht am Strand entlang und sieht vor sich im Sand Fußspuren. Unwillkürlich schließt er daraus, daß vor ihm ein anderer Mensch diesen Weg entlanggegangen sein muß. Dies scheint ihm die beste Erklärung für die Fußspuren zu sein. Vor Gericht präsentiert der Staatsanwalt eine Reihe von Indizien für die Schuld des Angeklagten: Er wurde zur Tatzeit am Tatort gesehen, er hatte ein Motiv für den Mord, die Tatwaffe wurde in seiner Wohnung gefunden, an seiner Kleidung wurden Blutspuren des Opfers entdeckt usw. Aus all dem schließt der Richter, daß der Angeklagte der Täter ist. Diese Schlußfolgerung hält er für die beste Erklärung aller Indizien. Gegen Ende der ersten Hälfte des 19. Jahrhunderts stellen die Astronomen John Couch Adams und Urbain Jean Joseph Leverrier fest, daß die Umlaufbahn des Planeten Uranus um die Sonne nicht mit den Vorhersagen der Newtonschen Gravitationstheorie übereinstimmt. Sie schließen daraus, daß es einen weiteren, bisher nicht entdeckten Planeten mit einer bestimmten Masse und Umlaufbahn um die Sonne geben muß. Dies stellt für sie die beste Erklärung der beobachteten Phänomene dar. (Dieser Planet - der Neptun - wird 1846 von Johann Gottfried Galle tatsächlich entdeckt.) Diese drei Schlüsse kann man als Schlüsse auf die beste Erklärung beschreiben: Gewisse zu erklärende Phänomene liegen vor, und eine bestimmte Hypothese wird als die beste Erklärung dieser Phänomene angesehen - auf diese Hypothese wird geschlossen. Wie die drei genannten Beispiele andeuten, kommen Schlüsse auf die beste Erklärung sowohl im Alltag als auch in den Einzelwissenschaften häufig vor. Nach Ansicht vieler Autoren handelt es sich bei dem Schluß auf die beste Erklärung sogar um eines der wichtigsten

2

Einleitung

W e r k z e u g e zur Wissenserweiterung. S o schreibt beispielsweise Clark Glymour: This pattern of argument is not bounded by time or by subject matter. One can find such arguments in sociology, in psychometrics, in chemistry, and in astronomy, in the time of Copernicus and in the most recent scientific journals. The goodness of explanations is a ubiquitous criterion; in every scientific subject it forms one of the principal standards by which we decide what to believe. (Glymour 1984: 173) M a n c h e Autoren gehen noch weiter und bezeichnen den Schluß auf die beste Erklärung als „das zentrale Schlußverfahren" (Bartelborth 1996a: 2 5 4 ) im Bereich der nicht-deduktiven Schlüsse. 1 A u c h in der Philosophie wird der Schluß auf die beste Erklärung gern verwendet. V i e l e Autoren setzen ihre H o f f n u n g e n in ihn, w e n n sie ihre e i g e n e philosophische Position begründen wollen. Einige B e i spiele aus verschiedenen Disziplinen m ö g e n dies belegen. In der Philosophie

des Geistes

vertritt Jerry Fodor ( 1 9 8 7 ) eine Position, nach der

M e n s c h e n und Tiere im großen und ganzen diejenigen Meinungen und W ü n s c h e haben, die ihnen durch die Alltagspsychologie zugeschrieben werden. D i e s e These begründet er folgendermaßen: I have no serious doubt that this theory (what I call 'commonsense belief/desire psychology') is pretty close to being true. My reason for believing this [...] is that commonsense belief/desire psychology explains vastly more of the facts about behavior than any of the alternative theories available. (Fodor 1987: x)

1

Ein oft genanntes Beispiel für eine Verwendung des Schlusses auf die beste Erklärung in den Naturwissenschaften ist Charles Darwins Argument für seine Theorie der Evolution durch natürliche Auslese in The Origin of Species (1859): „It can hardly be supposed that a false theory would explain, in so satisfactory a manner as does the theory of natural selection, the several large classes of facts above specified." (Darwin 1962: 476). Darwins BegrUndungsstrategie scheint in der Biologie weit verbreitet zu sein; vgl. Resnik (1989) für eine kritische Analyse. Thagard (1978: 77 f.) führt aus der Geschichte der Naturwissenschaften Lavoisiers Argument für die Sauerstofftheorie der Veibrennung und die Argumente von Huygens, Young und Fresnel für die Wellentheorie des Lichts als berühmte Beispiele für Schlüsse auf die beste Erklärung an. Auch außerhalb der Naturwissenschaften im engeren Sinn wird der Schluß auf die beste Erklärung angewendet; vgl. Hanen/Kelley (1989) für eine Analyse der Rolle des Schlusses auf die beste Erklärung in der Archäologie und Holcomb (1996) für eine Studie zur (Evolutions-)Psychologie.

0.1

Schlüsse auf die beste Erklärung

3

Nach Fodors Ansicht stellt also die Alltagspsychologie die beste Erklärung der Summe der Tatsachen Uber das Verhalten von Menschen und Tieren dar und sollte aus diesem Grund akzeptiert werden. In der Diskussion um den Rechtfertigungsbegriff in der Erkenntnistheorie verteidigt Laurence Bonjour (1985) eine kohärentistische Theorie der Rechtfertigung: Eine Meinung ist dann gerechtfertigt, wenn sie zu einem kohärenten System von Überzeugungen gehört, das über einen längeren Zeitraum hinweg stabil und dabei ständigem Beobachtungsinput ausgesetzt ist. Ein solches System von Meinungen bildet darüber hinaus nach Bonjours Ansicht die Welt im großen und ganzen zutreffend ab. Sein Argument für diese These lautet: Daß ein Meinungssystem bei ständigem Beobachtungsinput über einen längeren Zeitraum hinweg kohärent und stabil bleibt, ist erklärungsbedürftig, und: The best explanation, the likeliest to be true, for a system of beliefs remaining coherent (and stable) over the long run while continuing to satisfy the Observation Requirement is that (a) the cognitively spontaneous beliefs which are claimed, within the system, to be reliable are systematically caused by the sorts of situations which are depicted by their content, and (b) the entire system of beliefs corresponds, within a reasonable degree of approximation, to the independent reality which it purports to describe [...]. (Bonjour 1985: 171)

In der Ästhetik vertritt Gregory Currie (1989) die These, daß es sich bei Kunstwerken ontologisch um Handlungstypen (action types) handelt: Jedes Kunstwerk - auch ein Bild oder eine Skulptur - ist ein abstrakter Gegenstand, der viele verschiedene konkrete Instantiierungen haben kann. Diese Auffassung der Ontologie von Kunstwerken stellt seiner Ansicht nach die beste Erklärung für zahlreiche Aspekte ästhetischer Wertschätzung dar: The strategy of the book is to clarify important aspects of aesthetic appreciation and then to devise an ontology which economically explains those aspects. Thus we arrive at the nature of works [of art] by inference to the best explanation from their effects. (Currie 1989: Abstract, Philosopher's Index)

In der wissenschaftstheoretischen Debatte um den Naturgesetzbegriff vertritt David Armstrong (1983) die These, daß Naturgesetze nicht lediglich kontingente Regularitäten beschreiben, sondern auf tiefer liegende, notwendige Verknüpfungen zwischen Universalien verwei-

4

Einleitung

sen, die die beobachteten Regularitäten überhaupt erst hervorrufen. Diese These begründet er folgendermaßen: Daß wir Uberhaupt Regularitäten beobachten, ist erklärungsbedürftig; die beste Erklärung hierfür besteht in der Annahme von Naturgesetzen im Sinne von notwendigen Verknüpfungen zwischen Universalien, die die beobachteten Regularitäten hervorrufen - daher existieren solche Naturgesetze: The sort of observational evidence which we have makes it rational to postulate laws which underly, and are in some sense distinct from, the observational evidence. The inference to the laws is a case of inference to the best explanation. (Armstrong 1983: 52; Hervorhebung des Autors)

Insofern Armstrong mit diesem Argument auch die Existenz von Universalien nachweisen will, ist sein Argument weiterhin ein Beispiel für die Verwendung des Schlusses auf die beste Erklärung in der Metaphysik (vgl. hierzu auch Armstrong 1978, 1992). Innerhalb dieser Disziplin lassen sich zahlreiche weitere Beispiele für Schlüsse auf die beste Erklärung finden. So argumentiert beispielsweise Chris Swoyer in verschiedenen Veröffentlichungen für die Existenz von Eigenschaften, indem er darauf hinweist, daß zahlreiche philosophische Phänomene mit Hilfe einer Ontologie von Eigenschaften am besten erklärt werden können: Why should we believe in the existence of properties? [...] I have argued that many of the best arguments for the existence of properties, both traditional and contemporary, are most plausibly construed as inferences to the best explanation [...]. [...] Throughout much of the history of philosophy, properties have been invoked to explain phenomena in epistemology, metaphysics, and the philosophy of language. (Swoyer 1996: 247; H. d. A.)2

Insbesondere in der Religionsphilosophie erfreut sich der Schluß auf die beste Erklärung großer Beliebtheit. So argumentiert beispielsweise Pearl (1988), daß es, falls es Wunder gibt, auch einen Gott geben müs2

Vgl. hierzu auch Swoyer (1983). In einem späteren Artikel geht Swoyer (1999: 101) sogar so weit zu behaupten, ohne den Schluß auf die beste Erklärung sei Metaphysik unmöglich: „[...] if inference to the best explanation isn't possible in ontology, ontology isn't possible either." (Swoyer verwendet „ontology" und „metaphysics" in diesem Artikel synonym; vgl. die der zitierten Textstelle unmittelbar folgende Fußnote.) Für eine weitere Verwendung des Schlusses auf die beste Erklärung innerhalb der Metaphysik vgl. etwa Balashov (1999).

0.1

Schlüsse auf die beste Erklärung

5

se, da die beste Erklärung für das Auftreten von Wundern die Existenz eines göttlichen Wesens beinhalte. Johnson (1993) und Mixie (1994) versuchen, den teleologischen Gottesbeweis zu einem Schluß auf die beste Erklärung umzuformulieren mit der Absicht, auf diese Weise die Existenz Gottes zu begründen. Und Clark (1992) versucht, mit Hilfe des Schlusses auf die beste Erklärung die These göttlicher Unempfindlichkeit (divine impassibility) zu verteidigen, nach der Gott durch die Geschehnisse in der Welt nicht affiziert wird. 3 Diese Liste von Beispielen für Versuche, bestimmte philosophische Theorien mit Hilfe des Schlusses auf die beste Erklärung zu begründen, ließe sich leicht verlängern. Darüber hinaus wird der Schluß auf die beste Erklärung innerhalb der Philosophie von einigen Autoren auch verwendet, um klassische philosophische Probleme zu lösen. Hierzu gehören insbesondere das von Hume aufgeworfene traditionelle Induktionsproblem, das Problem des Skeptizismus in bezug auf die Außenwelt und das Problem des Fremdpsychischen. Was das letztgenannte Problem betrifft, so argumentiert beispielsweise Robert Pargetter (1984) für die Existenz von mentalen Zuständen anderer Personen, indem er darauf verweist, daß diese Annahme die beste Erklärung ihres Verhaltens darstelle. Er erläutert dies am Beispiel eines Mannes, der eine tiefe Schnittwunde an der Hand hat, stark blutet, seine Hand mit der anderen fest zusammendrückt, blaß und angespannt aussieht, Sätze äußert wie „Meine Hand tut weh. Ich habe Schmerzen." und darüber hinaus seufzt und stöhnt. Pargetter behauptet zunächst, die beste Erklärung für diese Beobachtungen bestünde in der Annahme, der Mann habe Schmerzen und diese Schmerzen seien denjenigen ähnlich, die er selbst unter ähnlichen Umständen habe. Er fährt dann fort: Now if I am right in thinking that this is clearly the best explanation I have available at the present time, and it is clearly a very good explanation, then I am certainly justified in strongly believing that the man I am observing is in pain, and that his pain is qualitatively similar to the pains I experience. (Pargetter 1984: 159)

Im Hinblick auf das Problem des Skeptizismus bezüglich der Existenz der Außenwelt greift beispielsweise Paul Moser (1989) auf einen 3

Für weitere Verwendungen des Schlusses auf die beste Erklärung innerhalb der Religionsphilosophie vgl. etwa Clayton (1997) und Peacocke (2000).

6

Einleitung

Schluß auf die beste Erklärung zurück, wenn er gegen skeptische Hypothesen und für die Existenz von physikalischen Gegenständen argumentiert, indem er darauf hinweist, daß diese Annahme die beste Erklärung für die Gehalte seiner Wahrnehmungen darstelle: When compared with the foregoing sceptical explanations, the following realist hypothesis provides a physical-object explanation that satisfies the conditions for a decisively better explanation: Realist Hypothesis: My subjective contents consisting of an apparent blue book are best explained by the physical-object proposition that there is a blue book here. I shall argue that the physical-object explanation provided by this Realist Hypothesis is decisively superior to the foregoing skeptical explanations. This argument will forcefully challenge any version of justification skepticism involving those explanations. (Moser 1989: 161; H. d. A.)4

Was schließlich das traditionelle Induktionsproblem betrifft, so argumentiert Harman (1965), daß enumerativ-induktive Schlüsse als solche nicht als gerechtfertigt gelten können, sondern diesen Status nur dann erwerben, wenn sie als Schlüsse auf die beste Erklärung beschreibbar sind. Enumerativ-induktive Schlüsse, wie Harman sie versteht, sind Schlüsse der folgenden Form: „Alle bisher beobachteten Fälle von A waren auch Fälle von B. Also werden auch in Zukunft alle Α-Fälle gleichfalls B-Fälle sein." Ein Aspekt des tradtionellen Induktionsproblems besteht darin, eine Begründung für die Verwendung des „also" in Schlüssen dieser Art zu liefern und Gründe für die Annahme anzugeben, daß solche Schlüsse von einer wahren Prämisse wahrscheinlich zu einer wahren Konklusion führen. Harmans Vorschlag zur Lösung dieses Problems besteht nun darin zu fragen, was denn wohl die beste Erklärung für den Umstand darstelle, daß bisher alle beobachteten Α-Fälle auch B-Fälle waren. In einigen Fällen wird die beste Erklärung hierfür seiner Ansicht nach darin bestehen, daß alle Α-Fälle auch B-Fälle sind. Und in diesen Fällen ist der betreffende enumerativ-induktive Schluß gerechtfertigt, in anderen nicht:

4

Vogel (1990) argumentiert in ähnlicher Weise gegen den Skeptiker. Er ist darüber hinaus der Ansicht, daß diese Strategie völlig allgemein anwendbar ist: „In cases of underdetermination generally, principles of inference to the best explanation can license the choice of one theory over others." (Vogel 1990: 658).

0.2

Zur Rechtfertigung des Schlusses auf die beste Erklärung

7

If [...] we think of the inference as an inference to the best explanation, we can explain when a person is and when he is not warranted in making the inference from "All observed A's are B's" to "All A's are B's." The answer is that one is warranted in making this inference whenever the hypothesis that all A's are B's is (in the light of all the evidence) a better, simpler, more plausible (and so forth) hypothesis than is the hypothesis, say, that someone is biasing the observed sample in order to make us think that all A's are B's. (Harman 1965: 90 f.) 5 Auch diese Reihe von Beispielen, bei denen der Schluß auf die beste Erklärung verwendet wird, um klassische philosophische Probleme zu lösen, ließe sich leicht fortsetzen.

0.2

Zur Rechtfertigung des Schlusses auf die beste Erklärung

Die gerade dargestellten philosophischen Verwendungen des Schlusses auf die beste Erklärung ebenso wie dessen Anwendung in Alltagsund einzelwissenschaftlichen Kontexten setzen natürlich die Annahme voraus, daß es sich bei dem Schluß auf die beste Erklärung um ein gerechtfertigtes Schlußmuster handelt. Wer für die Wahrheit einer Hypothese argumentiert, indem er darauf hinweist, daß sie die beste Erklärung gewisser beobachteter Phänomene darstellt, geht offensichtlich davon aus, daß diese Eigenschaft einer Hypothese für ihre Wahrheit und nicht etwa für ihre Falschheit spricht. Anders ausgedrückt: Wer einen Schluß auf die beste Erklärung zieht, vertritt, implizit oder explizit, die folgende These - die ich als „Verläßlichkeitsthese" bezeichnen will, um mich im folgenden kurz auf sie beziehen zu können:

5

Dieser Strategie zur .Lösung' des traditionellen Induktionsproblems hat sich in jüngerer Zeit auch Laurence Bonjour in seinem Buch In Defense of Pure Reason: A Rationalist Account of A Priori Justification (1998) bedient: „What sort of an a priori reason might be offered, then, for thinking that a standard inductive conclusion is likely to be true when such a standard inductive premise is true? The intuitive idea behind the reason to be suggested here is that an objective regularity of a sort that would make the conclusion of a standard inductive argument true provides the best explanation for the truth of the premise of such an argument." (Bonjour 1998: 207; H. d. Α.).

8

Einleitung

(0.1)

Die Verläßlichkeitsthese Der Schluß auf die beste Erklärung ist ein verläßlicher Schluß: Er führt von wahren Prämissen wahrscheinlich zu einer wahren Konklusion.

Die Annahme, es handle sich bei dem Schluß auf die beste Erklärung um ein in diesem Sinne verläßliches Schlußmuster, kann zunächst eine gewisse intuitive Plausibilität für sich verbuchen. Wie die beschriebenen Beispiele zeigen, ziehen wir sowohl im Alltag als auch in den Einzelwissenschaften und insbesondere in der Philosophie häufig Schlüsse auf die beste Erklärung. Und es scheint nur natürlich anzunehmen, daß wir diese Schlüsse gerechtfertigt ziehen und Grund zu der Annahme haben, solche Schlüsse führten uns von wahren Prämissen wahrscheinlich zu einer wahren Konklusion. In der Tat halten viele Autoren die Verläßlichkeitsthese für so selbstverständlich, daß sie wenig oder gar keine Mühe auf ihre Begründung verwenden. So schreibt etwa Robert Pargetter unmittelbar im Anschluß an die oben wiedergegebene Textstelle: I am justified in believing this because it is rational to believe an hypothesis if it is the best available explanation of the evidence. (Pargetter 1984: 159)

- und damit endet sein Argument für die Verläßlichkeit des Schlusses auf die beste Erklärung. Der ebenfalls zitierte David Armstrong begründet seine Verwendung des Schlusses auf die beste Erklärung folgendermaßen: To infer to the best explanation is part of what it is to be rational. If that is not rational, what is? (Armstrong 1983: 59)

Andere Autoren scheinen sich der Verwendung des Schlusses auf die beste Erklärung in ihren Argumentationen nicht einmal bewußt zu sein. Sie erwähnen lediglich, daß nach ihrer Auffassung eine bestimmte Hypothese die beste Erklärung gewisser Phänomene darstelle, und überlassen es dem Leser zu erschließen, daß diese Bemerkung als ein Argument für die Wahrheit der Hypothese verstanden werden soll.6

Diese Tendenz ist natürlich insbesondere im Alltag und in den Einzelwissenschaften ausgeprägt, dort aber auch nicht weiter zu beanstanden. Eine Ausnahme stellt, was die Einzelwissenschaften betrifft, der erwähnte Darwin dar, wenn

0.2 Zur Rechtfertigung des Schlusses auf die beste Erklärung Es ist allerdings offensichtlich, daß diese knappen Hinweise auf die vermeintliche Rationalität des Schlusses auf die beste Erklärung für dessen Rechtfertigung bzw. für eine Begründung der Verläßlichkeitsthese nicht ausreichen. Denn in der in (0.1) formulierten Verläßlichkeitsthese wird ein Zusammenhang behauptet, der keineswegs selbstverständlich ist und erst eines Nachweises bedarf - der Zusammenhang nämlich zwischen dem Umstand, daß eine gegebene Hypothese die beste Erklärung eines Phänomens darstellt, und der Wahrheit dieser Hypothese. Warum sollte gerade die beste Erklärung eines gegebenen Phänomens wahrscheinlich wahr sein? Warum nicht vielmehr die schlechteste Erklärung des Phänomens oder eine mittelmäßige? Warum sollte weiterhin ein uniformer Zusammenhang bestehen zwischen der Wahrheit einer Hypothese und ihrer Eigenschaft, die beste Erklärung eines bestimmten Phänomens zu sein? Warum sollte nicht statt dessen für einige Phänomene eine schlechte Erklärung wahr sein, für andere eine mittelmäßige und für manche die beste? Mit anderen Worten: Welche Gründe sprechen dafür, daß zwischen der explanatorischen Kraft einer Hypothese und ihrer Wahrheit ein uniformer und positiver Zusammenhang besteht? Diese Überlegungen zeigen, daß die Beweislast auf der Seite der Befürworter des Schlusses auf die beste Erklärung liegt. Sie müssen Gründe für die in (0.1) formulierte Verläßlichkeitsthese vorbringen und damit nachweisen, daß der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. In dieser Arbeit werde ich dafür argumentieren, daß diese Aufgabe alles andere als leicht zu bewältigen ist, daß die anfängliche Plausibilität des Schlusses auf die beste Erklärung sich bei näherer Untersuchung nicht durch Argumente untermauern läßt und daß daher die Hoffnungen, die viele Autoren in den Schluß auf die beste Erklärung setzen, in weiten Teilen überzogen sind. Es wird sich im Verlauf dieser Arbeit zum einen zeigen, daß die wenigen Argumente, die für die Verläßlichkeit des Schlusses auf die beste Erklärung in der Literatur vorgebracht werden, auf äußerst wackligen Beinen stehen, und zum

er folgendes .Argument' für den Schluß auf die beste Erklärung anbietet: „It has recently been objected that this is an unsafe method of arguing; but it is a method used in judging of the common events of life, and has often been used by the greatest natural philosophers." (Darwin 1962:476).

9

10

Einleitung

anderen, daß bereits seine Grundlagen alles andere als solide sind. Im verbleibenden Teil dieser Einleitung werde ich andeuten, wie diese Behauptungen zu verstehen sind und in welchen Teilen der Arbeit sie durch Argumente gestützt werden. Ich beginne im nächsten Abschnitt damit, zunächst zu präzisieren, was ich in dieser Arbeit unter dem Schluß auf die beste Erklärung verstehen will.

0.3

Präzisierung der Redeweise vom Schluß auf die beste Erklärung

Die zu Anfang dieser Einleitung diskutierten Beispiele für Schlüsse auf die beste Erklärung hatte ich informell folgendermaßen beschrieben: Bei einem Schluß auf die beste Erklärung liegen bestimmte erklärungsbedürftige Phänomene vor; eine bestimmte Hypothese wird als die beste Erklärung dieser Phänomene angesehen; und auf diese Hypothese wird geschlossen. Diese Charakterisierung legt folgendes Schlußschema für den Schluß auf die beste Erklärung nahe: (0.2) Der Schluß auf die beste Erklärung - Schlußschema Prämisse Pj: Prämisse P2:

...

^

beobachtete, zu erklärende Phänomene

Prämisse P„: Prämisse P„+i: Hypothese E* stellt die beste Erklärung der in den Prämissen Pi bis P„ beschriebenen Phänomene dar. — [r] Konklusion: E* Die Prämissen P, bis P„ beziehen sich auf beobachtete und zu erklärende Phänomene; Prämisse Pn+i sagt aus, daß Hypothese E* diese Phänomene am besten erklärt; und E* selbst stellt die Konklusion des Schlusses dar. Beispielsweise würden im zweiten der eingangs dargestellten Schlüsse die Prämissen Pi bis Pn bestimmte Indizien gegen

0.3 Präzisierung der Redeweise vom Schluß auf die beste Erklärung 11 den Angeklagten wiedergeben: Prämisse Pi könnte etwa besagen, daß der Angeklagte zur Tatzeit am Tatort gesehen wurde, Prämisse P2, daß er ein Motiv für den Mord hatte, usw. Prämisse Pn+i würde in diesem Fall etwa lauten: „Die Hypothese, daß der Angeklagte der Täter ist, stellt die beste Erklärung der vorliegenden Indizien dar." Und die Konklusion E* könnte heißen: „Der Angeklagte ist der Täter." Der Doppelstrich, der in Schema (0.2) die Prämissen von der Konklusion trennt, soll andeuten, daß es sich bei dem dargestellten Schlußschema um ein induktives und nicht um ein deduktives Schlußschema handelt. Wie die diskutierten Beispiele zeigen, folgt bei einem Schluß auf die beste Erklärung die Konklusion nicht mit Notwendigkeit aus den Prämissen: Es ist möglich, daß alle Prämissen eines Schlusses auf die beste Erklärung wahr sind, die Konklusion des Schlusses aber dennoch falsch. Es ist beispielsweise möglich, daß tatsächlich alle genannten Indizien gegen den Angeklagten vorliegen und seine Täterschaft wirklich die beste Erklärung all dieser Indizien darstellt (die Prämissen Pi bis P„+i sind ausnahmslos wahr), daß er aber dennoch nicht der Täter ist (die Konklusion ist falsch). Die Prämissen eines Schlusses auf die beste Erklärung verleihen seiner Konklusion vielmehr lediglich eine gewisse induktive Wahrscheinlichkeit, wobei die in eckigen Klammern notierte Variable r das Maß dieser induktiven Wahrscheinlichkeit angibt, d. h. den Grad der Stärke des induktiven Schlusses. Wer einen Schluß auf die beste Erklärung zur Begründung seiner Position verwendet, geht hierbei offensichtlich davon aus, daß diese induktive Wahrscheinlichkeit hoch ist, d. h. daß r nahe bei 1 liegt (zumindest aber größer als 0,5 ist). Würde der Staatsanwalt beispielsweise hiervon nicht ausgehen, bliebe unklar, warum er in seinem Plädoyer auf die vorliegenden Indizien hinweist und die Behauptung aufstellt, die beste Erklärung für das Vorliegen all dieser Indizien bestehe in der Täterschaft des Angeklagten. Wie das Schema zeigt, handelt es sich bei einem Schluß auf die beste Erklärung nicht - wie man aufgrund seines Namens vielleicht zunächst vermuten könnte - um einen Schluß, dessen Konklusion lautet: „E* ist die beste Erklärung der Phänomene." Bei einem Schluß auf die beste Erklärung wird also nicht darauf geschlossen, daß eine bestimmte Hypothese E* die beste Erklärung gewisser beobachteter und erklärungsbedürftiger Phänomene darstellt - daß E* die beste Erklärung der betreffenden Phänomene ist, wird im Gegenteil bei einem solchen

12

Einleitung

Schluß vorausgesetzt: Diese Annahme geht in die Prämissen des Schlusses ein - sie stellt nämlich Prämisse Pn+I des Schlusses dar. Ausgehend von dieser und den übrigen Annahmen wird dann auf die wahrscheinliche Wahrheit von E* geschlossen. Diese Redeweise vom .Schließen auf die wahrscheinliche Wahrheit von E*' darf man allerdings nicht so verstehen, daß die Konklusion eines Schlusses auf die beste Erklärung etwa lautete: ist wahrscheinlich." Der Wahrscheinlichkeitsbegriff gehört keineswegs zur Konklusion eines Schlusses auf die beste Erklärung. Daß dies so ist, kann man sich am besten durch einen Vergleich mit einem deduktiv gültigen Schluß verdeutlichen: „Wenn Peter Schreiner ist, dann ist Peter Handwerker. Peter ist Schreiner. - Also ist Peter Handwerker." Die Konklusion lautet hier nicht: „Peter ist notwendigerweise Handwerker." Peter ist selbstverständlich kontingenterweise Handwerker - er hätte genausogut Lehrer werden können. Der Begriff der Notwendigkeit ist hier vielmehr sozusagen ein Bestandteil des Schlusses: Es gilt notwendigerweise, daß die Konklusion des Schlusses wahr ist, wenn seine Prämissen wahr sind. In analoger Weise ist der Wahrscheinlichkeitsbegriff bei einem Schluß auf die beste Erklärung - wie bei allen induktiven Schlüssen - ein Bestandteil des Schlusses und nicht der Konklusion: Wenn die Prämissen eines Schlusses auf die beste Erklärung wahr sind, so ist es - nach Ansicht seiner Befürworter - wahrscheinlich, daß auch seine Konklusion wahr ist.7

7

Einige Autoren beschreiben den Schluß auf die beste Erklärung - unter Rekurs auf Charles S. Peirce und dessen sog. Methode der Abduktion - als eine dritte unabhängige Form des Schließens, die zu induktivem und deduktiv gültigem Schließen hinzutritt. Diese Einschätzung ist allerdings bei obiger Rekonstruktion des Schlusses auf die beste Erklärung nicht angemessen. Der Schluß auf die beste Erklärung ist keineswegs eine eigenständige Form des Schließens, sondern stellt vielmehr einen der vielen Typen induktiver Schlüsse dar, zu denen neben den bereits erwähnten enumerativ-induktiven Schlüssen beispielsweise noch Analogieschlüsse und Schlüsse aus der Autorität gehören. Vgl. hierau auch Kapitan (1992) und Hintikka (1998), die beide dafür argumentieren, daß Peirces Methode der Abduktion nicht mit dem Schluß auf die beste Erklärung identifiziert werden kann.

0.4

0.4

Erklärungen

13

Erklärungen

Vor dem Hintergrund der bisherigen Erläuterungen dürfte es unmittelbar einleuchten, daß die vermeintliche Eigenschaft des Schlusses auf die beste Erklärung, von wahren Prämissen wahrscheinlich zu einer wahren Konklusion zu führen, irgend etwas mit dem Begriff der Erklärung zu tun haben muß. Schließlich wird bei einem Schluß auf die beste Erklärung ja deswegen auf eine bestimmte Hypothese E* geschlossen, weil diese die beste Erklärung bestimmter vorliegender Phänomene darstellt. Aus diesem Grund stellt sich vor jeder Anwendung des Schlusses auf die beste Erklärung zunächst einmal die Frage, worum es sich bei einer Erklärung eines Phänomens eigentlich handeln soll. Es scheint eine vernünftige Forderung an Befürworter des Schlusses auf die beste Erklärung zu sein, daß sie ihren Schlüssen ein Erklärungsmodell zugrunde legen, auf dessen Basis sie erstens beurteilen, was überhaupt als Erklärung eines Phänomens in Frage kommt, und zweitens entscheiden, welche von verschiedenen, miteinander konkurrierenden Erklärungen die beste Erklärung des betreffenden Phänomens darstellt. Mit anderen Worten: Sie sollten eine Theorie angeben, die insbesondere die folgenden beiden Fragen beantwortet: (0.3) Zwei Grundfragen einer Theorie der Erklärung (I)

Was ist eine Erklärung? - Was unterscheidet Hypothesen, die Erklärungen von Phänomenen darstellen, von Hypothesen, bei denen dies nicht der Fall ist? (II) Was macht eine Erklärung zur besten Erklärung? - Anhand welcher Kriterien wird beurteilt, welche von einer Menge von gegebenen Erklärungen eines Phänomens die beste Erklärung dieses Phänomens darstellt? Die übliche Redeweise vom Schluß auf die beste Erklärung legt nahe, daß es für gegebene Phänomene im allgemeinen mehrere Erklärungen gibt. Einige dieser Erklärungen sind gute Erklärungen der Phänomene, andere sind schlechte. Insbesondere gibt es unter den verschiedenen Erklärungen eine bestimmte Erklärung, die besser ist als alle anderen - die beste Erklärung der Phänomene. Auf sie, und nicht auf die anderen Erklärungen, wird geschlossen. Sie wird für wahrscheinlich wahr gehalten, eben weil sie die beste Erklärung der Phänomene darstellt.

14

Einleitung

Ein Erklärungsmodell, das dieser Redeweise vom Schluß auf die beste Erklärung gerecht werden will, darf Frage (I) nicht in einer Weise beantworten, die den Wahrheitsbegriff in den Erklärungsbegriff einbaut - d. h„ es darf die Wahrheit einer Hypothese H nicht zu einer notwendigen Bedingung dafür machen, daß H eine Erklärung der betreffenden Phänomene darstellt. Denn bei dieser Konzeption bliebe zum einen unklar, warum man für die Wahrheit einer Hypothese fy und gegen die Wahrheit anderer Hypothesen H2, H 3 ,..., H„ argumentieren können soll, indem man darauf hinweist, daß H, eine bessere Erklärung der Phänomene darstellt als H2, H 3 ,..., und H„. Wenn man auf Hi, nicht aber auf eine der anderen Erklärungen schließt, dann wohl deswegen, weil man H] für wahr, die anderen Erklärungen aber für falsch hält. Wenn der Wahrheitsbegriff allerdings ein notwendiger Bestandteil des Erklärungsbegriffs ist, dann sind auch die schlechteren Erklärungen H2, H 3 ,..., und Hn wahr. Zum anderen würden bei dieser Konzeption des Erklärungsbegriffs Schlüsse auf die beste Erklärung notwendigerweise von wahren Prämissen zu einer wahren Konklusion führen: Denn ist Prämisse Pn+i wahr, so ist Hypothese E* die beste Erklärung der betreffenden Phänomene; mithin ist E* eine Erklärung der Phänomene; und daher ist E*, d. h. die Konklusion des Schlusses, wahr. Dann würde es sich aber bei dem Schluß auf die beste Erklärung nicht um ein induktives, sondern um einen deduktives Schlußmuster handeln.8

g Die Idee, Wahrheit zu einem notwendigen Bestandteil des Erklärungsbegriffs zu machen, mag zunächst naheliegend sein. Was eine wirkliche Erklärung von einer nur scheinbaren Erklärung unterscheidet, ist - so könnte man sagen eben insbesondere, daß erstere wahr, letztere aber falsch ist. Diese Einschätzung scheint durch die Eigentümlichkeit von Aussagen wie der folgenden weiter gestützt zu werden: „Ja, Hypothese H erklärt die Phänomene, aber H ist nicht wahr." Diese Aussage scheint in sich widersprüchlich und nahezulegen, daß es falsche Erklärungen nicht geben kann: Wenn H die Phänomene wirklich erklärt, dann muß H auch wahr sein. Wie wenig der Hinweis auf Aussagen dieser Art und die sie begleitenden Intuitionen aber letztlich leistet, kann man ersehen, wenn man zum Kontrast beispielsweise die folgende Aussage betrachtet: „Ja, Hypothese H erklärt die Phänomene zwar ganz gut, aber H ist trotzdem nicht wahr." Diese Aussage impliziert im Gegenteil, daß eine Hypothese eine Erklärung bestimmter zu erklärender Phänomene darstellen kann, ohne daß sie wahr ist.

0.4

Erklärungen

15

Ein für die Zwecke des Schlusses auf die beste Erklärung akzeptables Erklärungsmodell muß also bei der Beantwortung von Frage (I) die Existenz von falschen Erklärungen zulassen. Weiterhin darf ein Erklärungsmodell, das als Basis für den Schluß auf die beste Erklärung dienen können soll, auch Frage (II) nicht in einer Weise beantworten, die den Wahrheitsbegriff zu einem Bestandteil des Begriffs der besten Erklärung macht. Es muß im Gegenteil zulassen, daß es Erklärungen gibt, die - obwohl sie die beste Erklärung der betreffenden Phänomene darstellen - dennoch falsch sind. Denn ansonsten würden Schlüsse auf die beste Erklärung wiederum notwendigerweise von wahren Prämissen zu einer wahren Konklusion führen, und bei dem Schluß auf die beste Erklärung handelte es sich erneut um ein deduktives Schlußmuster. In der Wissenschaftstheorie der letzten 50 Jahre sind verschiedene Modelle zur Explikation des Erklärungsbegriffs entwickelt worden. Im ersten Teil dieser Arbeit - den Kapiteln 1 bis 3 - werde ich versuchen zu zeigen, daß die drei einflußreichsten dieser Modelle sich nicht als Basis für den Schluß auf die beste Erklärung eignen. In Kapitel 1 werde ich mich zunächst mit dem sog. covering /aw-Modell wissenschaftlicher Erklärung beschäftigen, mit dem die zeitgenössische Debatte um den Erklärungsbegriff begann. Dieses Modell stellte etwa 25 Jahre lang eine der wenigen Erfolgsgeschichten innerhalb der Wissenschaftstheorie dar und wurde in weiten Kreisen als eine bis auf wenige Details adäquate Theorie des Erklärunsgbegriffs angesehen. Diese Details erwiesen sich jedoch im Laufe der Zeit als schwerwiegende Defekte des Modells und haben letztlich dazu geführt, daß das covering /ave-Modell zugunsten anderer Modelle in den Hintergrund getreten ist. Eines dieser Modelle, das in direkter Auseinandersetzung mit dem covering /aw-Modell entstand, ist das sog. Vereinheitlichungsmodell der Erklärung, das in verschiedenen Ausprägungen vorkommt - je nach der Art und Weise, wie der Vereinheitlichungsbegriff jeweils expliziert wird. Die zwei einflußreichsten Theorien innerhalb dieses Modells^- von Michael Friedman und Philip Kitcher - werde ich in Kapitel 2 dieser Arbeit diskutieren. Ein weiteres sehr einflußreiches Modell der Erklärung, das aus einem anderen Aspekt der Auseinandersetzung mit dem covering /aw-Modell hervorging, ist das sog. kausale Erklärungsmodell. Auch in diesem Modell konkurrieren verschiedene Theorien miteinander. Mit den zwei meiner Ansicht nach

16

Einleitung

wichtigsten - den Erklärungstheorien von David Lewis und Wesley Salmon - werde ich mich in Kapitel 3 beschäftigen. Diese drei Erklärungsmodelle haben bereits erhebliche Schwierigkeiten damit, eine akzeptable Antwort auf die in (0.3) formulierte Frage (I), d. h. eine angemessene Explikation des Erklärungsbegriffs zu liefern - unabhängig von der Frage ihrer möglichen Verwendung als Basis für den Schluß auf die beste Erklärung. Darüber hinaus treten je verschiedene Probleme auf, wenn diese Modelle im Hinblick auf den Schluß auf die beste Erklärung betrachtet werden. Insbesondere bieten die zu diskutierenden Modelle bzw. Theorien entweder gar keine befriedigende Antwort auf die in (0.3) formulierte Frage (II) an - so das covering /aw-Modell und das kausale Modell. Oder sie schlagen eine Lösung vor, bei der nicht einzusehen ist, warum Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen sollten - so das Vereinheitlichungsmodell. Diese Probleme der einschlägigen Erklärungsmodelle lassen bereits starke Zweifel an der ursprünglichen Plausibilität des Schlusses auf die beste Erklärung aufkommen. Denn solange kein akzeptables Erklärungsmodell zur Verfügung steht, das bei Anwendungen des Schlusses auf die beste Erklärung zugrunde gelegt werden kann, bleibt unklar, in welchem Sinne überhaupt Schlüsse auf die beste Erklärung gezogen werden.9 9 Ein weiteres einfluBreiches Erklärungsmodell, auf das ich in dieser Arbeit nicht eingehe, ist das sog. pragmatische Erklärungsmodell, wie es insbesondere von Bas van Fraassen (1980) vertreten wird. In diesem Modell wird bei der Explikation des Erklärungsbegriffs ein wesentlicher Bestandteil fallengelassen, der in jedem der in dieser Arbeit diskutierten Modelle enthalten ist - der Begriff der Objektivität. Im covering law-, im Vereinheitlichungs- und im kausalen Erklärungsmodell wird vorausgesetzt, daß es fUr zu erklärende Phänomene richtige, tatsächliche, wahre Erklärungen gibt, nach denen gesucht werden kann und soll. An die Stelle dieser Forderung tritt im pragmatischen Modell die Subjektivität einer Erklärung: Was als Erklärung eines Phänomens und was insbesondere als die beste Erklärung eines Phänomens gilt, hängt hier von vielen verschiedenen Faktoren ab - von der historischen Epoche, vom Kontext, von deijenigen Person, die nach einer Erklärung verlangt, von ihrer subjektiven Perspektive, ihrem Interesse, ihren Vorstellungen, ihrem Verständnis usw. Ian Hacking beschreibt diesen pragmatischen Erklärungsbegriff treffend folgendermaßen: „[...] the explanation of a phenomenon [is not] one of the ingredients of the universe, as if the Author of Nature had written down various things in the Book of the World - the entities, the phenomena, the quantities, the qualities,

0.5 Argumente für und gegen den Schluß auf die beste Erklärung

0.5

17

Argumente für und gegen den Schluß auf die beste Erklärung

Die durch die Untersuchung einschlägiger Erklärungsmodelle bereits geweckten Zweifel an der ursprünglichen Plausibilität des Schlusses auf die beste Erklärung werden noch verstärkt durch die Diskussion von Argumenten für und gegen den Schluß auf die beste Erklärung, die weitgehend unabhängig von einem zugrunde gelegten Erklärungsmodell sind. Hierauf werde ich im zweiten Teil dieser Arbeit eingehen. In Kapitel 4 werde ich zunächst die wenigen Argumente untersuchen, die in der Literatur ßr die Verläßlichkeit des Schlusses auf die beste Erklärung vorgebracht werden. Ich werde versuchen zu zeigen, daß diese wenig überzeugend sind und letztlich die Annahme nicht stützen können, der Schluß auf die beste Erklärung führe von wahren Prämissen wahrscheinlich zu einer wahren Konklusion. Befürworter des Schlusses auf die beste Erklärung können die Beweisschuld, die im Hinblick auf die Verläßlichkeitsthese auf ihren Schultern lastet, also nicht erbringen. Dieses Ergebnis würde im Grunde für eine skeptische Haltung dem Schluß auf die beste Erklärung gegenüber schon ausreichen. Die Skepsis im Hinblick auf dieses Schlußmuster wird weiter unterstützt durch Argumente, die einige Autoren gegen die Verläßlichkeitsthese vorbringen und mit denen sie versuchen zu zeigen, daß Schlüsse auf die beste Erklärung wahrscheinlich nicht von wahren Prämissen zu einer wahren Konklusion führen. Diese Arthe laws, the numerical constants, and also the explanations of events. Explanations are relative to human interests." (Hacking 1983: 53; H. d. Α.). Im pragmatischen Modell gibt es dementsprechend für ein und dasselbe zu erklärende Phänomen viele verschiedene, gleich legitime Erklärungen, die sich gegenseitig widersprechen können. Es ist offensichtlich, daß das pragmatische Erklärungsmodell aufgrund dieser Konzeption des Erklärungsbegriffs nicht als Basis für den Schluß auf die beste Erklärung in Frage kommt. Zwischen dem Begriff der besten Erklärung und dem Begriff der Wahrheit besteht im pragmatischen Erklärungsmodell keinerlei Zusammenhang. Die Behauptung, Erklärung E* sei die beste Erklärung eines Phänomens und daher wahrscheinlich wahr, ist im Rahmen dieses Modells sinnlos. Aus diesem Grund werde ich auf das pragmatische Erklärungsmodell in dieser Arbeit nicht eingehen. Dies bedeutet allerdings nicht, daß pragmatische Aspekte von Erklärungen hier Uberhaupt keine Rolle spielen würden. Insbesondere in Kapitel 3 werde ich auf diese Frage noch einmal zurückkommen.

18

Einleitung

gumente werden, bis auf eine Ausnahme, ebenfalls in Kapitel 4 diskutiert. In Kapitel 5 werde ich eines dieser Argumente gegen den Schluß auf die beste Erklärung gesondert untersuchen. Bas van Fraassen sucht in seinem Buch Laws and Symmetry (1989) nachzuweisen, daß die Annahme eines Zusammenhangs zwischen der explanatorischen Kraft und der Wahrheit einer Hypothese zu Problemen führt, wenn man sie in Verbindung mit Bayesianistischen Modellen der Bestätigung von wissenschaftlichen Hypothesen betrachtet. Van Fraassen diskutiert einen speziellen Fall der Untersuchung wissenschaftlicher Hypothesen, in dem seiner Ansicht nach die Antwort auf die Frage, welche von miteinander konkurrierenden Hypothesen mit welcher Wahrscheinlichkeit zu akzeptieren ist, allein auf der Basis der Bayesianistischen Erkenntnistheorie entschieden werden sollte. Wird zusätzlich die explanatorische Kraft der betreffenden Hypothesen berücksichtigt, führt dies nach seiner Auffassung zu einem inkonsistenten Meinungssystem. Dies stellt für van Fraassen einen eindeutigen Grund dar, den Schluß auf die beste Erklärung abzulehnen. Van Fraassens Argument hat in der Literatur einige Erwiderungen hervorgerufen. In Kapitel 5 werde ich dafür argumentieren, daß alle diese Versuche, van Fraassens Argument zu widerlegen, letztlich scheitern. Mit diesem Kapitel ist die Begründung meiner Hauptthese weitgehend abgeschlossen: Die anfängliche Plausibilität des Schlusses auf die beste Erklärung läßt sich bei genauerer Untersuchung nicht aufrechterhalten, und die großen Hoffnungen, die in weiten Teilen der Philosophie auf ihn gesetzt werden, sind größtenteils unbegründet. Zum einen existiert derzeit kein akzeptables Erklärungsmodell, das man als Basis für den Schluß auf die beste Erklärung verwenden könnte - so daß letztlich unklar bleibt, worum es sich bei einem Schluß auf die beste Erklärung überhaupt handeln soll. Zum anderen können keine guten Gründe für die Annahme vorgebracht werden, der Schluß auf die beste Erklärung führe von wahren Prämissen wahrscheinlich zu einer wahren Konklusion - so daß nicht einzusehen ist, warum Befürworter des Schlusses auf die beste Erklärung bei der Begründung ihrer jeweiligen Position auf ihn zurückgreifen können sollten. Nach der Untersuchung der Grundlagen des Schlusses auf die beste Erklärung in den Kapiteln 1 bis 3 und der allgemeinen Diskussion sei-

0.5

Argumente fu r und gegen den Schluß auf die beste Erklärung

19

ner Verläßlichkeit in den Kapiteln 4 und 5 erscheint es sinnvoll, eine konkrete Anwendung dieses Schlußmusters detailliert zu analysieren. Aus diesem Grund werde ich in Kapitel 6 die Verwendung des Schlusses auf die beste Erklärung in einer der wichtigsten Debatten der zeitgenössischen Wissenschaftstheorie untersuchen - der Realismus-Debatte um die Interpretation wissenschaftlicher Theorien. Wissenschaftliche Realisten vertreten in dieser Debatte die These, daß erfolgreiche wissenschaftliche Theorien (annähernd) wahr sind und daß die von ihnen postulierten unbeobachtbaren theoretischen Entitäten tatsächlich existieren.10 Realisten begründen diese These in der Regel mit dem Hinweis darauf, daß die Annahme der (annähernden) Wahrheit der betreffenden Theorien und der Existenz der von ihnen postulierten Entitäten die beste Erklärung für ihren Erfolg darstelle. Antirealisten bestreiten die These der Realisten zum einen dadurch, daß sie alternative Erklärungen für den Erfolg wissenschaftlicher Theorien anbieten und behaupten, diese Erklärungen seien genauso gut oder sogar besser als diejenigen der Realisten. Zum anderen greifen sie die Argumentation der Realisten aber auch dadurch an, daß sie die Legitimität des Schlusses auf die beste Erklärung in Zweifel ziehen. Realisten, die sich ihrer Verwendung des Schlusses auf die beste Erklärung in der Regel bewußt sind, versuchen dann zu erläutern, warum sie glauben, auf dieses Schlußmuster zurückgreifen zu dürfen. Die Diskussion um die Legitimität des Schlusses auf die beste Erklärung wird also in der Realismus-Debatte explizit geführt, und aus diesem Grund eignet sie sich besonders für eine Fallstudie. Bei der Diskussion der Rolle des Schlusses auf die beste Erklärung in dieser Debatte werden einige Aspekte, die bereits in den Kapiteln 1 bis 5 diskutiert wurden, nochmals aus einem anderen Blickwinkel beleuchtet. Andere, die nur gestreift wurden, werden an dieser Stelle ausführlich diskutiert. Insbesondere wird dieses Kapitel der Arbeit exemplarisch zeigen, wie wenig hilfreich der Schluß auf die beste Erklärung in philosophischen Debatten ist: Zum einen ist unklar, inwiefern und nach welchem Erklärungsmodell die von Realisten bevorzugte Erklärung des Erfolgs wissenschaftlicher Theorien die beste Erklärung 10

Dies ist eine vereinfachte Darstellung des wissenschaftlichen Realismus, der tatsächlich in vielen verschiedenen Ausprägungen vorkommt (vgl. hierzu etwa Leplin 1984: 1 f.).

20

Einleitung

dieses Phänomens darstellt; zum anderen baut ihre Argumentation auf dem Schluß auf die beste Erklärung auf, dessen Verläßlichkeit nach den Ergebnissen der vorigen Kapitel alles andere als gesichert ist.

0.6

Wahrheit und Rechtfertigung - einige kurze Erläuterungen

Bevor ich nun zur Durchführung des gerade geschilderten Projektes schreite, möchte ich in diesem Abschnitt noch einige kurze Bemerkungen zu zwei in dieser Einleitung häufig verwendeten, aber nicht explizierten Begriffen machen - ohne damit allerdings beanspruchen zu wollen, eine Explikation dieser Begriffe zu liefern. Die erste Bemerkung betrifft den in der Verläßlichkeitsthese auftretenden Wahrheitsbegriff. Diesen werde ich in dieser Arbeit im Sinne des gesunden Menschenverstandes interpretieren. Ich werde also annehmen, daß eine Aussage genau dann wahr ist, wenn die Welt in denjenigen Aspekten, von denen die Aussage handelt, so beschaffen ist, wie es die Aussage behauptet. Diese realistische Interpretation des Wahrheitsbegriffs scheint mir zum einen den Verwendungen des Schlusses auf die beste Erklärung in Alltagskontexten am besten zu entsprechen und zum anderen auch für Anwendungen in den Einzelwissenschaften außerhalb der Philosophie angemessen sein. Darüber hinaus deckt sie sich meiner Ansicht nach mit den Intentionen vieler Autoren, die Schlüsse auf die beste Erklärung innerhalb der Philosophie verwenden. Auf eine Diskussion der Frage, wie ein solcher Wahrheitsbegriff am besten zu explizieren und gegen die - in jedem Fall auftretenden - Einwände zu verteidigen wäre, möchte ich mich hier ebensowenig einlassen wie auf eine Debatte über die Frage, ob Aussagen die angemessenen Wahrheitswertträger sind. Beide Fragen scheinen mir keinen Einfluß auf die Diskussion um den Schluß auf die beste Erklärung zu haben." Diese common smse-Bestimmung will ich allerdings nicht so liberal verstanden wissen, daß durch sie jede Interpretation des Wahrheits11

Mit dieser Bestimmung des Wahrheitsbegriffs beabsichtige ich, mich auch neutral gegenüber der Frage zu verhalten, ob Wahrheit als relationales (insbesondere korrespondenztheoretisches) oder als nicht-relationales Prädikat (beispielsweise von Propositionen) zu analysieren ist.

0.6

Wahrheit und Rechtfertigung - einige kurze Erläuterungen

21

begriffs zugelassen wäre. Insbesondere will ich in dieser Arbeit antirealistische, d. h. pragmatische, epistemische und kohärentistische Explikationen des Wahrheitsbegriffs ausschließen, gegen die mir eine Reihe von gravierenden Einwänden zu sprechen scheinen. 12 Vor allem kann in solchen Theorien, vereinfacht ausgedrückt, kein angemessener Zusammenhang hergestellt werden zwischen der (wie auch immer explizierten) Eigenschaft einer Aussage, wahr zu sein, und der Beschaffenheit der Welt - d. h., Aussagen können unter diesen antirealistischen Interpretationen wahr sein, ohne daß die Welt sich so verhält, wie es ausgesagt wird. Der Schluß auf die beste Erklärung wird von seinen Befürwortern aber gerade so verstanden, daß wir mit seiner Hilfe Information Uber die Welt erlangen und etwas über diese erfahren können. Da bei Zugrundelegung einer antirealistischen Interpretation des Wahrheitsbegriffs diese Möglichkeit von vornherein in Frage steht, müssen solche Interpretationen bei einer Untersuchung der Verläßlichkeit des Schlusses auf die beste Erklärung, wie sie in dieser Arbeit zur Diskussion steht, ausgeschlossen werden. Die Wahl des Wahrheitsbegriffs ist dabei für die Beurteilung der Verläßlichkeit des Schlusses auf die beste Erklärung keineswegs irrelevant. Wenn man beispielsweise eine kohärentistische Interpretation des Wahrheitsbegriffs voraussetzt und annimmt, daß eine Aussage genau dann wahr ist, wenn sie zu einem maximal kohärenten System von Aussagen gehört; wenn ein Bestandteil der Kohärenz eines solchen Systems ist, daß die verschiedenen Aussagen durch Erklärungsbeziehungen miteinander verknüpft sind; und wenn die Kohärenz eines solchen Systems insbesondere um so größer ist, je besser bestimmte Aussagen dieses Systems andere Aussagen erklären - so werden zu einem maximal kohärenten Aussagensystem alle und nur die besten Erklärungen gehören. Eine Hypothese, die die beste Erklärung eines gegebenen, zu erklärenden Phänomens darstellt, wird in diesem Fall also zwangsläufig Bestandteil eines maximal kohärenten Systems von Aussagen und daher wahr sein. Die Verläßlichkeit des

12

Vgl. hierzu etwa Kirkham (1992: Kapitel 3) und Künne (1985: Abschnitt 3.3.6; 2000: Abschnitt IV).

22

Einleitung

Schlusses auf die beste Erklärung würde dann bereits aus dem verwendeten Wahrheitsbegriff folgen.13 Die zweite Bemerkung, die ich abschließend machen möchte, betrifft den Begriff der Rechtfertigung. Unter einer Rechtfertigung des Schlusses auf die beste Erklärung bzw. unter einer Begründung der Verläßlichkeitsthese soll in dieser Arbeit selbstverständlich erstens kein Nachweis der These verstanden werden, daß Schlüsse auf die beste Erklärung notwendigerweise von wahren Prämissen zu einer wahren Konklusion führen. Da es sich bei dem Schluß auf die beste Erklärung wie beschrieben um ein induktives und nicht um ein deduktives Schlußmuster handelt, kann ein solcher Nachweis gar nicht erbracht werden. Zu zeigen ist vielmehr, daß der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Zweitens wird von einer Rechtfertigung des Schlusses auf die beste Erklärung keine Gewißheit verlangt. Die Gründe, die für die Wahrheit der Verläßlichkeitsthese gesucht werden, müssen keineswegs sichere Gründe sein. Von einem Argument, das die Verwendung des Schlusses auf die beste Erklärung rechtfertigen soll, wird nicht gefordert, daß es etwa mittels einer logisch gültigen Deduktion die Verläßlichkeit des Schlusses auf die beste Erklärung aus ersten unbezweifelbaren Prinzipien herleite. Völlig ausreichend für eine Rechtfertigung des Schlusses auf die beste Erklärung bzw. für eine Begründung der Verläßlichkeitsthese ist die Angabe von guten Gründen für die Annahme, daß Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen. Diese Gründe müssen dabei allerdings von epistemischer Art sein: Es muß sich um Gründe handeln, die für die Wahrheit der Verläßlichkeitsthese sprechen und die uns in diesem Sinne einen Grund geben, die Verläßlichkeitsthese zu akzeptieren. Es darf sich nicht um pragmatische Gründe handeln: Ein Argument, das beispielsweise zeigen würde, daß wir die Verläßlichkeitsthese akzeptieren und den Schluß auf die beste Erklärung verwenden müssen, weil wir gar keine andere Wahl haben, trägt

13

Ich vermute, daß sich ähnliche Konsequenzen auch für andere antirealistische Interpretationen des Wahrheitsbegriffs aufzeigen lassen, kann allerdings an dieser Stelle nicht auf diese Frage eingehen. Auf die Bedeutung des vorausgesetzten Wahrheitsbegriffs fUr eine Beurteilung der Verläßlichkeit des Schlusses auf die beste Erklärung werde ich in Kapitel 2 noch einmal kurz zurückkommen.

0.6

Wahrheit und Rechtfertigung - einige kurze Erläuterungen

23

- so, wie der Begriff in dieser Arbeit verstanden werden soll - nicht zur Rechtfertigung des Schlusses auf die beste Erklärung bei.

Kapitel 1 Das covering Zaw-Modell der Erklärung 1.1

Einleitung

Das covering /aw-Modell der Erklärung bietet den bereits klassisch gewordenen Bezugspunkt für alle aktuellen Untersuchungen zum Erklärungsbegriff. Es wurde in einer Reihe von Veröffentlichungen im wesentlichen durch Carl G. Hempel während des dritten Viertels dieses Jahrhunderts entwickelt und dominierte während dieser Jahre die philosophische Diskussion um den Erklärungsbegriff. Seit Anfang der sechziger Jahre sah sich das Modell jedoch einer Reihe von Angriffen ausgesetzt, die zunächst zu seiner Weiterentwicklung, letztlich aber zu seiner Aufgabe und zur Entwicklung von alternativen Erklärungsmodellen geführt haben. Wesentliche Teile der Grundidee des covering Zaw-Modells leben allerdings in diesen neueren Modellen fort.1 Eine zentrale Eigenschaft von Erklärungen im covering tov-Modell besteht darin, daß es sich bei ihnen um Argumente handelt. Das zu erklärende Phänomen - das sog. Explanandum-Phänomen - wird dabei durch die Konklusion des jeweiligen Argumentes - den sog. Explanandum-Satz - wiedergegeben. Die Prämissen des Argumentes bilden 1

Vgl. Hempel/Oppenheim (1948) fllr den ersten Entwurf des covering Ζανν-Μοdells, der noch auf sog. deduktiv-nomologische Erklärungen beschränkt ist; Hempel (1962a) für die Erweiterung des Modells auf sog. induktiv-statistische Erklärungen; Hempel (1942, 1962b) für eine Diskussion des covering law-Modells im Hinblick auf historische Erklärungen; Hempel (1965a) für die ausfuhrlichste Darstellung des gesamten Modells, bei der außerdem sog. deduktiv-statistische Erklärungen eingeführt werden; Hempel (1966) fllr die Einordnung des covering /aw-Modells in Hempels allgemeine wissenschaftstheoretische Position; und Hempel (1977) für Hempels letzten Beitrag zum covering lawModell. Für eine ausführliche Diskussion der Charakteristika des Modells, seiner Entwicklung und Schwierigkeiten vgl. etwa StegmUller ( 2 1983) und Salmon (1989).

26

1

Das covering law-Modell der Erklärung

das sog. Explanans der Erklärung. Im Explanans treten zum einen Gesetze auf. Zum anderen können weitere Aussagen hinzukommen, die einzelne, spezielle Tatsachen (sog. Anfangs- oder Randbedingungen) beschreiben. Die verwendeten Gesetze, die für die Erklärung ,/tätig sind, d. h. deren Streichung das Argument ungültig machen würde" (Hempel 1977: 7; H. d. Α.), stellen dabei eine Verbindung her zwischen dem Explanandum-Phänomen und diesen speziellen Tatsachen - „wegen dieser Gesetze sind die im Explanans angeführten speziellen Tatsachen für das Explanandum-Phänomen erklärungsrelevant" (Hempel 1977: 7). Im Hinblick auf diese Charakterisierung von Erklärungen als Argumenten sind zwei verschiedene Verwendungsweisen des Ausdrucks „Erklärung" zu unterscheiden. Im covering Zaw-Modell wird im allgemeinen das gesamte Argument - einschließlich Explanans und Explanandum-Satz - als Erklärung] bezeichnet. Bei dieser Verwendungsweise ist es offensichtlich unsauber, von der Erklärung¡ eines Phänomens zu sprechen, da das zu erklärende Phänomen in der Form des Explanandum-Satzes selbst in dieser Erklärungi auftritt. Bei Hempel finden sich allerdings auch Stellen, in denen sinngemäß das in solchen Erklärungen ι auftretende Explanans als Erklärung 2 bezeichnet wird - nämlich als Erklärung 2 des Explanandum-Phänomens. Diese Mehrfachverwendung des Ausdrucks „Erklärung" mit verschiedenen Bedeutungen ist im Grunde unproblematisch, da im allgemeinen der Kontext hinreichend klarmacht, in welchem Sinne von „Erklärung" gesprochen wird. Allerdings wird dieser Umstand im weiteren Verlauf dieses Kapitels noch einmal von Bedeutung sein. Im folgenden werde ich aus Gründen der Übersichtlichkeit die etwas umständliche Unterscheidung und Indizierung der verschiedenen Verwendungsweisen von „Erklärung" nicht weiter durchführen. Ebenso werde ich gelegentlich dem Kontext die Unterscheidung zwischen „ExplanandumSatz" und „Explanandum-Phänomen" überlassen und den kürzeren Ausdruck „Explanandum" verwenden. Innerhalb des covering /aw-Modells werden drei Typen von Erklärungen unterschieden: deduktiv-nomologische, deduktiv-statistische und induktiv-statistische Erklärung. Die Unterscheidung betrifft dabei zwei Parameter: zum einen die Art der Gesetze, die bei einer Erklärung verwendet werden, und zum anderen die Art der argumentativen Beziehung zwischen dem Explanans und dem Explanandum-Satz (die

1.1

Einleitung

27

.Stärke' des Argumentes). In deduktiv-nomologischen Erklärungen sind die verwendeten Gesetze von universeller Art; in deduktiv-statistischen und induktiv-statistischen Erklärungen dagegen von statistischer Art. Bei Erklärungen des deduktiv-nomologischen und deduktiv-statistischen Typs handelt es sich um deduktiv gültige Argumente; bei induktiv-statistischen Erklärungen dagegen um induktiv starke Argumente, d. h. um Argumente, bei denen das Explanans dem Explanandum eine hohe induktive Wahrscheinlichkeit verleiht. Man spricht davon, daß covering Ζανν-Erklärungen das Explanandum-Phänomen unter ein im Explanans auftretendes .umfassendes Gesetz' (covering law) subsumieren. Eine covering Ζανν-Erklärung zeigt dabei, daß das Explanandum vor dem Hintergrund der im Explanans angeführten Information über Gesetze und Anfangs- oder Randbedingungen zu erwarten war. Genau hierin besteht die Erklärungsleistung einer covering /aw-Erklärung bezüglich des jeweiligen Explanandums, und in genau diesem Sinne führt eine covering Zaw-Erklärung zu Verständnis. Beispielsweise zeigt eine deduktiv-nomologische Erklärung laut Hempel, daß unter der Voraussetzung der besonderen Umstände und der fraglichen Gesetze das Auftreten des Phänomens zu erwarten war; und genau in diesem Sinne ermöglicht die Erklärung es uns, zu verstehen, warum das Phänomen eintrat [...]. (Hempel 1977: 6; H. d. A.)

Diese Charakterisierung für deduktiv-nomologische Erklärungen läßt sich analog auf deduktiv-statistische und induktiv-statistische Erklärungen übertragen. Den Ausdruck „covering Íaw-Modell" verwendet Hempel selbst unterschiedlich. Manchmal spricht er, wie in der Überschrift des vierten Kapitels von Hempel (1977), im Plural von den .„covering law'Modelle[n]" (Hempel 1977: 124) der Erklärung und meint damit das Modell der deduktiv-nomologischen, deduktiv-statistischen bzw. induktiv-statistischen Erklärung (zu dieser pluralischen Verwendungsweise vgl. auch Kapitel 7, erster Absatz). Zum anderen spricht er aber im fünften Absatz desselben Kapitels im Singular von dem .„covering law'-Modell wissenschaftlicher Erklärung" (Hempel 1977: 125), das offensichtlich die von mir als verschiedene Typen bezeichneten Erklärungen umfassen soll. Im folgenden werde ich den Ausdruck „covering /aw-Modell" nur im Singular verwenden und damit das von Hem-

1

28

Das covering law-Modell der Erklärung

pel entwickelte Modell meinen, das die drei erwähnten Typen von Erklärungen umfaßt. Auf Erklärungen dieser drei Typen werde ich mich mit dem Ausdruck „covering /aw-Erklärungen" beziehen.2 Im folgenden Abschnitt 1.2 werde ich nun zunächst die einzelnen, speziellen Charakteristika der drei Typen von covering tew-Erklärungen näher darstellen und dabei die gerade gegebenen allgemeinen Bestimmungen anhand von Beispielen erläutern. Im Anschluß hieran werde ich in Abschnitt 1.3 die wichtigsten der in der Literatur vorgebrachten Einwände gegen das covering /aw-Modell diskutieren, die sowohl allgemein die Grundkonzeption des Modells als auch speziell die einzelnen Typen von covering /aw-Erklärungen betreffen. In Abschnitt 1.4 werde ich schließlich auf die Frage eingehen, ob sich das covering /aw-Modell der Erklärung als Basis für den Schluß auf die beste Erklärung eignet, und dafür argumentieren, daß diese Frage mit „Nein." beantwortet werden muß.

1.2

Drei Typen von covering Zaw-Erklärungen 1.2.1

Deduktiv-nomologische Erklärungen

Deduktiv-nomologische Erklärungen (DN-Erklärungen) lassen sich durch das folgende Schema wiedergeben: (1.1)

Schema für DN-Erklärungen Explanans

S

Explanandum-Satz

Im obigen Schema stehen Αι, A2,..., A„ für Prämissen, die sich auf einzelne, spezielle Tatsachen - Anfangs- bzw. Randbedingungen beziehen, auf die in der Erklärung zurückgegriffen wird. Gi, G 2 , ..., G m stehen für Gesetze universellen Typs, die eine Verbindung zwi2

Die Ausdrücke „covering law" und „covering law model" Ubernimmt Hempel von Dray (1957, 1963) (vgl. Hempel 1977: 17, Fußnote 14).

1.2 Drei Typen von covering law-Erklärungen

29

sehen den Anfangs- bzw. Randbedingungen und dem zu erklärenden Phänomen herstellen, das durch den Explanandum-Satz S bezeichnet wird. Die betreffenden Gesetze sind dabei für dessen Ableitung nötig. Diese beiden Typen von Prämissen bilden zusammen das Explanans. Der einfache horizontale Strich, der das Explanans vom Explanandum-Satz S trennt, soll andeuten, daß es sich bei einer DN-Erklärung um ein deduktiv gültiges Argument handelt. 3 Alle Argumente, die Schema (1.1) genügen, sind potentielle DNErklärungen. Sind bei einer potentiellen DN-Erklärung die Prämissen, die das Explanans bilden, wahr (und somit auch die Konklusion), so spricht Hempel von einer wahren DN-Erklärung (vgl. Hempel 1977: 7). Weiterhin will Hempel eine potentielle DN-Erklärung „mehr oder weniger stark gestützt oder bestätigt nennen, wenn ihr Explanans durch die vorliegende Evidenz entsprechend mehr oder weniger stark bestätigt wird" (Hempel 1977: 7 f.; H. d. A.). 4 Mit Hilfe von DN-Erklärungen können zum einen einzelne, spezielle Tatsachen oder Ereignisse und zum anderen empirische Regularitäten universeller Art erklärt werden. Das folgende Argument, mit dem die Schwingungsdauer von etwa zwei Sekunden eines bestimmten mathematischen Pendels P) erklärt wird, ist ein einfaches Beispiel für eine DN-Erklärung der ersten Art:

3

Diese Grundidee des Hempelschen Modells von DN-Erklärungen - deduktive Subsumption des Explanandums unter umfassende Gesetze - taucht bereits wesentlich früher in der wissenschañstheoretischen Diskussion auf. So schreibt etwa Popper 1935: „Einen Vorgang .kausal erklären' heißt, einen Satz, der ihn beschreibt, aus Gesetzen und Randbedingungen deduktiv ableiten." (Popper 1994: 31; H. d. Α.). Eine ähnliche Formulierung findet sich bereits bei Mill (1843: Buch III, Kapitel 12, § 1). Hempel weist auf diese Vorläufer selbst hin; vgl. die Bemerkungen in Hempel/Oppenheim (1948: 140, Fußnote 4) und in Hempel (1977: 6 f., Fußnote 2). Es ist dabei zu beachten, daß der Ausdruck „wahr" hier von Hempel in einem übertragenen Sinn verwendet wird. Im allgemeinen findet der Ausdruck Anwendung auf Sätze, Äußerungen, Aussagen, Propositionen, Meinungen usw. diese können wahr (oder eben auch falsch) sein - und nicht auf Argumente. Hieraufkomme ich in Abschnitt 1.4 noch einmal zurück.

30

¡

(1.2)

Das covering law-Modell der Erklärung

Beispiel für eine DN-Erklärung einer einzelnen Tatsache G,: Länge 1 und Schwingungsdauer t eines mathematischen Pendels Ρ sind Uber die Gleichung t = 2π Λ l ~ miteinanmitei V s der verknüpft.

V

Explanans

Ai: Die Länge h des Pendels Pi beträgt 1 Meter. A 2 : g = 9,81 f r S:

Die Schwingungsdauer t] des Pendels Pi beträgt ungefähr zwei Sekunden.

J Expland.Satz

Die Prämissen A] und A 2 des Arguments beschreiben die vorliegenden Anfangs- oder Randbedingungen: die Länge 1) des betrachteten Pendels Pj und die Beschleunigung g, die es erfährt. Prämisse Gi beschreibt einen gesetzmäßigen, universellen Zusammenhang zwischen der Länge eines Pendels, seiner Schwingungsdauer und der Beschleunigung, die es erfährt. Diese Prämisse ist dabei für die Ableitung des Explanandums notwendig. Die Konklusion S des Argumentes gibt das zu erklärende Phänomen wieder. Ein weiteres Beispiel für eine DN-Erklärung einer einzelnen Tatsache stellt das in der Einleitung zu dieser Arbeit erwähnte Argument von Adams und Leverrier dar, mit dem diese das Abweichen des Planeten Uranus von seiner berechneten Umlaufbahn um die Sonne zu erklären versuchten. Auch bei dieser Erklärung wird im Explanans sowohl auf Gesetzesprämissen als auch auf Prämissen, die Anfangsoder Randbedingungen beschreiben, zurückgegriffen: Or take the celebrated explanation, propounded by Leverrier (and independently by Adams), of peculiar irregularities in the motion of the planet Uranus, which on the current Newtonian theory could not be accounted for by the gravitational attraction of the other planets then known. Leverrier conjectured that they resulted from the gravitational pull of an as yet undetected outer planet, and he computed the position, mass, and other characteristics which that planet would have to possess to account in quantitative detail for the observed irregularities. [...] Here again, the explanation has

1.2

Drei Typen von covering law-Erüärungen

31

the character of a deductive argument whose premisses include general laws - specifically, Newton's laws of gravitation and of motion - as well as statements specifying various quantitative particulars about the disturbing planet. (Hempel 1966: 52; meine Hervorhebung)

Die Ableitung der Uranusbahn aus den von Hempel erwähnten Prämissen ist natürlich erheblich komplizierter als die Herleitung der Periodendauer eines Pendels. Dementsprechend würde sich in diesem Fall eine deduktiv-nomologische Erklärung ergeben, die wesentlich umfangreicher und komplexer wäre als die in Beispiel (1.2) dargestellte. Neben einzelnen, speziellen Tatsachen oder Ereignissen können durch DN-Erklärungen wie erwähnt auch universelle

Regularitäten

erklärt werden. Für eine DN-Erklärung dieser Art nennt Hempel unter anderem das folgende Beispiel: [...] consider the explanation of a characteristic of image formation by reflection in a spherical mirror; namely, that generally 1/« + 1/v = 2Ir, where u and ν are the distances of object-point and image-point from the mirror, and r is the mirror's radius of curvature. In geometrical optics, this uniformity is explained with the help of the basic law of reflection in a plane mirror, by treating the reflection of a beam of light at any one point of a spherical mirror as a case of reflection in a plane tangential to the spherical surface. The resulting explanation can be formulated as a deductive argument whose conclusion is the explanandum sentence, and whose premisses include the basic laws of reflection and of rectilinear propagation, as well as the statement that the surface of the mirror forms a segment of a sphere. (Hempel 1966: 50 f.; m. H.)

Als weitere Beispiele für DN-Erklärungen dieser Art erwähnt Hempel etwa die Herleitungen von Galileis Fallgesetz oder den drei Keplerschen Gesetzen aus den Newtonschen Axiomen und dem Gravitationsgesetz (vgl. Hempel 1977: 15 f.). Bei DN-Erklärungen von universellen Regularitäten ist zweierlei zu beachten. Zum einen sind diejenigen Gesetze, die im Explanans einer solchen DN-Erklärung auftreten, in der Regel von allgemeinerer Art als im Fall von DN-Erklärungen einzelner Tatsachen oder Ereignisse; sie werden auch als „theoretische Prinzipien" bezeichnet (Hempel 1977: 15). Zum anderen gilt, daß die zu erklärenden Gesetze oft „aus der jeweiligen Theorie nicht in Strenge logisch folgen; die Theorien implizieren vielmehr, daß diese Gesetze nur innerhalb eines begrenz-

32

1

Das covering law-Modell der Erklärung

ten Anwendungsbereichs gelten, und auch dort nur in Annäherung" (Hempel 1977:15). DN-Erklärungen sowohl von einzelnen Tatsachen oder Ereignissen als auch von universellen Regularitäten teilen eine Reihe von Eigenschaften mit sog. deduktiv-statistischen Erklärungen, auf die ich im nächsten Unterabschnitt eingehe.

1.2.2

Deduktiv-statistische Erklärungen

Deduktiv-statistische Erklärungen (DS-Erklärungen) genügen bis auf die folgenden zwei Unterschiede ebenso wie DN-Erklärungen Schema (1.1): (i) Im Explanans einer DS-Erklärung tritt wenigstens ein Gesetz nicht universeller, sondern statistischer Art als unentbehrliche Prämisse" (Hempel 1977: 60; m. H.) auf. (ii) Das Explanandum einer DSErklärung besteht in einer statistischen Regularität und nicht in einer universellen Regularität bzw. einem einzelnen Ereignis. Eine DS-Erklärung „läuft im Prinzip auf die deduktive Subsumption einer engeren statistischen Gesetzmäßigkeit unter umfassendere [statistische Gesetzmäßigkeiten] hinaus" (Hempel 1977: 59). Dabei gilt: Die Ableitung [der engeren statistischen Gesetzmäßigkeit] wird durch die mathematische Theorie der statistischen Wahrscheinlichkeit bewerkstelligt, die es ermöglicht, gewisse abgeleitete Wahrscheinlichkeiten (auf die im Explanandum Bezug genommen wird) aus anderen Wahrscheinlichkeiten (die im Explanans angegeben werden) zu berechnen, wobei die letzteren empirisch ermittelt oder hypothetisch angenommen wurden. (Hempel 1977: 60)

Wie bei DN-Erklärungen kann auch bei DS-Erklärungen von potentiellen, mehr oder weniger stark bestätigten und wahren DS-Erklärungen gesprochen werden.5 Als Beispiel für eine DS-Erklärung nennt Hempel die Erklärung für die Tatsache, daß bei einem Wurf mit einer fairen Münze die Wahrscheinlichkeit für das Ergebnis .Wappen' auch nach einer langen Rei5

In Hempel (1977: 87) ist zwar explizit nur von wahren und potentiellen DSErklärungen die Rede; daß DS-Erklärungen aber ebenso wie DN-Erklärungen auch mehr oder weniger stark bestätigt sein können, steht meiner Ansicht nach völlig in Einklang mit Hempels Darstellung von DS-Erklärungen in Hempel (1977: 59 f.).

1.2 Drei Typen von covering law-Erklärungen

33

he von Würfen mit dem Ergebnis .Wappen' (immer noch) 0,5 beträgt. Daß dies so ist, läßt sich mit Hilfe zweier Hypothesen erklären, die die Form statistischer Gesetze besitzen. Die erste besagt, daß bei dem Zufallsexperiment des Wurfs mit einer fairen Münze das Ergebnis .Zahl' [ebenso wie das Ergebnis .Wappen'] mit einer statistischen Wahrscheinlichkeit von 1/2 auftritt. Die zweite Hypothese sagt, daß die Ergebnisse der verschiedenen Würfe mit der Münze statistisch unabhängig sind, so daß die Wahrscheinlichkeit flir eine spezielle Ergebnisfolge - etwa zweimal Zahl, dann Wappen, dann Zahl, dann dreimal Wappen - gleich dem Produkt der Wahrscheinlichkeiten für die einzelnen Ergebnisse ist. Aus diesen beiden Hypothesen, die statistische Wahrscheinlichkeiten benutzen, folgt deduktiv, daß die Wahrscheinlichkeit für Wappen nach einer langen Folge, bei der stets Wappen auftrat, immer noch 1/2 ist. (Hempel 1977: 59; H. d. A.)

Als ein weiteres Beispiel für DS-Erklärungen nennt Hempel unter anderem die Erklärung von Halbwertszeiten radioaktiver Elemente. DS-Erklärungen nehmen in Hempels Darstellung seines Modells relativ wenig Raum ein und werden sowohl von ihm als auch von seinen Kritikern nur am Rande behandelt. Sein Hauptinteresse bei statistischen Erklärungen gilt Erklärungen von Einzelereignissen (vgl. etwa Hempel 1977: 60). Statistische Erklärungen dieser Art werden im folgenden Unterabschnitt behandelt.

1.2.3

Induktiv-statistische Erklärungen

Induktiv-statistische Erklärungen (IS-Erklärungen) enthalten ebenso wie DS-Erklärungen im Explanans wenigstens ein Gesetz statistischer Art. Allerdings werden durch IS-Erklärungen einzelne, spezielle Ereignisse und nicht statistische Regularitäten erklärt. Weiterhin folgt bei IS-Erklärungen - im Gegensatz zu DN- und DS-Erklärungen - der Explanandum-Satz nicht deduktiv aus dem Explanans. Vielmehr verleiht „das Explanans dem Explanandum einen mehr oder weniger hohen Grad induktiver Stützung oder logischer (induktiver) Wahrscheinlichkeif' (Hempel 1977: 66; m. H.). Bei einer IS-Erklärung macht das Vorliegen der im Explanans genannten Information es also nicht sicher, sondern lediglich wahrscheinlich, daß der durch den Explanandum-Satz bezeichnete Sachverhalt eintritt.

1

34

Das covering law-Modell der Erklärung

IS-Erklärungen lassen sich durch das folgende Schema wiedergeben: (1.3)

Schema für IS-Erklärungen

Ai, A2,..., A„

Ί

Gi, G2,..., Gm = =

J

r

S

Explanans

[r] Explanandum-Satz

Wie in Schema (1.1) beziehen sich die Prämissen Aj, A 2 ,..., A„ wiederum auf spezielle, einzelne Tatsachen (Anfangs- oder Randbedingungen), auf die in der Erklärung zurückgegriffen wird. Die Prämissen Gi, G 2 ,..., G m stellen nun Gesetze von statistischer Art dar, die eine Verbindung zwischen den Anfangsbedingungen und dem Explanandum-Phänomen herstellen. Der Doppelstrich, der die Prämissen des Argumentes von dessen Konklusion S trennt, soll andeuten, daß es sich um ein induktiv starkes und nicht um ein deduktiv gültiges Argument handelt. Die Variable r gibt dabei den Grad der Stärke des Argumentes bzw. den Grad der induktiven Wahrscheinlichkeit an, den der Explanandum-Satz bezüglich der im Explanans genannten Information hat. Über den numerischen Wert von r macht Hempel keine präzisen Angaben. Er fordert lediglich, daß r nahe bei 1 liegen muß.6 Mit dem Umstand, daß das Explanans einer IS-Erklärung das jeweilige Explanandum nicht sicher, sondern lediglich wahrscheinlich macht, hängt eine weitere Eigenschaft von IS-Erklärungen zusammen, die sie von DN- und DS-Erklärungen abhebt. Im Hinblick auf Erklärungen, bei denen der Explanandum-Satz nicht deduktiv aus dem Explanans folgt, existiert nämlich das sog. „Problem der Erklärungsmehrdeutigkeit" (Hempel 1977: 76), das sich am besten anhand eines Beispiels erläutern läßt (vgl. Hempel 1977: 60 f.; die folgende Darstellung ist eine Rekonstruktion von Hempels Beispiel): 6

In Hempel (1968: 117; m. H.) schreibt er: „The argument will be considered as explanatory only if r is sufficiently close to 1\ but no specific common lower bound for r can reasonably be imposed on all probabilistic explanations." Auf Hempels Forderung nach einer hohen induktiven Wahrscheinlichkeit des Explanandum-Satzes bezüglich des Explanans komme ich im folgenden Abschnitt noch einmal zurück.

1.2 Drei Typen von covering law-Erklärungen (1.4)

35

Beispiel 1 fiir eine IS-Erklärung Aj: Der Patient Hans Maier war an einer Streptokokken-Infektion erkrankt.

Λ

A2: Der Patient Hans Maier wurde mit Penicillin behandelt. Gi: Eine Behandlung mit Penicillin führt bei Erkrankungen an einer Streptokokken-Infektion mit einer hohen statistischen Wahrscheinlichkeit r/Stat zur Genesung von dieser Infektion. S,:

Der Patient Hans Maier ist von der betreffenden Streptokokken-Infektion genesen.

>

Explanans

J

Expland.Sat7

Bei dieser IS-Erklärung verleiht das durch Ai, A2 und Gi gebildete Explanans dem Explanandum-Satz S] eine gewisse hohe induktive Wahrscheinlichkeit r/" d : Bei der Erkrankung von Herrn Maier an einer Streptokokken-Infektion war aufgrund der Gabe von Penicillin und der Tatsache, daß Penicillin mit einer hohen statistischen Wahrscheinlichkeit r/ Slal zu einer Genesung führt, mit einer hohen induktiven Wahrscheinlichkeit r/ n d zu erwarten, daß Hans Maier von seiner Infektion genesen würde.7 Das Problem der Erklärungsmehrdeutigkeit besteht nun darin, daß ein spezielles Einzelereignis [...] oft zufällig aus einer von mehreren „Bezugsklassen" ausgewählt wird [...], bezüglich denen das fragliche Ergebnis [...] im vorliegenden Einzelfall verschiedene statistische Wahrscheinlichkeiten besitzt. Zu einer vorgeschlagenen probabilistischen Erklärung mit wahren Prämissen, die einem speziellen Ereignis praktische Gewißheit zuschreibt, gibt es also oft ein rivalisierendes Argument der gleichen probabilistischen Gestalt, das ebenfalls wahre Prämissen besitzt und

7

Im allgemeinen wird bei einer solchen IS-Erklärung - meist ohne Begründung - der numerische Wert der induktiven Wahrscheinlichkeit - r¡ - mit dem der Stat

statistischen Wahrscheinlichkeit - r¡ - identifiziert. Es handelt sich hierbei aber um zwei verschiedene Typen von Wahrscheinlichkeiten. Es wäre ein Fehler, im Schema zweimal dieselbe Variable zu verwenden.

1

36

Das covering law-Modell der Erklärung

dem Nicht-Eintreten eben dieses Ereignisses praktische Gewißheit zuschreibt. (Hempel 1977: 77; m. H.) Im betrachteten Fall der Krankheit von Herrn Maier könnte sich das Problem der Erklärungsmehrdeutigkeit beispielsweise daraus ergeben, daß bei Herrn Maier eine Infektion mit einem Streptokokkenstamm vorliegt, der gegen Penicillin resistent ist. In diesem Fall könnte folgende Erklärung für den Umstand vorgebracht werden, daß Herr Maier nicht von seiner Infektion genesen ist: ( 1.5) Beispiel 2 fiir eine IS-Erklärung A 3 : Der Patient Hans Maier war an einer Streptokokken-Infektion mit gegen Penicillin resistenten Erregern erkrankt.

Λ

A2: Der Patient Hans Maier wurde mit Penicillin behandelt. G2: Eine Behandlung mit Penicillin führt bei einer Streptokokken-Infektion mit penicillin-resistenten Erregern mit einer hohen statistischen Wahrscheinlichkeit r2s"" nicht zur Genesung.

V

Explanans

J

[r2,nd] S2:

Der Patient Hans Maier ist nicht von der betreffenden Streptokokken-Infektion genesen.

Expland.· Satz

Es ist zu beachten, daß Erklärung (1.5) im Explanans auf Prämissen zurückgreift, die mit den Prämissen im Explanans von Erklärung (1.4) völlig verträglich und zum Teil identisch sind: Ai, A2, A3, Gi und G 2 können alle gleichzeitig wahr sein. Auf der Grundlage dieser möglicherweise wahren Prämissen können zwei verschiedene IS-Erklärungen vorgebracht werden, von denen die eine der Genesung des Patienten Hans Maier, die andere aber seiner Mc/ii-Genesung eine hohe Wahrscheinlichkeit zuschreibt.8 g Argumente wie (1.4) und (1.5) bezeichnet Hempel (1960) auch als statistische Syllogismen. Das Grundproblem im Hinblick auf solche Syllogismen besteht allgemein darin, daß es zwei verschiedene statistische Syllogismen mit jeweils

1.2

Drei Typen von covering

law-Erklärungen

37

Die Möglichkeit, daß prinzipiell zwei verschiedene IS-Erklärungen mit wahren Prämissen gegeben werden können, von denen die eine einem gegebenen Explanandum eine hohe Wahrscheinlichkeit zuschreibt, die andere aber der Negation des Explanandums, stellt für Hempel ein Problem dar, denn jede statistische Erklärung für das Auftreten [eines Ereignisses] muß fragwürdig erscheinen, wenn die Möglichkeit einer logisch und empirisch gleichermaßen korrekten probabilistischen Erklärung für sein Nicht-Auftreten besteht. (Hempel 1977:77; m. H.)

Aus diesem Grund führt Hempel eine weitere Bedingung für IS-Erklärungen ein, die das Problem der Erklärungsmehrdeutigkeit beheben soll - die sog. „Forderung nach maximaler Spezifizierung" (Hempel 1977: 79). Sie besagt, daß das in einer IS-Erklärung verwendete statistische Gesetz maximal spezifisch im Hinblick auf das zu erklärende Ereignis sein muß. Im Fall der Erkrankung von Hans Maier bedeutet dies beispielsweise, daß das verwendete Gesetz sich nicht lediglich auf Hans Maiers Erkrankung an einer Streptokokken-Infektion beziehen darf, da spezifischere Informationen über diese Infektion vorliegen: Es ist zudem bekannt, daß Hans Maier an einer Infektion mit einem Streptokokken-Stamm erkrankt war, der gegen Penicillin resistent ist. Daher muß ein statistisches Gesetz verwendet werden, das sich auf diese spezifischere Tatsache bezieht. Mit anderen Worten: Von einer IS-Erklärung muß allgemein verlangt werden, daß sie im Explanans „auf eine statistische Wahrscheinlichkeitsaussage über die kleinste Bezugsklasse zurückgreift, zu der der betrachtete Einzelfall nach unserer Gesamtinformation gehört" (Hempel 1977: 81; m. H.). Sollte es daher zu unserer Gesamtinformation gehören, daß Hans Maier an einer Streptokokken-Infektion mit gegen Penicillin resistenten Erregern erkrankt war, so würde das in (1.4) dargestellte Argument die Forderung nach maximaler Spezifizierung nicht erfüllen und könnte somit nicht als Erklärung für die Genesung von Hans Maier in Frage kommen: Das verwendete Gesetz Gi wäre nicht maximal spezi-

wahren Prämissen geben kann, deren Konklusionen logisch inkompatibel sind. Solche Syllogismen erzeugen dann „inductive inconsistencies" (vgl. Hempel 1960: 442). Diese Eigenschaft von statistischen Syllogismen ist natürlich nicht nur auf Argumente wie (1.4) und (1.5) beschränkt, die als Erklärungen gelten sollen, sondern betrifft induktive Argumente ganz allgemein.

38

7

Das covering law-Modell der Erklärung

fisch, da Hans Maiers Erkrankung zu einer kleineren Bezugsklasse gehören würde. 9 Aus der Tatsache, daß IS-Erklärungen die Forderung nach maximaler Spezifizierung erfüllen müssen, folgt nach Hempel, daß sie wesentlich epistemisch relativiert sind: Die vorangehenden Betrachtungen zeigen, daß der Begriff der statistischen Erklärung von Einzelereignissen grundsätzlich als relativ aufzufassen ist: genau wie eine gerade Linie nicht schlechthin senkrecht sein kann, sondern nur senkrecht zu gewissen anderen Geraden, so kann ein statistisches Argument nie eine I-S-Erklärung schlechthin sein, sondern immer nur eine I-S-Erklärung in bestimmten Wissenssituationen, die durch entsprechende Klassen [K] akzeptierter Sätze dargestellt werden können. Die Forderung nach maximaler Spezifizierung nimmt ausdrücklich und zwangsläufig auf eine solche Klasse Bezug, und dadurch kennzeichnet sie den Begriff der „I-S-Erklärung relativ zu einer durch Κ dargestellten Wissenssituation". Diese Eigenart wollen wir die epistemische Relativität statistischer Erklärung nennen. (Hempel 1977: 86; H. d. A.) Diese epistemische Relativität von IS-Erklärungen bezieht sich dabei bereits auf den Begriff der potentiellen IS-Erklärung. Potentielle ISErklärungen bezüglich einer Wissenssituation Κ sind solche induktiven Argumente, die Schema (1.3) erfüllen und bei denen die verwendeten Gesetze maximal spezifisch bezüglich Κ sind. Hierdurch unterscheiden sich IS-Erklärungen wesentlich von DNund DS-Erklärungen, bei denen der Begriff der potentiellen Erklärung völlig ohne Bezug auf eine Wissenssituation bestimmt werden kann. DN- und DS-Erklärungen sind zwar ebenfalls in einem gewissen Sinne epistemisch relativiert. Diese Relativierung betrifft allerdings lediglich die Frage der Akzeptierbarkeit bzw. Bestätigung einer DN- oder DS-Erklärung in einer bestimmten Wissenssituation, und diese Bedingung der empirischen Bestätigung gilt gleichermaßen für [induktiv-]statistische Erklärungen, die in einer bestimmten Wissenssituation akzeptierbar sein sollen. Die epistemische Relativität, die sich aus der For9 Für eine formalere Darstellung der Forderung nach maximaler Spezifizierung vgl. Hempel (1965a: 400; 1968: 120, 122), für eine überarbeitete Version der Forderung Hempel (1968: 131) und für eine letzte Bemerkung hierzu Hempel (1977: 112). Für eine Diskussion der Forderung, insbesondere auch im Hinblick auf das Problem der Bestimmung der .kleinsten Bezugsklasse', vgl. Salmon (1989: 56 ff.).

1.2

Drei Typen von covering law-Erklärungen

39

derung nach maximaler Spezifizierung fiir I-S-Erklärungen ergibt, ist jedoch von ganz anderer Art und besitzt für den Fall der D-N-Eridärungen [und D-S-Erklärungen] kein Analogon. Denn die Forderung nach Spezifizierung betrifft nicht die Bestätigung, die die Gesamt-Evidenz Κ den Explanans-Aussagen verleiht: sie verlangt weder, daß diese zu Κ gehören, noch, daß Κ stutzende Evidenz für sie liefert. Sie betrifft vielmehr das, was wir eine potentielle [induktiv-jstatistische Erklärung nennen könnten. Denn sie legt fest, daß eine vorgeschlagene I-S-Erklärung, ganz gleich, wie gut das Explanans durch empirische Befunde gestützt sein mag, dann nicht zu akzeptieren ist, wenn ihr potentielles Erklärungsvermögen bezüglich des angegebenen Explanandums durch statistische Gesetze beeinträchtigt wird, die zu K, nicht jedoch zum Explanans gehören und die die Konstruktion von rivalisierenden [induktiv-]statistischen Argumenten gestatten könnten. Wie wir gesehen haben, besteht diese Gefahr bei deduktiven Erklärungen nie. Deshalb unterliegen sie keiner solchen einschränkenden Bedingung, und der Begriff der potentiellen deduktiven Erklärung (im Unterschied zu einer deduktiven Erklärung mit gut bestätigtem Explanans) braucht nicht auf Κ relativiert zu werden. (Hempel 1977: 86 f.; m. H. außer „potentielle") Der Umstand, daß IS-Erklärungen - anders als DN- und DS-Erklärungen - im beschriebenen Sinne epistemisch relativiert sind, d. h. nur in bezug auf eine bestimmte Wissenssituation Κ als potentielle Erklärung in Frage kommen, hat zur Folge, daß es keinen sinnvollen Begriff der wahren IS-Erklärung gibt: Demzufolge können wir sinnvoll von wahren D-N- und D-S-Erklärungen sprechen: das sind solche potentiellen D-N- und D-S-Erklärungen, deren Prämissen (und also auch Konklusionen) wahr sind - ganz gleich, ob dies bekannt ist oder geglaubt wird, und also auch ganz gleich, ob die Prämissen zu Κ gehören. Diese Idee hat jedoch kein sinnvolles Analogon für den Fall der I-S-Erklärung, da der Begriff der potentiellen [induktiv-]ifaiwtjschen Erklärung, wie wir gesehen haben, auf Κ relativiert werden muß. (Hempel 1977: 87; m. H.) Auf diese Tatsache - das Fehlen eines sinnvollen Begriffs der wahren IS-Erklärung - werde ich in Abschnitt 1.3 noch einmal zurückkommen.

1

40

Das covering law-Modell der

1.2.4

Erklärung

Übersicht

Die folgende Tabelle gibt noch einmal eine Übersicht über die drei in diesem Abschnitt dargestellten Erklärungstypen, die Art des Argumentes, die Art der verwendeten Gesetze und die Art der erklärten Phänomene: (1.6)

Übersicht über die drei Erklärungstypen des covering dells

Typ der Erklärung

DNErklärung

10

Art des Arguments

deduktiv gültig

law-Mo-

Art der verwendeten Gesetze

Art des erklärten Phänomens

universelle Gesetze

einzelne Tatsachen/ Ereignisse

bzw. universelle .theoretische Prinzipien'

bzw. universelle Regularitäten

DSErklärung

deduktiv gültig

statistische Gesetze

statistische Regularitäten

ISErklärung

induktiv stark

statistische Gesetze

einzelne Tatsachen/ Ereignisse 10

In Hempel (1977) werden covering /aw-Erklärungen unterteilt in DN-Erklärungen auf der einen Seite und statistische Erklärungen - DS- und IS-Erklärungen - auf der anderen Seite. Das Unterscheidungskriterium besteht dabei darin, daß erstere, wie aus der Tabelle ersichtlich, im Explanans universelle Gesetze verwenden, während letztere auf statistische Gesetze zurückgreifen. Diese von Hempel vorgenommene Einteilung ist insofern schlecht begründet, als sie auf einem der Unterschiede zwischen den Erklärungstypen - der Art der verwendeten Gesetze - beruht, ohne hierfür Gründe anzugeben. Ebensogut könnte man unter Verwendung eines anderen Unterschiedes - der Art des Argumentes covering /aw-Erkläningen in deduktive (DN- und DS-)Erklärungen, und induktive (IS-)Erklärungen unterteilen. Diese Klassifizierung wäre nach meiner Ansicht sinnvoller. Sie hätte zum einen den Vorteil, daß diejenigen Typen von Erklärungen in eine Klasse fallen, mit deren Hilfe Regularitäten erklärt werden können. (Die Erklärungstypen, mit denen einzelne Ereignisse erklärt werden können - DN-Erklärungen und IS-Erklärungen - fallen auch bei Hempels Klassifikation in verschiedene Klassen.) Zum anderen besteht nur für IS-Erklärungen das Problem der Erklärungsmehrdeutigkeit mit den sich daraus ergebenden Konsequenzen (der Forderung nach maximaler Spezifizierung und der Aufgabe des Begriffs der wahren IS-Erklärung).

1.3 Einwände gegen das covering law-Modell

1.3

E i n w ä n d e g e g e n d a s covering 1.3.1

41

/aw-Modell

Einleitung

Die Literatur, die sich mit dem covering /aw-Modell der Erklärung auseinandersetzt, ist ausgesprochen umfangreich. Zahlreiche Aspekte des Modells wurden ausgiebig diskutiert, und eine erschöpfende Behandlung aller vorgebrachten Einwände würde ganze Bände füllen. 11 Unter den Einwänden gegen das covering /aw-Modell haben sich allerdings die folgenden vier Hauptkritikpunkte herauskristallisiert: (1.7)

Vier Haupteinwände gegen das covering law-Modell der Erklärung (i)

Die allgemeine Charakterisierung des covering Zaw-Modells ist problematisch, da der zentrale Begriff des Gesetzes alles andere als wohlbestimmt ist. (ii) Die Bedingungen, die im covering /aw-Modell aufgestellt werden, sind auf der einen Seite zu stark, d. h. nicht notwendig für Erklärungen: Viele Erklärungen, die in den Wissenschaften vorgebracht und intuitiv als adäquat angesehen werden, erfüllen sie nicht. (iii) Die im covering /aw-Modell aufgestellten Bedingungen sind auf der anderen Seite zu schwach, d. h. nicht hinreichend für Erklärungen: Viele Argumente erfüllen die Bedingungen, können aber intuitiv nicht als angemessene Erklärungen betrachtet werden. (iv) Der Begriff der IS-Erklärung ist grundsätzlich falsch konzipiert, da bei der gegebenen Bestimmung nicht einmal von wahren IS-Erklärungen gesprochen werden kann. Dies hat zur Folge, daß unklar bleibt, inwiefern eine ISErklärung ihr Explanandum erklärt. Diese Einwände werden in den folgenden vier Unterabschnitten im einzelnen diskutiert. 11

Für eine detaillierte Übersicht über die einschlägigen Veröffentlichungen bis 1989 vgl. etwa die 24-seitige chronologische Bibliographie in Salmon (1989: 196-219) (die allerdings nicht ausschließlich Arbeiten zum covering /aw-Modell enthält).

42

I

Das covering law-Modell der

1.3.2

Erklärung

Der Gesetzesbegriff

Wie in den Abschnitten 1.1 und 1.2 beschrieben, wird im covering Ζανν-Modell wesentlich auf Gesetze Bezug genommen. Damit ein gegebenes Argument als Erklärung eines Phänomens in Frage kommt, muß in seiner Prämissenmenge wenigstens ein (für die Ableitung des Phänomens notwendiges) Gesetz vorkommen - je nach Typ der covering /aw-Erklärung entweder ein universelles oder ein statistisches Gesetz. Damit der Erklärungsbegriff des covering /aw-Modells wohlbestimmt ist, muß daher der Begriff des Gesetzes geklärt werden. Gesetze konzipiert Hempel als Aussagen bestimmter Art, nämlich als „wahre gesetzartige Aussagen" (Hempel 1977: 8; m. H.).12 Das Problem besteht dann darin zu bestimmen, worum es sich bei gesetzartigen Aussagen handelt. Hierbei treten insbesondere die folgenden beiden Schwierigkeiten auf: Zum einen muß gezeigt werden, wie sich gesetzartige Aussagen von sog. akzidentellen Verallgemeinerungen unterscheiden; zum anderen, wie sie sich von Pseudo-Gesetzen abheben, die auf sog. nicht-projizierbare Prädikate Bezug nehmen. Was zunächst die Frage der Unterscheidung von gesetzartigen Aussagen und sog. akzidentellen Verallgemeinerungen betrifft, so kann nach intuitiver Einschätzung folgende Aussage als gesetzartig gelten und, sollte sie wahr sein, ein Gesetz im Sinne Hempels darstellen: (1.8) Beispiel 1 für ein mögliches Gesetz Alle Objekte, die aus Uran 238 bestehen, haben eine Masse geringer als 1.000.000 kg. Demgegenüber kann die folgende - formal völlig analoge - Aussage nach intuitiver Einschätzung nicht als gesetzartig gelten. Dementsprechend würde es sich bei ihr auch dann, wenn sie wahr sein sollte, nicht um ein Gesetz, sondern lediglich um eine akzidentelle Verallgemeinerung handeln:

12

Vgl. hierzu auch Hempel (1977: 30, 33). Statt von gesetzartigen Aussagen spricht Hempel an einigen Stellen auch von gesetzartigen Sätzen; vgl. ζ. B. Hempel (1977: 8 f.).

1.3 Einwände gegen das covering law-Modell (1.9)

43

Beispielför eine mögliche akzidentelle Verallgemeinerung Alle Objekte, die aus Gold bestehen, haben eine Masse geringer als 1.000.000 kg.

Sollte es nämlich im Universum tatsächlich keine aus Gold bestehenden Objekte geben, die eine Masse von 1.000.000 kg oder mehr haben, so würde es sich hierbei lediglich um einen Zufall (eine Akzidenz) handeln. Dagegen sind Objekte aus Uran 238 mit einer Masse von 1.000.000 kg oder mehr durch die atomaren Eigenschaften von Uran 238 ausgeschlossen. Die sich ergebende Schwierigkeit für das covering /aw-Modell besteht nun darin, daß das folgende Argument die formalen Bedingungen einer DN-Erklärung erfüllt: (1.10) Beispiel für eine unzulässige DN-Erklärung Ai : Objekt A besteht aus Gold. Gi: Alle Objekte, die aus Gold bestehen, haben eine Masse geringer als 1.000.000 kg.

Explanans

S:

Expland.Satz

Objekt A hat eine Masse geringer als 1.000.000 kg.

Nach Hempel soll (1.10) allerdings nicht als Erklärung dafür gelten können, daß das aus Gold bestehende Objekt A eine Masse von weniger als 1.000.000 kg hat. Um Argumente wie (1.10) als DN-Erklärungen ausschließen zu können, muß Hempel aber ein allgemeines Kriterium zur Unterscheidung von gesetzartigen Aussagen bzw. Gesetzen und akzidentellen Verallgemeinerungen angeben. Ein ähnliches Beispiel wie das gerade diskutierte kann verwendet werden, um den Unterschied zwischen Gesetzen und Pseudo-Gesetzen, die auf sog. nicht-projizierbare Prädikate Bezug nehmen, zu illustrieren. Folgende Aussage stellt möglicherweise ein Gesetz im Sinne Hempels dar: (1.11) Beispiel 2 für ein mögliches Gesetz Alle Smaragde sind grün.

44

1

Das covering law-Modell der Erklärung

Folgende Aussage kann nach intuitiver Einschätzung allerdings nicht als Gesetz gelten: (1.12) Beispiel für ein Pseudo-Gesetz Alle Smaragde sind grarz. Der Ausdruck „grarz" sei dabei so bestimmt, daß er auf alle Smaragde zutrifft, die entweder vor dem heutigen Tage ausgegraben wurden und grün waren oder ab heute ausgegraben werden und schwarz sind. Analog zu Argument (1.10) könnte nun auch auf der Grundlage von (1.12) ein Argument konstruiert werden, das die formalen Bedingungen einer DN-Erklärung erfüllt, aber intuitiv nicht als Erklärung des Umstands gelten kann, daß der soeben von mir ausgegrabene Smaragd grarz, d. h. schwarz ist. Um aber Argumente dieser Art als DN-Erklärungen ausschließen zu können, müssen nicht-projizierbare Prädikate als Komponenten von gesetzartigen Aussagen ausgeschlossen werden. Dies wiederum verlangt eine Bestimmung des Begriffs des projizierbaren bzw. nicht-projizierbaren Prädikats, die sich als sehr schwierig erwiesen hat. 13 Hempel ist sich des Problems der Bestimmung des Begriffs der gesetzartigen Aussage bzw. des Gesetzes sehr wohl bewußt und diskutiert ausführlich einige Charakteristika gesetzartiger Aussagen (vgl. etwa Hempel 1977: 8-14). Er weist zunächst darauf hin, daß gesetzartige Aussagen nicht durch ihre Form allein charakterisiert werden können; daß es für den Status der Gesetzartigkeit keine Rolle spielt, wie viele potentielle oder tatsächliche Instanzen (Einzelfälle) eine Aussage hat; und daß gesetzartige Aussagen sich nicht dadurch auszeichnen, daß sie nicht „direkt oder indirekt auf spezielle Gegenstände, Personen oder Orte Bezug nehmen" (Hempel 1977: 12). Unter Rekurs auf Goodman (1955) weist Hempel daraufhin, daß Gesetze - im Gegensatz zu akzidentellen Verallgemeinerungen und Pseudo-Gesetzen - irreale und subjunktive Konditionalaussagen stützen können; und er ergänzt, daß Gesetze darüber hinaus in Erklärungen verwendet werden können. Nach Hempels Ansicht können diese beiden Kriterien allerdings nicht dazu dienen, den Gesetzesbegriff in befriedigender 13

Zum Problem der Unterscheidung von projizierbaren und nicht-projizierbaren Prädikaten vgl. Goodman (1955), der solche Prädikate im Hinblick auf das Induktionsproblem diskutiert, und Stalker (Hg.) (1994).

1.3

Einwände gegen das covering law-Modell

45

Weise zu charakterisieren. Das zuletzt genannte Kriterium ist nutzlos, da der Begriff der Erklärung ja unter Rekurs auf den Gesetzesbegriff bestimmt werden soll, weswegen jener nicht wieder bei der Bestimmung von diesem verwendet werden darf. Das zuerst genannte Kriterium ist wenig hilfreich, denn es setzt „ein Verständnis irrealer und subjunktiver Konditionalaussagen voraus, das notorische philosophische Schwierigkeiten in sich birgt" (Hempel 1977: 10).'4 Seine Diskussion des Gesetzesbegriffs bzw. des Begriffs der gesetzartigen Aussage beschließt Hempel mit der - nach meiner Auffassung etwas euphemistischen - Einschätzung, daß „die vorangegangene Diskussion zu keiner gänzlich befriedigenden allgemeinen Charakterisierung gesetzartiger Sätze (und damit von Gesetzen) geführt hat" (Hempel 1977: 14; m. H.). Hempel hat also bereits Schwierigkeiten damit, einen der Grundbegriffe des covering /aw-Modells befriedigend zu explizieren.15

1.3.3

Die Notwendigkeit der Bedingungen des covering /aw-Modells

Das covering /aw-Modell spezifiziert, wie in den Abschnitten 1.1 und 1.2 beschrieben, notwendige Bedingungen, die jede Entität, die als Erklärung in Frage kommen will, erfüllen muß (wobei sich diese Bedingungen je nach Erklärungstyp unterscheiden). Nach Ansicht einiger Autoren sind diese Bedingungen zu stark: Viele Erklärungen, die im Alltag und in den Wissenschaften vorgebracht und intuitiv als adäquat akzeptiert werden, erfüllen die Bedingungen des covering lawModells nicht. Im Hinblick auf DN-Erklärungen hat vor allem Michael Scriven in einer Reihe von Veröffentlichungen dafür argumentiert, daß (i) viele intuitiv adäquate Erklärungen völlig ohne Rekurs auf uni14

Auf das Problem der Analyse von kontrafaktischen Konditionalaussagen komme ich in Kapitel 3 bei der Diskussion der Erklärungsmodelle von David Lewis und Wesley Salmon noch einmal ausfuhrlich zu sprechen. Was das Problem der projizierbaren Prädikate betrifft, scheint Hempel (1977: 13 f.) eine Lösung nach dem Muster Goodmans zumindest für möglich zu halten, der projizierbare Prädikate über das Maß ihrer .Verankerung' {entrenchment) in wissenschaftlichen und Alltagskontexten bestimmt (vgl. Goodman 1955: 94 ff.).

46

1

Das covering law-Modell der Erklärung

verseile Gesetze auskommen und daß (ii), selbst wenn universelle Gesetze in einer Erklärung verwendet werden, die jeweiligen Explananda in den seltensten Fällen aus dem Explanans deduktiv folgen. 16 So kann man nach Scrivens Ansicht beispielsweise einen auf dem Teppich entstandenen Tintenfleck erklären, indem man darauf hinweist, daß ein auf dem Tisch befindliches Tintenfaß umgestoßen worden und ausgelaufen ist: As you reach for the dictionary, your knee catches the edge of the table and thus turns over the ink-bottle, the contents of which proceed to run over the table's edge and ruin the carpet. If you are subsequently asked to explain how the carpet was damaged you have a complete explanation. You did it, by knocking over the ink. The certainty of this explanation is primeval. It has absolutely nothing to do with your knowledge of the relevant laws of physics; a cave-man could supply the same account and be quite as certain of it. (Scriven 1959a: 456)

In diesem Beispielfall ist es nach Scrivens Auffassung weder nötig, sich auf ein universelles Gesetz zu beziehen, um das Entstehen des Tintenflecks zu erklären, noch kann ein solches Gesetz überhaupt gefunden werden: Ein universelles Gesetz, das das Entstehen des Tintenflecks mit dem Umstoßen des Tintenfasses verbindet, existiert nicht (vgl. Scriven 1959a: 456). Darüber hinaus wäre nach Scrivens Ansicht selbst dann, wenn in diesem oder in einem anderen Fall universelle Gesetze gefunden und für eine Erklärung herangezogen werden könnten, die betreffende Erklärung keine DN-Erklärung - denn bei der jeweiligen Erklärung würde es sich nicht um eine Deduktion des Explanandums aus dem Explanans handeln. Alle Erklärungen, die Hempel als Beispiele für DN-Erklärungen nennt, sind nach Scrivens Auffassung bestenfalls Skizzen solcher Erklärungen, die in den meisten Fällen nicht in deduktive Argumente überführt werden können (vgl. Scriven 1959b: 193). Der Grund hierfür liegt vereinfacht gesagt darin, daß die in Erklärungen verwendeten Gesetze der .theoretischen Ebene' angehören und in .theoretischen Begriffen' formuliert sind, während das zu erklärende Phänomen der .Beobachtungsebene' zugehört und mit Hilfe von .Beobachtungsbegriffen' beschrieben wird. Der Übergang zwischen die-

16

Vgl. Scriven (1956, 1959a, 1959b, 1962, 1963a, 1963b).

1.3

Einwände gegen das covering

law-Modell

47

sen beiden Ebenen mit Hilfe von sog. , Brückenprinzipien ' läßt sich auf rein deduktivem Wege nicht bewerkstelligen: If we wish to explain the observed phenomenon P, we can only do this by reference to scientific laws and concepts, if there is some way of establishing a connection between the scientific concepts and the observation terms involved in the description Dp of P. I have argued that in general no translation of the one into the other is possible and that the ideal of a deduction of Dp from the usual singular statements and law statements is therefore unsound. [...] The trouble always lies in substantiating the idea that by tightening up the description a little, an exact deduction could be achieved. This is never possible because at the one end, the so-called bridge laws (or correspondence rules), i. e. the relations of vocabularies of different levels, are not exact, and at the other the scientific laws are not exact. (Scriven 1959b: 192 f.)

Nach Scrivens Ansicht sollte aus diesen Gründen davon ausgegangen werden, daß es sich bei der überwiegenden Mehrzahl aller Erklärungen um induktive Erklärungen handelt (vgl. Scriven 1959b: 193).17 Auch im Hinblick auf induktive Erklärungen ist allerdings fraglich, ob die Bedingungen des covering /aw-Modells für diese notwendig sind. Wie in den vorigen Abschnitten beschrieben, besagt eine der Bedingungen für IS-Erklärungen, daß das Explanans dem jeweiligen Explanandum eine hohe induktive Wahrscheinlichkeit verleihen müsse. Jeffrey (1969) und Salmon (1970) diskutieren eine Reihe von Fällen, bei denen nach ihrer Auffassung eine adäquate statistische Erklärung des jeweiligen Phänomens vorliegt, ohne daß das Auftreten dieses Phänomens durch die im Explanans genannte Information sehr wahrscheinlich gemacht würde. Salmon nennt unter anderem das folgende Beispiel, bei dem der Zerfall eines Atoms innerhalb eines bestimmten Zeitintervalls unter Rekurs auf bestimmte Anfangsbedingungen und Gesetze des radioaktiven Zerfalls erklärt wird, ohne daß dem Explanandum-Phänomen dabei eine hohe Wahrscheinlichkeit zugesprochen würde: Suppose we had a metallic substance in which one of the atoms experienced radioactive decay within a particular, small time period, say one minute. For purposes of the example, let us suppose that only one such de17

Scrivens Einwände beziehen sich wie erwähnt auf covering faw-Erklärungen des DN-Typs; der DS- und IS-Typ waren zum Zeitpunkt der Veröffentlichung von Scrivens Artikel noch nicht entwickelt.

48

1

Das covering law-Modell der Erklärung

cay occurred within that time period. When asked why that particular atom decayed, we might reply that the substance is actually an alloy of two metals, one radioactive (for example, uranium 238) and one stable (for example, lead 206). Since the half-life of U238 is 4.5 χ 10® years, the probability of a given uranium atom's decaying in an interval of one minute is not large, yet there is explanatory relevance in pointing out that the atom that did decay was a U atom. (Salmon 1970: 201 ; m. H.) Die von Salmon skizzierte Erklärung des Zerfalls des betreffenden Uran-Atoms erfüllt nicht die Bedingungen einer IS-Erklärung, da dem Eintreten des Explanandum-Phänomens keine hohe, sondern vielmehr eine niedrige Wahrscheinlichkeit zugeschrieben wird. Nach Salmons Ansicht kann in diesem Fall nichtsdestotrotz von einer statistischen Erklärung des betreffenden Phänomens gesprochen werden. Salmon weist außerdem darauf hin, daß es sich nach gegenwärtigem physikalischen Wissen bei der von ihm dargestellten Erklärung um die einzig mögliche Erklärung des Phänomens handelt: Eine .genauere', .detailliertere' oder .bessere' Erklärung des radioaktiven Zerfalls einzelner Atome kann nicht gegeben werden (vgl. Salmon 1970: 201). Auf der Grundlage von Gegenbeispielen dieser und ähnlicher Art fordern Jeffrey und Salmon, die Bedingung hoher induktiver Wahrscheinlichkeit für statistische Erklärungen fallen zu lassen. Unter Anerkennung dieser Kritik hat Hempel die Bedingung im Nachwort zur deutschen Übersetzung von Hempel (1965a) dann auch aufgegeben (vgl. Hempel 1976: 123).18 Hempels Aufgabe der Forderung nach hoher induktiver Wahrscheinlichkeit bei IS-Erklärungen hat Auswirkungen auf die allgemeine Charakterisierung von Erklärungen im covering /aw-Modell. In Abschnitt 1.1 wurden covering /aw-Erklärungen bestimmt als Argumente, die zeigen, daß das Explanandum vor dem Hintergrund der im Explanans angeführten Information zu erwarten war. Diese allgemeine Charakterisierung kann nach der Kritik von Jeffrey und Salmon nicht mehr aufrecht erhalten werden. Explanandum-Phänomene wie die von Salmon beschriebenen sind vor dem Hintergrund der im Explanans angeführten Information unwahrscheinlich. Dementsprechend 18

Auf die Frage, inwieweit es sich bei der von Salmon gegebenen Erklärung wirklich um eine Erklärung des Zerfalls des betreffenden Atoms handelt, komme ich bei der Diskussion von Philip Kitchers Erklärungsmodell im nächsten Kapitel noch einmal zurück.

1.3

Einwände gegen das covering

law-Modell

49

zeigt die jeweilige IS-Erklärung nicht, daß das betreffende Explanandum-Phänomen zu erwarten war. Auch kann man bei einer solchen Erklärung nur schwer von einem Argument sprechen (oder doch bestenfalls von einem schlechten), denn die Prämissenmenge der Erklärung verleiht der Konklusion lediglich eine geringe Wahrscheinlichkeit.

1.3.4

Das Hinreichen der Bedingungen des covering /aw-Modells

Die im letzten Unterabschnitt besprochenen Einwände gegen das covering /aw-Modell der Erklärung stellen in Frage, daß die in diesem Modell spezifizierten Bedingungen für Erklärungen notwendig sind: Viele der im Alltag und in den Wissenschaften vorgebrachten Erklärungen erfüllen diese Bedingungen nicht, werden aber dennoch als adäquat angesehen. Die in diesem Unterabschnitt zu diskutierenden Einwände ziehen nun in Zweifel, daß die Bedingungen des covering /aw-Modells hinreichend für Erklärungen sind: Viele Argumente, die alle Bedingungen des Modells erfüllen, können dennoch nicht als Erklärungen der jeweiligen Explananda betrachtet werden. Einwände dieser Art kommen in verschiedenen Typen vor. Betrachten wir zunächst ein von Sylvain Bromberger vorgebrachtes und besonders bekanntes Gegenbeispiel zur Konzeption der DN-Erklärung, das das Phänomen der Asymmetrie bei Erklärungen betrifft (vgl. Bromberger 1966: 91 f.). Aus Prämissen, die die Höhe h des Empire State Building, den Stand der Sonne über New York City zum Zeitpunkt t und die Gesetze der geometrischen Optik wiedergeben, kann man die Länge 1 des Schattens, den das Empire State Building wirft, deduzieren. Dies bedeutet, daß man die Länge des Schattens unter Rekurs auf die genannte Information in Übereinstimmung mit den Bedingungen des covering /aw-Modells deduktiv-nomologisch erklären kann. So weit, so gut. Allerdings kann man - in völlig analoger Weise - auch die Höhe des Empire State Building aus den genanten Informationen über die Länge des Schattens, den Stand der Sonne und die relevanten Gesetze deduktiv herleiten. Diese Deduktion erfüllt ebenfalls alle Bedingungen des covering /aw-Modells und sollte daher auch als DN-Erklärung der Höhe des Empire State Building angesehen werden. Nach Brombergers Ansicht stellt diese Deduktion aller-

50

1

Das covering law-Modell der Erklärung

dings keine Erklärung der Höhe des Empire State Building dar. Hinsichtlich der Länge des Schattens und der Höhe des Empire State Building besteht eine explanatorische Asymmetrie: Man kann zwar die Länge des Schattens unter Rekurs auf die Höhe des Gebäudes, nicht aber diese unter Rekurs auf jene erklären. Dieser explanatorischen Asymmetrie, die sich auch in vielen anderen Fällen zeigt, kann das covering Ζανν-Modell nicht Rechnung tragen.15 Ein weiterer Typ von Einwand gegen das Hinreichen der Bedingungen des covering Zaw-Modells betrifft Fälle, bei denen im Explanans einer vermeintlichen Erklärung auf irrelevante Information Bezug genommen wird. Solche Fälle gibt es sowohl für DN- als auch für IS-Erklärungen. So könnte man durch ein DN-Argument erklären, warum sich eine in Wasser gegebene Probe Speisesalz auflöste, indem man darauf hinweist, daß (i) die fragliche Probe ,mit einem Auflösungsfluch verhext' war; daß (ii) alle mit einem Auflösungsfluch verhexten Speisesalzproben sich in Wasser auflösen; und daß (iii) aus den ersten beiden Punkten deduktiv folgt, daß sich die betreffende Probe auflöste. Dieses Argument genügt dem DN-Schema, es erklärt aber nach intuitiver Einschätzung nicht, warum sich die betreffende Probe auflöste.20 In analoger Weise könnte die folgende vermeintliche ISErklärung für den Umstand vorgebracht werden, daß sich der Patient Peter Becker nach etwa einer Woche von einem Schnupfen erholte: (i) Peter Becker nahm Vitamin C ein. (ii) Die meisten Patienten erholen sich bei Einnahme von Vitamin C nach etwa einer Woche von einem Schnupfen, (iii) Aus (i) und (ii) folgt mit einer hohen induktiven Wahrscheinlichkeit, daß sich Peter Becker nach etwa einer Woche von seinem Schnupfen erholte. Dieses Argument genügt dem IS-Schema, es erklärt aber nicht, warum Peter Becker sich nach etwa einer Woche von seinem Schnupfen erholte. Der Grund dafür, daß es sich bei diesem wie dem vorigen Beispiel nicht um eine Erklärung handelt, liegt darin, daß die jeweils unter (ii) genannten Gesetze keinerlei Einfluß auf die zu erklärenden Ereignisse haben. Die Gesetze sind irrelevant, 19

Weitere Beispiele dieser Art finden sich in Bromberger (1966: 91 f.). Dieses Beispiel stammt von Kyburg (1965: 147). Ein weiteres schönes Beispiel dieser Art findet sich in Salmon (1970: 178): „John Jones avoided becoming pregnant during the past year, for he has taken his wife's birth control pills regularly, and every man who regularly takes birth control pills avoids pregnancy."

1.3 Einwände gegen das covering law-Modell

51

da sich zum einen alle Speisesalzproben in Wasser auflösen, ob sie nun ,verhext' werden oder nicht, und sich zum anderen die meisten Patienten nach etwa einer Woche von einem Schnupfen erholen, ob sie nun Vitamin C einnehmen oder nicht.21 Ein dritter Typ von Einwand bezieht sich auf Fälle, in denen zwei (oder mehr) Phänomene durch eine gemeinsame Ursache hervorgerufen werden. In solchen Fällen kann im Rahmen des covering lawModells eines der Phänomene durch das jeweils andere erklärt werden, obwohl es sich intuitiv bei den vorgebrachten Argumenten nicht um tatsächliche Erklärungen des betreffenden Phänomens handelt. Dieser Einwand betrifft ebenso wie der vorige DN- und IS-Erklärungen in gleicher Weise. Beispielsweise kann man das schnellere Trocknen der Wäsche aus dem gestiegenen Stand des Thermometers und dem Gesetz deduktiv herleiten, daß immer, wenn das Thermometer steigt, die Wäsche schneller trocknet - d. h., man kann die verkürzte Trocknungszeit der Wäsche im Rahmen des covering /aw-Modells unter Rekurs auf die genannte Information durch ein deduktiv-nomologisches Argument erklären. Bei diesem Argument handelt es sich aber nach intuitiver Einschätzung nicht um eine Erklärung der verkürzten Trocknungszeit - denn sowohl das schnellere Trocknen der Wäsche als auch der gestiegene Thermometerstand sind Wirkungen ein und derselben Ursache, nämlich des Aufdrehens der Heizung. In analoger Weise kann man im Rahmen des covering /aw-Modells das Aufkommen eines Sturms mit Hilfe eines induktiv-statistischen Argumentes erklären, indem man darauf hinweist, daß erstens das Barometer gefallen ist und daß zweitens in fast allen Fällen, in denen das Barometer fällt, ein Sturm aufkommt. Allerdings handelt es sich auch bei diesem induktiv-statistischen Argument, das alle Bedingungen einer IS-Erklärung erfüllt, nicht um eine tatsächliche Erklärung des Aufkommens des Sturms. Denn sowohl der Sturm als auch der gefallene Barometerstand sind Wirkungen ein und derselben Ursache, nämlich bestimmter veränderter atmosphärischer Bedingungen. Dieser Einwand zeigt somit ebenso wie die zuvor diskutierten Einwände, daß

21

Die empirische Richtigkeit dieser beiden Behauptungen wird bei der Argumentation vorausgesetzt. Sollten die beiden Behauptungen falsch sein, ließen sich andere Beispiele finden. Das beschriebene Vitamin C-Beispiel stammt von Salmon (1965: 145 f.); vgl. hierzu auch Salmon (1970: 177 f.).

52

1

Das covering law-Modell der Erklärung

die Bedingungen, die das covering /aw-Modell für Erklärungen formuliert, nicht stark genug sind: Ihr Erfülltsein ist nicht hinreichend dafür, daß es sich um eine Erklärung handelt.22

1.3.5

Spezielle Probleme für IS-Erklärungen

Neben den in den vorigen Unterabschnitten diskutierten Problemen, die den im covering /aw-Modell vorausgesetzten Gesetzesbegriff bzw. die Notwendigkeit und das Hinreichen der in diesem Modell spezifizierten Bedingungen betreffen, gibt es einen weiteren sehr grundsätzlichen Einwand, der sich gegen die Konzeption von IS-Erklärungen richtet. Dieser von Coffa (1973, 1974) vorgebrachte Einwand befaßt sich mit den Konsequenzen, die sich aus dem Problem der Erklärungsmehrdeutigkeit ergeben. Wie erwähnt müssen die in IS-Erklärungen auftretenden Gesetze die Forderung nach maximaler Spezifizierung erfüllen, damit das Problem der Erklärungsmehrdeutigkeit vermieden werden kann (vgl. die Beispiele (1.4) und (1.5) in Unterabschnitt 1.2.3). Aus der Forderung nach maximaler Spezifizierung ergibt sich wiederum, daß IS-Erklärungen wesentlich epistemisch (nämlich auf bestimmte Wissenssituationen K) relativiert sind. Dies hat wie beschrieben zur Folge, daß - anders als bei DN- und DS-Erklärungen - der Begriff der wahren IS-Erklärung nicht bestimmt werden kann. 22

Neben den genannten drei Typen von Einwänden gegen das Hinreichen der Bedingungen des covering /aw-Modells gibt es zwei weitere. Zum einen wird durch das covering /aw-Modell nicht ausgeschlossen, daß man beispielsweise das Auftreten einer Sonnenfinsternis in einem vergangenen Jahrhundert erklärt, indem man auf die Gesetze der Himmelsmechanik und den heutigen Stand des Mondes und der Erde rekurriert. Zum anderen läßt das covering /aw-Modell zu, daß man Phänomene unter Rekurs auf Gesetzmäßigkeiten und einzelne spezielle Tatsachen erklärt, ohne einen Mechanismus zu beschreiben, der das zu erklärende Phänomen bei Vorliegen der genannten Information hervorbringt. In diesem Sinne wird etwa eingewendet, daß die schon im Altertum erfolgreiche Vorhersage von Ebbe und Flut unter Rekurs auf Phase und Stand des Mondes keine Erklärung dieser Phänomene darstellte. Erst als Newton auf die Gravitationskraft aufmerksam machte, die fUr den Zusammenhang zwischen den Gezeiten einerseits und Phase und Stand des Mondes andererseits verantwortlich ist, lag eine Erklärung dieser Phänomene vor. Ich komme auf diese und die drei zuvor genannten Typen von Einwänden noch einmal bei der Diskussion des kausalen Modells der Erklärung in Kapitel 3 zurtlck.

1.3

Einwände gegen das covering

law-Modell

53

Coffa argumentiert nun, daß aus diesem Grunde völlig unklar bleibt, inwiefern IS-Erklärungen ihr Explanandum überhaupt erklären. Nach Coffas Ansicht ist es schlicht Etikettenschwindel, wenn man behauptet, bei IS-Erklärungen handle es sich um Erklärungen: I will try to convince you that to accept Hempel's thesis of epistemic relativity amounts to accepting the claim that there are no inductive explanations, the concept of I-S explanation relative to Κ functioning as a placebo which can only calm the intellectual anxieties of the uncautious user. (Coffa 1974: 155)

Coffas Hauptargument dafür, daß IS-Erklärungen relativ zu einer Wissenssituation Κ keine Erklärungen ihrer Explananda sind, hat die Form eines Widerspruchsbeweises: Angenommen, es gäbe in der Welt Umstände, die herangezogen werden könnten, um eine bestimmte Einzeltatsache induktiv zu erklären. Dann wäre eine korrekte Beschreibung dieser Umstände eine wahre induktive Erklärung der betreffenden Einzeltatsache. Nach Hempel gibt es aber prinzipiell keine wahren IS-Erklärungen von Einzeltatsachen. Daher kann es auch keine Umstände geben, die Einzeltatsachen induktiv erklären. In Coffas Worten: Indeed, if there is no characterization of true inductive explanation, then it must be because there are no such things which go on in the non-epistemic world of facts that can inductively explain the event. For if there were such non-epistemic going ons, their characterization would be a characterization of true inductive explanation. (Coffa 1974: 157)

Aus diesem Grund muß es nach Coffa die zentrale Eigenschaft jeder Konzeption von Erklärungen sein, die ihren Namen verdient, daß in ihr der Begriff der wahren Erklärung bestimmt werden kann: Thus, the possibility of a notion of true explanation, inductive or otherwise, is not just a desirable but ultimately dispensable feature of a model of explanation: it is the sine qua non of its realistic, non-psychologistic inspiration. (Coffa 1974: 157; H. d. A.)

Da Hempels Modell der IS-Erklärung diese Forderung nicht erfüllt, ist für Coffa völlig unklar, wozu IS-Erklärungen bei Hempel überhaupt gut sein sollen: What, then, is the interest of I-S explanations relative to Kl Surely not, as we seen above [sic], that in knowledge situation Κ we have reason to believe that they are inductive explanations. Then what? We detect in Hem-

54

i

Das covering law-Modell der Erklärung

pel's writings not even a hint as to what an answer to this question might be. (Coffa 1974:157 f.) Dieser Einwand von Coffa gegen Hempels Konzeption von IS-Erklärungen wird ebenso wie die zuvor diskutierten Einwände gegen das covering Ζανν-Modell relevant sein, wenn es im nächsten Abschnitt um die Frage geht, wie gut sich das covering Zaw-Modell der Erklärung als Basis für den Schluß auf die beste Erklärung eignet.23

1.4

Das covering Ζανν-Modell und der Schluß auf die beste Erklärung 1.4.1

Einleitung

Eine erste Schwierigkeit, die in diesem Zusammenhang auftaucht, betrifft die Frage, worauf bei einem Schluß auf die beste Erklärung überhaupt geschlossen würde, wenn es sich bei der betreffenden besten Erklärung um eine Erklärung im Sinne des covering Zaw-Modells handelte. Wie in der Einleitung zu dieser Arbeit beschrieben, wird bei einem Schluß auf die beste Erklärung auf diejenige Hypothese geschlossen, die die beste Erklärung bestimmter Phänomene darstellt. Diese Hypothese tritt dementsprechend als Konklusion des jeweiligen Schlusses auf, und bei ihr muß es sich folglich um eine Aussage handeln. Im covering toe-Modell werden Erklärungen aber als Argumente konzipiert (als deduktive Argumente im Falle von DN- und DS-Erklärungen, als induktiv starke Argumente im Falle von IS-Erklärungen; vgl. Abschnitt 1.2). Ohne die Frage genau beantworten zu wollen, worum es sich bei einem Argument ontologisch handelt, scheint es mir jedenfalls gerechtfertigt zu sagen, daß ein Argument keine Aussage ist und daher nicht als Konklusion eines Schlusses auf die beste Erklärung in Frage kommt. Das covering Ζανν-Modell scheint sich also bereits deswegen nicht als Basis für den Schluß auf die beste Erklä-

23

Für Versuche, das von Coffa aufgezeigte Problem bei IS-Erklärungen zu lösen, vgl. etwa Coffa (1974), Fetzer (1974) und Railton (1978).

1.4

Covering law-Modell und Schluß auf die beste Erklärung

55

rung zu eignen, weil Erklärungen in diesem Modell nicht vom geeigneten ontologischen Typ sind.24 Diese Schwierigkeit läßt sich allerdings relativ leicht beheben, indem man das Explanans einer covering /aw-Erklärung als dasjenige betrachtet, worauf bei einem Schluß auf die beste covering /aw-Erklärung geschlossen würde. Das Explanans einer covering /aw-Erklärung kann man sich nach Hempel „entweder als Menge der erklärenden Sätze oder als deren Konjunktion vorstellen" (Hempel 1977: 6; m. H.). Die Menge der Prämissen einer covering /aw-Erklärung kommt zwar, da sie keine Aussage ist, ebenfalls nicht als Konklusion eines Schlusses in Frage. Allerdings handelt es sich bei der Konjunktion der Prämissen um eine (je nach Anzahl und Art der verwendeten Prämissen verschieden komplexe) Aussage, die formal als Konklusion eines Schlusses auftreten kann. Das Explanans einer covering /aw-Erklärung im beschriebenen Sinne als potentielle Konklusion eines Schlusses auf die beste Erklärung aufzufassen, steht nach meiner Auffassung völlig im Einklang mit Hempels Konzeption von covering law-Έχklärungen. Wie bereits erwähnt drückt Hempel sich an verschiedenen Stellen so aus, als würde die erklärende Funktion bei einer covering /aw-Erklärung vom jeweiligen Explanans übernommen (vgl. Abschnitt 1.1 und das Zitat zu Beginn dieses Absatzes). Diese Einschätzung wird auch durch die Wortbedeutung des - von Hempel eingeführten - Ausdrucks „Explanans" nahegelegt. Die Annahme, daß bei einem Schluß auf die beste Erklärung im Sinne des covering lawModells auf die Konjunktion derjenigen Aussagen geschlossen würde, die das Explanans der betreffenden covering /aw-Erklärung bilden, scheint mir daher sinnvoll und angemessen. Hierbei können nun zwei Fälle unterschieden werden. Zum einen kann es vorkommen, daß man mit Hilfe des Schlusses auf die beste Erklärung zwischen verschiedenen, miteinander konkurrierenden Theorien auswählen will. Bestimmte Phänomene Pi, P 2 ,..., P„ werden beobachtet. Man stellt fest, daß diese Phänomene zwar mit Hilfe von Theorie T, im Rahmen des covering /aw-Modells erklärt werden kön24

Em Argument kann möglicherweise als ein Tripel konzipiert werden, dessen erste Komponente eine Menge von Aussagen, dessen zweite Komponente eine einzelne Aussage und dessen dritte Komponente ein Schlußschema ist. Diese Komponenten wären dann die Prämissen, die Konklusion und das Schlußschema des jeweiligen Argumentes.

56

1

Das covering law-Modell der Erklärung

nen, nicht aber mit Hilfe von Theorie T 2 : Es läßt sich eine covering /aw-Erklärung der beobachteten Phänomene Pi bis P„ konstruieren, deren Explanans erstens Gesetze G], G2i ..., G„ aus T¡ und zweitens bestimmte Aussagen Ai, A 2 ,..., A„ Uber einzelne, spezielle Tatsachen (Anfangs- oder Randbedingungen) enthält. In einem solchen Fall sind die Aussagen A|, A 2 ,..., A„ Uber einzelne, spezielle Tatsachen in der Regel unstrittig. Zur Diskussion steht lediglich die Wahrheit der betreffenden Gesetzesaussagen Gi, G 2 ,..., Gn. Daher sollte man in einem solchen Fall nicht davon sprechen, daß bei einem Schluß auf die beste covering /aw-Erklärung auf die Konjunktion aller Prämissen der betreffenden Erklärung geschlossen wird. Statt dessen sollte man besser sagen, daß lediglich auf die Konjunktion der Gesetzesaussagen Gi, G2, ..., G„ geschlossen wird, die im Explanans der betreffenden covering /aw-Erklärung auftreten. Zum anderen kann es vorkommen, daß man mit Hilfe des Schlusses auf die beste Erklärung zwischen verschiedenen Hypothesen über einzelne spezielle Tatsachen auswählen will. In einem solchen Fall sind nun die in der betreffenden covering /aw-Erklärung auftretenden Gesetzesaussagen in der Regel unstrittig, und zur Diskussion steht lediglich die Wahrheit der verschiedenen Aussagen über einzelne spezielle Tatsachen. Daher sollte man wiederum nicht davon sprechen, daß bei einem Schluß auf die beste Erklärung auf die Konjunktion aller Prämissen, die das Explanans bilden, geschlossen wird. Vielmehr wird hier lediglich auf die Konjunktion deijenigen Prämissen aus dem Explanans geschlossen, die einzelne spezielle Tatsachen beschreiben.25 Die Unterscheidung dieser zwei Fälle wird jedoch im weiteren Verlauf dieses Abschnitts keine entscheidende Rolle spielen. Ich werde daher im folgenden vereinfachend davon sprechen, daß bei einem Schluß auf die beste covering /aw-Erklärung auf die Konjunktion der Explanans-Aussagen der betreffenden Erklärung geschlossen wird bzw. - noch vereinfachender - auf das Explanans dieser Erklärung. 25

Ein gutes Beispiel für diesen zweiten Fall bietet die bereits erwähnte Erklärung der Auffälligkeiten in der Umlaufbahn des Uranus durch die Annahme der Existenz eines bis dato unentdeckten Planeten (vgl. Unterabschnitt 1.2.1). Bei dieser Untersuchung wird die Gültigkeit der Gesetze der Himmelsmechanik vorausgesetzt, und es geht lediglich um die Frage, ob die beobachtete Umlaufbahn des Planeten Uranus auf die Existenz eines bis dato unentdeckten Planeten zurückgeführt werden kann.

1.4 Covering law-Modell und Schluß auf die beste Erklärung

57

Nach diesen Vorüberlegungen wende ich mich nun im folgenden Unterabschnitt der eigentlichen Diskussion der Frage zu, ob sich das covering /aw-Modell als Basis für den Schluß auf die beste Erklärung eignet. Ich beginne damit, daß ich die Konsequenzen untersuche, die sich aus den in Abschnitt 1.3 diskutierten Einwänden gegen das covering /aw-Modell ergeben.

1.4.2

Konsequenzen aus den Einwänden

Alle vier Einwände, die in Abschnitt 1.3 gegen das covering law-Modell der Erklärung vorgebracht wurden, haben unmittelbare Auswirkungen auf dessen Eignung als Basis für den Schluß auf die beste Erklärung. Betrachten wir zunächst Einwand (1.7)(i), der den für das covering /aw-Modell zentralen Begriff des Gesetzes betrifft. Nach diesem Einwand hat es Hempel versäumt, den Gesetzesbegriff in einer befriedigenden Art und Weise zu explizieren, die es insbesondere erlaubt, Gesetze von akzidentellen Verallgemeinerungen und PseudoGesetzen zu unterscheiden, die auf nicht-projizierbare Prädikate Bezug nehmen. Das hieraus resultierende Problem für die Eignung des covering /aw-Modells als Basis für den Schluß auf die beste Erklärung besteht in folgendem: Solange keine befriedigende Explikation des Gesetzesbegriffes zur Verfügung steht, bleibt unklar, bei welchen Aussagen es sich um Gesetze handelt und welche Aussagen lediglich akzidentelle Verallgemeinerungen bzw. Pseudo-Gesetze darstellen. Damit bleibt offen, bei welchen (deduktiven oder induktiv starken) Argumenten es sich um covering /aw-Erklärungen handelt und bei welchen nicht. Das bedeutet, daß im Rahmen des covering law-Modells die Menge der Erklärungen nicht bestimmt werden kann, im Hinblick auf die eine Auswahl zu treffen ist, d. h., aus der die beste covering /aw-Erklärung auszuwählen ist. Und dies hat schließlich zur Folge, daß auf der Basis des covering /aw-Modells kein Schluß auf die beste Erklärung gezogen werden kann - denn es bleibt unklar, worauf überhaupt geschlossen werden soll. Auf diesen Einwand könnten Befürworter des Schlusses auf die beste Erklärung erwidern, daß man von einem philosophischen Projekt nicht verlangen könne, daß es alle Probleme löse, die in seiner Umgebung bestehen. Sowohl bei der Bestimmung des Gesetzesbegriffs als

58

1

Das covering law-Modell der Erklärung

auch bei der Unterscheidung von projizierbaren und nicht-projizierbaren Prädikaten handelt es sich um Grundprobleme der Wissenschaftstheorie, die nicht ausschließlich die Theorie der Erklärung oder den Schluß auf die beste Erklärung betreffen. Befürworter des Schlusses auf die beste Erklärung könnten dementsprechend die Explikation dieser Begriffe an die entsprechenden Zweige der Wissenschaftstheorie delegieren - mit der Hoffnung, daß dort irgendwann eine befriedigende Analyse gelingen möge, die sich mit dem covering Ζανν-Modell und dem Schluß auf die beste Erklärung vereinbaren läßt. Weiterhin könnten sie beschließen, bis zu diesem Zeitpunkt lediglich solche Argumente als covering /aw-Erklärungen zu akzeptieren, deren Explanantia nach intuitiver Einschätzung eindeutige Fälle von Gesetzesaussagen enthalten, und alle anderen Argumente als Erklärungen abzulehnen. Diese Erwiderung der Befürworter des Schlusses auf die beste Erklärung ist natürlich völlig berechtigt. Allerdings löst sie das Problem nicht. Es sei zunächst zugestanden, daß unsere Intuitionen die Auszeichnung einer Klasse von Aussagen erlauben, bei denen es sich eindeutig um Gesetzesaussagen handelt. (Man mag diese klaren Intuitionen als eine nicht zur Disposition stehende Randbedingung betrachten, die jede akzeptable Explikation des Gesetzesbegriffs erfüllen muß.) Offensichtlich folgt hieraus aber nicht, daß es sich bei allen Aussagen, die nicht in diese Klasse fallen, klarerweise nicht um Gesetzesaussagen handelt. Vielmehr wird es eine Klasse von Aussagen G' geben, bei denen es strittig ist, ob sie Gesetzesaussagen darstellen oder nicht. Dieser Umstand zeitigt aber die oben beschriebenen Konsequenzen: Es bleibt offen, ob es sich bei Argumenten, die diese Aussagen G' als Prämissen enthalten, um Erklärungen im Sinne des covering /ävv-Modells handelt. Dadurch bleibt die Menge der covering Ζανν-Erklärungen eines Phänomens unbestimmt. Und somit kann kein Schluß auf die beste Erklärung gezogen werden, da unklar bleibt, welche Erklärung die beste Erklärung des fraglichen Phänomens darstellt und worauf also geschlossen werden soll. Ein ähnliches Problem tritt im Hinblick auf den in Abschnitt 1.3 diskutierten Einwand (1.7)(ii) auf. Nach diesem Einwand sind die Bedingungen des covering Zaw-Modells nicht notwendig für den Erklärungsbegriff: Es gibt viele tatsächliche Erklärungen, die die Bedingungen des covering /aw-Modells nicht erfüllen. Da diese Erklärungen im Rahmen des covering Zaw-Modells nicht einmal als Erklärungen gel-

1.4

Covering law-Modell und Schluß auf die beste Erklärung

59

ten, können sie selbstverständlich bei der Bestimmung der besten Erklärung eines Phänomens nicht in Betracht gezogen werden. Wenn man daher das covering /aw-Modell als Basis für den Schluß auf die beste Erklärung wählt, ist es möglich, daß bei Schlüssen auf die beste Erklärung nicht auf die tatsächlich beste Erklärung geschlossen wird, sondern lediglich auf die beste Erklärung im Sinne des covering lawModells (bzw. auf die Konjunktion der Explanans-Aussagen dieser Erklärung). Es spricht aber selbst für Befürworter des Schlusses auf die beste Erklärung nichts dafür, daß solche Schlüsse wahrscheinlich zu einer wahren Konklusion führen. Denn Befürworter des Schlusses auf die beste Erklärung halten eine Hypothese ja deswegen für wahrscheinlich wahr, weil sie bestimmte Phänomene am besten erklärt. Und diese Bedingung ist hier gerade nicht erfüllt - denn die betreffende Hypothese (die Konjunktion der Explanans-Aussagen) stellt lediglich die beste Erklärung im Sinne des covering law -Modells dar. Dieser Einwand läßt sich auch folgendermaßen formulieren. Wie in der Einleitung zu dieser Arbeit beschrieben (vgl. Schema (0.2) in Abschnitt 0.3), besagt Prämisse Pn+i eines Schlusses auf die beste Erklärung, daß Hypothese E* die beste Erklärung der jeweiligen Explanandum-Phänomene darstellt. Auf diese Hypothese E* wird bei einem Schluß auf die beste Erklärung geschlossen, und dessen Anhänger behaupten dabei, daß ein solcher Schluß von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Wenn man nun das covering Ζανν-Modell der Erklärung als Basis für den Schluß auf die beste Erklärung verwendet, wird diese Voraussetzung in vielen Fällen nicht erfüllt sein: Prämisse Pn+1 wird in vielen Fällen falsch sein, da Hypothese E* zwar die beste covering -Erklärung der betreffenden Explanandum-Phänomene darstellt, nicht aber die tatsächlich beste Erklärung dieser Phänomene. Es muß dann aber selbst für Befürworter des Schlusses auf die beste Erklärung offen bleiben, warum ein solcher Schluß auf die beste covering /aw-Erklärung wahrscheinlich zu einer wahren Konklusion führen sollte - denn schließlich sind nicht einmal alle seine Prämissen wahr. Dieses Problem wird durch den in Abschnitt 1.3 behandelten Einwand (1.7)(iii) verstärkt. Nach diesem Einwand sind die Bedingungen des covering /ow-Modells der Erklärung nicht hinreichend für den Erklärungsbegriff: Viele Argumente, die alle Bedingungen des covering Ζανν-Modells erfüllen, können dennoch nicht als Erklärungen der je-

60

1

Das covering law-Modell der Erklärung

weiligen Explananda angesehen werden. Solche nicht-erklärenden Argumente werden allerdings im Rahmen des covering Zaw-Modells bei der Auswahl der besten Erklärung in Betracht gezogen. Wählt man daher das covering /ow-Modell als Basis für den Schluß auf die beste Erklärung, besteht die Gefahr, daß auf eines dieser nicht-erklärenden Argumente (bzw. auf die jeweilige Konjunktion der Explanans-Aussagen) geschlossen wird. Es stellt sich dann wiederum die Frage, welcher Grund zu der Annahme besteht, daß die betreffenden Schlüsse wahrscheinlich zu einer wahren Konklusion führen. Anhänger des Schlusses auf die beste Erklärung können auf diese Frage erneut keine Antwort liefern. Wie erwähnt betrachten sie eine Hypothese ja deswegen als wahrscheinlich wahr, weil sie die beste Erklärung bestimmter Phänomene darstellt. Diese Bedingung ist hier aber gerade nicht erfüllt - denn die betreffende Hypothese stellt überhaupt keine Erklärung des jeweiligen Explanandums dar. Auch dieser Einwand zeigt somit, daß Prämisse P„+i des Schlusses auf die beste Erklärung in vielen Fällen nicht erfüllt ist, wenn man das covering /aw-Modell der Erklärung als Basis für den Schluß auf die beste Erklärung wählt. Das Problem hat einen weiteren Aspekt, der sich aus dem in Abschnitt 1.3 beschriebenen Einwand (1.7)(iv) gegen das covering lawModell ergibt und der die Lage weiter verschärft. Nach diesem Einwand handelt es sich bei IS-Erklärungen prinzipiell nicht um Erklärungen der jeweiligen Explananda, da innerhalb des covering lawModells nicht einmal sinnvoll von wahren IS-Erklärungen gesprochen werden kann. IS-Erklärungen werden im Rahmen des covering lawModells aber offensichtlich bei der Auswahl der besten Erklärung berücksichtigt. Was die induktive Erklärung von einzelnen Ereignissen betrifft, stellen IS-Erklärungen sogar die einzig mögliche Form der Erklärung dar (vgl. Abschnitt 1.2). Somit wird die beste induktive covering Zaw-Erklärung eines einzelnen Ereignisses immer eine IS-Erklärung sein. Wenn man daher das covering /aw-Modell der Erklärung als Basis für den Schluß auf die beste Erklärung verwendet, so besteht nicht nur (wie in den beiden zuvor genannten Fällen) die Gefahr, daß auf eine Hypothese geschlossen wird, die tatsächlich nicht die beste Erklärung des betreffenden Explanandums darstellt - vielmehr wird zwangsläufig auf eine solche Hypothese geschlossen (auf die Konjunktion der Explanans-Aussagen der betreffenden IS-Erklärung). Mit anderen Worten: Der Schluß auf die beste Erklärung führt, wenn man

1.4 Covering law-Modell und Schluß auf die beste Erklärung

61

ihm das covering ¿ανν-Modell der Erklärung zugrunde legt, nie zu einer Hypothese, die tatsächlich die beste induktive Erklärung des betreffenden einzelnen Ereignisses darstellt. Es entfällt daher für Befürworter des Schlusses auf die beste Erklärung jeder Grund, warum Schlüsse auf die beste induktiv-statistische Erklärung im Sinne des covering Zaw-Modells wahrscheinlich zu einer wahren Konklusion führen sollten. Da eine IS-Erklärung überhaupt keine und somit auch nicht die beste Erklärung des jeweiligen Explanandums darstellt, ist wie in den beiden zuvor diskutierten Fällen Prämisse Pn+i des Schlusses auf die beste Erklärung nicht erfüllt. Diese Überlegungen, die sich aus den in Abschnitt 1.3 diskutierten Einwänden gegen das covering /aw-Modell der Erklärung ergeben, scheinen mir bereits große Zweifel daran zu erlauben, daß sich das covering Zaw-Modell der Erklärung als Basis für den Schluß auf die beste Erklärung eignet. Im folgenden Unterabschnitt werde ich einen weiteren Einwand formulieren, der diese Zweifel noch weiter verstärkt.

1.4.3

Gütekriterien für covering /aw-Erklärungen

In der Einleitung zu dieser Arbeit hatte ich darauf hingewiesen, daß jedes Erklärungsmodell, das als Basis für den Schluß auf die beste Erklärung in Frage kommen will, die Möglichkeit bieten muß, verschiedene Erklärungen im Hinblick auf ihre explanatorische Güte zu vergleichen - denn bei einem Schluß auf die beste Erklärung soll ja nicht auf eine beliebige, sondern auf die beste der verschiedenen möglichen Erklärungen eines Phänomens geschlossen werden. Bei der Diskussion im letzten Unterabschnitt hatte ich zunächst vorausgesetzt, daß das covering /aw-Modell eine solche Möglichkeit bietet. Tatsächlich ist diese Voraussetzung im covering Zaw-Modell aber nicht erfüllt: Es gibt im covering law-Modell keine Kriterien für die Beurteilung der explanatorischen Güte einer Erklärung. Der Begriff der Erklärung im covering Zatv-Modell ist nicht komparativ. Das Modell spezifiziert lediglich notwendige und zusammen hinreichende Bedingungen für den Begriff der Erklärung. Alle Entitäten, die diese Bedingungen erfüllen, sind potentielle Erklärungen des jeweiligen Explanandums. Sind bei einer potentiellen (DN- oder DS-)Erklärung die Prämissen, die das

62

1

Das covering law-Modell der Erklärung

Explanans bilden, wahr, so liegt eine wahre covering /aw-Erklärung vor. Zwischen potentiellen covering /aw-Erklärungen gibt es aber darüber hinaus keinerlei Unterschiede hinsichtlich ihrer explanatorischen Kraft. Das covering /aw-Modell stellt somit keine Kriterien zur Verfügung, aufgrund derer von einer potentiellen Erklärung Ei behauptet werden könnte, sie erkläre das jeweilige Explanandum besser als eine andere potentielle Erklärung E2. Hempel bestimmt zwar explizit den Begriff der empirischen Stützung oder Bestätigung für covering /aw-Erklärungen: Eine gegebene Erklärung gilt als mehr oder weniger stark gestützt oder bestätigt, „wenn ihr Explanans durch die vorliegende Evidenz entsprechend mehr oder weniger stark bestätigt wird" (Hempel 1977: 7 f.; vgl. auch Abschnitt 1.2). Und in diesem Sinne könnte man denken, daß die Begriffe der besseren bzw. besten Erklärung einfach folgendermaßen definiert werden könnten: (1.13) Informelle Definition der Begriffe der besseren und besten Erklärung Seien Ei und E2 potentielle Erklärungen eines Phänomens Ρ im Sinne des covering Ζανν-Modells. (i) Ei ist eine bessere Erklärung von Ρ als E 2 genau dann, wenn gilt: Ei ist durch die vorliegende Evidenz stärker gestützt oder bestätigt als E2. (ii) Ei ist die beste Erklärung von Ρ genau dann, wenn gilt: Es gibt keine potentielle Erklärung E k , die durch die vorliegende Evidenz stärker gestützt oder bestätigt wird als Ei. Eine solche Definition dieser Begriffe ist nach meiner Auffassung aber unangemessen: Der Grad der Stützung bzw. Bestätigung einer gegebenen potentiellen covering /aw-Erklärung betrifft nämlich lediglich die Frage, wie wahrscheinlich die im Explanans auftretenden Gesetzesaussagen und Aussagen über Anfangs- bzw. Randbedingungen vor dem Hintergrund der verfügbaren Daten sind - er hat nichts mit der Frage zu tun, wie gut das Explanans das Explanandum erklärt! Darüber hinaus geht dieses Kriterium an den Erfordernissen des Schlusses auf die beste Erklärung völlig vorbei. Verwendet man dieses Kriterium zur Beurteilung der Güte von covering /aw-Erklärungen, läuft der Schluß auf die beste Erklärung leer. Wie in der Einleitung zu dieser Arbeit beschrieben, treten Anhänger des Schlusses auf

1.4

Covering law-Modell und Schluß auf die beste Erklärung

63

die beste Erklärung ja gerade mit dem Anspruch auf, mit diesem Schlußmuster ein erkenntnistheoretisches Mittel gefunden zu haben, das uns zu wahren bzw. sehr wahrscheinlichen Hypothesen oder Theorien führt. Wir können nicht direkt beobachten, welche Hypothesen oder Theorien wahr bzw. sehr wahrscheinlich sind. Deshalb müssen wir auf indirektem Wege zu diesen Hypothesen bzw. Theorien gelangen - etwa indem wir uns fragen, welche von ihnen die beste Erklärung der Phänomene darstellt. Wenn nun aber die beste Erklärung der Phänomene gerade als diejenige bestimmt wird, die die wahrscheinlichsten Prämissen verwendet, dann sind wir wieder auf die Bestimmung von Wahrscheinlichkeiten zurückgeworfen und keinen Schritt vorangekommen. Man stelle sich zur Illustration einen Wissenschaftler vor, der an Anhänger des Schlusses auf die beste Erklärung die Frage richtet, wie er denn unter den verschiedenen miteinander konkurrierenden Theorien auswählen solle, die in seiner Wissenschaft zur Diskussion stehen. Ihm wird geantwortet: „Schließen Sie einfach auf diejenige Theorie, die die beste Erklärung der Phänomene darstellt." Er fragt nach, woran er denn erkenne, welche Erklärung die beste sei, und erhält als Antwort: „Diejenige Erklärung ist die beste, deren Explanans durch die vorliegende Evidenzmenge am stärksten bestätigt wird." Auf die abermalige Nachfrage, was dies bedeute, wird ihm erwidert: „Dasjenige Explanans wird am stärksten durch die vorliegende Evidenzmenge bestätigt, bei dem die betreffenden Gesetzes- und sonstigen Aussagen am wahrscheinlichsten sind." Der betreffende Wissenschaftler würde ob einer solchen Auskunft wohl nur verwundert und berechtigterweise den Kopf schütteln. Denn die Antwort bedeutet, ihn auf eine Einschätzung der Wahrscheinlichkeiten der im Explanans auftretenden Gesetzes- und sonstigen Aussagen zurückzuwerfen. Er muß bei dieser Auskunft bereits wissen, wonach er gerade gefragt hat - nämlich welche der konkurrierenden Theorien tatsächlich am wahrscheinlichsten ist. Wenn der Schluß auf die beste Erklärung, der gerade zu dem Zweck .erfunden' wurde, ihm bei dieser Entscheidung zu helfen, ihn nun also wieder auf seinen Ausgangspunkt zurückverweist, dann kann man schwerlich behaupten, man habe mit diesem Schlußmuster ein probates erkenntnistheoretisches Werkzeug gefunden. Diese Eigenschaft des covering Ζανν-Modells - das Fehlen von Kriterien zur Beurteilung der explanatorischen Güte einer Erklärung -

64

1

Das covering law-Modell der Erklärung

macht das Modell meiner Ansicht nach als Basis für den Schluß auf die beste Erklärung grundsätzlich ungeeignet. Das covering law-Modell läßt völlig offen, auf welche von verschiedenen potentiellen covering /aw-Erklärungen ein Anhänger des Schlusses auf die beste Erklärung in einem gegebenen Fall schließen soll. In Verbindung mit den zuvor diskutierten Einwänden gegen das covering /aw-Modell als Basis für den Schluß auf die beste Erklärung zeigt dies nach meiner Auffassung, daß sich Befürworter des Schlusses auf die beste Erklärung nach einem anderen Erklärungsmodell umsehen müssen, das für die Zwecke des Schlusses auf die beste Erklärung besser geeignet ist. Ein mögliches anderes Erklärungsmodell - das Vereinheitlichungsmodell der Erklärung - werde ich im nächsten Kapitel diskutieren.

Kapitel 2 Das Vereinheitlichpigsmodell der Erklärung 2.1

Einleitung

Das Auftreten von immer größeren Schwierigkeiten für das im vorigen Kapitel diskutierte covering /aw-Modell der Erklärung führte seit Anfang der siebziger Jahre verstärkt zur Entwicklung alternativer Erklärungsmodelle. Ein solches Modell sieht die wesentliche Funktion von Erklärungen in ihrer Vereinheitlichungsleistung: Erklärungen haben die Funktion, unser Bild von der Welt zu vereinfachen, zu systematisieren, die verschiedenen Phänomene, die wir beobachten, in eine einheitliche Gesamtstruktur einzubetten. Diese Grundidee eines engen Zusammenhangs von Erklärung und Vereinheitlichung findet sich bereits bei Hempel: [...] a worthwhile scientific theory explains an empirical law by exhibiting it as one aspect of more comprehensive underlying regularities, which have a variety of other testable aspects as well, i. e., which also imply various other empirical laws. Such a theory thus provides a systematically unified account of many different empirical laws. (Hempel 1965a: 444; m. H.) 1

Diese Idee von Erklärung als Vereinheitlichung fand bei Hempel allerdings nie Eingang in die explizite Bestimmung des Erklärungsbegriffs, die lediglich die (deduktive oder induktive) Subsumption des Explanandums unter das Explanans fordert, welches wenigstens eine gesetzartige Aussage wesentlich enthalten muß (vgl. Kapitel 1, Abschnitt 1.1). Nach dem Auftreten der beschriebenen Schwierigkeiten für das covering /aw-Modell lag es nahe, diesen Hinweis von Hempel aufzugreifen und Erklärungsmodelle zu entwickeln, die auf dem Vereinheitlichungsbegriff aufbauen. Dies geschah durch eine Reihe von Au1

Vgl. hierzu auch Hempel (1966: 75,77, 83).

66

2 Das Vereinheitlichungsmodell der Erklärung

toren in jeweils verschiedener Ausgestaltung des Vereinheitlichungsbegriffs. Das Projekt wurde durch Michael Friedman (1974) angestoßen und später insbesondere von Philip Kitcher (1981, 1989) weiterentwickelt. Für Friedman wird Vereinheitlichung vereinfacht gesagt dadurch erreicht, daß die Gesamtanzahl an unabhängigen Phänomenen bzw. Gesetzen reduziert wird, die als gegeben akzeptiert werden müssen. Für Kitcher dagegen besteht Vereinheitlichung in der Möglichkeit, möglichst viele akzeptierte Sätze mit möglichst wenigen Argumentmustern herleiten zu können, wobei die verwendeten Argumentmuster zum einen von den Argumenten, die sie instantiieren, eine gewisse Ähnlichkeit erfordern müssen und zum anderen auch untereinander ähnlich sein sollen. Gemeinsam ist den Modellen von Friedman und Kitcher, daß sie eine relativ große Nähe zum covering /aw-Modell der Erklärung zeigen. Insbesondere muß bei beiden Autoren das Explanandum deduktiv aus dem Explanans folgen, der Begriff des gesetzartigen Satzes tritt an prominenter Stelle auf, und in Kitchers Modell werden Erklärungen ebenso wie bei Hempel als Argumente konzipiert. Insofern ist nicht völlig klar, ob es sich bei den beiden Modellen um Versuche handelt, das covering /aw-Modell zu retten, indem man es erweitert und ihm zusätzliche notwendige Bedingungen für Erklärungen hinzufügt; oder ob die Modelle eine völlig andere Erklärungstheorie beschreiben, die sich bereits im Ansatz vom covering /aw-Modell unterscheidet.2 Gemeinsam ist beiden Modellen weiterhin, daß der Begriff der Erklärung global und nicht wie im covering /aw-Modell lokal bestimmt werden muß. Die Frage, ob es sich bei einer vorgeschlagenen, vermeintlichen Erklärung eines Phänomens tatsächlich um eine Erklärung des Phänomens handelt, kann nicht entschieden werden, indem man lediglich auf das fragliche Phänomen und die vorgeschlagene Erklärung schaut. Vielmehr muß man das Gesamtbild ins Auge fassen: Alle oder zumindest viele Phänomene müssen betrachtet und es muß beurteilt werden, ob die vorgeschlagene Erklärung eine Vereinheitlichung unseres Gesamtbildes von diesen Phänomenen erlaubt.

2

Sowohl Friedman (1974: 7 ff.) als auch Kitcher (1989: Abschnitt 1) lehnen das covering /aw-Modell vehement ab, was allerdings vor dem Hintergrund der genannten Ähnlichkeiten nicht sehr Uberzeugend ist.

2.2

Das Erklärungsmodell von Michael Friedman

67

Im Unterschied zum covering Ζανν-Modell der Erklärung, das wie gesehen überhaupt kein Kriterium zur Beurteilung der Güte einer Erklärung anbietet, legen Vereinheitlichungsmodelle ein relativ klares Kriterium zur Einschätzung explanatorischer Güte nahe: Je größer das Maß an Vereinheitlichung, das durch eine Erklärung erzielt wird, desto besser die Erklärung; diejenige Erklärung der Phänomene, die die größte Vereinheitlichung bewirkt, stellt die beste Erklärung der Phänomene dar. Mit diesem Kriterium zur Beurteilung der Güte von Erklärungen ist allerdings auch eine Hauptschwierigkeit von Vereinheitlichungsmodellen benannt: Wie nämlich ist das Maß an Vereinheitlichung zu bestimmen, das eine gegebene Erklärung bezüglich einer Menge von Phänomenen erreicht? In den folgenden beiden Abschnitten werde ich nun die zwei einflußreichsten Vereinheitlichungsmodelle der Erklärung im einzelnen diskutieren. Abschnitt 2.2 beschäftigt sich mit Michael Friedmans, Abschnitt 2.3 mit Philip Kitchers Modell. Ich beginne jeweils mit der Grundidee des Modells, gehe dann zu den Explikationsversuchen dieser Grundidee über, formuliere im Anschluß Einwände gegen das Modell und argumentiere auf der Basis dieser Einwände abschließend, daß und warum sich das Modell nicht als Basis für den Schluß auf die beste Erklärung eignet. 3

2.2

Das Erklärungsmodell von Michael Friedman 2.2.1

Die Grundidee von Friedmans Modell

Trotz der beschriebenen Nähe unterscheidet sich Michael Friedmans Erklärungsmodell in einer Reihe von Punkten vom covering law-Modell der Erklärung. Einer dieser Punkte betrifft das Verhältnis von wissenschaftlicher Erklärung und wissenschaftlichem Verständnis. Nach Friedmans Ansicht besteht eine der zentralen Aufgaben einer Im deutschsprachigen Raum wurden insbesondere von Thomas Bartelborth und Gerhard Schurz Versuche unternommen, den Erklärungsbegriff über den Begriff der Vereinheitlichung zu bestimmen. Für eine Darstellung von Bartelborths Position vgl. (1996a: Kapitel IX; 1996b, 1999); für einen Kommentar zu dieser Position Schurz (1998). Für eine Darstellung von Schurz' Position vgl. (1988, 1997, 1999) und Schurz/Lambert (1994).

68

2

Das Vereinheitlichungsmodell der Erklärung

Erklärungstheorie darin, eine Verbindung zwischen diesen beiden Begriffen herzustellen. Eine Erklärungstheorie muß nicht nur Bedingungen dafür angeben, wann etwas als Erklärung eines Phänomens gilt und wann nicht - sie muß auch zeigen, inwiefern Erklärungen zu Verständnis ßhren. Nicht zuletzt an dieser Anforderung scheitert für Friedman das covering tov-Modell: Eine covering /aw-Erklärung eines Phänomens führt nach Hempel insofern zu einem Verständnis des Phänomens, als sie zeigt, daß das Phänomen vor dem Hintergrund der angeführten Information zu erwarten war (vgl. Kapitel 1, Abschnitt 1.1). In der Erwartbarkeit des zu erklärenden Phänomens kann nach Friedmans Ansicht das Verstehen des Phänomens allerdings nicht bestehen, denn „to have grounds for rationally expecting some phenomenon is not the same as to understand it" (Friedman 1974: 8). Wissenschaftliche Erklärungen können zwar die Angabe von Gründen für die Erwartbarkeit eines Phänomens beinhalten, „but it is not in virtue of the provision of such grounds that they give us understanding" (Friedman 1974: 9; m. H.). Dies wird nach Friedmans Ansicht bewiesen by the well-known examples of prediction via so-called "indicator laws" the barometer and the storm, Koplick spots and measles, etc. In these examples, one is able to predict some phenomenon on the basis of laws and initial conditions, but one has not thereby enhanced one's understanding of why the phenomenon occurred. (Friedman 1974: 8) Das Verhältnis von Erwartbarkeit und Verständnis betrifft einen weiteren Unterschied von Friedmans Modell zu demjenigen Hempels. Nach Friedmans Auffassung macht die Hempelsche Gleichsetzung von rationaler Erwartbarkeit und Verständnis nämlich überhaupt nur Sinn f ü r Erklärungen von einzelnen Ereignissen. Nur hier kann davon gesprochen werden, daß sie auf der Grundlage bestimmter Informationen zu erwarten sind. Im Falle von Regularitäten - „general regularities or patterns of behavior" (Friedman 1974: 9) - ist es dagegen nach Friedmans Ansicht von vornherein sinnlos, das Verständnis dieser Regularitäten über ihre Erwartbarkeit bestimmen zu wollen. Es ist nämlich unklar, was es heißen soll, daß man Regularitäten .erwartet': „Since general regularities do not occur at definite times, there is no

2.2 Das Erklärungsmodell von Michael Friedman

69

question of literally expecting them." (Friedman 1974: 9).4 Dieser Punkt stellt für Friedman einen um so entscheidenderen Einwand gegen das covering Zaw-Modell dar, als nach seiner Auffassung diejenigen Phänomene, die in der Wissenschaft typischerweise zu erklären versucht werden, gerade Regularitäten sind. Erklärungen von einzelnen Ereignissen hält Friedman dagegen für relativ selten; sie kommen seiner Ansicht nach allenfalls in der Geologie oder der Astronomie vor. Phänomene im Sinne von Regularitäten werden nun nach Friedman in der Wissenschaft erklärt, indem sie auf andere, umfassendere Phänomene zurückgefährt oder reduziert werden. Betrachten wir ein vereinfachtes Beispiel. Die übliche Erklärung für das Phänomen, daß Wasser verdampft, wenn es (unter geeigneten Umständen) erhitzt wird, besteht darin, Wasser als eine Ansammlung von Molekülen zu beschreiben, die sich in ständiger Bewegung befinden. Zwischen den Molekülen wirken Kräfte, die die Moleküle bei normalen Temperaturen zusammenhalten. Durch das Erhitzen wird den Molekülen Energie zugeführt, was zu einer Zunahme der Bewegung führt. Bei geeigneter Temperatur nehmen die Moleküle genug Energie auf, um die intermolekularen Kräfte zu überwinden - die Moleküle können nun nicht mehr zusammengehalten werden, fliegen auseinander, und das Wasser wird zu Wasserdampf. Nach Friedmans Auffassung wird bei dieser Erklärung das Phänomen des Verdampfens von Wasser zurückgeführt auf das Verhalten der Moleküle, aus denen das Wasser besteht: „[...] the behavior of water ist reduced to the behavior of molecules." (Friedman 1974: 6). Allerdings bestehen für Friedman Erklärung und Verständnis nicht nur aus der Zurückführung von Phänomenen auf andere Phänomene. Nehmen wir beispielsweise an, es gäbe in einer gegebenen Einzelwissenschaft genau zehn voneinander unabhängige, zu erklärende Phä4

Dieser Punkt ist nach meiner Auffassung nicht ganz unkontrovers, denn auch bei Regularitäten scheint mir in einem übertragenen Sinn von Erwartbarkeit gesprochen werden zu können: Folgt eine engere Gesetzmäßigkeit aus einer oder mehreren weiteren Gesetzmäßigkeiten und haben wir Grund anzunehmen, daß die weiteren Gesetzmäßigkeiten zutreffen, so ist zu erwarten, daß auch die engere Gesetzmäßigkeit zutrifft. Diese Interpretation wird im übrigen bereits durch Friedman selbst mit der Verwendung von „literally" im obigen Zitat nahegelegt.

70

2

Das Vereinheitlichungsmodell

der Erklärung

nomene und diese würden nun auf zehn andere, unabhängige Phänomene zurückgeführt. In diesem Falle würde es sich nach Friedman nicht um eine Erklärung dieser Phänomene handeln, und es wäre durch die Zurückführung auch kein Verständnis der ursprünglichen Phänomene hergestellt worden. Für Friedman muß neben der Zurückführung der Phänomene auf andere Phänomene noch ein weiteres Element hinzutreten, damit von Erklärung und Verständnis gesprochen werden kann. Eine Erklärung liegt erst dann vor, und von Verständnis kann erst dann gesprochen werden, wenn eine Reduktion der Gesamtanzahl an unabhängigen Phänomenen erreicht wird, die als gegeben akzeptiert werden müssen: We don't simply replace one phenomenon with another. We replace one phenomenon with a more comprehensive phenomenon, and thereby effect a reduction in the total number of accepted phenomena. (Friedman 1974: 19; H. d. A.)

Genau hierin - in der Reduktion der Gesamtanzahl an unabhängigen Phänomenen, die akzeptiert werden müssen - besteht nun Erklärung, und genau hierdurch führen Erklärungen zu Verständnis: [...] this is the essence of scientific explanation - science increases our understanding of the world by reducing the total number of independent phenomena that we have to accept as ultimate or given. (Friedman 1974: 15)

Indem wissenschaftliche Erklärungen die Gesamtanzahl an unabhängigen, zu akzeptierenden Phänomenen reduzieren, bewirken sie eine Vereinheitlichung unseres Weltbildes. In diesem treten nun weniger voneinander unabhängige Phänomene auf. Eine Vielzahl von Phänomenen läßt sich auf eine geringe Anzahl von grundlegenden Phänomenen zurückführen, und hierdurch entsteht Verständnis, denn: „A world with fewer independent phenomena is, other things equal, more comprehensible than one with more." (Friedman 1974: 15).5 Betrachten wir zur Illustration nochmals das Beispiel der kinetischen Gastheorie. Diese Theorie erklärt nach Friedman eine Reihe von Gesetzmäßigkeiten im Verhalten von Gasen, die vor der Entwicklung

5

Friedman verwendet die Ausdrücke „understanding", „intelligibility", „comprehensible", wenn er von Verstehen oder Verständnis spricht. Er unterscheidet nicht begrifflich zwischen diesen Ausdrücken, so daß ich davon ausgehe, daß er sie synonym verwendet.

2.2

Das Erklärungsmodell von Michael Friedman

71

der kinetischen Gastheorie durch voneinander unabhängige Gasgesetze beschrieben wurden und als voneinander unabhängige Phänomene galten. Sie tut dies, indem sie diese verschiedenen Phänomene auf das Verhalten von Molekülen zurückführt und zeigt, daß die Phänomene in Wirklichkeit nicht voneinander unabhängig sind. Dadurch erzeugt die kinetische Gastheorie eine Vereinheitlichung dieser Phänomene und führt zu Verständnis: This theory explains phenomena involving the behavior of gases, such as the fact that gases approximately obey the Boyle-Charles law, by reference to the behavior of the molecules of which gases are composed. For example, we can deduce that any collection of molecules of the sort that gases are, which obeys the laws of mechanics will also approximately obey the Boyle-Charles law. How does this make us understand the behavior of gases? I submit that if this were all the kinetic theory did we would have added nothing to our understanding. We would have simply replaced one brute fact with another. But this is not all the kinetic theory does - it also permits us to derive other phenomena involving the behavior of gases, such as the fact that they obey Graham's law of diffusion and (within certain limits) that they have the specific-heat capacities that they do have, from the same laws of mechanics. The kinetic theory effects a significant unification in what we have to accept. Where we once had three independent brute facts [...] we now have only one [...]. (Friedman 1974: 14; m. H. außer „unification") Die kinetische Gastheorie bewirkt nach Friedman aber nicht nur eine Vereinheitlichung unserer Theorie über Gase, indem sie drei Gasgesetze miteinander verbindet und auf einen gemeinsamen Ursprung die Gesetze der Mechanik - zurückführt. Sie führt darüber hinaus zu einer noch größeren Vereinheitlichung, indem sie es erlaubt, das Verhalten von Gasen mit intuitiv völlig verschiedenen Phänomenen in Verbindung zu bringen - beispielsweise mit der Planetenbewegung und mit dem Verhalten von fallenden Körpern nahe der Erde: Furthermore, the kinetic theory also allows us to integrate the behavior of gases with other phenomena, such as the motions of the planets and of falling bodies near the earth. This is because the laws of mechanics also permit us to derive both the fact that planets obey Kepler's laws and the fact that falling bodies obey Galileo's laws. From the fact that all bodies obey the laws of mechanics it follows that the planets behave as they do, falling bodies behave as they do, and gases behave as they do. Once again, we have reduced a multiplicity of unexplained, independent phenomena to one. (Friedman 1974: 15; H. d. A.)

72

2

Das Vereinheitlichungsmodell

der Erklärung

Die Gesetze der Mechanik erlauben somit eine Reduzierung der Anzahl unabhängiger Phänomene, indem sie zum einen Phänomene aus ein und demselben Bereich - der Theorie der Gase - vereinheitlichen und indem sie zum anderen Phänomene aus diesem Bereich und aus den Bereichen der Planetenbewegung und der Fallbewegung in Erdnähe vereinheitlichen.6 Neben diesen drei Aspekten des Friedmanschen Modells - Erklärung und Verstehen müssen zusammen betrachtet werden, die Explananda bestehen aus Regularitäten, Erklärung bzw. Verständnis entsteht durch die Reduktion der Gesamtanzahl von unabhängigen Phänomenen - ist ein weiterer Punkt von grundlegender Bedeutung: Die Art von Verständnis, das wissenschaftliche Erklärungen im Sinne Friedmans erzeugen, betrifft nicht einzelne zu erklärende Phänomene, sondern unser gesamtes Weltbild: On the view of explanation that I am proposing, the kind of understanding provided by science is global rather than local. Scientific explanations do not confer intelligibility on individual phenomena [...]. However, our overall understanding of the world is increased; our total picture of nature is simplified via a reduction in the number of independent phenomena that we have to accept as ultimate. (Friedman 1974: 18; m. H.)

Ob eine Erklärung eines Phänomens vorliegt, läßt sich also nicht entscheiden, indem man sich lediglich das zu erklärende Phänomen und die dafür angebotene, vermeintliche Erklärung anschaut. Vielmehr muß untersucht werden, ob die potentielle Erklärung mehrere Phänomene auf wenige oder ein einziges Phänomen reduziert. Streng genommen macht es also keinen Sinn, von der Erklärung eines Phänomens zu sprechen. Dies kann nur in einem übertragenen Sinn verstanden werden: Haben wir eine Erklärung E für eine Menge von Phänomenen P¡, die diese auf andere Phänomene geringerer Anzahl zurückführt, so ist E auch eine Erklärung für jedes Phänomen P¡.

6

In diesem Sinne könnte man mrratheoretische Vereinheitlichung und miertheoretische Vereinheitlichung von Phänomenen unterscheiden: Im ersten Fall werden Phänomene vereinheitlicht, die intuitiv zum selben Phänomenbereich gehören (beispielsweise Verhalten von Gasen); im zweiten Fall werden Phänomene vereinheitlicht, die intuitiv zu verschiedenen Phänomenbereichen gehören (beispielsweise Verhalten von Gasen, Verhalten von Planeten, Verhalten von fallenden Körpern nahe der Erde).

2.2

Das Erklärungsmodell

von Michael Friedman

73

Ebensowenig macht es für Friedman Sinn, vom Verständnis eines einzelnen Phänomens zu sprechen und zu behaupten, eine Erklärung eines Phänomens führe, indem sie das gegebene Phänomen auf andere Phänomene reduziere, zu einem Verständnis des Phänomens. Die Art von Verständnis, das Erklärungen im Sinne Friedmans erzeugen, betrifft die gesamte Welt oder Natur und nicht lediglich ein einzelnes Phänomen. Verständnis betrifft „the relation of the phenomena in question to the total set of accepted phenomena" (Friedman 1974: 18; m. H.). Nach Friedmans Ansicht ist es gerade dieser Umstand - die Vernachlässigung des globalen Aspektes wissenschaftlicher Erklärung und wissenschaftlichen Verständnisses - , an dem andere Erklärungstheorien scheitern. Wenn man sein Augenmerk nur auf den lokalen Aspekt von Erklärung richtet - auf die Beziehung zwischen dem erklärenden und dem zu erklärenden Phänomen - , dann muß man nach Friedman dem erklärenden Phänomen zwangsläufig einen „special epistemological status" (Friedman 1974: 18) zusprechen. Dieser besteht dann je nach Modell in der Vertrautheit, der Natürlichkeit, der Notwendigkeit usw. des erklärenden Phänomens. Wenn man andererseits den globalen Aspekt von Erklärung betont, können die grundlegenden Phänomene, auf die alle anderen reduziert werden, so „stränge, unfamiliar, and unnatural" sein, wie man will - „even as strange as the basic facts of quantum mechanics" (Friedman 1974: 18). Die Grundidee von Friedmans Erklärungsmodell - Erklärung besteht in der Reduktion der Gesamtanzahl voneinander unabhängiger Phänomene, die akzeptiert werden müssen - klingt zunächst plausibel. Es ist allerdings klar, daß sein Modell mit der Frage steht und fällt, inwieweit diese Idee präzisiert werden kann. Friedman ist sich dieses Umstands sehr wohl bewußt und versucht im letzten Teil seines Artikels, die intuitiv verwendeten Grundbegriffe seiner Position zu explizieren (vgl. Friedman 1974: 15-18). Hierauf gehe ich im folgenden Unterabschnitt ein.

2.2.2

Explikation der Grundidee

Friedman beginnt die Explikation seiner Grundidee damit, daß er Phänomene - „general uniformities or patterns of behavior" (Friedman 1974: 15) - durch gesetzartige Sätze repräsentiert. Statt von der Ge-

74

2

Das Vereinheitlichungsmodell

der

Erklärung

samtanzahl unabhängiger Phänomene kann also von der Gesamtanzahl an (logisch) unabhängigen, gesetzartigen Sätzen gesprochen werden. Weiterhin geht Friedman davon aus, daß es zu jedem Zeitpunkt eine Menge Κ von gesetzartigen Sätzen gibt, die von der wissenschaftlichen Gemeinschaft akzeptiert werden, wobei er Κ als im folgenden Sinne deduktiv abgeschlossen auffaßt: Κ enthält alle gesetzartigen Konsequenzen von Elementen von K.7 Die Elemente von Κ werden dann im folgenden auch als „Gesetze" bezeichnet. Auf der Basis dieser Annahmen reformuliert Friedman das Grundproblem dann folgendermaßen: Wann erlaubt ein gesetzartiger Satz die Reduktion der Gesamtanzahl an (logisch) unabhängigen, gesetzartigen Sätzen aus Κ (vgl. Friedman 1974: 16)?8 Offensichtlich ist es für die Entscheidung dieser Frage notwendig, daß man in der Lage ist, gesetzartige Sätze zu zählen. Dies bedeutet insbesondere, daß man feststellen können muß, wann es sich bei einem gegebenen Satz um einen einzigen gesetzartigen Satz und wann es sich um eine Konjunktion aus zwei oder mehreren gesetzartigen Sätzen handelt. Betrachten wir noch einmal das Beispiel der kinetischen Gastheorie und nehmen wir an, Κ enthalte das Boyle-Charles Gesetz (BCG), Grahams Gesetz (GrG), Galileos Gesetz des freien Falls (GaG) und die Keplerschen Gesetze (Ki, K2, K3). Nehmen wir weiter an, S' sei die Konjunktion der Gesetze der Newtonschen Mechanik. Nach intuitiver Einschätzung erlaubt S' die Reduktion der Gesamtanzahl unabhängiger Sätze in K, da eine bestimmte Anzahl 7

Man beachte, daß es sich hierbei nicht um die übliche Auffassung von deduktiver Abgeschlossenheit handelt, nach der alle Konsequenzen von Elementen von Κ (und nicht lediglich die gesetzartigen Konsequenzen) wiederum Elemeng te von Κ wären. Beim Ansetzen der Menge Κ handelt es sich natürlich um eine Idealisierung: Was ist die wissenschaftliche Gemeinschaft? Die Menge aller Einzelwissenschaftler aus allen wissenschaftlichen Disziplinen? Oder nur die Menge der .besten' Einzelwissenschaftler? Sollte nicht lieber von je nach wissenschaftlicher Disziplin verschiedenen wissenschaftlichen Gemeinschaften gesprochen werden? Wo und wann trifft sich die wissenschaftliche Gemeinschaft, um sich über die Elemente von Κ zu einigen? Wer ermittelt die gesetzartigen Folgerungen aus diesen Elementen und bestimmt so den Umfang von K? Gehören zu einer Wissenschaft nicht mehr Dinge als gesetzartige Sätze? Anders ausgedrückt: Geht Friedman nicht von einem überholten Theorienverständnis aus (Theorien als Mengen von Sätzen/Gesetzen)?

2.2

Das Erklärungsmodell von Michael Friedman

75

von Sätzen durch weniger Sätze ersetzt werden kann: Die Menge Σ* = {BCG, GrG, GaG, K,, K2, K3} kann durch {S*} ersetzt werden. Betrachten wir nun die Konjunktion aus BCG, GrG, GaG, Ki, K 2 und K3, und nennen wir diesen Satz S*. Hier würden wir nach intuitiver Einschätzung sagen, daß S* nicht die Reduktion der Gesamtanzahl an unabhängigen Sätzen aus Κ erlaubt, obwohl natürlich wie im vorigen Fall die Menge Σ* durch {S*} ersetzt werden kann.9 Als Ausweg aus diesem Problem führt Friedman nun den Begriff der unabhängigen Akzeptierbarkeit von Sätzen ein. Friedman bietet zwar keine Definition dieses Begriffs, er stellt allerdings zwei notwendige Bedingungen für unabhängig akzeptierbare Sätze auf, die auf der folgenden Grundidee aufbauen: Ist ein Satz Si unabhängig von einem Satz S 2 akzeptierbar, so gibt es hinreichende Gründe für das Akzeptieren von Sj, die nicht zugleich hinreichende Gründe für das Akzeptieren von S 2 sind. Die beiden Bedingungen lauten dann: (2.1)

(1)

Gilt S ι bar.

S2, so ist S ! nicht unabhängig von S 2 akzeptier-

(2)

Ist Si nicht unabhängig von S 2 akzeptierbar, so gilt nicht: Si ist unabhängig von S 3 akzeptierbar und S 2 => S 3 .

Unter der plausiblen Annahme, daß hinreichende Gründe für das Akzeptieren eines Satzes S zugleich hinreichende Gründe für das Akzeptieren jeder Folgerung aus S sind, leuchtet Bedingung (1) unmittelbar ein: Wird S 2 von S t impliziert, so ist Si nicht unabhängig von S 2 akzeptierbar; denn akzeptiert man Sj, so muß man - da Si S 2 impliziert auch S 2 akzeptieren. Bedingung (2) leuchtet ebenso ein: Wenn S! nicht unabhängig von S 2 akzeptierbar ist, so muß man S 2 akzeptieren, 9 Dieses Beispiel wird von Friedman (1974: 16) diskutiert. Es ist allerdings aus mehreren Gründen nicht besonders glücklich: Erstens können die erwähnten Gesetze nicht durch die Gesetze der Mechanik allein ersetzt werden, da weitere Annahmen eingehen (beispielsweise, daß ein Gas aus Molekülen aufgebaut ist). Zweitens folgen die erwähnten Gesetze nicht aus den Gesetzen der Mechanik es folgt lediglich, daß sie approximativ gelten (beispielsweise bewegen sich die Planeten nicht wirklich auf Ellipsenbahnen um die Sonne). Drittens handelt es sich bei S' ebenfalls um eine Konjunktion aus verschiedenen Gesetzen und nicht um ein einziges Gesetz (wahrscheinlich meint Friedman mit den „laws of mechanics" (Friedman 1974: 16) die drei Newtonschen Axiome und das Gravitationsgesetz).

76

2

Das Vereinheitlichungsmodell der Erklärung

falls man Si akzeptiert; und wenn S2 => S 3 , so muß man - falls man Si akzeptiert - auch S3 akzeptieren, so daß Si nicht unabhängig von S 3 akzeptierbar ist (bzw. falls man Si akzeptieren kann, ohne S 3 zu akzeptieren, kann nicht S 2 => S 3 gelten).10 Mit Hilfe des Begriffs der unabhängigen Akzeptierbarkeit definiert Friedman nun einige weitere Begriffe: Unter einer Zerlegung eines Satzes S versteht er eine Menge Σ von Sätzen, für die gilt: (i) Σ ist logisch äquivalent zu S, und (ii) jedes σ e Σ ist unabhängig von S akzeptierbar. Im Hinblick auf das bereits erwähnte Beispiel gilt also: Ist S* die Konjunktion aus BCG, GrG, GaG, Ki, K2 und K3, so ist die Menge Σ* = {BCG, GiG, GaG, K,, K2, K3} eine Zerlegung von S*, da Σ* logisch äquivalent zu S* und jedes σ* e Σ* unabhängig von S* akzeptierbar ist. Ist andererseits S' die Konjunktion der Newtonschen Axiome und des Gravitationsgesetzes, so ist Σ* keine Zerlegung von

S' - zwar gilt weiterhin, daß jedes σ* ε Σ* unabhängig von S' akzeptierbar ist, allerdings ist Σ* nicht logisch äquivalent zu S \ Weiterhin soll ein Satz S K-atomar heißen, wenn er keine Zerlegung in Κ hat. Das bedeutet also: S ist K-atomar genau dann, wenn es keine zu S logisch äquivalente Menge Σ von gesetzartigen Sätzen aus Κ gibt, die unabhängig von S akzeptierbar sind. Im obigen Beispiel ist S* also nicht K-atomar. Dasselbe gilt für S', denn die Menge der Newtonschen Axiome und des Gravitationsgesetzes ist eine Zerlegung vonS'." Unter einer K-Zerlegung einer Menge Σ von Sätzen versteht Friedman nun eine Menge Γ von K-atomaren Sätzen, die logisch äquivalent 10

Friedmans eigene Formulierung von Bedingung (2) lautet: „(2) If S is acceptable independently of Ρ and Q P, then S is acceptable independently of Q." (Friedman 1974: 16). Mit anderen Worten: Ist S unabhängig von Ρ akzeptierbar und gilt Q => P, so ist S unabhängig von Q akzeptierbar. Ich habe für die Darstellung die Kontraposition gewählt, die mir den Gedanken einfacher auszudrucken scheint. " Friedman (1974: 17) fordert bei der Einführung des Begriffs „K-atomar" nicht explizit, daß die Elemente einer möglichen Zerlegung Elemente von Κ - und damit akzeptierte gesetzartige Sätze - sein müssen. Es scheint mir aber aus dem Vorhergehenden und aus seiner Benennung des Begriffs ersichtlich zu sein, daß er dies meint. Vgl. hierzu auch Salmon (1989: 96), der bei der Darstellung von Friedmans Theorie ebenfalls fordert, daß die Elemente einer möglichen Zerlegung aus Κ sein müssen, allerdings nicht darauf hinweist, daß diese Forderung von ihm hinzugefügt wurde und bei Friedman nicht explizit zu finden ist.

2.2 Das Erklärungsmodell von Michael Friedman

77

zu Σ ist. Zu einem gegebenen Satz S kann man also zunächst eine .gewöhnliche' Zerlegung Σ finden und dann eine zu dieser Zerlegung logisch äquivalente Menge Γ von K-atomaren Sätzen. Wenn man annimmt, daß die Elemente von Σ* = {BCG, GiG, GaG, K,, K 2 , K 3 } K-atomar sind, so wäre Σ* eine K-Zerlegung von sich selbst. Weiterhin würde in diesem Fall auch gelten, daß Σ* eine K-Zerlegung der Einermenge von S* ist, d. h. also eine K-Zerlegung der Einermenge der Konjunktion von BCG, GrG, GaG, Ki, K 2 und K 3 . Ebenso wäre unter der Annahme, daß die Newtonschen Axiome und das Gravitationsgesetz K-atomar sind - die Menge der Newtonschen Axiome und des Gravitationsgesetzes eine K-Zerlegung von sich selbst und eine K-Zerlegung der Einermenge von S'. Bei der Einführung des Begriffs der K-Zerlegung macht Friedman darüber hinaus die nicht-triviale Annahme, daß es zu jeder Menge von Sätzen eine K-Zerlegung gibt. Zu einer gegebenen Menge Σ von Sätzen kann es nun mehrere K-Zerlegungen r ¡ geben, die verschieden viele Elemente enthalten. Friedman ist besonders an derjenigen K-Zerlegung r k von Σ interessiert, die die geringste Anzahl an K-atomaren Sätzen enthält (falls es eine einzige solche K-Zerlegung gibt; ansonsten sind diejenigen KZerlegungen interessant, die gleichwenig Elemente enthalten). Hierfür definiert er den Begriff der K-Kardinalität einer Menge Σ von Sätzen: K - K a r d © = inf{Kard(r): Γ ist eine K-Zerlegung von Σ}. Mit anderen Worten: Die K-Kardinalität einer Menge Σ von Sätzen ist die Kardinalität derjenigen K-Zerlegung von Σ, die die wenigsten Elemente enthält (bzw. im Falle von Nicht-Einzigkeit: die Kardinalität derjenigen K-Zerlegungen mit den wenigsten Elementen). Im obigen Beispiel ist Σ* eine K-Zerlegung von {S*}. Σ* enthält 6 Elemente. Es gibt also eine K-Zerlegung von {S*}, deren Kardinalität 6 ist. Es gilt daher: K-Kard({S*}) < 6 (die K-Kardinalität von {S*} ist kleiner oder gleich 6).

Auf der Grundlage dieser Begriffe kann nun der Begriff der Reduktion bestimmt werden: (2.2)

Der Begriff der Reduktion Ein Satz S reduziert eine Menge Σ von Sätzen genau dann, wenn gilt: Die K-Kardinalität von Σ υ { 8 } ist kleiner als die K-Kardinalität von Σ.

78

2 Das Vereinheitlichungsmodell der Erklärung

Ein Satz S reduziert eine Menge von Sätzen Σ also genau dann, wenn es eine K-Zerlegung von Σ U {S} gibt, die weniger Elemente enthält als jede K-Zerlegung von Σ; d. h., wenn es eine Menge von K-atomaren Sätzen gibt, die logisch äquivalent z u I U { S ) ist und weniger Elemente enthält als jede Menge von K-atomaren Sätzen, die logisch äquivalent zu Σ ist. Im betrachteten Beispielfall reduziert S* (die Konjunktion aus BCG, GrG, GaG, K h K 2 und K 3 ) die Menge Σ* = {BCG, GrG, GaG, Ki, K 2 , K 3 } also nicht, denn Σ* kJ (S*} ist lediglich die Erweiterung von Σ* um die Konjunktion ihrer Elemente, so daß es keine K-Zerlegung von Σ* kJ{S*} geben kann, die weniger Elemente enthält als jede K-Zerlegung von Σ*. Andererseits wird Σ* aber von S' (der Konjunktion aus den drei Newtonschen Axiomen und dem Gravitationsgesetz) reduziert, wie das folgende Argument zeigt (seien Ni, N 2 und N 3 die Newtonschen Axiome und GravG das Gravitationsgesetz): (2.3)

(i)

{Ni, N2, N 3 , GravG} ist eine K-Zerlegung von Σ* U f S ' } - denn jedes σ € {Ν], N 2 , N 3 , GravG} ist K-atomar, und (N,, N 2 , N 3 , GravG} ist logisch äquivalent zu Σ* U (S'}. (ii) Die Kardinalität von {Ni, N2, N 3 , GravG} ist gleich 4. (iii) Die K-Kardinalität von Σ* U { S ' } ist kleiner oder gleich 4 - wegen (i) und (ii). (iv) Die K-Kardinalität von Σ* ist gleich 6 (unter der Annahme, daß es keine K-Zerlegung von Σ* mit weniger als 6 Elementen gibt). (v) K - K a r d ^ * U (S'}) < K-Kard^*) - wegen (iii) und (iv).

Dies ist ein erwünschtes Resultat: Die Konjunktion aus BCG, GrG, GaG, K,, K 2 und K 3 reduziert die Menge {BCG, GrG, GaG, K,, K 2 , K 3 } nicht; andererseits wird diese Menge durch die Konjunktion der Newtonschen Axiome und des Gravitationsgesetzes reduziert. Kommen wir nun zurück zu Friedmans Grundidee: Erklärung besteht in der Reduzierung der Gesamtanzahl an unabhängigen Sätzen, die akzeptiert werden müssen. Im Hinblick auf welche Menge von Sätzen soll eine Reduzierung stattfinden? Bei Friedmans ursprünglicher Beschreibung der Grundidee schien es sich bei dieser Menge um K, d. h. um die Menge der von der wissenschaftlichen Gemeinschaft akzeptierten gesetzartigen Sätze zu handeln. Friedman wandelt die ursprüngliche Idee nun allerdings ab, indem er für eine Entität Si, die

2.2

Das Erklärungsmodell

von Michael

Friedman

79

eine Entität S 2 erklären soll, fordert, sie solle die Menge derjenigen Konsequenzen von S¡ reduzieren, die unabhängig von S¡ akzeptierbar sind. Diese Menge nennt er Konsic(Si). Beispielsweise handelt es sich seiner Meinung nach bei den Newtonschen Gesetzen um einen guten Kandidaten für eine Erklärung des Boyle-Charles Gesetzes, da die Newtonschen Gesetze die Menge ihrer Konsequenzen reduzieren, die unabhängig von ihnen akzeptierbar sind. Andererseits handelt es sich bei der Konjunktion des Boyle-Charles Gesetzes und des Grahamschen Gesetzes nicht um einen guten Kandidaten für eine Erklärung des Boyle-Charles Gesetzes, da diese Konjunktion die Menge ihrer Konsequenzen nicht reduziert, die unabhängig von ihr akzeptierbar sind.12 Auf der Grundlage dieser Überlegungen erwägt Friedman nun die folgende Definition des Erklärungsbegriffs: (2.4)

Definition (Dl) des

Erklärungsbegriffs

Si erklärt S 2 genau dann, wenn gilt: (i) S 2 e Kons K (S,); (ii) S, reduziert Kons K (Si). Nach dieser Definition erklärt ein Satz Si einen Satz S 2 also genau dann, wenn S 2 eine Konsequenz von Si und unabhängig von S] akzep-

12

Bei der Namensgebung der Menge Konsx(S) ist das tiefgestellte „K" auffällig. Man könnte versucht sein, dies so zu interpretieren, daß KonsK(S) die Menge deijenigen unabhängig von S akzeptierbaren Sätze ist, die Konsequenzen von S bezüglich Κ sind, d. h. Konsequenzen aus S und K. (Somit wäre KonsR(S) eine umfangreichere Menge.) Dies ist die Interpretation, die van Fraassen wählt, wenn er schreibt: „Here A is called a consequence of Β [d. h. von S] relative to Κ exactly if A is a consequence of Β and Κ together." (van Fraassen 1980: 110; m. H.). Diese Interpretation scheint mir aber falsch zu sein. Friedman schreibt zur Einführung dieser Menge: „I think that the relevant set we want S to reduce is the set of independently acceptable consequences of S (con^S))." (Friedman 1974: 17; H. d. Α.). Hier ist also nur die Rede von Sätzen, die Konsequenzen von S allein sind. Seine allgemeine Bestimmung erläutert Friedman dann am bereits erwähnten Beispiel: „[...] Newton's laws reduce the set of their independently acceptable consequences - the set containing Boyle's law, Graham's law, etc." (Friedman 1974: 17; m. H.). Hier ist wiederum nur die Rede davon, daß Boyles Gesetz und Grahams Gesetz Konsequenzen von Newtons Gesetzen sind, nicht von Newtons Gesetzen und Κ zusammen.

80

2

Das Vereinheitlichungsmodell der Erklärung

tierbar ist und wenn Si die Menge seiner Konsequenzen reduziert, die unabhängig von ihm akzeptierbar sind. Definition (Dl) hält Friedman allerdings nicht für angemessen, denn aus ihr ergibt sich folgende Konsequenz: Wenn Si gemäß der Definition S 2 erklärt und S 3 ein anderes unabhängig akzeptierbares Gesetz ist, dann wird die Konjunktion von S) und S3, d. h. (Si λ S3), S 2 nicht erklären, da (Si Λ S 3 ) die Menge der unabhängig von (Si a S 3 ) akzeptierbaren Konsequenzen nicht reduzieren wird. Diese Konsequenz hält Friedman nicht für wünschenswert, denn „why should the conjunction of a completely irrelevant law to a good explanation destroy its explanatory power?" (Friedman 1974: 17). Aus diesem Grand schlägt er eine andere Definition des Erklärungsbegriffs vor, die der Intention nach die erste Definition abschwächen soll:13 (2.5)

Definition (Dl ') des Erklärungsbegriffs Si erklärt S 2 genau dann, wenn gilt: Es gibt eine Zerlegung Σ von S) und ein o¡ ε Σ, so daß gilt: (i) S 2 e KonsK(a¡); (ii) o¡ reduziert KonsK(o¡).

Nach dieser Definition kann nun ein Satz (Si Λ S 3 ) einen Satz S 2 erklären, obwohl S 3 für diese Zwecke gänzlich irrelevant ist und lediglich Si die Menge KonsK(Si) reduziert (von der S 2 ein Element ist). Denn: {Si, S 3 } ist eine Zerlegung von (S( Λ S3), d. h., {Si, S 3 } ist logisch äquivalent zu (S| Λ S 3 ) und Si und S 3 sind unabhängig von (Sj Λ S 3 ) akzeptierbar; es gibt ein σ, e {Si, S 3 }, nämlich Si; und es gilt nach Voraussetzung: S 2 e KonsK(Si), und S) reduziert die Menge KonsK(S,).14

13

In der Fortsetzung des letzten Zitats schreibt Friedman (1974: 17; m. H.): „So I will weaken (Dl) to [...]", worauf Definition (DI') folgt. Dieser Punkt wird in Unterabschnitt 2.2.3 eine wichtigeRolle spielen, da es sich bei (DI') nicht um eine Abschwächung von (Dl) handelt. Wie Friedman betont, hat Definition (DI') das wünschenswerte Resultat, daß die Konjunktion zweier unabhängiger Gesetze nicht ihre Konjunkte erklären kann. Denn zwar ist {G|, G 2 } eine Zerlegung von (G| Λ G 2 ), und es gilt G ι ε {Gì, G2)· Allerdings gilt nicht: Gì e Konsx(Gi) — denn G] ist nicht unabhängig von Gi akzeptierbar. (Analoges gilt natürlich für G 2 .)

2.2

Das Erklärungsmodell von Michael Friedman

81

Einige erläuternde Bemerkungen zu diesen Definitionen scheinen angebracht: Erstens handelt es sich in Friedmans Modell - nach beiden Definitionen - sowohl bei Erklärungen als auch bei den zu erklärenden Entitäten um Sätze. Nach (Dl) muß eine Erklärung S! einer zu erklärenden Entität S 2 eine bestimmte Menge, nämlich KonsK(Si), reduzieren; und nach der Definition von „reduzieren" kommen damit für Si nur Sätze in Frage. Nach (DI') muß es zu einer Erklärung S] eine Zerlegung geben; und nach der Definition von „Zerlegung" kommen für Si wiederum nur Sätze in Frage. Wird eine Entität S 2 von einem Satz Si erklärt, so gilt entweder, nach (Dl), daß S 2 e KonsK(Si), oder, nach (DI'), daß S 2 e K o n s u l ) (wobei σι Element einer Zerlegung von S! ist) - in beiden Fällen muß S 2 ein Satz sein. Zweitens handelt es sich sowohl bei erklärenden als auch bei zu erklärenden Sätzen um gesetzartige Sätze - denn jene müssen aus Κ sein, und Κ ist die Menge der akzeptierten gesetzartigen Sätze.15 Drittens besteht eine notwendige Bedingung dafür, daß ein Satz S 2 von einem anderen Satz Sj erklärt wird, darin, daß S 2 aus einem anderen Satz deduktiv folgt entweder, gemäß (Dl), aus dem erklärenden Satz Si, oder, gemäß (DI'), aus einem Satz, der ein Element einer Zerlegung von Si ist. Friedmans Explikationsversuch seiner Grundidee, den ich hier nur in knapper Form darstellen konnte, sieht sich ebenso wie die Grundidee selbst ernsthaften Einwänden ausgesetzt. Hierauf gehe ich im nächsten Unterabschnitt ein.

2.2.3

Einwände gegen Friedmans Modell

Die Grundidee In Friedmans Forderung nach Gesetzartigkeit von Explanans und Explanandum und nach einer deduktiven Beziehung zwischen ihnen zeigt sich eine große Nähe zum deduktiv-nomologischen Erklärungstyp des covering /aw-Modells. Bei einer DN-Erklärung einer Gesetz15

Daß es sich um gesetzartige Sätze handeln muß, folgt nicht explizit aus den dargestellten Definitionen. Dies liegt daran, daß diese informell gehalten sind und nicht jede ihrer Voraussetzungen explizit machen. Es geht allerdings bereits aus Friedmans Grundidee hervor, daß es sich bei den zu erklärenden Entitäten um gesetzartige Sätze handelt, die wiederum auf allgemeinere gesetzartige Sätze reduziert werden sollen.

82

2 Das Vereinheitlichungsmodell der Erklärung

mäßigkeit handelte es sich ja gerade um ein Argument, bei dem die zu erklärende Gesetzmäßigkeit aus einer oder mehreren anderen Gesetzmäßigkeiten deduktiv abgeleitet wurde (vgl. Kapitel 1, Abschnitt 1.2).16 Daher kann man Friedmans Ansatz so verstehen, daß er den deduktiv-nomologischen Erklärungstyp aus dem covering /aw-Modell Ubernimmt, ihn auf die Erklärung von Gesetzmäßigkeiten einschränkt und um eine weitere Bedingung - Vereinheitlichung - ergänzt. Andererseits zeigen sich in diesen beiden Forderungen auch zwei wesentliche Unterschiede zum covering /aw-Modell. Denn in Friedmans Modell können ja zum einen nur Gesetzmäßigkeiten, nicht aber einzelne Ereignisse erklärt werden. Und zum anderen schließt sein Modell die Möglichkeit von induktiven Erklärungen aus, d. h. von Erklärungen, bei denen das Explanandum bezüglich des Explanans lediglich sehr wahrscheinlich (oder sogar unwahrscheinlich) ist. Es gibt in Friedmans Modell also keine Erklärungen, die Hempels induktivstatistischen Erklärungen entsprechen. Diese Eigenschaften von Friedmans Modell haben einige unerwünschte Konsequenzen. Zunächst einmal ist das Modell für dieselben Einwände anfällig, die in Kapitel 1 gegen das covering Ζανν-Μοdell im Hinblick auf den Gesetzesbegriff vorgebracht wurden. Friedman liefert für diesen Begriff ebensowenig eine befriedigende Explikation wie Hempel. Da der Gesetzesbegriff in Friedmans Modell eine zumindest ebenso zentrale Rolle einnimmt wie im covering ίανν-Μοdell, stellt das Fehlen einer befriedigenden Explikation dieses Begriffs einen schwerwiegenden Nachteil des Modells dar. Weiterhin erscheint die Einschränkung des Erklärungsbegriffs auf Gesetzmäßigkeiten nicht vorteilhaft. Wie in Unterabschnitt 2.2.1 beschrieben, ist Friedman der Ansicht, daß dasjenige, was uns bei einer Erklärung tatsächlich interessiert, nicht die Erklärung eines einzelnen Ereignisses ist, sondern die Frage, warum dieses Ereignis - wenn die gleichen Umstände vorliegen - immer eintritt. Diese Einschätzung mag plausibel erscheinen, wenn man an die Erklärung der Periodendauer eines mathematischen Pendels oder an die Erklärung des Verdampfens von Wasser denkt. Was uns in diesen Fällen interessiert, ist möglicherweise nicht die Periodendauer dieses bestimmten Pendels 16

Entsprechendes gilt für deduktiv-statistische Erklärungen, die Friedman allerdings nicht explizit behandelt.

2.2 Das Erklärungsmodell von Michael Friedman

83

bzw. warum diese Wassermenge verdampft, sondern die Frage, warum alle Pendel einer bestimmten Länge diese Periodendauer haben bzw. warum alle Wasserproben bei ausreichendem Erhitzen verdampfen. Friedmans Einschätzung erscheint allerdings überhaupt nicht plausibel, wenn man an Ereignisse wie etwa das Auftreten einer totalen Sonnenfinsternis in weiten Teilen Deutschlands am 11. August 1999 oder das schwere Erdbeben in der Türkei am 17. August 1999 denkt. Bei diesen Beispielen ist völlig klar, daß wir an der Erklärung dieser bestimmten Ereignisse interessiert sind; und es ist unklar, an welcher anderen Erklärung wir sonst noch interessiert sein sollten. Darüber hinaus ist die Beschränkung von Friedmans Modell auf deduktive Erklärungen zu kritisieren. Sie hat zur Folge, daß beispielsweise die in Kapitel 1 diskutierte Genesung Herrn Maiers von einer Streptokokken-Infektion im Rahmen seines Modells nicht erklärbar ist. Im covering /aw-Modell wird diese Genesung durch ein induktivstatistisches Argument erklärt, dessen Prämissen die Information enthalten, daß Herr Maier Penicillin erhielt und daß die meisten Patienten nach der Verabreichung von Penicillin von einer Streptokokken-Infektion genesen. In Friedmans Modell kann es eine solche Erklärung wie gesehen schon deswegen nicht geben, weil es sich beim Explanandum um ein einzelnes Ereignis und nicht um eine Gesetzmäßigkeit handelt. Aber selbst wenn wir diese Einschränkung nicht berücksichtigen, ist die Genesung von Herrn Maier in Friedmans Modell nicht erklärbar - denn sie ergibt sich nicht mit Notwendigkeit aus dem betreffenden Explanans, sondern nur mit hoher Wahrscheinlichkeit. Bei der angedeuteten induktiv-statistischen Erklärung handelt es sich nach Friedman lediglich um einen ErklärungsversKc/i, der so lange nicht Erklärung genannt werden kann, bis er in eine Deduktion verwandelt worden ist. Dies bedeutet entweder, die prinzipielle Unerklärbarkeit von Herrn Maiers Genesung zu behaupten, oder der Hoffnung Ausdruck zu geben, es könnten Faktoren (etwa genetischer Art) gefunden werden, die zusammen mit einer Gabe von Penicillin seine Genesung notwendig machen. Eine solche Hoffnung mag im Falle der Genesung von einer Streptokokken-Infektion noch sinnvoll erscheinen. Möglicherweise ist es nur unserem unvollständigen Wissen um die biologischen Zusammenhänge geschuldet, daß wir Herrn Maiers Genesung nicht aus biologischen Anfangsbedingungen und Gesetzen deduzieren können. In

84

2

Das Vereinheitlichungsmodell

der Erklärung

anderen Fällen allerdings ist diese Hoffnung nach allem, was wir zur Zeit wissen, völlig unbegründet. Den Zerfall eines Uran238-Atoms innerhalb eines bestimmten Zeitintervalls können wir beispielsweise ebensowenig deduktiv herleiten wie das Tunneln eines Elektrons durch eine Potential-Barriere. Solche Ereignisse sind in Friedmans Modell prinzipiell unerklärbar. Vor dem Hintergrund der Vermutung, daß die Gesetze der Quantenmechanik auch die makroskopische Welt bestimmen, bedeutet dies die Unerklärbarkeit auch einer großen Klasse von makroskopischen Phänomenen.17 Friedmans Erklärungsmodell hat daher bereits im Hinblick auf die Grundidee mit erheblichen Schwierigkeiten zu kämpfen. Weitere Einwände lassen sich gegen seinen Explikationsversuch dieser Grundidee vorbringen. Erstens ist der für die Explikation zentrale Begriff des K-atomaren Satzes nicht angemessen bestimmt, d. h., bei Friedmans Definition des Begriffs fallen einige Sätze nicht unter den Begriff, die intuitiv als K-atomar gelten sollten. Zweitens ist das Verhältnis zwischen den beiden Erklärungsbegriffen (Dl) und (DI') anders, als Friedman annimmt: (DI') ist keineswegs eine Abschwächung von (Dl), d. h., nicht jede Erklärung gemäß (Dl) ist auch eine Erklärung gemäß (DI'). Vielmehr legen die beiden Begriffe disjunkte Klassen von Sätzen fest. Drittens schließen beide Erklärungsbegriffe Erklärungen aus, die intuitiv völlig akzeptabel sind. Auf diese Punkte gehe ich im verbleibenden Teil dieses Unterabschnittes nacheinander ein. Ich beginne mit dem Problem der K-atomaren Sätze. K-atomare Sätze Wie im letzten Unterabschnitt beschrieben, ist einer der zentralen Begriffe für Friedmans Explikation seiner Grundidee der Begriff des Katomaren Satzes. Dieser wird eingeführt, um .richtige' gesetzartige Sätze von solchen Sätzen zu unterscheiden, die sich etwa aus der Konjunktion von zwei .richtigen' gesetzartigen Sätzen ergeben. Wesley Salmon (1989: 96-99) hat nun argumentiert, daß bei der Friedman17

Neben Friedman vertritt auch Philip Kitcher die Auffassung, es müsse eine deduktive Beziehung zwischen Explanans und Explanandum bestehen. Kitcher begründet diese Auffassung, anders als Friedman, jedoch ausführlich. Ich werde bei der Diskussion von Kitchers Modell in Abschnitt 2.3 noch einmal auf diesen Punkt zurückkommen.

2.2

Das Erklärungsmodell

von Michael

Friedman

85

sehen Definition der Begriff des K-atomaren Satzes seine Funktion nicht erfüllt. Nach Salmon sollte eine Teilklasse der .richtigen' gesetzartigen Sätze aus Sätzen der folgenden Form bestehen: (2.6)

(Vx)(Fx —» Gx)

Sätze dieser Form sind allerdings nach Salmons Auffassung gemäß Friedmans Definition nicht K-atomar. Salmons Argument lautet folgendermaßen. (2.6) ist logisch äquivalent zur folgenden Menge von Sätzen: (2.7)

{(Vx)((Fx Λ HX)

Gx), (Vx)((Fx Λ -,ΗΧ)

Gx)} 18

Damit würde es sich bei (2.7) um eine Zerlegung von (2.6) handeln und bei (2.6) daher nicht um einen K-atomaren Satz - , falls die Elemente von (2.7) die folgenden Bedingungen erfüllen. Sie sind: (i) Elemente von K, d. h. gesetzartige Sätze; und (ii) unabhängig von (2.6) akzeptierbar. Diese Bedingungen sind nach Salmons Ansicht erfüllt. Zunächst zu Bedingung (i): Da (2.6) aus Κ ist und jedes σ aus (2.7) von (2.6) impliziert wird, gilt (wegen der Forderung deduktiver Abgeschlossenheit von Κ im Sinne Friedmans) für jedes σ aus (2.7): σ ist aus K, falls σ gesetzartig ist. Man wähle nun ein beliebiges Prädikat H, so daß (Vx)((Fx Λ HX) —> Gx) gesetzartig ist. In diesem Fall wird nach Salmons Ansicht auch (Vx)((Fx Λ -IHX) —> Gx) gesetzartig sein, denn: If the first member [of (2.7)] has unlimited scope, so has the second; if the first makes no reference to any particular entity, neither does the second; if the first contains only purely qualitative predicates so does the second; etc. (Salmon 1989: 97) 19

18

D. h.: (2.6) impliziert jedes Element von (2.7), und die Elemente von (2.7) implizieren zusammen (2.6). Salmon räumt allerdings ein, daß bei einer anderen Auffassung von Gesetzartigkeit (Vx)((Fx Λ -iHx) —> Gx) möglicherweise nicht gesetzartig sein wird. Dies gilt ζ. B. dann, wenn man fUr gesetzartige Sätze fordert, daß sie nur Prädikate enthalten, die eine natürliche Art festlegen. Legt Η eine natürliche Art fest (ζ. Β. Η = ist-ein-Tiger), wird -iH keine natürliche Art festlegen (-iH = istkein-Tiger). Dann wird zwar (Vx)((Fx Λ Hx) —> Gx) gesetzartig sein, nicht aber (Vx)((Fx Λ -iHx) —» Gx). Doch in diesem Fall schlägt Salmon folgende Vorgehensweise vor. Statt (2.7) betrachten wir die folgende Menge M: {(Vx)((Fx Λ Η,Χ) -> Gx), (Vx)((Fx Λ H2X) -> Gx) (Vx)((Fx Λ H„X) -> Gx)}

86

2

Das Vereinheitlichungsmodell

der Erklärung

Nun zu Bedingung (ii). Es scheint zunächst offensichtlich, daß die beiden Elemente von (2.7) jeweils unabhängig von (2.6) akzeptiert werden können. Friedman wendet in bezug auf Salmons Beispiel allerdings folgendes gegen die unabhängige Akzeptierbarkeit der beiden Elemente von (2.7) ein: In your case, it would seem in general that our ground for accepting the two conjuncts [the two elements of (2.7)] is just that they follow from 'All F are G.' If, on the other hand, we have grounds for accepting the two conjuncts independently - by testing for the two conjuncts directly, say - then it would seem that 'All F are G' is in no way an explanation of the two, but just a summary of what we already know. (Friedman, private Korrespondenz mit Salmon, zitiert in Salmon (1989: 97))

Salmon erwidert auf diesen Einwand, indem er zwei Beispiele anführt (vgl. Salmon 1989: 97 f.). Dies scheint mir allerdings völlig unnötig, da Friedmans Einwand den strittigen Punkt Uberhaupt nicht berührt. Friedman behauptet lediglich, daß im Fall einer unabhängigen Akzeptierbarkeit der Elemente von (2.6) Satz (2.7) keine Erklärung dieser Elemente, sondern lediglich eine Zusammenfassung von (2.7) darstellen würde. Dies mag zwar sein, ist aber irrelevant - denn es geht hier lediglich darum, ob die beiden Elemente von (2.7) unabhängig von (2.6) akzeptierbar sein können oder nicht. Und dies räumt Friedman in der oben wiedergegebenen Textstelle sogar explizit ein: „If, on the other hand, we have grounds for accepting the two conjuncts independently - by testing for the two conjuncts directly, say [...]." Wenn die beiden Elemente von (2.7) aber unabhängig von (2.6) akzeptierbar sein können, dann ist Bedingung (ii) ebenso erfüllt wie Bedingung (i) - d. h., (2.7) ist eine Zerlegung von (2.6) und (2.6) damit nicht K-atomar. Salmons Argument zeigt somit, daß man prinzipiell zu jedem gesetzartigen Satz der Form von (2.6) eine logisch äquivalente Menge von gesetzartigen Sätzen aus Κ finden kann, deren Elemente jeweils unabhängig von (2.6) akzeptierbar sind - d. h., daß man zu Sätzen der Form von (2.6) prinzipiell eine Zerlegung finden kann. Dann handelt - wobei es sich bei den Hj um .erlaubte' Prädikate handelt, die einen gegebenen Gegenstandsbereich zerlegen. Die Menge M ist logisch äquivalent zu (2.6). Jedes Element aus M wird also von (2.6) impliziert, und jedes Element aus M wird gesetzartig sein - so daß (Vx)((Fx Λ HJX) —> Gx) e Κ gilt (für alle j) und Bedingung (i) erfüllt ist.

2.2

Das Erklärungsmodell von Michael Friedman

87

es sich bei Sätzen der Form von (2.6) aber nicht um K-atomare Sätze. Nimmt man wie Salmon an, daß zumindest einige K-atomare Sätze die Form von (2.6) haben sollten, dann würde Friedmans Explikation seiner Grundidee schon relativ früh an der Einführung eines Grundbegriffs scheitern. Verhältnis der Definitionen (Dl) und (Dl ') Betrachten wir nun den zweiten Einwand gegen Friedmans Explikation seiner Grundidee, der das Verhältnis der beiden vorgeschlagenen Definitionen (Dl) und (DI') für den Erklärungsbegriff betrifft. Philip Kitcher (1976) hat gezeigt, daß sich (Dl) und ( D I ' ) - entgegen dem, was Friedman unterstellt, wenn er (DI') als Abschwächung von (Dl) bezeichnet - erheblich unterscheiden. Es ist nämlich keineswegs so, daß jede Erklärung gemäß (Dl) auch eine Erklärung gemäß (DI') darstellt - was der Fall sein müßte, wenn ( D I ' ) eine Abschwächung von (Dl) wäre. Im Gegenteil: Nach Definition (Dl) können nur K-atomare Sätze erklären, nach (DI') kann kein K-atomarer Satz erklären. Die beiden Definitionen legen also disjunkte Klassen von Sätzen fest. Betrachten wir zunächst Definition (Dl) und die Behauptung, gemäß (Dl) könnten Sätze, die nicht K-atomar sind, nicht erklären. Kitcher (1976: 209) argumentiert wie folgt: 20 (2.8)

(i)

(ii) (iii) (iv) (v) (vi) (vii)

20

Angenommen, S ist nicht K-atomar. Dann gibt es eine Zerlegung Σ von S, so daß gilt: (α) Σ ist logisch äquivalent zu S, und (ß) jedes σ e Σ ist unabhängig von S akzeptierbar; wegen (i.a) impliziert S jedes σ € Σ, daher gilt wegen (i.ß) und der Definition von Kons K (S): 21 Σ ç Konsic(S); daher gilt wegen (i.a): Kons K (S) impliziert S; da andererseits offensichtlich gilt, daß Kons K (S) von S impliziert wird, folgt: S ist logisch äquivalent zu Kons K (S); somit gilt: Kons K (S) ist logisch äquivalent zu Kons K (S) U {S} ; hieraus folgt:

Die folgende Darstellung ist eine bereinigte Form von Kitchers Argument. KonsR(S) ist die Menge aller Konsequenzen von S, die unabhängig von S akzeptierbar sind (vgl. Unterabschnitt 2.2.2).

88

2 Das Vereinheitlichungsmodell der Erklärung (viii)jede K-Zerlegung von KonsK(S) U { S ) ist eine K-Zerlegung von KonsK(S) und umgekehrt; und daher gilt: (ix) K-Kard(KonsK(S) U {S}) = K-Kard(KonsK(S)), so daß gemäß Friedmans Definition von „reduzieren" gilt: (x) S reduziert KonsK(S) nicht; somit gilt gemäß Definition (Dl) von „erklären": (xi) S kann keine Erklärung irgendeines Elements von KonsK(S) sein, d. h., S kommt überhaupt nicht als Erklärung in Frage.

Aus diesem Argument folgt offensichtlich (Uber Annahmebeseitigung): Ist S nicht K-atomar, so kann S gemäß der Friedmanschen Definition (Dl) nicht erklären - d. h„ nach (Dl) können nur K-atomare Sätze erklären. Betrachten wir nun Friedmans Definition (DI'). Es ist leicht zu sehen, daß gemäß dieser Definition kein K-atomarer Satz erklären kann: Nach (DI') kann ein Satz Si einen Satz S2 nur dann erklären, wenn es eine Zerlegung Σ von S¡ gibt. Wenn es aber eine Zerlegung Σ von S] gibt, dann ist S¡ per definitionem nicht K-atomar. Nach (DI') können also nur Sätze erklären, die nicht K-atomar sind. Die beiden Definitionen (Dl) und (DI') legen somit disjunkte Klassen von Sätzen fest, und (DI') ist keineswegs, wie Friedman behauptet, eine Abschwächung von (Dl). Angemessenheit der Definitionen Ich komme nun zum dritten Einwand gegen Friedmans Erklärungsmodell, der die Angemessenheit seiner Definitionen für den Erklärungsbegriff betrifft. Nach diesem Einwand schließen beide Definitionen intuitiv völlig akzeptable Erklärungen aus. Betrachten wir wiederum zuerst Definition (Dl). Es scheint zunächst ein wünschenswertes Resultat zu sein, daß nach Definition (Dl) nur K-atomare Sätze erklären können. Denn beispielsweise ist die Konjunktion aus dem Boyle-Charles Gesetz und Grahams Gesetz nicht K-atomar und sollte auch nicht als eine Erklärung etwa des Boyle-Charles Gesetzes oder von Grahams Gesetz angesehen werden. Allerdings täuscht dieser Eindruck, denn es gibt eine Reihe von intuitiv akzeptablen Erklärungen, bei denen Konjunktionen aus verschiedenen Gesetzen, d. h.

2.2

Das Erklärungsmodell von Michael Friedman

89

nicht-K-atomare Sätze verwendet werden. Kitcher nennt zwei Typen von Beispielen: There are two main types of counterexamples to Friedman's theory of explanation. Counterexamples of the first type occur when we have independently acceptable laws which (intuitively) belong to the same theory and which can be put together in genuine explanations. The explanantia that result are not Af-atomic and hence fail to meet the necessary condition derived from Friedman's theory. [...] The second type of counterexample is more obvious. Sometimes we explain the behavior of complex systems by using laws from a number of different theories. In such cases the theories are often independently acceptable and the laws drawn from them are also independently acceptable. (Kitcher 1976: 209 f.; m. H.) Als Beispiel für den ersten Typ von Gegenbeispiel zu Friedmans Erklärungsbegriff ( D l ) nennt Kitcher unter anderem die Erklärung des Gesetzes der adiabatischen Expansion eines idealen Gases: The explanans here is the conjunction of the Boyle-Charles law and the first law of thermodynamics. These laws are acceptable on the basis of quite independent tests, so their conjunction is not AT-atomic. However, the derivation of the law of adiabatic expansion from the conjunction is, intuitively, a genuine explanation. (Kitcher 1976: 209 f.) Dieser Typ von Gegenbeispiel kann allerdings noch besser an Friedmans eigenem Beispiel illustriert werden. Wie Friedman ausdrücklich betont, kann die Konjunktion aus den Gesetzen der Mechanik verwendet werden, um das Boyle-Charles Gesetz, Grahams Gesetz usw. zu erklären. Aber natürlich handelt es sich bei der Konjunktion aus den Gesetzen der Mechanik nicht um einen K-atomaren Satz: Die Menge der Gesetze der Mechanik ist logisch äquivalent zu dieser Konjunktion, und diese Gesetze sind, wie ich annehme, unabhängig von der Konjunktion akzeptierbar. Damit ist diese Menge eine Zerlegung der Konjunktion. Als Beispiele für den zweiten Typ von Gegenbeispiel nennt Kitcher die folgenden beiden Erklärungen: As an example, imagine a complete explanation of why human eyes are sensitive to a particular range of light frequencies (an explanation that would involve independently acceptable laws drawn from evolutionary biology, geophysics, and optics) or the explanation of why lightning flashes are followed by thunderclaps. [...] The explanation utilizes laws of elee-

90

2

Das Vereinheitlichungsmodell der Erklärung

tricity, thermodynamics, and acoustics, which are independently acceptable. (Kitcher 1976: 210 und Fußnote 4)

Alle diese Beispiele zeigen meiner Ansicht nach überzeugend, daß es intuitiv akzeptable Erklärungen gibt, deren Explanantia nicht K-atomar sind. Somit ist Friedmans Definition (Dl) des Erklärungsbegriffs nicht angemessen, denn aus ihr folgt, daß nur K-atomare Sätze erklären können und diese Beispiele daher als Erklärungen ausgeschlossen sind. Betrachten wir also Friedmans Definition (DI'). Handelt es sich bei ihr um eine angemessene Definition des Erklärungsbegriffs? Es ist relativ leicht zu sehen, daß dies nicht der Fall ist, indem man sich nochmals Salmons Kritik an Friedmans Definition des Begriffs des Katomaren Satzes in Erinnerung ruft. Nach Salmon sollten Sätze der Form (Vx)(Fx —> Gx) sowohl als K-atomar gelten - was bei Friedmans Bestimmung wie gesehen nicht der Fall ist - als auch für Erklärungen verwendet werden können. Letzteres scheint intuitiv sehr plausibel. Beispielsweise sind ja gerade Hempels Paradebeispiele solche Erklärungen, die das Explanandum aus einem Satz der Form (Vx)(Fx —> Gx) (und einer oder mehreren Anfangsbedingungen) ableiten. Wenn aber nur «/cAi-K-atomare Sätze erklären können, sind solche Erklärungen ausgeschlossen. Darüber hinaus scheitert (DI') noch aus einem anderen Grund. Denn nach dieser Definition sind - neben Erklärungen durch Katomare Sätze - auch bestimmte intuitiv akzeptable Erklärungen durch m'cftf-K-atomare Sätze ausgeschlossen. Kitcher argumentiert, daß (DI') seinen Gegenbeispielen ebenso zum Opfer fällt wie (Dl). Betrachten wir noch einmal das erwähnte Beispiel der Erklärung der adiabatischen Expansion eines idealen Gases. Kitcher (1976: 211) argumentiert wie folgt: (2.9)

(i)

Sei Ti das erste Gesetz der Thermodynamik, BCG das Boyle-Charles Gesetz und AEG das Gesetz der adiabatischen Expansion eines idealen Gases. Dann kann gemäß (DI') die Konjunktion Τ, Λ BCG das Gesetz AEG nur dann erklären, wenn es eine Zerlegung Σ von Τι Λ BCG und ein o¡ e Σ gibt, so daß gilt: (a) AEG e KonsK(a¡), und (b) σ, reduziert KonsK(o¡);

2.2 Das Erklärungsmodell von Michael Friedman (ii)

(iii)

(iv) (ν) (vi) (vii) (viii) (ix) (x)

22

23

91

da ein Teilresultat unserer Diskussion von (Dl) darin bestand, daß ein m'c/if-K-atomarer Satz die Menge seiner unabhängig von ihm akzeptierbaren Konsequenzen nicht reduzieren kann (vgl. Punkt (2.08)(x)), muß o¡ weiterhin K-atomar sein; nehmen wir also an, es gebe Σ* und o¡*, die die geforderten Bedingungen erfüllen; betrachten wir nun die Menge (σ,* ν Τ,, o¡* ν BCG}; diese Menge ist logisch äquivalent zu folgendem Satz: o¡* ν (Τι Λ BCG); da Σ* eine Zerlegung von Τι Λ BCG ist, wird o¡* von Τ] Λ BCG impliziert; somit gilt: σι* ist logisch äquivalent zu σ,* ν (Τ, a BCG); 22 und wegen (iii) gilt dann: o¡* ist logisch äquivalent zu {o¡* ν Ti, o¡* ν BCG}; da nach (ii) o¡* K-atomar ist, hat o¡* keine Zerlegung; daher gilt mit (vi): (o¡* ν Τ)) oder (o¡* ν BCG) ist nicht unabhängig von o¡* akzeptierbar; daher gilt: entweder T t oder BCG ist nicht unabhängig von σ,* akzeptierbar; 23 aus (i)-(ix) folgt, daß Σ und o¡ derart gewählt werden müssen, daß entweder Ti oder BCG oder beide nicht unabhängig von o¡ akzeptierbar sind; d. h., wir müssen ein Gesetz o¡ finden, für das gilt: (i) unsere Gründe, Ti (bzw. BCG) zu akzeptieren, sind zugleich Gründe, o, zu akzeptieren, und (ii) o¡ => AEG; aber:

Beweis: (i) Annahme: o¡* ν (Τι λ BCG); dann entweder o¡* oder Τι λ BCG oder beides; o¡* => a¡* und (Τ) λ BCG) => a¡* und o¡* λ (Τι λ BCG) => σ,*; (ii) Annahme: o¡*; a¡* (a¡* ν C) für beliebiges C; also o¡* => [o¡* ν (Τ, a BCG)]. Zur Erinnerung: Friedmans Bestimmung der unabhängigen Akzeptierbarkeit lautet: Ist a¡* ν Tj unabhängig von a¡* akzeptierbar, so gibt es Gründe, σι* ν T( zu akzeptieren, die nicht zugleich GrUnde sind, o¡* zu akzeptieren. Damit dies erfüllt ist, muß Ti unabhängig von a¡* akzeptierbar sein, denn sonst gilt: Jeder Grund, Ti zu akzeptieren, ist ein Grund, o¡* zu akzeptieren. Und da man, wenn man o¡* ν Tj akzeptiert, entweder o¡* oder Tj oder beide akzeptieren muß, würde man - falls man Ti akzeptiert - in jedem Fall auch o¡* akzeptieren müssen. (Analoges gilt für c¡* ν BCG und a¡*.)

92

2

Das Vereinheitlichungsmodell der Erklärung

(viii)es gibt kein Gesetz, das diese Bedingungen erfüllt; daher gilt: (xii) die intuitiv zufriedenstellende Erklärung der adiabatischen Expansion eines idealen Gases über das erste Gesetz der Thermodynamik (T t ) und das Boyle-Charles Gesetz (BCG) ist keine Erklärung nach Friedmans Definition (Dl')· Auch Friedmans Definition (DI') leistet also nicht das, was sie soll: Zum einen werden durch sie viele intuitiv akzeptable Erklärungen ausgeschlossen, die auf K-atomaren Sätzen beruhen; zum anderen aber auch einige angemessen erscheinende Erklärungen, die auf nichtK-atomare Sätze zurückgreifen.24 Das Erklärungsmodell von Michael Friedman hat also - sowohl im Hinblick auf die Grundidee als auch auf deren Explikation - einige ernste Defekte. Das Modell verwendet an zentraler Stelle einen unexplizierten Gesetzesbegriff; es läßt nur Erklärungen von Gesetzmäßigkeiten zu und schließt Erklärungen von Einzelereignissen aus; alle Erklärungen müssen darüber hinaus deduktive Gestalt haben, induktive Erklärungen sind prinzipiell nicht vorgesehen. Der zentrale Begriff des K-atomaren Satzes ist nicht angemessen bestimmt; die beiden Erklärungsbegriffe (Dl) und (DI') stehen in einem anderen Verhältnis zueinander, als Friedman annimmt; und sie schließen jeweils eine große Klasse von intuitiv akzeptablen Erklärungen aus. Diese Schwierigkeiten haben unmittelbare Auswirkungen auf die Frage, ob Friedmans Erklärungsmodell als Basis für den Schluß auf die beste Erklärung geeignet ist. Auf diese Frage gehe ich im folgenden Unterabschnitt ein.

24

Aus diesem letzten Grund würde es auch nichts nutzen, etwa die Disjunktion von (Dl) und (DI') als Definition des Erklärungsbegriffs zu verwenden (so daß sowohl K-atomare als auch nicht-K-atomaie Sätze erklären könnten). Denn die von Kitcher diskutierte Erklärung der adiabatischen Expansion eines idealen Gases ist ja nach beiden Erklärungsbegriffen keine Erklärung.

2.2

2.2.4

Das Erklärungsmodell

von Michael

Friedman

93

Friedmans Modell und der Schluß auf die beste Erklärung

Einleitung Das Erklärungsmodell von Michael Friedman ist aus einer Vielzahl von Gründen nicht als Basis für den Schluß auf die beste Erklärung geeignet. Erstens ergibt sich aus dem vorigen Unterabschnitt, daß Friedmans Modell nicht die richtige Menge von Erklärungen auszeichnet, im Hinblick auf die eine Auswahl der besten Erklärung der jeweiligen Phänomene zu treffen ist. Dieses Problem hat zwei Aspekte. Zum einen bleibt in Friedmans Modell - wie bereits im covering /aw-Modell - die Menge der Erklärungen insofern unbestimmt, als keine befriedigende Explikation des Gesetzesbegriffs bzw. des Begriffs des gesetzartigen Satzes zur Verfügung gestellt wird. Daher ist unklar, bei welchen Sätzen es sich um gesetzartige Sätze handelt und bei welchen nicht, so daß offen bleibt, welche Sätze als Erklärungen in Frage kommen und welche nicht. Das bedeutet, daß im Rahmen von Friedmans Modell die Menge der Erklärungen nicht bestimmt werden kann, im Hinblick auf die eine Auswahl zu treffen ist, d. h., aus der die beste Erklärung auszuwählen ist. Und dies hat schließlich zur Folge, daß auf der Basis von Friedmans Modell überhaupt kein Schluß auf die beste Erklärung gezogen werden kann, da unklar bleibt, worauf geschlossen werden soll. Zum anderen haben wir gesehen, daß die beiden Friedmanschen Definitionen (Dl) und (DI') des Erklärungsbegriffs viele Erklärungen ausschließen, die intuitiv akzeptabel sind. Da diese Erklärungen nicht einmal als Erklärungen gelten, können sie selbstverständlich bei der Bestimmung der besten Erklärung eines Phänomens nicht in Betracht gezogen werden. Wenn man daher Friedmans Modell als Basis für den Schluß auf die beste Erklärung wählt, ist es möglich, daß bei Schlüssen auf die beste Erklärung nicht auf die tatsächlich beste Erklärung geschlossen wird, sondern lediglich auf die beste Erklärung im Sinne von Friedmans Modell. Wie bereits bei der Diskussion des covering /öw-Modells erwähnt, spricht aber selbst für Befürworter des Schlusses auf die beste Erklärung nichts dafür, daß solche Schlüsse wahrscheinlich zu einer wahren Konklusion führen. Denn Befürworter des Schlusses auf die beste Erklärung halten eine Hypothese ja deswegen für wahrscheinlich wahr, weil sie bestimmte Phänomene am besten erklärt. Und diese Bedingung ist hier gerade nicht erfüllt - denn die betreffende Hypothese

94

2 Das Vereinheitlichungsmodell der Erklärung

stellt lediglich die beste Erklärung im Sinne von Friedmans Modell dar (vgl. hierzu auch die entsprechenden Bemerkungen in Kapitel 1, Unterabschnitt 1.4.2).25 Ein zweiter Grund, aus dem Friedmans Modell nicht als Basis für den Schluß auf die beste Erklärung geeignet ist, betrifft die Einschränkung des Erklärungsbegriffs auf deduktive Erklärungen von Gesetzmäßigkeiten. Friedmans Erklärungsmodell läßt keine Schlüsse auf die beste Erklärung zu, falls dasjenige, was erklärt werden soll, entweder ein einzelnes Ereignis ist oder nicht deduktiv hergeleitet werden kann. Denn für solche Explananda kann es in Friedmans Modell überhaupt keine Erklärungen geben, und somit kann nicht auf die beste Erklärung dieser Explananda geschlossen werden. Will Hercule Poirot beispielsweise Linnet Ridgeways unnatürlichen Tod auf dem Nil erklären, so kann er nicht auf Friedmans Modell zurückgreifen. Nachdem er all die Indizien ermittelt hat, die uns aus der Geschichte bekannt sind, mag er zwar glauben, er sei im Besitz der besten Erklärung für Linnet Ridgeways Tod und habe ihre Mörderin gefunden. Tatsächlich hat er nach Friedman allerdings überhaupt keine Erklärung gefunden. Denn zum einen handelt es sich beim Explanandum nicht um eine Gesetzmäßigkeit. Und zum andern ergibt sich Linnet Ridgeways Tod nicht mit Notwendigkeit aus den Informationen, die Hercule Poirot zusammengetragen hat, sondern bestenfalls mit einer hohen induktiven Wahrscheinlichkeit. Folglich kann Poirot, da er überhaupt keine Erklärung für Linnet Ridgeways Tod hat, auch keinen Schluß auf die beste Erklärung ziehen. Ebensowenig kann ein Geologe das Erdbeben in der Türkei am 17. August 1999 mit dem Hinweis auf bestimmte geologische Faktoren erklären. Denn wiederum handelt es sich zum einen beim Explanandum um ein Einzelereignis, dessen Erklärung in Friedmans Modell nicht vorgesehen ist. Und zum anderen dürfte sich das Auftreten des Erdbebens nicht mit Notwendigkeit aus den Informationen ergeben, die der Geologe gesammelt hat, sondern bestenfalls mit einer hohen induktiven Wahrscheinlichkeit. Diese beiden Beispiele lassen sich natürlich auf eine große Klasse von Fällen verallgemeinern, so daß der Schluß auf die beste Erklärung - falls

Diese Problematik wird noch durch die beschriebenen Schwierigkeiten bei der Bestimmung des Begriffs des K-atomaren Satzes verschärft, der in die Definitionen (Dl) und (DI') des Erklärungsbegriffs eingeht.

2.2 Das Erklärungsmodell von Michael Friedman

95

man Friedmans Erklärungsmodell als Basis verwendet - in weiten Teilen des alltäglichen Lebens ebensowenig angewendet werden kann wie in großen Bereichen der Wissenschaft. Diese beiden Gründe schränken nach meiner Einschätzung die Tauglichkeit von Friedmans Erklärungsmodell als Basis für den Schluß auf die beste Erklärung bereits erheblich ein. Darüber hinaus gibt es zwei weitere, von diesen beiden Gründen unabhängige Schwierigkeiten, die Friedmans Modell auch dann als Basis für den Schluß auf die beste Erklärung ungeeignet machen würden, wenn in seinem Modell der Gesetzesbegriff geklärt, die Definitionen (Dl) und (DI') angemessen und induktive Erklärungen bzw. Erklärungen von Einzelereignissen zugelassen wären. Auf diese beiden Schwierigkeiten gehe ich im verbleibenden Teil dieses Unterabschnitts ein. Gütekriterien für Erklärungen Die erste dieser Schwierigkeiten betrifft einen Aspekt, der ebenfalls bereits im Hinblick auf das covering Zaw-Modell in Kapitel 1 diskutiert wurde - nämlich das Problem, daß dieses Modell keine Möglichkeit bereitstellt, verschiedene Erklärungen im Hinblick darauf zu vergleichen, wie gut sie das betreffende Explanandum erklären. Dieses Problem tritt auch bei Friedmans Modell auf: Es enthält ebensowenig wie das covering Ζανν-Modell einen komparativen Begriff der Erklärung. Ein Satz ist, wie in Unterabschnitt 2.2.2 beschrieben, nach Friedmans Modell entweder eine Erklärung - wenn alle Bedingungen von (Dl) bzw. (DI') erfüllt sind. Oder er ist keine Erklärung - wenn eine der Bedingungen der jeweiligen Definition verletzt ist. Alle Sätze, die die entsprechenden Bedingungen erfüllen, sind Erklärungen, und all diese Sätze sind gleich gute Erklärungen. Eine Möglichkeit, verschiedene Sätze im Hinblick auf ihre explanatorische Güte zu vergleichen, besteht nicht. Es kann in Friedmans Modell nicht sinnvoll gefragt werden, ob eine Erklärung Ei (eines gegebenen Explanandums) besser oder schlechter ist als eine Erklärung E 2 (desselben Explanandums). Somit kann nicht entschieden werden, wann eine Erklärung Ek die beste unter einer Menge von konkurrierenden Erklärungen E¡ (für dasselbe Explanandum) ist. Natürlich kann - wie im Fall des covering /aw-Modells - gefragt werden, wie wahrscheinlich verschiedene angebotene Erklärungen vor dem Hintergrund des Gesamtwissens sind. Und selbstverständlich

96

2 Das Vereinheitlichungsmodell der Erklärung

können Erklärungen nach diesem Kriterium miteinander verglichen, beurteilt und ausgewählt bzw. abgelehnt werden. (Im Fall des covering /aw-Modells ist die Wahrscheinlichkeit der Prämissen des jeweiligen Argumentes zu untersuchen, in Friedmans Modell die Wahrscheinlichkeit des jeweiligen Satzes.) Aber wie bereits im Hinblick auf das covering /aw-Modell eingewendet, betrifft dieses Kriterium zum einen nicht die explanatorische Güte der betreffenden Erklärung: Es wird bei dieser Untersuchung nicht die Qualität des betreffenden Satzes als Erklärung beurteilt; es wird nicht gefragt, wie gut der betreffende Satz erklärt, sondern lediglich, wie wahrscheinlich er ist. Zum anderen wäre dieses Kriterium wie erwähnt für die Zwecke des Schlusses auf die beste Erklärung wenig hilfreich: Denn dieses Schlußmuster soll es uns ja gerade ermöglichen, die wahrscheinlichen Hypothesen von den unwahrscheinlichen zu unterscheiden - und zwar indem wir uns fragen, wie gut die jeweilige Hypothese das betreffende Explanandum erklärt (vgl. die entsprechenden Bemerkungen in Kapitel 1, Abschnitt 1.4.3). Man kann nun allerdings versuchen, Friedmans Modell auf andere Weise um einen komparativen Erklärungsbegriff zu ergänzen. Intuitiv ist der Gedanke naheliegend, daß in einem Vereinheitlichungsmodell eine Erklärung Ei genau dann besser als eine Erklärung E 2 ist, wenn Ei zu einem größeren Grad an Vereinheitlichung führt als E2. Wie könnte diese intuitive Idee in Friedmans Modell integriert werden? Betrachten wir nochmals Definition (Dl) für den Begriff der Erklärung (vgl. Unterabschnitt 2.2.2):26 (2.4)

Definition (Dl) des

Erklärungsbegriffs

Si erklärt S 2 genau dann, wenn gilt: (i) S 2 ε Kons K (S,); (ii) Sj reduziert Kons K (Si). Auf Punkt (ii) dieser Definition aufbauend, könnte man beispielsweise festlegen, daß ein Satz Si eine um so bessere Erklärung eines Satzes S 2 ist, je .stärker' oder je ,mehr' Si die Menge Kons K (Si) reduziert. S! wäre somit eine bessere Erklärung als Si* genau dann, wenn Si die Menge Konsic(Si) stärker/mehr reduziert als Si* die Menge Kons K (Si*). Entsprechend wäre St die beste Erklärung einer Menge 26

Für Definition (DI') ergeben sich vollkommen analoge Überlegungen.

2.2

Das Erklärungsmodell von Michael Friedman

97

von Erklärungen S¡, wenn S k die Menge Kons K (S k ) stärker/mehr reduziert als jedes Sj die Menge Kons K (Sj) (für j Φ k). Wie kann diese Rede von .stärkerer' oder ,mehr' Reduktion expliziert werden? Betrachten wir hierzu noch einmal die Definition des Begriffs der Reduktion: (2.2)

Der Begriff der Reduktion Ein Satz S reduziert eine Menge Σ von Sätzen genau dann, wenn gilt: Die K-Kardinalität von I U ( S [ ist kleiner als die K-Kardinalität von Σ.

Ein Satz S reduziert eine Menge von Sätzen Σ also genau dann, wenn es eine K-Zerlegung von Z U j S ) gibt, die weniger Elemente enthält als jede K-Zerlegung von Σ. Es liegen nun drei Möglichkeiten nahe, den Begriff der stärkeren Reduzierung zu bestimmen. Die erste dieser Möglichkeiten nimmt einfach auf die Anzahl der Elemente von Σ k J { S ) Bezug: Je geringer die Anzahl der Elemente, desto stärker reduziert der Satz S die Menge Dementsprechend reduziert ein Satz Si die Menge seiner (unabhängig von ihm akzeptierbaren) Konsequenzen Kons K (Si) stärker als ein Satz Si* die Menge Kons K (Si*) genau dann, wenn folgende Bedingung erfüllt ist: K-Kard(Kons K (S,) U {S,}) < K-Kard(Kons R (S,*) U {S,*}) Ein Satz S) wäre somit eine bessere Erklärung (eines Satzes S 2 ) als ein konkurrierender Satz Si* genau dann, wenn Si die Menge Kons K (Si) in diesem Sinne stärker reduziert als Si* die Menge Kons K (Si*). 27 Die zweite Möglichkeit verwendet als Maß für die erreichte Reduzierung nicht die Anzahl der Elemente von E U ( S ) , sondern die Differenz zwischen der Anzahl der Elemente von Σ und der Anzahl der Elemente von Σ J e größer diese Differenz, desto stärker die Reduzierung. Dementsprechend reduziert ein Satz S) die Menge Kons K (Si) stärker als ein Satz S t * die Menge Kons K (Si*) genau dann, wenn folgende Bedingung erfüllt ist: [K-Kard(KonsK(S,))-K-Kard(Kons K (S,)U{Si})] > [K-Kard(KonsK(S ι *)) - K-Kard(Kons K (S ι *) U {S ] *} )] Der Begriff der besseren Erklärung ergibt sich entsprechend. 27

Außerdem muß natürlich gelten: S2 e Kons K (S0 bzw. S2 e KonsK(Si*).

98

2 Das Vereinheitlichungsmodell der Erklärung

Die dritte Möglichkeit besteht darin, auf beide dieser Faktoren Bezug zu nehmen und das Maß der erreichten Vereinheitlichung sowohl von der Anzahl der Elemente von Σ U { S } als auch von der Differenz zwischen der Anzahl der Elemente von Σ und der Anzahl der Elemente von Σ abhängig zu machen. Möglicherweise ist diese dritte Möglichkeit die intuitiv einleuchtendste. Entsprechend der Grundidee Friedmans - nach der Verständnis dadurch erzielt wird, daß die Anzahl an unabhängigen Phänomenen reduziert wird, die wir zu akzeptieren haben - scheint sowohl die bloße Anzahl dieser Phänomene eine Rolle zu spielen als auch die Differenz zwischen der Anzahl der Phänomene, die wir jetzt zu akzeptieren haben, und der Anzahl der Phänomene, die wir nach einer gegebenen Erklärung zu akzeptieren haben. Natürlich umfaßt diese dritte Möglichkeit eine prinzipiell unendliche Anzahl an Funktionen dieser beiden Variablen. Eine plausible Argumentation für die Wahl einer bestimmten Funktion dürfte schwierig sein, und die jeweilige Wahl dürfte nach meiner Auffassung eher willkürlichen Charakter haben.28 All diese Überlegungen sind zudem natürlich vor dem Hintergrund zu sehen, daß die beiden Definitionen (Dl) und (DI'), wie im letzten Unterabschnitt gezeigt wurde, ohnehin nicht angemessen sind. Dennoch mag man einräumen, daß dieser Einwand gegen Friedmans Erklärungsmodell vielleicht nicht endgültig zeigt, daß es als Basis für den Schluß auf die beste Erklärung ungeeignet ist. Falls Friedmans Definition des Erklärungsbegriffs befriedigend modifiziert werden könnte, wäre eine Ergänzung dieser Definition um einen komparativen Erklärungsbegriff möglicherweise im Sinne der hier gemachten Bemerkungen zu leisten. Eine vereinheitlichte Welt? Dies wirft aber die folgende grundlegende Schwierigkeit für Friedmans Modell auf, die sich in einer kurzen Frage zusammenfassen läßt: Was wenn die Welt nicht vereinheitlicht ist? Es ist wichtig, sich klarzumachen, daß Friedmans Erklärungsmodell - anders als dasjenige Hempels - substantielle Annahmen über die Beschaffenheit der Welt macht. Der Hempelsche Erklärungsbegriff ist völlig neutral hinsieht28

Ein ähnliches Problem wird uns bei der Diskussion von Philip Kitchers Erklärungsmodell im folgenden Abschnitt beschäftigen.

2.2 Das Erklärungsmodell von Michael Friedman

99

lieh der Frage, wie die Welt beschaffen ist. Für Erklärungen wird vereinfacht gesagt lediglich die (deduktive oder induktive) Erschließbarkeit des Explanandums aus Gesetzes- und anderen Prämissen gefordert. Dies läßt zu, daß die verwendeten Gesetzesprämissen von großer Zahl sind und aus völlig verschiedenen Bereichen stammen, die nicht miteinander vereinigt oder aufeinander reduziert werden können. Die Welt mag vereinheitlicht sein - dann wird es einige wenige Gesetze geben, aus denen sich viele andere Gesetze herleiten lassen, aus denen wiederum viele Einzelereignisse herleitbar sind (unter Rückgriff auf Rand- bzw. Anfangsbedingungen). Wir können dann viele Phänomene auf einige wenige reduzieren und dementsprechend durch diese erklären. Oder die Welt mag nicht vereinheitlicht sein - dann werden wir viele Gesetze brauchen, um andere Gesetze und Einzelereignisse zu erklären. Dennoch wird auch in diesem Fall eine Erklärung der vielfältigen Phänomene in der Welt möglich sein. Der Friedmansche Erklärungsbegriff ist dagegen alles andere als neutral hinsichtlich der Frage, wie die Welt beschaffen ist. Wenn die Welt nicht aus wenigen grundlegenden Phänomenen besteht, auf die alle anderen reduzierbar sind, dann können wir viele Phänomene in der Welt prinzipiell nicht erklären - und dies nicht etwa, weil uns das entsprechende Wissen über die Welt fehlt, sondern weil es unser Erklärungsmodell nicht zuläßt. Dies scheint bereits eine unbefriedigende Konsequenz zu sein, wenn man nur Uber verschiedene Erklärungsmodelle spricht. Darüber hinaus hat sie unmittelbare Auswirkungen im Hinblick auf den Schluß auf die beste Erklärung. Wie in der Einleitung zu dieser Arbeit beschrieben, behaupten Anhänger des Schlusses auf die beste Erklärung, daß dieses Schlußmuster von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Nehmen wir nun (wie weiter oben beschrieben) an, daß Erklärungen in Friedmans Modell um so besser sind, je größer der Grad an Vereinheitlichung ist, der durch sie erreicht wird.29 Unter dieser Annahme führen - bei Verwendung von Friedmans Modell - Schlüsse auf die beste Erklärung immer zu Erklä29

Alternativ können wir natürlich diesen Vorschlag verwerfen und einräumen, daß es in Friedmans Modell keinen komparativen Begriff der Erklärung gibt. Dann kommt sein Modell aber natürlich ohnehin nicht als Basis fUr den Schluß auf die beste Erklärung in Frage.

100

2

Das Vereinheitlichungsmodell der Erklärung

rangen, die unser Weltbild am meisten vereinheitlichen. Solche Erklärungen werden aber nur dann wahr sein - und Schlüsse auf die beste Erklärung werden also nur dann von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen - , wenn die Welt selbst maximal vereinheitlicht ist. Bei dieser Frage - ob die Welt maximal vereinheitlicht ist oder nicht - handelt es sich aber um eine empirische Frage. Diese sollte von den empirischen Wissenschaften auf möglichst unvoreingenommene Weise untersucht und, sofem dies möglich ist, entschieden werden. Wenn man nun dem Schluß auf die beste Erklärung - einem Schlußmuster, das in den empirischen Wissenschaften selbst verwendet wird - Friedmans Erklärungsmodell zugrunde legt, dann baut man die Annahme, daß die Welt vereinheitlicht ist, in die Methodologie der empirischen Wissenschaften ein. Denn konkurrieren verschiedene Theorien um die Gunst der Wissenschaftsgemeinschaft, und ist Theorie Ti die beste Erklärung der Daten - d. h„ führt T! zum größten Grad an Vereinheitlichung - , dann wird mit Hilfe eines Schlusses auf die beste Erklärung auf Ti geschlossen werden. Es wird also diejenige Theorie bevorzugt werden, die die Welt am vereinheitlichsten darstellt. Hierbei dürfte es sich aber nicht um eine unvoreingenommene Untersuchung der Frage handeln, ob die Welt vereinheitlicht ist oder nicht. Betrachten wir diese Problematik an einem Beispiel. Gegenwärtig geht man in der Physik von drei fundamentalen Wechselwirkungen aus: der elektroschwachen, der starken (oder hadronischen) und der Gravitationswechselwirkung.30 Nehmen wir an, Wissenschaftler A entwickelt eine Theorie Ti, die die elektroschwache und die hadronische Wechselwirkung in einer Grand Unified Theory auf eine gemeinsame Universalwechselwirkung zurückführt. Wissenschaftler Β hingegen entwickelt eine Theorie T 2 , die nicht nur diese beiden Wechselwirkungen, sondern auch die Gravitationswechselwirkung in einer Theory of (Almost) Everything behandelt. Nach Friedmans Bestimmungen ist T2 eine bessere Erklärung der drei genannten Wechselwirkungen als Theorie T¡, da sie ein größeres Maß an Vereinheitlichung 30

Die schwache und die elektromagnetische Wechselwirkung wurden vor kurzem auf die elektroschwache Wechselwirkung zurückgeführt. Vgl. für eine kurze Darstellung Tipler (1994: Kap. 41).

2.2 Das Erklärungsmodell von Michael Friedman

101

herbeiführt, d. h. ein größeres Maß an Reduktion bewirkt. Wenn nun Friedmans Erklärungsmodell dem Schluß auf die beste Erklärung zugrunde gelegt wird, dann mtißte auf Theorie T 2 und nicht auf Ti geschlossen werden (unter der Annahme, daß keine anderen Theorien zur Verfügung stehen). Welche Gründe haben wir aber anzunehmen, daß T 2 wahr ist, nicht aber Ti? Unser einziger Grund für diese Annahme ist, daß T 2 eine bessere Erklärung nach Friedmans Modell darstellt als T,. Hierbei scheint es sich allerdings überhaupt nicht um einen Grund für die Behauptung der Wahrheit weder der einen noch der anderen Theorie zu handeln, sondern lediglich um ein Vorurteil zugunsten einer vereinheitlichenden Theorie bzw. einer einheitlichen Welt. Gründe für oder gegen die eine oder andere Theorie sollten statt dessen in den empirischen Konsequenzen dieser neu vorgeschlagenen Theorien gesucht werden, die im Experiment entweder bestätigt oder widerlegt werden können. 31 Zusammenfassend läßt sich zu Michael Friedmans Erklärungsmodell also folgendes sagen. Es kommt als Basis für den Schluß auf die beste Erklärung schon deshalb nicht in Frage, weil es mit erheblichen internen Schwierigkeiten zu kämpfen hat: Es baut auf einem unexplizierten Begriff des gesetzartigen Satzes auf; es läßt keine Erklärungen von Einzelereignissen zu, sondern gestattet nur Erklärungen von Gesetzmäßigkeiten; es sieht keine induktiven, sondern nur deduktive Erklärungen vor; und es bietet zwei verschiedene Definitionen für den Begriff der Erklärung an, die beide unbefriedigend sind und darüber hinaus auf einem Begriff (K-atomarer Satz) beruhen, der nicht angemessen expliziert wird. Diese Schwierigkeiten haben wie beschrieben zur Konsequenz, daß die Menge der Erklärungen unbestimmt bleibt bzw. nicht alle zu berücksichtigenden Elemente enthält und daß keine Schlüsse auf die beste Erklärung möglich sind, wenn es sich bei den

31

Eine Möglichkeit, diesem Einwand zu entgehen, besteht natürlich darin, den Begriff der Vereinheitlichung in den Begriff der Wahrheit einzubauen. Man könnte beispielsweise einen kohärenztheoretischen Wahrheitsbegriff vertreten und Vereinheitlichung als einen Bestandteil von Kohärenz eines Überzeugungssystems festlegen. In diesem Falle wäre die Tatsache, daß eine Erklärung ein großes Maß an Vereinheitlichung herbeiführt, selbstverständlich relevant für die Frage, ob diese Erklärung wahr ist. Etwas in dieser Art unternimmt Philip Kitcher, dessen Erklärungsmodell im nächsten Abschnitt untersucht wird. Ich werde dort auf diesen Punkt zurückkommen.

102

2

Das Vereinheitlichungsmodell der Erklärung

Explananda um Einzelereignisse handelt bzw. wenn die jeweiligen Explananda nur induktiv erschlossen werden können. Weiterhin ist Friedmans Modell im Hinblick auf den Schluß auf die beste Erklärung unbefriedigend, weil es keinen komparativen Erklärungsbegriff an die Hand gibt, der eine Beurteilung der explanatorischen Güte einer Erklärung erlauben und damit die Auswahl der besten unter verschiedenen konkurrierenden Erklärungen überhaupt erst möglich machen würde - was eine Grundvoraussetzung für eine Anwendung des Schlusses auf die beste Erklärung ist. Darüber hinaus werden in Friedmans Modell substantielle Annahmen über die Beschaffenheit der Welt gemacht, die nicht Bestandteil eines Erklärungsmodells sein sollten, das als Basis für den Schluß auf die beste Erklärung verwendet werden soll. Das im nächsten Abschnitt zu behandelnde Vereinheitlichungsmodell der Erklärung von Philip Kitcher versucht, insbesondere auf diese beiden letzten Probleme eine Antwort zu liefern. Beide Antworten werden sich allerdings als unbefriedigend erweisen.

2.3

Das Erklärungsmodell von Philip Kitcher 2.3.1

Die Grundidee von Kitchers Modell

Ein ähnliches Erklärungsmodell wie Michael Friedman hat Philip Kitcher in einer Reihe von Veröffentlichungen entwickelt (vgl. Kitcher 1981, 1989). Ebenso wie Friedman versucht Kitcher, den Begriff der Erklärung über den Begriff der Vereinheitlichung zu bestimmen. Diesen expliziert er allerdings anders als Friedman. Vereinfacht ausgedrückt wird nach Kitcher ein Überzeugungssystem Κ durch eine Theorie Τ dann vereinheitlicht, wenn Τ es erlaubt, eine große Anzahl von Elementen von Κ unter Verwendung von einigen wenigen Argumentmustern herzuleiten: The picture of unification [...] may be summarized quite simply: a theory unifies our beliefs when it provides one (or more generally, a few) pattem(s) of argument which can be used in the derivation of a large number of sentences which we accept. (Kitcher 1981: 514; m. H.)

Wie bei Friedman spielt also auch bei Kitcher der Begriff der Reduktion eine entscheidende Rolle bei der Bestimmung des Vereinheitli-

2.3

Das Erklärungsmodell

von Philip Kitcher

103

chungsbegriffs. Was allerdings reduziert wird, ist - anders als bei Friedman - nicht die Gesamtanzahl an unabhängigen Phänomenen bzw. unabhängigen gesetzartigen Sätzen, die wir zu akzeptieren haben, sondern die Anzahl an Argumenten verschiedenen Typs, die wir benutzen, wenn wir Sätze aus unserem Überzeugungssystem herleiten. Eine weitere Ähnlichkeit zu Friedmans Modell besteht in der Betonung des globalen Charakters von Erklärungen. Ob es sich bei einer gegebenen Entität um eine gute, eine schlechte oder gar keine Erklärung handelt, läßt sich auch in Kitchers Modell nicht entscheiden, indem man lediglich das zu erklärende Phänomen und die vermeintliche Erklärung betrachtet. Vielmehr muß man hierzu die Menge aller Erklärungen untersuchen, die in der Wissenschaft vorgebracht werden den sog. Erklärungsvorrat: On both the Hempelian and the causal approaches to explanation, the explanatory worth of candidates [...] can be assessed individually. By contrast, the heart of the view that I shall develop [...] is that successful explanations earn that title because they belong to a set of explanations, the explanatory store [...]. [...] Science supplies us with explanations whose worth cannot be appreciated by considering them one-by-one but only by seeing how they form part of a systematic picture of the order of nature. (Kitcher 1989: 430; m. H. außer „explanatory store")

Dieser Erklärungsvorrat läßt sich, wie im Zitat angedeutet, folgendermaßen beschreiben: Intuitively, the explanatory store associated with science at a particular time contains those derivations which collectively provide the best systematization of our beliefs. (Kitcher 1989: 430; m. H.)

Und hierbei ist Systematisierung im Sinne von Vereinheitlichung zu verstehen: Der ErklärungsVorrat für das gegebene Überzeugungssystem Κ enthält also diejenigen Erklärungen, die zusammen Κ am besten vereinheitlichen.32 Bei Erklärungen - den Elementen des Erklärungsvorrats - handelt es sich nach Kitcher um Ableitungen. Unter einer Ableitung versteht er dabei im wesentlichen ein Argument, d. h. eine Folge von Aussa32

Allerdings betont Kitcher, daß es sich hierbei nur um eine Ausgestaltung des .Systematisierungsansatzes' handele. Nach seiner Ansicht umfaßt dieser „an entire family of proposals among which is that based on the view of systematization as unification" (Kitcher 1989: 501, Endnote 15).

104

2

Das Vereinheitlichungsmodell

der

Erklärung

gen, von denen eine als Konklusion und die übrigen als Prämissen intendiert sind. Allerdings ist es Kitcher zudem wichtig, daß die betreffenden Aussagen nicht lediglich aufgelistet werden, sondern daß ihr argumentativer Status ersichtlich ist. Insbesondere soll kenntlich sein, wie die Konklusion aus den Prämissen folgt (vgl. hierzu weiter unten, Unterabschnitt 2.3.2). Als potentielle Erklärungen sind dabei lediglich deduktive Argumente zugelassen (vgl. Kitcher 1989: 448,459). In dieser Bestimmung von Erklärungen zeigt sich einerseits eine weitere Gemeinsamkeit mit Friedmans Modell, in dem ebenfalls nur deduktive Beziehungen zwischen Explanans und Explanandum zugelassen sind. Andererseits unterscheidet sich Kitcher von Friedman darin, daß zum einen Erklärungen nicht als Sätze, sondern als Argumente bestimmt werden und daß zum anderen Erklärungen von Einzelereignissen explizit zugelassen sind. Eine noch größere Nähe weist Kitchers Modell zum deduktiv-nomologischen bzw. deduktiv-statistischen Erklärungstyp im covering Zaw-Modell der Erklärung auf auch hier werden Erklärungen ja als deduktive Argumente konzipiert (vgl. Kapitel 1, Abschnitt 1.2).33 Kitcher motiviert und veranschaulicht seine Grundidee der Bestimmung des Erklärungsbegriffs über den Vereinheitlichungsbegriff anhand von zwei Beispielen - der Newtonschen Mechanik und der Darwinschen Evolutionstheorie. Newtons Theorie hat nach Kitchers Ansicht genau im gerade beschriebenen Sinn zu einer Vereinheitlichung geführt: Principia had exhibited how one style of argument [...] could be used in the derivation of descriptions of many, diverse, phenomena. The unifying power of Newton's work consisted in its demonstration that one pattern of

33

Die Konzeption von Erklärungen in Kitcher (1989) stellt eine Änderung zur Konzeption in Kitcher (1981) dar. In dieser Arbeit lehnt Kitcher noch explizit die Hempelsche Auffassung ab, nach der Erklärungen Argumente sind. Statt dessen werden Erklärungen als geordnete Paare konzipiert, die aus einer Proposition und einem Akttyp bestehen: „But although I shall follow the covering law model in employing the notion of argument to characterize that of explanation, / shall not adopt the ontological thesis that explanations are arguments. Following Peter Achinstein's thorough discussion of ontological issues concerning explanation in his (1977), I shall suppose that an explanation is an ordered pair consisting of a proposition and an act type." (Kitcher 1981: 509; m. H.).

2.3

Das Erklänmgsmodell

von Philip Kitcher

105

argument could be used again and again in the derivation of a wide range of accepted sentences. (Kitcher 1981: 514; H. d. A.)

Und genau hierin besteht nach Kitcher die hohe Erklärungsleistung von Newtons Theorie. Was die Darwinsche Evolutionstheorie betrifft, betont Kitcher zunächst, daß Darwin große Schwierigkeiten bei der genauen Herleitung von biologischen Phänomenen gehabt habe. Er stellt dann die rhetorische Frage, wie Darwin dennoch die erklärende Kraft seiner Theorie als deren größten Vorzug habe darstellen können, und antwortet: The answer lies in the fact that Darwin's evolutionary theory promises to unify a host of biological phenomena [...]. The eventual unification would consist in derivations of descriptions of these phenomena which would instantiate a common pattern. When Darwin expounds his doctrine what he offers us is the pattern. [ . . . ] he exhibits a pattern of argument, which, he maintains, can be instantiated, in principle, by a complete and rigorous derivation of descriptions of the characteristics of any current species. (Kitcher 1981: 514; H. d. A.) 3 4

Kitchers Hauptaufgabe besteht nun natürlich darin, seine durch Beispiele motivierte, intuitive Idee von Erklärung als Vereinheitlichung zu explizieren. Hierzu ist insbesondere eine Bestimmung des Begriffs des Argumentmusters anzugeben. Auf Kitchers Versuch einer Explikation seiner Grundidee gehe ich im folgenden Unterabschnitt 2.3.2 ein. Kitchers Modell sieht sich einer Reihe von Einwänden ausgesetzt, die ich in Unterabschnitt 2.3.3 diskutieren werde. In Unterabschnitt 2.3.4 werde ich schließlich dafür argumentieren, daß Kitchers Modell ebensowenig wie dasjenige Friedmans als Basis für den Schluß auf die beste Erklärung in Frage kommt.

34

Vgl. Kitcher (1985b) für eine genauere Darstellung der Anwendung seiner Theorie der Argumentmuster auf die Darwinsche Evolutionstheorie, vgl. Kitcher (1984) für eine Anwendung der Theorie auf die klassische und Molekulargenetik, und vgl. Kitcher (1985c) für eine Anwendung auf die Soziobiologie.

106

2

Das Vereinheitlichungsmodell

2.3.2

der

Erklärung

Explikation der Grandidee 35

Bei der Explikation seiner Grundidee geht Kitcher zunächst davon aus, daß es zu jedem Zeitpunkt in der Wissenschaft eine (konsistente und deduktiv abgeschlossene) Menge Κ von Sätzen gibt, die von der Wissenschaftsgemeinschaft akzeptiert werden. Diese Menge Κ ist das gegebene Überzeugungssystem, im Hinblick auf das Vereinheitlichung stattfindet. Weiterhin nimmt Kitcher (1989: 431) an, daß es zu jedem Überzeugungssystem Κ genau eine Menge von Ableitungen gibt, die Κ am besten vereinheitlicht, d. h. genau einen explanatorischen Vorrat E(K).36 Zur Bestimmung des zentralen Begriffs des Argumentmusters führt Kitcher nun einige Hilfsdefinitionen ein: Unter einem schematischen Satz versteht er einen Ausdruck, der aus einem normalsprachlichen Satz entsteht, indem einige, nicht notwendigerweise alle, nicht-logischen Ausdrücke des Satzes durch Schemabuchstaben ersetzt werden. Unter einer Menge von Ersetzungsinstruktionen für einen schematischen Satz versteht er eine Menge von Anweisungen für die Ersetzung der Schemabuchstaben des schematischen Satzes durch normalsprachliche Ausdrücke (wobei die jeweilige Menge für jeden Schemabuchstaben eine Anweisung enthält, die angibt, wie er zu ersetzen ist). Unter einem schematischen Argument versteht er eine Folge von schematischen Sätzen. Und unter einer Klassifikation für ein schematisches Argument A versteht er eine Menge von Sätzen, die den Ableitungscharakter von A beschreiben, d. h., deren Funktion darin besteht anzugeben, welche Glieder von A als Prämissen zu betrachten sind, welche Glieder aus welchen abzuleiten sind, welche Ableitungsregeln verwendet werden usw.

35

Die folgende Darstellung beruht im wesentlichen auf Kitcher (1989: Abschnitt 4), Abweichungen zu Kitcher (1981) werden an den betreffenden Stellen kenntlich gemacht. Die Menge Κ spielt bei Kitcher also in zweierlei Hinsicht eine andere Rolle als in Friedmans Modell: Zum einen ist Κ bei Friedman die Menge der akzeptierten gesetzartigen Sätze; zum anderen ist Κ in Friedmans Modell insofern deduktiv abgeschlossen, als Κ jede gesetzartige Folgerung aus Κ enthält. Was die Plausibilität des Ansetzens einer solchen Menge angeht, ob nun in Friedmans oder Kitchers Sinn, vgl. die Bemerkungen in Abschnitt 2.2.

2.3

Das Erklärungsmodell

von Philip Kitcher

107

Unter Verwendung dieser Begriffe definiert Kitcher ein allgemeines Argumentmuster als ein geordnetes Tripel (A, M, C) bestehend aus: (i) (ii)

einem schematischen Argument A; einer Menge M von Mengen von Ersetzungsinstruktionen (wobei M eine Menge von Ersetzungsinstruktionen für jeden schematischen Satz von A enthält) und (iii) einer Klassifikation C für A. Damit beurteilt werden kann, wie viele Argumentmuster eine Menge von Argumenten - insbesondere der Erklärungsvorrat E(K) - verwendet, muß der Begriff der Verwendung eines Argumentmusters durch ein Argument expliziert werden. Hierzu führt Kitcher den folgenden Begriff ein: Eine Folge F von Sätzen instantiiert ein Argumentmuster (A, M, C), falls sie die folgenden drei Bedingungen erfüllt: (1)

F hat dieselbe Anzahl von Gliedern wie das schematische Argument A; (ii) jedes Glied von F wird aus dem entsprechenden schematischen Satz in A in Übereinstimmung mit der passenden Menge von Ersetzungsinstruktionen in der Menge M gewonnen; (iii) es ist möglich, einen Gedankengang zu entwickeln, der jedem Glied von F den Status zuweist, der dem entsprechenden schematischen Satz in A durch die Klassifikation C zugewiesen wird. Ein Beispiel mag die Funktion der bis hierhin eingeführten Begriffe erläutern. Wie bereits im vorigen Unterabschnitt erwähnt, betrachtet Kitcher die Newtonsche Mechanik als eine vereinheitlichende Theorie. Sie erlaubt es seiner Ansicht nach, mit Hilfe des folgenden Argumentmusters (A*, M*, C*) eine große Anzahl von akzeptierten Sätzen über Einkörpersysteme herzuleiten (vgl. Kitcher 1981: 517). Das aus fünf schematischen Sätzen bestehende schematische Argument A* hat hier die folgende Form: ( 1 ) Die auf α wirkende Kraft ist ß. (2) Die Beschleunigung von α ist γ. (3) Kraft = Masse · Beschleunigung

108

2 Das Vereinheitlichungsmodell der Erklärung (4) (5)

β = (Masse von α) · γ δ=θ

Die Ersetzungsinstruktionen m¡* geben für die schematischen Sätze von A* folgendes an: Vorkommen von „a" sind durch einen Ausdruck zu ersetzen, der den betrachteten Körper bezeichnet; Vorkommen von „ß" durch einen Ausdruck, der eine Funktion der Ortskoordinaten und der Zeit bezeichnet; Vorkommen von ,,γ" durch einen Ausdruck, der eine Funktion der Ortskoordinaten und ihrer zeitlichen Ableitungen bezeichnet; 37 Vorkommen von ,,δ" durch einen Ausdruck, der die Ortskoordinaten des Körpers bezeichnet; und „Θ" ist zu ersetzen durch einen Ausdruck, der eine Funktion der Zeit bezeichnet. 38 Die Klassifikation C* für das schematische Argument A* gibt schließlich an, daß die Sätze (1) bis (3) den Status von Prämissen haben, daß (4) in offensichtlicher Weise aus ihnen gewonnen werden kann und daß (5) aus (4) unter Zuhilfenahme mathematischer Techniken folgt. Unter Rekurs auf die bisher eingeführten Begriffe ist es nun bereits möglich, die im vorigen Unterabschnitt dargestellte Grundidee zu explizieren, nach der unter Verwendung möglichst weniger Argumentmuster eine große Anzahl von akzeptierten Sätzen aus dem Überzeugungssystem Κ durch Elemente des Erklärungsvorrates hergeleitet werden soll. Kitcher stellt nun allerdings noch zwei weitere Forderungen an den Erklärungsvorrat E(K): Erstens sollen die verwendeten Argumentmuster von den sie instantiierenden Argumenten ein großes Maß an Ähnlichkeit verlangen bzw., in Kitchers Terminologie, sie sollen möglichst stringent sein. Zweitens sollen auch die Argumentmuster untereinander ein hohes Maß an Ähnlichkeit aufweisen. Beide Arten von Ähnlichkeit tragen nach Kitcher zur Erhöhung der Vereinheitlichung bei. 39 37

Im Falle einer eindimensionalen Bewegung entlang der x-Achse eines Cartesid2x" sehen Koordinatensystems würde ,,γ" beispielsweise durch „ ersetzt.

38

Die Sätze, die aus dem schematischen Satz (5) entstehen, beschreiben also die Abhängigkeit der Ortskoordinaten von der Zeit und spezifizieren so die Positionen des Körpers während seiner Bewegung. Die zweite Forderung fehlt in Kitcher (1989) und findet sich nur in Kitcher (1981). Dies ist nicht etwa darin begründet, daß sich Kitchers Position in der Zwischenzeit geändert hätte. Das Hinzufügen der Bedingung wurde schlicht übersehen. (Persönliches Gespräch, 1. Juni 2001.)

2.3

Das Erklärungsmodell von Philip Kitcher

109

Betrachten wir zunächst die Frage der Ähnlichkeit von Argumenten bzw. den Begriff der Siringenz eines Argumentmusters. Argumente können sich nach Kitcher in zwei Aspekten ähnlich sein: (i) hinsichtlich des nicht-logischen Vokabulars, das sie benutzen; und (ii) hinsichtlich ihrer logischen Struktur. Was (i) betrifft, so stellen Argumentmuster Bedingungen an ihre Instantiierungen einerseits durch das Vorkommen nicht-logischer Ausdrücke in den schematischen Sätzen des jeweiligen schematischen Argumentes und andererseits durch die Regeln für die Ersetzung von Schemabuchstaben in den schematischen Sätzen durch nicht-logische Ausdrücke. Was (ii) betrifft, so legt die Klassifikation des schematischen Argumentes den instantiierenden Argumenten Bedingungen auf. Wenn ein Argumentmuster nun von seinen Instantiierungen in diesen beiden Hinsichten mehr fordert als ein anderes Muster, so nennt Kitcher dieses Muster stringenter als das andere. 40 Betrachten wir nun den Begriff der Ähnlichkeit von Argumentmwstern. Hier ist nicht völlig klar, was Kitcher im Auge hat. Er scheint von der Ähnlichkeit von Argumentmustern untereinander zu reden, wenn er schreibt:

40

Offensichtlich wird ein Argumentmuster (A],Mi,Ci) stringenter als ein Muster (A2, M2, C2) sein, wenn es an seine Instantiierungen stärkere Bedingungen hinsichtlich Aspekt (i) stellt, hinsichtlich Aspekt (ii) aber dasselbe fordert. Analoges gilt bei Vertauschung der Aspekte. Wie allerdings die Stringenz von Argumentmustern zu bestimmen ist für den Fall, daß (Ai,M[,Ci) hinsichtlich Aspekt (i) stringenter ist als {A2, M2, C2), (A2, M2, C2) aber hinsichtlich Aspekt (ii) stringenter als (Aj, Mi, Ci), führt Kitcher nicht aus. Damit kann also die relative Stringenz von Argumentmustern nicht allgemein bestimmt werden. Kitchers .Lösung' für dieses Problem besteht in der Hoffnung, daß solche Fälle nicht vorkommen: „Of course, there is the worrying theoretical possibility that we may be forced to judge between argument patterns, one of which scores well by the kinds of considerations adduced in (T) [d. i. Aspekt (i)], while the other is recommended by the kinds of considerations adduced in (R) [d. i. Aspekt (ii)]. [...] we may hope that when this occurs there will be some acceptable argument pattern that combines the merits of both - but perhaps this is overly optimistic." (Kitcher 1989: 480). Auf diesen Punkt werde ich in Unterabschnitt 2.3.3 noch einmal zurückkommen. Vgl. im übrigen Kitcher (1989: 479 f.) für einen Versuch zu präzisieren, was es heißen soll, daß ein Argumentmuster hinsichtlich Aspekt (i) bzw. Aspekt (ii) stringenter ist als ein anderes.

110

2

Das Vereinheitlichungsmodell

der Erklärung

[...] our conditions on unifying power should be modified, so that, instead of merely counting the number of different patterns in a basis, we pay attention to similarities among them. (Kitcher 1981: 521; m. H.)

Allerdings scheint er tatsächlich nicht die Ähnlichkeit der Argumente untereinander im Sinn zu haben, sondern vielmehr deren Ähnlichkeit zu einem Kernmuster. All the patterns in the basis may contain a common core pattern, that is, each of them may contain some pattern as a subpattern. The unifying power of a basis is obviously increased if some (or all) of the patterns it contains share a common core pattern. (Kitcher 1981: 521; m. H.)

Es scheint mir offensichtlich, daß es sich bei der Forderung nach Ähnlichkeit von Argumentmustern untereinander bzw. nach Ähnlichkeit dieser Muster zu einem Kernmuster um zwei verschiedene Forderungen handelt. Zwei Argumentmuster " bezeichne eine 2stellige Operation auf Propositionen, und „A C H C" bezeichne die Proposition,

daß wenn A wahr wäre, dann auch C wahr wäre. Diese

Proposition heiße ein kontrafaktisches Konditional oder, der Kürze halber, ein Kontrafakt (in Anlehnung an den üblichen englischen Ausdruck „counterfactual"). Ist A* beispielsweise die Proposition, daß Peter sich mit Anna unterhalten hat, und C* die Proposition, daß Peter Caroline geküßt hat, dann bezeichnet „A* Hl·-» C*": die Proposition, daß wenn A* (die Proposition, daß Peter sich mit Anna unterhalten hat) wahr wäre, dann auch C* (die Proposition, daß Peter Caroline

136

3

Das kausale Modell der Erklärung

geküßt hat) wahr wäre.6 Die Operation C H wird dabei durch die folgende Wahrheitsbedingung definiert: (3.2)

Wahrheitsbedingung fiir Kontrafakte (A C H C) ist wahr in einer möglichen Welt w genau dann, wenn (1) oder (2) gilt: (1) es gibt keine mögliche Welt, in der A wahr ist; (2) es gibt eine mögliche Welt, in der A wahr ist, in der C wahr ist und die w ähnlicher ist als jede mögliche Welt, in der A wahr, C aber nicht wahr ist.

Ist ein Kontrafakt (A C H C) aufgrund von (1) wahr, so heißt es trivialerweise wahr (vacuously true) oder auch leer (vacuous). Die Bedeutung von Bedingung (2) reformuliert Lewis folgendermaßen: „In other words, a counterfactual is nonvacuously true iff it takes less of a departure from actuality to make the consequent true along with the antecedent than it does to make the antecedent true without the consequent." (Lewis 1986b: 164). Offensichtlich kann unser Beispielkontrafakt (A* C H C*) gemäß der oben geschilderten Konzeption von möglichen Welten nur dann wahr sein (in einer möglichen Welt w), wenn Bedingung (2) erfüllt ist - denn es gibt eine mögliche Welt, in der Peter sich mit Anna unterhalten hat, in der A* also wahr ist. In unserer Welt ist (A* C H C*) beispielsweise genau dann wahr, wenn es eine mögliche Welt gibt, in der Peter sich mit Anna unterhalten und Caroline geküßt hat, und wenn diese Welt der unseren ähnlicher ist als jede andere mögliche Welt, in der Peter sich zwar mit Anna unterhalten, aber Caroline nicht geküßt hat. Bei der Bestimmung der Wahrheitsbedingung eines Kontrafakts (A C H C) für eine mögliche Welt w nimmt Lewis zum einen nicht an, daß A in w immer falsch sein muß. Ist A in w wahr, so ist A in derjenigen Welt wahr, die w am ähnlichsten ist. In diesem Fall ist (A C H C) in w genau dann wahr, wenn C in w wahr ist. Hat Peter sich also in 6

Im folgenden werde ich die Bezeichnung „die Proposition, daß wenn A* (die Proposition, daß Peter sich mit Anna unterhalten hat) wahr wäre, dann auch C* (die Proposition, daß Peter Caroline geküßt hat) wahr wäre" abkürzen mit: „die Proposition, daß wenn Peter sich mit Anna unterhalten hätte, er dann auch Caroline geküßt hätte".

3.2

Das Erklärungsmodell von David Lewis

137

unserer Welt mit Anna unterhalten, so ist (A* C H C*) in unserer Welt genau dann wahr, wenn er auch Caroline in unserer Welt geküßt hat.7 Zum anderen nimmt Lewis in (3.2) nicht an, daß es immer eine oder mehrere Welten geben muß, die einer Welt w am nächsten sind: „Why not an infinite sequence of closer and closer [...] worlds, but no closest?" (Lewis 1986b: 164). Sollte es aber für w eine oder mehrere solcher Welten geben, läßt sich Bedingung (2) nochmals vereinfachen: „A C H C is nonvacuously true iff C holds at all the closest Aworlds." (Lewis 1986b: 164). Mit diesen Vorbereitungen kann nun der Begriff der kontrafaktischen Abhängigkeit zwischen Propositionen definiert werden:8 (3.3)

Kontrafaktische

Abhängigkeit zwischen

Propositionen

Eine mögliche Proposition C heißt kontrafaktisch abhängig von einer möglichen Proposition A genau dann, wenn gilt: Das Kontrafakt (A C H C) ist wahr. Im erwähnten Beispiel ist also die Proposition C* - daß Peter Caroline geküßt hat - kontrafaktisch abhängig von der Proposition A* - daß Peter sich mit Anna unterhalten hat - genau dann, wenn das Kontrafakt (A* C H C*) wahr ist, d. h., wenn es wahr ist, daß Peter Caroline geküßt hätte, falls er sich mit Anna unterhalten hätte. 7

Die Annahme, daß A in w falsch ist, ist allerdings die im üblichen Sprachgebrauch nächstliegende. Dies gilt insbesondere für sog. irreale Konditionalaussagen wie „Wenn Paul zu Hause gewesen wäre, hätte er den Anruf entgegennehmen können.", aber auch für sog. subjunktive Konditionalaussagen wie „Wäre Paul schlauer, würde er die Prüfung bestehen." Die Terminologie ist im Deutschen im übrigen unglücklich: „irreale Konditionalaussage" spielt auf ein semantisches Merkmal der betreffenden Aussagen an - die jeweiligen Sachverhalte bestehen nicht; während „subjunktive Konditionalaussage" ein syntaktisches Merkmal bezeichnet - Formulierung im Konjunktiv I. Dasselbe gilt für die englischen Ausdrücke „counterfactual conditional" bzw. „subjunctive conditional". Die Bezeichnung „counterfactual" ist darüber hinaus besonders unglücklich, wenn man wie Lewis annimmt, daß die betreffenden Sachverhalte doch bestehen können und insofern nicht counterfactual sein müssen. Lewis definiert den Begriff der kontrafaktischen Abhängigkeit eigentlich für Familien von Propositionen. Dieser Unterschied ist aber für die hier zu behandelnden Fragen nicht von Bedeutung; vgl. hierzu Lewis (1986b: 164 f.). Für eine ausführlichere Diskussion der Begriffe des Kontrafakts, der Ähnlichkeit zwischen möglichen Welten und der kontrafaktischen Abhängigkeit vgl. Lewis (1986c) und Lewis (1973b).

138

3

Das kausale Modell der Erklärung

Wie eingangs erwähnt, ist Lewis am Begriff der Verursachung zwischen einzelnen Ereignissen und nicht zwischen Propositionen interessiert. Um nun den Übergang von Propositionen zu Ereignissen zu erreichen, ordnen wir zunächst jedem möglichen Ereignis E die Proposition O(E) zu - die Proposition, daß sich E ereignet. (Diese Proposition ist in allen und nur den möglichen Welten wahr, in denen sich E ereignet.) Damit können wir von kontrafaktischer Abhängigkeit zwischen einzelnen Ereignissen sprechen: Diese ist nichts anderes als kontrafaktische Abhängigkeit zwischen den entsprechenden Propositionen. Das Ereignis E2 - Peters Küssen von Caroline - ist also kontrafaktisch abhängig vom Ereignis Ei - Peters Unterhaltung mit Anna - genau dann, wenn das Kontrafakt [O(Ei) C H CKE2)] wahr ist, d. h., wenn gilt: Wenn sich Ei ereignet hätte, dann hätte sich auch E2 ereignet. M. a. W.: E 2 ist kontrafaktisch abhängig von Ei genau dann, wenn gilt: Wenn Peter sich mit Anna unterhalten hätte, dann hätte er auch Caroline geküßt. Mit Hilfe des Begriffs der kontrafaktischen Abhängigkeit zwischen Ereignissen kann nun der Begriff der kausalen Abhängigkeit zwischen Ereignissen definiert werden: (3.4)

Kausale Abhängigkeit zwischen Ereignissen Ein mögliches Ereignis W ist kausal abhängig von einem (von ihm verschiedenen) möglichen Ereignis U genau dann, wenn gilt: Die Propositionen O(W), -iO(W) sind kontrafaktisch abhängig von den Propositionen O(U), -iO(U).

W ist von U also genau dann kausal abhängig, wenn sowohl das Kontrafakt [ 0 ( U ) l » 0 ( W ) ] als auch das Kontrafakt [-iO(U) C H -iO(W)] wahr sind, d. h„ wenn gilt: Wenn U eingetreten wäre, dann wäre auch W eingetreten, und wenn U nicht eingetreten wäre, dann wäre auch W nicht eingetreten. Betrachten wir zur Verdeutlichung nochmals unseren Beispielfall: Peters Küssen von Caroline ist nach (3.4) genau dann kausal abhängig von seiner Unterhaltung mit Anna, wenn sowohl [O(EI) C H 0(E 2 )] als auch [-.O(EI) C H -IO(E 2 )] wahr sind, d. h., wenn gilt: Hätte Peter sich mit Anna unterhalten, dann hätte er Caroline geküßt, und hätte Peter sich nicht mit Anna unterhalten, dann hätte er Caroline nicht geküßt. Hat Peter sich tatsächlich mit Anna unterhalten und Caroline geküßt (sind also E, und E2 eingetreten), so ist das Kontrafakt [O(EI)

3.2

Das Erklärungsmodell

von David Lewis

139

Ch» 0(E 2 )] automatisch wahr - denn dann sind sowohl O(Ei) als auch 0(E2) in unserer tatsächlichen Welt wahr, d. h. in derjenigen Welt, die der unseren am ähnlichsten ist. Peters Küssen von Caroline ist in diesem Fall genau dann kausal abhängig von seiner Unterhaltung mit Anna, wenn [—.O(Ei) C H -iO(E 2 )] wahr ist, d. h., wenn gilt: Hätte Peter sich nicht mit Anna unterhalten, so hätte er Caroline nicht geküßt. Allerdings ist Definition (3.4) nicht auf tatsächliche Ereignisse eingeschränkt. Auch Ereignisse, die nicht eingetreten (aber möglich) sind, können kausal voneinander abhängig sein: Hat Peter sich weder mit Anna unterhalten noch Caroline geküßt (sind also Ei und E2 nicht eingetreten), so ist [—lOCE^ C H -iO(E2)] automatisch erfüllt, und Peters Küssen von Caroline ist in diesem Fall genau dann kausal abhängig von seiner Unterhaltung mit Anna, wenn [O(Ei) C H CKE2)] wahr ist, d. h., wenn gilt: Hätte Peter sich mit Anna unterhalten, dann hätte er Caroline geküßt. Unter Verwendung des Begriffs der kausalen Abhängigkeit definiert Lewis schließlich den Begriff einer Ursache, der, anders als der Begriff der kausalen Abhängigkeit, auf tatsächliche Ereignisse eingeschränkt ist: (3.5)

Der Begriff einer Ursache Ein tatsächliches Ereignis U ist eine Ursache eines tatsächlichen Ereignisses W genau dann, wenn es eine kausale Kette gibt, die von U zu W führt, d. h., wenn es eine (endliche) Folge U, Vi, V 2 ,..., V„, W von tatsächlichen Ereignissen gibt, deren unmittelbar aufeinanderfolgende Glieder jeweils kausal voneinander abhängig sind.9

Es ist zu beachten, daß nach Definition (3.5) das Bestehen kausaler Abhängigkeit zwischen einem tatsächlichen Ereignis U und einem tatsächlichen Ereignis W hinreichend dafür ist, daß U eine Ursache von W ist: Ist W von U kausal abhängig, so gibt es eine (endliche) Folge von tatsächlichen Ereignissen, zwischen denen jeweils kausale Abhängigkeit besteht (nämlich die zweigliedrige Folge, deren Glieder U und W sind), und somit ist U eine Ursache von W. Andererseits ist 9

Das bedeutet: Vi ist kausal abhängig von U, V 2 ist kausal abhängig von Vi,.... V n ist kausal abhängig von V„_|, und W ist kausal abhängig von V„. Die betreffende Folge kann auch lediglich zweigliedrig sein.

3

140

Das kausale Modell der

Erklärung

nach (3.5) kausale Abhängigkeit nicht notwendig für Verursachung: Das Vorliegen einer kausalen Kette von U über V zu W, d. h. das Vorliegen von kausaler Abhängigkeit zwischen W und V und zwischen V von U, impliziert nicht das Vorliegen kausaler Abhängigkeit zwischen W und U. Weiterhin ist zu beachten, daß die Verursachungsrelation nach (3.5) transitiv ist: Ist U eine Ursache von V und V eine Ursache von W, so gibt es eine kausale Kette zwischen U und V und eine andere zwischen V und W. Somit gibt es auch eine kausale Kette zwischen U und W - nämlich diejenige Folge von Ereignissen, die aus der Konkatenation der beiden Ursprungsfolgen resultiert. Also ist U auch eine Ursache von W. Die hier beschriebene Bestimmung des Ursachenbegriffs hat mit einer Reihe von Schwierigkeiten zu kämpfen, auf die ich im folgenden Abschnitt eingehen werde. 10

3.2.3

Einwände gegen Lewis' Kausalitätsmodell

Mögliche Welten und ihre Ähnlichkeit untereinander Gegen David Lewis' Kausalitätsmodell lassen sich eine ganze Reihe von Einwänden vorbringen, von denen ich hier nur einige diskutieren kann. Bereits die Grundlagen seines Modells - die Begriffe der möglichen Welt und der Ähnlichkeit zwischen möglichen Welten, auf denen alle weiteren Definitionen aufbauen - sind problematisch. Was zunächst das Ansetzen von möglichen Welten betrifft, so ist sich Lewis der Unplausibilität seiner Position durchaus bewußt. Er denkt allerdings, daß dieser Nachteil durch die systematischen Vorteile zum Ver10

Es ist noch anzumerken, daß die Relation der Verursachung, wie sie in (3.5) definiert ist, sich in einem wesentlichen Punkt von der in (3.4) bestimmten Relation der kausalen Abhängigkeit unterscheidet - bei den Relata muß es sich nämlich nicht um verschiedene Ereignisse handeln, d. h., Selbstverursachung ist zugelassen, kausale Selbstabhängigkeit aber nicht: „Despite the truth of the appropriate counterfactuals, no event depends causally on itself; or on any other event from which it is not distinct. However, I do allow that an event may cause itself by way of a two-step chain of causal dependence: c depends on d which depends in turn on c, where d and c are distinct." (Lewis 1986h: 212 f.; m. H.). Neben Selbstverursachung ist weiterhin auch rückwirkende Verursachung möglich, d. h„ Ursachen müssen nicht zeitlich vor ihren Wirkungen liegen; vgl. hierzu auch Lewis (1986i).

3.2

Das Erklärungsmodell

von David Lewis

141

schwinden gebracht wird, die eine Ontologie möglicher Welten mit sich bringt. Es gibt seiner Ansicht nach many ways in which systematic philosophy goes more easily if we may presuppose modal realism in our analyses. I take this to be a good reason to think that modal realism is true, just as the utility of set theory in mathematics is a good reason to believe that there are sets. (Lewis 1986e: vii)

Und an anderer Stelle schreibt er: Why believe in a plurality of worlds? - Because the hypothesis is serviceable, and that is a reason to think that it is true. The familiar analysis of necessity as truth at all possible worlds was only the beginning. In the last two decades, philosophers have offered a great many more analyses that make reference to possible worlds, or to possible individuals that inhabit possible worlds. I find that record most impressive. I think it is clear that talk of possibilia has clarified questions in many parts of the philosophy of logic, of mind, of language, and of science - not to mention metaphysics itself. (Lewis 1986e: 3; H. d. A.)

Es wäre hier zum einen zu diskutieren, ob die Annahme von möglichen Welten wirklich all das leistet, was Lewis behauptet; zum anderen wäre zu untersuchen, ob eine solche Leistung tatsächlich einen guten Grund liefert, an die Existenz möglicher Welten im Lewisschen Sinne zu glauben. Es scheint mir, daß die Antwort auf diese beiden Fragen nicht so offensichtlich positiv ausfällt, wie Lewis annimmt. Ich kann hier allerdings nicht näher auf diese Fragen eingehen und will im folgenden annehmen, daß Lewis' modaler Realismus hinreichend durch gute Argumente untermauert werden kann. Aber auch dann, wenn dies der Fall sein sollte, ist Lewis' Kausalitätsmodell auf unsicheren Fundamenten gebaut - denn der Begriff der Ähnlichkeit zwischen möglichen Welten ist nach meiner Auffassung höchst unklar. Entgegen dem, was Lewis behauptet, ist es nämlich nicht der Fall, daß wir im Hinblick auf die Frage, welche Welten der unsrigen ähnlicher sind, klare Intuitionen haben. Dies kann man sich an einer Reihe von Beispielen verdeutlichen. Eines dieser Beispiele stammt von Bas van Fraassen: Let us suppose that I say to myself, sotto voce, that a certain fuse leads into a barrel of gunpowder, and then say out loud, 'If Tom lit that fuse there would be an explosion.' Suppose that before I came in, you had observed to yourself that Tom is very cautious, and would not light any fuse before

142

3

Das kausale Modell der Erklärung

disconnecting it, and said out loud, 'If Tom lit that fuse, there would be no explosion.' (van Fraassen 1980: 116; H. d. A.)

Damit wir entscheiden können, welches der beiden genannten Kontrafakte wahr ist, müssen wir in Lewis' Modell entscheiden können, welche mögliche Welt der unsrigen ähnlicher ist. Es ist aber völlig unklar, wie eine solche Entscheidung getroffen werden sollte: What sort of situation, among all the possible unrealized ones, is more like ours in the fuse example: one in which nothing new is done except that the fuse is lit, or one in which the fuse is lit after being disconnected? It all depends - similar in what respect? Similar in that no fuse is disconnected or similar in that no one is being irresponsible? (van Fraassen 1980: 117)

Dasselbe Problem wird durch ein Beispiel von Quine (vgl. 41982: 23) beleuchtet. Welches der beiden nachfolgenden Kontrafakte ist wahr? (3.6)

Wenn Verdi und Bizet Landsleute gewesen wären, dann wären sie Italiener gewesen. Wenn Verdi und Bizet Landsleute gewesen wären, dann wären sie Franzosen gewesen.

Ist eine mögliche Welt, in der Verdi und Bizet Landsleute sind, der unsrigen ähnlicher, wenn beide Franzosen oder wenn beide Italiener sind - oder vielleicht wenn beide Schweizer sind? Beispiele dieser Art zeigen meiner Ansicht nach, daß wir im Hinblick auf die Ähnlichkeit zwischen möglichen Welten keine Intuitionen haben, die „definite and accurate enough" (Lewis 1986b: 163; s. o.) wären, um eine Beantwortung der betreffenden Fragen zu erlauben. Lewis' Hinweis darauf, daß wir Einschätzungen von Ähnlichkeiten im alltäglichen Leben vornehmen - z. B. im Hinblick auf Personen, deren Ähnlichkeit viele verschiedene Aspekte hat - , ist zwar zutreffend, aber nicht relevant. Mit dem Personenbegriff wachsen wir auf, wir haben Übung darin, Personen miteinander zu vergleichen, und daher rühren unsere bestimmten Intuitionen über die Ähnlichkeit von Personen. Bei möglichen Welten verhält es sich ganz offensichtlich anders. Die Unklarheit des Begriffs der Ähnlichkeit zwischen möglichen Welten hat natürlich unmittelbare Konsequenzen für die Begriffe der kontrafaktischen Abhängigkeit, der kausalen Abhängigkeit und der Ursache: Wenn nicht entschieden werden kann, ob eine mögliche Welt W(, in der A und C wahr sind, unserer tatsächlichen Welt ähnlicher ist

3.2

Das Erklärungsmodell

von David Lewis

143

als jede andere mögliche Welt w¡, in der zwar A, nicht aber C wahr ist, so kann nicht entschieden werden, ob das Kontrafakt (A C H C) wahr ist; in diesem Fall kann nicht entschieden werden, ob zwischen den Propositionen C und A kontrafaktische Abhängigkeit besteht und ob daher zwischen den C und A korrespondierenden Ereignissen W und U kausale Abhängigkeit besteht; was schließlich zur Folge hat, daß nicht entschieden werden kann, ob U eine Ursache von W ist." Hinreichen von kontrafaktischer Abhängigkeit für kausale Abhängigkeit Die Grundlagen des Lewisschen Kausalitätsmodells sind also bereits sehr fragwürdig. Ein weiteres Problem für sein Modell resultiert aus der Analyse des Begriffs der kausalen Abhängigkeit über den Begriff der kontrafaktischen Abhängigkeit. Wie im letzten Abschnitt erwähnt, ist das Bestehen kontrafaktischer Abhängigkeit zwischen zwei Ereignissen W und U in Lewis' Modell hinreichend für das Bestehen kausaler Abhängigkeit zwischen den betreffenden Ereignissen; und das Vorliegen kausaler Abhängigkeit zwischen zwei tatsächlichen Ereignissen W und U ist hinreichend dafür, daß U eine Ursache für W ist. Es scheint allerdings viele Fälle zu geben, in denen kontrafaktische Abhängigkeit zwischen zwei tatsächlichen Ereignissen U und W vorliegt, ohne daß W kausal von U abhängt und ohne daß U eine Ursache von W ist. Kontrafaktische Abhängigkeit scheint also keineswegs hinreichend für kausale Abhängigkeit und Verursachung zu sein. Diese Schwierigkeit zeigt sich bereits bei der Unterscheidung von Ursachen und Wirkungen. Betrachten wir ein einfaches Beispiel: Ich schlage mit dem Hammer auf ein Glas. Das Glas zerbricht. Nehmen wir die Wahrheit folgender Aussage an: „Wenn ich nicht mit dem Hammer auf das Glas geschlagen hätte, wäre das Glas nicht zerbrochen." Das Zerbrechen des Glases ist also nach Lewis' Analyse kon11

Möglicherweise ist man versucht hier einwenden, daß ich mich bei dieser Kritik zu sehr auf die erkenntnistheoretischen Aspekte des Problems konzentriere, während Lewis' Analyse doch hierauf gar nicht abziele - Lewis versuche lediglich, eine begriffliche Analyse von kontrafaktischen Konditionalaussagen zu geben und keine Handlungsanweisung zur Entscheidung der Wahrheit solcher Aussagen. Ich werde auf diesen Punkt in Abschnitt 3.2.5 zurückkommen, wenn ich die Eignung von Lewis' Modell als Basis für den Schluß auf die beste Erklärung diskutiere.

144

3 Das kausale Modell der Erklärung

trafaktisch abhängig von meinem Schlagen mit dem Hammer. Mithin ist das Zerbrechen kausal abhängig vom Schlagen. 12 Und daher ist das Schlagen eine Ursache des Zerbrechens. So weit, so gut. Allerdings scheint auch folgendes zu gelten: Wenn das Glas nicht zerbrochen wäre, dann hätte ich nicht mit dem Hammer auf das Glas geschlagen - denn hätte ich doch geschlagen, dann wäre das Glas ja zerbrochen. Mein Schlagen mit dem Hammer ist also kontrafaktisch abhängig vom Zerbrechen des Glases; mithin ist das Schlagen kausal abhängig vom Zerbrechen; und daher ist das Zerbrechen eine Ursache des Schlagens! Lewis' Analyse liefert also ein äußerst unerwünschtes Ergebnis: Wirkungen sind Ursachen ihrer Ursachen. Eine ähnliche Schwierigkeit betrifft den Fall, in dem zwei Wirkungen einer gemeinsamen Ursache vorliegen. Betrachten wir wieder ein einfaches Beispiel: Bestimmte atmosphärische Veränderungen treten ein; das Barometer fällt; ein Sturm kommt auf. Nehmen wir folgendes an: Wenn die Veränderungen nicht eingetreten wären, dann wäre das Barometer nicht gefallen, und der Sturm wäre nicht aufgekommen. Das Fallen des Barometers und das Aufkommen des Sturms sind also nach Lewis' Analyse kontrafaktisch abhängig von den atmosphärischen Veränderungen. Damit sind sie kausal abhängig von diesen, und die Veränderungen sind mithin Ursachen des Fallens des Barometers und des Aufkommens des Sturms. Emeut: So weit, so gut. Allerdings scheint erstens wiederum zu gelten: Wenn das Barometer nicht gefallen wäre, dann wären die atmosphärischen Veränderungen nicht eingetreten - denn wären diese doch eingetreten, dann wäre ja auch das Barometer gefallen (dies ist dasselbe Argument wie im letzten Absatz). Außerdem scheint zweitens zu gelten: Wenn das Barometer nicht gefallen wäre, dann wäre der Sturm nicht aufgekommen - denn in diesem Fall wären, wie gerade gesehen, die atmosphärischen Veränderungen nicht eingetreten, und dann wäre nach unserer obigen Annahme auch der Sturm nicht aufgekommen. Das Aufkommen des Sturms ist somit kontrafaktisch abhängig vom Fallen des Barometers, damit kausal abhängig von diesem, und daher ist das Fallen des Ba12 Die Wahrheit der zweiten hierfür relevanten Aussage: „Wenn ich mit dem Hammer auf das Glas geschlagen hätte, wäre das Glas zerbrochen." ist ebenfalls gegeben, da beide Ereignisse eingetreten sind. Ich verwende hier der Einfachheit halber den Ausdruck „Aussage" synoym mit dem Ausdruck „Proposition".

3.2

Das Erklärungsmodell von David Lewis

145

rometers eine Ursache für das Aufkommen des Sturms. Lewis' Analyse macht also gemeinsame Wirkungen ein und derselben Ursache zu Ursachen voneinander. Lewis versucht, diese beiden Probleme zu lösen, indem er die Wahrheit der in den beiden letzten Absätzen kursiv gesetzten Kontrafakte leugnet, die er als ,back-tracking counterfactuals' bezeichnet: „The proper solution to both problems, I think, is flatly to deny the counterfactuals that cause the trouble." (Lewis 1986b: 170). Es ist nach Lewis' Auffassung nicht der Fall, daß wenn das Glas nicht zerbrochen wäre, ich nicht mit dem Hammer geschlagen hätte. Ich hätte mit dem Hammer geschlagen. Aber irgendwie hätte dies nicht zum Zerbrechen des Glases geführt: If e [the effect] had been absent, it is not that c [the cause] would have been absent [..]. Rather, c would have occured just as it did but would have failed to cause e. (Lewis 1986b: 170; m. H.) Wie kann Lewis die Wahrheit der betreffenden Kontrafakte leugnen? Nun, er muß zeigen, daß sie die Wahrheitsbedingung f ü r Kontrafakte nicht erfüllen, die wie gesehen über den Begriff der Ähnlichkeit von möglichen Welten definiert ist. Eine mögliche Welt Wi, in der gilt: (3.7)

Wenn das Glas nicht zerbrochen wäre, dann hätte ich nicht mit dem Hammer auf das Glas geschlagen.

muß der unsrigen Welt weniger ähnlich sein als eine Welt w 2 , in der gilt: (3.8)

Wenn das Glas nicht zerbrochen wäre, dann hätte ich dennoch mit dem Hammer auf das Glas geschlagen.

Und genau hierfür votiert Lewis, wenn er schreibt: It is less of a departure from actuality to get rid of e [the effect] by holding c [the cause] fixed and giving up some or other of the laws and circumstances in virtue of which c could not have failed to cause e, rather than to hold those laws and circumstances fixed and get rid of e by going back and abolishing its cause c. (Lewis 1986b: 170) O b diese Behauptung von Lewis nun richtig oder falsch ist, ob daher sein Lösungsversuch dieser beiden Probleme erfolgreich ist, hängt davon ab, ob seine Aussagen über die relative Ähnlichkeit zwischen möglichen Welten korrekt sind. Wie läßt sich diese Frage beantwor-

146

3

Das kausale Modell der Erklärung

ten? Wie ich weiter oben argumentiert habe, sind unsere Intuitionen über die relative Ähnlichkeit zwischen möglichen Welten zu vage, um eine eindeutige Entscheidung zuzulassen. Mich Uberzeugt Lewis' Einschätzung der Situation nicht, aber dies stellt so lange kein Gegenargument zu Lewis' Einschätzung dar, wie seine Einschätzung selbst kein Argument darstellt. Und dies ist so lange der Fall, wie der Begriff der Ähnlichkeit zwischen möglichen Welten vage und unbestimmt bleibt. Lewis' Ausführungen zu dem hier behandelten Punkt beziehen ihre Überzeugungskraft nach meiner Auffassung hauptsächlich aus einem rhetorischen Trick: Natürlich würde jeder sofort zugeben, daß es sehr schwer oder gar unmöglich ist, die Wirkung zu beseitigen „by going back and abolishing its cause" (Lewis 1986b: 170; m. H.; s. o.). Aber die beiden gerade beschriebenen Fälle stellen nicht den einzigen Typ von Gegenbeispiel zur These dar, kontrafaktische Abhängigkeit sei hinreichend für kausale Abhängigkeit und Verursachung. Jaegwon Kim (1973) diskutiert eine Reihe von Fällen, in denen seiner Ansicht nach zwar kontrafaktische Abhängigkeit, nicht aber kausale Abhängigkeit vorliegt. Kim hält kausale Abhängigkeit für einen von mehreren Unterfällen von kontrafaktischer Abhängigkeit. Neben kausaler Abhängigkeit umfaßt kontrafaktische Abhängigkeit beispielsweise noch analytische oder logische Abhängigkeit: „Wäre gestern nicht Dienstag gewesen, dann wäre heute nicht Mittwoch." Es ist jedoch unklar, inwiefern die von Kim angeführten Fälle tatsächlich Gegenbeispiele zu Lewis' Analyse darstellen. Wie erwähnt schränkt Lewis die Relation der kausalen Abhängigkeit auf voneinander verschiedene Ereignisse ein, und es ist fraglich, inwieweit es sich bei den Relata in den von Kim genannten Fällen um voneinander verschiedene Ereignisse handelt. Es gibt allerdings auch einige klare Fälle. Betrachten wir ein einfaches Beispiel: Mein Abheben des Telefonhörers um 20.34 Uhr gestern Abend ist kontrafaktisch abhängig vom unmittelbar vorher einsetzenden Klingeln dés Telefons - denn hätte das Telefon nicht geklingelt, hätte ich den Hörer nicht abgehoben. Somit ist nach Lewis' Analyse mein Abheben des Hörers kausal abhängig vom Klingeln des Telefons, und das Klingeln des Telefons ist eine Ursache für mein Abheben des Hörers. Allerdings ist mein Abheben des Hörers auch kontrafaktisch abhängig von meiner Rückkehr in die Wohnung um 19.48 Uhr - denn wenn ich nicht zurückgekehrt (sondern etwa in die Oper

3.2

Das Erklärungsmodell

von David Lewis

147

gegangen) wäre, dann hätte ich den Hörer um 20.34 Uhr nicht abgenommen. Somit ist nach Lewis' Analyse mein Abheben des Hörers um 20.34 Uhr kausal abhängig von meiner Rückkehr in die Wohnung um 19.48 Uhr, und meine Rückkehr ist eine Ursache für mein Abheben des Hörers. Dies ist keine wünschenswerte Konsequenz einer Definition der Relation der kausalen Abhängigkeit bzw. der Verursachung. Redundante Verursachung Ein weiteres gravierendes Problem für Lewis sind Fälle von sog. redundanter Verursachung, die in zwei verschiedenen Typen vorkommen. Beim ersten Typ - sog. Überverursachung (over-determination) - verursachen nach intuitiver Einschätzung zwei Ereignisse Uj und U2 gemeinsam ein Ereignis W, wobei allerdings jedes dieser Ereignisse bereits allein W verursacht hätte. Ein einfaches Beispiel hierfür ist das Erschießen eines Wolfes durch zwei Jäger, deren Kugeln gleichzeitig das Herz des Tieres treffen. Nach Lewis' Analyse ist weder der Schuß des ersten Jägers (Ereignis Ui) noch der Schuß des zweiten Jägers (Ereignis U2) eine Ursache für den Tod des Wolfes (Ereignis W). Denn weder gilt: Wäre U] nicht eingetreten, so wäre W nicht eingetreten. Noch gilt: Wäre U2 nicht eingetreten, so wäre W nicht eingetreten. Seine Analyse liefert also für beide Schüsse das falsche Ergebnis, denn nach intuitiver Einschätzung sind offensichtlich sowohl Uj als auch U 2 Ursachen für den Tod des Tieres. Beim zweiten Typ von redundanter Verursachung - der in verschiedenen Unterfallen vorkommt und zusammenfassend als preemption bezeichnet wird - verursacht nach intuitiver Einschätzung ein Ereignis Uj allein ein Ereignis W, wobei allerdings bei Fehlen von Ui ein anderes Ereignis U2 W verursacht hätte. Ein einfaches Beispiel für einen Unterfall von preemption - nämlich für sog. late cutting preemption - ist das Erschießen des Wolfes durch einen der beiden Jäger: Seine Kugel trifft den Wolf ins Herz; dieser fällt hierauf sofort zu Boden; daher verfehlt die Kugel des anderen Jägers (der etwas später oder aus größerer Entfernung oder mit einem schwächeren Gewehr schießt) ihr Ziel; seine Kugel hätte den Wolf aber ins Herz getroffen und getötet, wenn der erste Jäger nicht geschossen hätte. Nach Lewis' Analyse ist weder der Schuß des ersten Jägers (Ereignis U|) noch der Schuß des zweiten Jägers (Ereignis U2) eine Ursache für den Tod des Wolfes (Ereignis W). Denn weder gilt: Wäre Ui nicht eingetreten, so

148

3

Das kausale Modell der Erklärung

wäre W nicht eingetreten. Noch gilt: Wäre U2 nicht eingetreten, so wäre W nicht eingetreten. Lewis* Analyse liefert also im Hinblick auf den Schuß des zweiten Jägers das erwünschte Ergebnis, denn U 2 ist auch nach intuitiver Einschätzung keine Ursache für den Tod des Tieres. Im Hinblick auf Ui liefert sie allerdings das falsche Ergebnis, denn nach intuitiver Einschätzung ist Ui klarerweise eine Ursache für den Tod des Wolfes. In beiden Beispielen besteht zwischen den Ereignissen, die nach intuitiver Einschätzung Ursache und Wirkung sind, keine kontrafaktische Abhängigkeit. Da kontrafaktische Abhängigkeit in Lewis' Analyse aber eine notwendige Bedingung für kausale Abhängigkeit ist, besteht zwischen den betreffenden Ereignissen auch keine kausale Abhängigkeit. Dieser Umstand allein stellt noch kein Problem für Lewis' Analyse dar. Denn wie im letzten Abschnitt beschrieben, ist kausale Abhängigkeit keine notwendige Bedingung für Verursachung: Es reicht aus, wenn es eine Folge von Ereignissen U, Vi, V 2 ,..., V„, W gibt, die von der Ursache zur Wirkung führt, wobei zwischen unmittelbar aufeinanderfolgenden Ereignissen jeweils kausale Abhängigkeit vorliegt. Lewis versucht in der Tat, einen Unterfall des zweiten Typs von redundanter Verursachung - nämlich sog. early cutting preemption mit dieser Strategie zu lösen. Bei anderen Unterfällen - beispielsweise dem gerade beschriebenen late cutting preemption - eignet sich diese Strategie allerdings nicht, da völlig unklar ist, welches Ereignis zwischen Ursache und Wirkung geschoben werden soll. Fälle von late cutting preemption wollte Lewis zunächst über das Ansetzen einer Relation der kausalen Qmüsi-Abhängigkeit behandeln. Die Einführung dieses Begriffs bedeutete eine erste Modifikation seines Kausalitätsmodells: Der Begriff der kausalen Kette wurde nun neu definiert als eine Folge von (zwei oder mehr) Ereignissen, zwischen denen jeweils entweder kausale Abhängigkeit oder kausale Quasi-Abhängigkeit besteht. Aber auch diese Lösung mußte Lewis aus verschiedenen Gründen wieder aufgeben. 13

13

Zur Motivation und Definition des Begriffs der kausalen Quasi-Abhängigkeit vgl. Lewis ( 1986g: 20S ff.); für eine kurze Diskussion seiner Schwierigkeiten vgl. Lewis (2000: 184 f.).

3.2

Das Erklärungsmodell von David Lewis

149

In Lewis (2000) wird nun wiederum ein neuer Begriff eingeführt der Begriff der kausalen Beeinflussung. Vereinfacht gesprochen beeinflußt ein tatsächliches Ereignis U ein von ihm verschiedenes tatsächliches Ereignis W genau dann kausal, wenn es eine Reihe von Ereignissen Ui, U 2 usw. gibt, die U sehr ähnlich sind, und eine Reihe von Ereignissen Wi, W 2 usw., die W sehr ähnlich sind, so daß gilt: Wäre Ui eingetreten, so wäre Wi eingetreten; wäre U 2 eingetreten, so wäre W 2 eingetreten, usw. In Lewis' eigenen Worten: Where C and E are distinct actual events, let us say that C influences E if and only if there is a substantial range C b C2...of different not-too-distant alterations of C (including the actual alteration of C) and there is a range Ei, E2...of alterations of E, at least some of which differ, such that if C! had occurred, E! would have occurred, and if C 2 had occurred, E2 would have occurred, and so on. (Lewis 2000: 190; H. d. A.)

Der Begriff der kausalen Beinflussung ersetzt nun die Begriffe der kausalen Abhängigkeit und der kausalen Quasi-Abhängigkeit bei der Definition des Begriffs einer Ursache. 14 Da Lewis die Verursachungsrelation nach wie vor als transitiv charakterisieren möchte, die Relation der kausalen Beeinflussung allerdings für nicht transitiv hält, wird erneut der Begriff einer kausalen Kette - nämlich von kausalen Beeinflussungen - in seine Definition des Ursachenbegriffs eingebaut: U ist eine Ursache von W genau dann, wenn zwischen U und W eine kausale Kette besteht, d. h., wenn es eine Folge von Ereignissen U, Vi, V 2 ,..., V n , W gibt, so daß zwischen aufeinanderfolgenden Ereignissen die Relation der kausalen Beeinflussung besteht. 15 Ich kann an dieser Stelle nicht weiter auf die Frage eingehen, warum und wie Lewis glaubt, mit Hilfe des Begriffs der kausalen Beeinflussung die verschiedenen Fälle von redundanter Verursachung lösen zu können. Ich möchte statt dessen zum einen darauf hinweisen, daß die Ersetzung der Begriffe der kausalen Abhängigkeit und Quasi-Abhängigkeit durch den Begriff der kausalen Beeinflussung die weiter oben genannten Probleme von Lewis' Kausalitätsmodell nicht löst: 14

15

Lewis' zweite Modifikation seines Kausalitätsmodells ist nicht nur durch die Schwierigkeiten des Begriffs der kausalen Quasi-Abhängigkeit begründet, sondern geht insbesondere zurück auf die Entdeckung eines neuen Typs von redundanter Verursachung - sog. trumping preemption - durch Schaffer (2000). Lewis diskutiert diesen Typ ausfuhrlich im genannten Aufsatz. Siehe hierzu Lewis (2000: Abschnitt VIII).

150

3

Das kausale Modell der

Erklärung

Der Begriff der kausalen Beeinflussung basiert ebenfalls auf dem Begriff der kontrafaktischen Abhängigkeit und damit auf den Begriffen der möglichen Welt und der Ähnlichkeit zwischen möglichen Welten. Alle Einwände, die gegen diese Begriffe vorgebracht wurden, stellen also auch Einwände gegen Lewis' aktuelles Modell dar. Zum anderen handelt sich Lewis mit der Einführung des Begriffs der kausalen Beeinflussung ein neues Problem ein - nämlich das sog. Problem der ,spurious causation'. Dieses Problem besteht darin, daß die Definition von Verursachung Uber kausale Beeinflussung viele Ereignisse zu Ursachen anderer Ereignisse macht, die nach intuitiver Einschätzung keine Ursachen für diese Ereignisse sind. Laurie Paul beschreibt dieses Problem folgendermaßen: [...] consider two events a and b that we would normally take to be causally unrelated. Take a to be my body temperature and b to be the white pages of the manuscript strewn across my desk. If my body temperature were altered so that I radiated sufficient heat, the white paper would turn brown and curl at the edges. But, surely, the temperature of my body is not the cause of the whiteness of the paper [...]. (Paul 2000: 250)

Das Vorliegen von kausaler Beeinflussung im Sinne von Lewis ist also keine hinreichende Bedingung für Verursachung.16 Die geschilderten Probleme des Kausalitätsmodells von David Lewis scheinen mir berechtigte Zweifel daran zu erlauben, daß sein Modell eine angemessene Analyse des Kausalitätsbegriffs darstellt. Diese Probleme haben darüber hinaus unmittelbare Auswirkungen auf die Eignung seines Erklärungsmodells als Basis für den Schluß auf die beste Erklärung. Bevor ich allerdings zur Diskussion dieser Frage komme, werde ich im nächsten Abschnitt zunächst auf Lewis' Erklärungsmodell eingehen.

16

Für Lewis' Entgegnung auf diesen Einwand vgl. Lewis (2000: Abschnitt VI). Ein weiteres Problem, mit dem bereits Lewis' ursprüngliches Modell zu kämpfen hatte und das auch durch die Einführung des Begriffs der kausalen Beeinflussung nicht gelöst wird, betrifft die bereits beschriebene Eigenschaft der Verursachungsrelation, transitiv zu sein: Es scheint entgegen Lewis' Annahme eine Reihe von Fällen zu geben, in denen zwar U eine Ursache von V und V eine Ursache von W, U aber keine Ursache von W ist. Für die Diskussion solcher Fälle vgl. Hall (2000) und Paul (2000: 250 f., insbesondere Fußnote 22). Für Lewis' Replik auf diesen Einwand vgl. Lewis (2000: Abschnitt IX).

3.2

Das Erklärungsmodell

3.2.4

von David Lewis

151

Lewis' Erklärungsmodell

Die Grundidee Die Grundidee von David Lewis' Erklärungsmodell läßt sich in einem Satz zusammenfassen: Here is my main thesis: to explain an event is to provide some about its causal history. (Lewis 1986a: 217; m. H.)

information

Das Explanandum jeder Erklärung in Lewis' Modell ist ein konkretes Ereignis. Dieses Ereignis wird erklärt, indem in der einen oder anderen Form Information über seine kausale Geschichte angeführt wird. Lewis' Hauptthese ist dabei so zu verstehen, daß es sich hierbei um die einzige Art der Erklärung handelt, die für konkrete Ereignisse gegeben werden kann: Besides the causal explanation that I am discussing, is there also any such thing as non-causal explanation of particular events? My main thesis says there is not. (Lewis 1986a: 221)

Die vollständige kausale Erklärung eines Ereignisses besteht in Lewis' Modell in der Angabe seiner gesamten kausalen Geschichte: Among the true propositions about the causal history of an event, one is maximal in strength. It is the whole truth on the subject - the biggest chunk of explanatory information that is free of error. We might call this the whole explanation of the explanandum event, or simply the explanation. (Lewis 1986a: 218 f.; H. d. A.)

Die in tatsächlichen Erklärungen vorgelegte Information über die kausale Geschichte eines zu erklärenden Ereignisses ist allerdings niemals vollständig, sondern immer „inevitably partial" (Lewis 1986d: 242). Welcher Teil der kausalen Geschichte eines zu erklärenden Ereignisses bei einer Erklärung genannt wird, hängt von unserem Interesse an bestimmten Aspekten dieser Geschichte ab. Pragmatische Faktoren steuern nach Lewis' Auffassung auch die Beurteilung der Güte einer Erklärung: Die Beantwortung der Frage, wie gut eine vorgelegte Information über die kausale Geschichte eines Explanandum-Ereignisses dieses erklärt, hängt davon ab, inwieweit sie unser spezielles Interesse an bestimmten Aspekten dieser Geschichte befriedigt. Im folgenden werde ich versuchen, Lewis' Hauptthese näher zu erläutern, indem ich zunächst die beiden entscheidenden Begriffe diskutiere, die in

152

3

Das kausale Modell der Erklärung

der These verwendet werden - den Begriff der kausalen Geschichte und den der Information über diese kausale Geschichte. Daran anschließend werde ich seine Konzeption der Gütekriterien für Erklärungen behandeln. Die kausale Geschichte eines Ereignisses Jedes Ereignis W hat nach Lewis eine lange und komplizierte kausale Geschichte. Viele Ereignisse gehen W voraus, und viele davon sind Ursachen von W. Diese Ursachen von W haben selbst wieder eigene Ursachen. Und auch diese sind - gemäß der geschilderten Bestimmung des Ursachenbegriffs im vorigen Abschnitt - Ursachen von W. Ursachen eines Ereignisses W können Teile haben. Diese können wiederum selbst Ursachen von W oder von Teilen von W sein. Ursachen von Ereignissen liegen nach Lewis' Auffassung außerdem dicht: Für jedes Ereignis W und jede Ursache U dieses Ereignisses gibt es ein weiteres Ereignis V, das von U verursacht wird und selbst eine Ursache von W ist. Betrachten wir ein Beispiel (vgl. Lewis 1986a: 214 ff.). Ein Autounfall geschieht. Der Fahrer des einen beteiligten Autos ist betrunken, und er fährt zu schnell. Die Reifen seines Autos haben kein Profil mehr und nicht den vorgeschriebenen Reifendruck. Die Straße, auf der er fährt, ist vereist. Die Sicht auf das von rechts kommende andere Auto ist durch eine Hecke versperrt. Alle diese Faktoren wirken zusammen und verursachen gemeinsam den Unfall. Für jeden der Faktoren gilt: Hätte er gefehlt, so wäre der Unfall nicht eingetreten. Jeder der Faktoren ist also eine Ursache des Unfalls. Die genannten Faktoren haben selbst Ursachen, denen wiederum eigene Ursachen vorangehen. Beispielsweise wird die Betrunkenheit des Fahrers durch das Trinken von zuviel Bier verursacht; das Trinken von zuviel Bier durch eine Einladung eines Freundes; die Einladung durch die Geburt des ersten Kindes des Freundes usw. Trinken, Einladung, Geburt usw. sind ebenfalls Ursachen des Unfalls. Die Ursachen des Unfalls haben Teile, die selbst wieder Ursachen des Unfalls bzw. seiner Teile sind: Die vereiste Straße besteht aus der vereisten Fläche unterhalb der Vorderräder und aus der vereisten Fläche unterhalb der Hinterräder. Diese Teile verursachen - zusammen mit dem Betätigen der Bremsen - das Blockieren der Vorderräder bzw. das Blockieren der Hinterräder. Die Ursachen des Unfalls liegen dicht: Die vereiste Straße ist kei-

3.2

Das Erklärungsmodell von David Lewis

153

ne unmittelbare Ursache des Unfalls - vielmehr verursacht die vereiste Straße das Blockieren der Vorderräder und das Blockieren der Hinterräder, beide Ereignisse verursachen zusammen das Schleudern des Autos, dieses verursacht eine Richtungsänderung usw. Die kausale Geschichte eines Ereignisses hat in der Regel die Struktur eines (umgedrehten) Baumes: Ein eintretendes Ereignis ist vereinfacht gesagt „the culmination of countless distinct, converging causal chains" (Lewis 1986a: 214).17 Darüber, ob die Anzahl der Ursachen eines Ereignisses unendlich oder lediglich sehr groß ist, äußert sich Lewis nicht genau. An manchen Stellen drückt er sich so aus, als würde er sie für unendlich halten - etwa wenn er davon spricht, daß kausale Ketten (also Folgen von Ereignissen) dicht sind (vgl. Lewis 1986a: 215), oder wenn er schreibt: „The causal process was in fact a continuous one." (Lewis 1986a: 215; m. H.). An anderen Stellen scheint er sich dessen nicht sicher zu sein: We might imagine a world where causal histories are short and simple; but in the world as we know it, the only question is whether they are infinite or merely enormous. [...] each of these causes in turn has its causes; and those too are causes of the crash. So in turn are their causes, and so, perhaps, ad infinitum. (Lewis 1986a: 214; m. H. außer „ad infinitum")

Wenn wir die kausale Geschichte eines Ereignisses beschreiben, treffen wir aus der großen Anzahl seiner Ursachen eine Auswahl. Diese Auswahl ist aber nicht durch objektive Faktoren, nicht durch die tatsächlichen Ereignisse festgelegt. Es gibt keine objektiv wichtigen oder unwichtigen Ursachen eines Ereignisses, sondern nur Ursachen, die uns bedeutender erscheinen als andere: „There is no one right way though there may be more or less natural ways - of carving up a causal history." (Lewis 1986a: 215). Insbesondere gibt es nicht die Ursache eines Ereignisses, obwohl unsere übliche Redeweise von bestimmten Ereignissen als den Ursachen anderer Ereignisse dies nahezulegen scheint. Wenn ein Polizist die Trunkenheit des Fahrers als die Ursache des Unfalls bezeichnet, ein Soziologe dessen schlechte Erziehung, ein Mechaniker die abgefahrenen Reifen des Autos und des 17

Allerdings kann es auch vorkommen, daß die Äste, die zur Wurzel laufen, sich nicht nur vereinigen, sondern auch verzweigen: Die schlechte Erziehung des Fahrers kann eine Ursache sowohl für das fehlende Profil seiner Reifen als auch für seinen Alkoholkonsum unmittelbar vor der Fahrt sein.

154

3

Das kausale Modell der Erklärung

Fahrers Ehefrau die ungünstigen Sichtverhältnisse, so liegt kein Widerspruch vor: They disagree only about which part of the causal history is most salient for the purposes of some particular inquiry. They may be looking for the most remarkable part, the most remediable or blameworthy part, the least obvious of the discoverable parts,.... Some parts will be salient in some contexts, others in others. Some will not be at all salient in any likely context, but they belong to the causal history all the same: the availability of petrol, the birth of the driver's paternal grandmother, the building of the fatal road, the position and velocity of the car a split second before the impact. (Lewis 1986a: 215 f.) Die kausale Geschichte eines zu erklärenden Ereignisses W ist also eine ausgesprochen umfangreiche und komplexe Entität, die unzählige Ereignisse umfaßt, die allesamt Ursachen von W sind. Was ist nun unter dem Begriff der Information über eine solche kausale Geschichte zu verstehen? Information über die kausale Geschichte eines Ereignisses Die nächstliegende Möglichkeit, Information Uber die kausale Geschichte eines Explanandum-Ereignisses W anzugeben, besteht darin, Elemente seiner kausalen Geschichte zu benennen - d. h. Ereignisse, die zu den Ursachen von W gehören. Dies kann offensichtlich auf unterschiedliche Art und Weise geschehen: Man kann eine der Ursachen von W identifizieren - im oben beschriebenen Beispiel etwa die vereiste Straße; man kann mehrere solche Ursachen nennen, die kausal voneinander unabhängig sind, mehr oder weniger gleichzeitig auftreten und W gemeinsam verursachen - die vereiste Straße, die Trunkenheit am Steuer, die durch die Hecke eingeschränkte Sicht usw.; man kann eine der kausalen Ketten, die zu W führen, mehr oder weniger spezifisch beschreiben - der Golfstrom bewirkte einen Zustrom von Warmluft nach Westeuropa, wodurch eine Kaltfront nach Deutschland abgedrängt wurde, die zur Abkühlung der Luftmasse Uber dem Boden führte, was eine Abkühlung des Bodens bewirkte, die schließlich zur Vereisung der Straße führte usw.; oder man kann eine baumartige Struktur solcher Ketten beschreiben - die schlechte Erziehung führte zu Verantwortungslosigkeit seitens des Fahrers, dies bewirkte zum einen eine versäumte Inspektion des Autos, zum anderen seine Trunkenheit am Abend des Unfalls usw.

3.2

Das Erklärungsmodell

von David Lewis

155

Diese Nennung von konkreten Ereignissen, die zu den Ursachen des Explanandum-Ereignisses gehören, ist aber nicht die einzige Möglichkeit, Information über die kausale Geschichte zu liefern. Man kann weiterhin Existenzbehauptungen über die kausale Geschichte aufstellen, ohne dabei ein konkretes Ereignis als Ursache des ExplanandumEreignisses zu identifizieren. Diese Existenzbehauptungen können wiederum entweder einzelne Ereignisse betreffen und beispielsweise besagen, daß ein Ereignis einer bestimmten Art zu den Ursachen des Explanandum-Ereignisses gehört; oder sie können eine kausale Kette betreffen und etwa besagen, daß eine Kette dieser oder jener Art Teil der kausalen Geschichte ist; usw. Existenzbehauptungen Uber die kausale Geschichte eines Explanandum-Ereignisses können dabei viele verschiedene Formen annehmen: If someone says that the causal history includes a pattern of events having such-and-such description, there are various sorts of description that he might give. A detailed structural specification might be given, listing the kinds and relations of the events that comprise the pattern. But that is not the only case. The explainer might instead say that the pattern that occupies a certain place in the causal history is some biological, as opposed to merely chemical, process. Or he might say that it has some global structural feature·, it is a case of underdamped negative feedback, a dialectical triad, or a resonance phenomenon. [...] Or he might say that it is a process analogous to some other, familiar process. [...] Or he might say that the causal process, whatever it may be, is of a sort that tends in general to produce a certain kind of effect. (Lewis 1986a: 220; m. H.)

Eine dritte Möglichkeit, Information Uber die kausale Geschichte eines Explanandum-Ereignisses anzugeben, besteht darin, negative Information anzuführen - man sagt etwas darüber, was kein Bestandteil der kausalen Geschichte ist: "Why was the CIA man there when His Excellency dropped dead? - Just coincidence, believe it or not." Here the information given is negative, to the effect that a certain sort of pattern of events - namely, a plot - does not figure in the causal history. (Lewis 1986a: 220)

Negative Information ist dabei für Lewis ein relativ weiter Begriff: Ein Patient erhält Opium und schläft sofort ein. Ein Arzt verweist auf die vis dormitiva von Opium als Bestandteil der kausalen Geschichte des Einschlafens. Seine Erklärung ist nicht gerade sehr detailliert, aber er hat nach Lewis' Auffassung dennoch gewisse negative Information

156

3 Das kausale Modell der Erklärung

Uber das Einschlafen geliefert. Denn sein Hinweis schließt beispielsweise aus, daß immer dann, wenn ein Patient Opium erhält, böse Krankenschwestern unbemerkt starke Schlafmittel verabreichen, um den Anschein zu erwecken, Opium habe eine vis dormitiva. Die Information des Arztes impliziert zumindest, daß das Einschlafen mit den Eigenschaften des Opiums zusammenhängen muß. Die Information Uber die kausale Geschichte eines zu erklärenden Ereignisses kann also viele verschiedene Formen annehmen - „information about what the causal history includes may range from the very specific to the very abstract" (Lewis 1986a: 220). Insbesondere muß sie nicht immer in der Angabe bestimmter Ursachen des Explanandum-Ereignisses bestehen. Kriterien zur Beurteilung der Güte einer Erklärung Eine Erklärung eines Ereignisses besteht also in der Angabe von Information Uber seine kausale Geschichte, in der einen oder anderen der oben beschriebenen Formen. Nach welchen Kriterien wird nun die Güte einer Erklärung in Lewis' Modell beurteilt? Welche Gesichtspunkte sind ausschlaggebend fUr die Beantwortung der Frage, welche von verschiedenen, miteinander konkurrierenden Erklärungen die beste Erklärung des Explanandum-Ereignisses darstellt? Die Grundidee zur Antwort auf diese Frage faßt Lewis folgendermaßen zusammen: Goodness of explanation is governed by the pragmatic standards that apply to information-giving generally. (Lewis 1986d: 242; m. H.) Diese Bestimmung enthält zwei Komponenten: Zum einen soll die Güte einer Erklärung nach pragmatischen Kriterien beurteilt werden; zum anderen sollen diese Kriterien dieselben sein, die bei der Beurteilung der Güte von Information allgemein verwendet werden. Diesen zweiten Aspekt betont Lewis ganz besonders. Seine Analyse der GUtekriterien einer Erklärung applies just as well to acts of providing information about any large and complicated structure. It might just as well have been the rail and tram network of Melbourne rather than the causal history of some explanandum event. The information provided, and the act of providing it, can be satisfactory or not in precisely the same ways. There is no special subject: pragmatics of explanation. (Lewis 1986a: 227 f.; H. d. A.)

3.2 Das Erklärungsmodell von David Lewis

157

Eine spezielle explanatorische Güte einer Hypothese gibt es in Lewis' Modell also nicht. Damit unterscheidet es sich wesentlich vom in Kapitel 2 diskutierten Vereinheitlichungsmodell der Erklärung, in dem erklärende Hypothesen ein spezifisch explanatorisches Kriterium erfüllen müssen - sie müssen nämlich möglichst vereinheitlichend wirken. 18 Was Lewis unter dem Ausdruck „pragmatisch" verstehen will, führt er nicht näher aus. Es liegt nahe, den Ausdruck so zu verstehen, daß er etwas mit der Handlung des Erklärens zu tun hat und insbesondere die Personen betrifft, die in eine solche Handlung involviert sind - d. h. den Erklärenden und den Rezipienten der Erklärung. In der Tat diskutiert Lewis einige Gütekriterien einer Erklärung, die direkt auf die Erklärungshandlung, den Erklärenden und den Rezipienten der Erklärung bezogen sind. Beispielsweise ist es fur die Beurteilung der Güte einer Erklärung nach Lewis' Auffassung wichtig, ob die zur Verfügung gestellte Information für den Rezipienten neu oder ihm schon bekannt ist: „The information provided, even if satisfactory in itself, may be stale news. It may add little or nothing to the information the recipient possesses already." (Lewis 1986a: 227). Weiterhin ist für die Güte einer Erklärung relevant, ob die angeführte Information über die kausale Geschichte des Explanandum-Ereignisses das spezifische Interesse des Rezipienten befriedigt: The information provided may not be of the sort the recipient most wants. He may be especially interested in certain parts of the causal history, or in certain questions about its overall structure. If so, no amount of explanatory information that addresses itself to the wrong questions will satisfy his wants [...]. (Lewis 1986a: 227)

Darüber hinaus muß die Information Uber die kausale Geschichte des Explanandum-Ereignisses dem Rezipienten so präsententiert werden, daß er sie sich zu eigen machen kann: Explanatory information may be provided in such a way that the recipient has difficulty in assimilating it, or in disentangling the sort of information he wants from all the rest. He may be given more than he can handle, or he may be given it in a disorganized jumble. ' ' O r he may be given it in so 18

Im in Kapitel 1 diskutierten covering /aw-Modell der Erklärung werden wie beschrieben Uberhaupt keine Kriterien zur Beurteilung der Gute einer Erklärung angesetzt.

158

3

Das kausale Modell der Erklärung

unconvincing a way that he doesn't believe what he's told. If he is hard to convince, just telling him may not be an effective way to provide him with information. You may have to argue for what you tell him, so that he will have reason to believe you. (Lewis 1986a: 227)

Eine Erklärung kann außerdem insofern eine schlechte Erklärung sein, als der Erklärende versäumt, bestimmte irrige Annahmen zu korrigieren, von denen der Rezipient fälschlicherweise ausgeht: „The recipient may start out with some explanatory misinformation, and the explainer may fail to set him right." (Lewis 1986a: 227). Schließlich ist es für die Beurteilung der Güte einer Erklärung nach Lewis' Auffassung wichtig, daß der Erklärende die Information über die kausale Geschichte nicht lediglich dahersagt oder erfindet, sondern im Hinblick auf diese Information über gerechtfertigte Meinungen bzw. Wissen verfügt: He [the explainer] may have said what he did not know and had no very good reason to believe. If so, the act of explaining is not fully satisfactory, even if the information provided happens to be satisfactory. (Lewis 1986a: 227)

Alle diese Kriterien zur Beurteilung der Güte einer Erklärung betreffen in der einen oder anderen Form den Erklärenden, den Rezipienten oder beide und können insofern fraglos als pragmatische Kriterien bezeichnet werden. Neben Kriterien dieser Art diskutiert Lewis allerdings auch andere Kriterien zur Beurteilung der Güte einer Erklärung, die nach meiner Auffassung nichts mit der Handlung des Erklärens, dem Erklärenden oder dem Rezipienten zu tun haben. Diese Kriterien betreffen vielmehr ausschließlich die Information, die bei einer Erklärung zur Verfügung gestellt wird. Es bleibt insofern unklar, warum es sich bei ihnen um pragmatische Kriterien handeln soll. Eines dieser Kriterien betrifft die Wahrheit der Information, die über die kausale Geschichte eines zu erklärenden Ereignisses angeführt wird: An act of explaining may be unsatisfactory because the explanatory information provided is unsatisfactory. In particular, it might be misinformation: it might be Ά false proposition about the causal history of the explanandum. (Lewis 1986a: 226; m. H.)

Dieses Kriterium erlaubt dabei Gradabstufungen: Zum einen kann die Information über die kausale Geschichte des Ereignisses mehr oder

3.2

Das Erklärungsmodell voti David Lewis

159

weniger falsch, d. h. verschieden weit von der Wahrheit entfernt sein sein: „False is false, but a false proposition may or may not be close to the truth." (Lewis 1986a: 226). Zum anderen können verschieden große Teile der explanatorischen Information falsch sein: „If it has a natural division into conjuncts, more or fewer of them may be true." (Lewis 1986a: 226). Die explanatorische Information über die kausale Geschichte eines Ereignisses wird also unter anderem danach beurteilt, wie nahe sie insgesamt der tatsächlichen kausalen Geschichte kommt: „The world as it is may be more or less similar to the world as it would be if the falsehood were true." (Lewis 1986a: 226). Ein zweites meiner Ansicht nach nicht-pragmatisches Kriterium zur Beurteilung der Güte einer Erklärung betrifft die Menge und die Aussagekraft der angeführten Information. Einerseits kann es sich bei dieser Information um eine schwache Proposition handeln - „one that excludes few (with respect to some suitable measure) of the alternative possible ways the causal history of the explanandum might be" (Lewis 1986a: 226). Andererseits kann sie ungebührlich disjunktiv sein: „The alternative possibilities left open might be too widely scattered, too different from one another." (Lewis 1986a: 226). Auch dieses Kriterium zur Beurteilung der Güte explanatorischer Information erlaubt Gradabstufungen: Other things being equal, it is better if more correct explanatory information is provided, and it is better if that information is less disjunctive, up to the unattainable limit in which the whole explanation is provided and there is nothing true and relevant left to add. (Lewis 1986a: 227)

Eine Erklärung ist also nach diesem Kriterium um so besser, je mehr korrekte Information sie über die kausale Geschichte des Explanandum-Ereignisses zur Verfügung stellt. Insbesondere besteht die beste Erklärung eines Ereignisses nach diesem Kriterium in der wahrheitsgemäßen Angabe der vollständigen kausalen Geschichte des Ereignisses. Im folgenden Abschnitt komme ich nun zu den Einwänden gegen Lewis' Erklärungsmodell und zu der Frage, ob sich sein Modell, wie es hier beschrieben wurde, als Basis für den Schluß auf die beste Erklärung eignet.

160

3

Das kausale Modell der Erklärung

3.2.5 Einwände gegen Lewis' Erklärungsmodell und dessen Eignung als Basis für den Schluß auf die beste Erklärung Eingeschränkter

Anwendungsbereich

Ein erster Einwand gegen das Erklärungsmodell von David Lewis betrifft dessen eingeschränkten Anwendungsbereich. Wie im vorigen Abschnitt beschrieben, ist Lewis' Erklärungsmodell zum einen auf die Erklärung von einzelnen Ereignissen beschränkt, und zum anderen werden einzelne Ereignisse in diesem Modell erklärt, indem in der einen oder anderen Form Information über ihre kausale Geschichte angeführt wird. Aufgrund dieser Tatsache ist Lewis' Modell bestenfalls für eine Teilmenge aller Erklärungen angemessen. Denn es gibt viele Erklärungen, bei denen weder ein einzelnes Ereignis erklärt werden soll, noch zu diesem Zweck kausale Information angeführt wird. Dies gilt insbesondere für nicht naturwissenschaftliche Bereiche. Beispielsweise sind Erklärungen in der Mathematik offensichtlich keine kausalen Erklärungen von Ereignissen.19 Weiterhin sind die Phänomene, die in der Philosophie zu erklären versucht werden, nur sehr selten (wenn überhaupt) einzelne Ereignisse, und philosophische Erklärungen dieser Phänomene führen auch keine Information über deren ,kausale Geschichte' an. Wenn David Armstrong (1983) die Regularitäten, die wir in der empirischen Forschung beobachten, durch den Hinweis auf notwendige Verbindungen zwischen Universalien zu erklären versucht, so führt er keine kausale Erklärung im Lewisschen Sinn an. Weder bei Regularitäten noch bei Universalien handelt es sich um einzelne Ereignisse. Da Universalien weiterhin abstrakte Gegenstände sind, die als solche im allgemeinen als kausal isoliert betrachtet werden, dürften sie kaum als Ursachen für Regularitäten in Frage kommen und auch in keiner anderen Weise zur .kausalen Geschichte' von Regularitäten gehören. Auch bei der Erklärung, die wissenschaftliche Realisten für den Erfolg wissenschaftlicher Theorien geben, handelt es sich nicht um eine kausale Erklärung im Sinne von Lewis' Modell. Der Erfolg der betreffenden Theorien ist kein einzelnes Ereignis; und zudem kommen die (annähernde) Wahrheit der Theorien und die Existenz der von diesen Theorien postulierten Enti19

Für eine Diskussion von Erklärungen in der Mathematik vgl. etwa Steiner (1978).

3.2

Das Erklärungsmodell

von David Lewis

161

täten - auf die wissenschaftliche Realisten bei ihrer Erklärung Bezug nehmen - nicht als kausal wirksame Faktoren in Frage, die es etwa verursachten, daß die betreffenden Theorien erfolgreich sind. Lewis' kausales Erklärungsmodell ist allerdings nicht nur in Bereichen außerhalb der Naturwissenschaften nicht anwendbar. Auch viele Erklärungen in den Naturwissenschaften selbst können in Lewis' Modell nicht erfaßt werden. Der möglicherweise eindeutigste Fall von nicht-kausaler Erklärung innerhalb der Naturwissenschaften ist dabei die Erklärung von Gesetzen durch allgemeinere Gesetze. Beispielsweise sind die Keplerschen Gesetze keine einzelnen Ereignisse, und bei ihrer Erklärung innerhalb der Newtonschen Physik wird nicht auf ihre kausale Geschichte rekurriert. Ein weiteres Beispiel betrifft die Erklärung der Periodendauer eines Pendels unter Rekurs auf dessen Länge: Die Periodendauer des Pendels ist kein Ereignis, und die Länge des Pendels gehört nicht zur .kausalen Geschichte' der Periodendauer.20 Diese Einschränkung des Anwendungsbereichs von Lewis' Erklärungsmodell hat natürlich unmittelbare Auswirkungen auf die Eignung seines Modells als Basis für den Schluß auf die beste Erklärung. Bei Zugrundelegung von Lewis* Modell reduziert sich der Schluß auf die beste Erklärung auf einen Schluß auf die beste kausale Erklärung von einzelnen Ereignissen. In allen Bereichen, in denen keine Erklärungen im Lewisschen Sinne vorgebracht werden können, kann der Schluß auf die beste Erklärung folglich nicht angewendet werden. Dies bedeutet insbesondere, daß viele (wenn nicht alle) Verwendungen des Schlusses auf die beste Erklärung innerhalb der Philosophie von denen einige in der Einleitung beschrieben wurden - auf der Grundlage von Lewis' kausalem Modell der Erklärung nicht möglich sind. Der Hinweis auf den eingeschränkten Anwendungsbereich von Lewis' Modell stellt selbstverständlich zunächst keinen Einwand gegen die Angemessenheit seines Modells in denjenigen Bereichen dar, für die es konzipiert wurde. Er zeigt nicht, daß Lewis' Modell hier fehlerhaft ist. Dementsprechend könnte man entgegnen, daß es bereits ein Erfolg wäre, wenn Lewis für die intendierten Bereiche ein akzep20

Für eine Vielzahl von weiteren Beispielen vgl. etwa Bartelborth (1996a: 330 ff.).

162

3 Das kausale Modell der Erklärung

tables Erklärungsmodell spezifizieren würde. Insbesondere könnten Befürworter des Schlusses auf die beste Erklärung einwenden, daß Lewis' Modell zumindest in diesen Bereichen als Basis für den Schluß auf die beste Erklärung genutzt werden könnte. Diese Entgegnung ist zwar berechtigt. Allerdings werden die im folgenden zu diskutierenden Einwände gegen Lewis' Modell zeigen, daß sein Modell selbst in denjenigen Bereichen, in denen es anwendbar ist und in denen einzelne Ereignisse erklärt werden, indem Information über ihre kausale Geschichte angeführt wird, mit erheblichen Schwierigkeiten zu kämpfen hat, die insbesondere die Verwendung des Modells als Basis für den Schluß auf die beste Erklärung unmöglich machen. Konsequenzen aus den erkenntnistheoretischen Problemen des Lewisschen Kausalitätsmodells In Abschnitt 3.2.3 hatte ich darauf hingewiesen, daß Lewis' Analyse des Kausalitätsbegriffes auf unsicheren Fundamenten ruht. Zur Beantwortung der Frage, ob ein Ereignis U eine Ursache von Ereignis W ist, muß letztlich entschieden werden können, ob das Kontrafakt [-iO(U) C H -iO(W)] wahr ist („Wenn sich U nicht ereignet hätte, dann hätte sich auch W nicht ereignet."). Und hierfür ist wesentlich, daß man die relative Ähnlichkeit möglicher Welten zueinander beurteilen kann. Wie ich in Abschnitt 3.2.3 argumentiert habe, ist eine solche Beurteilung im allgemeinen nicht möglich, da wir im Hinblick auf mögliche Welten und ihre Ähnlichkeit untereinander nicht über hinreichend klare Intuitionen verfügen. Somit kann auf der Basis von Lewis' Modell nicht entschieden werden, welche Ereignisse Ursachen von anderen Ereignissen sind und welche nicht. Dies hat zur Folge, daß man in Lewis' Modell nicht entscheiden kann, welche Ereignisse für Erklärungen anderer Ereignisse in Frage kommen und welche nicht. Nun kann man natürlich einwenden, daß es sich bei diesem Problem zunächst nur um ein erkenntnistheoretisches Problem handelt, und nicht um ein Problem der angemessenen Analyse der Begriffe der kontrafaktischen und kausalen Abhängigkeit (bzw. Beeinflussung) sowie des Ursachenbegriffs. Begriffsanalysen können erkenntnistheoretisch fragwürdig sein, ohne daß sie deswegen als Analysen der jeweiligen Begriffe problematisch wären. Beispielsweise können wir den Begriff eines Kustplazer folgendermaßen bestimmen: Ein Kustplazer ist ein kugelförmiger Siein, der auf einem der P/aneten des Universums

3.2

Das Erklärungsmodell

von David Lewis

163

existierte, die in den ersten 2 Milliarden Jahren nach dem Urknall zerstört wurden. Wir werden nie gerechtfertigte Meinungen darüber haben können, ob es jemals Kustplazer gab, welche Steine auf welchen Planeten Kustplazer waren, ob manche Kustplazer rot waren usw.; die betreffenden Planeten sind seit langem zerstört und mit ihnen alle Kustplazer. Erkenntnistheoretisch ist dieser Begriff also von wenig Nutzen - seine Charakterisierung ist allerdings ohne Fehl und Tadel. In diesem Sinne könnte man einwenden, daß Lewis' Kausalitätsmodell als Analyse der Begriffe der kontrafaktischen und kausalen Abhängigkeit sowie des Ursachenbegriffs unproblematisch ist. Dieser Einwand mag berechtigt sein. Möglicherweise gibt es tatsächlich für je zwei Welten immer eine objektiv richtige Antwort auf die Frage, welche von ihnen der unsrigen ähnlicher ist (oder ob sie der unsrigen gleich ähnlich sind) - eine Antwort, die nicht von einzelnen Personen, Zeitpunkten, Kontexten usw. abhängig ist und die sozusagen von Gott in seinem Archiv der wahren Antworten seit dem sechsten Tag aufbewahrt wird. In diesem Fall gäbe es unter Zugrundelegung von Lewis' Kausalitätsmodell auch eine objektiv richtige Antwort auf die Frage, zwischen welchen Ereignissen kontrafaktische und kausale Abhängigkeit sowie die Relation der Verursachung besteht - so daß insbesondere auch feststünde, welche Ereignisse für die Erklärung anderer Ereignisse in Frage kommen. Allerdings ist dieser Punkt im Hinblick auf den Schluß auf die beste Erklärung unerheblich. Denn für die Frage, ob sich das Erklärungsmodell von David Lewis als Basis für den Schluß auf die beste Erklärung eignet, ist bereits die erkenntnistheoretische Fragwürdigkeit des Begriffs der Ähnlichkeit zwischen möglichen Welten entscheidend. Damit wir einen Schluß auf die beste Erklärung überhaupt ziehen können, müssen wir zumindest wissen, bei welchen Entitäten es sich um Erklärungen handelt und bei welchen nicht. Dazu müssen wir wissen, bei welchen Entitäten es sich um Ursachen handelt und bei welchen nicht. Dies können wir aber nur beurteilen, wenn wir entscheiden können, ob Ereignis W von Ereignis U kausal abhängig ist, ob W von U kontrafaktisch abhängig ist und ob das Kontrafakt [->0(U) • - » -iO(W)] wahr ist. Und diese Fragen können wir gerade nicht beantworten, wenn wir nicht wissen, welche von zwei verschiedenen möglichen Welten der unsrigen ähnlicher ist. Bereits die erkenntnistheoretischen Probleme im Hinblick auf den Begriff der Ahn-

164

3 Das kausale Modell der Erklärung

lichkeit zwischen möglichen Welten machen daher Lewis' Erklärungsmodell als Basis für den Schluß auf die beste Erklärung ungeeignet. Hierbei handelt es sich allerdings nicht um die einzige Schwierigkeit. Keine hinreichende Bedingung für den Erklärungsbegriff Ein weiterer Einwand gegen Lewis' Erklärungsmodell besteht darin, daß es keine hinreichende Bedingung für den Begriff der Erklärung spezifiziert. Dieser Einwand hat zwei Aspekte. Der erste dieser Aspekte resultiert wiederum aus Lewis' KaMsa/i/ä/smodell und betrifft die in Abschnitt 3.2.3 beschriebenen Schwierigkeiten bei der Bestimmung der Begriffe der kausalen Abhängigkeit und der Verursachung über den Begriff der kontrafaktischen Abhängigkeit. Wie wir in Abschnitt 3.2.3 gesehen haben, gibt es Fälle, bei denen zwischen zwei Ereignissen Ei und E2 zwar kontrafaktische Abhängigkeit, nicht aber kausale Abhängigkeit oder die Relation der Verursachung besteht. In solchen Fällen kann Ei nicht für die Erklärung von E2 herangezogen werden, weil Ei nach intuitiver Einschätzung für E 2 keine explanatorische Relevanz hat: Das Zerbrechen des Glases erklärt nicht, warum ich mit dem Hammer auf das Glas geschlagen habe, das Fallen des Barometers nicht die veränderten atmosphärischen Bedingungen, und der Hinweis darauf, daß ich um 19.48 Uhr nach Hause gekommen bin, ist als Erklärung dafür, daß ich um 20.34 Uhr den Telefonhörer abgenommen habe, völlig ungeeignet. Da in Lewis' Kausalitätsmodell kontrafaktische Abhängigkeit zwischen zwei tatsächlichen Ereignissen aber hinreichend für kausale Abhängigkeit und Verursachung ist, kommen die betreffenden Beispiele in seinem Modell als Erklärungen in Frage. Dies bedeutet, daß die Menge der Erklärungen in Lewis' Erklärungsmodell zu umfassend ist - sie enthält Elemente, die tatsächlich keine Erklärungen darstellen.21 Dieses Problem hat einen zweiten Aspekt, der direkt Lewis' ErklärMMgimodell betrifft. In seinem Modell kann wie beschrieben prinzipiell jede Information über die kausale Geschichte eines Ereignisses zur Erklärung dieses Ereignisses herangezogen werden. Wie im vori21 Die in Abschnitt 3.2.3 dargestellten Probleme des Lewisschen Kausalitätsmodells im Hinblick auf redundante Verursachung, ,spurious causation' und die Transitivität der Verursachungsrelation resultieren in analogen Einwänden gegen Lewis' Erklärungsmodell.

3.2

Das Erklärungsmodell von David Lewis

165

gen Abschnitt erwähnt, ist etwa der Hinweis auf die schläfrigmachende Kraft von Opium in Lewis' Modell explanatorisch relevant für das Einschlafen von Personen, die Opium genommen haben. Nach intuitiver Einschätzung ist es allerdings absurd, die Tatsache, daß eine Person nach Opiumgenuß eingeschlafen ist, damit erklären zu wollen, daß Opium schläfrig macht. Beispiele dieser Art lassen sich in großer Zahl finden. Um ein besonders sprechendes zu wählen: Der Urknall gehört zur kausalen Geschichte jedes Ereignisses, kann aber wahrscheinlich nur zur Erklärung von relativ wenigen Ereignissen herangezogen werden - beispielsweise nicht zur Erklärung dafür, warum Peter Caroline geküßt hat oder ich um 20.34 Uhr den Telefonhörer abgehoben habe. Die Tatsache, daß Lewis der Information über die kausale Geschichte eines Ereignisses, die zu Erklärungszwecken herangezogen werden kann, keine einschränkenden Bedingungen auferlegt, stellt einen zweiten Grund dar, warum bei seiner Konzeption des Erklärungsbegriffs die Menge der Erklärungen zu umfangreich ist. Dieses Problem hat natürlich direkte Konsequenzen für die Eignung von Lewis' Erklärungsmodell als Basis für den Schluß auf die beste Erklärung. Da die Menge der Erklärungen in Lewis' Modell zu umfangreich ist, enthält sie Elemente, bei denen es sich tatsächlich nicht um Erklärungen handelt. Deshalb erlaubt Lewis' Modell Schlüsse auf die beste Erklärung, bei denen dasjenige, worauf geschlossen wird, überhaupt keine Erklärung darstellt (geschweige denn die beste). Es spricht aber nichts dafür, daß solche Schlüsse wahrscheinlich zu einer wahren Konklusion führen. Denn nach Ansicht der Befürworter dieses Schlußmusters führen Schlüsse auf die beste Erklärung ja deswegen wahrscheinlich zu einer wahren Konklusion, weil es sich bei dieser Konklusion tatsächlich um die beste Erklärung des jeweiligen Phänomens handelt - und diese Voraussetzung ist in Lewis' Modell gerade nicht erfüllt, da es sich bei der betreffenden Konklusion nicht einmal um eine Erklärung handeln muß. Aus diesem Grund können Befürworter des Schlusses auf die beste Erklärung, wenn sie Lewis' kausales Erklärungsmodell verwenden, nicht behaupten, ihre Schlüsse führten wahrscheinlich zu einer wahren Konklusion. Dies stellt einen weiteren Grund dar, weshalb Lewis' Modell nicht für die Zwecke des Schlusses auf die beste Erklärung geeignet ist.

166

3 Das kausale Modell der Erklärung

Gütekriterien einer Erklärung Ein letzter Einwand gegen Lewis* Erklärungsmodell betrifft die in diesem Modell spezifizierten Kriterien zur Beurteilung der Güte einer Erklärung. Diese Kriterien zerfallen wie in Abschnitt 3.2.4 beschrieben in zwei Klassen: in pragmatische Kriterien, die die Erklärenshandlung, den Erklärenden und den Rezipienten der Erklärung betreffen, und nicht-pragmatische Kriterien, bei denen dies nicht der Fall ist. Wie ich in der Einleitung zu dieser Arbeit ausgeführt habe, müssen für die Zwecke des Schlusses auf die beste Erklärung die Kriterien zur Beurteilung der Güte einer Erklärung so gewählt werden, daß mit aufsteigender Güte einer Erklärung deren Wahrheit immer wahrscheinlicher wird. Diejenige Erklärung, deren Güte maximal ist, die also die beste Erklärung der betreffenden Phänomene darstellt, ist die wahrscheinlichste Erklärung der Phänomene, und aus diesem Grund wird auf sie geschlossen. Mit anderen Worten: Die Auswahl von Gütekriterien für eine Erklärung muß transparent machen, warum eine Erklärung, die besser ist als eine andere, größere Chancen hat wahr zu sein als diese, und warum insbesondere die beste Erklärung eines Phänomens am wahrscheinlichsten sein soll. Es ist nach meiner Auffassung offensichtlich, daß die pragmatischen Kriterien, die Lewis zur Einschätzung der Güte einer Erklärung nennt, mit der Frage der Wahrscheinlichkeit einer Erklärung Uberhaupt nichts zu tun haben: Ob die Information, die in einer Erklärungshandlung angeführt wird, für den Rezipienten neu ist oder nicht, ob sie ihn besonders interessiert, ob sie in für ihn verstehbaren Portionen kommt, ob sie eine bestimmte irrige Annahme des Rezipienten korrigiert - all dies hat nichts mit der Frage zu tun, ob die betreffende Erklärung wahrscheinlich wahr ist oder nicht. Eine Erklärung, die Bestnoten in allen diesen von Lewis angeführten pragmatischen Aspekten erhält, ist deswegen nicht einen Deut wahrscheinlicher als eine andere Erklärung, die hinsichtlich dieser Aspekte eine schlechte Beurteilung erhält. Die pragmatischen Kriterien in Lewis' Modell helfen uns daher für die Zwecke des Schlusses auf die beste Erklärung nicht weiter. Betrachten wir also die nicht-pragmatischen Kriterien, die Lewis zur Beurteilung der Güte einer Erklärung anführt. Eines dieser Kriterien betrifft wie erwähnt die Frage, wieviel Information über die kausale Geschichte eines Explanandum-Ereignisses durch eine Erklärung zur

3.2

Das Erklärungsmodell

von David Lewis

167

Verfügung gestellt wird. Nach diesem Kriterium ist eine Erklärung um so besser, je mehr Information sie über die betreffende kausale Geschichte anführt. Auch dieses Kriterium ist nach meiner Auffassung nicht für die Zwecke des Schlusses auf die beste Erklärung geeignet. Bei einem solchen Schluß wird diejenige Hypothese, die als die beste Erklärung der jeweiligen Phänomene angesehen wird, aufgrund genau dieses Umstandes für am wahrscheinlichsten gehalten. Das hier beschriebene Kriterium liefert aber überhaupt keinen Grund für eine solche Annahme. Eine Erklärung E + , die sehr viel Information über die kausale Geschichte des Explanandum-Ereignisses anführt, ist nicht aufgrund dieser Tatsache wahrscheinlich wahr; ebensowenig ist eine Erklärung E", die weniger Information vorlegt, aufgrund dieser Tatsache weniger wahrscheinlich wahr. Warum sollte eine Erklärung insbesondere deswegen am wahrscheinlichsten sein, weil sie am detailliertesten und auf ausführlichste Art und Weise eine gewisse kausale Geschichte über das Explanandum-Ereignis erzählt? Eine kausale Geschichte Uber das Explanandum-Ereignis kann noch so genau erzählt werden - wenn die in dieser Geschichte enthaltene Information nicht die wirklichen Ursachen des Explanandum-Ereignisses betrifft und die tatsächlichen kausalen Ketten beschreibt, die zum Explanandum-Ereignis geführt haben, dann handelt es sich bei ihr überhaupt nicht um eine Erklärung des fraglichen Ereignisses, und folglich besteht kein Grund, sie für sehr wahrscheinlich wahr zu halten. Dieses Kriterium zur Beurteilung der Güte einer Erklärung ist daher für die Zwecke des Schlusses auf die beste Erklärung ebenfalls nicht geeignet.22 Es gibt allerdings in Lewis' Modell wie erwähnt noch ein zweites nicht-pragmatisches Kriterium zur Beurteilung der Güte einer Erklärung. Nach diesem Kriterium ist eine Erklärung um so besser,^ näher die zur Verfügung gestellte Information der Wahrheit Uber die kausale Geschichte des Explanandum-Ereignisses kommt. Dieses Kriterium hat ganz offensichtlich etwas mit der Wahrheit einer Erklärung zu tun. 22

Darüber hinaus wäre es nach diesem Kriterium nicht einmal möglich, überhaupt Schlüsse auf die beste Erklärung zu ziehen. Denn die beste Erklärung eines Ereignisses besteht nach diesem Kriterium ja in der vollständigen Angabe der gesamten Information über die kausale Geschichte des zu erklärenden Ereignisses, und dies stellt für Lewis wie beschrieben ein „unattainable limit" (Lewis 1986a: 227; m. H.) dar - wir sind also nie im Besitz der nach diesem Kriterium besten Erklärung.

168

3

Das kausale Modell der Erklärung

Wenn eine Erklärung E + nach diesem Kriterium besser als eine Erklärung E~ ist, dann kommt sie der Wahrheit näher als E"; und die nach diesem Kriterium beste Erklärung ist offensichtlich diejenige, die der Wahrheit am nächsten kommt. Insofern könnte man versucht sein zu sagen, daß dieses Kriterium hervorragend für die Zwecke des Schlusses auf die beste Erklärung geeignet ist: Ein Schluß auf die nach diesem Kriterium beste Erklärung führt wahrscheinlich zu einer wahren Konklusion. Es scheint, als könnten Befürworter des Schlusses auf die beste Erklärung endlich aufatmen und verkünden, sie hätten das passende Erklärungsmodell für ihr favorisiertes Schlußmuster gefunden. Allerdings scheint es in der Tat nur so. Denn wie ich in den vorigen beiden Kapiteln bereits erläutert habe, benötigen wir den Schluß auf die beste Erklärung gerade deshalb, weil wir einer Hypothese nicht direkt ansehen können, ob sie wahrscheinlich wahr ist bzw. ob sie der Wahrheit sehr nahe kommt. Der Schluß auf die beste Erklärung soll es uns ermöglichen, auf indirektem Wege - nämlich auf dem Umweg über den Erklärungsbegriff - zu Hypothesen mit dieser Eigenschaft zu gelangen. Nach Ansicht der Befürworter des Schlusses auf die beste Erklärung sind gerade diejenigen Hypothesen wahrscheinlich wahr bzw. kommen gerade solche Hypothesen der Wahrheit sehr nahe, die die beste Erklärung der jeweils zu erklärenden Phänomene darstellen. Wenn wir also eine Hypothese H* ermittelt haben, die die beste Erklärung der Phänomene darstellt, dann können wir darauf schließen, daß H* sehr wahrscheinlich ist bzw. der Wahrheit sehr nahe kommt. Die Frage, die sich dann stellt, ist, nach welchem Kriterium wir H* - die beste Erklärung der betreffenden Phänomene - ermitteln sollen. Nach dem hier diskutierten Kritèrium handelt es sich bei der besten Erklärung eines Phänomens um diejenige Hypothese, die der Wahrheit am nächsten kommt. Man schlägt uns also vor, H* dadurch zu ermitteln, daß wir nach derjenigen Hypothese Ausschau halten, die der Wahrheit am nächsten kommt. Wir wissen ja aber gerade nicht, welche Hypothese dies ist. Aus diesem Grund haben wir ja Uberhaupt erst auf den Schluß auf die beste Erklärung zurückgreifen müssen. Wenn wir wußten, welche Hypothese der Wahrheit am nächsten kommt, dann müßten wir dieses Schlußmuster gar nicht bemühen. Aus diesem Grund ist auch dieses Kriterium für die Zwecke des Schlusses auf die beste Erklärung völlig ungeeignet - mit ihm drehen wir uns im Kreis.

3.3

Das Erklärungsmodell von Wesley Salmon

169

Es hilft uns somit auch dieses letzte Kriterium nicht weiter. Lewis' Modell bietet uns daher keine tragfähige Möglichkeit, verschiedene, miteinander konkurrierende Erklärungen im Hinblick auf die Frage zu untersuchen, wie gut sie die betreffenden Phänomene erklären. Mithin können wir unter Zugrundelegung von Lewis' Modell keine Erklärung als die beste Erklärung der Phänomene auszeichnen. Dies hat zur Folge, daß wir keinen Schluß auf die beste Erklärung - im Sinne von Lewis' Erklärungsmodell - ziehen können. Dieser Umstand - in Verbindung mit den zuvor genannten Einwänden - diskreditiert meiner Auffassung nach das kausale Erklärungsmodell von David Lewis als Basis für den Schluß auf die beste Erklärung.

3.3

Das Erklärungsmodell von Wesley Salmon 3.3.1

Einleitung

Das zweite kausale Erklärungsmodell, das ich in diesem Kapitel diskutieren möchte, ist dasjenige von Wesley Salmon. Salmon begann die Entwicklung seines Modells in Auseinandersetzung mit dem im ersten Kapitel dieser Arbeit diskutierten covering /aw-Modell der Erklärung. In diesem Modell werden Erklärungen wie beschrieben als Argumente konzipiert, bei denen das Explanandum aus dem Explanans entweder mit Notwendigkeit folgt (wie bei deduktiv-nomologischen und deduktiv-statistischen Erklärungen) oder mit einer hohen induktiven Wahrscheinlichkeit (wie bei induktiv-statistischen Erklärungen), wobei das Explanans wenigstens ein Gesetz wesentlich enthält. Wie bereits in Kapitel 1 erwähnt, hat das covering /aw-Modell insbesondere mit zwei Problemen zu kämpfen: dem Problem der Irrelevanz und dem Problem der Erklärung von Ereignissen, die vor dem Hintergrund der bekannten Randbedingungen und Gesetze eine geringe Wahrscheinlichkeit haben. Was das erste dieser Probleme betrifft, so kann man beispielsweise Peters ausbleibende Schwangerschaft nicht dadurch erklären, daß man darauf hinweist, daß (i) alle Männer, die die Anti-Baby-Pille nehmen, nicht schwanger werden und (ii) Peter die Anti-Baby-Pille nimmt. Dieses Argument erfüllt aber die Bedingungen des covering Íaw-Modells. Was das zweite Problem be-

170

3

Das kausale Modell der

Erklärung

trifft, so kann man im covering /aw-Modell beispielsweise das Auftreten von Parese bei Peter nicht dadurch erklären, daß man auf Peters unbehandelte Syphilis hinweist. Denn Parese folgt nur mit einer geringen Wahrscheinlichkeit auf unbehandelte Syphilis, und somit läßt sich kein adäquates deduktiv-nomologisches bzw. induktiv-statistisches Argument konstruieren. Der Hinweis auf Peters unbehandelte Syphilis scheint aber sehr wohl explanatorisch relevant für Peters Erkrankung an Parese zu sein, da sich Parese nur bei Vorliegen von unbehandelter Syphilis entwickelt. Diese Schwierigkeiten des covering faw-Modells, die Salmon zum Teil in eigenen Veröffentlichungen aufgezeigt hatte, bewogen ihn, sein sog. Statistisches Relevanzmodell (SR-Modell) der Erklärung zu entwickeln. Nach diesem Modell handelt es sich bei einer Erklärung nicht um ein Argument, sondern um die Angabe einer Menge von Faktoren, die im Hinblick auf das zu erklärende Ereignis statistisch relevant sind - „an assemblage of factors that are statistically relevant to the occurrence of the event-to-be-explained" (Salmon 1984: 96). Hierbei ist ein Ereignis Ei genau dann statistisch relevant für ein Ereignis Ei, wenn sich die bedingte Wahrscheinlichkeit von E2 unter der Voraussetzung von Ei, d. h. P ^ I E I ) , von der absoluten Wahrscheinlichkeit von E2, d. h. von P(E2), unterscheidet - wenn also das Eintreten von Ei die Wahrscheinlichkeit von E2 beeinflußt.23 Da die Einnahme der Anti-Baby-Pille für das Auftreten einer Schwangerschaft bei Männem nicht statistisch relevant ist, kann das Ausbleiben einer Schwangerschaft bei Peter nach dem SR-Modell auch nicht durch seine Einnahme der Anti-Baby-Pille erklärt werden. Da aber andererseits unbehandelte Syphilis sehr wohl statistisch relevant ist für das Auftreten von Parese, kann dieser Umstand im SR-Modell zur Erklärung von Peters Erkrankung an Parese herangezogen werden, obwohl die Wahrscheinlichkeit des Auftretens von Parese bei unbehandelter Syphilis gering ist. Im SR-Modell erfolgt eine Erklärung eines Ereignisses E vereinfacht gesagt in vier Schritten: Zuerst wird die Wahrscheinlichkeit von E im Hinblick auf eine gegebene Referenzklasse R, d. h. P(EIR) bestimmt. Darauf werden relevante Zerlegungen dieser Referenzklasse 23

Wird die Wahrscheinlichkeit von E2 erhöht, spricht man von positiver statistischer Relevanz; wird sie vermindert, von negativer statistischer Relevanz.

3.3 Das Erklärungsmodell von Wesley Salmon

171

in Teilklassen R1( R 2 ,..., R„ vorgenommen, wobei diese Zerlegungen insofern relevant sein müssen, als die Wahrscheinlichkeit von E bezüglich dieser Teilklassen sich von PÍE! R) unterscheiden muß - d. h., P(E| Ri) * P(E|R), für alle i G {1,2,..., η). Im nächsten Schritt werden dann die Werte dieser bedingten Wahrscheinlichkeiten PÍE! R¡) bzw. P(E| —iR¡) bestimmt. Und schließlich wird das zu erklärende Ereignis einer bestimmten Teilklasse zugeordnet. Betrachten wir zur Erläuterung eines von Salmons eigenen Beispielen. Das zu erklärende Ereignis E besteht darin, daß Tom, ein amerikanischer Teenager, ein Auto gestohlen hat. Wir beginnen damit, daß wir die Wahrscheinlichkeit dieses Ereignisses im Hinblick auf die Referenzklasse R aller amerikanischen Teenager bestimmen. Dann suchen wir nach relevanten Zerlegungen dieser Klasse. Eine relevante Zerlegung ist beispielsweise diejenige in männliche und weibliche Teenager, da die Wahrscheinlichkeit, daß ein weiblicher Teenager ein Auto stiehlt, verschieden ist von der betreffenden Wahrscheinlichkeit für einen männlichen Teenager. Eine weitere relevante Zerlegung teilt die Referenzklasse in solche Teenager auf, die auf dem Land, und solche, die in der Stadt aufwachsen. Nehmen wir kontrafaktisch an, dies seien die einzigen relevanten Zerlegungen der Referenzklasse. Wir erhalten dann vier veschiedene Teilklassen R¡ der Referenzklasse R (weiblich-Stadt, männlich-Stadt, weiblich-Land, männlich-Land) und bestimmen für jede dieser Teilklassen die bedingte Wahrscheinlichkeit P(E|R¡). Schließlich ordnen wir Tom in diejenige Teilklasse ein, zu der er gehört. Damit haben wir nach dem SR-Modell eine Erklärung dafür, daß Tom ein Auto gestohlen hat.24 Salmons SR-Modell kann also das Problem der Irrelevanz und das Problem der Erklärung von Ereignissen, die bezüglich des Hintergrundwissens Uber Randbedingungen und Gesetze unwahrscheinlich sind, vermeiden. Trotz dieser Erfolge liefert sein Modell allerdings dennoch keine Analyse des Erklärungsbegriffs, denn statistische Rele24

Bei einer solchen Erklärung nach dem SR-Modell spielt es keine Rolle, ob die Wahrscheinlichkeit des zu erklärenden Ereignisses bezüglich derjenigen Klasse, in die das Ereignis eingeordnet wird, höher ist als bezüglich der Referenzklasse. Auch wenn Tom zu einer Teilklasse gehört, bezüglich der die Wahrscheinlichkeit eines Diebstahls geringer ist als bezüglich der Referenzklasse, erhalten wir durch die vollständige Angabe der statistisch relevanten Faktoren eine Erklärung seines Diebstahls.

172

3

Das ¡causale Modell der Erklärung

vanz ist keine hinreichende Bedingung für explanatorische Relevanz. Dies kann man sich wiederum am Parese-Beispiel verdeutlichen. Da man nur dann an Parese erkranken kann, wenn man an unbehandelter Syphilis leidet, ist die Wahrscheinlichkeit von unbehandelter Syphilis unter der Voraussetzung des Auftretens von Parese gleich 1. Diese Wahrscheinlichkeit ist damit sehr viel höher als die Wahrscheinlichkeit von Syphilis in der Gesamtbevölkerung - d. h., Parese ist positiv statistisch relevant für unbehandelte Syphilis. Aber selbstverständlich kann man das Auftreten von Parese nicht zur Erklärung von unbehandelter Syphilis heranziehen. Um solche Gegenbeispiele vermeiden zu können, mußte Salmon auf andere Mittel zurückgreifen. Intuitiv gesprochen kann man unbehandelte Syphilis deshalb nicht durch das Auftreten von Parese erklären, weil Syphilis nicht durch Parese verursacht wird, sondern umgekehrt Parese durch Syphilis. Diese Intuition griff Salmon auf, indem er sein SR-Modell um einen kausalen Teil erweiterte. Im neuen Modell handelt es sich bei einer Erklärung nun um einen zweistufigen Prozess. Die Angabe der für das Explanandum statistisch relevanten Fakten - die Bereitstellung der sog. SR-Basis - ist dabei der erste Schritt. Im zweiten Schritt müssen dann zusätzlich die kausalen Zusammenhänge zwischen den statistisch relevanten Fakten und dem Explanandum aufzeigt werden: It now seems to me that explanation is a two-tiered affair. At the most basic level, it is necessary, for purposes of explanation, to subsume the eventto-be-explained under an appropriate set of statistical relevance relations [...]. At the second level, it seems to me, the statistical relevance relations that are invoked at the first level must be explained in terms of causal relations. (Salmon 1984: 22; H. d. A.)25

Es ist allerdings nicht völlig klar, ob es sich bei dieser Modifikation des SR-Modells um eine Erweiterung oder um die Aufgabe des Modells handelt. Denn Salmon ist sich nicht sicher, ob die SR-Basis tatsächlich ein Bestandteil der Erklärung ist oder nur eine Vorstufe zur eigentlichen Erklärung darstellt. So schreibt er beispielsweise bei der Diskussion eines Artikels von Ben Rogers (1981):

25

Vgl. hierzu auch Salmon (1984: 260 ff.).

3.3

Das Erklärungsmodell von Wesley Salmon

173

Rogers' basic point can be summarized by saying that while precise values of probabilities are indispensable aids in the discovery and testing of causal

hypotheses, only the causal relations have genuine explanatory import. I suspect that Rogers is entirely correct. Applied to the theory of scientific explanation I have been trying to elaborate, this thesis would imply that the S-R basis provides fundamental evidence regarding causal explanations,

but the S-R basis itself does not constitute an ingredient in scientific explanations. (Salmon 1984: 265; m. H.) Und an anderer Stelle schreibt er: „It seemed obvious at the time [when the S-R model was first presented] that statistical relevance relations had some sort of explanatory power in and of themselves. As I have said repeatedly throughout this book, that view now apperars to be utterly mistaken." (Salmon 1984: 191 f.; m. H.). Da der Status der SR-Basis für die Zwecke kausaler Erklärung insofern zumindest unklar ist, werde ich hier nicht weiter auf sie eingehen, sondern mich vollständig auf den kausalen Teil von Salmons Erklärungsmodell konzentrieren. 26 Die Bezugnahme auf kausale Faktoren bei der Konzeption eines Erklärungsmodells erfordert natürlich die Bereitstellung eines Kausalitätsmodells. Salmon entwickelte in einer Reihe von Veröffentlichungen ein eigenes Kausalitätsmodell, dessen ausführlichste Formulierung sich in Salmon (1984) findet. Dieses Modell wurde insbesondere von Kitcher (1985a, 1989), Sober (1987) und Dowe (1992) kritisiert, was zu einer ersten Modifikation des Modells in Salmon (1994) führte. Aufgrund weiterer Kritik von Dowe (1995) und Hitchcock (1995) Schloß sich hieran eine zweite Modifikation an, die in Salmon (1997) vorgenommen wurde. Im folgenden Abschnitt 3.3.2 werde ich nun zunächst Salmons ursprüngliches Kausalitätsmodell darstellen. In Abschnitt 3.3.3 werde ich dann die gegen dieses Modell vorgebrachten Einwände, die beiden Modifikationen des Modells und verbleibende Kritikpunkte diskutieren. In Abschnitt 3.3.4 werde ich Salmons eigentliches ErklärungsmodeM behandeln. Und in Abschnitt 3.3.5 werde ich schließlich die Frage erörtern, ob dieses kausale Erklärungsmodell sich als Basis für den Schluß auf die beste Erklärung eignet.

26

Vgl. zu diesem Punkt auch Salmon (1984: 34, Fußnote 10; 264-267). Für Näheres zur SR-Basis und zu den Begriffen der Referenzklasse und der Zerlegung vgl. Salmon (1984: Kap. 2 und 3).

3 Das kausale Modell der Erklärung

174 3.3.2

Salmons ursprüngliches Kausalitätsmodell

Eine zentrale Eigenschaft von Salmons Kausalitätsmodell besteht darin, daß er nicht wie beispielsweise der im letzten Abschnitt diskutierte Lewis von Ereignissen ausgeht und versucht, eine kausale Relation zwischen diesen Ereignissen zu charakterisieren, sondern daß er Kausalität primär als eine Eigenschaft von raumzeitlich kontinuierlichen Prozessen betrachtet. Durch diese Strategie glaubt Salmon, insbesondere die virulenten Fragen beantworten zu können, die David Hume bei seiner Behandlung der Kausalität aufwarf und auf die er keine Antworten finden konnte: Worin besteht Kausalität über bloße ,constant conjunction' hinaus? Welche physikalische Verbindung gibt es zwischen Ursache und Wirkung? Wie bringt die Ursache die Wirkung hervor? Salmons Antworten auf diese Fragen lauten: Kausalität besteht darin, daß zwischen Ursache und Wirkung ein kausaler Prozeß verläuft, der den kausalen Einfluß von der Ursache an die Wirkung vermittelt; dieser Prozeß stellt die physikalische Verbindung zwischen Ursache und Wirkung dar, und durch ihn bringt die Ursache die Wirkung hervor: „[...] we have an answer to the question, raised by Hume, concerning the connection between cause and effect. [...] the connection between them is simply a spatiotemporally continuous causal process" (Salmon 1978: 131), „causal processes are precisely the connections Hume sought", „the relation between a cause and an effect is a physical connection" (Salmon 1998a: 16). Entsprechend dieser Grundausrichtung entwickelt Salmon eine Konzeption von kausalen Prozessen und insbesondere ein Kriterium, durch das kausale Prozesse von nicht-kausalen Prozessen oder sog. Pseudo-Prozessen unterschieden werden können. Unter einem Prozess versteht Salmon zunächst eine Entität, die sich von einem Ereignis dadurch unterscheidet, daß sie eine größere zeitliche und in vielen Fällen auch räumliche Ausdehnung hat. Während Ereignisse in Raum-ZeitDiagrammen als Punkte repräsentiert werden, entsprechen Prozessen dort Linien (vgl. hierzu Salmon 1981: 286). Prozesse weisen weiterhin innerhalb des Raum-Zeit-Intervalls, das sie einnehmen, einen gewissen Grad an Uniformität bzw. eine gewisse gleichbleibende Struktur auf: „A given process, whether it be causal or pseudo, has a certain degree of uniformity - we may say, somewhat loosely, that it exhibits a certain structure." (Salmon 1984: 144). Ein Prozess in diesem Sinn

3.3

Das Erklärungsmodell von Wesley Salmon

175

ist nach Salmons Ansicht vergleichbar mit einer .causal line', wie sie Bertrand Russell beschreibt: A causal line may always be regarded as the persistence of something - a person, a table, a photon, or what not. Throughout a given causal line, there may be constancy of quality, constancy of structure, or gradual change in either, but not sudden change of any considerable magnitude. (Russell 1948: 477)

Beispielsweise handelt es sich bei der Ausbreitung einer elektromagnetischen Welle, bei einer rollenden Billardkugel, bei einem sich bewegenden Schatten, und auch bei jedem ruhenden Objekt um einen Prozess in Salmons Sinne. Allerdings sind nicht alle Prozesse in diesem Sinne kausale Prozesse (insofern hält Salmon Russells Bezeichnung „causal line" nicht für adäquat). Einige Prozesse, sog. Pseudo-Prozesse, unterscheiden sich von kausalen Prozessen dadurch, daß sie nicht in der Lage sind, Markierungen zu übertragen - sie erfüllen nicht das sog. Kriterium der Markierungs-Übertragung

oder kurz

Markierungs-Kriterium:

The basic method for distinguishing causal processes from pseudo-processes is the criterion of mark transmission. A causal process is capable of transmitting a mark·, a pseudo-process is not. (Salmon 1981: 287 f.; m. H.)

Unter einer Markierung eines Prozesses ist dabei eine Modifikation eines Charakteristikums des Prozesses zu verstehen, die durch eine einmalige und lokale Wechselwirkung mit dem Prozess eingeführt wird. Weiterhin überträgt ein Prozeß eine Markierung genau dann, wenn er (i) das modifizierte Charakteristikum nach der Wechselwirkung beibehält, falls keine weiteren Wechselwirkungen stattfinden, und wenn er (ii) seine alten Charakteristika beibehalten hätte, wenn keine Wechselwirkung mit ihm stattgefunden hätte (vgl. Salmon 1984: 148).27 27

Seine Konzeption des Begriffs der Übertragung bezeichnet Salmon in Anlehnung an Russells ,at-at theory of motion' auch als ,at-at theory of transmission': „Transmission is a type of movement. When a mark is introduced into a process, the modification moves with the process [...]. According to the "at-at" theory of transmission, the mark is transmitted from point A to point Β by being present in the process at every point between A and Β without further interactions with other processes." (Salmon 1998a: 21; m. H. außer „transmission"). Vgl. hierzu auch Salmon (1977 und 1984: 147 ff.).

176

3 Das kausale Modell der Erklärung

Betrachten wir diese Bestimmungen an einem Beispiel. Wir denken uns einen rotierenden Scheinwerfer, der in der Mitte eines kreisförmigen Raumes positioniert ist und einen umlaufenden weißen Lichtpunkt an die Wand des Raumes wirft. Bei dem Lichtstrahl, der vom Scheinwerfer zur Wand läuft, handelt es sich um einen kausalen Prozess: Wenn wir an den Scheinwerfer eine rote Linse anbringen, so wird durch eine einmalige lokale Wechselwirkung mit dem Lichtstrahl dessen Farbe von weiß zu rot modifiziert. Der Lichtstrahl behält die neue Farbe bei, falls keine weiteren Wechselwirkungen stattfinden, und er hätte diese Farbe nicht angenommen, sondern seine alte beibehalten, wenn keine Wechselwirkung mit ihm stattgefunden hätte. Der Lichtstrahl überträgt also tatsächlich eine Markierung, ist daher in der Lage, eine Markierung zu Ubertragen, erfüllt dadurch das MarkierungsKriterium, und gilt somit als kausaler Prozeß. Bei dem umlaufenden Lichtpunkt allerdings handelt es sich nicht um einen kausalen, sondern um einen Pseudo-Prozess - denn er ist nicht in der Lage, eine Markierung zu Ubertragen: Wenn wir den Lichtpunkt an einer Stelle der Wand rot färben, indem wir dort ein rotes Stück Papier befestigen, so modifizieren wir zwar durch eine einmalige lokale Wechselwirkung mit dem Lichtpunkt dessen Farbe von rot zu weiß. Aber der Lichtpunkt behält die rote Farbe nicht bei, sondern nimmt, falls keine weiteren Wechselwirkungen mit ihm stattfinden, wieder seine ursprüngliche weiße Farbe an, sobald er das rote Stück Papier verläßt. Natürlich könnten wir versuchen, den rotierenden weißen Lichtpunkt auf andere Weise so zu markieren, daß er die rote Farbe beibehält. Zum einen könnten wir ihn entweder dadurch permanent rot färben, daß wir an jedem Punkt auf der Wand, an dem er vorbeikommt, ein rotes Papier befestigen, oder dadurch, daß wir eine rote Linse an der Wand anbringen, die gemeinsam mit dem Lichtpunkt rotiert. Allerdings würde es sich hierbei nicht um eine Modifikation der Farbe des Lichtpunktes handeln, die in einer einmaligen lokalen Wechselwirkung mit dem Lichtpunkt eingeführt und beibehalten wird, falls keine weiteren Wechselwirkungen stattfinden. Im Gegenteil behält der Lichtpunkt die rote Farbe nur deswegen bei, weil permanent weitere Wechselwirkungen mit ihm stattfinden (entweder in Form des roten Papiers oder in Form der rotierenden Linse). Zum anderen könnten wir den rotierenden weißen Lichtpunkt wie beschrieben auch dadurch

3.3 Das Erklärungsmodell von Wesley Salmon

177

permanent rot färben, daß wir am Scheinwerfer eine rote Linse anbringen. Aber dabei würde es sich nicht um eine einmalige lokale Wechselwirkung mit dem Lichtpunkt handeln (sondern um eine einmalige lokale Wechselwirkung mit dem Lichtstrahl). Es gibt noch eine weitere Möglichkeit, den Lichtpunkt permanent rot zu färben: Nehmen wir an, daß wir den rotierenden weißen Lichtpunkt, der auf die Wand geworfen wird, wie im letzten Absatz beschrieben durch das Anbringen eines roten Papiers an der Wand rot färben; daß wir aber zusätzlich, unmittelbar bevor wir dies tun, eine rote Linse am Scheinwerfer anbringen - so daß der Lichtpunkt durch das Anbringen des roten Papiers an der Wand rot wird und durch das Anbringen der Linse rot bleibt. In diesem Fall wird der Lichtpunkt durch eine einmalige lokale Wechselwirkung modifiziert, und er behält das modifizierte Charakteristikum nach der Wechselwirkung bei, falls keine weiteren Wechselwirkungen mit ihm stattfinden. Allerdings ist in diesem Fall die oben wiedergegebene kontrafaktische Bedingung (ii) nicht erfüllt: Der Lichtpunkt hätte seine ursprüngliche weiße Farbe nicht beibehalten, wenn keine Wechselwirkung mit dem roten Papier stattgefunden hätte - vielmehr hätte er sich durch das Anbringen der Linse am Scheinwerfer ohnehin rot gefärbt. Der rotierende Lichtpunkt ist also nicht in der Lage, eine Markierung zu übertragen, und gilt daher nach dem Markierungs-Kriterium nicht als kausaler, sondern als Pseudo-Prozeß. Die kontrafaktische Bedingung (ii) mußte Salmon aufgrund eines Hinweises von Nancy Cartwright mit „great philosophical regret" (Salmon 1998a: 18) in seine Explikation des Begriffs der Übertragung einer Markierung aufnehmen (vgl. hierzu Salmon 1984: 148 ff.). Seine Charakterisierung kausaler Prozesse enthält allerdings bereits unabhängig von dieser Bedingung ein kontrafaktisches Element: Ein kausaler Prozeß ist ein Prozeß, der eine Markierung übertragen kann, aber nicht faktisch übertragen muß. Damit es sich bei Ρ also um einen kausalen Prozeß handelt, muß das folgende kontrafaktische Konditional erfüllt sein: Wenn Ρ markiert würde, dann würde Ρ die Markierung übertragen. Dieser Rekurs auf kontrafaktische Bedingungen stellt, wie sich im nächsten Abschnitt zeigen wird, einen der Hauptkritikpunkte an Salmons ursprünglichem Kausalitätsmodell dar. Kausale Prozesse zeichnen sich also dadurch aus, daß sie - anders als Pseudo-Prozesse - in der Lage sind, im beschriebenen Sinne Mar-

178

3 Das kausale Modell der Erklärung

kierungen zu Ubertragen. Bei dieser Eigenschaft handelt es sich allerdings nicht um die konstitutive Eigenschaft von kausalen Prozessen, sondern vielmehr um ein Symptom, das auf eine grundlegendere Eigenschaft kausaler Prozesse verweist (vgl. Salmon 1994: 303). Aus diesem Grund bezeichnet Salmon das Markierungs-Kriterium in der oben wiedergegebenen Textstelle auch lediglich als eine „basic method for distinguishing causal processes from pseudo-processes" (Salmon 1981: 287; m. H.) und nicht als ein definierendes Kriterium. Die wesentliche Eigenschaft von kausalen Prozessen besteht darin, daß sie im Gegensatz zu Pseudo-Prozessen ihre eigene Struktur übertragen. Aufgrund dieser Eigenschaft sind sie in der Lage, auch Markierungen übertragen zu können: The difference between a causal process and a pseudo-process, I am suggesting, is that the causal process transmits its own structure, while the pseudo-process does not. The distinction between processes that do and those that do not transmit their own structures is revealed by the mark criterion. If a process - a causal process - is transmitting its own structure, then it will be capable of transmitting certain modifications in that structure. (Salmon 1984: 144; m. H.) Das Markierungs-Kriterium dient also lediglich zur Identifizierung von kausalen Prozessen, und Salmons These besteht darin, daß dieses Kriterium eine extensional adäquate Unterscheidung von kausalen und Pseudo-Prozessen erlaubt. Auch auf diesen Punkt werde ich im folgenden Abschnitt zurückkommen. Bei der Unterscheidung von kausalen und Pseudo-Prozessen über das Markierungs-Kriterium spielt der Begriff der Wechselwirkung offensichtlich die entscheidende Rolle: Ein Prozeß überträgt eine Markierung, die in ihn durch eine einmalige lokale Wechselwirkung eingeführt wurde, genau dann, wenn er (i) diese Markierung beibehält, falls keine weiteren Wechselwirkungen mit ihm stattfinden, und er (ii) seine alten Charakteristika beibehalten hätte, wenn keine Wechselwirkung mit ihm stattgefunden hätte. Salmon ist sich dieses Umstandes bewußt und versucht, den Begriff der Wechselwirkung, bei dem es sich natürlich um einen kausalen Begriff handelt, über andere, nicht-kausale Begriffe zu explizieren. Seine informelle Bestimmung dieses Begriffes lautet folgendermaßen:

3.3

Das Erklärungsmodell von Wesley Salmon

179

When two processes intersect, and they undergo correlated modifications that persist after the intersection, I shall say that the intersection constitutes

a causal interaction. (Salmon 1984: 170; H. d. A.)28 Diese Bestimmung enthält vier Komponenten. Erstens überschneiden sich bei einer kausalen Wechselwirkung zwei Prozesse raumzeitlich, d. h., ihre Weltlinien durchlaufen denselben Punkt. Zweitens erwerben beide Prozesse bei dieser Überschneidung Modifikationen, die sie drittens nach der Überschneidung beibehalten, falls sie nicht in weitere Wechselwirkungen treten. Und viertens sind diese Modifikationen insofern korreliert, als sie „normally - perhaps invariably" (Salmon 1984: 171) durch Erhaltungssätze beschrieben werden. Zu diesen vier Komponenten tritt in Salmons detaillierterer Bestimmung des Begriffs der kausalen Wechselwirkung noch eine weitere, kontrafaktische Komponente hinzu (in Analogie zur bereits erwähnten Bedingung bei der Bestimmung des Begriffs der Übertragung einer Markierung): Um eine kausale Wechselwirkung handelt es sich nur dann, wenn die beiden beteiligten Prozesse ihre alten Charakteristika beibehalten hätten, falls es nicht zur betreffenden Überschneidung gekommen wäre. 29 Betrachten wir auch diese Bestimmung an einem Beispiel. Treten ein Lichtstrahl und eine rote Linse in eine kausale Wechselwirkung, so überschneiden sich die beiden kausalen Prozesse an demjenigen Raum-Zeit-Punkt, wo der Lichtstrahl auf die Linse trifft. Der Lichtstrahl erhält eine rote Farbe, während der Filter einen Teil des Lichtstrahls absorbiert und dadurch erwärmt wird. Diese Modifikationen, die durch den Energie-Erhaltungssatz beschrieben werden, behalten der Lichtstrahl und die Linse bei, falls sie nicht in weitere Wechselwirkungen treten. Und außerdem gilt, daß der Lichtstrahl und die Linse keine Modifikationen erfahren, sondern ihre alten Charakteristika beibehalten hätten, wenn sie sich nicht raumzeitlich überschnitten hätten. Bei der Erläuterung der dritten Komponente des Begriffs der kausalen Wechselwirkung habe ich eine Klausel hinzugefügt, die weder in 28

Unter einer Wechselwirkung ist bei Salmon immer eine kausale Wechselwirkung zu verstehen: „[...] in my terminology 'causal interaction' and 'interaction' are synonymous; there are no such things as noncausal interactions." Salmon (1994: 299). Für die detailliertere Darstellung des Begriffs der kausalen Wechselwirkung vgl. Salmon (1984: 171).

180

3

Das kausale Modell der Erklärung

Salmons informeller, noch in seiner detaillierteren Charakterisierung vorkommt: Bei einer kausalen Wechselwirkung behalten die wechselwirkenden Prozesse die erworbenen Modifikationen bei, falls sie nicht in weitere Wechselwirkungen treten. Diese Klausel ist offensichtlich erforderlich, damit nicht einige kausale Wechselwirkungen durch Salmons Charakterisierung ausgeschlossen werden: Wenn der Lichtstrahl in unserem Beispiel unmittelbar nach dem Auftreffen auf die rote Linse auf eine blaue Linse trifft, so behält er die erworbene Modifikation nicht bei - aber natürlich hat dies nicht zur Folge, daß es sich bei seinem Auftreffen auf die rote Linse nicht mehr um eine kausale Wechselwirkung handelt. Würde die Klausel allerdings fehlen, wäre genau dies die unerwünschte Konsequenz. Wie wir im nächsten Abschnitt sehen werden, hat das Hinzufügen dieser notwendigen Klausel eine für Salmons Modell sehr unangenehme Nebenwirkung. Durch die wiedergegebene Bestimmung des Begriffs der kausalen Wechselwirkung und durch die weiter oben beschriebene Charakterisierung kausaler Prozesse glaubt Salmon, die zwei seiner Ansicht nach fundamentalen Begriffe zur Behandlung der Kausalität erfolgreich expliziert zu haben - nämlich die Begriffe der kausalen Produktion und der kausalen Übertragung: Causal processes are the means by which structure and order are propagated or transmitted from one space-time region of the universe to other times and places. [...] Causal interactions [...] constitute the means by which modifications in structure (which are propagated by causal processes) are produced. (Salmon 1984: 179; H. d. A.)

Salmons Explikation dieser kausalen Begriffe ist allerdings alles andere als unkontrovers, wie die im folgenden Abschnitt zu diskutierenden Einwände zeigen werden.30 30

Den Begriff der kausalen Produktion versucht Salmon unter Rückgriff auf sog. .kausale Gabelungen' (causal forks) zu explizieren. Diese kommen in drei Typen vor - konjunktive, Wechsel wirkende und perfekte Gabelung - und werden durch statistische Eigenschaften beschrieben (vgl. Salmon 1984: Kapitel 6). Allerdings geht die statistische Explikation der wechselwirkenden Gabelung nicht in die Bestimmung des Begriffs der kausalen Wechselwirkung ein. Salmon merkt an einer Stelle sogar an, daß er eine statistische Bestimmung dieses Begriffes nicht mehr für angebracht hält: „In (Salmon, 1978), I suggested that interactive forks could be defined statistically, in analogy with conjunctive forks, but I now think that the statistical characterization is inadvisable." (Salmon

3.3

3.3.3

Das Erklärungsmodell von Wesley Salmon

181

Einwände gegen Salmons ursprüngliches Kausalitätsmodell und dessen Weiterentwicklung

Gegen Wesley Salmons ursprüngliches Kausalitätsmodell wurde eine Reihe von Einwänden vorgebracht, von denen ich hier nur einige diskutieren kann.31 Diese Einwände haben dazu geführt, daß Salmon sein ursprüngliches Modell in zwei Veröffentlichungen (1994, 1997) in wesentlichen Teilen modifiziert hat. Das resultierende Modell sieht sich allerdings ebenfalls mit erheblichen Problemen konfrontiert. Einwände gegen Salmons ursprüngliches

Modell

Einer der Einwände gegen Salmons ursprüngliches Modell betrifft die Zirkularität seiner Definitionskette. Dowe faßt Salmons Konzeption zunächst folgendermaßen zusammen: (3.9)

Dowes Zusammenfassung litätsmodell I. II. III. IV. V.

31

von Salmons ursprünglichem

Kausa-

A process is something that displays consistency of characteristics. A causal process is a process that can transmit a mark. A mark is transmitted over an interval when it appears at each spacetime point of that interval, in the absence of interactions. A mark is an alteration to a characteristic, introduced by a single local interaction. An interaction is an intersection of two processes where both processes are marked and the mark in each process is transmitted beyond the locus of the intersection. (Dowe 2000b: 71; m. H.)32

1984: 174, Fußnote 12). In (1990a) argumentiert Salmon erstmals gegen die statistische Bestimmung, und Salmon (1994: 301) drückt seine Ablehnung dieser Charakterisierung explizit aus. Vgl. insbesondere Kitcher (1985a, 1989), Sober (1987) und Dowe (1992, 2000b). In dieser Zusammenfassung nimmt Dowe in (III) und (V) die im vorigen Unterabschnitt beschriebenen kontrafaktischen Anteile in Salmons Konzeption nicht auf, weil er sie an einer anderen Stelle diskutieren will (vgl. Dowe 2000b: 71, Fußnote 10). Ihr Fehlen ist für den hier zu diskutierenden Einwand nicht relevant.

182

3

Das kausale Modell der Erklärung

Dann weist Dowe darauf hin, daß zum einen Definition (IV) von „mark" und Definition (V) von „interaction" offensichtlich wechselseitig voneinander abhängen: The concept of a mark involves the concept of an interaction: a mark is a modification to a process introduced by a single interaction (IV). But the concept of an interaction involves the concept of a mark: an interaction is an intersection where both processes are marked (V). The circularity is blatant. (Dowe 2000b: 72) Zum anderen macht Dowe darauf aufmerksam, daß auch Definition (III) von „transmitted" und Definition (V) von „interaction" wechselseitig aufeinander aufbauen: For the concept of transmission involves the concept of an interaction: transmission must be in the absence of interactions (III). But the concept of an interaction involves the concept of transmission: in an interaction both processes transmit a mark beyond the locus of the intersection (V). Again, the circularity is blatant. (Dowe 2000b: 73) Bei meiner eigenen Darstellung von Salmons Begriff der kausalen Wechselwirkung hatte ich nicht wie Dowe in (V) auf den Begriff der Markierung zurückgegriffen. Statt dessen hatte ich eine kausale Wechselwirkung (in Übereinstimmung mit Textstellen bei Salmon) bestimmt als eine raumzeitliche Überschneidung von zwei Prozessen, bei der beide Prozesse Modifikationen erfahren, die sie nach der Überschneidung beibehalten, falls sie nicht in weitere Wechselwirkungen treten. Bei dieser Bestimmung liegt weder eine wechselseitige Abhängigkeit zwischen den Begriffen der Markierung (IV) und der Wechselwirkung (V), noch zwischen den Begriffen der Übertragung (III) und der Wechselwirkung (V) vor. Die von Dowe beschriebene Zirkularität tritt daher nicht auf. Allerdings ergibt sich bei dieser Bestimmung des Begriffs der Wechselwirkung eine andere besonders unerfreuliche und gleichermaßen offensichtliche Konsequenz. Bei dieser Charakterisierung des Begriffs der Wechselwirkung wird nämlich im Definiens auf den zu definierenden Begriff zurückgegriffen: Eine Wechselwirkung ist eine raumzeitliche Überschneidung von zwei Prozessen, bei der die Prozesse miteinander korrelierte Modifikationen erfahren, die sie nach der Überschneidung beibehalten, falls sie nicht in weitere Wechsel-

3.3

Das Erklärungsmodell

von Wesley Salmon

183

Wirkungen treten. W i e man Salmons Position also auch zusammenfassen mag, das Resultat ist gleichermaßen unbefriedigend. 3 3 Ein weiterer Einwand gegen Salmons Konzeption betrifft das Markierungs-Kriterium. W i e gesehen behauptet Salmon, daß dieses Kriterium eine extensional angemessene Unterscheidung zwischen kausalen Prozessen und Pseudo-Prozessen ermöglicht. Eine Reihe von Gegenbeispielen scheint allerdings zu zeigen, daß dies nicht der Fall ist. In Beispielen des ersten Typs weist das Kriterium Pseudo-Prozesse fälschlicherweise als kausale Prozesse aus, in Beispielen des zweiten Typs identifiziert es echte kausale Prozesse nicht als solche. Eines der Beispiele, die den ersten T y p exemplifizieren, stammt von Philip Kitchen Imagine that a vehicle equipped with skis is sliding on an ice rink and casting a shadow. A projectile is thrown in such a way that it lands at the edge of the shadow with a horizontal component of velocity equal to that of the shadow of the vehicle. Because the projectile lies across the edge there is an immediate distortion of the shadow shape. Moreover, the distortion persists because the projectile retains its position relative to the vehicle (and to its shadow). (Kitcher 1989: 464) Der Wurf des Projektils führt zu einer Modifikation eines Charakteristikums des Schattens, die durch eine einmalige lokale Wechselwirkung mit dem Schatten eingeführt wird, die nicht eingetreten wäre, wenn das Projektil nicht geworfen worden wäre, und die fortbesteht, falls der Schatten nicht in weitere Wechselwirkungen tritt. Mit ande-

33

Für Dowes ursprünglichen Zirkularitätsvorwurf gegen Salmon vgl. Dowe (1992: 200 f.), wo auch ähnliche Vorwürfe von Kitcher (1985a) und Mellor (1988) kurz diskutiert werden. Dowe (2000b: 72 ff.) diskutiert verschiedene Möglichkeiten, die oben wiedergegebenen Definitionen so zu modifizieren, daß die beschriebene Zirkularität vermieden wird. Diese Modifikationen führen allerdings, wie Dowe zeigen kann, zu jeweils neuen Schwierigkeiten. Salmon (1994: 299) hat im Übrigen an Dowes Definition (V) des Begriffs der kausalen Wechselwirkung nichts zu beanstanden und Ubernimmt diese bei seiner eigenen Beschreibung seiner Position. Er versucht der ersten von Dowe beschriebenen Zirkularität zu entgehen, indem er in Definition (IV) „interaction" durch „intersection" ersetzt (vgl. Salmon 1994: 298 ff.). Dies stellt aber bereits eine Änderung seiner ursprünglichen Konzeption dar und kann somit den Zirkularitätsvorwurf gegen diese Position nicht ausräumen. Auf die zweite der von Dowe beschriebenen Zirkularität geht Salmon (1994) nicht ein; sie fehlt in Dowe (1992) und wird erst in Dowe (2000b) erwähnt.

184

3

Das kausale Modell der Erklärung

ren Worten: Der Schatten überträgt eine Markierung und erfüllt damit das Markierungs-Kriterium - d. h„ der Schatten ist ein kausaler Prozeß. Ein weiteres Beispiel für einen Pseudo-Prozess, der nach Salmons Markierungs-Kriterium als kausaler Prozeß gilt, stammt von Phil Dowe: [...] take the case where a stationary car (a causal process) throws its shadow on a fence. Suddenly the fence falls over, producing a permanent modification in the shadow. Then the shadow has been marked by the single local action of the falling fence. (Dowe 2000b: 79)

Wieder erfährt der Schatten durch eine einmalige lokale Wechselwirkung eine Modifikation eines seiner Charakteristika. Er behält das neue Charakteristikum bei, falls keine weiteren Wechselwirkungen stattfinden, und er hätte ohne die erfolgte Wechselwirkung seine alten Charakteristika beibehalten. Der Schatten überträgt also die Markierung und qualifiziert sich damit als kausaler Prozeß.34 Ein dritter Kritikpunkt betrifft Salmons Verwendung von kontrafaktischen Bedingungen bei der Formulierung des Markierungs-Kriteriums, bei der Bestimmung des Begriffs der Übertragung einer Markierung und bei der Definition des Begriffs der kausalen Wechselwirkung. Wie wir im letzten Abschnitt bei der Diskussion von Lewis' Kausalitätsmodell gesehen hatten, werfen solche Bedingungen Probleme im Hinblick auf die Frage auf, wie festgestellt werden soll, ob sie erfüllt sind. Salmon bietet hierfür eine eigene Methode an, bei der nicht wie bei Lewis auf mögliche Welten und deren relative Ähnlich34

Gegenbeispiele des zweiten Typs, bei denen echte kausale Prozesse durch das Markierungs-Kriterium nicht als solche identifiziert werden, diskutieren Dowe (2000b: 74 f.) und Kitcher (1989: 461-470). Einige der Gegenbeispiele, die gegen das Markierungs-Kriterium angeführt werden, beruhen auf dem Umstand, daß die Begriffe des .Charakteristikums' (characteristic) bzw. der .Struktur' (structuré) eines Prozesses von Salmon nicht hinreichend präzisiert werden und vage bleiben; vgl. hierzu Dowe (1992: 201-204; 2000b: 75-79) und Kitcher (1989: 461-470). Salmon (1994: 300 f.) reagiert auf diese Gegenbeispiele, indem er einen Eigenschaftsbegriff charakterisiert, der auf dem Begriff der „objectively codefined class" (Salmon 1994: 300) beruht. Nach seiner Ansicht erlaubt es der Rekurs auf Eigenschaften in diesem Sinn, die fraglichen Gegenbeispiele auszuschließen, weil in ihnen keine Eigenschaft im definierten Sinn Ubertragen wird. Dieser Versuch wird nach meiner Einschätzung allerdings von Dowe (2000b: 77 f.) erfolgreich kritisiert.

3.3

Das Erklärungsmodell von Wesley Salmon

185

keit zueinander rekurriert wird. 35 Statt dessen wird die Wahrheit bzw. Falschheit kontrafaktischer Konditionale nach Salmons Ansicht überprüft, indem man wissenschaftliche Experimente anstellt: Science has a direct way of dealing with the kinds of counterfactual assertions we require, namely, the experimental approach. In a well-designed controlled experiment, the experimenter determines which conditions are to be fixed for purposes of the experiment and which allowed to vary. The result of the experiment establishes some counterfactual statements as true and others as false under well-specified conditions. (Salmon 1984: 149 f.) Das Problem bei dieser Methode besteht darin, daß wir entscheiden müssen, mit welchen Experimenten wir die betreffenden kontrafaktischen Bedingungen überprüfen wollen. Denn in Abhängigkeit davon, welche Experimente wir wählen, können sich verschiedene Resultate ergeben. Betrachten wir dieses Problem an einem Beispiel. Zwei Billardkugeln rollen auf einer durchsichtigen Platte aufeinander zu und kollidieren. Bei dieser Kollision handelt es sich nach intuitiver Einschätzung um eine kausale Wechselwirkung. Diese Intuition scheint durch Salmons Modell bestätigt werden zu können: Bei der Kollision der beiden Kugeln überschneiden sich zwei Prozesse raumzeitlich; die beiden Kugeln ändern ihren Impuls (nach Richtung und Betrag) auf korrelierte Art und Weise; diese Modifikation behalten die Kugeln bei, falls keine weiteren Wechselwirkungen auftreten. Und insbesondere scheint zu gelten: Wenn die Kugeln nicht kollidiert wären, dann hätten sie ihren Impuls nicht geändert, sondern ihren alten Impuls beibehalten die für kausale Wechselwirkungen notwendige kontrafaktische Bedingung scheint also erfüllt zu sein. Die durchsichtige Platte, auf der die beiden Kugeln aufeinander zurollen, werde nun von oben beleuchtet, wodurch die Schatten der Kugeln auf den Boden projiziert werden. Bei der Kollision der Kugeln überschneiden sich die beiden Schatten raumzeitlich. Hierbei handelt es sich nach intuitiver Einschätzung nicht um eine kausale Wechselwirkung. Allerdings ändern die beiden Schatten bei dieser Überschneidung auf korrelierte Art und Weise ihre Bewegungsrichtung, und sie behalten diese Modifikation bei, falls keine weiteren Wechselwirkun35

Diese Herangehensweise an kontrafaktische Bedingungen lehnt Salmon explizit ab; vgl. Salmon (1997:476).

186

3

Das kausale Modell der Erklärung

gen auftreten. Insbesondere scheint auch die betreffende kontrafaktische Bedingung erfüllt zu sein: Wenn die Schatten sich nicht raumzeitlich überschnitten hätten, dann hätten sie ihre Bewegungsrichtung nicht geändert, sondern ihre alte Bewegungsrichtung beibehalten. Dies bedeutet, daß Salmons Modell keine Handhabe dafür bietet, die raumzeitliche Überschneidung der Schatten der beiden Kugeln als eine kausale Wechselwirkung auszuschließen - es sei denn, Salmon ist in der Lage zu zeigen, daß die genannte kontrafaktische Bedingung im Falle der Schatten nicht erfüllt ist. Diesen Nachweis versucht Salmon nun durch seine experimentelle Methode zu führen. Es ist zunächst darauf hinzuweisen, daß das folgende Experiment nicht in der Lage ist, das Erfülltsein der kontrafaktischen Bedingung im Falle der Schatten zu widerlegen: Wir lassen die Kugeln 100 Mal aufeinander zurollen. Dabei lassen wir sie 50 Mal kollidieren und 50 Mal aneinander vorbeirollen. Dieses Experiment scheint die folgende kontrafaktische Aussage zu bestätigen: Wenn die Kugeln nicht kollidiert wären, dann hätten sie ihren Impuls nicht verändert, sondern ihren alten Impuls beibehalten. Allerdings scheint es auch die folgende kontrafaktische Aussage zu bestätigen: Wenn die Schatten der Kugeln sich nicht raumzeitlich überschnitten hätten, dann hätten sie ihre Bewegungsrichtung nicht verändert, sondern ihre alte Bewegungsrichtung beibehalten. Dieses Experiment kann also keinen Unterschied zwischen den beiden Fällen begründen. Salmon schlägt nun aber folgende Modifikation dieses Experiments vor. Wir beleuchten den Boden unter der Platte in einer Weise, die den Schatten der einen Kugel zum Verschwinden bringt, und führen dann die erwähnten 100 Versuche durch. Nach wie vor scheint das Experiment zu belegen, daß die kontrafaktische Bedingung bei der Kollision der Kugeln erfüllt ist: Wenn die Kugeln nicht kollidiert wären, dann hätten sie ihren Impuls nicht geändert. Allerdings scheint es jetzt zu zeigen, daß die kontrafaktische Bedingung im Fall der Schatten nicht erfüllt ist. Denn es scheint nicht zu gelten: Wenn die Schatten sich nicht raumzeitlich überschnitten hätten, dann hätten sie ihre Bewegungsrichtung nicht geändert. Der Schatten der einen Kugel ändert seine Bewegungsrichtung auch in den 50 Fällen, bei denen er sich nicht mit dem Schatten des anderen Balles überschneidet. Dieses modifizierte Experiment kann also einen Unterschied zwischen den beiden Fällen begründen. Salmon scheint somit durch das modifizierte

3.3

Das Erklärungsmodell von Wesley Salmon

187

Experiment das ErfQlltsein der kontrafaktischen Bedingung im Fall der Schatten widerlegt zu haben, so daß er die raumzeitliche Überschneidung der Schatten als kausale Wechselwirkung ausschließen kann. Allerdings handelt es sich hierbei nur um einen Scheinerfolg. Wir modifizieren das ursprüngliche Experiment jetzt nämlich auf eine andere Art und Weise. Wir lassen die Kugeln 50 Mal miteinander kollidieren, und 50 Mal lassen wir nur eine der beiden Kugeln losrollen. Diese unterwerfen wir allerdings, wenn sie an dem Punkt ankommt, an dem sie mit der anderen Kugel kollidiert wäre, einer Impulsänderung, die derjenigen entspricht, die die Kugel bei der entsprechenden Kollision erfahren hätte. Dieses Experiment scheint nun die kontrafaktische Bedingung im Fall der Kugeln zu widerlegen. Denn es scheint nicht zu gelten: Wenn die Billardkugeln nicht miteinander kollidiert wären, dann hätten sie ihren Impuls nicht geändert, sondern ihren alten Impuls beibehalten. Die rollende Kugel ändert ihren Impuls auch in den 50 Fällen, in denen sie nicht mit der anderen Kugel zusammenstößt. Dieses Experiment schließt somit die Kollision der beiden Billardkugeln als eine kausale Wechselwirkung aus. Natürlich würde Salmon dieses dritte Experiment zur Überprüfung der kontrafaktischen Bedingung ablehnen, weil es das falsche Resultat liefert. Allerdings ist nicht klar, welche Begründung er für diese Ablehnung anbieten will. Kitcher bemerkt hierzu: Now it is natural to protest that Experiment III involves gratuitous intervention, But isn't it possible to make a similar protest in the case of Experiment II where we introduce a new object (the light source) into the situation? What justifies us in thinking that the interventions involved in II do not confound the probative force of the test while those involved in III do? (Kitcher 1989: 475)

Wie Kitcher (1989: 475) richtig bemerkt, kann sich Salmon bei einer Antwort auf diese Frage nicht (in Analogie zu Lewis) darauf berufen, daß im zweiten Experiment die 50 abweichenden Durchgänge eine größere Ähnlichkeit zu den 50 ursprünglichen Durchgängen aufweisen als im dritten Experiment. Denn in allen drei beschriebenen Experimenten bestehen Ähnlichkeiten und Unterschiede zwischen den 50 .normalen' und den 50 veränderten Versuchsdurchgängen. Tatsächlich kann man behaupten, daß die Situation für die beiden modifizierten Experimente völlig analog ist: In beiden Experimenten entfernen

188

3 Das kausale Modell der Erklärung

wir zur Überprüfung der entsprechenden kontrafaktischen Bedingung eines der beteiligten Objekte - im zweiten Experiment einen der Schatten, im dritten Experiment eine der Kugeln. Salmons Methode zur Überprüfung der kontrafaktischen Bedingungen, die in die Bestimmung der Begriffe des kausalen Prozesses und der kausalen Wechselwirkung eingehen, führt also nicht zum Ziel. Dies bedeutet, daß auch diese Begriffe selbst von Salmon nicht befriedigend bestimmt werden konnten. Im Rahmen von Salmons Modell kann nicht festgestellt werden, ob es sich bei einem gegebenen Prozeß um einen kausalen Prozeß bzw. bei einer gegebenen raumzeitlichen Überschneidung von zwei Prozessen um eine kausale Wechselwirkung handelt oder nicht. Kurz: Salmons Modell erlaubt keine Entscheidung der Frage, welche Entitäten kausale Prozesse und welche Entitäten kausale Wechselwirkungen darstellen. Sein Modell ist also erkenntnistheoretisch unbefriedigend.36 Salmons Modifikationen seines ursprünglichen Modells und die verbleibenden Probleme Die beschriebenen und weitere Kritikpunkte an Salmons ursprünglichem Kausalitätsmodell haben dazu geführt, daß Salmon dieses Modell in seinem Artikel „Causality without Counterfactuals" (1994) in wesentlichen Punkten modifiziert hat. In diesem Artikel räumt Salmon einen Großteil der gegen sein ursprüngliches Modell vorgebrachten Einwände ein und gibt zum einen das Markierungs-Kriterium zur Unterscheidung von kausalen Prozessen und Pseudo-Prozessen auf. Statt dessen charakterisiert er kausale Prozesse nun als Weltlinien von Objekten, die eine sog. invariante Größe (mit einem von Null verschiedenen Betrag) übertragen. Zum anderen bestimmt er kausale Wechselwirkungen als raumzeitliche Überschneidungen von Weltlinien von Objekten, bei denen eine invariante Größe ausgetauscht wird. Durch diese Änderungen entledigt sich Salmon der Absicht nach erstens aller kontrafaktischen Bestandteile seines Modells; zweitens werden durch die Aufgabe des Markierungs-Kriteriums auch die beschriebenen Ge-

36

Für weitere Kritikpunkte im Hinblick auf Salmons Verwendung von kontrafaktischen Bedingungen vgl. Kitcher (1989: 470 ff.), Dowe (1992: 207 f., 2000b: 84 f.) und Carrier (1998: 52 f.).

3.3

Das Erklärungsmodell von Wesley Salmon

189

genbeispiele irrelevant; und schließlich soll diese Änderung auch den beschriebenen Zirkularitätsvorwurf entkräften. Gegen Salmons Modifikation des ursprünglichen Modells im erwähnten Artikel haben Dowe (1995) und Hitchcock (1995) weitere Einwände vorgebracht, so daß Salmon (1997) eine zweite Modifikation vornahm. Diese betrifft insbesondere den Wechsel von invarianten Größen zu Erhaltungsgrößen, wodurch Salmons endgültiges Modell in wesentlichen Teilen mit Dowes Modell der Erhaltungsgrößen übereinstimmt (vgl. Dowe 1992, 1995, 2000b). Salmons Kausalitätsmodell, wie es in Salmon (1997) formuliert wird, läßt sich folgendermaßen zusammenfassen: (3.10) Salmons gegenwärtige dell der

Version seines Kausalitätsmodells:

Mo-

Erhaltungsgrößen

I.

Ein kausaler Prozeß ist die Weltlinie eines Objektes, das eine Erhaltungsgröße an jedem Raum-Zeit-Punkt seiner Trajektorie überträgt, wobei diese Größe einen von Null verschiedenen Betrag hat. II. Ein Prozess überträgt eine Erhaltungsgröße zwischen A und Β (Α / Β) genau dann, wenn er die Größe an A, an Β und an jedem Punkt des Prozesses zwischen A und Β - in Abwesenheit von kausalen Wechselwirkungen diese Größe betreffend - besitzt. III. Eine kausale Wechselwirkung ist eine Überschneidung von Weltlinien, bei denen eine Erhaltungsgröße ausgetauscht wird.37 Eine Erhaltungsgröße ist dabei eine Größe, für die ein Erhaltungssatz gilt, deren Betrag sich in bezug auf ein abgeschlossenes System also nicht ändert. Beispiele für Erhaltungsgrößen sind etwa Energie, elek37

Vgl. Salmon (1997: 462, 468 f.). Ich wähle hier eine andere Reihenfolge der Definitionen als Salmon, um die definitorischen Abhängigkeiten besser zum Ausdruck zu bringen. Der entscheidende verbleibende Unterschied zwischen Salmons und Dowes Theorie besteht darin, daß Salmon weiterhin bei der Bestimmung von kausalen Prozessen auf den Begriff der Übertragung zurückgreift, während Dowe einen kausalen Prozeß bestimmt als „a world line of an object that possesses a conserved quantity" (Dowe 2000b: 90; m. H.). Dowe argumentiert für diese und gegen Salmons Konzeption in Dowe (2000b: Kapitel 5).

190

3

Das kausale Modell der

Erklärung

trische Ladung, Drehimpuls und linearer Impuls: „Consider linear momentum [...]. We have a law of conservation of linear momentum [...]. Within any closed system the total quantity of linear momentum is constant over time." (Salmon 1994: 305). Die von Salmon vorgenommenen Modifikationen an seinem ursprünglichen Modell sind allerdings nur bedingt erfolgreich, denn auch das Modell der Erhaltungsgrößen hat mit einer Vielzahl von Einwänden zu kämpfen, von denen ich hier kurz die wichtigsten skizzieren will.38 Zunächst weist Christopher Hitchcock (1995) darauf hin, daß auch Salmons neues Modell Gefahr läuft, zirkulär zu sein. Wie wir in (3.10)(III) gesehen haben, wird der Begriff der kausalen Wechselwirkung in diesem Modell über den Begriff der Erhaltungsgröße bestimmt. Hitchcock stellt nun die Frage, wie denn der Begriff der Erhaltungsgröße zu charakterisieren sei, und vermutet, daß dabei auf kausale Wechselwirkungen Bezug genommen werden muß: Suppose it be asked how we are to define 'conserved quantity'. A conserved quantity is one that remains constant through time in a closed system, but what is a closed system but a system that does not engage in any causal interactions? In other words, is not the concept of conserved quantity to be explicated in terms of the concept of causal interaction [...]? (Hitchcock 1995: 315 f.; m. H.)

Falls der Begriff der Erhaltungsgröße in dieser Weise bestimmt werden muß, kann natürlich der Begriff der kausalen Wechselwirkung nicht mehr Uber den Begriff der Erhaltungsgröße expliziert werden.39 Ein weiteres schwerwiegendes Problem für Salmons neues Modell spricht Phil Dowe (2000a) an. Nach Dowes Auffassung spezifiziert Salmons Modell der Erhaltungsgrößen keine hinreichende, sondern

38

Vgl. hierzu Hitchcock (1995), Dowe (1995,2000b) und Carrier (1998). Hitchcock (1995: 314 f.) argumentiert darüber hinaus, daß auch im Modell der ErhaltungsgröBen der Rekurs auf kontrafaktische Bedingungen nicht vermieden werden kann (vgl. hierzu allerdings Salmon 1997: 470 ff.). Nach Hitchcocks Auffassung sollte Salmons altes Modell nicht durch das Modell der Erhaltungsgrößen ersetzt, sondern beide sollten miteinander kombiniert werden. Allerdings erhält man selbst dann keine „reductive analysis of the concepts of causal process and interaction" und keine „infallible rules", um diese zu identifizieren; man erwirbt in diesem Fall lediglich „guidelines for recognizing causal processes and interactions" (Hitchcock 1995: 316; H. d. Α.).

3.3

Das Erklärungsmodell von Wesley Salmon

191

lediglich eine notwendige Bedingung für Kausalität. Dowe illustriert dies an folgendem Beispiel: Take any two causally independent events, say, my tapping the table and the clock hand moving a moment later. There is no causal connection between these two particular events, but there is in fact a set of causal processes and interactions between them, according to the conserved quantity theory. The reason is that there are air molecules filling the gap between, so that one can connect the two events by stringing together a series of molecular collisions. Also there is a longitudinal disturbance, the sound of my tapping, which reaches the clock hand before it moves. So, again, there can be a set of causal processes and interactions where there is no causal connection. [...] Thus the conserved quantity theory does not provide a sufficient condition for singular causation [...]. (Dowe 2000a: 173) Dieser Einwand von Dowe gegen Salmons Modell entspricht dem Einwand von Laurie Paul gegen David Lewis' neues Modell der kausalen Beeinflussung, der am Ende von Abschnitt 3.2.3 diskutiert wurde. Wie schon Paul in bezug auf Lewis, so zieht auch Dowe in bezug auf Salmon aus diesem Einwand den Schluß, daß dessen neues Modell keine angemessene Analyse der Kausalität bzw. der kausalen Verbindung von Ursache und Wirkung darstellt.40 Einen weiteren Kritikpunkt gegen Salmons neues Kausalitätsmodell bringt Martin Carrier (1998) vor. Er weist zunächst darauf hin, daß der Rekurs auf Erhaltungsgrößen bei der Bestimmung von kausalen Prozessen und Wechselwirkungen diese Begriffe an Erhaltungssätze bindet: Eine Konsequenz der Kausaltheorie der Erhaltungsgrößen ist, daß Ursachen nur dort zu finden sind, wo es Erhaltungssätze gibt. Verursachung ist danach im wesentlichen auf den Austausch von Energie, Impuls und Ladung beschränkt. (Carrier 1998: 62) Dies hat nach Carriers Ansicht zur Folge, daß „das Vorliegen von Kausalität an die grundlegenden Prozesse der Physik" gebunden wird und „daher mit einer erheblichen Einschränkung des legitimen Anwendungsbereichs von Kausalurteilen" (Carrier 1998: 69) einhergeht:

40

Für Dowes Versuch, das beschriebene Problem im Rahmen seiner eigenen Theorie zu lösen, vgl. Dowe (2000a: 173 f., 2000b: Kapitel 7). Für weitere Kritikpunkte Dowes an Salmons Version der Theorie der Erhaltungsgrößen vgl. Dowe (2000b: 114-121).

192

3

Das kausale Modell der Erklärung

Urteile über Verursachung in Disziplinen wie Biologie oder Psychologie erforderten danach den Rückgriff auf Fundamentalgrößen der Physik. Die Einlösung dieses Anspruchs beinhaltet jedenfalls eine erhebliche Herausforderung. (Carrier 1998: 69)

In der Tat: Dieser Anspruch ist gleichbedeutend mit der Forderung der physikalistischen Reduktion aller Wissenschaften, in denen Kausalität eine Rolle spielt.41 Die Summe dieser Einwände scheint mir zu zeigen, daß Salmons modifiziertes Kausalitätsmodell der Erhaltungsgrößen mit erheblichen Schwierigkeiten zu kämpfen hat. Da sein ursprüngliches, auf dem Begriff der Markierung aufbauendes Modell, wie wir gesehen haben, sich mindestens ebenso großen Problemen gegenüber sieht, ist nach meiner Auffassung das Fazit erlaubt, daß Salmon sein Ziel, eine unkontroverse Explikation des Kausalitätsbegriffs zu liefern, nicht erreicht. Dieser Umstand hat natürlich auch Auswirkungen auf die Angemessenheit seines im folgenden Abschnitt zu behandelnden kausalen Erklärungsmodeiis, denn dieses baut offensichtlich auf seinem Kausalitätsmodell auf.

3.3.4

Salmons Erklärungsmodell

Drei verschiedene Ansätze Salmon unterscheidet drei grundsätzlich verschiedene Ansätze innerhalb der Theorie der Erklärung: den epistemischen, den modalen und den ontischen Ansatz. Im epistemischen Ansatz wird der Erklärungsbegriff mit dem Begriff der Erwartbarkeit verknüpft. Wenn beispielsweise das Auftreten einer Sonnenfinsternis erklärt werden soll, so muß die betreffende Erklärung zeigen, daß die Sonnenfinsternis vor dem Hintergrund gegebener Information über astronomische Randbedingungen und Gesetze zu erwarten war. Eine Erklärung im epistemi41

Carrier formuliert diesen Einwand noch im Hinblick auf Salmons (1994) erste Modifikation des ursprünglichen Modells, bei dem auf invariante und nicht auf Erhaltungsgrößen rekurriert wird. Das Argument ist aber auf Salmons (1997) Modell der Erhaltungsgrößen übertragbar, wobei seine Schlagkraft im Hinblick auf invariante Größen allerdings noch etwas größer ist (vgl. hierzu Carrier 1998: 63 f.). Insgesamt versucht Carrier in seinem Artikel zu zeigen, daß Salmons ursprüngliches Modell dem neuen überlegen ist.

3.3

Das Erklärungsmodell von Wesley Salmon

193

sehen Ansatz wird dementsprechend aufgefaßt „as an argument to the effect that the event-to-be-explained was to be expected by virtue of the explanatory facts" (Salmon 1984: 16; H. d. Α.). Eine entscheidende Rolle spielen hierbei die in der Erklärung verwendeten Gesetze: The key to this sort of explanation is nomic expectability. An event that is quite unexpected in the absence of knowledge of the explanatory facts is rendered expectable on the basis of lawful connections with other facts. Nomic expectability as thus characterized is clearly an epistemological concept. (Salmon 1984: 16; H. d. A.)

Diese Charakterisierung des epistemischen Ansatzes trifft ganz offensichtlich auf das in Kapitel 1 dieser Arbeit beschriebene covering lawModell zu. Hier werden wie gesehen Erklärungen als deduktive oder induktiv starke Argumente konzipiert, die zeigen, daß das Explanandum-Phänomen vor dem Hintergrund der im Explanans genannten Information über Gesetze und Randbedingungen zu erwarten war.42 Im modalen Ansatz ist der Erklärungsbegriff mit dem Begriff der Notwendigkeit verknüpft, und Erklärungen erfüllen ihre Funktion „by showing that what did happen had to happen" (Salmon 1985: 320; m. H.). Die Erklärung einer Sonnenfinsternis zeigt im modalen Ansatz, daß diese eintreten mußte, weil die gegebenen Randbedingungen und die herrschenden Gesetze ihr Auftreten notwendig machten: In the absence of knowledge of the explanatory facts, the explanandumevent [...] was something that might not have occurred for all we know; given the explanatory facts it had to occur. The explanation exhibits the nomological necessity of the fact-to-be-explained, given the explanatory facts. (Salmon 1984: 17; H. d. A.)

Während im epistemischen Ansatz also eine logische Beziehung zwischen Explanans und Explanandum besteht, die entweder die Form logischer Notwendigkeit oder hoher induktiver Wahrscheinlichkeit an42

Beim covering ίανν-Modell der Erklärung handelt es sich um die sog. inferentielle Version des epistemischen Ansatzes. Zu diesem Ansatz gehören nach Salmons Auffassung außerdem noch das von James Greeno (1971) entwickelte und später von Joseph Hanna (1978) erweiterte sog. informationstheoretische Modell und das von Sylvain Bromberger (1966) angeregte und von Bas van Fraassen (1977, 1980) ausgearbeitete sog. eroterische Modell. Salmon gibt, soweit ich sehen kann, an keiner Stelle eine allgemeine Charakterisierung des epistemischen Ansatzes, die auf alle drei Versionen zutreffen würde.

194

3

Das kausale Modell der Erklärung

nimmt, liegt im modalen Ansatz eine physikalische Beziehung zwischen beiden vor: „The explanation renders the explanandum-event physically necessary relative to the explanatory facts." (Salmon 1984: 111; m. H.). Im ontischen Ansatz schließlich weisen Erklärungen den zu erklärenden Phänomenen gewissermaßen ihren Platz in der vorgegebenen ontischen Struktur der Welt an. In diesem Ansatz werden Erklärungen verstanden als „exhibitions of the ways in which what is to be explained fits into natural patterns or regularities" (Salmon 1985: 320; m. H.). Die Erklärung einer Sonnenfinsternis zeigt im ontischen Ansatz, wie diese in die Struktur der Welt paßt, die durch die herrschenden Naturgesetze und die faktischen Gegebenheiten bestimmt ist: Scientific explanation, according to the ontic conception, consists in exhibiting the phenomena-to-be-explained as occupying their places in the patterns and regularities which structure the world. (Salmon 1984: 239)

Die drei beschriebenen Ansätze scheinen sich nicht wesentlich zu unterscheiden, solange man nur Phänomene betrachtet, die unter universelle Gesetze fallen. Wenn das Auftreten der Sonnenfinsternis aus den gegebenen Randbedingungen und den geltenden Gesetzen mit Hilfe eines deduktiven Argumentes hergeleitet, erwartbar gemacht und somit gemäß dem epistemischen Ansatz erklärt werden kann, so gilt offensichtlich auch, daß die Sonnenfinsternis vor dem Hintergrund der beschriebenen Randbedingungen und Gesetze auftreten mußte - so daß ebenfalls eine Erklärung nach dem modalen Ansatz vorliegt. Weiterhin wird durch eine solche Erklärung natürlich auch beschrieben, wie sich das Auftreten der Sonnenfinsternis in die Struktur der Welt einfügt, so daß ebenso eine Erklärung nach dem ontischen Ansatz vorliegt. Die drei Ansätze weisen allerdings erhebliche Unterschiede auf, wenn es um die Erklärung von Ereignissen geht, die unter statistische Gesetze fallen. Betrachten wir als Beispiel den radioaktiven Zerfall eines Tritium-Atoms. Nehmen wir an, ein Tritium-Atom mit einer Halbwertszeit von etwa 12 lA Jahren werde für 24 Vi Jahre in einem Behälter verschlossen. Die Wahrscheinlichkeit, daß dieses Atom nach diesem Zeitraum zerfallen ist, beträgt etwa 0,75 und die Wahrscheinlichkeit, daß es nicht zerfallen ist, etwa 0,25. Nehmen wir weiter an, der Behälter werde geöffnet und das Atom sei nicht zerfallen.

3.3

Das Erklärungsmodell

von Wesley Salmon

195

Dieses Ereignis kann im epistemischen Ansatz nicht erklärt werden, da die zur Verfügung stehenden Gesetze und die gegebenen Anfangsbedingungen es nicht erlauben, ein Argument zu konstruieren, das dem Auftreten des Explanandum-Ereignisses eine hohe Wahrscheinlichkeit verleiht, so daß dieses Auftreten erwartbar wäre. Ebensowenig kann es im modalen Ansatz erklärt werden, aus dem einfachen Grund, weil das fragliche Ereignis natürlich nicht eintreten mußte - es hätte mit einer Wahrscheinlichkeit von 0,75 auch nicht eintreten können. Die Lage ist im modalen Ansatz in gewissem Sinne sogar noch schlechter als im epistemischen. Während man nämlich in diesem zumindest den Zerfall des Atoms erklären könnte, indem man ein induktiv starkes Argument vorbringt, das den Zerfall mit einer Wahrscheinlichkeit von 0,75 erwartbar macht, ist im modalen Ansatz auch dieses Ereignis unerklärbar, da es ebensowenig wie das Nichtzerfallen des Atoms eintreten mußte. Im ontischen Ansatz dagegen stellt weder die Erklärung des Zerfalls noch des Nichtzerfallens des Tritium-Atoms ein Problem dar. Beide Ereignisse können erklärt und verstanden werden, indem man zeigt, wie sie sich in die gesetzmäßigen, probabilistischen Strukturen der Welt einfügen: Scientific understanding, according to this conception, involves laying bare the mechanisms [...] that bring about the fact-to-be-explained. If there is a stochastic process that produces one outcome with high probability and another with low probability, then we have an explanation of either outcome when we cite the stochastic process and the fact that it gives rise to the outcome at hand in a certain percentage of cases. The same circumstance - the fact that this particular stochastic process was operating - explains the one outcome on one occasion and an alternative on another occasion. (Salmon 1985: 328)

Da Salmon wie bereits erwähnt gerade die statistischen Erklärungen am Herzen liegen und da er sehr wohl Ereignisse für erklärbar hält, die bezüglich des Hintergrundwissens eine geringe Wahrscheinlichkeit haben, lehnt er sowohl den epistemischen als auch den modalen Ansatz ab und votiert für den ontischen. Die Strukturen und Mechanismen, auf die im ontischen Ansatz Bezug genommen wird, faßt Salmon dabei als kausal auf:

196

3

Das kausale Modell der Erklärung

Causal relations lie at the foundations of these patterns and regularities; consequently, the ontic conception has been elaborated as a causal conception of scientific explanation. (Salmon 1984: 239; H. d. A.) According to the ontic conception - as I see it, at least - an explanation of an event involves exhibiting that event as it is embedded in its causal network and/or displaying its internal causal structure. (Salmon 198S: 325; m. H.)

Die Begriffe des kausalen Netzwerks, der kausalen Struktur, der kausalen Mechanismen usw. gründen sich dabei auf die im vorigen Abschnitt diskutierten Begriffe des kausalen Prozesses und der kausalen Wechselwirkung.43 Ätiologische versus konstitutive Erklärung In seinem kausalen Erklärungsmodell unterscheidet Salmon dabei zwei Typen von Erklärungen: ätiologische und konstitutive Erklärungen. Eine ätiologische Erklärung eines Ereignisses „teils the causal story leading up to its occurrence" (Salmon 1985: 324). Bei einer solchen Erklärung wird das betreffende Ereignis erklärt „by showing how it came to be as a result of antecedent events, processes, and conditions" (Salmon 1984:269): An etiological explanation is an exhibition of the causal connections between the explanandum and prior occurrences; such an explanation fits the explanandum into an external pattern of causal relationships. (Salmon 1984: 270)

Ätiologische Erklärungen in Salmons Sinne dürften damit ungefähr dem entsprechen, was in David Lewis' Terminologie bezeichnet wird als die Erklärung eines Ereignisses E durch die Beschreibung einer oder mehrerer kausaler Ketten, die zu E führen (vgl. Abschnitt 3.2.4). Eine konstitutive Erklärung dagegen „does not explain particular facts or general regularities in terms of causal antecedents"·, sie zeigt statt dessen „that the fact-to-be-explained is constituted by underlying causal mechanisms" (Salmon 1984: 270; m. H.). Bei einer solchen Erklärung wird ein gegebenes Phänomen erklärt „by providing a causal analysis of the phenomenon itself" (Salmon 1985: 324; m. H.): 43

Hierbei spielt es nach meiner Einschätzung keine Rolle, ob Salmons ursprüngliches Kausalitätsmodell oder das Modell der Erhaltungsgrößen zugrunde gelegt wird. Vgl. hierzu auch Hitchcock (1995: 308).

3.3

Das Erklärungsmodell von Wesley Salmon

197

A constitutive explanation consists of an exhibition of the internal causal structure of the explanandum; such an explanation exposes the causal mechanisms within the explanandum. (Salmon 1984: 270)

Beispielsweise handelt es sich nach Salmons Auffassung bei vielen Fällen von physikalischer Reduktion um konstitutive Erklärungen: „When, for example, we explain optical phenomena in terms of Maxwell's electromagnetic theory, the explanation is constitutive. Light waves are the electromagnetic waves (in a particular part of the spectrum) treated by Maxwell's theory." (Salmon 1984: 270; H. d. Α.). Ein weiteres Beispiel für eine konstitutive Erklärung in diesem Sinne dürfte die von Michael Friedman diskutierte Erklärung der klassischen Gasgesetze durch die kinetische Gastheorie darstellen (vgl. Abschnitt 2.2.1).

Zwar gibt es nach Salmons Ansicht Erklärungen, die rein ätiologisch bzw. rein konstitutiv sind (vgl. Salmon 1984: 270), aber in der Regel wird eine Erklärung beide Aspekte aufweisen. Als ein Beispiel für einen solchen kombinierten Fall nennt Salmon die Erklärung der Zerstörung Hiroshimas am Ende des Zweiten Weltkrieges durch die Explosion einer Atombombe: To give a full explanation of the destruction [...] it would be necessary to refer to an atomic bomb, and to explain the explosion in terms of the assembly of a critical mass of U235. Such an explanation would embody constitutive aspects. The explosion is explained in terms of a self-sustaining chain reaction, and this notion is causally explained in terms of the mechanisms of nuclear fission. The same explanation of the destruction of Hiroshima would include reference to the dropping of the bomb from an airplane and the detonation by implosion of a critical mass of fissionable material at a certain place above the city. These are the etiological factors because they are antecedent events that contributed causally to the occurrence of the explanandum-event. (Salmon 1984: 270 f.; m. H.)

Diese Konzeption vom Zusammenspiel von ätiologischer und konstitutiver Erklärung erläutert Salmon anhand des nachstehenden Diagramms (vgl. Salmon 1984:275).

198

3

Das kausale Modell der Erklärung

(3.11) Diagramm: Zusammenspiel Erklärung

von ätiologischer

und

konstitutiver

vergangener Lichtkegel Das zu erklärende Ereignis E nimmt hier ein bestimmtes Volumen in der vierdimensionalen Raumzeit ein, von dem ein zukünftiger und ein vergangener Lichtkegel ausgehen. Dieses Ereignis E wird nun folgendermaßen erklärt: Suppose we want to explain some event E. We may look at E as occupying a finite volume of four-dimensional space-time [...]. If we want to show why E occurred, we fill in the causally relevant processes and interactions that occupy the past light cone of E. This is the etiological aspect of our explanation; it exhibits E as embedded in its causal nexus. If we want to show why E manifests certain characteristics, we place inside the volume occupied by E the internal causal mechanisms that account for E's nature. This is the constitutive aspect of our explanation; it lays bare the causal structure o f f . (Salmon 1984: 275; m. H.) Ätiologische und konstitutive Aspekte spielen allerdings nicht nur bei der Erklärung einzelner Ereignisse zusammen (wie in diesem Fall), sondern analog auch bei Erklärungen von Regularitäten. In einem solchen Fall werden dann genau dieselben Überlegungen angewandt auf „any volume of space-time that is similar in relevant respects", wobei

3.3

Das Erklärungsmodell von Wesley Salmon

199

die relevanten Ähnlichkeiten bestimmt werden „by the nature of the regularity we are trying to explain" (Salmon 1984: 275).44 Vereinbarkeit des kausalen und des Vereinheitlichungsmodells der Erklärung Eine weitere Eigenschaft von Salmons Erklärungsmodell, die im folgenden Abschnitt noch einmal eine Rolle spielen wird, soll hier noch erwähnt werden. In seinem Artikel „Scientific Explanation: Causation and Unification" (1990b) vertritt Salmon die These, daß sein kausales Erklärungsmodell und das Vereinheitlichungsmodell der Erklärung, wie es in Kapitel 2 dieser Arbeit beschrieben wurde, nicht unverträglich miteinander sind, sondern als komplementär betrachtet werden können. Nach Salmons Auffassung gibt es für ein zu erklärendes Phänomen oft zwei verschiedene Erklärungen, von denen die eine eine kausale und die andere eine vereinheitlichende Erklärung des betreffenden Phänomens darstellt.45 Betrachten wir zur Erläuterung dieser These eines seiner Beispiele. Wir stellen uns einen mit Helium gefüllten Luftballon vor, der an einem Sitz eines Flugzeugs befestigt ist. Wenn das Flugzeug startet, bewegt sich der Ballon nach vom und nicht, wie alle anderen frei beweglichen Gegenstände an Bord, nach hinten. Für dieses Phänomen kann nach Salmons Ansicht zum einen die folgende Erklärung gegeben werden:

44

45

Die Unterscheidung von ätiologischen und konstitutiven Erklärungen hat nach Salmons Auffassung den erfreulichen Nebeneffekt, daß funktionale Erklärungen als ätiologische Erklärungen beschrieben werden können: „[...] functional explanations constitute a subset of etiological explanations" (Salmon 1984: 269). Seine Position im Hinblick auf funktionale Erklärungen übernimmt er im wesentlichen von Larry Wright (1976), von dem auch der Ausdruck „etiological explanation" stammt. Für Salmon sind funktionale Erklärungen somit unproblematisch, da sie einen Unterfall von kausaler Erklärung darstellen: „It seems to me that Larry Wright's (1976) consequence-etiology analysis shows how functional explanations can be understood in terms of straightforward causal relations, thereby qualifying functional explanations as a legitimate subset of causal explanations." Salmon (1998c: 7; H. d. Α.). Vgl. hierzu auch Salmon (1982 und 1990b: 74 f.). Vgl. hierzu auch Salmon (1984: 259-267, 276, vorletzter Absatz, und 1998d: Abschnitt 7).

200

3

Das kausale Modell der Erklärung

First, it can be pointed out that, when the plane accelerates, the rear wall of the cabin exerts a force on the air molecules near the back, which produces a pressure gradient from rear to front. Given that the inertia of the balloon is smaller than that of the air it displaces, the balloon tends to move in the direction of less dense air. (Salmon 1990b: 73)

Bei dieser Erklärung handelt es sich um eine „straightforward causal explanation" (Salmon 1990b: 73; m. H.). Zum anderen kann die Richtung der Bewegung des Luftballons auch folgendermaßen erklärt werden: Second, one can appeal to Einstein's principle of equivalence, which says that an acceleration is physically equivalent to a gravitation field. The effect of the acceleration of the airplane is the same as that of a gravitational field. Since the helium balloon tends to rise in air in the earth's gravitational field, it will tend to move forward in the air of the cabin in the presence of the aircraft's acceleration. (Salmon 1990b: 73)

Diese Erklärung der Bewegungrichtung des Ballons „is clearly an example of a unification-type explanation, for the principle of equivalence is both fundamental and comprehensive" (Salmon 1990b: 73; m. H.). Im Anschluß an dieses Beispiel beschreibt Salmon zur Illustration seiner These ein weiteres Beispiel aus der Physik, und zusammenfassend stellt er fest, [...] that both explanations are perfectly legitimate in both cases; neither is intrinsically superior to the other. Pragmatic considerations often determine which of the two types is preferable in any particular situation. [...] The two examples are meant to show that explanations of the two different types are not antithetical but, rather, complementary. (Salmon 1990b: 74)

Das kausale Modell und das Vereinheitlichungsmodell können also nebeneinander bestehen und sich ergänzen. Eine Möglichkeit, den Unterschied zwischen den beiden Modellen bzw. die verschiedenen Aspekte des Begriffs der Erklärung, die sie jeweils beleuchten, zu verstehen, besteht in der Beschreibung der Struktur der Welt aus verschiedenen Perspektiven bzw. Richtungen. Während im Vereinheitlichungsmodell, wie wir in Kapitel 2 gesehen haben, ein globaler Erklärungs- und Verstehensbegriff spezifiziert wird, ist das kausale Erklärungsmodell (ebenso wie das in Kapitel 1 diskutierte covering lawModell der Erklärung) eher lokal ausgerichtet (vgl. Salmon 1990b:

3.3

Das Erklärungsmodell von Wesley Salmon

201

72). Für Salmon besteht eine Erklärung eines Phämomens in der Beschreibung des Phänomens selbst (konstituiver Aspekt) bzw. in der Angabe seiner kausalen Geschichte (ätiologischer Aspekt). Die unmittelbare und nähere lokale Umgebung des zu erklärenden Phänomens spielen dabei eine ausgezeichnete Rolle. Erklärungen im Vereinheitlichungsmodell sind demgegenüber global ausgerichtet. Das Verstehen, das sie vermitteln involves a general worldview - a Weltanschauung. To understand the phenomena in the world requires that they be fitted into the general worldpicture. [...] The conception of understanding in terms of fitting phenomena into a comprehensive scientific world-picture is obviously connected closely with the unification conception of scientific explanation. (Salmon 1990b: 76 f.; H. d. A.) Derselbe Kontrast kann mit Hilfe von zwei verwandten Begriffen beschrieben werden. Im Vereinheitlichungsmodell wird die Welt topdown erklärt - also ,νοη oben nach unten' - , während im kausalen Erklärungsmodell, ebenso wie im covering /aw-Modell, am anderen Ende begonnen und eine sog. froifom-wp-Erklärung vorgebracht wird: The Hempelian approach illustrates the bottom-up way. We begin by explaining the conductivity of a penny by appeal to the generalization that copper is a conductor. We can explain why copper is a conductor in terms of the fact that it is a metal. We can explain why metals are conductors in terms of the behavior of their electrons. And so it goes from the particular fact to the more general laws until we finally reach the most comprehensive available theory. The causal/mechanical approach has the same sort of bottom-up quality. (Salmon 1990b: 72; m. H.)46 Im folgenden Abschnitt komme ich nun zu den Einwänden gegen Salmons kausales Erklärungsmodell und zu der Frage, ob sich sein Modell als Basis für den Schluß auf die beste Erklärung eignet.

46

Zur Unterscheidung von bottom-up- und top-down-kns&ztn in der Erklärungstheorie vgl. Kitcher (1985a). Salmon versucht, die erwähnten Begriffe darüber hinaus anzubinden an Railtons (1981) Begriff des .ideal explanatory text', der gewissermaßen die gesamte Information über ein zu erklärendes Phänomen enthält: „To invoke Railton's terminology and Kitcher's metaphor, we can think in terms of reading the ideal explanatory text either from the bottom-up or from the top-down." (Salmon: 1990b: 77).

202

3

Das kausale Modell der Erklärung

3.3.5 Einwände gegen Salmons Erklärungsmodell und dessen Eignung als Basis für den Schluß auf die beste Erklärung Die in diesem Abschnitt zu diskutierenden Einwände gegen Wesley Salmons kausales Erklärungsmodell sind in weiten Teilen analog zu den Einwänden, die im vorigen Abschnitt gegen das Erklärungsmodell von David Lewis vorgebracht wurden. Der erste dieser Einwände betrifft eine erhebliche Einschränkung des Anwendungsbereichs von Salmons Modell, die hier in einem noch größeren Maße vorliegt als bei Lewis. Der zweite Einwand besteht wie bei Lewis darin, daß Salmons Modell allenfalls eine notwendige, nicht aber eine hinreichende Bedingung für den Begriff der Erklärung formuliert. Der dritte Einwand schließlich betrifft die Kriterien zur Beurteilung der Güte einer Erklärung - anders als Lewis spezifiziert Salmon Uberhaupt keine solchen Kriterien. Alle diese Einwände haben wie zuvor unmittelbare Auswirkungen auf die Eignung von Salmons Erklärungsmodell für die Zwecke des Schlusses auf die beste Erklärung; diese werden im Anschluß an den jeweiligen Einwand diskutiert. Eingeschränkter

Anwendungsbereich

Bei der Diskussion von David Lewis' kausalem Erklärungsmodell im letzten Abschnitt hatte ich bereits darauf hingewiesen, daß kausale Modelle der Erklärung in ihren möglichen Anwendungen auf Bereiche eingeschränkt sind, in denen Kausalität eine Rolle spielt. Deswegen sind sie insbesondere nicht geeignet für die Erklärung von Phänomenen beispielsweise in der Mathematik, der formalen Linguistik oder der Philosophie. Bei Salmons Erklärungsmodell tritt dieser Aspekt aufgrund seines Kausalitätsmodells in verschärfter Form zutage. Wie wir in Abschnitt 3.3.3 gesehen haben, argumentiert Carrier (1998), daß Salmons Kausalitätsmodell der Erhaltungsgrößen kausale Prozesse und Wechselwirkungen an die grundlegenden Gesetze der Physik bindet, in denen Erhaltungsgrößen beschrieben werden (denn kausale Prozesse und Wechselwirkungen sind ja in Salmons Kausalitätsmodell durch die Übertragung bzw. den Austausch von Erhaltungsgrößen bestimmt). Da eine Erklärung eines Phänomens in Salmons Sinne unter Rekurs auf kausale Prozesse und Wechselwirkungen erfolgen muß, bedeutet dies, daß im Rahmen seines Erklärungsmodells nur physikalistische Erklärungen vorgebracht werden können, die die Übertra-

3.3 Das Erklärungsmodell von Wesley Salmon

203

gung oder den Austausch von Erhaltungsgrößen betreffen. Erklärungen von Phänomenen beispielsweise in der Chemie, der Biologie, der Psychologie oder der Soziologie sind somit im Rahmen von Salmons Erklärungsmodell nur möglich, wenn die betreffenden Wissenschaften auf die Physik reduziert und die jeweiligen Phänomene unter Rekurs auf Erhaltungsgrößen beschrieben werden können. Eine solche physikalistische Reduktion der betreffenden Wissenschaften ist aber bisher nicht gelungen, und auch die zukünftigen Chancen eines solchen Projektes dürften eher schlecht stehen. Erklärungen von Phänomenen in den genannten und anderen Wissenschaften sind also derzeit im Rahmen von Salmons Modell nicht möglich und dürften dies auch in Zukunft nicht sein.47 Diese starke Einschränkung des Anwendungsbereichs von Salmons Modell hat direkte Konsequenzen für dessen Eignung als Basis für den Schluß auf die beste Erklärung. Selbstverständlich kann man nur dann einen Schluß auf die beste Erklärung ziehen, wenn überhaupt eine Erklärung zur Verfügung steht (die noch dazu die beste sein muß). Innerhalb von Wissenschaften wie der Chemie, der Biologie, der Psychologie oder der Soziologie können aber keine Erklärungen von Phänomenen im Rahmen von Salmons kausalem Modell gegeben werden. Dies bedeutet aber, daß unter Zugrundelegung von Salmons Erklärungsmodell nicht nur keine Schlüsse auf die beste Erklärung in Bereichen gezogen werden können, in denen Kausalität keine Rolle spielt, sondern daß auch in Bereichen, in denen kausale Aspekte ganz offensichtlich von Bedeutung sind, keine solchen Schlüsse möglich sind.48 Bei diesem Einwand handelt es sich natürlich zunächst nur um den Hinweis auf die Unmöglichkeit der Nutzung von Salmons Modell für die Zwecke des Schlusses auf die beste Erklärung in den genannten 47

48

Lewis' Modell ist in diesem Punkt wesentlich liberaler, da für das Vorliegen von Kausalität lediglich die Wahrheit entsprechender Kontrafakte gegeben sein muß; und solche Kontrafakte lassen sich auch in den oben genannten Wissenschaften formulieren. Einige Autoren argumentieren darüber hinaus, daß Salmons Modell auch in der Allgemeinen Relativitätstheorie und der Quantenmechanik nicht angewendet werden kann; vgl. hierzu Hitchcock (1995: 309), der auf Kitcher (1989) und Woodward (1989) hinweist, und van Fraassen (1980: 122). Wenn dies zutrifft, sind auch in diesen Bereichen keine Schlüsse auf die beste Erklärung auf der Basis von Salmons Erklärungsmodell möglich.

204

3 Das kausale Modell der Erklärung

Bereichen. Befürworter des Schlusses auf die beste Erklärung könnten hierauf entgegnen, daß es bereits ein Erfolg wäre, wenn Salmons Modell in denjenigen Bereichen, in denen es anwendbar ist, eine geeignete Basis für Anwendungen des Schlusses auf die beste Erklärung darstellen würde, und daß man für andere Bereiche wie die Chemie, die Biologie usw. eben andere Erklärungsmodelle entwickeln muß. Diese Erwiderung ist, wie die entsprechende im Falle von Lewis' Modell, berechtigt. Allerdings werden die im folgenden zu diskutierenden Einwände zeigen, daß Salmons Modell, genauso wie dasjenige von Lewis, auch in den Bereichen unangemessen ist, in denen es angewendet werden kann, und generell nicht als Basis für den Schluß auf die beste Erklärung in Frage kommt. Keine hinreichende Bedingung für den Begriff der explanatorischen Relevanz In seinem Artikel „Discussion: Salmon on Explanatory Relevance" (1995) argumentiert Christopher Hitchcock, daß Salmons kausales Erklärungsmodell keine befriedigende Explikation des Begriffs der explanatorischen Relevanz darstellt. Durch Salmons Forderung nach der Lokalisierung des Explanandums in der kausalen Struktur der Welt (unter Rekurs auf kausale Prozesse und Wechselwirkungen) wird nach Hitchcocks Auffassung allenfalls eine notwendige, nicht aber eine hinreichende Bedingung für das Vorliegen von explanatorischer Relevanz spezifiziert. Dies gilt dabei sowohl für diejenige Variante von Salmons Erklärungsmodell, die auf sein ursprüngliches Kausalitätsmodell zurückgreift, als auch für die beiden Varianten, die sich auf das Modell der Erhaltungsgrößen bzw. das Modell der invarianten Größen stützen. Betrachten wir zur Erläuterung von Hitchcocks These eine der vermeintlichen Erklärungen, die Salmon als Gegenbeispiel zum covering Zaw-Modell anführte: Das Sichauflösen einer Salzprobe in Wasser wird erklärt unter Berufung auf das Gesetz, daß sich alle verhexten Salzproben in Wasser auflösen, und den Umstand, daß die betreffende Salzprobe verhext wurde. Hitchcock argumentiert nun, daß diese vermeintliche Erklärung in gleichem Maße ein Gegenbeispiel zu Salmons eigenem Erklärungsmodell darstellt:

3.3

Das Erklärungsmodell

von Wesley Salmon

205

If in the process of hexing the salt, the (person dressed up as a) witch never initiated a causal process that interacted with the salt, then it would seem that Salmon's theory would give us grounds for rejecting the hex as explanatorily irrelevant. Let us suppose, however, that during the casting of her spell, our would-be sorceress touched the salt with a wand. This is a genuine causal interaction, so what would justify our rejection of it as [explanatorily] irrelevant? (Hitchcock 1995: 309; H. d. A.)

Hitchcocks Punkt ist hier, daß das Schwingen des Zauberstabs einen kausalen Prozeß und die Berührung der Salzprobe mit dem Zauberstab eine kausale Wechselwirkung darstellen. Dieser Prozeß und diese Wechselwirkung gehören zur kausalen Geschichte der Salzprobe und zum vergangenen Lichtkegel des Auflösens-Ereignisses dieser Probe.49 Wenn nun die kausale Erklärung eines Ereignisses - wie Salmon behauptet - in der Lokalisierung des Ereignisses in der kausalen Struktur der Welt besteht, dann sollte man bei der Erklärung des Auflösens der Probe auf den kausalen Prozeß des Schwingens des Zauberstabs und auf die kausale Wechselwirkung zwischen dem Zauberstab und der Probe zurückgreifen können. Offensichtlich kann man dies aber nicht, denn dieser kausale Prozeß und diese kausale Wechselwirkung sind explanatorisch irrelevant. Dies zeigt, daß nicht jede Information über die kausale Geschichte eines Explanandum-Ereignisses für dieses Ereignis explanatorisch relevant ist. Nicht jede Art der Lokalisierung des Explanandum-Ereignisses im kausalen Nexus stellt eine Erklärung (oder auch nur einen Beitrag zu einer Erklärung) des betreffenden Ereignisses dar. Salmon versäumt es, in seinem Modell diejenigen kausalen Faktoren, die explanatorisch relevant sind, von denjenigen zu unterscheiden, für die dies nicht gilt. Sein Modell spezifiziert damit allenfalls eine notwendige, nicht aber eine hinreichende Bedingung für den Erklärungsbegriff bzw. für den Begriff der explanatorischen Relevanz. Hitchcocks Einschätzung von Salmons kausalem Erklärungsmodell lautet dementsprechend: The concepts of causal process and interaction are physically legitimate and philosophically interesting regardless of whether either of Salmon's 49

Wir können darüber hinaus annehmen, daß die Berührung der Probe mit dem Zauberstab zu einer Markierung der Probe führte bzw. den Austausch einer Erhaltungsgröße mit sich brachte - vielleicht war der Zauberstab frisch gestrichen und färbte die Probe rot, vielleicht war er sehr heiß und erwärmte die Probe.

206

3

Das kausale Modell der Erklärung

theories [of causality] provides a definitive characterization of them. But these concepts do not provide the resources to explicate the notion of explanatory relevance that Hempel's models failed to capture. (Hitchcock 1995: 316; m. H.)

Hitchcock (1995: Abschnitt 6) merkt jedoch an, daß Salmon sein kausales Erklärungsmodell mit seinem früheren Statistischen Relevanzmodell verbinden könnte, um diesem Einwand zu entgehen. Er weist allerdings auch daraufhin, daß dies nicht Salmons Position in (1984) entsprechen dürfte. Darüber hinaus würde diese Kombination nach Hitchcocks Ansicht weitere explikative Arbeit erfordern.50 Die beschriebene Kritik Hitchcocks hat natürlich direkte Auswirkungen auf die Eignung von Salmons kausalem Erklärungsmodell als Basis für den Schluß auf die beste Erklärung. Das Problem besteht darin, daß Salmons Modell Schlüsse auf die beste Erklärung erlaubt, bei denen dasjenige, worauf geschlossen wird, überhaupt keine Erklärung darstellt (geschweige denn die beste). Die Menge der Erklärungen in Salmons Modell ist wie bei Lewis zu umfangreich, sie enthält Elemente, bei denen es sich tatsächlich nicht um Erklärungen handelt. Deshalb besteht die Gefahr, daß bei einem Schluß auf die beste Erklärung auf eines dieser ungeeigneten Elemente geschlossen wird. Es ist natürlich nicht auszuschließen, daß es sich bei einem solchen Element um eine wahre Hypothese handelt - so daß Schlüsse auf die beste Erklärung unter Zugrundelegung von Salmons Modell nicht zwangsläufig zu einer falschen Konklusion führen müssen. Es spricht allerdings 50

Vgl. hierzu auch meine Bemerkungen zur SR-Basis in der Einleitung zu diesem Abschnitt. Salmon räumt zum einen Hitchcocks Kritik an seinem Erklärungsmodell ein: „As Hitchcock points out, my earliest criticisms of Hempel's 'covering law' models of explanation focused on their failure to capture the relation of explanatory relevance [...]. [...] Now, ironically, Hitchcock levels the same charge against my causal theory of explanation, whether formulated in terms of the mark criterion or in terms of the conserved quantity theory. The argument is, roughly, that this theory does not give an adequate basis for determining which properties possessed by causal processes and interactions are pertinent [explanatorily relevant] to a given outcome and which are not. [...] as 1 acknowledged above, the criticism is sound." (Salmon 1997: 474; m. H.). Zum anderen greift Salmon (1997: 475 f.) Hitchcocks Bemerkung auf und tendiert in Richtung einer Anreicherung seines kausalen Modells durch statistische Komponenten. Seine Bemerkungen hierzu sind allerdings knapp gehalten und gereichen nicht zu einer Charakterisierung eines neuen Erklärungsmodells.

3.3

Das Erklärungsmodell

von Wesley Salmon

207

für Befürworter des Schlusses auf die beste Erklärung auch nichts dafür, daß es sich bei einem solchen Element um eine wahre (oder zumindest wahrscheinliche) Hypothese handelt. Denn nach Ansicht der Befürworter dieses Schlußmusters fuhren Schlüsse auf die beste Erklärung ja deswegen wahrscheinlich zu einer wahren Konklusion, weil es sich bei dieser Konklusion tatsächlich um die beste Erklärung des jeweiligen Phänomens handelt - und diese Voraussetzung ist in Salmons Modell gerade nicht erfüllt, da es sich bei der betreffenden Konklusion nicht einmal um eine Erklärung handeln muß. Daher können Befürworter des Schlusses auf die beste Erklärung, wenn sie Salmons kausales Erklärungsmodell verwenden, nicht behaupten, ihre Schlüsse führten wahrscheinlich zu einer wahren Konklusion. Unter anderem aus diesem Grund ist Salmons Modell für die Zwecke des Schlusses auf die beste Erklärung ungeeignet. Kriterien zur Beurteilung der Güte einer Erklärung Ein weiterer Einwand gegen Salmons Erklärungsmodell betrifft wie erwähnt die Frage, wonach verschiedene, miteinander konkurrierende Erklärungen in Salmons Modell beurteilt werden sollen. Zu dieser Frage hat Salmon erstaunlich wenig zu sagen. In der großen Zahl von Artikeln und Büchern, die Salmon zum Thema der Erklärung veröffentlicht hat, findet sich praktisch keine Diskussion, geschweige denn eine ausgearbeitete Konzeption von Kriterien zur Beurteilung der Güte einer Erklärung. Dieser Umstand stellt natürlich einen weiteren entscheidenden Nachteil von Salmons Modell im Hinblick auf den Schluß auf die beste Erklärung dar. Denn um einen Schluß auf die beste Erklärung ziehen zu können, muß man offensichtlich in der Lage sein, die verschiedenen möglichen Erklärungen eines Phänomens miteinander zu vergleichen und im Hinblick auf die Frage zu beurteilen, wie gut sie das jeweilige Phänomen erklären - ansonsten kann man selbstverständlich keinen Schluß auf die beste Erklärung ziehen, da man nicht weiß, welche Erklärung die beste Erklärung darstellt. Aus dem Umstand, daß Salmon auf diese Frage selbst keine Antwort bereitstellt, folgt natürlich nicht, daß es unmöglich ist, eine solche Antwort zu geben. Möglicherweise kann man Salmons Modell ja um eine Komponente ergänzen, die Kriterien zur Beurteilung der Güte einer Erklärung enthält und insbesondere die Auszeichnung der besten Erklärung eines Explanandum-Phänomens ermöglicht. Im folgenden

208

3

Das kausale ModeU der Erklärung

werde ich genau dies versuchen, indem ich drei naheliegende Möglichkeiten diskutiere, die explanatorische Kraft einer Erklärung einzuschätzen. Es wird sich allerdings zeigen, daß keine dieser Möglichkeiten für die Zwecke des Schlusses auf die beste Erklärung geeignet ist. Ein erstes Kriterium, das sich unmittelbar aufdrängt und bereits an früherer Stelle mehrfach zur Sprache kam, ist das folgende: Eine kausale Erklärung im Sinne von Salmons Modell ist um so besser, je wahrscheinlicher sie ist. Ist es wahrscheinlicher, daß Erklärung Ei und nicht Erklärung E 2 die korrekten kausalen Prozesse und Wechselwirkungen beschreibt, so ist Ei eine bessere Erklärung der betreffenden Phänomene als E2. Wie ich bereits an den entsprechenden Stellen angemerkt habe, ist dieses Kriterium völlig ungeeignet. Zwar würden Erklärungen, die nach diesem Kriterium besonders gut sind, offensichtlich eine hohe Wahrscheinlichkeit haben; und insbesondere würde die nach diesem Kriterium beste Erklärung eine große Chance haben, wahr zu sein - so daß man sagen könnte, unter diesem Kriterium führte der Schluß auf die beste Erklärung wahrscheinlich von wahren Prämissen zu einer wahren Konklusion. Aber der Schluß auf die beste Erklärung wäre in diesem Fall ein erkenntnistheoretisches Instrument, das seinen Zweck nicht erfüllen könnte und völlig überflüssig wäre. Der Schluß auf die beste Erklärung soll es uns ja gerade ermöglichen, zwischen verschiedenen, miteinander konkurrierenden Hypothesen von denen wir nicht wissen, welche von ihnen die wahrscheinlichste ist - auszuwählen. Er soll es uns erlauben, auf die wahrscheinlichste der miteinander konkurrierenden Hypothesen zu schließen, indem wir diese im Hinblick auf ihre explanatorische Güte miteinander vergleichen. Wenn das Kriterium zur Beurteilung dieser explanatorischen Güte aber wiederum in einer Wahrscheinlichkeitseinschätzung besteht, sind wir keinen Schritt weiter gekommen. In diesem Fall können wir auf den Schluß auf die beste Erklärung ganz verzichten und schlicht auf die wahrscheinlichste aller Hypothesen schließen. Dieses erste Kriterium scheitert also. Ein zweites Kriterium zur Beurteilung der Güte einer Erklärung läßt sich folgendendermaßen umschreiben: Eine kausale Erklärung im Sinne von Salmons Modell ist um so besser, je detaillierter sie ist, d. h., je genauer sie die kausalen Prozesse und Wechselwirkungen beschreibt, die im vergangenen Lichtkegel des Explanandum-Ereignisses liegen (ätiologischer Aspekt) bzw. die das Explanandum-Ereignis

3.3

Das Erklärungsmodell

von Wesley Salmon

209

ausmachen (konstitutiver Aspekt). Dieses Kriterium kann zum einen eine gewisse intuitive Plausibilität für sich verbuchen. Zum anderen deutet Salmon selbst etwas in dieser Art an einigen Stellen an. So schreibt er beispielsweise im Hinblick auf die SR-Basis (vgl. Unterabschnitt 3.3.1): According to the S-R approach [...] the statistical basis of scientific explanation consists, not in an argument, but in an assemblage of relevant considerations. High probability is not the desideratum; rather the amount of relevant information is what counts. [...] The goodness, or epistemic value, of such an explanation is measured [...] by the gain in information provided by the probability distribution [...]. (Salmon 1984: 88 f.; m. H.) 51

Diese Textstelle bezieht sich zwar nur auf die SR-Basis und ist somit streng genommen nicht anwendbar auf Salmons kausales Erklärungsmodell. Aber ein Transfer auf dieses Modell scheint durchaus möglich und sinnvoll. Man könnte in diesem Sinne sagen, daß eine kausale Erklärung im Sinne von Salmons Modell um so besser ist, je genauer sie ätiologisch die kausalen Prozesse beschreibt, die zu einem erklärenden Ereignis hin laufen, je genauer sie konstitutiv die kausalen Wechselwirkungen beschreibt, die zwischen kausalen Prozessen stattfinden, wenn diese sich raumzeitlich überschneiden, und je genauer sie konstitutiv das Explanandum-Ereignis selbst beschreibt. Natürlich müßte man noch jeweils ein Maß für die Genauigkeit einer Beschreibung unter jedem der drei genannten Aspekte angeben und eine Regel spezifizieren, die die jeweils erreichte Qualität einer Erklärung im Hinblick auf die drei genannten Aspekte gegeneinander abwägt. Aber wir wollen annehmen, diese (keineswegs leichte Aufgabe) ließe sich bewerkstelligen. Dieses Kriterium erinnert an eines der Kriterien, das David Lewis zur Beurteilung der Güte einer Erklärung in seinem Modell angibt und das am Ende des vorigen Abschnitts diskutiert wurde. Wie gesehen hält Lewis eine Erklärung E! unter anderem dann für besser als eine Erklärung E2, wenn erstere mehr Information über die kausale Geschichte des Explanandum-Ereignisses liefert. Bei der Kritik von Lewis' Erklärungsmodell in Abschnitt 3.2.5 hatte ich argumentiert, daß dieses Kriterium für die Zwecke des Schlusses auf die beste Erklärung 51

Vgl. hierzu auch Salmon (1984: 38, 41) und den Hinweis in Salmon (1984: 89, Fußnote 3) auf Salmon (1971).

210

3

Das kausale Modell der Erklärung

nicht geeignet ist. Bei einem Schluß auf die beste Erklärung wird diejenige Hypothese, die als die beste Erklärung der jeweiligen Phänomene angesehen wird, aus genau diesem Grund für am wahrscheinlichsten gehalten. Das hier beschriebene Kriterium liefert aber überhaupt keinen Grund für eine solche Annahme. Warum sollte eine Erklärung deswegen besonders wahrscheinlich sein, weil sie besonders detailliert ausgearbeitet ist und sehr präzise eine gewisse kausale Geschichte erzählt? Kausale Wechselwirkungen und Prozesse können noch so genau und ausführlich beschrieben werden - wenn diese Beschreibung nicht die wirklichen Prozesse und Wechselwirkungen enthält, die tatsächlich stattgefunden und das Explanandum-Phänomen verursacht haben, dann handelt es sich bei ihr überhaupt nicht um eine Erklärung der fraglichen Phänomene, geschweige denn um die beste. Es spricht nichts dafür, daß Schlüsse auf die beste Erklärung eher zu einer wahren Konklusion führen, wenn es sich um Schlüsse auf eine besonders detaillierte Erklärung handelt, als wenn sie Schlüsse auf eine weniger detaillierte Erklärung darstellen. Dieses zweite Kriterium zur Beurteilung der Güte einer Erklärung scheitert also trotz seiner anfänglichen Plausibilität ebenfalls. Es kommt nun noch ein drittes Kriterium in Betracht. Wie am Ende des vorigen Unterabschnitts erwähnt, vertritt Salmon in seinem Artikel „Scientific Explanation: Causation and Unification" (1990b) die These, daß das Vereinheitlichungsmodell und das kausale Modell der Erklärung nicht unverträglich miteinander sind, sondern als komplementär betrachtet werden können. Am Ende dieses Artikels erwägt er darüber hinaus die Möglichkeit, daß die Suche nach einer umfassenden Theorie der Erklärung aufgegeben werden muß, daß statt dessen viele verschiedene Eigenschaften wissenschaftlicher Hypothesen als explanatorisch relevant angesehen werden müssen und daß die jeweiligen Hypothesen im Hinblick auf diese verschiedenen Eigenschaften zu beurteilen sind: [...] perhaps it is futile to try to explicate the concept of scientific explanation in a comprehensive manner. It might be better to list various explanatory virtues that scientific theories might possess, and to evaluate scientific theories in terms of them. [...] I have been discussing two virtues, one in terms of unification, the other in terms of exposing underlying mechanisms. (Salmon 1990b: 78)

3.3

Das Erklärungsmodell

von Wesley Salmon

211

Diese Textstelle läßt die Interpretation zu, daß ein Kriterium zur Beurteilung der Güte einer kausalen Erklärung in Salmons Sinne darin bestehen könnte, wie vereinheitlichend diese wirkt: Eine kausale Erklärung ist um so besser, je vereinheitlichender sie ist, und die beste kausale Erklärung eines Phänomens ist diejenige Erklärung, die das größte Maß an Vereinheitlichung herbeiführt. Man könnte dementsprechend versuchen, Salmons kausales Erklärungsmodell um dieses Kriterium zur Beurteilung der Güte einer Erklärung zu erweitern. Dieser Versuch erscheint mir allerdings ebenfalls nicht besonders erfolgversprechend: Erstens ist unklar, nach welchem Vereinheitlichungsbegriff die Beurteilung der verschiedenen kausalen Erklärungen zu erfolgen hätte. Zweitens habe ich in Kapitel 2 dafür argumentiert, daß die einschlägigen Vereinheitlichungsmodelle der Erklärung mit erheblichen Schwierigkeiten zu kämpfen haben. Und drittens habe ich dort versucht zu zeigen, daß nichts für die Annahme spricht, daß besonders vereinheitlichende Erklärungen eine besonders große Chance haben, wahr zu sein. Daher scheitert nach meiner Auffassung auch dieses dritte und letzte Kriterium zur Beurteilung der Güte einer kausalen Erklärung. Das Resultat dieser Diskussion ist also das folgende: Weder charakterisiert Salmon selbst in seinen Veröffentlichungen ein Kriterium, das die Beurteilung der Güte einer Erklärung und die Auszeichnung einer besten Erklärung erlauben würde; noch scheint es möglich, Salmons Modell sinnvoll um ein solches Kriterium zu ergänzen. Aus diesem und den bereits genannten anderen Gründen ist Wesley Salmons kausales Erklärungsmodell nach meiner Auffassung genauso wenig als Basis für den Schluß auf die beste Erklärung geeignet wie das im vorigen Abschnitt diskutierte Erklärungsmodell von David Lewis.

Kapitel 4 Argumente für und gegen den Schluß auf die beste Erklärung 4.1

Einleitung

In den ersten drei Kapiteln dieser Arbeit habe ich mich mit Einwänden gegen den Schluß auf die beste Erklärung beschäftigt, die sich im Zusammenhang mit den dort untersuchten Erklärungsmodellen ergeben. Ich habe in diesen Kapiteln dafür argumentiert, daß die prominentesten der in der Literatur diskutierten Erklärungsmodelle - das covering /aw-Modell, das Vereinheitlichungsmodell und das kausale Modell der Erklärung - sich nicht als Basis für den Schluß auf die beste Erklärung eignen. Die drei untersuchten Modelle haben zum einen bereits unabhängig von einer möglichen Verwendung als Basis für den Schluß auf die beste Erklärung mit erheblichen Schwierigkeiten zu kämpfen. Diese (je verschiedenen) Schwierigkeiten lassen es zweifelhaft erscheinen, daß eines der Modelle eine adäquate Explikation des Erklärungsbegriffs darstellt. Zum anderen haben wir gesehen, daß im Hinblick auf den Schluß auf die beste Erklärung in diesen Modellen insbesondere das Problem einer angemessenen Spezifizierung eines komparativen Erklärungsbegriffes (in je verschiedener Weise) auftritt. In keinem der Modelle kann die explanatorische Güte einer Erklärung in einer Art und Weise bestimmt werden, die mit den Erfordernissen des Schlusses auf die beste Erklärung in Einklang steht. Verschiedene, konkurrierende Erklärungen können nicht befriedigend im Hinblick auf die Frage miteinander verglichen werden, wie gut sie ein gegebenes Explanandum-Phänomen erklären - so daß die Auswahl der besten Erklärung des betreffenden Phänomens für die Zwecke des Schlusses auf die beste Erklärung unmöglich ist. Aus der Diskussion der untersuchten Erklärungsmodelle in den Kapiteln 1 bis 3 ergibt sich also vereinfacht ausgedrückt der folgende

214

4

Argumente für und gegen den Schluß auf die beste Erklärung

Einwand gegen den Schluß auf die beste Erklärung: Dieses Schlußmuster ist nutzlos - denn wir wissen überhaupt nicht, worauf wir bei einem Schluß auf die beste Erklärung schließen sollen. Wir haben kein Erklärungsmodell, das uns zum einen sagen würde, was eine Erklärung und was keine Erklärung eines Explanandum-Phänomens darstellt, und das uns zum anderen die Beantwortung der Frage erlauben würde, welche von verschiedenen, miteinander konkurrierenden Erklärungen die beste Erklärung des betreffenden Phänomens ist. Die Kritik an den diskutierten Erklärungsmodellen zeigt natürlich weder, daß es unmöglich ist, diese Modelle so zu verbessern, daß sie als Basis für den Schluß auf die beste Erklärung dienen können; noch zeigt sie, daß es unmöglich ist, andere Erklärungsmodelle zu entwikkeln, die diese Funktion erfüllen. Sie zeigt allerdings, daß jetzt die Befürworter des Schlusses auf die beste Erklärung am Zuge sind. Die anfängliche Plausibilität dieses Schlußmusters hat einer Untersuchung seiner Grundlagen nicht standgehalten. Wenn Befürworter des Schlusses auf die beste Erklärung weiterhin auf dieses Schlußmuster zurückgreifen und es bei ihren Argumentationen verwenden wollen, müssen sie ein Erklärungsmodell entwickeln, das sie ihren Schlüssen zugrunde legen und das die Auszeichnung der besten Erklärung eines Phänomens ermöglicht. Die unerfreuliche Lage des Schlusses auf die beste Erklärung, die sich durch die Ergebnisse der Kapitel 1 bis 3 dieser Arbeit ergibt, wird durch die Diskussion in diesem Kapitel noch weiter verschlechtert. Hier werde ich nun Einwände gegen den Schluß auf die beste Erklärung diskutieren, die - im Gegensatz zu den Argumenten der Kapitel 1 bis 3 - weitgehend unabhängig von einem spezifischen Erklärungsmodell sind, das bei einem Schluß auf die beste Erklärung vorausgesetzt werden müßte. Diese Einwände treffen also der Absicht nach jeden Schluß auf die beste Erklärung - unabhängig davon, nach welchem Erklärungsmodell diejenige Hypothese, auf deren Wahrheit geschlossen wird, als die beste Erklärung des betreffenden ExplanadumPhänomens gilt. Die zu diskutierenden Argumente stellen dabei insofern Einwände gegen den Schluß auf die beste Erklärung dar, als sie die bereits in der Einleitung zu dieser Arbeit genannte Verläßlichkeitsthese angreifen:

4.2 Argumente ßr den Schluß auf die beste Erklärung (0.1)

215

Die Verläßlichkeitsthese Der Schluß auf die beste Erklärung ist ein verläßlicher Schluß: Er führt von wahren Prämissen wahrscheinlich zu einer wahren Konklusion.

Diese These kann man, wie jede These, prinzipiell auf zwei verschiedene Arten angreifen. Man kann zum einen zeigen, daß Anhänger der These keine überzeugenden Gründe ßr sie vorbringen können und daß daher nichts dafür spricht, daß die These wahr ist. Zum anderen kann man selbst Argumente entwickeln, die sich gegen die These richten und somit dafür sprechen, daß diese falsch ist. Ich beginne im folgenden Abschnitt 4.2 mit Angriffen des ersten Typs, indem ich Argumente von Anhängern der Verläßlichkeitsthese untersuche und zeige, daß diese nicht überzeugend sind. In Abschnitt 4.3 wende ich mich dann Argumenten zu, die zu zeigen beanspruchen, daß die Verläßlichkeitsthese falsch ist.

4.2

Argumente für den Schluß auf die beste Erklärung 4.2.1

Verteilung der Beweislast

Der grundlegendste Einwand gegen die Verläßlichkeitsthese besteht in dem einfachen Hinweis darauf, daß in ihr ein Zusammenhang behauptet wird, der keineswegs selbstverständlich ist und der erst eines Nachweises bedarf - der Zusammenhang nämlich zwischen dem Umstand, daß eine gegebene Hypothese die beste Erklärung eines Phänomens darstellt, und der Wahrheit dieser Hypothese. Warum sollte gerade die beste Erklärung eines gegebenen Phänomens wahrscheinlich wahr sein? Warum sollte nicht vielmehr die schlechteste Erklärung eines Phänomens wahrscheinlich wahr sein? Oder warum sollte nicht in manchen Fällen eine mittelmäßige Erklärung, in anderen die schlechteste und gelegentlich auch einmal die beste Erklärung eines Phänomens wahr sein? Diese Möglichkeiten sind denkbar, und das bedeutet, daß die Behauptung eines Zusammenhangs zwischen der Güte einer Erklärung und ihrer Wahrheit einer Begründung bedarf. In diesem Sinne zeigt der Einwand, daß die Beweislast auf der Seite der Befürworter des Schlusses auf die beste Erklärung liegt, und er mahnt

216

^

Argumente für und gegen den Schluß auf die beste Erklärung

somit die Lieferang von Gründen für die Verläßlichkeitsthese an. Solange solche Gründe nicht vorgebracht werden, steht die These auf demselben Niveau wie beliebige andere Hypothesen - etwa die Hypothese, nach der wahrscheinlich die schlechteste Erklärung eines Phänomens wahr ist. Es ist bezeichnend für die Diskussion um den Schluß auf die beste Erklärung, daß Gründe für die Verläßlichkeitsthese schwer zu finden sind. Zwar gibt es eine ganze Reihe von skeptischen Argumenten gegen den Schluß auf die beste Erklärung und die Verläßlichkeitsthese, aber fast keine Argumente ßr sie. Wie bereits in der Einleitung zu dieser Arbeit erwähnt, scheinen Befürworter des Schlusses auf die beste Erklärung eher von der Selbstverständlichkeit des Zusammenhangs zwischen der explanatorischen Güte einer Hypothese und ihrer Wahrheit auszugehen und zu glauben, diese Annahme bedürfe gar keiner Begründung. Gern beruft man sich bei einer Verteidigung des Schlusses auf die beste Erklärung auch auf dessen vermeintliche Rationalität. So schreibt der in der Einleitung bereits erwähnte David Armstrong: If making such an inference is not rational, what is? [...] To infer to the best explanation is part of what it is to be rational. If that is not rational, what is? (Armstrong 1983: 53, 59)

Die Güte solcher Verteidigungen hängt natürlich davon ab, was unter „rational" verstanden werden soll. Manchmal hat es den Anschein, als würden Autoren, die auf die vermeintliche Rationalität des Schlusses auf die beste Erklärung hinweisen, einräumen, daß es, erstens, in der Tat keine epistemischen Argumente fiir den Schluß auf die beste Erklärung bzw. die Verläßlichkeitsthese gibt - genauso wenig wie für andere induktive Schlußmuster; daß wir aber, zweitens, um weiterleben und -arbeiten zu können, dennoch irgendeines oder mehrere dieser Schlußmuster verwenden müssen; und daß es daher, drittens, aus pragmatischen Gründen rational ist, solche Schlußmuster anzuwenden. Diese drei Punkte kann man zugeben - hieraus folgt aber nicht, daß wir gute Gründe haben anzunehmen, die Verläßlichkeitsthese sei wahr und Schlüsse auf die beste Erklärung führten mithin von wahren Prämissen wahrscheinlich zu einer wahren Konklusion. Im Gegenteil wird bei dieser Argumentation eingeräumt, daß wir über solche Gründe gerade nicht verfügen.

4.2

A rgumente für den Schluß auf die beste Erklärung

217

Manchmal wird allerdings bei der Berufung auf den Ausdruck „rational" auch suggeriert, der Schluß auf die beste Erklärung sei (wie andere induktive Schlußmuster) genau dann rational, wenn er von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Bei diesem Verständnis von „rational" ist die Beweiskraft der oben wiedergegeben Textstelle aber offensichtlich sehr gering. Es reicht in diesem Fall nicht aus, die Rationalität des Schlusses auf die beste Erklärung lediglich zu behaupten, indem man darauf hinweist, daß wir den Schluß auf die beste Erklärung ständig benutzen und auch gar keine andere Wahl haben - vielmehr muß man für die so verstandene Rationalität des Schlusses auf die beste Erklärung argumentieren, indem man tatsächliche Gründe für seine Verläßlichkeit vorbringt.1 In den folgenden beiden Unterabschnitten werde ich nun auf zwei Versuche eingehen, solche Gründe zu liefern.

4.2.2

Die Idee vom gewachsenen Zusammenhang

Eines der wenigen Argumente für den beschriebenen Zusammenhang zwischen der explanatorischen Güte einer Hypothese und ihrer Wahrheit läßt sich etwa folgendermaßen wiedergeben: Unsere Vorstellungen davon, was eine Erklärung eines Phänomens darstellt und welche Erklärungen besser als andere sind, stehen nicht für immer fest. Sie entwickeln sich vielmehr im Laufe unseres Strebens nach Erkenntnis, im Laufe unserer Bemühungen um eine Beschreibung und Erklärung der Phänomene, die wir in der Welt um uns herum vorfinden. Diese Entwicklung verläuft dabei insbesondere so, daß wir diejenigen Erklärungen für die besten halten, die sich in der Vergangenheit als wahr erwiesen haben. In diesem Sinne argumentiert beispielsweise Peter Lipton in seinem Buch Inference to the Best Explanation (1991). Lipton beschreibt zunächst zwei Eigenschaften von Erklärungen: Erklärungen sind lovely, wenn sie als Erklärung sehr gut sind - unabhängig davon, wie wahrscheinlich sie sind. Erklärungen sind likely, wenn sie sehr wahrscheinlich sind - unabhängig davon, wie gut sie als Erklärungen sind. Er versucht dann folgendermaßen, einen empirischen Zu-

1

Vgl. hierzu auch die Diskussion in van Fraassen (1989: 138-142).

218

4

A- rgumente für und gegen den Schluß auf die beste Erklärung

sammenhang zwischen diesen beiden Eigenschaften von Erklärungen zu begründen: There is something further that can be said to account for the match between loveliness and judgments of likeliness. Our judgments of likeliness change over time, in part because we gather new evidence, but our standards of explanation change too. Our explanatory standards [...] are malleable, so we can explain the match by saying that they have been molded to that purpose. (Lipton 1991: 129)

Liptons Idee ist also, daß wir unsere Erklärungsmodelle nach der Maßgabe von Wahrscheinlichkeitserwägungen entwickeln: Wir modifizieren unsere Erklärungsmodelle im Lichte vergangener Erfahrungen gerade so, daß diejenigen Erklärungen als die besten ausgezeichnet werden, die die größte Wahrscheinlichkeit haben, wahr zu sein. Sollte dies tatsächlich der Fall sein, dann würden Schlüsse auf die beste Erklärung in der Tat von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen. Die Idee, man könne den Zusammenhang zwischen der explanatorischen Güte einer Hypothese und ihrer Wahrheit begründen, indem man annimmt, daß die Einschätzung der explanatorischen Güte einer Hypothese eine Funktion ihrer Wahrscheinlichkeit ist, ist natürlich zunächst nichts anderes als ein Hinweis auf die Möglichkeit einer solchen Begründung. Was aber not tut, ist der tatsächliche Nachweis eines solchen Zusammenhangs. Es ist in der Tat denkbar, daß wir genau diejenigen Erklärungen für die besten halten, die auch am wahrscheinlichsten sind. Allerdings ist ebenso das Gegenteil denkbar, und was ein Verfechter der Verläßlichkeitsthese benötigt, ist ein Argument für die eine dieser beiden Möglichkeiten und damit gegen die andere. Ein solches Argument - das insbesondere angeben müßte, wie sich im Laufe der Menschheitsgeschichte ein solcher Zusammenhang genau eingestellt hat, welcher Mechanismus hier am Werk war usw. - ist aber nirgendwo zu sehen. Auch Lipton hat ein solches Argument nicht zu bieten, sondern beschränkt sich auf das oben wiedergegebene Zitat. Schon allein aus diesem Grund handelt es sich hier nicht um ein gutes Argument für die Verläßlichkeitsthese, sondern, wie bereits gesagt, lediglich um den Nachweis der Möglichkeit eines solchen Argumentes. Weiterhin bemerkt Lipton selbst zu diesem Argument, daß es Befürwortern des Schlusses auf die beste Erklärung nicht wirklich gele-

4.2

Argumente für den Schluß auf die beste Erklärung

219

gen kommt. Denn eine Konsequenz dieses Arguments besteht darin, daß wir explanatorische Erwägungen nicht bei der Theorienwahl benutzen können: Explanation would not now be our guide to the truth, but only an epiphenomenon that makes us feel more at home in a world we have discovered by other means. [...] to suppose that our view of what counts as a lovely potential explanation is determined by our inferences seems to rule out using explanatory considerations as a guide to inference. (Lipton 1991: 129; m. H.) Wir müssen also zuerst wissen, welche von verschiedenen Hypothesen die wahrscheinlichste ist, um dann auf der Grundlage dieser Einschätzung sagen zu können, welche von ihnen die beste Erklärung der betrachteten Phänomene darstellt. Daher können wir nicht explanatorische Überlegungen als Grundlage für Wahrscheinlichkeitseinschätzungen benutzen. Dies ist aber besonders unerfreulich, wenn der Schluß auf die beste Erklärung - wie in der Einleitung zu dieser Arbeit beschrieben - als ein erkenntnistheoretisches Instrument zur Auswahl von besonders wahrscheinlichen Hypothesen verwendet werden soll. 2 Darüber hinaus scheint es Gründe zu geben, die dagegen sprechen, daß wir im Laufe der Menschheits- und Wissenschaftsgeschichte unsere explanatorischen Standards an Wahrscheinlichkeitserwägungen ausgerichtet haben. Denn es scheint einfach nicht der Fall zu sein, daß unsere Einschätzung der Güte einer Erklärung dadurch beeinträchtigt wird, daß diese sich als falsch herausstellt. Beispielsweise scheinen mir die Newtonsche Mechanik und Gravitationstheorie nach wie vor eine gute Erklärung für das Auftreten der Gezeiten zu liefern. Die Qualität dieser Erklärung wird nicht im mindesten dadurch beeinträchtigt, daß die Newtonsche Mechanik und Gravitationstheorie falsch sind. Aus diesen Gründen muß der Versuch, die Verläßlichkeitsthese über einen gewachsenen Zusammenhang zwischen der explanatorischen Güte und der Wahrscheinlichkeit einer Hypothese zu begründen, als gescheitert angesehen werden. 3 2

Vgl. zu diesem Punkt auch meine entsprechenden Bemerkungen in den Kapiteln 1 bis 3 dieser Arbeit. Die Einschätzung der Newtonschen Mechanik und Gravitationstheorie als einer guten Erklärung der Gezeiten erfolgt natürlich vor dem Hintergrund meiner In-

220

4

Argumente fur und gegen den Schluß auf die beste Erklärung

4.2.3

Ein evolutionstheoretisches Argument für den Schluß auf die beste Erklärung

Eine weitere Möglichkeit, zwischen der explanatorischen Güte einer Hypothese und ihrer Wahrheit einen Zusammenhang herzustellen, besteht darin, evolutionstheoretische Gründe anzuführen. Wenn man annimmt, daß, erstens, in der Vergangenheit in den Wissenschaften und im Alltag sehr oft Schlüsse auf die beste Erklärung gezogen wurden; daß, zweitens, auf der Basis der Meinungen, die durch diese Schlüsse gewonnen wurden, Handlungen vollzogen wurden; und daß, drittens, die gewonnenen Meinungen nicht in der Mehrzahl der Fälle wahr waren - so wäre es doch sehr erstaunlich, daß wir als Spezies im harten Überlebenskampf der Natur erfolgreich waren. Schlußmuster, die zu wahren Meinungen führen, scheinen im Hinblick auf das Überleben vorteilhaft zu sein; Schlußmuster, die in der Regel nicht zu wahren Meinungen führen, scheinen dem Überleben dagegen eher abträglich zu sein. Lipton formuliert dieses Argument folgendermaßen: We are members of a species obsessed with making inferences and giving explanations. That we should devote so much of our cognitive energy to inference is no surprise, on evolutionary grounds. Knowledge is good for survival. That we should also be so concerned with understanding is more surprising, at least if explaining is just something we do after we have finished making our inferences. What good is this activity? If, however, Inference to the Best Explanation is along the right lines, then explanation has a central evolutionary point, since one of its functions is inference. (Lipton 1991: 130 f.)

Gegen ein evolutionstheoretisches Argument dieser Art lassen sich allerdings eine Reihe von Einwänden vorbringen. Zunächst einmal geht in dieses Argument die Annahme ein, daß wir in der Vergangenheit tatsächlich sehr oft Schlüsse auf die beste Erklärung gezogen haben und somit viele beste Erklärungen für wahr hielten. Wie die Diskussituitionen, die angezweifelt werden können. Daß es sich bei der Newtonschen Mechanik und Gravitationstheorie um eine Erklärung der Gezeiten handelt, dürfte allerdings durch jedes der in den Kapiteln 1 bis 3 diskutierten Erklärungsmodelle abgedeckt sein. Wie gut die Newtonsche Erklärung der Gezeiten ist, läßt sich jedoch vor dem Hintergrund der beschriebenen Schwierigkeiten der drei Modelle bei der Spezifizierung eines komparativen Erklärungsbegriffs nicht sagen.

4.2 Argumente fir den Schluß auf die beste Erklärung

221

on der einschlägigen Erklärungsmodelle in den ersten drei Kapiteln dieser Arbeit aber gezeigt hat, läßt sich diese Annahme nur schwer begründen. Denn uns steht kein unkontroverses Erklärungsmodell zur Verfügung, auf dessen Basis wir entscheiden könnten, ob es sich bei den erschlossenen Meinungen tatsächlich erstens um Erklärungen und zweitens um die besten Erklärungen der jeweiligen Phänomene handelte. Weiterhin geht in dieses Argument die Annahme ein, daß ein positiver Zusammenhang besteht zwischen dem Haben von wahren Meinungen und dem Überleben im Kampf der Arten. Diese Annahme kann zunächst eine gewisse intuitive Plausibilität für sich verbuchen: Wenn ich in der Nähe von wilden Löwen wohne und glaube, daß es sich bei diesen um Kuscheltiere handelt, so habe ich eine falsche Meinung, die für mein Überleben sicher abträglich ist. Wenn ich dagegen die wahre Meinung habe, daß wilde Löwen Raubtiere sind, dann wird dies meinem Überleben gewiß zuträglich sein. Allerdings erweist sich die fragliche Annahme bei näherer Untersuchung schnell als keineswegs unkontrovers: Wenn ich in der Umgebung einer Vielzahl von teils giftigen, teils ungiftigen Schlangen wohne und Schlangen nicht als Nahrungsmittel zum Überleben benötige, dann wird meine falsche Meinung, daß alle Schlangen in meiner Umgebung giftig sind, für mein Überleben äußert hilfreich sein - sogar hilfreicher als die wahre Meinung, daß nur einige der Schlangen in meiner Umgebung giftig sind. Darüber hinaus gibt es eine Menge von wahren Meinungen, die für mein Überleben sicher völlig irrelevant sind: Meinungen über die Anzahl der Monde des Saturn, über die Eigenschaften von Schwarzen Löchern, Uber die politischen Erfolge und Mißerfolge von Julius Cäsar usw. Außerdem verfügen die meisten Lebewesen sicher nicht in einer Weise über Meinungen, wie wir Menschen dies tun, und dennoch waren sie evolutionär erfolgreich. Diese Überlegungen zeigen, daß der Zusammenhang zwischen dem Haben von wahren Meinungen und der Überlebensfähigkeit einer Art keineswegs so offensichtlich ist, wie bei dem hier diskutierten Argument angenommen wird. Ein Vertreter dieses Arguments müßte den fraglichen Zusammenhang daher erst nachweisen, um für die These argumentieren zu können, daß der Schluß auf die beste Erklärung in der Vergangenheit in der Regel zu wahren Meinungen geführt hat.

222

4

Argumente für und gegen den Schluß auf die beste Erklärung

Noch aus einem weiteren Grund ist das zur Diskussion stehende Argument bedenklich: Es handelt sich bei ihm nämlich ebenfalls um einen Schluß auf die beste Erklärung. In der angegebenen Textstelle weist Lipton zunächst auf die Erklärungsbedürftigkeit des Umstands hin, daß wir einen großen Teil unserer kognitiven Energie für die Suche nach Erklärungen aufwenden. Er suggeriert dann, daß die beste Erklärung für diesen Umstand darin besteht, daß Erklärungen hilfreich für das Überleben sind - und zwar deswegen, weil die besten Erklärungen von Phänomenen wahrscheinlich wahr und wahre Meinungen hilfreich für das Überleben sind. Auf der Basis dieser Annahmen schließt er dann mit Hilfe eines Schlusses auf die beste Erklärung darauf, daß der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Mit anderen Worten: Die beste Erklärung dafür, daß wir in der Vergangenheit sehr oft nach Erklärungen gesucht, Schlüsse auf die beste Erklärung verwendet haben und immer noch existieren, besteht darin, daß Schlüsse auf die beste Erklärung in den meisten Fällen zu einer wahren Konklusion führen. Daß er mit Hilfe eines Schlusses auf die beste Erklärung für die Verläßlichkeit des Schlusses auf die beste Erklärung argumentiert, hält Lipton erstaunlicherweise nicht für bedenklich, sondern im Gegenteil für ein weiteres Argument zugunsten des Schlusses auf die beste Erklärung: It is, of course, possible that the practice of explanation has no evolutionary function: not all traits are adaptive. But the fact that Inference to the Best Explanation can account for the point of explanation in adaptive terms [...] is, I think, an additional reason to favor it. (Lipton 1991: 131)

Diese Einschätzung ist aber offenkundig verfehlt: Die Verläßlichkeit eines Schlußmusters mit einem Argument begründen zu wollen, das wiederum dasselbe Schlußmuster verwendet, ist kein Aufweis der besonderen Nützlichkeit dieses Schlußmusters, sondern schlicht eine petitio principii. Angesichts dieser Vielzahl von Schwierigkeiten scheint mir das beschriebene evolutionstheoretische Argument nicht zeigen zu können, daß es sich bei dem Schluß auf die beste Erklärung um ein verläßliches Schlußmuster handelt, das von wahren Prämissen wahrscheinlich

4.3

Argumente gegen den Schluß auf die beste Erklärung

223

zu einer wahren Konklusion führt.4 Dieser Begründungsversuch der Verläßlichkeitsthese scheitert also ebenso wie das zuvor diskutierte Argument für den Schluß auf die beste Erklärung, das beanspruchte, einen gewachsenen Zusammenhang zwischen der explanatorischen Güte und der Wahrheit einer Hypothese aufzeigen zu können. Plausible Argumente für den Schluß auf die beste Erklärung sind also soweit nicht zu sehen, so daß die Verläßlichkeitsthese nach wie vor ohne Begründung dasteht. Dieses Ergebnis würde im Grunde ausreichen, um dem in der Einleitung zu dieser Arbeit formulierten Beweisziel gerecht zu werden: Es sind keine Gründe für die Annahme zu sehen, daß Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen. Die Lage der Befürworter des Schlusses auf die beste Erklärung wird sich durch die Diskussion im nächsten Abschnitt noch weiter verschlechtern. Hier werde ich nun auf den in Abschnitt 4.1 erwähnten zweiten Typ von Angriffen gegen die Verläßlichkeitsthese eingehen, d. h., ich werde Argumente gegen den Schluß auf die beste Erklärung und die Verläßlichkeitsthese diskutieren.5

4.3

Argumente gegen den Schluß auf die beste Erklärung 4.3.1

Ein empirisches Argument

In seinem Artikel „A Confutation of Convergent Realism" (1981) argumentiert Larry Laudan folgendermaßen gegen die These, daß Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen: In der Geschichte der Wis4

Ein evolutionstheoretisches Argument dieser Art wird uns im folgenden Abschnitt noch einmal begegnen. Zur Rolle von evolutionstheoretischen Begründungsversuchen in der Erkenntnistheorie vgl. im übrigen Bradie (1994). Es gibt noch ein weiteres einschlägiges Argument ftir die Verläßlichkeitsthese, das ich hier nicht diskutiert habe. Dieses Argument von Richard Boyd (1981, 1984, 1989, 1990) ist allerdings eingebettet in eine umfangreiche Argumentation ftlr den sog. Wissenschaftlichen Realismus und am besten vor dem Hintergrund dieser Diskussion zu verstehen. Ich werde dieses Argument daher in Kapitel 6 dieser Arbeit behandeln.

224

4 Argumente für und gegen den Schluß auf die beste Erklärung

senschaften gibt es eine ganze Reihe von Schlüssen auf die beste Erklärung. Ausgehend von bestimmten erklärungsbedürftigen Phänomenen wurden Hypothesen und Theorien entwickelt, die diese Phänomene erklären sollten. Unter den verfügbaren Theorien, die mit den Daten verträglich waren und die in der Vergangenheit zutreffende Vorhersagen ermöglicht hatten, wählten die Wissenschaftler diejenige Theorie aus, die ihrer Meinung nach die beste Erklärung der Phänomene darstellte. Per Schluß auf die beste Erklärung schlossen sie dann auf die Wahrheit dieser Theorien. Die Geschichte der Wissenschaften zeigt aber, daß alle diese Theorien sich im Zuge der weiteren Entwicklung als falsch herausstellten - alle wurden von Nachfolgern abgelöst. Daher haben Schlüsse auf die beste Erklärung im bisherigen Verlauf der Wissenschaften stets zu falschen Konklusionen geführt. Wenn wir also die Wissenschaftsgeschichte betrachten, haben wir keinen Grund anzunehmen, daß der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Im Gegenteil: Wir haben sogar allen Grund anzunehmen, daß er wahrscheinlich zu einer falschen Konklusion führt. Gegen dieses Argument von Laudan können Befürworter des Schlusses auf die beste Erklärung verschiedene Erwiderungen vorzubringen versuchen. Zunächst einmal handelt es sich bei dem Argument insofern um ein empirisches Argument, als es auf Erfahrungen aus der Geschichte der Wissenschaften zurückgreift. Damit stellt es kein apriorisch-begriffliches Argument gegen den Schluß auf die beste Erklärung als Schlußmuster dar. Es zeigt nicht, daß der Schluß auf die beste Erklärung nicht von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Das Argument zeigt zunächst nur, daß bei einer ausgewählten Teilmenge von Schlüssen auf die beste Erklärung, nämlich bei Schlüssen im wissenschaftlichen Bereich der Vergangenheit, die Bilanz nicht positiv ausfällt. Es könnte nun natürlich sein, daß diese Teilmenge unglücklich gewählt ist. Es könnte sich herausstellen - wenn man die Angelegenheit sozusagen vom Gottesstandpunkt aus betrachtet und alle vergangenen, gegenwärtigen und zukünftigen Schlüsse auf die beste Erklärung abzählt - , daß die Mehrzahl der Schlüsse auf die beste Erklärung tatsächlich von wahren Prämissen zu einer wahren Konklusion führt. Lediglich in den Wissenschaften der Vergangenheit haben wir Pech - wir haben sozusagen immer nur schwarze Schwäne in Australien beobachtet.

4.3

Argumente gegen den Schluß auf die beste Erklärung

225

Eine solche Situation ist natürlich denkbar. Aber selbst wenn sie vorliegen würde, bliebe unklar, was dadurch gewonnen wäre. Wissenschaftler jedenfalls können den Schluß auf die beste Erklärung nicht in Anspruch nehmen, um für die Wahrheit von Theorien zu plädieren, die sie für die beste Erklärung der gegebenen Daten halten. Daher haben sie keinen Grund, an die Wahrheit dieser Theorien zu glauben, auf der Basis dieser Theorien zu handeln und insbesondere andere Theorien, die sie für schlechtere Erklärungen der Daten halten, zu verwerfen. Darüber hinaus handelt es sich hier wiederum nur um den Hinweis auf eine Möglichkeit. Der Nachweis, daß Schlüsse auf die beste Erklärung in anderen Gebieten oder möglicherweise in der Zukunft auch in den Wissenschaften besser abschneiden, bliebe noch zu führen. Tatsächlich scheint aber gerade für einen Befürworter des Schlusses auf die beste Erklärung nicht viel für diese Annahme zu sprechen. Warum hat der Schluß auf die beste Erklärung in den Wissenschaften bisher so schlecht abgeschnitten? Ist nicht die beste Erklärung hierfür, daß er überall schlecht abschneidet (oder zumindest in den Wissenschaften immer schlecht abschneidet)? Und sollte man daher als Befürworter des Schlusses auf die beste Erklärung nicht annehmen, daß dies in der Tat der Fall ist? Gegner des Schlusses auf die beste Erklärung können dieses Argument natürlich nicht benutzen, da es sich hierbei wiederum um einen Schluß auf die beste Erklärung handelt, dem sie ja nicht vertrauen. Aber für Befürworter des Schlusses auf die beste Erklärung sollte es sich hierbei um ein gutes Argument handeln. Dieses Argument, das einen Schluß auf die beste Erklärung benutzt, zieht in Zweifel, daß der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Eine andere mögliche Erwiderung eines Befürworters des Schlusses auf die beste Erklärung auf Laudans Argument könnte folgendermaßen lauten: Was das Argument zeigt, ist lediglich, daß Schlüsse auf die beste Erklärung in der Geschichte der Wissenschaften nicht zu wahren Konklusionen geführt haben. Diese Konklusion ist aber mit der These verträglich, daß Schlüsse auf die beste Erklärung wahrscheinlich zu annähernd wahren Konklusionen führen. Denn die Behauptung, Schlüsse auf die beste Erklärung hätten in der Wissenschaftsgeschichte zu annähernd wahren, aber letztlich falschen Theorien geführt, birgt keinen Widerspruch in sich. Diejenigen Theorien, die in der Wissenschaftsgeschichte eine Weile lang verwendet wurden,

226

4

Argumente für und gegen den Schluß auf die beste Erklärung

sich dann aber als falsch herausstellten und von anderen Theorien abgelöst wurden, sind zwar tatsächlich nicht wahr. Sie sind aber, wie etwa das Beispiel der Newtonschen Mechanik zeigt, dennoch der Wahrheit sehr nahe, eben annähernd wahr. Hier müßte nun zum einen über den Begriff der annähernden Wahrheit, oder auch Wahrheitsähnlichkeit, gesprochen werden. Was soll genau darunter verstanden werden, daß eine Theorie oder Hypothese annähernd wahr oder wahrheitsähnlich ist? Welche Kriterien sind hier anzuwenden? In dieser Richtung gibt es einige Versuche, die aber alle mehr oder weniger problematisch sind.6 Zum anderen ist unklar, ob tatsächlich viele der in der Wissenschaftsgeschichte verwendeten Theorien Uberhaupt als annähernd wahr bezeichnet werden können (unter Voraussetzung eines intuitiven Begriffs der annähernden Wahrheit). Man denke hier etwa an die Phlogiston-Theorie, die diversen Äther-Theorien, die Ptolemäische Theorie der Planetenbewegung usw. als klare Gegenbeispiele. Andere Theorien mögen eher als annähernd wahr beurteilt werden. Aber nicht einmal für die Newtonsche Mechanik, die gern als Paradebeispiel einer zwar falschen, aber doch annähernd wahren Theorie herangezogen wird, ist klar, ob diese Einschätzung zutreffend ist. Kann sie wirklich als ein (nicht nur historischer, sondern auch) begrifflicher Vorgänger der relativistischen Mechanik und als annähernd wahr gelten? Schließlich ist es nicht gerade ein Nebenaspekt der Newtonschen Mechanik, daß der Raum euklidisch und nicht gekrümmt, die Zeit absolut und nicht relativ ist, daß materielle Objekte prinzipiell beliebig hohe Geschwindigkeiten erreichen können und nicht durch die Lichtgeschwindigkeit beschränkt sind usw. Vor dem Hintergrund dieser Überlegungen scheint es mir unwahrscheinlich, daß der Hinweis auf den Begriff der annähernden Wahrheit bzw. der Wahrheitsähnlichkeit den Befürwortern des Schlusses auf die beste Erklärung viel einbringen wird. Eine weitere mögliche Erwiderung auf Laudans Argument besteht darin zu leugnen, daß alle seine Annahmen erfüllt sind. In das Argument geht insbesondere ein, daß die Wissenschaftler der Vergangen6

Popper (1963) scheint der erste gewesen zu sein, der den Begriff der Wahrheitsähnlichkeit in die wissenschaftstheoretische Debatte eingeführt hat. Für einen Überblick Uber Theorien der Wahrheitsähnlichkeit vgl. etwa Brink (1989), für Wahrheitsähnlichkeit im Zusammenhang mit wissenschaftlichem Realismus vgl. etwa Niiniluoto (1984) und Weston (1992).

4.3

Argumente gegen den Schluß auf die beste Erklärung

227

heit tatsächlich auf die beste Erklärung schlossen. Möglicherweise glaubten sie aber nur, die beste Erklärung vor sich zu haben. Eventuell handelte es sich bei den Hypothesen, die sie verwendeten, nicht um die besten Erklärungen der jeweiligen Phänomene. In diesem Fall wäre aber eine der Prämissen des Schlusses auf die beste Erklärung nicht erfüllt - nämlich Prämisse P n+ i, die besagt, daß Hypothese E* die beste Erklärung der Phänomene darstellt.7 In diesem Falle würde Laudans Hinweis auf die Wissenschaftsgeschichte nicht die These widerlegen, daß Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen. Er würde allenfalls zeigen, daß Schlüsse auf die beste vermutete Erklärung (die aber tatsächlich nicht die beste Erklärung war) nicht zu wahren Konklusionen geführt haben. Auf die Konsequenzen dieser Erwiderung auf Laudans Argument für die Verläßlichkeitsthese und den Schluß auf die beste Erklärung werde ich im nächsten Unterabschnitt näher eingehen.

4.3.2

Van Fraassens Argumente gegen den Schluß auf die beste Erklärung

Einleitung In seinem Buch Laws and Symmetry (1989) hat Bas van Fraassen zwei Argumente gegen den Schluß auf die beste Erklärung vorgebracht, die ich im Anschluß an Psillos (1996) als .argument from the bad lot' und .argument from indifference' bezeichnen werde. Vereinfacht ausgedrückt versucht van Fraassen mit dem ersten Argument zu zeigen, daß diejenige Hypothese, die wir für die beste Erklärung der betrachteten Phänomene halten, möglicherweise keine besonders gute Erklärung der Phänomene darstellt - „our selection may well be the best of a bad lot" (van Fraassen 1989: 143). Wiederum vereinfacht ausgedrückt versucht er mit dem zweiten Argument zu zeigen, daß diejenige Hypothese, die wir für die beste Erklärung der betrachteten Phänomene halten, wahrscheinlich falsch ist - „it must seem very improbable to me that it is true" (van Fraassen 1989: 146). Während das erste Argument nach meiner Auffassung sein Beweisziel erreicht, ist dies für das zweite Argument nicht der Fall. Im folgenden werde ich zunächst van Fraas7

Vgl. hierzu Schema (0.2) in der Einleitung zu dieser Arbeit.

228

4 Argumente fur und gegen den Schluß auf die beste Erklärung

sens .argument from the bad lot' rekonstruieren. Im Anschluß daran werde ich zwei Einwände diskutieren, die beide zum Ziel haben, van Fraassens Argument zu entkräften, und zeigen, daß diese Einwände scheitern. Abschließend werde ich mich dem .argument from indifference' zuwenden und erläutern, warum es sein Ziel nicht erreicht. Das,argument from the bad lot'8 Van Fraassen weist zunächst darauf hin, daß in konkreten Situationen im Alltag und in den Wissenschaften, in denen potentiell ein Schluß auf die beste Erklärung eines Phänomens gezogen werden könnte, die beste Erklärung immer nur aus denjenigen Hypothesen ausgewählt werden kann, die zum gegebenen Zeitpunkt tatsächlich zur Verfügung stehen. Insofern sollte man bei solchen Schlüssen statt vom Schluß auf die beste Erklärung lieber vom Schluß auf die beste der mm gegebenen Zeitpunkt zur Verfügung stehenden Erklärungen sprechen (im folgenden kurz als „Schluß auf die beste gegebene Erklärung" bezeichnet). Wir können nun nach van Fraassen nicht ohne weiteres davon ausgehen, daß diejenige Hypothese, die die beste der gegebenen Erklärungen darstellt, auch die beste aller möglichen Erklärungen ist, denn: „We can watch no contest of the theories we have so painfully struggled to formulate, with those no one has proposed." (van Fraassen 1989: 143). Wir müssen vielmehr die Möglichkeit einräumen, daß die beste aller möglichen Erklärungen nicht zur Menge der gegebenen Erklärungen gehört und daß es sich bei ihr um eine eher schlechte Erklärung handelt: „So our selection may well be the best of a bad lot." (van Fraassen 1989: 143). Wenn wir daher behaupten wollen, daß diejenigen Schlüsse, die wir im Alltag und den Wissenschaften tatsächlich ziehen, wahrscheinlich zu einer wahren Konklusion führen, so müssen wir nicht nur annehmen, daß der Schluß auf die beste Erklärung ein verläßliches Schlußmuster ist, das von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt - d. h., wir müssen nicht nur annehmen, daß die beste aller möglichen Erklärungen eines Phänomens wahrscheinlich wahr ist. Sondern wir müssen darüber hinaus annehmen, daß die beste aller möglichen Erklärungen eines Phänomens wahrscheinlich zur Menge der gegebenen Erklärungen des Phänomens gehört: 8

Vgl. hierzu van Fraassen ( 1989: 142 ff.).

4.3

Argumente gegen den Schluß auf die beste Erklärung

229

To believe is at least to consider more likely to be true, than not. So to believe the best [available] explanation requires more than an evaluation of the given hypothesis. It requires a step beyond the comparative judgment that this hypothesis is better than its actual rivals. [...] For me to take it that the best of set X will be more likely to be true than not, requires a prior belief that the truth is already more likely to be found in X, than not. (van Fraassen 1989: 143; H. d. A.)

Es ist hilfreich, sich dieses Argument von van Fraassen anhand des Schlußmusters für den Schluß auf die beste Erklärung zu verdeutlichen, wie es in der Einleitung zu dieser Arbeit beschrieben wurde. Dabei werden zwei wesentliche Punkte deutlich werden: (0.2) Der Schluß auf die beste Erklärung - Schlußschema Prämisse Pj: Prämisse P2: l

Prämisse P„:

beobachtete, zu erklärende Phänomene

...

Prämisse Pn+i: Hypothese E* stellt die beste Erklärung der in den Prämissen P| bis P„ beschriebenen Phänomene dar. =

Konklusion:

[r]

E*

Wie dieses Schema zeigt, wird bei einem Schluß auf die beste Erklärung (mit einer gewissen induktiven Wahrscheinlichkeit r ) auf die Wahrheit der besten Erklärung E* der betrachteten Phänomene geschlossen. Van Fraassens Argument kann man nun so verstehen, daß es sich auf Prämisse P„+1 des oben dargestellten Schlußschemas bezieht. Van Fraassen weist darauf hin, daß wir in konkreten Situationen im Alltag und den Wissenschaften, in denen wir potentiell einen Schluß auf die beste Erklärung ziehen könnten, die beste Erklärung lediglich aus der Menge der zur Verfügung stehenden Erklärungen auswählen können. Um behaupten zu können, daß diese Erklärung tatsächlich die beste aller möglichen Erklärungen E* der betrachteten Phänomene darstellt, müssen wir zusätzlich davon ausgehen, daß die

230

4

Argumente für und gegen den Schluß auf die beste Erklärung

beste aller möglichen Erklärungen E* zur Menge der gegebenen Erklärungen der betrachteten Phänomene gehört. Der erste wichtige Punkt, den ich hier hervorheben möchte, besteht darin, daß van Fraassens Argument die Beweislast auf die Seite der Befürworter des Schlusses auf die beste Erklärung verschiebt: Wenn diese gerechtfertigt behaupten wollen, daß Schlüsse auf die beste gegebene Erklärung, wie sie im Alltag und den Wissenschaften tatsächlich gezogen werden, wahrscheinlich zu einer wahren Konklusion führen, so müssen sie zeigen, daß Prämisse Pn+i erfüllt ist - d. h., sie müssen gute Gründe für die Annahme angeben, daß die beste aller möglichen Erklärungen E* zur Menge der gegebenen Erklärungen gehört und daß die beste gegebene Erklärung somit die tatsächlich beste Erklärung E* der betrachteten Phänomene darstellt. Solange sie dies nicht tun, besteht kein Grund zu der Annahme, daß Schlüsse auf die beste gegebene Erklärung wahrscheinlich zu einer wahren Konklusion führen. Der zweite wichtige Punkt, auf den ich hinweisen möchte, ist der folgende: Nach meiner Auffassung wird sowohl bei van Fraassens Präsentation seines Arguments als auch bei dessen Diskussion in der Literatur ein entscheidender Punkt nicht hinreichend betont: Bei van Fraassens Argument handelt es sich nämlich im Grunde überhaupt nicht um einen Einwand gegen die Verläßlichkeitsthese, wie sie in Abschnitt 4.1 wiedergegeben wurde. Sein Argument stellt nicht die These in Frage, daß Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen, d. h., es zweifelt nicht an, daß die beste aller möglichen Erklärungen E* eines Phänomens wahrscheinlich wahr ist. Dies wird im Gegenteil bei van Fraassens Argument vorausgesetzt: Nachzuweisen, daß die beste aller möglichen Erklärungen E* zur Menge der gegebenen Erklärungen gehört, ist für die Wahrheit der Konklusion eines Schlusses auf die beste gegebene Erklärung offensichtlich nur dann von Bedeutung, wenn man davon ausgeht, daß E* wahrscheinlich wahr ist. Wenn man dies nicht annimmt, ist dieser Nachweis irrelevant für die Frage, ob Schlüsse auf die beste gegebene Erklärung, wie sie im Alltag und den Wissenschaften tatsächlich gezogen werden, wahrscheinlich zu einer wahren Konklusion führen. Van Fraassens Argument stellt also nicht die Schlüssigkeit des in (0.2) wiedergegebenen Schemas in Frage, sondern zieht in Zweifel, daß wir gute Gründe für die Annahme haben, daß ei-

4.3 Argumente gegen den Schluß auf die beste Erklärung

231

ne Prämisse dieses Schemas erfüllt sein wird - nämlich Prämisse P„+i. Dies bedeutet, daß van Fraassens Argument die Schwierigkeiten der Befürworter des Schlusses auf die beste Erklärung um einen weiteren Aspekt vergrößert. Zunächst einmal müssen sie gute Gründe für die Verläßlichkeitsthese angeben und zeigen, daß der Schluß auf die beste Erklärung tatsächlich von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Aber selbst wenn ihnen dies gelingt, ist ihre Aufgabe noch nicht beendet. Denn dann müssen sie weiterhin zeigen, daß die beste aller möglichen Erklärungen E* zur Menge der gegebenen Erklärungen gehört und Prämisse Pn+i somit erfüllt ist. Eine Möglichkeit, diesen Nachweis zu führen, besteht nun nach van Fraassen darin, ein epistemologisches Privileg in Anspruch zu nehmen und zu behaupten, wir seien „by nature predisposed to hit on the right range of hypotheses" (van Fraassen 1989: 143). In diesem Fall hätten wir guten Grand zu der Annahme, daß die Menge der Erklärungen, die uns zur Verfügung steht, tatsächlich die beste aller möglichen Erklärungen enthält. Hiermit komme ich zum ersten, von Stathis Psillos stammenden Einwand gegen van Fraassens .argument from the bad lot' (vgl. Psillos 1996,1999). Psillos' Einwand gegen van Fraassens ,argument from the bad lot' Bevor ich auf Psillos' eigentlichen Einwand eingehe, ist zu bemerken, daß er in zwei Punkten über Inhalt und Absicht von van Fraassens Argument im Irrtum ist. Erstens faßt Psillos van Fraassens .argument from the bad lot' falsch zusammen, wenn er schreibt: „In brief, van Fraassen's point is that unless an unwarranted privilege is appealed to, it is more likely that the truth lies in the space of hitherto unborn hypotheses." (Psillos 1996: 37; m. H.). Wie wir gesehen haben, behauptet van Fraassen dies keineswegs. Er will mit seinem .argument from the bad lot' lediglich darauf hinweisen, daß die Möglichkeit besteht, daß dies der Fall ist - „our selection may well be the best of a bad lot" (van Fraassen 1989: 143; m. H.). Und da diese Möglichkeit besteht, fordert van Fraassen von den Befürwortern des Schlusses auf die beste Erklärung die Angabe von guten Gründen für die Annahme, daß die beste Erklärung zur Menge der gegebenen Erklärungen gehört. Hiermit komme ich zu Psillos' zweitem Irrtum. Nach Psillos' Ansicht verlangt van Fraassen von Befürwortern des Schlusses auf die beste Erklärung nämlich, daß diese die Möglichkeit

232

4

A rgumente fiir und gegen den Schluß auf die beste Erklärung

ausschließen, daß die beste Erklärung außerhalb der Menge der gegebenen Erklärungen liegt: „[...] should one first eliminate the possibility that the truth might lie outside the theories that scientists have come up with, before one argues that there are good reasons to believe that the truth lies within this range of theories?" (Psillos 1996: 37; m. H.). Vor dem Hintergrund dieser Interpretation glaubt Psillos, van Fraassens Argument mit der Begründung zurückweisen zu können, daß es zuviel verlange und zum Skeptizismus führe: If this is what van Fraassen demands, then I must say that he operates with a very strong notion of warrant [...]. [...] very few beliefs, if any, can be warranted if warrant involves elimination of the possibility that the belief may be false. I do not think he can afford to have such a strong notion of belief-warrant without being an outright sceptic. (Psillos 1996: 37; m. H.)

Aber natürlich ist Psillos' Interpretation nicht korrekt: Van Fraassen verlangt von den Befürwortern des Schlusses auf die beste Erklärung keineswegs den Nachweis der Unmöglichkeit, daß die beste Erklärung außerhalb der Menge der gegebenen Erklärungen liegt. Er fordert von ihnen lediglich die Angabe von guten Gründen für die Annahme, daß die beste Erklärung zur Menge der gegebenen Erklärungen gehört. Diese Gründe sollen es dabei wahrscheinlich - nicht notwendig - machen, daß die beste Erklärung zur Menge der gegebenen Erklärungen gehört.9 Auf diese beiden Irrtümer von Psillos haben auch Ladyman/Douven/Horsten/van Fraassen (1997: 306) hingewiesen. In seinem neuen Buch Scientific Realism: How Science Tracks Truth (1999) nimmt Psillos auf diesen Artikel an einigen Stellen Bezug, nicht aber im Hinblick auf diese Punkte. An seine Präsentation von van Fraassens Argument schließt er zwar - anders als in Psillos (1996) - eine explizite Diskussion der Frage an, was van Fraassen meinen könnte, wenn er behauptet, „that our best theory may well be 'the best of a bad lot'" (Psillos 1999: 216). Und er erwägt dann die Möglichkeit, van Fraassen Im übrigen ist nicht zu sehen, was Psillos meinen könnte, wenn er in der zu Anfang dieses Absatzes zitierten Passage fragt, ob man zuerst die Möglichkeit ausschließen müsse, daß die beste Erklärung außerhalb der Menge der gegebenen Erklärungen liegt, bevor man gute Gründe dafür angebe, daß sie zu dieser Menge gehöre - wenn man die Möglichkeit ausgeschlossen hat, daß die beste Erklärung außerhalb der Menge der gegebenen Erklärungen liegt, braucht man offensichtlich keine guten Gründe mehr dafür anzugeben, daß sie darin liegt.

4.3

Argumente gegen den Schluß auf die beste Erklärung

233

meine damit, „that it is logically possible that our best theory is the best of a bad lot" (Psillos 1999: 216) - was van Fraassen wie gesehen in der Tat meint. Diese Interpretation lehnt Psillos dann aber unmittelbar im Anschluß mit genau derselben Begründung ab, die er bereits in (1996) gibt. Diese Interpretation würde nach Psillos' Auffassung verlangen, daß man die Möglichkeit ausschließt, daß die beste Erklärung außerhalb der Menge der gegebenen Erklärungen liegt - was wie gesehen nicht der Fall ist. Im Anschluß hieran wählt Psillos wieder die in (1996) vertretene, falsche Interpretation von van Fraassens Argument: „So I take it that van Fraassen's point is that unless an unwarranted privilege is appealed to, it is more likely that the truth lies in the space of hitherto unborn hypotheses." (Psillos 1999: 2 1 7 ;

H. d. Α.). Diese Strategie von Psillos ist um so erstaunlicher, als er durch sein weiteres Vorgehen (sowohl im Artikel von 1996 als auch im Buch von 1999) zeigt, daß er die korrekte Interpretation von van Fraassens Argument auch selbst für die richtige hält. Denn im folgenden kommt Psillos van Fraassens Aufforderung zur Angabe von guten Gründen nach, indem er zu zeigen versucht, daß wir tatsächlich Grund zu der Annahme haben, daß die beste aller möglichen Erklärungen zur Menge der gegebenen Erklärungen gehört. Nach Psillos' Ansicht verfügen wir nämlich in der Tat Uber das von van Fraassen erwähnte epistemologische Privileg, und zwar in Form unseres Hintergrundwissens: „[...] there is a sense in which we are privileged and warrantedly so. This is what I call the appeal to background knowledge privilege" (Psillos 1999: 217, H.d.A.; vgl. außerdem 1996: 37 ff.). Hiermit komme ich zu Psillos' eigentlichem Argument.10 Nach Psillos' Auffassung führt van Fraassens .argument from the bad lot' nur dann zum Ziel, wenn man annimmt, daß die Beurteilung von verschiedenen, miteinander konkurrierenden Hypothesen und die Wahl zwischen ihnen in einem Wissensvakuum stattfindet: One should observe that the argument from a bad lot works only on the following assumption: scientists have somehow come up with a set of hypotheses each of which entails the evidence - their only relevant informa-

10

Ich zitiere im folgenden nach Psillos (1999: 215-222), dessen Text dem Inhalt nach im wesentlichen identisch ist mit Psillos (1996: 36-43).

234

4

Argumente flir und gegen den Schluß auf die beste Erklärung

tion being that these hypotheses just entail the evidence - and then they want to know which of them, if any, is true. (Psillos 1999: 217)' 1 Wäre diese Annahme erfüllt, so würde van Fraassens Argument nach Psillos' Ansicht sein Beweisziel auch erreichen: If this situation were representative of what goes on in an abductive problem-situation, then, admittedly, scientists would not have the slightest clue as to whether any of these theories is likely to be approximately true. Even if they could specify which theory is the best explanation of the evidence, according to some criteria of 'bestness', they could not associate the best explanation with the likeliest one. (Psillos 1999: 217) Allerdings ist diese Annahme nach Psillos' Auffassung gerade nicht erfüllt, da bei der Auswahl der besten Erklärung auf das zur Verfügung stehende Hintergrundwissen zurückgegriffen werden kann: [...] it is at least dubious and at most absurd that theory choice operates in such a knowledge vaccum. Rather, theory choice operates within and is guided by a network of background knowledge. (Psillos 1999: 217)12 Diese These illustriert Psillos dann anhand eines konkreten Beispiels, nämlich anhand der Diskussion um die Wellentheorie des Lichts am Anfang des 19. Jahrhunderts (vgl. Psillos 1999: 217 ff.). Nach seiner Auffassung zeigt dieses Beispiel zweierlei: The first aspect is that background knowledge can drastically narrow down the space in which hypotheses can provide a potential explanation of the evidence at hand. [...] The second aspect is that when the background knowledge does not suggest just one theoretical hypothesis, then explanatory considerations - which are part and parcel of scientific practice - are called forth to assist the selection of the best from among the hypotheses which entail the evidence. (Psillos 1999: 218 f.; m. H.)

11

Psillos diskutiert van Fraassens Argument im Hinblick auf die Verwendung des Schlusses auf die beste Erklärung in wissenschaftlichen Kontexten, da er diesen im Rahmen einer umfassenderen Argumentation für den wissenschaftlichen Realismus untersucht. Sein Argument ist aber auch auf Anwendungen des Schlusses auf die beste Erklärung außerhalb der Wissenschaft Ubertragbar. Vgl. hierzu Psillos (1999: 211 ff.). Bei seinem Rückgriff auf Hintergrundwissen zur Lösung des von van Fraassen aufgeworfenen Problems beruft sich Psillos (1996: 38; 1999: 217) explizit auf Boyd (1984, 1985) und Lipton (1991, 1993).

4.3 Argumente gegen den Schluß auf die beste Erklärung

235

Beide Aspekte machen nach Psillos' Auffassung folgende Behauptung plausibel: I think both aspects of the 'background knowledge privilege' make it plausible that, contrary to van Fraassen's claim, scientists can have strong evidence for the belief that the best [available] explanation is also the correct account of the phenomena. (Psillos 1999: 219; m. H.) Diese Einschätzung kann ich nicht teilen: Keiner der beiden Aspekte liefert nach meiner Auffassung Gründe für die Annahme, daß die beste der gegebenen Erklärungen eines Phänomens die beste aller möglichen und damit (nach Ansicht der Befürworter des Schlusses auf die beste Erklärung) die korrekte Erklärung der betrachteten Explanandum-Phänomene ist. Untersuchen wir die beiden Aspekte einzeln. Der erste Aspekt besagt, daß das Hintergrundwissen die Anzahl an potentiellen Erklärungen der jeweils betrachteten Phänomene in erheblichem Maße beschränken kann. Diese Behauptung ist sicher richtig. Allerdings ist nicht zu sehen, inwiefern diese Beobachtung einen Einwand gegen van Fraassens Argument darstellt: Van Fraassens Hinweis bestand ja gerade darin, daß die Menge der gegebenen Erklärungen kleiner ist als die Menge aller möglichen Erklärungen und daher möglicherweise die beste aller möglichen Erklärungen E* nicht enthält. Psillos' Bemerkung wiederholt lediglich den Inhalt dieser Beobachtung. Sie liefert aber gerade keine guten Gründe für die Annahme, daß die beste aller möglichen Erklärungen E* wahrscheinlich zur Menge der gegebenen Erklärungen gehört. Psillos' Beobachtung würde solche Gründe nur dann liefern, wenn er zeigen könnte, daß das Hintergrundwissen die Menge der zur Verfügung stehenden Erklärungen in einer Weise einschränkt, die es wahrscheinlich macht, daß die beste aller möglichen Erklärungen E* zur Menge der gegebenen Erklärungen gehört. Daß dies nicht zwangsläufig der Fall sein wird, ist offensichtlich: Wenn mein Hintergrundwissen beispielsweise derart ist, daß es nur Erklärungen zuläßt, die sich in irgendeiner Form auf den Willen Gottes oder astrologische Überlegungen beziehen, dann spricht nichts dafür (sondern eher einiges dagegen), daß die beste Erklärung der betrachteten Phänomene wahrscheinlich zur Menge der zur Verfügung stehenden Erklärungen gehört. Das von Psillos in Anspruch genommene Hintergrundwissen wird die Menge der potentiellen Erklärungen eines Phänomens möglicher-

236

4 Argumente für und gegen den Schluß auf die beste Erklärung

weise dann in einer geeigneten Weise einschränken, wenn es sich bei diesem Hintergrundwissen tatsächlich um Wissen oder zumindest um wahre Meinung handelt. Dies anzunehmen, bedeutet aber gerade, das zu Zeigende vorauszusetzen. Die strittige Frage ist nämlich, ob Schlüsse auf die beste gegebene Erklärung, wie sie im Alltag und in den Wissenschaften tatsächlich gezogen werden, wahrscheinlich zu einer wahren Konklusion führen. Wenn der Schluß auf die beste gegebene Erklärung aber eines deijenigen Schlußmuster ist, die in der Wissenschaft verwendet werden, um zu dem Hintergrundwissen zu gelangen, das Psillos für sich in Anspruch nehmen will, dann ist gerade fraglich, ob es sich bei diesem um Wissen bzw. wahre Meinung handelt. Psillos (1996: 40; 1999: 219) ist sich dieses Umstandes bewußt. Er glaubt allerdings, die besagte strittige Annahme in der Auseinandersetzung mit van Fraassen dennoch machen zu dürfen. Denn Psillos geht davon aus, daß auch van Fraassen auf Hintergrundwissen zurückgreifen muß, um seine eigene wissenschaftstheoretische Position, den sog. Konstruktiven Empirismus, begründen zu können: [...] constructive empiricists cannot afford to deny that there is a 'background knowledge privilege'. They have to concede that, to some extent, scientists operate in an environment of correct background beliefs. [...] It is in this sense that I think my arguments do not beg the question. (Psillos 1999: 221)

Zunächst einmal ist fraglich, ob van Fraassen diese Annahme tatsächlich ebenfalls in der von Psillos beschriebenen Form machen muß. Unabhängig davon ist allerdings zu bemerken, daß Psillos' Hinweis auf van Fraassens vermeintlichen Rückgriff auf Hintergrundwissen für die hier zu behandelnde Frage völlig irrelevant ist. Denn hier geht es lediglich darum, ob Schlüsse auf die beste gegebene Erklärung, wie sie im Alltag und in den Wissenschaften tatsächlich gezogen werden, wahrscheinlich zu einer wahren Konklusion führen - und nicht darum, ob van Fraassens wissenschaftstheoretische Position korrekt ist oder nicht.13 13

Vgl. zu diesem Punkt auch Ladyman/Douven/Horsten/van Fraassen (1997: 306 -309), die diese Einschätzung teilen und zu Psillos' diesbezüglichen Argumenten schreiben: „They are also beside the point if the argument of the bad lot is considered simply by itself, as a critique of IBE [i. e., inference to the best ex-

4.3

Argumente gegen den Schluß auf die beste Erklärung

237

Der erste der von Psillos genannten Aspekte trägt also nichts zur Entkräftung von van Fraassens Argument bei. Betrachten wir nun den zweiten Aspekt: In denjenigen Fällen, in denen das Hintergrundwissen nicht schon ohne Berücksichtigung explanatorischer Überlegungen eine bestimmte Hypothese nahelegt, werden nach Psillos gerade solche Überlegungen benutzt, um eine Auswahl zu treffen: „[...] explanatory considerations - which are part and parcel of scientific practice - are called forth to assist the selection of the best from among the hypotheses which entail the evidence" (Psillos 1999: 219; m. H.). Zunächst einmal ist an dieser Behauptung eigentümlich, daß Psillos von der Auswahl der besten und nicht der wahrscheinlichsten Hypothese spricht - was er eigentlich müßte, um seinem Beweisziel nachzukommen. Aber vielleicht ist „best" hier im Sinne von „likeliest" zu verstehen. Entscheidender ist jedoch, daß Psillos' Behauptung einen völlig unstrittigen Punkt betrifft: Explanatorische Überlegungen werden nach Psillos' Ansicht in diesen Fällen benutzt, um die ,beste' Hypothese auszuwählen; und diese Überlegungen gehören zum Standard wissenschaftlicher Praxis. Die Richtigkeit dieser Behauptung wird bei der Diskussion zwischen van Fraassen und Psillos ja gerade vorausgesetzt ! Zu zeigen ist gerade nicht, daß explanatorische Überlegungen tatscichlich verwendet werden - zu zeigen ist vielmehr, daß man sie verwenden soll, und zwar deswegen, weil sie wahrscheinlich zur Auswahl von wahren Hypothesen führen. Aber dies zeigt die von Psillos getroffene Behauptung offensichtlich überhaupt nicht - sie ist für die zu begründende These erneut völlig irrelevant. Genausowenig wie der erste der von Psillos genannten Aspekte kann also auch der zweite Aspekt die These plausibel machen, daß die beste aller möglichen Erklärungen wahrscheinlich zur Menge der gegebenen Erklärungen gehört. Psillos' Einwand kann van Fraassens .argument from the bad lot' daher nicht entkräften. Es gilt nach wie vor, daß die Möglichkeit besteht, daß die beste gegebene Erklärung nicht die beste aller möglichen Erklärungen darstellt. Und Befürworter des Schlusses auf die beste Erklärung stehen weiterhin in der Pflicht,

planation], rather than in the context of some hypothetical empiricist epistemology which might be accompanying it." (Ladyman/Douven/Horsten/van Fraassen 1997: 309). Zum Konstruktiven Empirismus vgl. van Fraassen (1980,1985, 1989, 1994).

238

4 Argumente fiir und gegen den Schluß auf die beste Erklärung

gute Gründe für die Annahme zu liefern, daß diese Möglichkeit nicht realisiert ist. Solange sie dies nicht tun, besteht kein Grund zu der Annahme, daß Schlüsse auf die beste gegebene Erklärung wahrscheinlich zu einer wahren Konklusion führen (nicht einmal dann, wenn man wie Befürworter des Schlusses auf die beste Erklärung - annimmt, daß die beste aller möglichen Erklärungen wahrscheinlich wahr ist). Evolutionstheoretische lot'

Erwiderung auf das , argument from the bad

Eine weitere Möglichkeit, die Behauptung zu begründen, wir seien in der Regel im Besitz der besten aller möglichen Erklärungen, besteht in einem evolutionstheoretischen Argument: Wir sind als kognitive Organismen so beschaffen, daß wir beim Nachdenken über Phänomene in der Regel die beste aller möglichen Erklärungen finden. Wenn dies nicht der Fall wäre, so hätten wir in der Vergangenheit sehr oft auf Erklärungen geschlossen, die tatsächlich nicht die besten waren. Da aber nichts dafür spricht, daß solche Erklärungen wahr sind, hätten wir somit in der Vergangenheit sehr oft auf falsche Hypothesen geschlossen. In diesem Fall bliebe allerdings unklar, warum wir im Überlebenskampf der Arten so weit gekommen sind und immer noch existieren. Dieses Argument kommt uns bekannt vor, wir haben ein ähnliches bereits in Unterabschnitt 4.2.3 diskutiert. Dort wurde folgendermaßen für die Verläßlichkeit des Schlusses auf die beste Erklärung argumentiert: Der Schluß auf die beste Erklärung führt von wahren Prämissen wahrscheinlich zu einer wahren Konklusion; denn ansonsten hätten uns Schlüsse auf die beste Erklärung in der Vergangenheit sehr oft zu falschen Konklusionen geführt; und in diesem Fall bliebe unklar, warum wir immer noch hier sind. In analoger Weise wird nun argumentiert: Wir müssen in der Regel die beste aller möglichen Erklärungen der betrachteten Phänomene finden; denn ansonsten hätten uns Schlüsse auf die beste gegebene Erklärung in der Vergangenheit sehr oft zu falschen Konklusionen geführt; und in diesem Fall bliebe unklar, warum wir immer noch hier sind. Nach der Diskussion des evolutionstheoretischen Argumentes in Unterabschnitt 4.2.3 bedarf es wohl keiner weiteren Begründung, warum ein solches Argument problematisch ist. Eine Disanalogie zwischen den beiden Argumenten ist allerdings anzumerken: Zwar handelt es sich auch bei dem hier zur Diskussion

4.3

Argumente gegen den Schluß auf die beste Erklärung

239

stehenden Argument um einen Schluß auf die beste Erklärung: Die beste Erklärung dafür, daß wir in der Vergangenheit sehr oft Schlüsse auf die beste gegebene Erklärung gezogen haben und immer noch existieren, besteht darin, daß die Menge der gegebenen Erklärungen in der Regel die beste aller möglichen Erklärungen enthält - daher ist es wahrscheinlich, daß die Menge der gegebenen Erklärungen in der Regel die beste aller möglichen Erklärungen enthält. (Hierbei wird wie erwähnt vorausgesetzt, daß die beste aller möglichen Erklärungen eines Phänomens wahrscheinlich wahr ist.) Allerdings liegt hier zunächst keine Zirkularität der Begründung vor wie im Fall des in Unterabschnitt 4.2.3 diskutierten Arguments. Denn begründet werden soll hier nicht - wie dort - die Verläßlichkeit des Schlusses auf die beste Erklärung mit Hilfe eines Schlusses auf die beste Erklärung. Vielmehr soll hier durch einen Schluß auf die beste Erklärung die These begründet werden, daß die Menge der gegebenen Erklärungen in der Regel die beste aller möglichen Erklärungen enthält. Und es spricht zunächst nichts dagegen, hierbei anzunehmen, daß es sich bei dem Schluß auf die beste Erklärung um ein verläßliches Schlußmuster handelt. Allerdings stellen sich dennoch zwei Probleme ein. Erstens spricht zwar nichts dagegen, bei dem zur Diskussion stehenden Argument die Annahme zu machen, daß der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt allerdings spricht eben auch nichts daßr. Der Schluß auf die beste Erklärung kann zur Begründung der These, daß die beste aller möglichen Erklärungen in der Regel zur Menge der gegebenen Erklärungen gehört, offensichtlich nur dann verwendet werden, wenn man vorher gute Gründe für die Verläßlichkeitsthese vorgebracht hat. Und wie ich in den vorigen Teilen dieser Arbeit versucht habe zu zeigen, sind solche Gründe nicht zu sehen. Zweitens ergibt sich trotz der im vorletzten Absatz gemachten Bemerkungen eine Zirkularität. Van Fraassen weist ja mit seinem .argument from the bad lot' gerade darauf hin, daß wir nicht davon ausgehen können, daß die beste aller möglichen Erklärungen zur Menge der gegebenen Erklärungen gehört. Das bedeutet, daß man bei der Widerlegung von van Fraassen nicht annehmen darf, man sei selbst im Besitz der besten aller möglichen Erklärungen eines Phänomens. Man muß vielmehr einräumen, daß man lediglich die beste der gegebenen

240

4

Argumente für und gegen den Schluß auf die beste Erklärung

Erklärungen zur Verfügung hat. Befürworter des zur Diskussion stehenden evolutionstheoretischen Arguments können also nicht gerechtfertigt behaupten, die beste aller möglichen Erklärungen für unser Überleben im Kampf der Arten bestünde darin, daß wir in der Vergangenheit in der Regel die beste aller möglichen Erklärungen gefunden haben. Sie können somit nicht für sich in Anspruch nehmen, die beste aller möglichen Erklärungen zur Verfügung zu haben. Dies bedeutet, daß sie keinen Schluß auf die beste Erklärung ziehen können, sondern statt dessen lediglich einen Schluß auf die beste gegebene Erklärung. Dieser wird aber nur dann wahrscheinlich zu einer wahren Konklusion führen, wenn es sich bei der besten gegebenen Erklärung tatsächlich um die beste aller möglichen Erklärungen handelt. Wenn Befürworter des zur Diskussion stehenden evolutionstheoretischen Arguments aber diese Annahme machen, dann wird ihr Argument zirkulär - denn gerade diese Annahme ist ja strittig und zu begründen. Aus diesen Gründen scheint mir auch das hier diskutierte evolutionstheoretische Argument van Fraassens .argument from the bad lot' nicht entkräften zu können - ebensowenig wie das zuvor diskutierte Argument von Psillos, das auf Hintergrundwissen rekurrierte. Ich komme nun zu van Fraassens zweitem Argument gegen den Schluß auf die beste Erklärung. Argument from indifference Neben seinem Hinweis darauf, daß Befürworter des Schlusses auf die beste Erklärung zeigen müssen, daß die beste aller möglichen Erklärungen zur Menge der gegebenen Erklärungen gehört, d. h. neben dem Hinweis auf die Verteilung der Beweislast, entwickelt van Fraassen noch ein weiteres Argument gegen den Schluß auf die beste Erklärung. Dieses soll dem Anspruch nach zeigen, daß wir nicht nur keine guten Gründe haben anzunehmen, die beste aller möglichen Erklärungen gehöre zur Menge der gegebenen Erklärungen, sondern darüber hinaus gute Gründe haben anzunehmen, daß dies nicht der Fall ist: I believe, and so do you, that there are many theories, perhaps never yet formulated but in accordance with all evidence so far, which explain at least as well as the best we have now. Since these theories can disagree in so many ways about statements that go beyond our evidence to date, it is clear that most of them by far must be false. I know nothing about our best explanation, relevant to its truth-value, except that it belongs to this class

4.3

Argumente gegen den Schluß auf die beste Erklärung

241

[of theories which explain at least as well]. So I must treat it as a random member of this class, most of which is false. Hence it must seem very improbable to me that it is true, (van Fraassen 1989: 146)

Van Fraassen argumentiert also, daß die beste der zur Verfügung stehenden Erklärungen wahrscheinlich falsch sein wird, weil sie ein .random member' einer großen Menge von Erklärungen ist, die alle zumindest ebenso gut erklären wie sie selbst und von denen die meisten falsch sind. In dieses Argument gehen zwei Annahmen ein: Zum einen nimmt van Fraassen an, daß es immer viele andere, noch nicht entdeckte Erklärungen für die betreffenden Explanandum-Phänomene gibt; zum anderen, daß diese mindestens so gut erklären wie die beste der zur Verfügung stehenden Erklärungen: „[...] there are many theories, perhaps never yet formulated but in accordance with all evidence so far, which explain at least as well as the best we have now" (van Fraassen 1989: 146; s. o.). Psillos (1996: 43; 1999: 223) hat auf dieser Grundlage gegen van Fraassen eingewendet, daß sich die Beweislast jetzt auf dessen Seite befindet. Van Fraassen muß nun zeigen, daß es tatsächlich solche konkurrierenden Erklärungen gibt, damit er behaupten kann, die beste aller Erklärungen gehöre wahrscheinlich nicht zur Menge der zur Verfügung stehenden Erklärungen. Dies scheint mir im Hinblick auf das .argument from indifference' richtig zu sein, und die Erwiderung von Ladyman/Douven/Horsten/van Fraassen (1997) auf Psillos ist in diesem Punkt nach meiner Auffassung zurückzuweisen. Sie schreiben: [...] for the argument from indifference to go through, it is irrelevant whether [explanation] Τ possibly is a random member of a class of equally good explanations or whether Τ actually is a random member of such a class; the possibility that there may be equally good rivals to Τ already suffices to make an ampliative step from the evidence to Τ unwarranted. (Ladyman/Douven/Horsten/van Fraassen 1997: 309; H. d. A.)

Ladyman/Douven/Horsten/van Fraassen betonen in dieser Textstelle nochmals die Möglichkeit, daß es zumindest ebenso gute Erklärungen geben kann und daß daher die beste der zur Verfügung stehenden Erklärungen nicht die beste aller möglichen Erklärungen sein muß. Sie weisen also darauf hin, daß die Behauptung, die beste Erklärung gehöre zur Menge der zur Verfügung stehenden Erklärungen, einer Begründung bedarf und bis zur Angabe einer solchen Begründung „un-

242

4

Argumente für und gegen den Schluß auf die beste Erklärung

warranted" (s. o.) ist. Ladyman/Douven/Horsten/van Fraassen heben damit nochmals hervor, daß die Beweislast für diese Behauptung auf Seiten der Befürworter des Schlusses auf die beste Erklärung liegt. All das ist natürlich richtig - allerdings wurde es bereits durch das .argument from the bad lot' gezeigt. Van Fraassens Absicht mit dem .argument from indifference' war aber eine andere: Sie bestand nicht, wie bei dem vorigen Argument, lediglich darin, auf die Verteilung der Beweislast hinzuweisen und die Lieferung von Gründen für die besagte Behauptung anzumahnen. Vielmehr wollte van Fraassen mit diesem Argument selbst eine These begründen - nämlich die These, daß die beste Erklärung wahrscheinlich nicht zur Menge der zur Verfügung stehenden Erklärungen gehört. Dies leistet sein Argument aber nur dann, wenn die zwei erwähnten Thesen, auf die es aufbaut, begründet werden. Und eine solche Begründung liefert er nicht.14 Daher kann van Fraassen mit dem .argument from indifference' nicht zeigen, daß die beste der zur Verfugung stehenden Erklärungen wahrscheinlich falsch ist. Auf der anderen Seite haben wir aber bei der Diskussion des .argument from the bad lot' gesehen, daß die Befürworter des Schlusses auf die beste Erklärung ebenfalls einige Thesen nicht begründen können, die ihnen am Herzen liegen: Sie können zum einen nicht zeigen, daß die beste aller möglichen Erklärungen wahrscheinlich zur Menge der gegebenen Erklärungen gehört; und sie können zum anderen nicht zeigen, daß die beste aller möglichen Erklärungen eines Phänomens wahrscheinlich wahr ist. Das Fazit dieser Diskussion von van Fraassens Argumenten gegen den Schluß auf die beste Erklärung muß also lauten: Weder haben wir Grund zu der Annahme, daß der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt; noch haben wir Grund zu der Annahme, daß die beste aller möglichen Erklärungen zur Menge der gegebenen Erklärungen gehört. Dies bedeutet, daß wir - etwas unsauber gesprochen - sozusagen doppelt keinen Grund haben anzunehmen, daß Schlüsse auf die beste gegebene Erklärung, wie wir sie im Alltag und den Wissenschaften tatsächlich ziehen, zu wahren Konklusionen führen. 14

Auch Ladyman/Douven/Horsten/van Fraassen geben keine solche Begründung an.

4.3

Argumente gegen den Schluß auf die beste Erklärung

4.3.3

243

Abschließende Bemerkungen

Es ist nützlich, nun noch einmal kurz auf das Argument von Laudan zurückzukommen, das in Unterabschnitt 4.3.1 diskutiert wurde. Laudans Argument zeigte, daß diejenigen vermeintlichen Schlüsse auf die beste Erklärung, die in der Vergangenheit in den Wissenschaften gezogen wurden, nicht zu wahren Konklusionen geführt haben. Wie ich am Ende des betreffenden Unterabschnitts anmerkte, können Befürworter des Schlusses auf die beste Erklärung der Schlagkraft von Laudans Argument entgehen, indem sie bestreiten, daß bei diesen Schlüssen tatsächlich auf die beste aller möglichen Erklärungen geschlossen wurde. Sie können mit anderen Worten leugnen, daß Prämisse P„+i des Schlusses auf die beste Erklärung bei diesen Schlüssen erfüllt war. In diesem Fall würde Laudans Argument aber nicht die Verläßlichkeitsthese widerlegen, die ja lediglich besagt, daß der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Diese Replik auf Laudans Argument bedeutet allerdings zuzugeben, daß in der Vergangenheit in den Wissenschaften nicht auf die beste aller möglichen Erklärungen geschlossen wurde d. h., daß die beste aller möglichen Erklärungen nicht zur Menge der zur Verfügung stehenden Erklärungen gehörte. Laudans Argument liefert dann in diesem Fall das, was van Fraassen mit dem , argument from indifference' liefern wollte, aber tatsächlich nicht tat - nämlich Gründe für die Annahme, daß die beste aller möglichen Erklärungen wahrscheinlich nicht zur Menge der gegebenen Erklärungen gehört. In diesem Sinne stehen die Befürworter des Schlusses auf die beste Erklärung vor einem Dilemma. Sie können entweder zugeben, daß Laudans Argument Gründe gegen die Verläßlichkeitsthese beinhaltet. Oder sie können an der Verläßlichkeit des Schlusses auf die beste Erklärung festhalten - dafür allerdings einräumen, daß der Schluß auf die beste Erklärung für tatsächliche Anwendungen im Alltag und den Wissenschaften irrelevant ist, weil uns die beste aller möglichen Erklärungen eben wahrscheinlich nicht zur Verfügung steht. Beide Optionen sind für Befürworter des Schlusses auf die beste Erklärung äußerst unerfreulich.

Kapitel 5 Der Schluß auf die beste Erklärung und die Bayesianistische Erkenntnistheorie 5.1

Einleitung

In seinem 1989 erschienenen Buch Laws and Symmetry entwickelt Bas van Fraassen ein Argument gegen den Schluß auf die beste Erklärung, dessen Ziel in dem Nachweis besteht, daß dieses Schlußmuster mit den Prinzipien der Bayesianistischen Erkenntnistheorie konfligiert. Nach van Fraassens Auffassung erwirbt eine Person, die ihre Meinungen mit Hilfe des Schlusses auf die beste Erklärung und nicht in Übereinstimmung mit bayesianistischen Prinzipien formt, ein inkohärentes Meinungssystem. Da ein Schlußmuster, das Meinungssysteme dieser Art generiert, nicht als rational angesehen werden kann, ist der Schluß auf die beste Erklärung nach van Fraassens Ansicht abzulehnen (vgl. van Fraassen 1989: 160-170). Van Fraassens Argument richtet sich dabei nicht gegen den Schluß auf die beste Erklärung, wie er üblicherweise verstanden wird - nämlich als ein Schluß von einer gegebenen Datenmenge auf die Wahrheit der besten Erklärung dieser Datenmenge. Diese Version des Schlusses auf die beste Erklärung hält van Fraassen, insbesondere aufgrund seiner im vorangegangenen Kapitel diskutierten Argumente, ohnehin für gescheitert (vgl. van Fraassen 1989: 131-134, 142-150). Sein Angriff betrifft eine verfeinerte und abgeschwächte Version des Schlusses auf die beste Erklärung - „a probabilistic version of Inference to the Best Explanation" (van Fraassen 1989: 169). Bei dieser Konzeption werden vereinfacht ausgedrückt die Wahrscheinlichkeiten von Hypothesen so modifiziert, daß der explanatorischen Kraft der Hypothesen gegenüber den verfügbaren Daten Rechnung getragen wird. Damit die Diskussion von van Fraassens Argument nicht an verschiedenen Stellen durch Erläuterungen zur Bayesianistischen Er-

246

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

kenntnistheorie unterbrochen werden muß, werde ich diese zunächst im folgenden Abschnitt 5.2 kurz charakterisieren. Hierbei beschränke ich mich auf diejenigen Aspekte, die für das Folgende relevant sind. Außerdem versuche ich, die Darstellung möglichst frei von technischen Einzelheiten zu halten. (Ein Appendix am Ende dieses Kapitels enthält die wichtigsten Definitionen, Theoreme und Beweise.) Auf der Grundlage dieser Charakterisierung der Bayesianistischen Erkenntnistheorie werde ich van Fraassens Argument in Abschnitt 5.3 zunächst ausführlich darstellen, bevor ich es in einem weiteren Abschnitt eingehend diskutiere. Van Fraassens Angriff auf den Schluß auf die beste Erklärung hat eine Reihe von Erwiderungen hervorgerufen, die versuchen, sein Argument zu entkräften und den Schluß auf die beste Erklärung zu rehabilitieren. Wie ich in Abschnitt 5.4 zeigen werde, sind alle diese Versuche problematisch. In Abschnitt 5.5 werde ich schließlich kurz zusammenfassen, welche Auswirkungen van Fraassens Argument nach meiner Auffassung letztlich auf die Diskussion des Zusammenhangs zwischen der explanatorischen Kraft einer Hypothese und deren Wahrheit bzw. Wahrscheinlichkeit hat.

5.2 5.2.1

Die Bayesianistische Erkenntnistheorie

Grundprinzipien der Bayesianistischen Erkenntnistheorie

Die Bayesianistische Erkenntnistheorie (BE) stellt eine neuere Position innerhalb der Wissenschafts- und Erkenntnistheorie dar, die in den letzten Jahrzehnten vor allem im angelsächsischen Raum zunehmend an Einfluß gewonnen hat. Die BE versucht, Prinzipien dafür aufzustellen, wann ein System von Meinungen und welche Form der Modifikation eines solchen Systems als rational bezeichnet werden kann. Eine Grundannahme von Bayesianisten besteht dabei darin, daß die Annahme bzw. Ablehnung von Aussagen (wissenschaftlichen Hypothesen, Theorien usw.) keine binäre Frage von Ja-oder-Nein (oder von Jaoder-Nein-oder-Enthaltung), sondern vielmehr eine Frage des Grades ist. In den wenigsten Fällen ist eine Person von der Wahrheit einer gegebenen Aussage vollständig überzeugt oder aber völlig sicher, daß sie falsch ist. Die alltägliche und wissenschaftliche Praxis ist vielmehr dadurch gekennzeichnet, daß gegebene Aussagen für mehr oder weni-

5.2 Die Bayesianistische Erkenntnistheorie

247

ger wahr (bzw. für mehr oder weniger falsch), d. h. für mehr oder weniger wahrscheinlich gehalten werden. Mit anderen Worten: Hypothesen werden mit bestimmten Graden geglaubt bzw. akzeptiert, und diese Grade drücken aus, für wie wahrscheinlich die betreffenden Hypothesen gehalten werden. Die Grade, mit denen Aussagen geglaubt werden, werden dabei im allgemeinen als Glaubensgrade (degrees of belief) bezeichnet. Bayesianisten behaupten nicht, daß jede Person für jede Hypothese, die sie in Erwägung zieht, tatsächlich einen präzisen, numerischen Glaubensgrad hat und angeben kann. Allerdings wird angenommen, daß die verschiedenen Grade, mit denen eine Person eine Hypothese für wahr hält, numerisch repräsentiert werden können. Eine Möglichkeit, den Glaubensgrad einer Person S in eine Hypothese H zu repräsentieren, besteht beispielsweise darin, ihn über die sog. Quote zu bestimmen, die S bei einer Wette auf H als subjektiv fair ansehen würde. Mit einer Wette auf eine Hypothese H sei dabei eine Vereinbarung gemeint, nach der der Buchmacher an den Wetter einen Betrag a zahlt, falls H sich als wahr herausstellt, und nach der andernfalls der Wetter einen Betrag b an den Buchmacher zahlt. Das Verhältnis dieser Beträb ge, σ = - (für a * 0), bezeichnet man als die Quote der Wette. Eine a Wette auf H ist für eine Person S genau dann subjektiv fair, wenn S die Wette weder für sich selbst noch für den Buchmacher als vorteilhaft beurteilt. In diesem Fall wird S es als unerheblich betrachten, ob sie als Buchmacher oder als Wetter auftritt, d. h., ob sie ακ/oder gegen H wettet. Betrachten wir ein Beispiel: Gewettet werden soll auf die Hypothese, daß eine normale Münze beim nächsten Wurf auf ,Kopf* fällt. Die meisten Personen würden eine solche Wette genau dann für fair halten, wenn der Betrag, den sie zahlen müssen, wenn sie verlieren, genauso groß ist wie der Betrag, den sie erhalten, wenn sie gewinnen. D. h., die subjektiv faire Quote für diese Wette ist: σ = γ . Der Glaubensgrad von S in Hypothese H wird nun auf der Grundlage der für S subjektiv fairen Quote σ definiert als der für S subjektiv faire Wettquotient P(H) =

. Im obigen Beispiel ergibt sich der

subjektiv faire Wettquotient der meisten Personen für eine Wette auf Hypothese H - daß eine normale Münze beim nächsten Wurf auf

248

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

σ ,Kopf' fällt - aufgrund dieser Definition als: P(H)= ^ + σ

=

1 2~^'

Dies würden die meisten Personen wohl auch als ihren Glaubensgrad für das Eintreten des Ereignisses ,Kopf' angeben, was die Plausibilität dieses Vorschlags zur Repräsentation von Glaubensgraden verdeutlicht.1 Für die Glaubensgrade einer rationalen Person gelten nun in der BE die folgenden beiden Grundprinzipien: (5.1)

Kohärenz-Prinzip Glaubensgrade von rationalen Personen genügen den Axiomen der Wahrscheinlichkeitstheorie, d. h., die numerischen Werte der Glaubensgrade verhalten sich wie mathematische Wahrscheinlichkeiten.2

(5.2)

Konditionalisierungs-Prinzip Die Änderung von Glaubensgraden bei Erlangung neuer Information E erfolgt bei rationalen Personen durch Konditionalisierung: Der neue Glaubensgrad in eine Hypothese Η nach Bekanntwerden neuer Evidenz E ist identisch mit dem alten Glaubensgrad in Η unter der Bedingung von E: P„eu(H) = P a «(H|E). 3

Die beiden Prinzipien sind dabei normativ zu verstehen: Die Glaubensgrade von rationalen Personen sollten so beschaffen sein, daß sie den Axiomen der Wahrscheinlichkeitstheorie genügen, und eine Änderung dieser Glaubensgrade vor dem Hintergrund neuer Information sollte durch Konditionalisierung erfolgen. Da sich Glaubensgrade von 1

2

Es ist hierbei zu bemerken, daß die Einschätzung eines Wettquotienten als subjektiv fair nicht die Bereitschaft nach sich ziehen muß, auch tatsächlich eine Wette zu diesem Wettquotienten einzugehen. Dies kann aus den verschiedensten Gründen abgelehnt werden. Vgl. zu diesem Punkt und zur Bestimmung von Glaubensgraden als subjektiv fairen Wettquotienten ζ. B. Howson/Urbach (1989: 56-59). Siehe Abschnitt 5.6 für eine Darstellung der Axiome der Wahrscheinlichkeitstheorie. Dabei entspricht der alte Glaubensgrad in Η unter der Bedingung von E-d.h. P„it(H|E) - der bedingten Wahrscheinlichkeit von Η unter Voraussetzung von E im Sinne der Wahrscheinlichkeitstheorie; vgl. hierzu Definition (5.30) in Abschnitt 5.6.

5.2 Die Bayesianistische Erkenntnistheorie

249

rationalen Personen gemäß Prinzip (5.1) wie mathematische Wahrscheinlichkeiten verhalten und da sie relativ zu bestimmten Personen sind, werden sie auch als subjektive Wahrscheinlichkeiten bezeichnet. Weiterhin nennt man ein System von Glaubensgraden, das Prinzip (5.1) erfüllt, kohärent.4 Die beiden Grundprinzipien des Bayesianismus können um weitere Prinzipien ergänzt werden. Zunächst einmal kann das Konditionalisierungs-Prinzip verallgemeinert werden auf Fälle, bei denen die neue Information, die zugänglich wird, nicht sicher ist - d. h. auf Fälle, bei denen sich der Glaubensgrad hinsichtlich der betreffenden Information lediglich ändert (sich erhöht oder verringert), statt von einem bestimmten Wert auf 1 zu steigen. Für solche Fälle ist das folgende Prinzip anwendbar: Jeffrey-Konditionalisierung5

(5.3)

Der neue Glaubensgrad in Hypothese H nach Änderung des Glaubensgrades in eine für Hypothese H relevante Evidenz E ergibt sich bei rationalen Personen gemäß der folgenden Gleichung: 1

neu (H) = 1 neu (E)·

(H|E) + ^neu ( - Έ ) · Pait(H I -iE)

Konditionalisierung ergibt sich als Spezialfall von Jeffrey-Konditionalisierung: Gilt E als sicher, ist also P„eu(E) = 1, so ist P„ eu (-iE) = 0 und daher P„eu(H) = Pa|t (HlE). Eine weitere Bedingung für rationale Glaubensgrade formuliert das sog. Reflexions-Prinzip, das gegenwärtige und zukünftige Glaubensgrade von rationalen Personen miteinander verknüpft:

5

Experimentelle Studien zeigen, daß tatsächliche Systeme von Glaubensgraden in der Regel weder kohärent sind noch durch Konditionalisierung geändert werden; vgl. hierzu Kahnemann/Slovic/Tversky (Hgg.) (1982). Dementsprechend dürfen die Prinzipien (5.1) und (5.2) auch nicht deskriptiv verstanden werden: Bayesianisten behaupten nicht, daß jede Person - oder auch nur jeder Wissenschaftler - (5.1) und (5.2) tatsächlich erfüllt. Allerdings können das Kohärenzund das Konditionalisierungs-Prinzip so verstanden werden, daß mit ihrer Hilfe zumindest weite Teile wissenschaftlicher Methodologie angemessen beschrieben werden können. Hierauf werde ich in Abschnitt (5.2.4) noch einmal zurückkommen. 2 Jeffrey-Konditionalisierung geht zurück auf Richard Jeffrey ( 1983: Kap. 11).

250 (5.4)

5 Schluß auf die beste Erklärung und Bayes. Erkenntnistheorie Reflexions-Prinzip P,(H|P t+y (H) = x) = x

Das Prinzip besagt folgendes: Die bedingte subjektive Wahrscheinlichkeit, die eine rationale Person zu einem gegebenen Zeitpunkt t einer Hypothese H unter der Bedingung beimißt, daß sie zu einem späteren Zeitpunkt (t+y) dieser Hypothese die (absolute) subjektive Wahrscheinlichkeit χ zuteilt, ist ebenfalls gleich x. Das ReflexionsPrinzip drückt die Idee aus, daß eine Person ihren zukünftigen Glaubensgraden vertrauen sollte. Natürlich kann sie dies nur dann tun, wenn sie diese als (auf der Basis gegebener Evidenz) rational geformt betrachtet. Insofern stellt das Reflexions-Prinzip genaugenommen keine Bedingung an Glaubensgrade, als vielmehr eine Forderung an die Art und Weise, wie diese geändert werden sollten: Ändere Deine gegenwärtigen Glaubensgrade so, daß Du das Reflexionsprinzip erfüllen kannst.6 Eine weitere Bedingung für rationale Glaubensgrade ist das sog. Principal Principle. Es verknüpft objektive Wahrscheinlichkeiten mit subjektiven Wahrscheinlichkeiten. (5.5)

Principal Principle Ρ,(Η I ch,(H) = χ) = χ

Das Prinzip besagt folgendes: Die bedingte subjektive Wahrscheinlichkeit, die eine rationale Person zu einem Zeitpunkt t einer Hypothese Η unter der Bedingung beimißt, daß die objektive Wahrscheinlichkeit von Η zum Zeitpunkt t - d. h. ch,(H) - gleich χ ist, ist ebenfalls gleich χ. Das Principal Principle findet beispielsweise Anwendung, wenn eine Person auf der Grundlage ihrer Überzeugung, daß die vor ihr liegende Münze eine normale Münze ist - d. h., daß die objektive Wahrscheinlichkeit für ,Zahl' (bzw. ,Kopf') gleich 0,5 ist - , der Hypothese „Der nächste Wurf der Münze wird .Zahl' ergeben." die subjektive Wahrscheinlichkeit 0,5 beimißt.7

6

η

Das Reflexions-Prinzip geht auf Goldstein (1983) und van Fraassen (1984) zurück. Das Principal Principle geht zurUck auf David Lewis (1980); vgl. hierzu auch den Wiederabdruck und die Kommentare in Lewis (1986f) und außerdem Lewis (1994).

5.2

Die Bayesianistische

Erkenntnistheorie

251

Bayesianisten kommen in vielen verschiedenen Schattierungen vor und unterscheiden sich insbesondere dadurch, welche der genannten Prinzipien sie als Bedingungen für Rationalität ansetzen. Earman (1992: 35) unterscheidet beispielsweise ,pure personalists', die die Prinzipien (5.1) und (5.2) als die einzigen Bedingungen für rationale Glaubensgrade überhaupt betrachten, von tempered, personalists', die etwa noch Jeffrey-Konditionalisierung, das Principal Principle oder auch das Reflexions-Prinzip hinzunehmen würden, und ,objectivists\ die an Glaubensgrade neben den genannten Bedingungen noch weitere Forderungen stellen, beispielsweise diejenige, daß in einem rationalen System von Glaubensgraden keine Glaubensgrade wie etwa P(„Die Erde ist eine Scheibe.") = 0,9 vorkommen.8

5.2.2

Rechtfertigung der Grundprinzipien: Dutch books

Für die beiden Grundprinzipien (5.1) und (5.2) der BE gibt es Rechtfertigungsversuche verschiedener Art. Am bekanntesten sind die auf den sog. Dutch èoofc-Theoremen aufbauenden Dutch book-Argumente, die insbesondere auch für van Fraassens Argument gegen den Schluß auf die beste Erklärung von Bedeutung sind. Als ein Dutch book bezeichnet man ein Arrangement von Wetten über das Eintreffen bestimmter Ereignisse derart, daß eine der Parteien aus dem Arrangement mit einem sicheren Verlust hervorgeht - unabhängig davon, ob die fraglichen Ereignisse eintreten oder nicht. Was zunächst das in (5.1) wiedergegebene Kohärenz-Prinzip betrifft, so besagt das auf Ramsey (1926) und de Finetti (1937) zurückgehende sog. Synchronische Dutch ¿wofc-Theorem: (5.6)

Synchronisches Dutch book-Theorem (a)

(b)

g

Gegen Personen, deren subjektiv faire Wettquotienten nicht den Axiomen der Wahrscheinlichkeitstheorie genügen, kann ein Dutch book abgeschlossen werden. Gegen Personen, deren subjektiv faire Wettquotienten den Axiomen der Wahrscheinlichkeitstheorie genügen, kann kein Dutch book abgeschlossen werden.

Auf diesen Punkt komme ich in Abschnitt 5.2.5 noch einmal kurz zurück.

252

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

Das Synchronische Dutch èoofc-Argument baut auf diesem Ergebnis folgendermaßen auf: Erstens wird wie beschrieben der Glaubensgrad einer Person S in eine Hypothese H bestimmt als der subjektiv faire Wettquotient von S für eine Wette auf H. Somit ergibt sich aufgrund von (5.6), daß gegen Personen, deren Glaubensgrade Prinzip (5.1) nicht erfüllen (und nur gegen solche Personen), ein Dutch book gemacht werden kann. Zweitens wird angenommen, daß es irrational ist, Glaubensgrade zu haben, die es ermöglichen, daß man in ein Arrangement von Wetten verwickelt wird, die man alle für fair hält und das man in jedem Fall mit einem Verlust beendet. Hieraus folgt dann, daß die Glaubensgrade von rationalen Personen Prinzip (5.1) erfüllen müs9

sen. Betrachten wir zur Illustration ein einfaches Beispiel. Nehmen wir an, eine Person S habe einen Glaubensgrad von 0,8 dafür, daß es morgen regnet, und einen Glaubensgrad von 0,3 dafür, daß es morgen nicht regnet - wodurch sie die Axiome der Wahrscheinlichkeitstheorie verletzt, die unter anderem fordern, daß P(H) + P(-iH) = 1. Aufgrund des ersten Glaubensgrades wird S eine Wette für fair halten, bei der sie 2 DM gewinnt, falls es morgen regnet, und 8 DM verliert, falls es nicht regnet. Aufgrund des zweiten Glaubensgrades wird sie eine Wette für fair halten, bei der sie 7 DM gewinnt, falls es nicht regnet, und 3 DM verliert, falls es regnet. Falls es morgen regnet, gewinnt S die erste Wette (+ 2 DM) und verliert die zweite ( - 3 DM) - wodurch sie insgesamt einen Verlust von 1 DM erleidet. Falls es andererseits nicht regnet, verliert S die erste Wette ( - 8 DM) und gewinnt die zweite (+ 7 DM) - und erleidet wiederum einen Gesamtverlust von 1 DM. S geht also bei jedem möglichen Ausgang der beiden Wetten mit einem sicheren Verlust aus dem Wettarrangement hervor, obwohl sie beide Wetten für fair hält. Die Ursache hierfür liegt in der Beschaffenheit

9 Es ist hier möglicherweise nützlich anzumerken, daB der wesentliche Punkt in dem unter (5.6.b) genannten Ergebnis besteht: Die Tatsache, daB gegen mich ein Dutch book gemacht werden kann, falls meine Glaubensgrade nicht den Axiomen der Wahrscheinlichkeitstheorie genügen, würde mich kaum zu einer Erfüllung von Prinzip (5.1) verleiten, falls nicht gewährleistet wäre, daß in diesem Falle kein Dutch book gegen mich möglich ist.

5.2

Die Bayesianistische

Erkenntnistheorie

253

der Glaubensgrade von S, die nicht den Axiomen der Wahrscheinlichkeitstheorie genügen.10 Für das in (5.2) wiedergegebene Konditionalisierungs-Prinzip gibt es analog ein sog. Diachronisches Dutch book- Argument, das auf dem folgenden Theorem aufbaut: (5.7)

Diachronisches Dutch book-Theorem (a)

(b)

Gegen eine Person, die ihre subjektiv fairen Wettquotienten bei Eintreffen neuer Information nicht durch Konditionalisierung, sondern gemäß einer anderen Regel ändert, kann ein Dutch book abgeschlossen werden. Gegen eine Person, die ihre subjektiv fairen Wettquotienten bei Eintreffen neuer Information durch Konditionalisierung ändert, kann kein Dutch book abgeschlossen werden.11

Das Dutch èoo^-Argument dafür, daß eine rationale Person ihre Glaubensgrade durch Konditionalisierung ändern muß, verläuft dann wie im Fall des Kohärenz-Prinzips: Definiert man Glaubensgrade als subjektiv faire Wettquotienten und nimmt man an, daß es nicht rational ist, Glaubensgrade zu haben, die ein Dutch book ermöglichen, so ergibt sich aufgrund von (5.7), daß Personen, sofern sie rational sind, das Konditionalisierungs-Prinzip erfüllen müssen. Ein Dutch book der diachronischen Art wird bei van Fraassens Argument gegen den Schluß auf die beste Erklärung eine zentrale Rolle spielen.12 10

Würden die Glaubensgrade von S andererseits die Axiome der Wahrscheinlichkeitstheorie erfüllen, so wäre kein Dutch book gegen S möglich. Wäre der Glaubensgrad von S für Regen beispielsweise 0,8, so wäre ihr Glaubensgrad für Nicht-Regen 0,2. Bei Regen würde sie daher aufgrund der ersten Wette 2 DM gewinnen, aufgrund der zweiten aber 2 DM verlieren; im anderen Fall würde sie aufgrund der ersten Wette 8 DM verlieren und aufgrund der zweiten 8 DM gewinnen. Sie würde also keinen sicheren Verlust erleiden. Das diachronische Dutch book-Theorem geht auf David Lewis zurück und wird unter Angabe des Ursprungs zum ersten Mal erwähnt bei Paul Teller (1973); siehe auch Teller (1976). Für Lewis' ursprüngliche Version des Theorems vgl. Lewis (1999b). Für Jeffrey-Konditionalisierung, das Reflexions-Prinzip und das Principal Principle gibt es ebenfalls Dutch book-Argumente; vgl. hierzu Armendt (1980), Skyrms (1987a) und Howson (1993). Für eine allgemeine Diskussion von Dutch òoo/c-Argumenten vgl. Christensen (1996). Für einen Überblick Uber

254

5 Schluß auf die beste Erklärung und Bayes.

5.2.3

Erkenntnistheorie

Das Bayessche Theorem

Von besonderer Bedeutung für die BE ist das sog. Bayessche Theorem, eine einfache Folgerung aus den Axiomen der Wahrscheinlichkeitstheorie und einer Definition bedingter Wahrscheinlichkeit. Es lautet (in einer seiner Versionen) wie folgt: (5.8)

Bayessches Theorem Es seien H und E beliebige Hypothesen mit P(H), P(E) > 0. Dann gilt: P(H|E)=Ä.

P ( H )

Das Bayessche Theorem besagt: Die bedingte Wahrscheinlichkeit von H gegeben E ist gleich dem Quotienten aus der bedingten Wahrscheinlichkeit von E gegeben H und der Wahrscheinlichkeit von E, multipliziert mit der Wahrscheinlichkeit von H.13 Das Bayessche Theorem ist deshalb von so großer Bedeutung, weil es eine Möglichkeit zur Berechnung von bedingten Wahrscheinlichkeiten liefert und somit für das Konditionalisierungs-Prinzip relevant ist: Nehmen wir an, daß die Glaubensgrade einer Person S dem Kohärenzprinzip genügen und daß S bereits eine bestimmte subjektive Wahrscheinlichkeit für eine gegebene Hypothese H hat, beispielsweise P(H) = 0,6. Ferner sei die subjektive Wahrscheinlichkeit von S für das Eintreffen einer bestimmten experimentellen Beobachtung E gegeben als P(E) = 0,5 und ihre subjektive Wahrscheinlichkeit für E unter Voraussetzung von H gegeben als PÍE! H) = 0,7. Nun trete der Fall ein, daß E tatsächlich beobachtet wird. In diesem Fall schreibt das Konditionalisierungs-Prinzip vor, den neuen Glaubensgrad in H gleichzusetzen mit dem alten Glaubensgrad in H unter der Bedingung von E - d. h„ P„eu(H) = Pau(H | E). Da die Glaubensgrade der Person aufgrund unserer Annahme dem Kohärenz-Prinzip genügen, verhalten sie sich wie mathematische Wahrscheinlichkeiten, und das Bayessche Versuche, das Kohärenz-Prinzip ohne Rekurs auf das Synchronische Dutch book-Theorem zu rechtfertigen, vgl. Earman (1992:44 ff.) und Howson/Urbach (1989: 73-76); für entsprechende Versuche im Hinblick auf das Konditionalisierungs-Prinzip vgl. Earman (1992: 49 ff.). Für einen Beweis des Theorems siehe (5.33) in Abschnitt 5.6.

5.2 Die Bayesianistische Erkenntnistheorie

255

Theorem kann zur Berechnung dieses Glaubensgrades angewendet werden: (5.9)

Berechnung des neuen Glaubensgrades in H mit Hilfe des Bayesschen Theorems Pneu(H) = P alt (H|E) =

P a „(ElH)-P al ,(H) Pal,(E)

Der Glaubensgrad für Hypothese H erhöht sich also nach der Beobachtung von E von 0,6 auf 0,84. Auf der Basis der beiden Grundprinzipien der BE kann mit Hilfe des Bayesschen Theorems der neue Glaubensgrad in H ganz einfach errechnet werden.

5.2.4

Erfolge der Bayesianistischen Erkenntnistheorie

Die Bayesianistische Erkenntnistheorie kann eine Reihe von wissenschaftstheoretischen Erfolgen aufweisen. Viele Aspekte wissenschaftlicher Methodologie, die in den Einzelwissenschaften beobachtet werden, können auf der Grundlage bayesianistischer Prinzipien erklärt und gerechtfertigt werden. Beispielsweise liefert die BE eine einfache Rechtfertigung der Hypothetisch-Deduktiven Methode, für die trotz ihrer großen intuitiven Plausibilität eine Rechtfertigung außerhalb der BE schwer zu finden ist.14 Definiert man zunächst den Begriff der Bestätigung wie folgt: (5.10) Eine bayesianistische Bestimmung des Begriffs der Bestätigung E bestätigt H genau dann, wenn gilt: P(H IE) > P(H). - so ergibt sich eine Rechtfertigung der Hypothetisch-Deduktiven Methode unter Rekurs auf das Bayessche Theorem wie folgt: Ist E aus H 14 Die Hypothetisch-Deduktive Methode besagt, vereinfacht ausgedrückt, daß eine erwogene Hypothese H getestet wird, indem eine empirische Konsequenz E aus ihr abgeleitet und das Eintreten von E dann im Experiment überprüft wird. Tritt E ein, gilt die Hypothese als bestätigt; tritt E nicht ein, so ist H widerlegt. Der Schluß von den beiden Prämissen (H—>E) und -iE auf -iH - bei der Widerlegung von H - ist eine Instantiierung eines deduktiv gültigen Schlußschemas. Der Schluß allerdings von (H—>E) und E auf H - zum Zwecke der Bestätigung von H - ist ein deduktiver Fehlschluß.

256

S Schluß auf die beste Erklärung und Bayes. Erkenntnistheorie

ableitbar, so ist P(E|H) = 1; daher folgt P(E|H) > P(E), d. h., ^ f p > 1, und somit P(H IE) > P(H); d. h., E bestätigt H.15 Weiterhin läßt sich auf der Grundlage der BE erklären, warum Uberraschende, sehr unwahrscheinlich erscheinende empirische Konsequenzen E einer Hypothese H diese besser bestätigen als weniger überraschende, d. h. ohnehin wahrscheinliche. Definiert man zunächst P(H IE) das Verhältnis p ^ als ein Maß dafür, wie sehr Beobachtung E Hypothese H bestätigt, so ergibt sich (unter der Voraussetzung, daß Hypothese H Beobachtung E impliziert, und wiederum unter Rekurs auf das Bayessche Theorem): (

,

m

w

0

l

E

)

=

ï ! M

=

ï ï g

P(HIE) i_ P(H) - P(E)

D. h., je unwahrscheinlicher die empirische Konsequenz E und je kleiner damit P(E), desto höher ist der Grad der Bestätigung, den Hypothese H durch eine Beobachtung von E erhält. Darüber hinaus kann mit Hilfe der BE gezeigt werden, warum (i) Beurteilungen von Hypothesen auf der Grundlage von möglichst vielen empirisch beobachteten Konsequenzen erfolgen sollten; (ii) ein breites Spektrum von beobachteten Konsequenzen eine Hypothese besser bestätigt als ein enges Spektrum von Konsequenzen immer gleicher Art; (iii) die erfolgreiche Vorhersage einer empirischen Beobachtung für eine Hypothese eine größere Bestätigung liefert als die bloße Akkommodation von empirischen Daten; (iv) ad Zioc-Hypothesen abzulehnen sind.16 Diesen Erfolgen der BE stehen allerdings auch Einwände gegenüber, auf die ich im folgenden Abschnitt kurz eingehen werde.

15 16

Vgl. für Näheres etwa Howson/Uibach (1989: 79) und Eaiman (1992: 63 ff.). Vgl. Howson/Urbach (1989: Kap. 4) und Earman (1992: Kap. 3), die eine Reihe weiterer Aspekte diskutieren.

5.2 Die Bayesianistische Erkenntnistheorie 5.2.5

257

Probleme der Bayesianistischen Erkenntnistheorie

Der wohl grundlegendste Einwand gegen die BE besteht in der Behauptung, daß ihre Grundannahme unrealistisch und ihre Grundprinzipien irrelevant für menschliche Erkenntnissubjekte sind. Zum einen kann bezweifelt werden, daß Personen auch nur für die wenigsten ihrer Meinungen präzise bestimmte, numerische Glaubensgrade haben bzw. angeben können. Liegen solche Glaubensgrade aber nicht vor, so ist die Forderung, daß Glaubensgrade rationaler Personen den Axiomen der Wahrscheinlichkeitstheorie genügen und durch Konditionalisierung geändert werden sollten, offensichtlich ohne erkenntnistheoretische Bedeutung. Zum anderen kann behauptet werden, daß die Bayesianistischen Grundprinzipien für menschliche Erkenntnissubjekte deswegen problematisch sind, weil sie zuviel von ihnen fordern. Aus dem Kohärenz-Prinzip folgt beispielsweise, daß rationale Personen jeder logischen Wahrheit den Glaubensgrad 1, jedem logischen Widerspruch den Glaubensgrad 0, logisch äquivalenten Aussagen denselben Glaubensgrad zuordnen und daß keine logische Folgerung Β aus einer Aussage A einen niedrigeren Glaubensgrad erhält als A selbst. Diese Forderungen sind allerdings im allgemeinen nicht zu erfüllen. Was beispielsweise die letzte Forderung betrifft, so milßte eine Person S für jede Meinung A, der sie einen Glaubensgrad zuordnet, jede andere ihrer Meinungen dahingehend überprüfen, ob sie aus A logisch folgt und dementprechend einen nicht-niedrigeren Glaubensgrad hat. Selbst wenn man die praktische Unmöglichkeit, dies zu leisten (die aus der Endlichkeit und psychologischen Beschaffenheit von S resultiert) außer acht läßt, scheitert dieses Unterfangen bereits theoretisch daran, daß es keinen allgemeinen Algorithmus für die Entscheidung der Frage gibt, ob eine gegebene Aussage A eine gegebene Aussage Β logisch impliziert oder nicht. Ein weiterer Einwand gegen die BE betrifft die Frage, inwieweit die bayesianistischen Bedingungen eine vollständige Charakterisierung rationaler Meinungssysteme darstellen. Die BE verlangt zwar, daß die Glaubensgrade einer rationalen Person kohärent sein müssen und durch Konditionalisierung geändert werden, allerdings lassen diese Forderungen für die Werte der Glaubensgrade sehr viel Spielraum zu. Beispielsweise wird nicht ausgeschlossen, daß eine Person für die Hypothese Η „Der Papst ist Protestant." eine subjektive Wahrschein-

258

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

lichkeit von P(H) = 1 hat - was keine rationale Einschätzung der Lage zu sein scheint.17 Dieses sog. Problem der Ausgangswahrscheinlichkeiten (problem of priors) betrifft allgemein die Frage, welche zusätzlichen Bedingungen an die Werte Palt(H), Palt(E) und Pa,t(E|H) gestellt werden müssen, die in das Bayessche Theorem eingehen und bei Anwendung des Konditionalisierungs-Prinzips zur Berechnung von P n e u ( H ) = Pait(H IE) herangezogen werden. Darüber hinaus ist die bedingte Wahrscheinlichkeit P(H|E) nur dann definiert, wenn P(E) Φ 0. Es ist aber offensichtlich, daß eine für Hypothese Η relevante Information E zunächst eine subjektive Wahrscheinlichkeit von P(E) = 0 haben kann, die sich dann aufgrund bestimmter eintretender Umstände auf P(E) = 1 ändert. In diesem Fall macht die BE keine Aussage darüber, wie sich die subjektive Wahrscheinlichkeit von Η ändern soll.18 Ein ähnliches Problem ist mit dieser Frage eng verknüpft. Das Konditionalisierungs-Prinzip ist anwendbar, wenn sich die subjektive Wahrscheinlichkeit von relevanter Information E für eine gegebene Hypothese Η auf P(E) = 1 ändert. Die BE legt allerdings nicht fest, welcher Art die Änderung dieser subjektiven Wahrscheinlichkeit sein soll. Es ist mit der BE völlig verträglich, daß sich die subjektive Wahrscheinlichkeit bestimmter relevanter Information E beispielsweise durch Eingebungen beim Lesen von Kaffeesatz ändert - was im allgemeinen nicht als eine rationale Änderung von subjektiven Wahrscheinlichkeiten angesehen wird. Aufgrund dieser Probleme argumentieren Gegner der BE, daß Bayesianisten ihre Position um weitere Prinzipien ergänzen müssen, um eine vollständige Charakterisierung von Rationalität bieten zu können. Dieser und die zuvor genannten Einwände gegen die BE werden bei der Diskusssion von van Fraassens Argument noch einmal eine Rolle spielen.19 17

18

Hieran ändert sich auch dann nichts, wenn man die beiden Grundprinzipien der BE um Jeffrey-Konditionalisierung, das Reflexions-Prinzip und das Principal Principle ergänzt. Man denke beispielsweise an den Ausgang eines Experiments zur Feststellung von E, dessen Ergebnis zunächst fälschlicherweise als -iE interpretiert wurde P(E) = 0 - , das schließlich aber E lautete - P(E) = 1. Analoge Überlegungen gelten für den Fall, in dem P(E) nicht von 0 auf 1, sondern auf einen geringeren Wert steigt (so daß Jeffrey-Konditionalisierung zur Anwendung kommt). Für eine Diskussion der genannten und weiterer Einwände gegen den Bayesianismus vgl. etwa Howson/Urbach (1989: Kap. 11).

5.3 Van Fraassens Argument

5.3

259

Van Fraassens Argument 5.3.1

Einleitung

Vor dem Hintergrund der Erläuterungen im vorigen Abschnitt läßt sich van Fraassens Argument gegen den Schluß auf die beste Erklärung kurz folgendermaßen zusammenfassen: Personen, die für die Änderung ihrer Glaubensgrade anstelle des KonditionalisierungsPrinzips eine probabilistische Version des Schlusses auf die beste Erklärung verwenden, gelangen zu einem inkohärenten Überzeugungssystem, das ein Dutch book gegen sie ermöglicht. Solche Personen werden „incoherent in the following precise sense: by their own lights, they sabotage themselves through the commitment to follow that rule" (van Fraassen 1989: 173). Weil dies nach van Fraassens Ansicht nicht als rational angesehen werden kann, ist eine probabilistische Version des Schlusses auf die beste Erklärung abzulehnen. Da die spätere Diskussion der Einwände gegen van Fraassens Argument nur bei Kenntnis von dessen Einzelheiten nachvollziehbar ist, werde ich sein Argument im folgenden im Detail darstellen. Dabei werde ich allerdings zum Zwecke einer größeren Verständlichkeit an einigen Stellen, die für das Argument nicht entscheidend sind, von van Fraassens Art der Darstellung abweichen.

5.3.2

Das Experiment

Van Fraassen diskutiert das folgende Experiment: Gegeben sei ein Würfel, der dahingehend untersucht werden soll, mit welcher Häufigkeit er auf eine bestimmte Seite χ fällt. Der Würfel stamme von einem fremden Planeten, und es sei daher nichts über ihn bekannt, insbesondere nicht, ob er fair ist, d. h. auf jede seiner Seiten mit derselben Häufigkeit fällt. Der Experimentator - im folgenden kurz Peter genannt stellt daher zu Beginn des Experimentes η verschiedene Hypothesen über die Neigung des Würfels auf, auf Seite χ zu fallen, die anhand von wiederum η Würfen überprüft werden sollen. Die i-te Hypothese, für alle i e {1,2,..., η}, besagt dabei, daß die Wahrscheinlichkeit, mit der der Würfel bei einem beliebigen Wurf auf Seite χ fällt, gleich ^

260

5 ScMuß auf die beste Erklärung und Bayes. Erkenntnistheorie

ist. Alle η Hypothesen erhalten aufgrund fehlenden Ausgangswissens über den Würfel die gleiche Ausgangswahrscheinlichkeit P(H¡) = ^ . Der Würfel wird geworfen, und es ergibt sich, daß er bei den ersten vier Würfen auf Seite χ fällt. Die Wahrscheinlichkeiten der η Hypothesen werden nun auf der Grundlage dieses Ergebnisses gemäß den Prinzipien der BE modifiziert, d. h. durch Konditionalisierung und mit Hilfe des Bayesschen Theorems. Von besonderem Interesse ist hierbei Hypothese H„ - die Hypothese, die besagt, daß die Wahrscheinlichkeit, mit der der Würfel bei einem beliebigen Wurf auf Seite χ fällt, gleich ~ = 1 ist. Ihre Wahrscheinlichkeit verändert sich nach dem ersten Wurf wie folgt (,,P(Hn)" bezeichne die Awigangswahrscheinlichkeit von Hypothese H„; ,,Pj(H„)" bezeichne die Wahrscheinlichkeit von Hypothese H„ nach dem j-ten Wurf; E¡ sei die Aussage, daß der Würfel beim j-ten Wurf auf Seite χ fällt; „P'iEj)" bezeichne die Wahrscheinlichkeit von Ej vor dem j-ten Wurf; ,,Pj(H¡ I Ej)" bezeichne die bedingte Wahrscheinlichkeit von Hypothese H¡ vor dem j-ten Wurf unter der Voraussetzung von Ej; P(Ej I H¡) bezeichne die bedingte Wahrscheinlichkeit von Ej unter der Voraussetzung von H¡ (diese hängt nicht von j ab); und es gelte η = 10, so daß, für alle i e {1,2,..., 10}, P(H¡) = 0,1): (5.12) Berechnung der Wahrscheinlichkeit von H„ nach dem ersten Wurf P'(H„) = P'(H n IE,) =

gemäß Konditionalis.-Prinzip

Ρ(Ει I H„) · P(Hn) F(ËÏ)

„„ ^ gemäß Bayesschem Theorem

Nach dem zweiten Wurf erhalten wir bereits: (5.13) Berechnung der Wahrscheinlichkeit von H„ nach dem zweiten Wurf * W - P \ m l * > .

" ^ a k T " · '

=0,26

5.3

Van Fraassens Argument

261

Nach dem vierten Wurf mit dem Ergebnis .Seite x' hat sich die Wahrscheinlichkeit von Hypothese H„ bereits auf ungefähr 0,395 erhöht. Die Wahrscheinlichkeit nach dem vierten Wurf, daß der Würfel beim fünften Wurf auf Seite χ fallen wird, beträgt bereits P 5 (E 5 ) = 0,87, nachdem sie zu Anfang lediglich bei Ρ'(Ε,) = 0,55 gelegen hatte. 20 Diese veränderten Wahrscheinlichkeiten ergeben sich allein aufgrund der Anwendung des Konditionalisierungs-Prinzips und des Bayesschen Theorems. Explanatorische Erwägungen spielen hierbei noch überhaupt keine Rolle. Sie greifen allerdings jetzt in das Geschehen ein, denn ein Befürworter einer probabilistischen Version des Schlusses auf die beste Erklärung mischt sich in das Experiment mit dem folgenden Vorschlag ein.

5.3.3

Eine probabilistische Version des Schlusses auf die beste Erklärung

Der Befürworter der probabilistischen Version des Schlusses auf die beste Erklärung - im folgenden kurz Erwin genannt - macht zunächst folgende Beobachtung: The hypotheses of high bias [d. h. die Hypothesen mit i nahe η] not only predict four aces [d. h. Seite χ] in a row with high probability; and not only turn out to be 'right', to some degree, if that happens; but will offer us (after the fact) a good explanation of why we saw nothing but aces, (van Fraassen 1989:166; m. H. außer „aces")

Als ein Anhänger des Schlusses auf die beste Erklärung schlägt Erwin daher vor, die explanatorische Kraft der verschiedenen Hypothesen auch angemessen zu würdigen - d. h., denjenigen Hypothesen, die eine gute Erklärung der beobachteten Phänomene liefern, eine höhere 20

Die Ergebnisse kommen wie folgt zustande: Ρ(Ει I Hn) = 1, da H„ Ej impliziert; P(H„) = 0,1, da wie gesehen vor dem ersten Wurf P(H¡) = 0,1, Air alle i e {1, ...,10), gilt; P'(Ej) ergibt sich allgemein gemäß folgender Formel: Pj(Ej) = Σ η '' = 1 [P(EjI H¡) · Pj"'(Hi)]. Im Fall von P'(E0 gilt daher: Ρ'(Ε,) = Σ"'' = '[P(E, I H¡) · P(Hj)] = 0,1 · Σ η , ί = 1 P(E, I H¡) = 0,1 · (0,1 + 0,2 + ... + 1) = 0,55. Die Übrigen Wahrscheinlichkeiten ergeben sich auf analoge Weise.

262

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

Wahrscheinlichkeit zu geben, als sie sie allein auf der Grundlage bayesianistischer Erwägungen erhalten würden. Von allen Hypothesen erklärt Hypothese H„ die beobachteten Ergebnisse nach Erwins Meinung am besten: Wenn H„ wahr ist, dann ist die Häufigkeit, mit der der Würfel auf Seite χ fällt, gleich ^ = 1 - d. h., er muß bei jedem Wurf auf Seite χ fallen, weshalb das Ergebnis der ersten vier Würfe vor dem Hintergrund von Hn nicht verwundert. Die Wahrscheinlichkeit von H„ sollte dementsprechend am meisten erhöht werden. Peter findet Erwins Argument überzeugend und ändert seine subjektiven Wahrscheinlichkeiten für die verschiedenen Hypothesen H¡ nun nach einer von Erwin vorgeschlagenen Regel ab, die nicht nur von den Ausgangswahrscheinlichkeiten P(H¡) der Hypothesen, den bedingten Wahrscheinlichkeiten P(Ej|Hi) und den Ergebnissen der Würfe abhängt, sondern auch die explanatorische Kraft der Hypothesen berücksichtigt. Aufgrund dieser Modifikation der Wahrscheinlichkeiten der verschiedenen Hypothesen H¡ ergeben sich auch Änderungen hinsichtlich der Wahrscheinlichkeit, mit der der Würfel nach j Würfen bei einem weiteren Wurf wiederum auf Seite χ fällt. Denn in die Berechnung dieser Wahrscheinlichkeit gehen die Wahrscheinlichkeiten der verschiedenen Hypothesen H¡ ja wie gerade gesehen ein. Die Details von Erwins Regel sind für die im folgenden zu beschreibende Konsequenz nicht von Bedeutung. Entscheidend ist lediglich, daß, erstens, die verschiedenen Hypothesen H¡ posteriore Wahrscheinlichkeiten erhalten, die von denjenigen verschieden sind, die sich auf der Grundlage des rein bayesianistisch durchgeführten Experiments ergeben; und daß, zweitens, sich dies auch auf die Wahrscheinlichkeit Pj(Ej) auswirkt, mit der der Würfel bei einem weiteren Wurf auf .Seite x' fällt. Nehmen wir also an, Erwins Regel impliziere, daß nach dem vierten Wurf die Wahrscheinlichkeit dafür, daß beim fünften Wurf wiederum .Seite x' fällt, gleich Ρ5ε™™(Ε5) = 0,9 ist - anstatt P5(E5) = 0,87, dem bayesianistischen Ergebnis.

5.3.4

Diachronisches Dutch book

Diese Annahme hat sehr unerfreuliche Konsequenzen - gegen Peter kann nämlich ein Dutch book gemacht werden. Nehmen wir zu Zwek-

5.3 Van Fraassens Argument

263

ken der Illustration an, es werde ein zweiter unbekannter Würfel gefunden, der von einem anderen fremden Planeten stamme als der erste Würfel, so daß Peter weder Grund zu der Annahme hat, der Würfel verhalte sich wie ein normaler Würfel von der Erde, noch er verhalte sich wie der zuvor untersuchte Würfel. Daher entschließt er sich, den Würfel mit Hilfe desselben Modells zu untersuchen wie den ersten Würfel, d. h., indem er die beschriebenen Hypothesen aus dem ersten Experiment benutzt und diese wie vorher anhand von Würfen untersucht. Der einzige Unterschied besteht nun darin, daß Peter - von Erwins Argumenten überzeugt - im neuen Experiment zusätzlich die explanatorische Kraft der Hypothesen berücksichtigt, gemäß der von Erwin vorgeschlagenen Regel. Buchmacher Bastian, ein entschiedener Gegner des Schlusses auf die beste Erklärung, schlägt Peter nun mehrere Wetten vor, die die folgenden beiden Hypothesen betreffen: (5.14) Die fiirdie Wetten relevanten Hypothesen V: Der Würfel fällt bei den ersten vier Würfen auf Seite x. F: Der Würfel fällt beim fünften Wurf auf Seite x. Gewettet werden soll auf das Eintreffen der folgenden Ereignisse, wobei Bastian sich bereit erklärt, die nachstehenden Beträge an Peter zu bezahlen, falls dieser die Wetten eingeht und gewinnt (falls Peter die Wetten verliert, zahlt Bastian nichts): (5.15) Die ersten drei Wetten Wette 1: V ist wahr und F ist falsch. Wette 2: V ist falsch. Wette 3: V ist wahr.

10.000 DM 1.300 DM 300 DM

Die Frage ist nun, wieviel Peter bereit ist, für diese Wetten zu zahlen. Der faire Preis FP einer Wette auf eine Hypothese H ergibt sich allgemein nach der folgenden Formel als das Produkt aus der Wahrscheinlichkeit von H und dem Gewinn, den man erhält, falls H der Fall ist: (5.16) Formel für den fairen Preis FP einer Wette auf Hypothese H FP = P(H) · Gewinn(H) Damit ergeben sich als faire Preise für die drei von Buchmacher Bastian vorgeschlagenen Wetten:

264

5 Schluß auf die beste Erklärung und Bayes. Erkenntnistheorie

(5.17) Faire Preise fiir die Wetten 1 bis 3 Wette 1 : FP, = P(Va -iF) · 10.000 DM

Wette 2: F P 2 = P ( - i V ) · 1 . 3 0 0 D M Wette 3: FP3 = P(V) · 300 DM Welche Wahrscheinlichkeiten sind nun aus Peters Sicht für die verschiedenen Ereignisse anzusetzen? Da die Wetten vor dem ersten Wurf des Würfels abgeschlossen werden, ist natürlich noch nichts Uber das Verhalten des Würfels bekannt. Insbesondere ist zu diesem Zeitpunkt auch noch unbekannt, welche der Hypothesen H¡ das Verhalten des Würfels später am besten erklären wird. Daher können zum Zeitpunkt des Abschließens der Wetten auch nicht die explanatorischen Erfolge bzw. Mißerfolge der verschiedenen Hypothesen berücksichtigt werden. Für die Ermittlung der Wahrscheinlichkeiten der drei Ereignisse, auf die gewettet wird, können also nur die Ausgangswahrscheinlichkeiten P(H¡) der Hypothesen und deren Aussagen über die Wahrscheinlichkeit des Eintretens von V und F berücksichtigt werden. Auf dieser Grundlage sind die Wahrscheinlichkeiten wie folgt: (5.18) Peters Wahrscheinlichkeiten fiir die relevanten Hypothesen21 P(V Λ -IF):

0,032505

P(-IV):

0,74667

P(V):

0,25333

Damit ergeben sich für Peter die folgenden fairen Preise für die Wetten 1 bis 3:

21

Die Wahrscheinlichkeiten errechnen sich folgendermaßen: P(V) =Z n,i=1 [P(V|H¡)P(H¡)] = P(VIΗ,) · Ρ(Η,) + P(VI Mí) · P(H2) + ... + P(VIH,o) • P(H10) = [P(V I Hi) + P(V IH2) +... + P(V| H,o)] · 0,1 = [0,14 + 0,24 + ... + l 4 ] · 0,1 = 0,25333. Damit ergibt sich: P(->V) = [1 - P(V)] = 0,74667. Die Wahrscheinlichkeit von (V Λ -iF) errechnet sich analog zu derjenigen von V: P(V λ —.F) = Σ"·' 4= ^PCV Λ -,F|H¡) · P(H¡)] = [(0,1 · 0,9) + (0,24 · 0,8) + ... + (I4 · 0)] · 0,1 = 0,032505.

5.3

Van Fraassens

Argument

265

(5.19) Die für Peter fairen Preise ßr die von Bastian angebotenen Wetten Fairer Preis von Wette 1 (V Λ —IF): FP, = 0,032505 · 10.000 DM = 325,05 DM Fairer Preis von Wette 2 (-iV): FP2 = 0,74667 · 1.300 DM = 970,67 DM Fairer Preis von Wette 3 (V): FP 3 = 0,25333 · 300 DM = 76,00 DM Zu diesen Preisen geht nun Peter alle drei Wetten mit Bastian ein, d. h., er kauft die Wetten von diesem für den Gesamtpreis von 1.371,72 DM. Die ersten vier Würfe werden ausgeführt. Es gibt zwei mögliche Ergebnisse: I) Der Würfel fällt nicht bei allen vier Würfen auf Seite χ : In diesem Fall hat Bastian - da V falsch ist - die Wetten 1 und 3 gewonnen und Wette 2 verloren. Dementsprechend zahlt er wie vereinbart 1.300 DM an Peter. Das Wettspiel ist beendet, und Bastian verbucht einen Reingewinn von 71,72 DM. (Der fünfte Wurf des Würfels braucht nicht mehr abgewartet zu werden, da er nur für Wette 1 relevant ist, die aber bereits entschieden ist dadurch, daß sich V als falsch herausgestellt hat.) II) Der Würfel fällt viermal hintereinander auf Seite x: In diesem Fall hat Bastian - da V wahr ist - Wette 2 gewonnen und Wette 3 verloren. Dementsprechend zahlt er schon einmal 300 DM an Peter, und das Wettspiel geht weiter. Wette 1 hängt nun nur noch davon ab, ob F wahr oder falsch ist, d. h., ob der fünfte Wurf ebenfalls Seite χ ergibt oder nicht. Bevor aber der fünfte Wurf ausgeführt wird, schlägt Bastian eine weitere Wette mit nachstehendem Gewinn vor: (5.20) Vierte von Bastian angebotene Wette Wette 4: F ist falsch.

10.000 DM

Wie hoch ist Peters subjektive Wahrscheinlichkeit dafür, daß der Würfel beim fünften Wurf nicht auf Seite χ fällt? Da Peter sich von Erwin hat überzeugen lassen, die explanatorische Kraft der verschiedenen Hypothesen bei der Bestimmung ihrer Wahrscheinlichkeit zu berücksichtigen und Erwins Regel zu verwenden, hat er jetzt - nachdem der Würfel bei den ersten vier Würfen auf Seite χ gefallen ist - eine subjektive Wahrscheinlichkeit von 0,9 dafür, daß der Würfel auch beim

266

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

fünften Wurf auf Seite χ fällt (statt 0,87, dem bayesianistischen Ergebnis). Seine subjektive Wahrscheinlichkeit für Hypothese F beträgt also 0,9, diejenige für Hypothese -iF damit 0,1. Der für Peter faire Preis von Wette 4 ist daher: (5.21) Der für Peter faire Preis von Wette 4 FP4 = P(-iF) · 10.000 DM = 0,1 · 10.000 DM = 1.000 DM Für diesen Preis kauft nun Bastian Wette 4 von Peter. D. h., dieses Mal tritt Peter als Buchmacher und Bastian als Wetter auf, der auf die Wahrheit der Hypothese „F ist falsch." setzt. (Da der Preis der Wette für Peter fair ist, ist es ihm gleichgültig, ob er als Wetter oder als Buchmacher agiert.) Stellt sich F tatsächlich als falsch heraus, so erhält Bastian 10.000 DM von Peter, im anderen Falle erhält er nichts und hat seinen Einsatz von 1.000 DM verloren. Vor dem entscheidenden fünften Wurf ziehen wir eine Zwischenbilanz: Bis jetzt hat Bastian von Peter 1.371,72 DM als Preis für die Wetten 1, 2 und 3 erhalten. Er hat Wette 2 gewonnen, aber Wette 3 verloren und daher 300 DM an Peter gezahlt. Weiterhin hat er an Peter einen Preis von 1.000 DM für Wette 4 gezahlt. D. h., vor dem fünften Wurf weist Bastians Zwischenbilanz ein Plus von 71,72 DM auf. Das Wettspiel wird nun fortgesetzt, der Würfel zum fünften Mal geworfen. Es gibt wiederum zwei Möglichkeiten: IIa) Der Würfel fällt beim fünften Wurf nicht auf Seitex: Dann ist Hypothese F falsch. Bastian verliert also Wette 1 und zahlt daher 10.000 DM an Peter. Gleichzeitig gewinnt er aber Wette 4 und erhält somit 10.000 DM von Peter. Insgesamt ändert sich also nichts an Bastians Zwischenbilanz. IIb) Der Würfel fällt beim fünften Wurf auf Seite x: Dann ist Hypothese F wahr. Bastian gewinnt also Wette 1 und zahlt daher nichts an Peter. Gleichzeitig verliert er aber Wette 4 und erhält somit auch kein Geld von Peter. An Bastians Zwischenbilanz ändert sich also wiederum nichts. Dies bedeutet, daß unabhängig davon, wie der fünfte Wurf ausgeht, Bastians Zwischenbilanz unverändert bleibt und er das Wettspiel mit einem Reingewinn von 71,72 DM verläßt. Das Gesamtergebnis des Experimentes ist damit folgendes: Unabhängig davon, ob der Würfel bei den ersten vier Würfen auf Seite χ fallt oder nicht und ob er beim fünften Wurf auf Seite χ fällt oder

5.3

Van Fraassens Argument

267

nicht, geht Bastian mit einem Gewinn von 71,72 DM aus dem Wettarrangement hervor, während Peter einen sicheren Verlust von 71,72 DM zu beklagen hat. Peter verliert bei jedem möglichen Ergebnis der Würfe einen Betrag von 71,72 DM - er ist Opfer eines von Bastian geschickt arrangierten Dutch book geworden. Die Ursache hierfür liegt in der Art und Weise, wie Peter seine subjektiven Wahrscheinlichkeiten modifiziert - nämlich in seiner Verwendung eines probabilistischen Schlusses auf die beste Erklärung. Peters sicherer Verlust von 71,72 DM ist an sich bereits beklagenswert genug. Hinzu kommt allerdings noch, daß Peter diesen Verlust schon vor dem Beginn des Wtirfelns selbst hätte absehen können denn er wußte, welche subjektiven Wahrscheinlichkeiten er vor der Ausführung der Würfe hatte und nach vier Würfen mit dem Ergebnis .Seite x' haben würde. Er hätte sich selbst ausrechnen können, daß seine subjektiven Wahrscheinlichkeiten ihm zum Nachteil gereichen würden. Es ist dieser Umstand, den van Fraassen im Auge hat, wenn er von Anwendern eines probabilistischen Schlusses auf die beste Erklärung sagt, sie seien „incoherent in the following precise sense: by their own lights, they sabotage themselves through the commitment to follow that rule" (van Fraassen 1989: 173; m. H.).

5.3.5

Van Fraassens Folgerungen aus dem Argument

Im Hinblick auf die im folgenden Abschnitt zu diskutierenden Einwände gegen van Fraassens Argument ist es sinnvoll, kurz die Folgerungen zu beschreiben, die van Fraassen selbst aus seinem Argument zieht. Nach seiner Ansicht zeigt sein Argument, daß jede probabilistische Version des Schlusses auf die beste Erklärung, die als Regel zur Modifikation von Wahrscheinlichkeiten in Konkurrenz zum bayesianistischen Konditionalisierungs-Prinzip verwendet wird, zum Scheitern verurteilt ist: What is the moral of this story? Certainly, in part, that we should not listen to anyone who preaches a probabilistic version of Inference to the Best Explanation, whatever the details. Any such rule, once adopted as a rule, makes us incoherent, (van Fraassen 1989: 169)

268

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

Diese Schlußfolgerung gilt dabei nicht nur für die konkrete Regel, die Peter im Beispiel von Erwin übernimmt, sondern für alle möglichen Regeln zur Modifikation von Wahrscheinlichkeiten, bei denen die explanatorische Kraft der verschiedenen Hypothesen belohnt wird denn entscheidend für die Möglichkeit des Dutch book gegen Peter war ja nicht die bestimmte explanatorische Regel, die er benutzte, sondern daß er aufgrund dieser Regel Wahrscheinlichkeiten erhielt, die sich von rein bayesianistisch ermittelten unterschieden.22 Aus der Tatsache, daß gegen eine Person ein Dutch book gemacht werden kann, wenn sie ihre subjektiven Wahrscheinlichkeiten auf der Grundlage einer anderen Regel als dem Konditionalisierungs-Prinzip modifiziert, folgt aber für van Fraassen nicht, daß die einzige Möglichkeit zur Modifikation von Meinungen vor dem Hintergrund empirischer Evidenz durch das Konditionalisierungs-Prinzip beschrieben wird. Die Konsequenz ist lediglich, daß, wenn eine Person ihre Meinungen mit Hilfe einer Regel ändert, diese Regel die bayesianistische sein muß. Zwar wird nach van Fraassen im normalen Verlauf der Erfahrung üblicherweise das Konditionalisierungs-Prinzip zur Anwendung kommen, aber: „There remains always the option to leaven this process with theoretical innovation and courageous embrace of new hypotheses that have gained my admiration" (van Fraassen 1989: 174). Die Änderung von Meinungen im Lichte neuer Erfahrung ist damit nicht immer eine Frage von Regelanwendung, sondern „includes an element of free choice" (van Fraassen 1989: 176). Hierbei können insbesondere auch explanatorische Erwägungen eine Rolle spielen. Ihre Berücksichtigung bei der Modifikation von Wahrscheinlichkeiten ist nach van Fraassen also nicht allgemein als irrational einzustufen sondern nur dann, wenn dies in Form einer Regel geschieht, die in Konkurrenz zum Konditionalisierungs-Prinzip tritt: „Someone who comes to hold a belief because he found it explanatory, is not thereby irrational.1 1 He becomes irrational, however, if he adopts it as a rule to do so [...]." (van Fraassen 1989: 142; H. d. A.).23 22

Tatsächlich ist die SchluBfolgerung noch allgemeiner, denn ebensowenig war es entscheidend, daß Peter seine Wahrscheinlichkeiten aufgrund von explanatorischen Erwägungen modifizierte. Hätte er Hypothesen belohnt, die er für besonders einfach oder elegant hielt, wäre ebenfalls ein Dutch book gegen ihn möglich gewesen. Vgl. hierzu auch van Fraassen (1999).

5.4

Einwände gegen van Fraassens

Argument

269

Allerdings ist damit nicht gesagt, daß die Berücksichtigung explanatorischer Eigenschaften etwa besonders empfehlenswert wäre. Insbesondere will van Fraassen nicht behaupten, daß wir durch eine solche Berücksichtigung zu besonders wahrscheinlichen Hypothesen gelangen würden. Der Rekurs auf explanatorische Erwägungen kann nur insofern als rational bezeichnet werden, als nichts gegen einen solchen Rekurs spricht. Vereinfacht ausgedrückt ist für van Fraassen all das als rational anzusehen, was nicht nachweislich irrational ist: [...] what it is rational to believe includes anything that one is not rationally compelled to disbelieve. And similarly for ways of change: the rational ways to change your opinion include any that remain within the bounds of rationality - which may be very wide. Rationality is only bridled irrationality. (van Fraassen 1989: 171 f.; H. d. A.)

Die Quintessenz von van Fraassens Argument besteht also darin, daß, erstens, der Schluß auf die beste Erklärung ins Aus führt und zurückzuweisen ist, wenn man ihn als Regel zur Modifikation von Wahrscheinlichkeiten in Konkurrenz zum Konditionalisierungs-Prinzip verwendet; daß, zweitens, andere Formen der Berücksichtigung explanatorischer Erwägungen durchaus nicht als irrational angesehen werden müssen; daß aber, drittens, dies nicht bedeutet, daß sie etwa besonders empfehlenswert wären und uns zu Hypothesen führten, die besonders wahrscheinlich wären.

5.4

Einwände gegen van Fraassens Argument 5.4.1

Übersicht über die Einwände

Gegen van Fraassens Argument können Einwände verschiedener Art vorgebracht werden. Ein erster Einwand, der in Abschnitt 5.4.2 behandelt wird, besteht in der Behauptung, daß die Art und Weise der Verteilung der explanatorischen Bonus-Wahrscheinlichkeiten an die verschiedenen Hypothesen für die von van Fraassen aufgezeigten Inkohärenzen verantwortlich ist. Nach diesem Einwand ist die vorgenommene Einschätzung der explanatorischen Kraft der verschiedenen Hypothesen H¡ und die darauf basierende Zuteilung von Bonus-Wahrscheinlichkeiten nicht adäquat. Die unerwünschten Konsequenzen re-

270

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

sultieren lediglich hieraus und können bei einer korrekten Zuteilung vermieden werden. Ein zweiter Einwand sucht den Fehler in van Fraassens Argument nicht in der Art und Weise der Verteilung von Bonus-Wahrscheinlichkeiten. Im Gegenteil wird behauptet, daß prinzipiell bei jeder Form der Verteilung von Boni das von van Fraassen beschriebene Dutch book vermieden werden kann - solange nur an anderer Stelle entsprechende Vorkehrungen getroffen werden, die van Fraassen übersieht. Dieser Einwand wird in Abschnitt 5.4.3 diskutiert. Ein dritter Einwand besteht schließlich darin, die Verteilung von Bonus-Wahrscheinlichkeiten an die Hypothesen H¡ grundsätzlich abzulehnen und van Fraassens Konzeption eines probabilistischen Schlusses auf die beste Erklärung zurückzuweisen. Da diese Konzeption allerdings zunächst sehr plausibel erscheint, muß dieser Einwand eine Begründung für die Behauptung beinhalten, daß keine Bonus-Wahrscheinlichkeiten verteilt werden dürfen. Eine solche Begründung kann entweder die ursprüngliche Plausibilität von van Fraassens Konzeption durch gute Argumente beseitigen, oder sie kann eine plausiblere Konzeption des Schlusses auf die beste Erklärung vorschlagen. Die erste dieser beiden Möglichkeiten wird in Abschnitt 5.4.4 diskutiert, die zweite in Abschnitt 5.4.5.

5.4.2

Falsche Verteilung der Bonus-Wahrscheinlichkeiten

Betrachten wir zunächst den naheliegenden Einwand, van Fraassen schätze die explanatorische Kraft der verschiedenen Hypothesen H¡ nicht richtig ein und verteile die Bonus-Wahrscheinlichkeiten in einer nicht angemessenen Weise: Hypothese Hn stellt beispielsweise überhaupt nicht die beste Erklärung der beobachteten Daten - viermal Ergebnis .Seite x' in Folge - dar und sollte daher auch nicht die größte Bonus-Wahrscheinlichkeit erhalten. Dieser Einwand führt entweder (i) zu einem Vorschlag für eine andere Verteilung von Bonus-Wahrscheinlichkeiten an die verschiedenen Hypothesen auf der Grundlage ihrer explanatorischen Kraft - wodurch dann etwa Hypothese Hk die beste Erklärung der Daten darstellt und den größten Bonus erhält; oder er führt (ii) zu einem Vorschlag, bei dem nur an manche Hypothesen Bonus-Wahrscheinlichkeiten auf der Grundlage ihrer explanatorischen

5.4

Einwände gegen van Fraassens

Argument

271

Kraft verteilt werden, an die übrigen Hypothesen aber Abzüge in der Wahrscheinlichkeit, da sie die Daten schlecht oder gar nicht erklären. Was Möglichkeit (i) betrifft, so ist offensichtlich, daß eine andere Verteilung von Boni an die Hypothesen H¡ auf der Grundlage ihrer explanatorischen Kraft zu genau demselben Ergebnis führt. Entscheidend bei van Fraassens Argument ist ja nicht, welche der Hypothesen die beste Erklärung der Daten darstellt und die größte Bonus-Wahrscheinlichkeit erhält, sondern daß (a) die Hypothesen überhaupt aufgrund einer Regel, die ihre explanatorische Kraft belohnt, eine Wahrscheinlichkeit erhalten, die von derjenigen verschieden ist, die sich allein auf der Grundlage bayesianistischer Prinzipien ergeben würde; und daß (b) diese Änderung der Wahrscheinlichkeiten der Hypothesen zu einer Änderung der Wahrscheinlichkeiten führt, die das Eintreffen eines weiteren Wurfes mit dem Ergebnis .Seite x' betreffen. Sobald diese beiden Bedingungen erfüllt sind, ist ein Dutch book möglich.24 Diese Konsequenz kann aber zunächst in der zweiten Variante des Einwandes vermieden werden: Wenn die Wahrscheinlichkeiten der verschiedenen Hypothesen so verändert werden, daß einige Hypothesen H¡ aufgrund ihrer explanatorischen Kraft eine höhere Wahrscheinlichkeit erhalten (wahrscheinlich diejenigen H¡ mit i nahe n), andere aber aufgrund ihres explanatorischen Versagens eine niedrigere Wahrscheinlichkeit (wahrscheinlich diejenigen H¡ mit i nahe 1); und wenn diese Modifizierung der Wahrscheinlichkeiten nicht Bedingung (b) verletzt, d. h. nicht zu einer Änderung der Wahrscheinlichkeiten Pj(Ej) führt, so kann Bastian seine ursprüngliche Strategie nicht gegen Peter anwenden. Peter hat dann zwar nach dem vierten Wurf immer noch andere Wahrscheinlichkeiten für die Hypothesen H¡ als ein Bayesianist, aber keine andere Wahrscheinlichkeit für die Hypothese E5, nach der beim fünften Wurf wiederum .Seite x' fällt. Und es ist die Diskrepanz in der subjektiven Wahrscheinlichkeit für diese Hypothese zwischen Peter und einem reinen Bayesianisten, die Bastian ausnutzt.

24

Es würde insbesondere nichts nützen zu behaupten, Hypothese H n sei zwar komparativ gesehen die beste der vorhandenen Erklärungen, aber absolut betrachtet immer noch eine sehr schlechte Erklärung. Abgesehen einmal von der Frage, wie plausibel diese Einschätzung ist, sie ändert nichts am Ergebnis: Selbst wenn Hypothese H n nur einen minimalen Bonus bekommt, entstehen die beschriebenen Inkohärenzen.

272

5 Schluß auf die beste Erklärung und Bayes. Erkenntnistheorie

Diese Art der Modifikation der Wahrscheinlichkeiten der verschiedenen Hypothesen H¡ auf der Grundlage ihrer explanatorischen Kraft scheint im übrigen auch viel plausibler zu sein als diejenige, die van Fraassen vorschlägt. Einige der Hypothesen stellen nach intuitiver Einschätzung sehr schlechte Erklärungen der Daten dar und sollten deshalb nicht belohnt, sondern vielmehr .bestraft' werden. Natürlich gibt es sehr viele verschiedene Möglichkeiten, die Wahrscheinlichkeiten der verschiedenen Hypothesen H¡ gemäß diesem Vorschlag abzuändern, und ein Vertreter einer probabilistischen Version des Schlusses auf die beste Erklärung müßte einen guten Grund für die gerade von ihm vorgeschlagene Art der Modifikation angeben. Aber dieses Problem sei um des Argumentes willen vernachlässigt. 25 Dieser zunächst plausible Vorschlag vermeidet das Problem allerdings nur scheinbar. Zwar bleiben bei einer solchen Anwendung eines probabilistischen Schlusses auf die beste Erklärung die Wahrscheinlichkeiten P j (Ej) unverändert, und es kann daher kein Dutch book gegen Peter auf der Grundlage dieser Wahrscheinlichkeiten gemacht werden. Allerdings ändern sich natürlich weiterhin die Wahrscheinlichkeiten PJ(H¡) der Hypothesen H¡ auf eine Weise, die von derjenigen eines Bayesianisten verschieden ist - und daher kann aufgrund dieser Wahrscheinlichkeiten in völlig analoger Weise ein Dutch book gegen Peter gemacht werden, wie ich nun zeigen werde: Vor dem ersten Wurf des Würfels schlägt der Buchmacher Peter drei Wetten vor, die die folgenden Hypothesen betreffen: 25

Diese Möglichkeiten sind allerdings durch ein wenig Mathematik beschränkt. Wie weiter oben bereits erwähnt, ergibt sich die Wahrscheinlichkeit von E5 nach dem vierten Wurf gemäß der folgenden Formel: Ρ5(Ε5) = Σ η · ί = 1 [Ρ(Ε 5 ΐΗί)·Ρ 4 (Η0] = P(E5 IH,)· P4(Hi) + P(E51 H2) · P4(H2) +... + P(E5 I H10) · P 4 (H, 0 ) = 0,87. Allein die Summanden für i e {7,8,9, 10} machen bereits etwa 95% der Summe aus. Hierbei handelt es sich aber gerade um diejenigen Hypothesen H¡, die die Daten gut erklären. Deren Wahrscheinlichkeit kann deshalb nur in sehr geringem Maße erhöht werden, denn da Ρ (Es) konstant bleiben muß, müssen die übrigen Summanden, die nur etwa 5% der Summe ausmachen, die vorgenommene Erhöhung ausgleichen. Die Aufgabe ist um so schwieriger, als Hypothese Hi die schlechteste Erklärung der Daten darstellen dürfte und aufgrund ihres explanatorischen Versagens den stärksten Abzug erhalten sollte - ihr Beitrag liegt aber nach 4 Würfen bereits bei etwa 4 · 10" .

5.4 Einwände gegen van Fraassens Argument (5.22) Die für die neuen Wetten relevanten

273

Hypothesen

V: Der Würfel fällt bei den ersten vier Würfen auf Seite x. H: Hypothese H3 ist wahr. Die Wetten lauten wie folgt (der Buchmacher zahlt die nachstehenden Beträge an Peter, falls dieser die Wetten eingeht und gewinnt; ansonsten zahlt er nichts): (5.23) Die ersten drei neuen Wetten Wette !„„,: V ist wahr und H ist wahr. Wette 2„eu: Vist falsch. Wette 3 neu : V ist wahr.

10.000 DM 31,97 DM 11,97 DM

Peters subjektive Wahrscheinlichkeiten für die betreffenden Hypothesen betragen vor dem ersten Wurf: (5.24) Peters Wahrscheinlichkeiten für die relevanten Hypothesen P(VaH): P(-iV): P(V):

26

0,00081 0,74667 0,25333

Damit ergeben sich für Peter die folgenden fairen Preise für die drei Wetten: (5.25) Die für Peter fairen Preise für die neuen Wetten Fairer Preis von Wette l neu (V λ Η): FPineu = Fairer Preis FPînou = Fairer Preis FP3neu =

0,00081 • 10.000 DM = 8,10 DM von Wette 2neu (—iV): 0,74667 · 31,97 DM = 23,87 DM von Wette 3neu (V): 0,25333 · 11,97 DM = 3,03 DM

Peter geht nun zu den jeweiligen fairen Preisen alle drei Wetten mit dem Buchmacher ein, d. h., er kauft die Wetten von ihm für den Ge-

26

Die letzten beiden Wahrscheinlichkeiten sind wie im vorigen Beispiel, die erste Wahrscheinlichkeit ergibt sich aufgrund der Definition von P(V|H) wie folgt:

Ρ(ν|Η) = Ρ(ρ,„.Η) o P(V a H) = P(VIΗ) · Ρ(Η) = (0,3)4 • 0,1 =0,00081.

274

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

samtpreis von 35,00 DM. D i e ersten vier Würfe werden ausgeführt, es gibt zwei mögliche Ergebnisse: I) Der Würfel fällt nicht bei allen vier Würfen auf Seite x: In diesem Fall hat der Buchmacher - da V falsch ist - die Wetten 1 und 3 gewonnen und Wette 2 verloren. Dementsprechend zahlt er wie vereinbart 31,97 D M an Peter. Das Wettspiel ist beendet. Der Buchmacher erzielt einen Reingewinn von 3,03 D M . (Die Frage, ob H wahr oder falsch ist, braucht nicht mehr entschieden zu werden, da sie nur für Wette 1 relevant ist, die aber bereits entschieden ist dadurch, daß sich V als falsch herausgestellt hat.) II) Der Würfel fällt viermal hintereinander auf Seite x : In diesem Fall hat der Buchmacher - da V wahr ist - Wette 2 gewonnen und Wette 3 verloren. Dementsprechend zahlt er schon einmal 11,97 D M an Peter, und das Wettspiel geht weiter. Wette 1 hängt nun nur noch davon ab, o b Hypothese H wahr oder falsch ist. Bevor nun aber diese Frage entschieden wird, schlägt der Buchmacher eine weitere Wette mit nachstehendem Gewinn vor: (5.26) Vierte neu angebotene Wette 4„eu:

Wette

H ist wahr.

10.000 D M

Auf der Grundlage rein bayesianistischer Erwägungen sollte nach den ersten vier Würfen Peters subjektive Wahrscheinlichkeit für Hypothese H (die besagt, daß Hypothese H 3 wahr ist) gleich P 4 (H 3 ) = 0 , 0 0 3 1 9 7 betragen. 27 Da Peter sich aber von Erwin hat überzeugen lassen, die explanatorische Kraft von H3 bei der Bestimmung ihrer Wahrscheinlichkeit zu berücksichtigen, und da die Hypothese die Daten extrem schlecht erklärt, liegt Peters tatsächliche subjektive Wahrscheinlichkeit für H 3 niedriger als 0,003197. Nehmen wir an, sie betrage P p e t e r ( H 3 ) = 0,002. (Der genaue Wert ist nicht wichtig.) Für Peter ergibt sich damit als fairer Preis für Wette 4 neu : 4

(5.27) Der für Peter faire Preis von Wette 4neu FP4neu = 0 , 0 0 2 · 10.000 D M = 2 0 , 0 0 D M Für diesen Preis kauft nun der Buchmacher Wette 4„eil von Peter. Stellt sich H tatsächlich als wahr heraus, so erhält der Buchmacher 10.000 27

Vgl. die in (S.12) angegebene Formel zur Berechnung dieser Wahrscheinlichkeit.

5.4

Einwände gegen van Fraassens

Argument

275

DM von Peter; im anderen Falle erhält er nichts und hat seinen Einsatz von 20,00 DM verloren. Wiederum ziehen wir vor Ausführung des fünften Wurfes eine Zwischenbilanz'. Bis jetzt hat der Buchmacher von Peter 35,00 DM als Preis für die Wetten l„eu, 2MU und 3neu erhalten. Er hat Wette 2neu gewonnen, aber Wette 3neu verloren und daher 11,97 DM an Peter gezahlt. Weiterhin hat er an Peter einen Preis von 20,00 DM für Wette 4 gezahlt. D. h., bisher weist die Zwischenbilanz des Buchmachers ein Plus von 3,03 DM auf. Es gibt nun wiederum zwei Möglichkeiten: IIa) Hypothese H stellt sich als wahr heraus : Der Buchmacher verliert in diesem Fall Wette l„eu und zahlt daher 10.000 DM an Peter. Gleichzeitig gewinnt er aber Wette 4„eu und erhält somit 10.000 DM von Peter. Insgesamt ändert sich also nichts an seiner Zwischenbilanz. IIb) Hypothese H stellt sich als falsch heraus : Dann gewinnt der Buchmacher Wette 1 neu und zahlt daher nichts an Peter. Gleichzeitig hat er aber Wette 4„eu verloren und erhält somit auch kein Geld von Peter. An seiner Zwischenbilanz ändert sich also wiederum nichts. Dies bedeutet, daß die Zwischenbilanz des Buchmachers unverändert bleibt - unabhängig davon, ob sich Hypothese H als wahr oder als falsch herausstellt. Der Buchmacher verläßt das Wettspiel mit einem Reingewinn von 3,03 DM. Erneut konnte ein Dutch book gegen Peter gemacht werden. Und wiederum hätte Peter das böse Ende schon vor Beginn des Wettens kommen sehen können. Eine modifizierte Art und Weise der Bestimmung der Wahrscheinlichkeiten der verschiedenen Hypothesen, bei der nur einige der Hypothesen durch einen Bonus belohnt, andere aber durch Abzüge bestraft werden, kann also das von van Fraassen beschriebene Ergebnis nicht verhindern. Somit ist nach der ersten Variante des Einwandes - geänderte Verteilung von Bonus-Wahrscheinlichkeiten - auch die zweite Variante gescheitert - Boni für die explanatorisch starken Hypothesen und Abzüge für die explanatorisch schwachen. Die Modifikation der Wahrscheinlichkeiten der verschiedenen Hypothesen über die von der BE geforderte ausschließliche Anwendung des Konditionalisierungs-Prinzips hinaus führt zu den von van Fraassen beschriebenen Inkohärenzen. Es sei denn, es kann gezeigt werden, daß in den hier beschriebenen Dutch book-Argumenten ein Fehler steckt. Genau diese Absicht verfolgt der im folgenden Abschnitt zu besprechende Einwand gegen van Fraassens Argument.

276

-5 Schluß auf die beste Erklärung und Bayes. Erkenntnistheorie 5.4.3

Ein vermeintlicher Fehler im Dutch book-Argument

Die im letzten Abschnitt diskutierten Einwände gegen van Fraassens Argument versuchten zu zeigen, daß die beschriebene Inkohärenz sich nur deswegen einstellt, weil der Schluß auf die beste Erklärung falsch angewendet und die Bonus-Wahrscheinlichkeiten auf eine nicht angemessene Weise verteilt werden. Der in diesem Abschnitt zu diskutierende Einwand versucht dagegen nachzuweisen, daß sich die von van Fraassen beschriebene Konsequenz überhaupt nicht einstellt. In seinem Artikel „Inference to the Best Explanation Made Coherent" argumentiert Igor Douven (1999), daß man sehr wohl die von van Fraassen beschriebene probabilistische Version des Schlusses auf die beste Erklärung zur Änderung seiner subjektiven Wahrscheinlichkeiten verwenden kann, ohne daß man dadurch anfällig für ein dynamisches (d. h. diachronisches) Dutch book wird. Die Grundidee von Douvens Argument besteht darin, daß Regeln zur Änderung von subjektiven Wahrscheinlichkeiten wie das Konditionalisierungs-Prinzip oder Peters probabilistische Version des Schlusses auf die beste Erklärung nicht isoliert betrachtet werden dürfen, sondern immer im Zusammenhang mit einer entsprechenden Regel zur Berechnung von bedingten Wahrscheinlichkeiten gesehen werden müssen. Tatsächlich muß ja für einen Bayesianisten, wie in Abschnitt 5.2.1 beschrieben, erstens das Konditionalisierungs-Prinzip gelten - d. h. bei der Änderung von subjektiven Wahrscheinlichkeiten nach Erhalt neuer Information E die Gleichung Pneu(H) = Pau(HlE) erfüllt sein; und zweitens muß die bedingte Wahrscheinlichkeit Pait(H IE) nach dem Bayesschen Theorem berechnet werden. Douven votiert nun für ein neues Paar, das ein Anhänger des Schlusses auf die beste Erklärung an die Stelle des bayesianistischen Paares setzen kann. Diese Grundidee wendet Douven folgendermaßen auf das Beispiel an: Er schlägt zunächst vor, die Wahrscheinlichkeiten für die Hypothesen V und F, auf die gewettet wird, nicht nach der Formel zu berechnen, die van Fraassen anwendet und die auch ich bei der Diskussion verwendet habe, sondern nach einer allgemeineren Formel. Um welche Formel es sich hierbei genau handelt, ist für das folgende nicht von Bedeutung. Wichtig ist lediglich, daß, erstens, in diese Formel bedingte Wahrscheinlichkeiten der Form P(H¡ I E) eingehen, was bei van

5.4

Einwände gegen van Fraassens

Argument

277

Fraassens Formel nicht der Fall ist; daß, zweitens, diese Formel für die Wahrscheinlichkeiten der Hypothesen V und F genau dann dieselben Ergebnisse liefert wie van Fraassens Formel, falls die bedingten Wahrscheinlichkeiten P(H¡\E) nach dem Bayesschen Theorem berechnet werden·, und daß, drittens, Douven diese Faktoren nicht nach dem Bayesschen Theorem berechnet, sondern nach einer anderen Formel. Dies hat zur Folge, daß Peter vor Beginn des Würfeins andere subjektive Wahrscheinlichkeiten für die Hypothesen V und F hat als Bastian. Da die Wahrscheinlichkeiten dieser Hypothesen wie gesehen in die Berechnung der fairen Preise für die Wetten 1 bis 3 eingehen, erhält Peter auch andere faire Preise für die Wetten 1 bis 3 als Bastian. Daher sind die Wetten für Peter zu Bastians Preisen nicht fair (und für Bastian sind die Wetten zu Peters Preisen nicht fair). Aus diesem Grund geht Peter die ihm von Bastian zu dessen Preisen angebotenen Wetten nicht ein (und Bastian geht die Wetten zu Peters Preisen nicht ein). Selbstverständlich hat dies zur Folge, daß Bastian gegen Peter kein dynamisches Dutch book arrangieren kann. Und dies gilt, obwohl Peter seine subjektiven Wahrscheinlichkeiten nicht nach dem Konditionalisierungs-Prinzip, sondern nach einer anderen Regel ändert nämlich einem (nicht näher spezifizierten) probabilistischen Schluß auf die beste Erklärung. Douven scheint also gezeigt zu haben, daß man eine probabilistische Version des Schlusses auf die beste Erklärung zur Änderung seiner subjektiven Wahrscheinlichkeiten benutzen kann, ohne anfällig für ein dynamisches Dutch book zu werden. Douvens Vorschlag, zur Berechnung der Wahrscheinlichkeiten der Hypothesen V und F eine andere Formel zu benutzen und die darin auftretenden bedingten Wahrscheinlichkeiten der Form P(H¡ I E) nicht nach dem Bayesschen Theorem zu berechnen, ist nicht so willkürlich, wie es zunächst den Anschein haben mag. Wie erwähnt liefert Douvens Formel genau dieselben Wahrscheinlichkeiten wie van Fraassens Formel, falls die Faktoren P(H¡ I E) mit dem Bayesschen Theorem berechnet werden. Insofern ist die Verwendung der neuen Formel unproblematisch. Die bedingten Wahrscheinlichkeiten der Form P(H¡ I E) nicht nach dem Bayesschen Theorem zu berechnen, scheint Douven ebenfalls gut motivieren zu können: Peter weiß bereits vor dem ersten Wurf, daß er beispielsweise Hypothese Hn nach dem vierten Wurf mit einer Bonus-Wahrscheinlichkeit belohnen wird, falls der Würfel viermal nacheinander auf Seite χ fällt. Und er weiß ebenfalls, daß er Hy-

278

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

pothese -iF nach dem vierten Wurf eine Wahrscheinlichkeit geben wird, die zum einen von deijenigen verschieden ist, die er ihr vor Beginn der Würfe gab, und zum anderen von der bayesianistisch ermittelten Wahrscheinlichkeit. (Gerade dies ermöglicht Bastian ja das dynamische Dutch book gegen Peter.) Welche neue Wahrscheinlichkeit er Hypothese -iF gibt, hängt aber nicht nur von der Regel ab, die die Bonuszuteilung an die Hypothesen regelt, sondern auch von den bedingten Wahrscheinlichkeiten P(H¡|E). Und diese sollten nun nach Douven so berechnet werden, daß sie zur gewählten Regel .passen', d. h. in Verbindung mit dieser Regel keine Wahrscheinlichkeiten ergeben, die ein dynamisches Dutch book ermöglichen. Auch das Konditionalisierungs-Prinzip und das Bayessche Theorem passen ja in diesem Sinn zueinander. Es scheint nur natürlich, dies auch für andere epistemische Strategien zu fordern.28 Douvens Vorschlag erscheint also zunächst recht plausibel. Er hat allerdings einen entscheidenden Nachteil: Wenn man nämlich wie Douven die bedingten Wahrscheinlichkeiten P(H¡ I E) nicht nach dem Bayesschen Theorem berechnet, sondern nach einer anderen - auf den probabilistischen Schluß auf die beste Erklärung abgestimmten - Regel, erhält man ein System von subjektiven Wahrscheinlichkeiten, durch das man anfällig für ein Dutch book der statischen (d. h. synchronischen) Art wird! Hierüber ist sich Douven völlig im klaren: We have now seen how the non-Bayesian can avoid dynamic Dutch book vulnerability. However, the story cannot quite end here. For as de Finetti (1937, 68ff.) has shown, you will be vulnerable to a static Dutch book unless your degrees of belief satisfy, for all A and B, the following double equation: p(A & B) = p(A) χ ρ(Β I A) = ρ (Β) χ ρ(A I Β). (4) As is easily verified, in our account the non-Bayesian will not generally satisfy (4) [...]. (Douven 1999: 432; H. d. A.) 28

Da Douvens Argument völlig allgemein sein soll, schlägt er keine genaue Regel des probabilistischen Schließens auf die beste Erklärung vor und dementsprechend auch keine genaue Formel zur nicht-bayesianistischen Berechnung der bedingten Wahrscheinlichkeiten P(H¡ I E). Seine Behauptung ist, daß es zu jeder Regel des probabilistischen Schließens auf die beste Erklärung eine entsprechende Formel zur Berechnung der bedingten Wahrscheinlichkeiten P(H¡ IE) gibt; diese Formel „corresponds to or is symmetrical with the process of updating we enter into at the moment the data [...] start coming in" (Douven 1999:429; H. d. Α.).

5.4

Einwände gegen van Fraassens Argument

279

Douven hat also gezeigt, daß eine Person, die anstelle des Konditionalisierungs-Prinzips eine probabilistische Version des Schlusses auf die beste Erklärung verwendet und ihre bedingten Wahrscheinlichkeiten entsprechend berechnet, eine Anfälligkeit für ein Dutch book der dynamischen Art vermeiden kann - allerdings um den Preis, daß sie nun anfällig für ein Dutch book der statischen Art wird. Kurz gesagt lautet das Resultat von Douvens Argument also: Wer statt des Konditionalisierungs-Prinzips eine probabilistische Version des Schlusses auf die beste Erklärung verwendet, wird entweder anfällig für ein dynamisches oder für ein statisches Dutch book. Ändert Douvens Einwand irgend etwas an der Sprengkraft von van Fraassens Argument? - Selbstverständlich nicht! Entscheidend bei van Fraassens Argument ist ja nicht, daß die Verwendung einer probabilistischen Version des Schlusses auf die beste Erklärung zu einem Dutch book der dynamischen Art, sondern daß sie überhaupt zu einem Dutch book führt. Der springende Punkt ist, daß Peter durch seine Verwendung einer probabilistischen Version des Schlusses auf die beste Erklärung ein System von Glaubensgraden erhält, das ein Arrangement von Wetten gegen ihn ermöglicht, die er alle für fair hält, bei dem er aber sicher verlieren wird, wie auch immer die einzelnen Wetten ausgehen. Und diese Konsequenz vermeidet Douvens Vorschlag überhaupt nicht. Douven sieht in dem Umstand, daß Peter nun anfällig für ein statisches Dutch book wird, erstaunlicherweise keinen Nachteil. Er reagiert hierauf vielmehr mit der folgenden Überlegung: Peter weiß, daß sein System von Glaubensgraden die obige Gleichung nicht erfüllt und daß daher ein statisches Dutch book gegen ihn gemacht werden kann. D. h., er weiß, daß er einen sicheren Verlust erleiden wird, wenn er die betreffenden Wetten zu seinen fairen Preisen eingeht. Daher sollte er es einfach ablehnen, diese Wetten einzugehen. Douvens Ratschlag an Peter lautet also: [...] simply check, whenever you want to make a bet, that it does not lead to a sure loss in combination with bets already made. Quite evidently, if a bettor follows this principle, no static Dutch book can be made against him. (Douven 1999: 432)

Nun, wenn dies letztendlich die Lösung ist, dann hätte man sie zum einen einfacher haben können: Benutze eine probabilistische Version

280

S Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

des Schlusses auf die beste Erklärung und gehe einfach nie irgendwelche Wetten ein! Natürlich wird man dann auch nie einen sicheren Verlust beim Wetten erleiden.29 Zum anderen handelt es sich natürlich weder bei Douvens noch bei diesem allgemeineren Vorschlag um eine Lösung des eigentlichen Problems. Denn die Irrationalität der Verwendung einer probabilistischen Version des Schlusses auf die beste Erklärung besteht nicht darin, daß man möglicherweise Geld verliert. Sie liegt vielmehr in einer Inkohärenz des Überzeugungssystems, das man im Hinblick auf die angebotenen Wetten hat. Man hält die einzelnen Wetten, die in einem Dutch book vorgeschlagen werden, für fair, das gesamte Arrangement aber für nicht fair. David Lewis drückt dies folgendermaßen aus: Note also that the point of any Dutch book argument is not that it would be imprudent to run the risk that some sneaky Dutchman will come and drain your pockets. After all, there aren't so many sneaky Dutchmen around; and anyway, if ever you see one coming, you can refuse to do business with him. Rather, the point is that if you are vulnerable to a Dutch book, whether synchronic or diachronic, that means that you have two contradictory opinions about the expected value of the very same transaction. To hold contradictory opinions may or may not be risky, but it is in any case irrational. (Lewis 1999b: 404 f.) 30

Douven erwidert auf diesen Vorwurf, daß man besagte Irrationalität vermeiden könne, indem man in denjenigen Fällen, in denen man sich einem Dutch book ausgesetzt sieht, einfach das Formen von Meinungen über die Fairneß von Wetten unterläßt. Wir sollten Abstand nehmen „from making judgments about the fairness of bets under those conditions" (Douven 1999: 433, Fußnote 8). Diese Replik halte ich allerdings für eine ad Aoc-Lösung, die Douven nur aus dem einzigen Grund vorschlägt, um dem Vorwurf der Irrationalität entgehen zu können. Tatsächlich hat Douven auch keine unabhängige Begründung für diese .Lösung' anzugeben. 29

Die Situation ist hier allerdings im Hinblick auf statische und dynamische Dutch books nicht völlig symmetrisch. Vgl. zu dieser Frage Mäher (1992, 1993) und Skyrms (1993). Lewis' Einschätzung der Pointe von Dutch book-Argumenten wird beispielsweise auch von Ramsey (1926), Skyrms (1984: Kap. 2; 1987b), van Fraassen (1989: 361, Fußnote 10), Howson/Urbach (1989: Kap. 3) und Christensen (1991, 1996) geteilt.

5.4 Einwände gegen van Fraassens Argument

281

Darüber hinaus scheint mir Douvens Vorschlag noch aus einem weiteren Grund unplausibel zu sein. Seine Strategie kann nicht nur für jede der vielen möglichen probabilistischen Versionen des Schlusses auf die beste Erklärung angewendet werden; sie kann vielmehr für alle Methoden der Modifikation von Wahrscheinlichkeiten verwendet werden, die vom Konditionaiisierungs-Prinzip verschieden sind. Natürlich gibt es beliebig viele solcher Methoden: Gebe derjenigen Hypothese einen Bonus, die die schlechsteste Erklärung der Daten darstellt, an die zuerst gedacht wurde, die in ihrer deutschen Standard-Formulierung mit einem „L" beginnt usw. Auffällig ist, daß man bei allen diesen Methoden ausnahmslos für ein (statisches oder dynamisches) Dutch book anfallig wird - außer bei Anwendung des Konditionalisierungs-Prinzips in Verbindung mit einer Berechnung bedingter Wahrscheinlichkeiten über das Bayessche Theorem. Diese Argumente scheinen mir hinreichend zu begründen, daß der in diesem Abschnitt besprochene Einwand Douvens gegen van Fraassens Argument ebensowenig stichhaltig ist wie der in Abschnitt 5.4.2 diskutierte. Die Verteilung von Bonus-Wahrscheinlichkeiten an die verschiedenen Hypothesen auf der Grundlage ihrer explanatorischen Kraft führt in jeder möglichen Form und in Verbindung mit jeder Art der Berechnung bedingter Wahrscheinlichkeiten zu Inkohärenzen. Eine letzte Möglichkeit, van Fraassens Argument anzugreifen, besteht nun darin, die Verteilung von Β onus-Wahrscheinlichkeiten grundsätzlich abzulehnen und seine Konzeption einer probabilistischen Version des Schlusses auf die beste Erklärung als nicht angemessen zurückzuweisen.

5.4.4

Unplausible Konzeption des Schlusses auf die beste Erklärung

Der Vorschlag, die Verteilung von Bonus-Wahrscheinlichkeiten an die verschiedenen Hypothesen abzulehnen (ebenso wie Abzüge in ihrer Wahrscheinlichkeit), vermeidet das dynamische Dutch book-Szenario, da die hinreichende Bedingung für eine solche Vermeidung, nämlich die ausschließliche Anwendung des KonditionalisierungsPrinzips, erfüllt ist. Allerdings muß dieser Vorschlag, um den Anstrich einer ad Aoc-Lösung zu vermeiden, gute Gründe im Gefolge führen, warum in van Fraassens Beispiel die Wahrscheinlichkeiten der ver-

282

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

schiedenen Hypothesen nicht gemäß ihrer explanatorischen Kraft verändert werden dürfen. Vorderhand scheint es jedenfalls sehr plausibel zu sein, daß die verschiedenen Hypothesen die gegebenen Daten verschieden gut bzw. schlecht erklären, daß insbesondere Hypothese H„ die beste Erklärung der Daten darstellt und daß diese Eigenschaften der verschiedenen Hypothesen bei der Bestimmung ihrer Wahrscheinlichkeit berücksichtigt werden sollten. Eine solche Begründung versucht der bereits im letzten Abschnitt erwähnte Douven (1999: 426) zu geben. Nach Douvens Auffassung setzen Anwendungen des Schlusses auf die beste Erklärung ein reichhaltiges Hintergrundwissen voraus, das die Beurteilung der Güte einer Erklärung und die Auswahl einer besten Erklärung überhaupt erst möglich macht. Ein solches Hintergrundwissen liegt aber nach Douvens Ansicht im beschriebenen Fall nicht vor, da es sich um einen Würfel von einem fremden Planeten handelt. Aus diesem Grund sollten auch keine Bonus-Wahrscheinlichkeiten an Hypothesen vergeben werden, die vermeintlich gute Erklärungen der Daten darstellen: Presumably not even the staunchest defender of IBE [i. e., inference to the best explanation] would want to hold that IBE is applicable in every context. Indeed, it is exactly the sort of context in which van Frasssen puts the discussion that seems not to license an inference to the best explanation. For, as Lipton (1991) and Day and Kincaid (1994) have pointed out, IBE is a contextual principle in that it draws heavily upon background knowledge for its application, e. g., in order to judge which hypothesis among a number of rivals is the best explanation for the data gathered. However, in van Fraassen's model there is no such knowledge to invoke (the die is purposely chosen to be an alien die). (Douven 1999: 426; H. d. A.)

Dieser Einwand kann van Fraassens Argument allerdings nicht entkräften. Auch wenn man einräumt, daß in van Fraassens Beispiel zuwenig Hintergrundwissen für einen Schluß auf die beste Erklärung vorliegt und daß daher keine Zuteilung von Bonus-Wahrscheinlichkeiten erfolgen sollte, ändert sich nichts an der Schlagkraft von van Fraassens Argument. Man wähle einfach ein Beispiel, in dem ausreichend Hintergrundwissen vorliegt und die bayesianistische Maschinerie anwendbar ist, und man erhält genau dasselbe inkohärente Ergebnis. Beispielsweise kann man dies erreichen, indem man nicht einen Würfel von einem fremden Planeten, sondern einen gewöhnlichen von der Erde untersucht. Dann müssen zwar die Wahrscheinlichkeiten der

5.4

Einwände gegen van Fraassens

Argument

283

Ausgangshypothesen anders angesetzt werden - beispielsweise erhält diejenige Hypothese, die das Ergebnis , Seite x' in einem Sechstel der Fälle vorhersagt, die höchste Ausgangswahrscheinlichkeit; aber nach einer Reihe von Würfen, die ausnahmslos das Ergebnis , Seite x' ergeben, wird immer noch Hypothese H„ die beste Erklärung der Daten darstellen und von einem Befürworter des Schlusses auf die beste Erklärung eine Bonus-Wahrscheinlichkeit erhalten. Es wird sich dann genau dasselbe Ergebnis einstellen wie in van Fraassens ursprünglichem Beispiel. Douvens Verweis auf fehlendes Hintergrundwissen führt also nicht zum Ziel. Auf eine andere Art und Weise versucht Yemima Ben-Menahem (1990: 327-331) in ihrem Artikel „The Inference to the Best Explanation" van Fraassens Konzeption des Schlusses auf die beste Erklärung anzugreifen. Auch sie spricht sich grundsätzlich gegen eine Verteilung von Bonus-Wahrscheinlichkeiten aus. Sie begründet dies allerdings nicht mit mangelndem Hintergrundwissen, sondern sucht den Fehler in dem Kriterium, das van Fraassen verwendet, um die explanatorische Güte der verschiedenen Hypothesen einzuschätzen. Ben-Menahem untersucht zunächst van Fraassens Auffassung, Hypothese Hn sei die beste Erklärung für den Ausgang der ersten vier Würfe, bei denen der Würfel immer auf Seite χ gefallen war. (H„ besagt wie erwähnt, daß die Wahrscheinlichkeit, mit der der Würfel bei einem beliebigen Wurf auf Seite χ fällt, gleich ~ = 1 ist.) Diese Einschätzung von Hn als der besten Erklärung nimmt van Fraassen nach Ben-Menahems Ansicht aufgrund des folgenden Kriteriums vor: [...] hypotheses which entail the data constitute better explanation [sic] thereof than hypotheses which only make it highly probable, and similarly, [...] hypotheses lending higher probability to the data are superior to those which lend it lower probability. (Ben-Menahem 1990: 329; m. H.)

An diesem Kriterium zur Beurteilung der explanatorischen Güte einer Hypothese selbst hat Ben-Menahem nichts zu beanstanden, denn „it seems reasonable to regard the hypothesis which confers higher probability on the data as the better explanation" (Ben-Menahem 1990: 329). Für problematisch hält sie vielmehr die Anwendung dieses Kriteriums in van Fraassens Beispiel:

284

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

[...] it seems unreasonable to use this criterion to modify the very probabilities that gave rise to our evaluation. If the only way to assess explanatory power in this case is to compare the probabilities conferred upon the data by the various hypotheses, how can we then use the evaluation of explanatory power reached by that method to modify the very probabilities we have used? (Ben-Menahem 1990: 329; m. H.)

Dieser Einwand beruht auf einem Irrtum Ben-Menahems. Es ist zwar richtig, daß die Einschätzung der explanatorischen Kraft der verschiedenen Hypothesen auf einem Vergleich der Wahrscheinlichkeiten beruht, die sie den Daten verleihen, d. h. auf einem Vergleich von P(E|H¡). Für i = η ist diese Wahrscheinlichkeit beispielsweise am höchsten, nämlich gleich 1, und daher wird H„ die größte explanatorische Kraft zugeschrieben. Allerdings ist unklar, was Ben-Menahem meint, wenn sie behauptet, daß auf der Grundlage dieser Einschätzung „the very probabilities that gave rise to our evaluation", „the very probabilities we have used" (Ben-Menahem 1990: 329) modifiziert würden. Mit diesen „very probabilities" kann sie nur wiederum die Wahrscheinlichkeiten P(E|H¡) meinen - aber diese bedingten Wahrscheinlichkeiten werden überhaupt nicht verändert, sie bleiben über den gesamten Verlauf des Experiments konstant.'31 Was sich aufgrund der Einschätzung der explanatorischen Kraft der Hypothesen H, ändert, sind die Wahrscheinlichkeiten PJ(H¡) der verschiedenen Hypothesen und die Wahrscheinlichkeit Pj(E¡), mit der beim j-ten Wurf der Würfel auf Seite χ fällt. Diese Wahrscheinlichkeiten gehen zwar in die Berechnung späterer Wahrscheinlichkeiten ein, allerdings dienen sie van Fraassen nicht als Grundlage für die Evaluierung der explanatorischen Kraft der verschiedenen Hypothesen. Ben-Menahem versucht, ihr Argument gegen van Fraassens Anwendung des Kriteriums zur Einschätzung der explanatorischen Güte der verschiedenen Hypothesen durch einen weiteren Einwand zu untermauern: What makes the suggested procedure for rewarding explanatory power even more problematic is the fact that if it were legitimate it could be iterated indefinitely: the hypothesis which has received the bonus would now

31

Beispielsweise ist wie erwähnt die bedingte Wahrscheinlichkeit des Ergebnisses .Seite x' beim j-ten Wurf unter der Voraussetzung von Hypothese Hn gegeben als: P(Ej I H„) = 1 - unabhängig von j\

5.4

Einwände gegen van Fraassens

Argument

285

constitute an even better explanation and would therefore deserve a second bonus etc., which is clearly absurd. (Ben-Menahem 1990: 330; m. H.)

Es wäre in der Tat absurd, wenn sich die Zuschreibung explanatorischer Kraft unendlich oft wiederholen lassen würde allein auf der Grundlage einer ersten Zuschreibung. Allerdings ist dies keineswegs der Fall. Es ist nämlich völlig unklar, warum „the hypothesis which has received the bonus would now constitute an even better explanation" (Ben-Menahem 1990: 330). Die explanatorische Kraft einer Hypothese ergibt sich wie gerade gezeigt allein auf der Grundlage einer Einschätzung von P(E | H¡) - und wie gesehen ändern sich diese Wahrscheinlichkeiten durch die Zuschreibung eines WahrscheinlichkeitsBonus überhaupt nicht. Es ändern sich hierdurch lediglich die Wahrscheinlichkeiten Pj(H¡), die von van Fraassen allerdings nicht zur Einschätzung der explanatorischen Kraft der Hypothesen herangezogen werden. Es ist daher völlig unklar, warum diejenigen Hypothesen, die einen Bonus erhalten, dadurch eine noch bessere Erklärung werden sollten. Ben-Menahems zweiter Einwand beruht auf demselben Irrtum wie ihr erster Einwand - sie verwechselt die Wahrscheinlichkeiten Pj(H¡) der Hypothesen mit den bedingten Wahrscheinlichkeiten p(EIH,). 32 Ben-Menahem liefert daher keine Begründung für ihre These, daß in van Fraassens Beispiel das genannte Kriterium zur Einschätzung der Güte einer Erklärung nicht angewendet werden darf und den Hypothesen somit keine explanatorischen Eigenschaften zugesprochen werden können. Es scheint nach wie vor sehr plausibel, daß die verschiedenen Hypothesen die gegebenen Daten verschieden gut bzw. schlecht erklären und daß insbesondere Hypothese H n die beste Erklärung der Daten darstellt. Es ist daher kein Grund zu sehen, warum diesen Hypothesen keine Bonus-Wahrscheinlichkeiten zugesprochen werden sollten, warum also der Schluß auf die beste Erklärung in van

32

Einem ähnlichen Irrtum unterliegt im übrigen Douven, wenn er behauptet, der Verwender einer probabilistischen Version des Schlusses auf die beste Erklärung gebe „extra credence to the hypothesis that explains the data best, where a hypothesis is taken to be the best explanation of the data so far simply if it has, so far, highest probability" (Douven 1999: 426; m. H.). Diese Behauptung ist schlicht falsch. Wie gesehen wird diejenige Hypothese als die beste Erklärung eingeschätzt, die den Daten die größte Wahrscheinlichkeit verleiht.

286

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

Fraassens Beispiel nicht in der von ihm gewählten Weise anwendbar sein sollte. Damit ist auch der Versuch gescheitert, van Fraassens Argument zu entkräften, indem man seine Konzeption einer probabilistischen Version des Schlusses auf die beste Erklärung als unplausibel zurückweist und eine Verteilung von Bonus-Wahrscheinlichkeiten daher grundsätzlich ablehnt. Wie ich in Abschnitt 5.4.1 erwähnt habe, gibt es allerdings noch eine weitere Möglichkeit, van Fraassens Konzeption des Schlusses auf die beste Erklärung anzugreifen. Die Verteilung von Bonus-Wahrscheinlichkeiten kann dann zurückgewiesen werden, wenn eine alternative Art und Weise der Berücksichtigung explanatorischer Erwägungen beschrieben werden kann, die plausibler ist als diejenige van Fraassens. Auf diese Möglichkeit werde ich im nächsten Abschnitt eingehen.

5.4.5

Alternative Konzeption des probabilistischen Schlusses auf die beste Erklärung

In seinem Artikel „Van Fraassen's Critique of Inference to the Best Explanation" (2000) versucht Samir Okasha zu zeigen, daß sich die von van Fraassen beschriebenen Inkohärenzen bei der Anwendung einer probabilistischen Version des Schlusses auf die beste Erklärung nur deswegen einstellen, weil dieser den Schluß auf die beste Erklärung falsch konzipiert: „[...] the conflict between IBE and Bayesianism alleged by van Fraassen depends entirely on an idiosyncratic way of representing IBE in probabilistic terms" (Okasha 2000: 703). Während van Fraassen die Verwendung des Schlusses auf die beste Erklärung als Teil eines zweistufigen Prozesses beschreibt, bei dem in einem ersten Schritt die Wahrscheinlichkeiten der verschiedenen Hypothesen H¡ nach dem Konditionalisierungs-Prinzip modifiziert werden und bei dem in einem zweiten Schritt die Hypothesen H¡ entsprechend ihrer explanatorischen Güte Bonus-Wahrscheinlichkeiten erhalten, schlägt Okasha folgende Methode zur Berücksichtigung explanatorischer Eigenschaften vor: The correct way of representing IBE, I suggest, views the goodness of explanation of a hypothesis vis-à-vis a piece of data as reflected in the prior

5.4

Einwände gegen van Fraassens Argument

287

probability of the hypothesis P(H), and the probability of the data given the hypothesis P(e IH). (Okasha 2000: 703; H. d. A.)

Explanatorische Erwägungen sollen nach Okashas Ansicht also nicht durch die Vergabe von Bonus-Wahrscheinlichkeiten berücksichtigt werden, sondern in die Bestimmung der Ausgangswahrscheinlichkeit P(H) der jeweils untersuchten Hypothese und der bedingten Wahrscheinlichkeit P(e|H) der Daten eingehen. Sie sollen benutzt werden „as an aid for calculating the priors and likelihoods needed to apply Bayes's theorem itself' (Okasha 2000: 703). Bei dieser Auffassung des Schlusses auf die beste Erklärung ergeben sich die von van Fraassen aufgezeigten Schwierigkeiten nach Okashas Meinung nicht: Relative to this account, favouring a hypothesis on the grounds that it provides a better explanation of one's data than other hypotheses, and indeed making it a rule to do so, is perfectly consistent with Bayesian principles. (Okasha 2000: 703)

Darüber hinaus ist Okasha der Ansicht, daß seine Konzeption des Schlusses auf die beste Erklärung viel besser die Art und Weise erfaßt, wie wir Schlüsse auf die beste Erklärung tatsächlich ziehen: Modelling IBE in the way I have suggested - as a way of determining priors and likelihoods - captures the phenomenology of inferring to the best explanation much better than van Fraassen's account. (Okasha 2000: 703; H. d. A.)

Ob Okashas Konzeption des Schlusses auf die beste Erklärung für den von van Fraassen beschriebenen Fall tatsächlich angemessener ist als dessen eigene Konzeption, läßt sich nur schwer beantworten - es ist nämlich völlig unklar, worin Okashas Vorschlag im Hinblick auf diesen Fall eigentlich bestehen soll. Okasha spricht davon, daß explanatorische Überlegungen in die Bestimmung der Ausgangswahrscheinlichkeiten P(H) und P(e IH) eingehen sollen - er gibt allerdings keinerlei Hinweise darauf, wie dies in van Fraassens Beispiel geschehen soll. Das ist wahrscheinlich kein Zufall. Versucht man nämlich, seinen Vorschlag umzusetzen, sieht man sich vor unüberwindbare Probleme gestellt. Wie sollen zunächst die Ausgangswahrscheinlichkeiten P(H¡) der verschiedenen Hypothesen H¡ in van Fraassens Beispiel nach Maßgabe explanatorischer Erwägungen bestimmt werden? Zu Beginn des

288

5 Schluß auf die beste Erklärung und Bayes. Erkenntnistheorie

Experiments liegt weder Information über den zu untersuchenden Würfel vor (außer daß er von einem fremden Planeten stammt), noch gibt es irgendwelche Daten, die die verschiedenen Hypothesen erklären könnten. Insofern hat vor Beginn des Experiments keine der Hypothesen H¡ irgendeine Form von explanatorischer Güte aufzuweisen. Dementsprechend können auch keine explanatorischen Erwägungen zur Festlegung ihrer Ausgangswahrscheinlichkeiten P(H¡) verwendet werden. Versucht man andererseits, Okashas Vorschlag nicht zu Beginn des Experimentes, sondern erst nach dem ersten oder weiteren Würfen umzusetzen, so führt dies offensichtlich wiederum dazu, daß die verschiedenen Hypothesen Wahrscheinlichkeiten erhalten, die von denjenigen verschieden sind, zu denen ein Bayesianist gelangt. Und in diesem Fall droht erneut die Gefahr eines Dutch book, das Okasha mit seinem Vorschlag ja gerade vermeiden will. Genausowenig ist zu sehen, inwiefern explanatorische Erwägungen die Festlegung der bedingten Wahrscheinlichkeiten P(Ej|H¡) beeinflussen könnten. Diese Wahrscheinlichkeiten hängen nämlich überhaupt nicht davon ab, wie gut H¡ die Daten erklärt - sie ergeben sich vielmehr aus dem semantischen Gehalt der jeweiligen Hypothese. Hypothese Hn besagt beispielsweise, daß die Wahrscheinlichkeit, mit der der Würfel bei einem beliebigen Wurf auf Seite χ fällt, ^ = 1 beträgt. Dementsprechend ist die bedingte Wahrscheinlichkeit P(Ej|H„), daß der Würfel beim j-ten Wurf auf Seite χ fällt, unter der Voraussetzung der Wahrheit von Hypothese H„ gleich 1. Ob und wie oft der Würfel tatsächlich auf Seite χ fällt und ob Hypothese H n die jeweiligen Ergebnisse gut erklärt oder nicht, spielt für den Wert von P(Ej I H n ) überhaupt keine Rolle. Er bleibt, wie bereits bei der Diskussion von BenMenahems Einwand im vorigen Abschnitt erwähnt, bei jedem möglichen Ergebnis des Würfelns unverändert. Okashas Vorschlag ist daher auf van Fraassens Beispiel überhaupt nicht anwendbar. Insofern hat Okasha für diesen Fall auch keine Konzeption des Schlusses auf die beste Erklärung angeben können, die plausibler wäre als diejenige, die van Fraassen vorschlägt. Dementsprechend wird van Fraassens Argument auch durch Okashas Einwand nicht entkräftet, der ebenso scheitert wie die in den vorigen Ab-

5.4

Einwände gegen van Fraassens Argument

289

schnitten diskutierten Einwände. 33 Van Fraassens Schlußfolgerung gilt also weiterhin: Eine probabilistische Version des Schlusses auf die beste Erklärung führt zu Inkohärenzen und muß abgelehnt werden. Darüber hinaus scheint sich Okasha über sein eigenes Argument zu täuschen und das Gegenteil von dem zu meinen, was er explizit schreibt. Dies wird deutlich, wenn man das Beispiel untersucht, das er selbst für seine alternative Konzeption des Schlusses auf die beste Erklärung vorbringt und das er im Hinblick auf den Schluß auf die beste Erklärung für besonders einschlägig hält: Consider a typical example of IBE. A mother takes her five-year-old child to the doctor. The child is obviously in some distress. On the basis of the mother's information, the doctor forms two competing hypotheses: that the child has pulled a muscle, and that he has torn a ligament; call these H, and H2 respectively. A keen advocate of IBE, the doctor examines the child carefully, and decides that H2 offers the better explanation of the observed symptoms·, she therefore tentatively accepts H 2 - though she does not believe it outright - and rejects H,. (Okasha 2000: 702 f.; m. H.) Nach Okashas Ansicht beschließt die Ärztin also nach einer ausführlichen Untersuchung des Kindes, daß Hypothese H 2 die bessere Erklärung der beobachteten Symptome darstellt, und sie hält Hypothese H 2 aus diesem Grund für wahrscheinlicher als H^ Auf welcher Grundlage trifft die Ärztin nun die Entscheidung, daß H 2 eine bessere Erklärung der Symptome und daher wahrscheinlicher als Hi ist? Diese Frage beantwortet Okasha folgendermaßen: Suppose we ask the doctor to justify her reasoning. She answers: 'firstly, preadolescent children very rarely pull muscles, but often tear ligaments. Secondly, the symptoms, though compatible with either diagnosis, are exactly what we would expect if the child has torn a ligament, though not if he has pulled a muscle. Therefore the second hypothesis is preferable.' This reasoning can be represented in probabilistic terms as follows: 'given the background information, the prior probability of H2 is higher than that 33

Ebenso wie Okasha schlagen auch Day/Kincaid (1994: 285 f.) und Harman (1997: 139 ff.) vor, explanatorische Erwägungen bei der Einschätzung der Ausgangswahrscheinlichkeiten P(H) und P(E|H) ZU berücksichtigen. Aber auch diese Autoren erläutern nicht, wie der Vorschlag in van Fraassens Beispiel umzusetzen sein soll. Die im letzten Unterabschnitt erwähnte Yemima Ben-Menahem (1990: 330) deutet ebenfalls eine solche Konzeption des Schlusses auf die beste Erklärung an, konzidiert aber, daß sie auf van Fraassens Fall nicht anwendbar ist.

290

S Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

o f H i ; the probability of the evidence conditional on H2 is greater then [sic] its probability conditional on Hi, therefore the posterior probability of H2 is greater than that of H,.' (Okasha 2000: 703; m. H.) Die Ärztin hält H 2 also deswegen für eine bessere Erklärung der Daten und deswegen für wahrscheinlicher als H ( , weil erstens ihre Ausgangswahrscheinlichkeit P(H2) höher ist und weil zweitens die bedingte Wahrscheinlichkeit der Daten unter ihrer Voraussetzung, nämlich P(E|H 2 ), höher ist als unter der Voraussetzung von Hi. Damit bestimmt die Ärztin - entgegen dem, was Okasha in den zu Anfang wiedergegebenen Passagen behauptet - die Wahrscheinlichkeiten P(H 2 ) und P(E|H 2 ) nicht unter Rekurs auf explanatorische Erwägungen. Es ist keineswegs der Fall, daß explanatorische Erwägungen benutzt werden „as an aid for calculating the priors and likelihoods" (Okasha 2000: 703). Die Wahrscheinlichkeiten Ρ(Η,), P(H 2 ), P(E|H,) und P(E|H 2 ) werden nicht danach bestimmt, wie gut H! und H 2 die Daten erklären. Im Gegenteil entscheidet die Ärztin aufgrund dieser Wahrscheinlichkeiten, welche Erklärung sie für die bessere hält: Sie hält H 2 für eine bessere Erklärung als Hi, weil P(H 2 ) und P(E|H 2 ) höher sind als P(Hi) und PÍE! H,). Es gehen also nicht explanatorische Erwägungen in die Bestimmung der Ausgangswahrscheinlichkeiten P(H) und P(EIH) ein, sondern umgekehrt gehen wahrscheinlichkeitstheoretische Erwägungen in die Bestimmung der Güte einer Erklärung ein. Dieser Irrtum Okashas illustriert noch einmal eine Tendenz bei der Behandlung des Schlusses auf die beste Erklärung, die in den vorigen Kapiteln dieser Arbeit bereits mehrfach zur Sprache kam. Hypothesen werden von einigen Autoren deshalb für bessere Erklärungen gehalten, weil sie wahrscheinlicher sind als konkurrierende Hypothesen und den Daten eine höhere Wahrscheinlichkeit verleihen als diese. Wie ich schon mehrfach argumentiert habe, ist dieses Kriterium zur Bestimmung der Güte einer Erklärung für die Zwecke des Schlusses auf die beste Erklärung wenig hilfreich. Der Schluß auf die beste Erklärung soll uns ja gerade ermöglichen zu entscheiden, welche von verschiedenen Hypothesen am wahrscheinlichsten ist - und zwar nach Maßgabe ihrer explanatorischen Kraft gegenüber den gegebenen Daten. Wir untersuchen die miteinander konkurrierenden Hypothesen im Hinblick darauf, wie gut sie die Daten erklären, und akzeptieren diejenige Hypothese als am wahrscheinlichsten, die die beste Erklärung der Daten darstellt. Wenn „die beste Erklärung" aber nichts anderes heißt

5.5 Folgen von van Fraassens Argument

291

als „die wahrscheinlichste Erklärung", dann können wir auf diesen Umweg Uber die ,explanatorische Güte' ganz verzichten und gleich nach der wahrscheinlichsten Hypothese suchen.

5.5

Folgen von van Fraassens Argument für den Schluß auf die beste Erklärung

Welche Konsequenzen hat das in diesem Kapitel diskutierte Argument von van Fraassen für den Status des Schlusses auf die beste Erklärung? Was zeigt es im Hinblick auf die Frage, welcher Zusammenhang zwischen der explanatorischen Kraft einer Hypothese und ihrer Wahrheit bzw. Wahrscheinlichkeit besteht? Die Diskussion in den letzten beiden Abschnitten hat gezeigt, daß in denjenigen Fällen, in denen ein System von subjektiven Wahrscheinlichkeiten vorliegt, die vor dem Hintergrund der zur Verfügung stehenden Daten modifiziert werden sollen, die explanatorische Kraft von Hypothesen gegenüber den vorhandenen Daten nicht durch die Verteilung von Bonus-Wahrscheinlichkeiten berücksichtigt werden kann. In diesen Fällen gibt es nur eine rationale Art und Weise der systematischen Änderung dieser Wahrscheinlichkeiten - nämlich Konditionalisierung. Wird statt des Konditionalisierungs-Prinzips eine probabilistische Version des Schlusses auf die beste Erklärung zur Modifikation der betreffenden Wahrscheinlichkeiten verwendet, ergibt sich ein inkohärentes Meinungssystem, das eine Anfälligkeit für ein Dutch book begründet. Van Fraassen hat den Schluß auf die beste Erklärung somit für einen großen Bereich möglicher Anwendungen diskreditiert. Dies bedeutet natürlich nicht, daß explanatorische Erwägungen bei der Einschätzung der Wahrscheinlichkeit von Hypothesen in jedem Fall abzulehnen wären. Wie erwähnt räumt auch van Fraassen ein, daß der Schluß auf die beste Erklärung nur dann zu den beschriebenen Inkohärenzen führt, wenn er in Konkurrenz zum Konditionalisierungs-Prinzip in Form einer alternativen Regel verwendet wird. In diesem abschließenden Abschnitt will ich kurz auf die verbleibenden Möglichkeiten eingehen, explanatorische Erwägungen bei Wahrscheinlichkeitseinschätzungen zu berücksichtigen.

292

5 Schluß auf die beste Erklärung und Bayes. Erkenntnistheorie

Eine Möglichkeit, explanatorische Erwägungen zu rehabilitieren, besteht darin, die Bedeutung des Resultats von van Fraassens Argument herunterzuspielen, indem man es auf einen engen Bereich von Fällen einzuschränken versucht: Die von van Fraassen aufgezeigte Konsequenz der Anwendung eines probabilistischen Schlusses auf die beste Erklärung gilt nur für eine kleine Zahl möglicher Anwendungen; sie ist für Beispiele einschlägig, wie van Fraassen sie beschreibt; diese Beispiele sind aber sehr künstlich und nicht repräsentativ; das von ihm beschriebene Experiment ist sehr vereinfacht und läßt sich nur schwer auf tatsächliche Fälle aus der Wissenschaft und dem Alltag Ubertragen; Peter beginnt mit sehr wenigen und dazu recht simplen Hypothesen, und er macht relativ wenige Experimente - das Scheitern des Schlusses auf die beste Erklärung ist in diesem besonderen Charakter des Versuchsaufbaus begründet. Dieser Versuch der Marginalisierung von van Fraassens Argument führt allerdings nicht zum Ziel, denn die Details von van Fraassens Experiment sind für das Ergebnis völlig irrelevant: Ob Peter die Untersuchung des Würfels mit 10 oder mit 1034 Hypothesen beginnt, ob diese zu Anfang alle als gleich wahrscheinlich gelten oder ob einige Hypothesen eine höhere Ausgangswahrscheinlichkeit erhalten als andere, wie kompliziert die Hypothesen sind und welche Voraussagen sie über die Häufigkeit des Ergebnisses , Seite x' treffen - all dies ist unerheblich. Solange Peter seine Glaubensgrade nicht ausschließlich durch Konditionalisierung, sondern nach einer probabilistischen Version des Schlusses auf die beste Erklärung ändert, kann ein Dutch book gegen ihn gemacht werden. Der Vorwurf muß also etwas radikaler aufgefaßt und so verstanden werden, daß in der Wissenschaft und im Alltag in der Regel überhaupt keine präzisen Glaubensgrade und wohldefinierten Systeme von Hypothesen vorliegen, so daß die BE gar nicht erst zur Anwendung kommen kann: Es ist in der Regel schlicht nicht möglich, Glaubensgrade über das Konditionalisierungs-Prinzip und das Bayessche Theorem zu ändern, und daher muß eine andere Art und Weise der Modifikation von Wahrscheinlichkeiten von Hypothesen gefunden werden - explanatorische Erwägungen weisen hier den richtigen Weg. Eine probabilistische Version des Schlusses auf die beste Erklärung ist zwar in Fällen, wie sie van Fraassen beschreibt, abzulehnen, in anderen Fällen darf und soll sie aber angewendet werden. Und da solche Fälle eher

5.5

Folgen von van Fraassens Argument

293

realistisch und typisch sind für die wissenschaftliche und alltägliche Praxis, kann der Schluß auf die beste Erklärung weiterhin gute Dienste leisten. Diese Analyse scheint mir allerdings recht unplausibel: Warum sollte ein Schlußschema, das in präzise definierten Fällen zu Inkohärenzen führt, in weniger präzise definierten und vageren Fällen plötzlich zur Wahrheit führen? Man stelle sich vor, ein wissenschaftliches Experiment wird zunächst in einer recht vagen Art und Weise durchgeführt, wobei der Schluß auf die beste Erklärung zur Anwendung gelangt. Im Laufe der Forschung wird das Problem aber immer präziser definiert, so daß schließlich ein genau bestimmtes System von Hypothesen mit genau bestimmten subjektiven Wahrscheinlichkeiten vorliegt. Nun muß auf die BE und das Konditionalisierungs-Prinzip umgestellt werden, da der Schluß auf die beste Erklärung jetzt zu Inkohärenzen führt, nachdem er jedoch zuvor immer den rechten Weg gewiesen hatte. Dies erscheint mir wenig einleuchtend. Eine andere Möglichkeit, die Relevanz von explanatorischen Überlegungen zu rehabilitieren, besteht darin, neue Anwendungsfelder für den Schluß auf die beste Erklärung zu finden: Zwar sind explanatorische Überlegungen abzulehnen, wenn sie in Konkurrenz zur BE treten, allerdings können sie berücksichtigt werden, wenn sie in Ergänzung zur BE verwendet werden. Wie in Abschnitt 5.2.5 beschrieben, besteht einer der Vorwürfe gegen die BE darin, daß sie unvollständig ist. Zum einen legt sie den Ausgangswahrscheinlichkeiten, die in das Bayessche Theorem eingehen, keine Bedingungen auf, außer daß diese kohärent sein müssen. Explanatorische Erwägungen könnten nun hier ins Spiel kommen und die Bestimmung dieser Ausgangswahrscheinlichkeiten beeinflussen. Auf diese Möglichkeit hatte bereits der im letzten Unterabschnitt diskutierte Okasha hingewiesen. Sein Vorschlag war zwar erstens nicht auf van Fraassens Fall anwendbar, da nicht zu sehen war, wie explanatorische Erwägungen bei der Bestimmung dieser Wahrscheinlichkeiten eine Rolle spielen könnten; und zweitens schien sich Okasha über sein eigenes Argument nicht völlig im klaren zu sein - aber dies bedeutet natürlich nicht, daß sein Vorschlag nicht in anderen Fällen möglicherweise umgesetzt werden kann. Darüber hinaus macht Okasha im bereits erwähnten Artikel noch weitere Vorschläge, wie explanatorische Eigenschaften von Hypothe-

294

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

sen bei der Einschätzung von Wahrscheinlichkeiten berücksichtigt werden könnten. Er betont zunächst, daß van Fraassen den Schluß auf die beste Erklärung so interpretiert, daß mit seiner Hilfe aus einer feststehenden Menge von Hypothesen ausgewählt wird - nach der Maßgabe, wie gut die verschiedenen Hypothesen die gegebenen Daten erklären. Er behauptet dann, daß der Schluß auf die beste Erklärung auch eine entscheidende Rolle bei der Entdeckung neuer Hypothesen spiele: Explanatory considerations invariably guide the construction of new theories; indeed, often the point of inventing a new theory is to explain an anomalous phenomenon. Advocates of IBE have emphasised this; typically, they have not regarded IBE as a selection procedure operating on already existing hypotheses, à la van Fraassen. (Okasha 2000: 707; H. d. A.)

Nach Okasha liegt gerade hier einer der Vorteile des Schlusses auf die beste Erklärung gegenüber der BE, denn der Schluß auf die beste Erklärung erlaubt, auf neue Evidenz durch die Einführung neuer Hypothesen zu reagieren, was in der BE nicht möglich ist: In those cases where agents respond to new evidence by inventing new hypotheses, the Bayesian model is silent. But IBE provides a useful, if schematic account of what is going on: the agents are trying to explain the new evidence. They think that the best, or perhaps the only, explanation of the evidence lies outside the space of possibilities they have previously considered, so rather than conditionalizing, they invent a new hypothesis. (Okasha 2000: 707)

Explanatorische Erwägungen könnten also dann eine Rolle spielen, wenn bestimmte Daten vorliegen, für die die bekannten Hypothesen keine besonders guten Erklärungen darstellen, die aber durch eine neu gefundene Hypothese gut erklärt werden können. Dann erhält diese neue Hypothese eine hohe Wahrscheinlichkeit, und die Wahrscheinlichkeiten der alten Hypothesen werden dementsprechend abgeändert. Diese Modifikation von Wahrscheinlichkeiten geschieht dabei nicht in Form einer Regel in Konkurrenz zum Konditionalisierungs-Prinzip, so daß kein Dutch book möglich wird. In Abschnitt 5.2.5 hatte ich weiterhin darauf hingewiesen, daß das Konditionalisierungs-Prinzip nur dann anwendbar ist, wenn die bedingte Wahrscheinlichkeit P(H IE) definiert ist, d. h., wenn P(E) > 0 gilt. Man kann nun argumentieren, daß van Fraassens Argument zwar

5.5

Folgen von van Fraassens Argument

295

für Fälle, bei denen diese Bedingung erfüllt, P(H|E) definiert und das Konditionalisierungs-Prinzip anwendbar ist, die Inkohärenz des Schlusses auf die beste Erklärung nachweist - daß es aber andere Fälle gibt, die durch die BE nicht erfaßt werden und bei denen der Schluß auf die beste Erklärung eine wichtige Rolle spielen kann. In Fällen, in denen die Wahrscheinlichkeit von E von zunächst 0 auf einen Wert P(E) > 0 steigt, sollte auf explanatorische Erwägungen zurückgegriffen werden. Die Wahrscheinlichkeiten von Hypothesen H¡ werden so verändert, daß diejenige Hypothese, die das neue Datum am besten erklärt, den größten Bonus erhält usw. Zu diesem Vorschlag ist allerdings zu sagen, daß die Frage, ob für ein bestimmtes empirisches Datum zunächst P(E) = 0 gilt oder nicht, nichts damit zu tun hat, wie gut eine bestimmte Hypothese H dieses Datum erklärt. Warum dieser Unterschied dann aber relevant sein soll für die Frage, ob die betreffende Hypothese eine hohe Wahrscheinlichkeit erhält oder nicht, bleibt völlig offen. Weiterhin könnte vor dem Hintergrund der in Abschnitt 5.2.5 aufgeworfenen Frage, wie die Änderung der Wahrscheinlichkeit P(E) zustande kommt - auf deren Grundlage dann das Konditionalisierungs-Prinzip angewendet werden kann - , ein Verfechter des Schlusses auf die beste Erklärung im Sinne der Arbeitsteilung argumentieren, daß explanatorische Erwägungen zunächst für die Änderung der Wahrscheinlichkeit von Evidenz verantwortlich sind und daß auf dieser Grundlage dann die Wahrscheinlichkeiten der Hypothesen durch Konditionalisierung modifiziert werden. Bei diesem Vorschlag, ebenso wie bei den vorigen, handelt es sich allerdings zunächst nur um Hinweise auf eine Möglichkeit, explanatorische Erwägungen bei der Einschätzung von Wahrscheinlichkeiten zu berücksichtigen. Diese Hinweise zeigen nicht, daß wir explanatorische Überlegungen tatsächlich einbinden sollten. Insbesondere zeigen sie nicht, daß wir durch die Berücksichtigung dieser Erwägungen zu besonders wahrscheinlichen Hypothesen gelangen. Dies geben auch diejenigen Autoren zu, die für den Schluß auf die beste Erklärung und gegen van Fraassen argumentieren. So schreibt beispielsweise Douven im Hinblick auf seinen eigenen Vorschlag: Of course, the IBE-proponent still faces the challenge of showing that the proposed package, or some other that includes a version of IBE, does indeed do better - in whatever respects he thinks desirable - than packages including Bayes's rule or some other rule for belief change. That may well

296

-5 Schluß auf die beste Erklärung und Bayes. Erkenntnistheorie

be an immense task, and the current paper offers no help on this. (Douven 1999: 433)

Solange eine Begründung für den Zusammenhang zwischen der explanatorischen Kraft und der hohen Wahrscheinlichkeit einer Hypothese nicht erbracht werden kann, spricht nichts für die Berücksichtigung explanatorischer Erwägungen in einem der oben erwähnten Sinne. Daß eine solche Begründung nur schwer zu finden ist, wurde im letzten Kapitel gezeigt. Das Fazit dieses Kapitels lautet also, daß van Fraassen den Schluß auf die beste Erklärung für einen weiten Bereich von Anwendungen diskreditiert hat, daß noch einige Möglichkeiten offen bleiben, explanatorische Eigenschaften von Hypothesen bei der Einschätzung ihrer Wahrscheinlichkeit zu berücksichtigen, daß für eine solche Berücksichtigung jedoch keine Gründe zu sehen sind.

5.6

Appendix

Ich wähle im folgenden eine aussagentheoretische - und nicht die in der Mathematik übliche mengentheoretische - Darstellungsweise der Grundbegriffe der Wahrscheinlichkeitstheorie, da in diesem Kapitel Wahrscheinlichkeiten immer direkt Aussagen (Hypothesen, Theorien usw.) zugeschrieben wurden.34 (5.28) Definition von

„Wahrscheinlichkeitsfunktion"

Es sei Σ eine nicht-leere Menge von Sätzen A, B, C usw., die mindestens eine Tautologie Τ enthält. Ρ: Σ —» R heißt eine Wahrscheinlichkeitsfunktion genau dann, wenn gilt: 1. P(A) > 0, für alle A e Σ; 2. P(T) = 1, für alle Tautologien Τ e Σ; 3. Ρ(Α ν Β) = Ρ(Α) + Ρ(Β), für alle Α, Β, (Α ν Β) e Σ mit A, Β wechselseitig inkonsistent. Die Bedingungen (l)-(3) werden auch als die Axiome der Wahrscheinlichkeitstheorie bezeichnet.35 34

Von dieser Entscheidung hängt nichts ab, da beide Darstellungsweisen ineinander überführbar sind (vgl. Howson/Urbach 1989: 17 ff.). Ich wähle hier eine .schwache' Definition von „Wahrscheinlichkeitsfunktion", die insbesondere nicht wie Kolmogorov (1950) verlangt, daß Σ abgeschlossen

5.6

Appendix

297

(5.29) Definition von „(absolute) Wahrscheinlichkeit" Es sei Ρ eine Wahrscheinlichkeitsfunktion auf Σ. Der Wert P(A) der Wahrscheinlichkeitsfunktion Ρ für ein gegebenes Argument A € Σ heißt die (absolute) Wahrscheinlichkeit von A unter P. Die Begriffe der bedingten Wahrscheinlichkeitsfunktion bzw. der bedingten Wahrscheinlichkeit können auf der Grundlage von Definition (5.28) folgendermaßen definiert werden: (5.30) Definition von „bedingte Wahrscheinlichkeitsfunktion" Es sei Ρ eine Wahrscheinlichkeitsfunktion auf Σ, A, B, (Α Λ Β) e Σ und Ρ(Β) > 0. Die Funktion Ρ*: Σ χ Σ R heißt eine bedingte Wahrscheinlichkeitsfunktion genau dann, wenn gilt: P* =

^

(5.31) Definition von „bedingte Wahrscheinlichkeit" Es sei Ρ eine Wahrscheinlichkeitsfunktion auf Σ, P* eine bedingte Wahrscheinlichkeitsfunktion auf Σ χ Σ, Α, Β, (Α Λ Β) e Σ und Ρ(Β) > 0. Der Wert Ρ*(Α I Β) der bedingten Wahrscheinlichkeitsfunktion Ρ* für ein gegebenes Argument (A, B) e Σ χ Σ heißt die bedingte Wahrscheinlichkeit von A gegeben Β unter P* und P.36 Unter Voraussetzung dieser Definitionen kann das in Abschnitt 5.2.3 eingeführte Bayessche Theorem hergeleitet werden.

unter den Operationen Konjunktion und Negation ist, und außerdem nicht das Principle of Countable Additivity beinhaltet. Hinige Autoren bevorzugen es, den Begriff der bedingten Wahrscheinlichkeitsfunktion als eine weitere Grundgröße der Wahrscheinlichkeitstheorie einzuführen und nicht als über eine (absolute) Wahrscheinlichkeitsfunktion definiert zu betrachten. Dieser Unterschied spielt für die in diesem Kapitel behandelten Fragen keine Rolle.

298

5 Schluß auf die beste Erklärung und Bayes.

Erkenntnistheorie

(5.32) Bayessches Theorem Es seien H und E beliebige Hypothesen mit P(H), P(E)>0, dann gilt: Ρ(Η|Ε)=^·Ρ(Η) (5.33) Beweis des Bayesschen Theorems P(HlE) = B j j ^ B

Definition von bedingter Wahrscheinlichkeit

_ P(E λ Η) P(E)

logisch äquivalente Aussagen haben dieselbe Wahrscheinlichkeit

_ .PCE I Hi , - p(E) ' H")

Definition von bedingter Wahrscheinlichkeit

Das Bayessche Theorem kommt in verschiedenen Versionen vor, von denen die hier gewählte die einfachste darstellt.

Kapitel 6 Der Schluß auf die beste Erklärung und die Realismusdebatte in der Wissenschaftstheorie The positive argument for realism is that it is the only philosophy that doesn't make the success of science a miracle. (Putnam 1975: 73) Realism is dead. (Fine 1984: 83)

6.1 6.1.1

Einleitung

Wissenschaftlicher Realismus und das Wahrheitsargument

Während ich in den ersten drei Kapiteln dieser Arbeit die Grundlagen des Schlusses auf die beste Erklärung - nämlich die verschiedenen in der Literatur einschlägigen Modelle des Erklärungsbegriffs - untersucht habe und in den beiden vorigen Kapiteln auf einer allgemeinen Ebene der Frage nachgegangen bin, ob der Schluß auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt, soll in diesem abschließenden Kapitel der Schluß auf die beste Erklärung noch einmal anhand einer Fallstudie diskutiert werden - nämlich anhand der sog. Realismus-Debatte innerhalb der Wissenschaftstheorie. Diese Debatte zwischen sog. wissenschaftlichen Realisten auf der einen und Antirealisten auf der anderen Seite um die Interpretation wissenschaftlicher Theorien dürfte die wohl prominente-

300

6

Schluß auf die beste Erklärung und Realismusdebatte

ste Anwendung des Schlusses auf die beste Erklärung in philosophischen Kontexten darstellen. Sie eignet sich für eine Fallstudie insbesondere deswegen, weil die Verläßlichkeit des Schlusses auf die beste Erklärung in dieser Debatte explizit thematisiert wird. Das realistische Lager in dieser Debatte ist (ebenso wie das antirealistische) sehr heterogen, und eine Darstellung der Vielzahl an realistischen Positionen würde den Rahmen dieses Kapitels bei weitem sprengen. 1 Ich werde mich daher bei der Diskussion in diesem Kapitel auf eine bestimmte realistische Position konzentrieren, die nach meiner Auffassung in der bisherigen Debatte eine prominente Rolle gespielt hat und den Kem des wissenschaftlichen Realismus angemessen wiedergibt: (6.1)

Moderater wissenschaftlicher

Realismus

Die meisten der gegenwärtig akzeptierten, erfolgreichen wissenschaftlichen Theorien sind annähernd wahr, und die meisten der von diesen Theorien postulierten, unbeobachtbaren theoretischen Entitäten existieren tatsächlich. Die in (6.1) wiedergegebene Position ist im folgenden Sinne moderat: (i) Sie behauptet nicht von allen, sondern nur von den meisten der gegenwärtig akzeptierten, erfolgreichen wissenschaftlichen Theorien, daß sie annähernd wahr sind, (ii) Sie behauptet nicht, daß diese Theorien wahr (simpliciter) sind, sondern lediglich, daß sie annähernd wahr sind, (iii) Sie behauptet nicht, daß alle, sondern lediglich, daß die meisten der von den betreffenden Theorien postulierten, unbeobachtbaren theoretischen Entitäten tatsächlich existieren. 2 Ein Hauptargument wissenschaftlicher Realisten für die in (6.1) wiedergegebene These hat die Form eines Schlusses auf die beste Er1

Für eine Übersicht Uber verschiedene .realistische' Thesen, die in unterschiedlichen Kombinationen von verschiedenen wissenschaftlichen Realisten vertreten bzw. von Antirealisten abgelehnt werden, vgl. beispielsweise Leplin (1984: lf.). Ich lasse hierbei offen, auf welche der erfolgreichen wissenschaftlichen Theorien Realisten ihre These beziehen und im Hinblick auf welche der in diesen Theorien postulierten Entitäten sie eine Existenzbehauptung machen. Weiterhin lasse ich offen, welche Konzeption von Theorien wissenschaftliche Realisten bei ihrer These voraussetzen. Diese Punkte haben nach meiner Auffassung keinen Einfluß auf die folgende Diskussion.

6.1 Einleitung

301

klärung. Befürworter der These weisen zunächst darauf hin, daß viele der gegenwärtig akzeptierten wissenschaftlichen Theorien empirisch sehr erfolgreich sind. Dabei ist unter empirischem Erfolg zu verstehen, daß die betreffenden Theorien die bekannten Daten akkommodieren (d. h. mit diesen verträglich sind) und zutreffende Vorhersagen über beobachtbare Ereignisse ermöglichen. Weiterhin behaupten Befürworter der These, daß sich der empirische Erfolg der betreffenden Theorien am besten erklären läßt durch die annähernde Wahrheit der Theorien in Verbindung mit der Existenz der meisten der von ihnen postulierten, unbeobachtbaren theoretischen Entitäten. Von diesen beiden Annahmen ausgehend schließen Realisten dann mit Hilfe eines Schlusses auf die beste Erklärung auf die annähernde Wahrheit der betreffenden Theorien und die Existenz der meisten postulierten, unbeobachtbaren theoretischen Entitäten. Dieses realistische Argument, das in der Literatur üblicherweise als Wahrheitsargument (truth argument) bezeichnet wird (vgl. etwa Lipton 1991), läßt sich schematisiert folgendermaßen wiedergeben: (6.2)

Das Wahrheitsargument Prämisse P¡\ Prämisse P2:

Konklusion:

Die wissenschaftliche Theorie Τ ist empirisch erfolgreich. Die beste Erklärung für diesen Erfolg ist die annähernde Wahrheit von Τ in Verbindung mit der Existenz der meisten der von Τ postulierten, unbeobachtbaren theoretischen Entitäten. = Τ ist annähernd wahr, und die meisten der von Τ postulierten, unbeobachtbaren theoretischen Entitäten existieren tatsächlich.

[r]

Argumente nach diesem Schema finden sich bei praktisch allen wissenschaftlichen Realisten. Sie kommen in verschiedenen Varianten vor und unterscheiden sich unter anderem durch den Umfang ihrer Prämissen und Konklusion. Manche Autoren nehmen (wie in (6.2) dargestellt) den empirischen Erfolg einzelner Theorien zum Ausgangspunkt und argumentieren auf dieser Basis lediglich für die annähernde Wahrheit der betreffenden Theorien bzw. für die Existenz be-

302

6 Schluß auf die beste Erklärung und Realismusdebatte

stimmter theoretischer Entitäten, die diese Theorien voraussetzen. Andere Autoren gehen vom Erfolg einer einzelnen Wissenschaft aus und argumentieren für die annähernde Wahrheit der hierin auftretenden Theorien und die Existenz der meisten postulierten theoretischen Entitäten. Wieder andere nehmen den Erfolg der Wissenschaft zum Ausgangspunkt und argumentieren entsprechend für die annähernde Wahrheit der in den verschiedenen Wissenschaften verwendeten Theorien und die Existenz der meisten postulierten Entitäten.3 Eine Spielart des Wahrheitsarguments ist das sog. Wunderargument (miracle argument), das auf Putnam (1975) zurückgeht.4 Ebenso wie beim Wahrheitsargument wird beim Wunderargument zunächst davon ausgegangen, daß viele der gegenwärtig akzeptierten wissenschaftlichen Theorien empirisch erfolgreich sind. Es wird dann behauptet, daß dieser Erfolg unerklärlich - ein Wunder - wäre, wenn die betreffenden Theorien nicht annähernd wahr wären und die meisten der von ihnen postulierten, unbeobachtbaren theoretischen Entitäten nicht existierten. Auf dieser Grundlage wird dann - unter der impliziten Annahme, daß der Erfolg wissenschaftlicher Theorien eine Erklärung haben und kein Wunder sein sollte - auf die annähernde Wahrheit der betreffenden Theorien und die Existenz der meisten der von ihnen postulierten, unbeobachtbaren theoretischen Entitäten geschlossen. Das Wunderargument unterscheidet sich vom Wahrheitsargument im wesentlichen darin, daß nicht auf die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien geschlossen wird, sondern auf die einzige Erklärung dieses Erfolgs. Geht man davon aus, daß aus der Tatsache, daß eine gegebene Erklärung die einzige Erklärung eines Phänomens darstellt, folgt, daß sie auch die beste Erklärung des Phänomens ist (aber nicht umgekehrt), so werden im Wunderargument Annahmen gemacht, die stärker sind, als es für realistische Zwecke nötig ist: Die Annahme, daß der wissenschaftliche Realismus die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien ist, reicht für eine Anwendung des Schlusses auf die beste Erklärung und

3

4

Vgl. etwa Newton-Smith (1981), Hacking (1983), Boyd (1984, 1989, 1990) und Psillos (1999). Das Wunderargument wird manchmal auch als .ultimate argument' bezeichnet; vgl. etwa van Fraassen (1980: 39) und Musgrave (1988).

6.1 Einleitung

303

damit für den Übergang zur erwünschten realistischen Konklusion völlig aus. Geht man andererseits davon aus, daß die einzige Erklärung eines Phänomens nicht immer auch die beste Erklärung des Phänomens darstellt, so handelt es sich beim Wunderargument zunächst nicht um einen Schluß auf die beste Erklärung. In jedem Fall scheint es also sinnvoll, den Zusammenhang zwischen der Position des wissenschaftlichen Realismus und dem Schluß auf die beste Erklärung anhand des Wahrheitsargumentes und nicht anhand des Wunderargumentes zu diskutieren. 5

6.1.2

Wissenschaftlicher Antirealismus und Einwände gegen das Wahrheitsargument

Anders als wissenschaftliche Realisten glauben Antirealisten weder an die annähernde Wahrheit empirisch erfolgreicher wissenschaftlicher Theorien noch an die Existenz der von diesen Theorien postulierten, unbeobachtbaren theoretischen Entitäten. Antirealisten werden dementsprechend durch das Wahrheitsargument vor Probleme gestellt. Sie müssen es entkräften, um die Ansprüche der wissenschaftlichen Realisten zurückweisen zu können. Dies kann - wie bei jedem Argument auf zweierlei Art und Weise geschehen: Entweder man leugnet, daß die Konklusion aus den Prämissen folgt, und zieht damit das verwendete Schlußschema - den Schluß auf die beste Erklärung - in Zweifel; oder man bestreitet eine der Prämissen, die im Argument verwendet werden. Diese zweite Möglichkeit kann, entsprechend der Anzahl der Prämissen, die im Wahrheitsargument verwendet werden, wiederum in zwei Varianten auftreten: Entweder man bestreitet Prämisse Pi daß wissenschaftliche Theorien empirisch erfolgreich sind; oder man leugnet Prämisse P 2 - daß die annähernde Wahrheit dieser Theorien und die Existenz der meisten der von ihnen postulierten Entitäten tatsächlich die beste Erklärung für ihren empirischen Erfolg darstellen. Was zunächst den ersten möglichen Einwand gegen das Wahrheitsargument betrifft, mit dem das verwendete Schlußschema - der

5

Für Vorläufer des Putnamschen Wunderarguments vgl. Maxwell (1962) und Smart (1963) und die Diskussion über die Unterschiede zwischen diesen Argumenten in Psillos (1999: 72 ff.).

304

6

Schluß auf die beste Erklärung und

Realismusdebatte

Schluß auf die beste Erklärung - angegriffen wird, so habe ich in den vorigen Kapiteln dieser Arbeit versucht zu zeigen, daß keine guten Gründe dafür sprechen, den Schluß auf die beste Erklärung als ein verläßliches Schlußschema anzusehen, d. h. als ein Schlußschema, das von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt. Somit würde selbst dann nichts für die annähernde Wahrheit empirisch erfolgreicher wissenschaftlicher Theorien und nichts für die Existenz der von diesen Theorien postulierten Entitäten sprechen, wenn die von Realisten verwendeten Prämissen erfüllt sein sollten. Wissenschaftliche Realisten sind sich dieses Einwands, der von Antirealisten gern vorgebracht wird, allerdings bewußt und haben eine Erwiderung hierauf: Sie entwickeln, wie bereits in Kapitel 4 dieser Arbeit kurz erwähnt, ein Argument, das dem Anspruch nach zeigen soll, daß es sich bei dem Schluß auf die beste Erklärung doch um ein verläßliches Schlußmuster handelt. Auf dieses Argument werde ich in Abschnitt 6.3 eingehen. Ich werde dort zeigen, daß es - ebenso wie die anderen, in Kapitel 4 dieser Arbeit diskutierten Argumente für die Verläßlichkeit des Schlusses auf die beste Erklärung - scheitert. Was den zweiten Typ von Einwand gegen das Wahrheitsargument - den Angriff auf die verwendeten Prämissen - betrifft, so wird Prämisse Pi von Antirealisten in der Regel nicht bestritten: Daß wissenschaftliche Theorien empirisch erfolgreich (im beschriebenen Sinne) sind, ist schwer zu leugnen. Prämisse P2 dagegen ist in dieser Debatte ähnlich kontrovers wie die Verläßlichkeit des Schlusses auf die beste Erklärung. Antirealisten haben hier zwei Möglichkeiten, auf die Behauptung der Realisten zu reagieren, die annähernde Wahrheit empirisch erfolgreicher Theorien stelle in Verbindung mit der Existenz der postulierten Entitäten die beste Erklärung für den Erfolg der betreffenden Theorien dar. Sie können zum einen behaupten, daß sie eine ebenso gute, oder gar bessere, antirealistische Erklärung für den Erfolg wissenschaftlicher Theorien haben. Und in der Tat gibt es zwei Erklärungen - die sog. Erklärung über Selektion und die sog. Erklärung über empirische Adäquatheit - , die Antirealisten für mindestens ebenso gut halten wie die von Realisten bevorzugte Erklärung (die ich im folgenden kurz als Wahrheitserklärung bezeichnen werde). Zum anderen können Antirealisten zunächst zugestehen, daß die Wahrheitserklärung zwar die beste der zur Verfügung stehenden Erklärungen darstellt, dann aber leugnen, daß sie für sich selbst betrachtet gut

6.1

Einleitung

305

genug ist, um einen Schluß auf die beste Erklärung legitimieren zu können. Auf diese beiden Möglichkeiten, das Wahrheitsargument anzugreifen, und auf die Reaktion der Realisten auf diese Angriffe werde ich im folgenden Abschnitt 6.2 eingehen. Ich werde dort dafür argumentieren, daß die realistische Seite ihre Behauptung, die Wahrheitserklärung sei die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien, nicht überzeugend begründen kann. Man würde auf der Grundlage der Diskussion der verschiedenen Erklärungsmodelle in den Kapiteln 1 bis 3 dieser Arbeit erwarten, daß Argumente für und wider die Qualität einer gegebenen Erklärung des empirischen Erfolgs wissenschaftlicher Theorien immer vor dem Hintergrund einer zugrunde gelegten Theorie der Erklärung entwickelt werden - so daß deutlich wird, in welchem Sinne oder nach welchen Kriterien eine bestimmte realistische Erklärung A ebenso gut oder besser ist als eine alternative antirealistische Erklärung B. Dies ist allerdings nicht der Fall. Die betreffenden Argumente werden - sowohl von realistischer als auch von antirealistischer Seite - weitgehend unabhängig von konkreten Erklärungsmodellen vorgebracht. Dies hat zur Folge, daß sich nur sehr schwer beurteilen läßt, wie gut die jeweiligen Argumente sind und welche der vorgebrachten Erklärungen tatsächlich die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien darstellt. Die in diesem Kapitel zu behandelnde Debatte zwischen wissenschaftlichen Realisten und Antirealisten um die Interpretation wissenschaftlicher Theorien illustriert damit eine der in der Einleitung zu dieser Arbeit gemachten Behauptungen: Der Schluß auf die beste Erklärung ist in philosophischen Debatten viel weniger hilfreich, als dies zunächst den Anschein haben mag und weithin angenommen wird. Zum einen fehlt uns ein akzeptables Erklärungsmodell, auf dessen Basis wir Einschätzungen Uber Erklärungen und deren Güte abgeben könnten. Zum anderen haben wir keine guten Gründe für die Annahme, daß der Schluß auf die beste Erklärung verläßlich ist und von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt.

306

6

6.2

Schluß auf die beste Erklärung und

Realismusdebatte

Erklärungen für den empirischen Erfolg wissenschaftlicher Theorien 6.2.1

Die Selektionserklärung

Eine der Möglichkeiten, das Wahrheitsargument wissenschaftlicher Realisten anzugreifen, besteht wie im letzten Abschnitt beschrieben darin, Prämisse P 2 des Arguments in Zweifel zu ziehen und alternative Erklärungen für den Erfolg wissenschaftlicher Theorien anzubieten. Eine der Erklärungen, die Antirealisten zu diesem Zweck vorbringen, ist die sog. Selektionserklärung. Bei dieser Erklärung wird der empirische Erfolg wissenschaftlicher Theorien unter Rekurs auf den wissenschaftlichen Forschungsprozeß erklärt: Zu jedem Zeitpunkt in der Wissenschaft existieren miteinander konkurrierende Theorien, unter denen die .guten' auszuwählen und die .schlechten' abzulehnen sind. Natürlich ist für die Wahl zwischen den verschiedenen Theorien ausschlaggebend, wie erfolgreich die fraglichen Theorien sind, und selbstverständlich werden die erfolgreichen Theorien bevorzugt. Daher sind die zu jedem Zeitpunkt in der Wissenschaft akzeptierten Theorien erfolgreiche Theorien. Dies steht aber in keinerlei Beziehung zu ihrer Wahrheit. Kurz gesagt: Nicht weil wissenschaftliche Theorien wahr sind, sind sie erfolgreich, sondern wenn sie Erfolg haben, werden sie akzeptiert. Ein Befürworter der Selektionserklärung ist beispielsweise Bas van Fraassen: I would like to point out that science is a biological phenomenon, an activity by one kind of organism which facilitates its interaction with the environment. And this makes me think that a very different kind of scientific explanation [for the success of scientific theories] is required. I can best make the point by contrasting two accounts of the mouse who runs from its enemy, the cat. St. Augustine already remarked on this phenomenon, and provided an intentional explanation: the mouse perceives that the cat is its enemy, hence the mouse runs. [...] But the Darwinist says: Do not ask why the mouse runs from its enemy. Species which do not cope with their natural enemies no longer exist. That is why there are only ones who do. In just the same way, I claim that the success of current scientific theories is no miracle. It is not even surprising to the scientific (Darwinist) mind. For any scientific theory is born into a life of fierce competition, a jungle red in tooth and claw. Only the successful theories survive - the ones

6.2

Erklärungen fur den Erfolg wissenschaftlicher

Theorien

307

which in fact latched on to actual regularities in nature, (van Fraassen 1980: 39 ff.; H. d. A.)

Gegen diese antirealistisch-darwinistische Erklärung des empirischen Erfolgs wissenschaftlicher Theorien werden von realistischer Seite zwei Einwände geltend gemacht. Der erste dieser Einwände gegen die Selektionserklärung gesteht zunächst zu, daß diese erklären kann, warum alle Theorien, die in der Wissenschaft akzeptiert werden, erfolgreich sind. Er stellt dann aber in Abrede, daß durch sie erklärt werden kann, warum jede einzelne dieser Theorien erfolgreich ist. Der zweite Einwand räumt ein, daß die Selektionserklärung sowohl erklären kann, warum alle akzeptierten wissenschaftlichen Theorien erfolgreich sind, als auch, warum jede einzelne erfolgreich ist. Er leugnet dann aber, daß durch sie erklärt werden kann, warum eine Theorie, die erfolgreich war und aus diesem Grund ausgewählt wurde, fortfährt, erfolgreich zu sein. Was den ersten dieser Einwände betrifft, so schreibt beispielsweise Peter Lipton: [The] selection account may explain why all the theories we now accept have been observationally successful, but it does not explain why each of them has been. It does not explain why a particular theory, which was selected for its observational success, has this feature. (Lipton 1991: 170; m. H.)

Eine Analogie kann diesen Einwand verdeutlichen: Die Tatsache, daß an einer Schule für Hochbegabte alle Schüler hochbegabt sind, mag dadurch erklärt werden, daß eine Schule für Hochbegabte nur solche Schüler aufnimmt. Allerdings scheint dies nicht zu erklären, warum jeder einzelne Schüler an dieser Schule hochbegabt und nicht lediglich durchschnittlich begabt ist. In analoger Weise scheint die Selektionserklärung nicht zu erklären, warum jede einzelne akzeptierte wissenschaftliche Theorie erfolgreich ist.6 Eine Möglichkeit, diesem erstem Einwand der Realisten zu begegnen, besteht darin, daß man leugnet, daß es für den empirischen Erfolg 6

Ich verdanke dieses Beispiel Thomas Bartelborth. Ein ähnliches Beispiel stammt von Robert Nozick (1974: 22): Die Frage, warum alle Mitglieder eines bestimmten Clubs rote Haare haben, mag damit erklärt werden, daß dieser Club nur Rothaarige aufnimmt. Die Mitgliederpolitik des Clubs kann allerdings nicht erklären, warum jedes einzelne Mitglied des Clubs rote Haare hat.

308

6 Schluß auf die beste Erklärung und Realismusdebatte

einzelner Theorien eine Erklärung gibt, und beispielsweise behauptet, daß der Umstand, daß einige wissenschaftliche Theorien Uberhaupt erfolgreich sind, schlicht ein brute fact und eine Sache glücklicher Umstände ist.7 Dieser Rückzug auf brute facts scheint mir aber an dieser Stelle nicht plausibel zu sein. Er wäre eventuell akzeptabel, wenn es sich lediglich um eine einzige oder zumindest sehr wenige wissenschaftliche Theorien handelte, deren empirischer Erfolg zu erklären wäre - für viele Theorien scheint mir der Hinweis auf brute facts nicht einleuchtend. Allerdings ist es an diesem Punkt der Debatte gar nicht nötig, sich als Antirealist auf brute facts dieser Art zurückzuziehen, denn der gegen die Selektionserklärung vorgebrachte Einwand ist viel einfacher zu entkräften. Der Schwachpunkt des Einwandes liegt nämlich darin, daß die verwendete Analogie nicht trägt. Der entscheidende Unterschied zwischen hochbegabten Schülern und empirisch erfolgreichen Theorien besteht darin, daß wissenschaftliche Theorien bewußt so konzipiert werden, daß sie empirisch erfolgreich sind, während dies für hochbegabte Schüler offensichtlich nicht der Fall ist. In einer gegebenen Wissenschaft liegt eine gewisse Menge von Daten vor, und eine wissenschaftliche Theorie über den Bereich, aus dem diese Daten stammen, wird mit der expliziten Absicht konstruiert, mit den beobachteten Daten und den darin auftretenden Regularitäten verträglich zu sein - d. h., sie wird mit Absicht so gemacht, daß sie empirisch erfolgreich ist. Man stelle sich um des Argumentes willen vor, daß Eltern, die den Wunsch haben, ihr Kind an einer Schule für Hochbegabte studieren zu lassen, es (auf gentechnische oder andere Weise) bewirken könnten, daß ihr Kind hochbegabt ist. Die entsprechende Frage „Warum ist Schülerin x, die auf die Hochbegabten-Schule S geht, hochbegabt?" könnte dann in völlig befriedigender Weise beantwortet werden durch die Erklärung: „Weil die Eltern von Schülerin χ es so einrichteten, daß χ hochbegabt ist." In nun völlig analoger Weise kann die Frage „Warum ist Theorie χ erfolgreich?" beantwortet werden mit „Weil die Wissenschaftler es so einrichteten, daß χ erfolgreich ist." Diese Replik wird bei Realisten wahrscheinlich die folgende Reaktion hervorrufen: Es steht außer Frage, daß wissenschaftliche Theorien 7

Van Fraassen scheint an manchen Stellen diese Erwiderung in Erwägung zu ziehen (vgl. van Fraassen 1980: 24).

6.2 Erklärungen für den Erfolg wissenschaftlicher Theorien

309

mit dem Ziel konzipiert werden, die bekannten Daten zu akkommodieren. Und die Tatsache, daß sie in diesem Sinne erfolgreich sind, kann dementsprechend durch diese Zielsetzung erklärt werden. Was aber hierdurch nicht erklärt wird, ist die Tatsache, daß es überhaupt erfolgreiche Theorien gibt, daß es überhaupt möglich ist, eine erfolgreiche Theorie zu entwickeln, d. h. eine Theorie, die die Daten akkommodiert und erfolgreiche Vorhersagen macht. Was zunächst den Teil dieser Reaktion angeht, der die Akkommodation der Daten betrifft, so sollte klar sein, daß es für jede Menge empirischer Daten beliebig viele Theorien gibt, die diese akkommodieren. Daher ist es nicht verwunderlich, daß es möglich ist, für jede (endliche) Menge von Daten eine Theorie zu konzipieren, die diese Daten akkommodiert. Der Teil der Reaktion, der erfolgreiche Vorhersagen betrifft, ist komplizierter und führt hinüber zu dem zweiten realistischen Einwand gegen die Selektionserklärung, den ich weiter oben erwähnt habe. Dieser zweite Einwand gegen die Strategie, den empirischen Erfolg wissenschaftlicher Theorien durch Selektion zu erklären, lautet folgendermaßen: Durch die Selektion von wissenschaftlichen Theorien kann nur ein Teilaspekt des Erfolgs dieser Theorien erklärt werden nicht aber alle Aspekte dieses Erfolges. Der Hinweis auf Selektion kann erklären, warum Theorien, die wir akzeptieren, im Hinblick auf die bereits bekannten Daten erfolgreich sind, d. h., warum sie diese Daten akkommodieren und warum sie im Hinblick auf diese Daten bisher zutreffende Vorhersagen getroffen haben - denn nur Theorien, die diese Forderung erfüllen, können in einem Auswahlprozeß zwischen verschiedenen, miteinander konkurrierenden Theorien überleben. Der Hinweis auf Selektion kann aber nicht erklären, warum diese Theorien, nachdem sie ausgewählt und akzeptiert worden sind, fortfahren, erfolgreiche Vorhersagen zu machen. Diese Eigenschaft einer Theorie kann kein Kriterium zur Auswahl zwischen miteinander konkurrierenden Theorien sein, denn sie ist zu dem Zeitpunkt, an dem der Auswahlprozeß stattfindet, einfach nicht bekannt. Daher kann die Selektionserklärung die Eigenschaft wissenschaftlicher Theorien, nach dem Auswahlzeitpunkt weiterhin erfolgreiche Vorhersagen zu machen, nicht erklären. Die Wahrheitserklärung auf der anderen Seite kann dies nach Ansicht wissenschaftlicher Realisten erklären: Wenn eine Theorie wahr ist, dann werden nicht nur die von ihr bisher getroffenen Vorhersagen, sondern auch alle zukünftigen wahr sein.

310

6 Schluß auf die beste Erklärung und Realismusdebatte

Dieser zweite Einwand der Realisten gegen die Selektionserklärung ist meiner Ansicht nach allerdings ebenso wenig Uberzeugend wie der erste. Betrachten wir nochmals (in idealisierter, vereinfachter Weise) den wissenschaftlichen Forschungsprozeß: Verschiedene konkurrierende Theorien über ein gegebenes Datenmaterial stehen zur Auswahl. Eine dieser Theorien, für die gelten muß, daß sie empirisch erfolgreich ist, d. h. die bekannten Daten akkommodiert und bisher erfolgreiche Vorhersagen gemacht hat, wird ausgewählt. Nun werden mit Hilfe der jetzt akzeptierten Theorie bestimmte neue Vorhersagen gemacht. Treffen die Vorhersagen zu, dann wird die Theorie beibehalten. Treffen sie aber nicht zu - und es ist wohl angebracht, darauf hinzuweisen, daß dies oft genug vorkommt - so wird die betreffende Theorie entweder korrigiert oder durch eine andere ersetzt (der Übergang zwischen diesen beiden Möglichkeiten ist fließend). Es ist also keineswegs der Fall - wie Realisten behaupten - , daß alle ausgewählten und akzeptierten Theorien fortfahren, erfolgreiche Vorhersagen zu treffen. Einige tun es, andere nicht. Die Frage, die dann bleibt und auf die Antirealisten nach Ansicht der Realisten keine Antwort zu haben scheinen, ist lediglich: Warum fahren einige wissenschaftliche Theorien, die akzeptiert wurden, weil sie in der Vergangenheit empirisch erfolgreich waren, fort, empirisch erfolgreich zu sein, andere aber nicht? An dieser Stelle scheint mir nun die weiter oben gegebene (und dort zurückgewiesene) Antwort, daß es sich hierbei lediglich um einen brute fact, um eine Sache glücklicher Umstände handelt, durchaus plausibel. Fassen wir zusammen: Realisten beginnen mit den vielen gegenwärtig akzeptierten wissenschaftlichen Theorien und fragen, warum diese Theorien empirisch erfolgreich sind. Die antirealistische Antwort ist zunächst, daß alle diese Theorien genau nach diesem Kriterium ausgewählt und konzipiert wurden und daß es daher ,kein Wunder' ist, daß sie erfolgreich sind. Realisten fragen weiter, warum alle diese Theorien, nachdem sie ausgewählt wurden, fortfahren, erfolgreich zu sein. Die antirealistische Antwort hierauf ist, daß zunächst einmal die realistische Präsupposition falsch ist: Es ist keineswegs so, daß alle akzeptierten Theorien fortfahren, empirisch erfolgreich zu sein. Unter Bezug auf die Wissenschaftsgeschichte läßt sich vielmehr zeigen, daß die meisten (um nicht zu sagen alle) Theorien, die zu einem gegebenen Zeitpunkt wegen ihres empirischen Erfolges akzeptiert wurden, eben nicht fortfahren, empirisch erfolgreich zu sein.

6.2 Erklärungen für den Erfolg wissenschaftlicher Theorien

311

Vielmehr werden diese Theorien zu einem bestimmten Zeitpunkt durch andere Theorien ersetzt, die selbst wiederum empirisch erfolgreich sind, weil sie mit dieser Maßgabe konzipiert und deswegen akzeptiert wurden.8 Die realistische Frage, die dann bleibt, ist, warum einige wenige Theorien, die zu verschiedenen Zeitpunkten wegen ihres empirischen Erfolges akzeptiert wurden, für eine Weile fortfahren, empirisch erfolgreich zu sein. Die abschließende antirealistische Antwort hierauf ist, daß es sich hierbei um einen brute fact und eine Sache glücklicher Umstände handelt. Realisten scheinen mir daher nicht zeigen zu können, inwiefern die von ihnen bevorzugte Wahrheitserklärung eine bessere Erklärung des empirischen Erfolgs wissenschaftlicher Theorien ist als die von Antirealisten vorgeschlagene Selektionserklärung. Prämisse 2 des Wahrheitsarguments der Realisten, nach der die Wahrheitserklärung die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien darstellt, ist somit schon aus diesem Grund schlecht begründet. Der Status der Wahrheitserklärung wird noch weiter in Mitleidenschaft gezogen, wenn wir im nächsten Abschnitt die zweite potentielle Erklärung für den empirischen Erfolg wissenschaftlicher Theorien betrachten, die von Antirealisten ins Spiel gebracht wird.

6.2.2

Die Erklärung über empirische Adäquatheit

Neben der im vorigen Unterabschnitt diskutierten Selektionserklärung bieten Antirealisten wie erwähnt eine weitere Erklärung für den empirischen Erfolg wissenschaftlicher Theorien an - die sog. Erklärung über empirische Adäquatheit. Antirealisten betonen zunächst, daß der von Realisten gerühmte Erfolg wissenschaftlicher Theorien darin besteht, daß diese bisher empirisch adäquat waren, d. h., daß sie die schon bekannten beobachteten Daten akkommodiert und weiterhin in manchen Fällen die Beobachtung von noch nicht bekannten Daten erfolgreich vorhergesagt haben. Die beste Erklärung dieses Umstands besteht für Anhänger der Erklärung über empirische Adäquatheit allerdings nicht darin, daß die betreffenden Theorien annähernd wahr g Vgl. hierzu auch das in Kapitel 4, Abschnitt 4.3, diskutierte Argument von Laudan (1981).

312

6

Schluß auf die beste Erklärung und Realismusdebatte

sind, sondern vielmehr darin, daß die empirischen Konsequenzen dieser Theorien annähernd wahr sind, d. h. kurz gesagt darin, daß diese Theorien annähernd wahre Aussagen über Beobachtbares treffen. Der Schluß auf die beste Erklärung, der somit von Befürwortern der Erklärung über empirische Adäquatheit akzeptiert würde, hätte die folgende Form:9 (6.3)

Der Schluß auf die Erklärung über empirische Adäquatheit Prämisse P¡:

Die wissenschaftliche Theorie Τ ist empirisch erfolgreich.

Prämisse P2:

Die beste Erklärung für diesen Erfolg ist die annähernde Wahrheit des empirischen Teils von T.

Konklusion:

Der empirische Teil von Τ ist annähernd wahr.

[r]

Die Konklusion dieses Schlusses auf die beste Erklärung unterscheidet sich von detjenigen des in (6.2) wiedergegebenen Wahrheitsargumentes darin, daß lediglich die annähernde Wahrheit des empirischen Teils von Theorie Τ behauptet wird, nicht aber die annähernde Wahrheit von T, insofern als unbeobachtbare Aspekte der Theorie betroffen sind. Es wird also insbesondere nicht angenommen, daß die von Τ postulierten, unbeobachtbaren theoretischen Entitäten existieren. Auf die antirealistische Strategie, den empirischen Erfolg wissenschaftlicher Theorien über deren empirische Adäquatheit zu erklären und demgemäß nur auf die Wahrheit des empirischen Teils der Theorien zu schließen, gibt es wiederum zwei Einwände seitens der Realisten. Der erste dieser Einwände gegen die Erklärung über empirische Adäquatheit leugnet, daß diese überhaupt eine Erklärung des Erfolgs wissenschaftlicher Theorien darstellt: Die Erklärung über empirische Adäquatheit erklärt den empirischen Erfolg einer wissenschaftlichen Theorie Τ damit, daß Τ empirisch adäquat ist, d. h., daß die empiri9

.hätte' und .würde', da Befürworter der Erklärung über empirische Adäquatheit dadurch, daß sie diese für die beste Erklärung des Erfolgs wissenschaftlicher Theorien halten, noch nicht gleichzeitig Befürworter von Schlüssen auf die beste Erklärung sein müssen - denn sie können ja das Schlußschema als nicht verläßlich ablehnen.

6.2

Erklärungen für den Erfolg wissenschaftlicher

Theorien

313

sehen Konsequenzen von Τ wahr sind. Der Erfolg von T, der hierdurch erklärt werden soll, besteht aber nach diesem Einwand gerade darin, daß Τ die Daten akkommodiert und erfolgreiche Vorhersagen macht - was nichts anderes heißt, als daß die empirischen Konsequenzen von Τ wahr sind, d. h. Τ empirisch adäquat ist. Yemima BenMenahem formuliert diesen Einwand gegen die Erklärung Uber empirische Adäquatheit folgendermaßen: The realist invokes one feature of a theory, namely its truth, to explain another feature, namely its empirical adequacy. The instrumentalist [...] has no analogous explanation to offer. To explain success by empirical adequacy is tautological, for success is empirical adequacy. (Ben-Menahem 1990: 337; H. d. A.)

Auf diesen Einwand der Realisten können Befürworter der Erklärung Uber empirische Adäquatheit allerdings folgendes erwidern: Der Fehler, den Vertreter dieses Einwandes begehen, besteht darin, daß sie nicht genau genug zwischen dem Explanans und dem Explanandum der Erklärung Uber empirische Adäquatheit unterscheiden. Das Explanandum - daß wissenschaftliche Theorien wahre Aussagen Uber bekannte empirische Daten machen und daß sie bislang wahre Vorhersagen getroffen haben - wird bei der Erklärung über empirische Adäquatheit nicht wiederum durch genau diesen Umstand erklärt. Vielmehr besteht das Explanans der Erklärung aus der Behauptung, daß alle empirischen Konsequenzen der Theorie wahr sind - auch diejenigen, die bisher noch gar nicht hergeleitet worden sind und deren Wahrheit noch gar nicht überprüft worden ist. Diese Eigenschaft wissenschaftlicher Theorien ist nicht identisch mit ihrer Eigenschaft, bisher erfolgreich gewesen zu sein. Diese antirealistische Replik scheint mir berechtigt, und der erste Einwand der Realisten gegen die Erklärung über empirische Adäquatheit scheint mir daher nicht zeigen zu können, daß es sich zwar bei der Wahrheitserklärung, nicht aber bei der Erklärung Uber empirische Adäquatheit um eine Erklärung des empirischen Erfolgs wissenschaftlicher Theorien handelt. Der zweite Einwand der Realisten gegen die Erklärung über empirische Adäquatheit wird üblicherweise als Conjunction Objection bezeichnet und geht auf Putnam (1973) zurück. Dieser Einwand besagt nicht wie der vorige, daß die Erklärung Uber empirische Adäquatheit überhaupt keine Erklärung des empirischen Erfolgs wissenschaftlicher

314

6

Schluß auf die beste Erklärung und

Realismusdebatte

Theorien darstellt - er versucht vielmehr zu zeigen, daß die Erklärung über empirische Adäquatheit eine schlechtere Erklärung darstellt als die Wahrheitserklärung. Vertreter dieses Einwandes gehen zunächst davon aus, daß die Güte philosophischer Hypothesen nach denselben Kriterien zu beurteilen ist, nach denen auch Hypothesen in anderen Einzelwissenschaften beurteilt werden. Weiterhin wird behauptet, daß ein Kriterium zur Beurteilung wissenschaftlicher Hypothesen in der Untersuchung ihrer empirischen Konsequenzen bestehe. Insbesondere gilt hierbei: Hat eine gegebene Hypothese A empirische Konsequenzen, eine alternative Hypothese Β aber nicht, so ist A besser als B. Der Grund dafür, daß die Wahrheitserklärung für Vertreter dieses Einwands eine bessere Erklärung des empirischen Erfolgs wissenschaftlicher Theorien darstellt als die Erklärung über empirische Adäquatheit, liegt genau hierin: Sie hat nach deren Ansicht empirische Konsequenzen, die die Erklärung über empirische Adäquatheit nicht aufweisen kann. Worin bestehen diese empirischen Konsequenzen? Betrachten wir zwei empirisch erfolgreiche Theorien Ti und T 2 und die Konjunktion dieser beiden Theorien zu einer Gesamttheorie T, aus der (unter Umständen) empirische Konsequenzen hergeleitet werden können, die nicht bereits Konsequenzen von Ti oder T2 sind. Vertreter des besagten Einwandes argumentieren nun folgendermaßen: Wenn die Wahrheitserklärung die beste Erklärung des empirischen Erfolgs von T] und T 2 darstellt, so kann mit Hilfe des Schlusses auf die beste Erklärung auf die annähernde Wahrheit von Tj und T 2 geschlossen werden. Da Ti und T 2 annähernd wahr sind, ist auch Τ annähernd wahr, und daher müssen auch die neuen aus Τ ableitbaren empirischen Konsequenzen annähernd wahr sein. Wenn allerdings die Erklärung über empirische Adäquatheit die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien darstellt, dann kann man mit Hilfe des Schlusses auf die beste Erklärung lediglich auf die annähernde Wahrheit des empirischen Teils der beiden Theorien schließen. In diesem Fall folgt aber erstens nicht, daß die konjungierte Theorie Τ annähernd wahr ist - denn schon Ti und T 2 müssen dann nicht annähernd wahr sein. Außerdem folgt in diesem Fall zweitens nicht, daß die empirischen Konsequenzen von T, die nicht zugleich empirische Konsequenzen von Ti oder T 2 allein sind, auch annähernd wahr sind. Daher bringt die Wahrheitserklärung zusätzliche Möglichkeiten zur empiri-

6.2

Erklärungen für den Erfolg wissenschaftlicher

Theorien

315

sehen Überprüfung von Theorien mit sich, die die Erklärung über empirische Adäquatheit nicht ermöglicht. Und aus diesem Grund ist die Wahrheitserklärung besser als die Erklärung über empirische Adäquatheit. Diesem zweiten realistischen Einwand gegen die Erklärung über empirische Adäquatheit können Antirealisten allerdings unter Rekurs auf ein Argument von Arthur Fine (1984: 89 ff.) begegnen. Fine weist zunächst darauf hin, daß die Wahrheitserklärung - wenn sie überhaupt als prima facie plausibel gelten soll - den empirischen Erfolg wissenschaftlicher Theorien lediglich durch deren annähernde Wahrheit und nicht durch deren Wahrheit simpliciter erklärt.10 Fine argumentiert dann, daß die Eigenschaft der annähernden Wahrheit (wie diese auch genau bestimmt werden mag) eben gerade nicht garantiert, daß die Konjunktion zweier annähernd wahrer Theorien T, und T 2 wiederum eine annähernd wahre Theorie liefert: For nothing in the logic of approximate truth sanctions the inference from "T is approximately true" and "T' is approximately true" to the conclusion that the conjunction "Τ · T"' is approximately true. Rather, in general, the tightness of an approximation dissipates as we pile on further approximations. [...] Thus, the logic of approximate truth should lead us to the opposite conclusion here; that is, that the conjunction of two theories is, in general, less reliable than either (over their common domain). (Fine 1984: 90; H. d. A.)

Aus dem Umstand, daß die Konjunktion Τ zweier annähernd wahrer Theorien ^ und T 2 nicht wiederum annähernd wahr sein muß, ergibt sich, daß auch die neuen empirischen Konsequenzen, die aus Τ abgeleitet werden können, nicht annähernd wahr sein müssen. Es ist also auch unter der Voraussetzung der Wahrheitserklärung des empirischen Erfolgs wissenschaftlicher Theorien nicht zu erwarten, daß die Konjunktion zweier empirisch erfolgreicher Theorien wiederum empirisch erfolgreich ist. Und daher kann dieser zweite Einwand der Realisten gegen die Erklärung über empirische Adäquatheit nicht zeigen, daß die Wahrheitserklärung empirische Konsequenzen hat, die die Erklärung über empirische Adäquatheit nicht aufweisen kann. Der Einwand kann also nicht plausibel machen, daß die Wahrheitserklärung 10

In dieser Form habe ich die Wahrheitserklärung auch in Abschnitt 6.1 eingeführt.

316

6 SMuß auf die beste Erklärung und Realismusdebatte

eine bessere Erklärung des empirischen Erfolgs wissenschaftlicher Theorien darstellt als die Erklärung über empirische Adäquatheit.11 Fassen wir diesen Unterabschnitt zusammen: Antirealisten versuchen, den Erfolg wissenschaftlicher Theorien dadurch zu erklären, daß die betreffenden Theorien empirisch adäquat sind, d. h., daß diejenigen Aussagen der Theorien, die Beobachtbares betreffen, wahr sind. Der erste Einwand der Realisten hält diesem Versuch entgegen, daß es sich bei der Erklärung über empirische Adäquatheit Uberhaupt nicht um eine Erklärung des Erfolgs wissenschaftlicher Theorien handelt: Der Erfolg wissenschaftlicher Theorien besteht nach Ansicht der Realisten gerade darin, daß sie empirisch adäquat sind, und die Erklärung über empirische Adäquatheit versucht, dieses Phänomen durch sich selbst zu erklären. Antirealisten wenden ein, daß bei diesem Einwand nicht genau genug zwischen dem Explanandum und dem Explanans unterschieden wird: Zu erklären ist, daß die betreffenden Theorien bisher empirisch adäquat waren; erklärt wird dies damit, daß sie empirisch adäquat simpliciter sind, d. h., daß alle Aussagen der Theorien, die Beobachtbares betreffen, wahr sind. Bei ihrem zweiten Einwand gegen die Erklärung über empirische Adäquatheit - der Conjunction Objection - gehen Realisten zunächst davon aus, daß ein Kriterium zur Beurteilung der Güte einer Hypothese darin besteht, daß diese neue empirische Konsequenzen hat. Sie behaupten dann weiter, daß die Wahrheitserklärung diese Eigenschaft aufweisen kann - da sie die Konjunktion zweier empirisch erfolgreicher Theorien, die Herleitung von neuen empirischen Konsequenzen und damit eine neue Art der Überprüfung der beiden Theorien erlaubt - , während die Erklärung Uber empirische Adäquatheit dieses Merkmal nicht besitzt. Dieser Einwand übersieht aber, daß die Wahrheitserklärung den Erfolg wis-

11

Fine gesteht zu, daß das Konjungieren empirisch erfolgreicher Theorien zu einer Gesamttheorie und das Überprüfen neuer Vorhersagen, die aus dieser Gesamttheorie folgen, zur gängigen Praxis in den Wissenschaften gehört. Er behauptet, daß dies durch die Wahrheitserklärung eben gerade nicht befriedigend erklärt werden kann. Seine eigene, antirealistische Erklärung für diese Tatsache lautet folgendermaßen: „[...] there is no deep mystery as to why two compatible and successful theories lead us to expect their conjunction to be successful. For in forming the conjunction, we just add the reliable predictions of one onto the reliable predictions of the other, having antecendently ruled out the possibility of conflict." (Fine 1984: 91).

6.2 Erklärungen fur den Erfolg wissenschaftlicher Theorien

317

senschaftlicher Theorien lediglich mit deren annähernder Wahrheit erklärt und daß die Konjunktion zweier annähernd wahrer Theorien nicht wiederum annähernd wahr sein muß. Aus diesem Grund müssen auch die sich ergebenden neuen empirischen Konsequenzen nicht wiederum annähernd wahr sein, weswegen die betreffenden Theorien sich nicht durch diese Konsequenzen testen lassen. Dieser zweite Einwand der Realisten gegen die Erklärung über empirische Adäquatheit kann also ebensowenig wie der vorige zeigen, daß die Wahrheitserklärung eine bessere Erklärung des empirischen Erfolgs wissenschaftlicher Theorien darstellt als die Erklärung Uber empirische Adäquatheit. Das Resultat dieses und des vorigen Unterabschnitts besteht also darin, daß Antirealisten zwei potentielle Erklärungen für den empirischen Erfolg wissenschaftlicher Theorien vorbringen können, von denen die Realisten nicht zeigen können, inwiefern diese schlechtere Erklärungen darstellen als die von ihnen favorisierte Wahrheitserklärung. Das bedeutet, daß Prämisse 2 des Wahrheitsargumentes schlecht begründet ist: Realisten haben keine guten Argumente fUr die Annahme vorlegen können, daß es sich bei der Wahrheitserklärung um die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien handelt. Es bleibt die Frage zu beantworten, inwiefern die Wahrheitserklärung überhaupt als eine gute Erklärung des empirischen Erfolgs wissenschaftlicher Theorien angesehen werden kann.

6.2.3

Die Wahrheitserklärung - eine gute Erklärung des empirischen Erfolgs wissenschaftlicher Theorien?

Antirealisten haben, wie eingangs erwähnt, zwei Möglichkeiten, Prämisse 2 des Wahrheitsarguments anzugreifen. Sie können erstens behaupten, eine Erklärung für den Erfolg wissenschaftlicher Theorien zu haben, die zumindest ebenso gut ist wie die Wahrheitserklärung der Realisten. Zweitens können Antirealisten leugnen, daß die Wahrheitserklärung für sich selbst betrachtet gut genug ist, um einen Schluß auf die beste Erklärung zu legitimieren. Obwohl selbst kein Antirealist, wählt Peter Lipton in seinem Buch Inference to the Best Explanation (1991) diese zweite Möglichkeit, Prämisse 2 des Wahrheitsarguments anzugreifen: Die Wahrheitserklärung kann nach seiner Auffassung

318

6

Schluß auf die beste Erklärung und

Realismusdebatte

nicht als gut genug angesehen werden, um als diejenige Erklärung auftreten zu können, auf deren Wahrheit bei einem Schluß auf die beste Erklärung geschlossen würde. Der Grund hierfür ist: Sie ist zu einfach. Die Wahrheitserklärung würde sich nach Lipton als Erklärung für den Erfolg jeder beliebigen Theorie in genau der gleichen Weise eignen - ob diese Theorie nun tatsächlich wahr oder falsch, ad hoc oder über Jahre ausgearbeitet, ob sie selbst eine gute Erklärung der Daten ist oder nicht: How lovely, then, is the truth explanation? Alas, there is a good reason for saying that it is not lovely at all. The problem is that it is too easy. For any set of observational successes, there are many incompatible theories that would have produced them. [...] The trouble now is that the truth explanation would apply equally well to any of these theories. In each case, the theory's truth would explain its observational success, and all the explanations are equally lovely. A very complex and ad hoc theory provides less lovely explanations than does a simple and unified theory of the same phenomena, but the truth of the complex theory is as lovely or ugly an explanation of the truth of its predictions as is the explanation that the truth of the simple theory provides. (Lipton 1991: 172 f.; H. d. A.)

Ein weiteres Problem der Wahrheitserklärung liegt für Lipton in dem Umstand, daß ihr explanatorischer Wert für jede beliebige empirisch erfolgreiche Theorie lediglich darin besteht, daß deduktiv gültige Argumente mit wahren Prämissen wahre Konklusionen haben: „In either case, the explanatory value of the account lies simply in the fact that valid arguments with true premises have only true conclusions." (Lipton 1991: 173). Liptons Idee dabei ist, daß Beschreibungen empirischer Daten und Vorhersagen von Beobachtungen deduktiv aus der jeweiligen wissenschaftlichen Theorie abgeleitet werden, deren empirischer Erfolg zu erklären ist. Wenn diese Theorie wahr (und die Ableitung gültig) ist, müssen die Beschreibungen und Vorhersagen ebenfalls wahr, d. h. die betreffende Theorie empirisch erfolgreich sein. Und in diesem Sinne erklärt die Wahrheitserklärung den empirischen Erfolg der betreffenden Theorien. Da der explanatorische Wert einer solchen Erklärung nach Liptons Ansicht sehr gering und für jede beliebige empirisch erfolgreiche Theorie derselbe ist, stellt die Wahr-

6.2

Erklärungen für den Erfolg wissenschaftlicher

Theorien

319

heitserklärung für ihn keine gute, geschweige denn die beste Erklärung des Erfolgs wissenschaftlicher Theorien dar.12 Es liegt nahe, die Wahrheitserklärung gegen diesen Einwand von Lipton zu verteidigen, indem man von realistischer Seite darauf hinweist, daß sie eine analoge Struktur zu deduktiv-nomologischen Erklärungen im Sinne des covering Ζανν-Modells der Erklärung hat. Wie in Kapitel 1 beschrieben, wird bei einer deduktiv-nomologischen Erklärung das Explanandum (genauer: der Explanandum-Satz) aus dem Explanans deduktiv hergeleitet. Und man könnte argumentieren, daß der explanatorische Wert einer deduktiv-nomologischen Erklärung ebenfalls nur darin besteht, daß eine wahre Konklusion aus wahren Prämissen deduktiv hergeleitet wird. Wenn man also davon ausgeht, daß der deduktiv-nomologische Erklärungstyp des covering Ζανν-Μοdells eine adäquate Explikation des Erklärungsbegriffs darstellt, dann sollte die Wahrheitserklärüng, da sie diesem Typ genügt, als eine Erklärung des empirischen Erfolgs von wissenschaftlichen Theorien gelten können. Gegen diese Strategie, Liptons Einwand zu begegnen, sprechen natürlich in jedem Fall die in Kapitel 1 diskutierten Einwände gegen das covering /atv-Modell der Erklärung. Aber selbst wenn man von diesen Einwänden absieht, scheitert die Strategie bereits daran, daß die beanspruchte Analogie nicht trägt - denn tatsächlich genügt die Wahrheitserklärung dem deduktiv-nomologischen Erklärungstyp des covering /avf-Modells überhaupt nicht. Damit ein deduktiv gültiges Argument eine Erklärung im Sinne des covering /aw-Modells darstellt, muß in der Prämissenmenge des Arguments (d. h. im Explanans) wenigstens ein Gesetz als unverzichtbarer Bestandteil auftreten. Das Explanans der Wahrheitserklärung wird, wie in Abschnitt 6.1 beschrieben, von folgender Aussage gebildet: „Theorie Τ ist annähernd wahr, und die meisten der von Τ postulierten, unbeobachtbaren theoretischen Entitäten existieren tatsächlich." Bei dieser Aussage handelt es sich aber natürlich nicht um ein Gesetz. Daher kann es sich bei der Wahrheitserklärung nicht um eine deduktiv-nomologische Erklärung im Sinne des 12

Natürlich diskreditiert Liptons Einwand, wenn er stichhaltig ist, in analoger Wiese die Erklärung über empirische Adäquatheit für den Erfolg wissenschaftlicher Theorien. Denn die explanatorische Kraft dieser Erklärung besteht in genau demselben Umstand - aus der Wahrheit des empirischen Teils wird die Wahrheit empirischer Beschreibungen und Vorhersagen abgeleitet.

320

6

Schluß auf die beste Erklärung und Realismusdebatte

covering /mv-Modells handeln. Und das bedeutet, daß der Status der Wahrheitserklärung als einer guten Erklärung nicht gesichert werden kann, indem man darauf verweist, daß sie den Standards des covering fow-Modells genügt. Realisten können sich nun natürlich darauf zurückziehen, daß eine Erklärung nicht unbedingt dem covering /aw-Modell genügen muß, um ein bestimmtes Explanandum befriedigend zu erklären. Und sie können weiterhin behaupten, daß der von Lipton in Zweifel gezogene explanatorische Wert der Wahrheitserklärung dennoch groß genug ist, daß Lipton also nicht endgültig nachweisen kann, daß die Qualität der Wahrheitserklärung mangelhaft ist. Antirealisten auf der anderen Seite werden dies sicher wenig überzeugend finden und insbesondere auch auf ihre konkurrierenden Erklärungen hinweisen. Wir sind nun an einem Punkt angelangt, an dem Meinungen aufeinandertreffen, weil die Argumente ausgegangen sind. Einer der Hauptgründe für diese mißliche Lage liegt meiner Ansicht nach in der fehlenden Grundlage der Diskussion: Diese müßte in einem zugrunde gelegten Erklärungsmodell bestehen, das von beiden Seiten akzeptiert wird und auf dessen Basis sich einfach entscheiden läßt, ob die Wahrheitserklärung erstens überhaupt eine Erklärung des empirischen Erfolgs wissenschaftlicher Theorien darstellt, ob sie zweitens als eine gute Erklärung dieses Phänomens angesehen werden kann, ob sie drittens besser ist als die konkurrierenden antirealistischen Erklärungen und ob sie schließlich viertens die beste Erklärung des empirischen Erfolges wissenschaftlicher Theorien darstellt. Ein solches Modell steht uns aber nicht zur Verfügung. Denn wie wir in den ersten drei Kapiteln dieser Arbeit gesehen haben, sehen sich die in der Literatur einschlägigen Erklärungsmodelle allesamt großen Schwierigkeiten ausgesetzt. Daher ist es sehr schwierig zu entscheiden, ob und inwiefern die in diesem Abschnitt diskutierten Vorschläge der Realisten bzw. Antirealisten Erklärungen des empirischen Erfolgs wissenschaftlicher Theorien darstellen und welcher dieser Vorschläge die beste Erklärung dieses Erfolgs ist. Es bleibt allerdings festzuhalten, daß die von Realisten bevorzugte Wahrheitserklärung nach keinem der in dieser Arbeit diskutierten Erklärungsmodelle als gute Erklärung des empirischen Erfolgs wissenschaftlicher Theorien gelten kann. Weder wird bei der Wahrheitserklärung in irgendeiner Form auf kausale Faktoren oder die kausale Geschichte des empirischen Erfolgs wissenschaftlicher Theo-

6.2

Erklärungen für den Erfolg wissenschaftlicher Theorien

321

rien Bezug genommen: Die annähernde Wahrheit dieser Theorien, die zur Erklärung ihres empirischen Erfolgs herangezogen wird, ist kein kausal wirksamer Faktor, der es etwa hervorbrächte, daß die betreffenden Theorien empirisch erfolgreich sind. Noch ist zu sehen, inwiefern die Wahrheitsklärung zu einer Vereinheitlichung unseres Weltbildes führen würde: Durch sie wird nicht die Gesamtanzahl an unabhängigen Gesetzen reduziert, die wir zu akzeptieren haben (vgl. die Diskussion von Friedmans Vereinheitlichungsmodell der Erklärung in Kapitel 2, Abschnitt 2.2); und sie gehört auch nicht in irgendeinem Sinne zu einer Menge von wenigen Argumentmustern, mit denen wir viele akzeptierte Sätze aus unserem Überzeugungssystem herleiten können (vgl. die Diskussion von Kitchers Modell in Abschnitt 2.3 desselben Kapitels). Weiterhin greift die Wahrheitserklärung, wie wir gerade gesehen haben, nicht auf Gesetze zurück, so daß sie auch nach dem covering /aw-Modell nicht als Erklärung des empirischen Erfolgs wissenschaftlicher Theorien gelten kann. Das Ergebnis der Diskussion möglicher Erklärungen für den empirischen Erfolg wissenschaftlicher Theorien in diesem Abschnitt läßt sich also folgendermaßen zusammenfassen: Zum einen können wissenschaftliche Realisten nicht zeigen, daß und inwiefern die von ihnen bevorzugte Wahrheitserklärung besser ist als die von Antirealisten ins Spiel gebrachte Selektionserklärung bzw. die Erklärung über empirische Adäquatheit. Zum anderen ist fraglich, ob die Wahrheitserklärung für sich selbst betrachtet überhaupt eine gute Erklärung des empirischen Erfolgs wissenschaftlicher Theorien darstellt. Es sind also keine überzeugenden Gründe für die Behauptung wissenschaftlicher Realisten zu sehen, daß es sich bei der Wahrheitserklärung um die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien handelt. Daher muß die zweite Prämisse des in Abschnitt 6.1 beschriebenen Wahrheitsarguments wissenschaftlicher Realisten als unbegründet gelten, und dieses Argument für den wissenschaftlichen Realismus ist somit schon aus diesem Grund zurückzuweisen.

322

6 Schluß auf die beste Erklärung und Realismusdebatte

6.3

Die Verläßlichkeit des Schlusses auf die beste Erklärung

Wie in Abschnitt 6.1 erwähnt, ist das Wahrheitsargument für den wissenschaftlichen Realismus auch deswegen problematisch, weil es sich bei ihm um einen Schluß auf die beste Erklärung handelt. Denn wie ich in den vorigen Kapiteln dieser Arbeit versucht habe zu zeigen, sind keine guten Gründe für die Annahme zu sehen, daß Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen. Selbst wenn es sich also bei der im letzten Abschnitt diskutierten Wahrheitserklärung um die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien handeln sollte und die Prämissen des Wahrheitsargumentes damit erfüllt wären, müßten wissenschaftliche Realisten zunächst die Verläßlichkeit des Schlusses auf die beste Erklärung nachweisen, bevor sie sich in der RealismusDebatte zum Sieger erklären könnten.13 Das realistische Lager ist sich dieses Einwandes allerdings bewußt, und kürzlich hat Stathis Psillos in seinem Buch Scientific Realism: How Science Tracks Truth (1999) versucht, ein Argument für die Verläßlichkeit des Schlusses auf die beste Erklärung zu entwickeln. Psillos (1999: 78) beginnt seine Argumentation damit, daß er zunächst ein von Richard Boyd stammendes Argument für den wissenschaftlichen Realismus rekapituliert. Boyd hatte in mehreren Veröffentlichungen darauf hingewiesen, daß die in den Wissenschaften verwendeten Methoden zur Herleitung und Überprüfung von Vorhersagen zum einen sehr theorieabhängig sind: In die Konzeption von Experimenten und die Entwicklung neuer Hypothesen geht in hohem Maße Hintergrundwissen in der Form von vorausgesetzten Theorien ein. Zum anderen sind diese Methoden nach Boyds Ansicht instrumenteil verläßlich, d. h„ sie führen zu korrekten Vorhersagen, die experimentell überprüft werden können. Weiterhin ist Boyd der Auffassung, daß die beste Erklärung für diesen Umstand in der Annahme besteht, daß die das Hintergrundwissen bildenden wissenschaftlichen Theorien annähernd

13

Für eine antirealistische Kritik des Wahrheitsarguments in diesem Sinne vgl. insbesondere Fine (1984, 1986, 1991).

6.3

Die Verläßlichkeit des Schlusses auf die beste Erklärung

323

wahr sind. Und dies stellt schließlich einen Grund für ihn dar, an die annähernde Wahrheit besagter Theorien zu glauben.14 Bei diesem Argument von Boyd handelt es sich zunächst nur um eine weitere Variante des in Abschnitt 6.1 beschriebenen Wahrheitsargumentes. Der Unterschied zum Wahrheitsargument besteht lediglich darin, daß bei diesem der empirische Erfolg wissenschaftlicher Theorien das Explanandum darstellt, während im Fall von Boyds Argument die instrumenteile Verläßlichkeit wissenschaftlicher Methodologie zu erklären ist. Als beste Erklärung wird in beiden Fällen die annähernde Wahrheit der betrachteten Theorien angesehen, und auf diese wird dann mit Hilfe eines Schlusses auf die beste Erklärung geschlossen. Insofern ist nicht ohne weiteres zu sehen, was durch Psillos' Hinweis auf Boyds Argument im Hinblick auf die Verläßlichkeit des Schlusses auf die beste Erklärung gewonnen wird. Psillos behauptet nun aber, daß Boyds Argument mehr zu zeigen beabsichtigt, als es zunächst den Anschein hat. Boyds Argument aims at a broader target: to defend the thesis that Inference to the Best Explanation, or abduction (that is, a type of inferential method), is reliable. (Psillos 1999: 79; H. d. A.)

Mit Hilfe von Boyds Argument kann also nach Psillos' Auffassung auch die Verläßlichkeit des Schlusses auf die beste Erklärung gezeigt, d. h. die in der Einleitung zu dieser Arbeit beschriebene Verläßlichkeitsthese begründet werden. Wie genau kann nun Boyds Argument zur Begründung der Verläßlichkeit des Schlusses auf die beste Erklärung herangezogen werden? Psillos schreibt hierzu: But how exactly does this argument defend IBE [...]? As I have noted, it suggests that the best explanation of the instrumental reliability of scientific methodology is that background theories are relevantly approximately true. These background scientific theories have themselves been typically arrived at by abductive reasoning. Hence, it is reasonable to believe that abductive reasoning is reliable: it tends to generate approximately true theories. (Psillos 1999: 79 f.; m. H.)

Psillos' Argument für die Verläßlichkeit des Schlusses auf die beste Erklärung lautet also folgendermaßen: Die das Hintergrundwissen bildenden wissenschaftlichen Theorien sind annähernd wahr (Prämisse

14

Vgl. hierzu etwa Boyd (1981, 1984, 1989, 1990).

324

6

Schluß auf die beste Erklärung und Realismusdebatte

1). Diese Theorien werden typischerweise mit Hilfe des Schlusses auf die beste Erklärung erschlossen (Prämisse 2). Also führt der Schluß auf die beste Erklärung zu annähernd wahren Theorien und ist in diesem Sinne verläßlich (Konklusion). Die Rolle von Boyds Argument in diesem Argument von Psillos ist dabei offensichtlich die folgende: Die Konklusion von Boyds Argument - daß wissenschaftliche Theorien annähernd wahr sind - stellt Prämisse 1 von Psillos' Argument dar. 15 Gegen dieses Argument von Psillos für die Verläßlichkeit des Schlusses auf die beste Erklärung lassen sich schwerwiegende Einwände geltend machen. Der springende Punkt bei seinem Argument ist klarerweise Prämisse 1, in der die annähernde Wahrheit wissenschaftlicher Theorien behauptet wird. Welchen Grund haben wir, an die Wahrheit dieser Prämisse, d. h. an die annähernde Wahrheit wissenschaftlicher Theorien, zu glauben? Nun, Psillos bietet uns hierfür ein Argument an - nämlich das Argument von Boyd. Bei diesem Argument handelt es sich aber wie gesehen um einen Schluß auf die beste Erklärung: Die beste Erklärung für den Umstand, daß die wissenschaftliche Methodologie instrumenten verläßlich ist, besteht darin, daß die das Hintergrundwissen bildenden wissenschaftlichen Theorien annähernd wahr sind - also sind diese wahrscheinlich annähernd wahr. Dieses Argument von Boyd spricht selbstverständlich nur dann für die annähernde Wahrheit wissenschaftlicher Theorien, wenn es sich bei dem Schluß auf die beste Erklärung um ein verläßliches Schlußmuster handelt. Da Psillos aber gerade versucht, dies mit seinem Argument nachzuweisen, sollte er zur Begründung einer der Prämissen seines Arguments nicht auf den Schluß auf die beste Erklärung zurückgreifen und dessen Verläßlichkeit somit voraussetzen. Wissenschaftliche Realisten drehen sich hier gleich mehrfach im Kreis. Wie im letzten Abschnitt beschrieben, verwenden Realisten den Schluß auf die beste Erklärung bei der Argumentation für ihre Position, wenn sie beispielsweise das Wahrheitsargument oder das Wunderargument vorbringen. Antirealisten weisen dann darauf hin, daß einer der strittigen Punkte in der Realismus-Debatte gerade die Verläßlichkeit des Schlusses auf die beste Erklärung ist. Dementsprechend fordern sie die Realisten auf, Gründe für die Verläßlichkeit des Schlusses 15

Vgl. hierzu auch Psillos (1999: 82 f.).

6.3

Die Verläßlichkeit des Schlusses auf die beste Erklärung

325

auf die beste Erklärung vorzubringen, bevor sie diesen bei der Begründung ihrer realistischen Position verwenden. Dieser Aufforderung versucht Psillos, als bekennender Realist, nun nachzukommen, indem er das im vorletzten Absatz wiedergegebene Argument vorbringt. Bei diesem Argument für die Verläßlichkeit des Schlusses auf die beste Erklärung setzt er nun die Richtigkeit der realistischen Position voraus - nämlich daß wissenschaftliche Theorien annähernd wahr sind - , bzw. er begründet diese, indem er wiederum einen Schluß auf die beste Erklärung verwendet. Daß man auf diese Weise weder für den wissenschaftlichen Realismus noch für die Verläßlichkeit des Schlusses auf die beste Erklärung argumentieren kann, ist offensichtlich. Aber hierbei handelt es sich nicht um den einzigen Einwand gegen Psillos* Argument für die Verläßlichkeit des Schlusses auf die beste Erklärung. Dieses Argument scheitert selbst dann, wenn wir davon absehen, daß Prämisse 1 seines Arguments mit Hilfe eines Schlusses auf die beste Erklärung begründet wird, dessen Verläßlichkeit ja gerade strittig ist. Denn in Boyds Argument, das zur Begründung von Prämisse 1 von Psillos' Argument verwendet wird, geht eine Annahme ein, die keineswegs unkontrovers ist. Wie bereits erwähnt unterscheidet sich Boyds Argument vom Wahrheitsargument dadurch, daß das Explanandum in der instrumenteilen Verläßlichkeit der wissenschaftlichen Methodologie und nicht im empirischen Erfolg akzeptierter wissenschaftlicher Theorien besteht. Eine der Prämissen von Boyds Argument besagt demgemäß, daß die wissenschaftliche Methodologie instrumenteil verläßlich ist. Daß dies der Fall ist, kann aber bestritten werden. Während es nämlich nur schwer zu bestreiten ist, daß die gegenwärtig akzeptierten wissenschaftlichen Theorien empirisch erfolgreich sind (analoge Prämisse des Wahrheits- bzw. Wunderarguments), ist der instrumenteile Erfolg der wissenschaftlichen Methodologie alles andere als unkontrovers. Beispielsweise vertritt Arthur Fine die These, daß die wissenschaftliche Methodologie keineswegs in der Regel instrumenteil verläßlich ist, sondern vielmehr im Gegenteil eher selten: [...] in formulating the question as how to explain why the methods of science lead to instrumental success, the realist has seriously misstated the explanandum. Overwhelmingly, the results of the conscientious pursuit of scientific inquiry are failures: failed theories, failed hypotheses, failed conjectures, inaccurate measurements, incorrect estimations of parameters, fai-

326

6

Schluß auf die beste Erklärung und Realismusdebatte

lacious causal inferences, and so forth. If explanations are appropriate here, then what requires explaining is why the very same methods produce an overwhelming background of failures and, occasionally, also a pattern of successes. (Fine 1984: 104, Endote 8)

Falls das Explanandum, wie Fine behauptet, aber darin besteht, daß die wissenschaftliche Methodologie in der Regel gerade nicht verläßlich ist, dann kann - zumindest für Psillos und Boyd - die beste Erklärung dieses Umstandes nicht darin bestehen, daß die in die wissenschaftliche Methodologie eingehenden Hintergrundtheorien annähernd wahr sind. Dieser Hinweis von Fine hat damit zur Folge, daß Boyds Argument selbst dann scheitern würde, wenn der Schluß auf die beste Erklärung als verläßlich vorausgesetzt werden könnte - denn eine der Prämissen seines Argumentes ist nicht erfüllt. Daher ist Boyds Argument aus zweifachem Grund zur Begründung von Prämisse 1 von Psillos' Argument ungeeignet. Das bedeutet, daß Psillos' Argument für die Verläßlichkeit des Schlusses auf die beste Erklärung auf einer unbegründeten Prämisse aufbaut und somit scheitert: Psillos kann nicht zeigen, daß es sich bei dem Schluß auf die beste Erklärung um ein verläßliches Schlußmuster handelt, das von wahren Prämissen wahrscheinlich zu einer wahren Konlusion führt. 16

6.4

Abschließende Bemerkungen

Das in Abschnitt 6.1 beschriebene Wahrheitsargument stellt eines der Hauptargumente für den wissenschaftlichen Realismus dar. Es umfaßt zwei Prämissen: erstens, daß wissenschaftliche Theorien empirisch er-

16

Es ist im übrigen nicht zu sehen, warum Psillos bei seinem Argument für die Verläßlichkeit des Schlusses auf die beste Erklärung gerade auf Boyds Argument und nicht zum Beispiel auf das Wahrheits- oder das Wunderargument zurückgreift. Denn was Psillos für die Begründung der Verläßlichkeit des Schlusses auf die beste Erklärung benötigt, ist die Wahrheit von Prämisse 1, nach der wissenschaftliche Theorien annähernd wahr sind. Diese Prämisse tritt wie gesehen aber auch als Konklusion des Wahrheits- bzw. des Wunderarguments auf. Und in Anbetracht des beschriebenen Einwands von Fine wäre Psillos sogar eher zu diesen beiden Argumenten zu raten, da dann zumindest einer der Einwände gegen sein Argument entfallen würde.

6.4 Abschließende Bemerkungen

327

folgreich sind, und zweitens, daß die beste Erklärung für diesen Erfolg darin besteht, daß die betreffenden Theorien annähernd wahr sind und die meisten der von ihnen postulierten, unbeobachtbaren theoretischen Entitäten tatsächlich existieren. Mit Hilfe eines Schlusses auf die beste Erklärung wird dann auf die Wahrheit dieser Erklärung - d. h. auf die annähernde Wahrheit der betreffenden Theorien und die Existenz der postulierten Entitäten - geschlossen. In Abschnitt 6.2 habe ich zunächst versucht zu zeigen, daß die von Antirealisten ins Spiel gebrachte Selektionserklärung bzw. die Erklärung Uber empirische Adäquatheit gegen die Einwände der Realisten verteidigt werden kann. Anders ausgedrückt: Wissenschaftliche Realisten können nicht zeigen, daß und inwiefern die von ihnen bevorzugte Wahrheitserklärung für den empirischen Erfolg wissenschaftlicher Theorien eine bessere Erklärung dieses Erfolgs darstellt als die von Antirealisten gemachten Vorschläge. Weiterhin habe ich in diesem Abschnitt versucht nachzuweisen, daß wenig dafür spricht, daß die Wahrheitserklärung für sich betrachtet überhaupt eine gute Erklärung des empirischen Erfolgs wissenschaftlicher Theorien ist. Das bedeutet, daß keine überzeugenden Gründe für die Annahme vorliegen, daß es sich bei der von Realisten bevorzugten Wahrheitserklärung um die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien handelt. Es spricht daher nichts dafür, daß die zweite Prämisse des Wahrheitsarguments wahr ist.17 Bereits aus diesem Grund steht das Wahrheitsargument der Realisten auf schwachen Beinen. In den vorigen Kapiteln dieser Arbeit habe ich zudem versucht nachzuweisen, daß keine guten Gründe dafür sprechen, das im Wahrheitsargument verwendete Schlußschema - den Schluß auf die beste Erklärung - als verläßlich anzusehen. Im vorigen Abschnitt 6.3 habe ich nun ein weiteres Argument für die Verläßlichkeit des Schlusses auf die beste Erklärung - nämlich das Argument von Psillos - untersucht und gezeigt, daß es scheitert. Das Wahrheitsargument für den wissenschaftlichen Realismus ist also auch deswe17

Bei dieser Diskussion konnte die Frage, was als die beste Erklärung des empirischen Erfolgs wissenschaftlicher Theorien zu gelten hat, nicht abschließend geklärt werden. Dies hatte seinen Grund insbesondere darin, daß die Argumente für und wider die jeweilige Erklärung sich auf einem intuitiven und vagen Niveau bewegten und nicht vor dem Hintergrund eines zugrunde gelegten Erklärungsmodells beurteilt werden konnten.

328

6 Schluß auf die beste Erklärung und Realismusdebatte

gen zurückzuweisen, weil nichts für die Verläßlichkeit des verwendeten Schlußschemas spricht. Das Fazit muß also lauten, daß das Wahrheitsargument keine gute Basis fUr eine Begründung des wissenschaftlichen Realismus bietet. Dieses Kapitel illustriert somit anhand einer Fallstudie die in der Einleitung zu dieser Arbeit aufgestellte These: Der Schluß auf die beste Erklärung ist in philosophischen Debatten viel weniger hilfreich, als dies zunächst den Anschein hat und weithin angenommen wird. Zum einen ist bereits die Bestimmung der besten Erklärung der jeweils zu erklärenden Phänomene aufgrund des Fehlens eines unkontroversen Erklärungsmodells äußerst problematisch. Zum anderen sind keine guten Gründe für die Annahme zu sehen, daß es sich bei dem Schluß auf die beste Erklärung um ein verläßliches Schlußmuster handelt, das von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führt.

Epilog In dieser Arbeit habe ich versucht nachzuweisen, daß die anfängliche Plausibilität des Schlusses auf die beste Erklärung sich bei näherer Untersuchung nicht durch Argumente untermauern läßt und daß daher die großen Hoffnungen, die viele Autoren in ihn setzen, unbegründet sind. Wie die ersten drei Kapitel dieser Arbeit gezeigt haben, sind schon die Grundlagen des Schlusses auf die beste Erklärung alles andere als solide. Die in diesem Teil der Arbeit untersuchten Erklärungsmodelle haben bereits im Hinblick auf die adäquate Explikation des Erklärungsbegriffs mit erheblichen Schwierigkeiten zu kämpfen. Weiterhin eignen sie sich alle deswegen nicht als Basis für den Schluß auf die beste Erklärung, weil sie keine akzeptable Antwort auf die Frage bereitstellen, was eine Hypothese zur besten Erklärung eines Phänomens macht. Mit anderen Worten: Es bleibt unklar, was zum einen unter einer Erklärung eines Phänomens verstanden und wie zum anderen die beste Erklärung des Phänomens unter einer Menge von miteinander konkurrierenden Erklärungen ermittelt werden soll. Dies hat zur Folge, daß der Schluß auf die beste Erklärung gar nicht erst zur Anwendung kommen kann - denn es bleibt völlig offen, worauf bei einem solchen Schluß überhaupt geschlossen werden soll. Darüber hinaus nährte die Diskussion der von spezifischen Erklärungsmodellen weitgehend unabhängigen Argumente für und gegen den Schluß auf die beste Erklärung in den Kapiteln 4 und 5 dieser Arbeit weitere Zweifel an diesem Schlußmuster. Denn erstens sind keine guten Gründe für die Annahme zu sehen, daß Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen und in diesem Sinne verläßlich sind. Zweitens wäre es selbst unter dieser Annahme fraglich, ob diejenigen Schlüsse, die wir im Alltag, den Einzelwissenschaften und der Philosophie tatsächlich ziehen, als verläßlich gelten können - denn wir können hier immer nur auf die beste der zur Verfügung stehenden Erklärungen und

330

Epilog

nicht auf die beste Erklärung simpliciter schließen. Und drittens zeigt die Untersuchung des Schlusses auf die beste Erklärung im Zusammenhang mit dem Bayesianismus, daß die Anwendung dieses Schlußmusters in bestimmten Bereichen zu Inkohärenzen führt. In Anbetracht dieser Resultate nimmt schließlich das Ergebnis von Kapitel 6 dieser Arbeit nicht wunder: Der Schluß auf die beste Erklärung ist zur Entscheidung der Debatte zwischen wissenschaftlichen Realisten und Antirealisten um die Interpretation wissenschaftlicher Theorien wenig hilfreich. Vor dem Hintergrund dieser Ergebnisse liegt die Frage nahe, warum der Schluß auf die beste Erklärung anfänglich eine so hohe intuitive Plausibilität genießt und, wie eingangs dieser Arbeit gezeigt, in vielen Bereichen so verbreitet ist - wenn doch, wie ich behaupte, nichts für ihn spricht. Ich glaube, die Antwort auf diese Frage muß lauten, daß der Schluß auf die beste Erklärung seine Anfangsplausibilität einem Mißverständnis verdankt. Betrachten wir hierzu noch einmal das ganz zu Anfang dieser Arbeit erwähnte Beispiel des Spaziergängers, der im Sand Fußspuren entdeckt und daraus schließt, vor ihm müsse ein anderer Mensch denselben Weg entlanggegangen sein. Im Anschluß an die Darstellung dieses Beispiels hatte ich geschrieben, der betreffende Schluß könne als ein Schluß auf die beste Erklärung aufgefaßt werden: Der Spaziergänger hält die Annahme, ein anderer Mensch sei vor ihm denselben Weg entlanggegangen, für die beste Erklärung der Fußspuren und schließt aus diesem Grund auf die wahrscheinliche Wahrheit dieser Annahme, d. h. darauf, daß tatsächlich ein anderer Mensch vor ihm den betreffenden Weg entlanggegangen ist. Dieses Beispiel kann man allerdings auch anders beschreiben. Fragen wir uns zunächst, warum der Spaziergänger auf die besagte Annahme und nicht auf eine andere Hypothese geschlossen hat - beispielsweise darauf, daß ein Umweltkünstler für die Spuren verantwortlich ist, daß die Formationen auf besondere Windverhältnisse zurückgehen oder gar daß Außerirdische ein Wahrnehmungs-Experiment mit ihm unternehmen. Die Antwort auf diese Frage kann nicht lauten, daß diese Hypothesen keine Erklärungen der Fußspuren darstellen. Denn der einzig in Frage kommende Sinn, in dem das Vorübergehen eines anderen Menschen die Fußspuren erklärt, besteht darin, daß dieser die Fußspuren verursacht. In diesem Sinne erklären allerdings auch die Performance des Umweltkünstlers, die besonderen

Epilog

331

Windverhältnisse und die allseits bekannte Experimentierfreudigkeit der Außerirdischen die Fußspuren. Warum also schließt der Spaziergänger dann darauf, daß vor ihm ein anderer Mensch denselben Weg entlanggegangen sein muß? Nun, offensichtlich tut er dies deswegen, weil er diese Hypothese vor dem Hintergrund der vorliegenden Daten für bei weitem am wahrscheinlichsten hält, die anderen genannten Hypothesen aber (ebenso wie unzählige nicht genannte) für sehr viel weniger wahrscheinlich. Der Spaziergänger schließt jedoch nicht deshalb auf diese Hypothese, weil er sie in irgendeinem von Wahrscheinlichkeitserwägungen unabhängigen Sinne für die beste Erklärung der Fußspuren hält. Es ist keineswegs so, daß er beim Anblick der Fußspuren nicht wüßte, welche Hypothese am wahrscheinlichsten ist; daß er sich dann fragte, was die Fußspuren wohl am besten erkläre; daß er hierauf unter Verwendung eines bestimmten Erklärungsmodells entschiede, das Entlanggehen eines Menschen stelle die beste Erklärung der Fußspuren dar; und daß er aus diesem Grund die Hypothese für am wahrscheinlichsten hielte, ein anderer Mensch sei vor ihm denselben Weg entlanggegangen und für die Fußspuren verantwortlich. Man könnte eher umgekehrt sagen, daß er diese Hypothese deswegen als die beste Erklärung der Fußspuren betrachtet, weil er sie für am wahrscheinlichsten hält. Entgegen dem anfänglichen Anschein trägt der Erklärungsbegriff hier also nichts zur Entscheidung des Spaziergängers bei.1 Man kann natürlich, wenn man will, Beispiele dieser Art dennoch als Schlüsse auf die beste Erklärung auffassen. Man muß hierzu lediglich annehmen, daß „beste Erklärung" nichts anderes bedeutet als „wahrscheinlichste Hypothese": Der Spaziergänger hält die Annahme, ein anderer Mensch sei vor ihm denselben Weg entlanggegangen, für

1

Vgl. hierzu auch das in Kapitel 5, Abschnitt 5.4.5, diskutierte Beispiel der Ärztin, die nach der Untersuchung eines Kindes die Diagnose stellt, es läge ein Bänderriß vor. Es ist darüber hinaus fraglich, ob man in Fällen der beschriebenen Art überhaupt von Schlüssen - sei es auf die beste Erklärung, sei es auf die wahrscheinlichste Hypothese - sprechen sollte. Van Fraassen bemerkt hierzu: „What about such common examples as: I see dirty dishes and, although other explanations are possible, infer the best, namely that someone has eaten? Obviously these must be reconstrued: I make no inference at all, it was already highly probable to me that someone has been eating, given that there are dirty dishes." (van Fraassen 1989: 161; m. H.).

332

Epilog

die vor dem Hintergrund der gegebenen Daten wahrscheinlichste Hypothese, betrachtet sie deshalb als die beste Erklärung der vorliegenden Phänomene und schließt daher per Schluß auf die beste Erklärung auf ihre wahrscheinliche Wahrheit. Wie ich allerdings in den vorigen Kapiteln bereits mehrfach betont habe, ist diese Bestimmung des Begriffs der besten Erklärung für die Zwecke des Schlusses auf die beste Erklärung wenig hilfreich. Der Schluß auf die beste Erklärung wird von seinen Befürwortern ja gerade als eines der wichtigsten erkenntnistheoretischen Werkzeuge zur Wahl zwischen miteinander konkurrierenden Hypothesen empfohlen. Wir können den im jeweiligen Fall zur Diskussion stehenden Hypothesen nicht direkt ansehen, ob sie wahr oder falsch bzw. wie wahrscheinlich sie sind, und müssen daher auf indirektem Wege zu einer Einschätzung ihrer Wahrscheinlichkeit gelangen. Anhänger des Schlusses auf die beste Erklärung raten hierfür zum Umweg über den Erklärungsbegriff: Wir untersuchen die miteinander konkurrierenden Hypothesen im Hinblick auf die Frage, wie gut sie die betrachteten Phänomene erklären, und schließen auf diejenige Hypothese, d. h. halten diejenige Hypothese für wahrscheinlich wahr, die die beste Erklärung der Phänomene darstellt. Wenn man den Begriff der besten Erklärung nun jedoch Uber den Wahrscheinlichkeitsbegriff bestimmt und „beste Erklärung" als „wahrscheinlichste Hypothese" expliziert, dann kann der Schluß auf die beste Erklärung diese ihm von seinen Anhängern zugedachte Aufgabe offensichtlich nicht erfüllen. Denn dann muß man bei seiner Verwendung bereits wissen, was man durch seine Anwendung erst herausfinden will nämlich welche Hypothese vor dem Hintergrund der Daten am wahrscheinlichsten ist. Andernfalls kann man offensichtlich die beste Erklärung der betrachteten Phänomene gar nicht ermitteln und daher auch keinen Schluß auf die beste Erklärung ziehen. Bei dieser Konzeption des Begriffs der besten Erklärung drehen wir uns also im Kreis.2 Wir können den Erklärungsbegriff somit nicht unter Rekurs auf den Begriff der Wahrscheinlichkeit bestimmen, wenn der Schluß auf die beste Erklärung die ihm von seinen Befürwortern zugedachte Funktion erfüllen können soll. Was kann unter der besten Erklärung eines Vgl. hierzu insbesondere meine Ausführungen in den Kapiteln 1 bis 3 dieser Arbeit.

Epilog

333

Phänomens sonst verstanden werden? Auf diese Frage haben wir in dieser Arbeit keine Antwort finden können. Dies bedeutet natürlich nicht, daß die Bestimmung eines Erklärungsbegriffs, der für die Zwecke des Schlusses auf die beste Erklärung geeignet ist, unmöglich wäre. Es kann nicht ausgeschlossen werden, daß irgendwann ein Erklärungsmodell entwickelt wird, das eine adäquate Explikation des Begriffs der Erklärung bietet, die Auszeichnung der besten Erklärung des jeweils betrachteten Phänomens erlaubt und insbesondere verständlich machen kann, warum Schlüsse auf die beste Erklärung von wahren Prämissen wahrscheinlich zu einer wahren Konklusion führen und in diesem Sinne verläßlich sein sollen. Derzeit jedoch steht ein derartiges Erklärungsmodell nicht zur Verfügung. Und solange die Anhänger des Schlusses auf die beste Erklärung ein solches Modell nicht liefern können, sind die Hoffnungen, die sie in dieses Schlußmuster setzen, unbegründet.

Danksagung Bei diesem Buch handelt es sich im wesentlichen um meine Dissertationsschrift gleichnamigen Titels. Bei der Abfassung dieser Arbeit bin ich von vielen Personen und Institutionen unterstützt worden. Ihnen allen gebührt mein Dank. Zuvorderst habe ich Ulrich Gähde, Wolfgang Künne und Holm Tetens für die Betreuung der Arbeit zu danken. Weiterhin danke ich Thomas Bartelborth, Wolfgang Barz, Ali Behboud, Elke Brendel, Markus Braig, Dorothea Frede, Gilbert Harman, Martin Hoffmann, David Lewis, Nadine Ott, Jens Pape, Reinold Schmücker, Holger Jens Schnell, Manfred Stöckler, Mark Textor und Bas van Fraassen. Die vorliegende Arbeit wäre ohne ihre kritischen Anmerkungen, Vorschläge und Anregungen und ohne die ungezählten Diskussionen mit ihnen um vieles ärmer. Weiterhin danke ich der Studienstiftung des deutschen Volkes für ihre Förderung, der Freien Universität Berlin und dem Berlin Consortium für die Ermöglichung eines Forschungsaufenthaltes an der Princeton University, der Joachim Jungius-Gesellschaft der Wissenschaften für den Vorschlag zur Verleihung des Förderpreises der Dr. Helmut und Hannelore Greve-Stiftung für Wissenschaften und Kultur sowie der Greve-Stiftung selbst für die Zuerkennung ihres Förderpreises. Schließlich gilt mein Dank Wilfried Hinsch und Lutz Wingert für die Aufnahme meiner Arbeit in die Reihe Ideen und Argumente sowie dem Walter de Gruyter Verlag für die freundliche Zusammenarbeit.

Literaturverzeichnis Armendt, Β. (1980): „Is There a Dutch Book Argument for Probability Kinematics?". In: Philosophy of Science, 47: 583-589. Armstrong, D. M. (1978): Universals and Scientific Realism. Cambridge u. a.: Cambridge University Press. Armstrong, D. M. (1983): What Is a Law of Nature?. Cambridge u. a.: Cambridge University Press. Armstrong, D. M. (1992): „Properties". In: Mulligan, K. (Hg.) (1992): 14-27. Asquith, P. D./Giere, R. N. (Hgg.) (1981): PSA 1980, Bd. 2. East Lansing, Mich.: Philosophy of Science Association. Asquith, P. D./Kitcher, P. (Hgg.) (1985): PSA 1984, Bd. 2. East Lansing, Mich.: Philosophy of Science Association. Balashov, Y. (1999): „Relativistic Objects". In: Nous, 33: 644-662. Balzer, W./Moulines, C. U. (1996): Structuralist Theory of Science. Focal Issues, New Results. Berlin: de Gruyter. Barnes, E. (1992): „Explanatory Unification and the Problem of Asymmetry". In: Philosophy of Science, 59: 558-571. Bartelborth, T. (1996a): Begründungsstrategien. Ein Weg durch die analytische Erkenntnistheorie. Berlin: Akademie Verlag. Bartelborth, T. (1996b): „Scientific Explanation". In: Balzer, W./Moulines, C. U. (Hgg.) (1996): 23-43. Bartelborth, T. (1999): „Coherence and Explanations". In: Erkenntnis, 50: 209-224. Baumrin, B. (Hg.) (1963a): Philosophy of Science. The Delaware Seminar, Bd. I. New York/London: Wiley & Sons. Baumrin, B. (Hg.) (1963b): Philosophy of Science. The Delaware Seminar, Bd. II. New York/London: Wiley & Sons. Ben-Menahem, Y. (1990): „The Inference to the Best Explanation". In: Erkenntnis, 33: 319-344.

338

Literaturverzeichnis

Bonjour, L. (1985): The Structure of Empirical Knowledge. Cambridge, Mass., u. a.: Harvard University Press. Bonjour, L. (1998): In Defense of Pure Reason: A Rationalist Account of A Priori Justification. Cambridge u. a.: Cambridge University Press. Boolos, G. (Hg.) (1990): Meaning and Method. Essays in Honor of Hilary Putnam. Cambridge u. a.: Cambridge University Press. Boyd, R. (1981): „Scientific Realism and Naturalistic Epistemology". In: Asquith, P. D./Giere, R. N. (Hgg.) (1981): 613-662. Boyd, R. (1984): „The Current Status of Scientific Realism". In: Leplin, J. (Hg.) (1984): 41-82. Boyd, R. (1985): „The Logician's Dilemma: Deductive Logic, Inductive Inference and Logical Empiricism". In: Erkenntnis, 22: 197— 252. Boyd, R. (1989): „What Realism Implies and What It Does Not". In: Dialéctica, 43: 5-29. Boyd, R. (1990): „Realism, Conventionality, and 'Realism About'". In: Boolos, G. (Hg.) (1990): 171-195. Bradie, M. (1994): „Epistemology from an Evolutionary Point of View". In: Sober, E. (Hg.) (1994): 453-476. Brink, C. (1989): „Verisimilitude. Views and Reviews". In: History and Philosophy of Logic, 10: 181-201. Bromberger, S. (1966): „Why-Questions". In: Colodny, R. G. (Hg.) (1966): 86-111. Carrier, M. (1998): „Salmon 1 versus Salmon 2: Das Prozeßmodell der Kausalität in seiner Entwicklung". In: Dialektik, 1998/2 (= Falkenburg, B./Pätzold, D. (Hgg.) (1998): Verursachung. Repräsentationen von Kausalität. Hamburg: Meiner.): 49-70. Christensen, D. (1991): „Clever Bookies and Coherent Beliefs". In: The Philosophical Review, 100: 229-247. Christensen, D. (1996): „Dutch-Book Arguments Depragmatized: Epistemic Consistency for Partial Believers". In: The Journal of Philosophy, 93:450-479. Churchland, P. M./Hooker, C. A. (Hgg.) (1985): Images of Science: Essays on Realism and Empiricism, With a Reply from Bas C. van Fraassen. Chicago: University of Chicago Press.

Literaturverzeichnis

339

Clark, Κ. J. (1992): „Hold Not Thy Peace At My Tears: Methodological Reflections on Divine Impassibility". In: Clark, K. J. (Hg.) (1992): 167-193. Clark, K. J. (Hg.) (1992): Our Knowledge of God. Dordrecht u. a.: Kluwer. Clayton, P. (1997): „Inference to the Best Explanation". In: Zygon, 32: 377-391. Coffa, J. A. (1973): Foundations of Inductive Explanation. Dissertation, Universität Pittsburgh. Coffa, J. A. (1974): „Hempel's Ambiguity". In: Synthese, 28: 141163. Colodny, R. G. (Hg.) (1962): Frontiers of Science and Philosophy. University of Pittsburgh Series in the Philosophy of Science, Bd. I. Pittsburgh: University of Pittsburgh Press. Colodny, R. G. (Hg.) (1966): Mind and Cosmos. University of Pittsburgh Series in the Philosophy of Science, Bd. III. Pittsburgh: University of Pittsburgh Press. Colodny, R. G. (Hg.) (1970): The Nature and Function of Scientific Theories. University of Pittsburgh Series in the Philosophy of Science, Bd. IV. Pittsburgh: University of Pittsburgh Press. Currie, G. (1989): An Ontology of Art. New York: St. Martin's Press. Darwin, C. (1962): The Origin of Species. New York: Collier. Day, T./Kincaid, H. (1994): „Putting Inference to the Best Explanation in Its Place". In: Synthese, 98: 271-295. de Finetti, Β. (1937): „La Prévision: ses lois logiques, ses sources subjectives". In: Annales de l'Institut Henri Poincaré, 7: 1-68. Wiederabgedruckt als: „Foresight: Its Logical Laws, Its Subjective Sources". In: Kyburg, H. E./Smokler, H. E. (Hgg.) (1964): 93-158. Devitt, M. (1984): Realism and Truth. Princeton: Princeton University Press. Douven, I. (1999): „Inference to the Best Explanation Made Coherent". In: Philosophy of Science, 66 (3 Supplement): S424-S435. Dowe, P. (1992): „Wesley Salmon's Process Theory of Causality and the Conserved Quantity Theory". In: Philosophy of Science, 59: 195-216. Dowe, P. (1995): „Causality and Conserved Quantities: A Reply to Salmon". In: Philosophy of Science, 62: 321-333.

340

Literaturverzeichnis

Dowe, P. (2000a): „Causality and Explanation". In: British Journal for the Philosophy of Science, 51: 165-174. Dowe, P. (2000b): Physical Causation. Cambridge u. a.: Cambridge University Press. Dray, W. (1957): Laws and Explanation in History. Oxford: Oxford University Press. Dray, W. (1963): „The Historical Explanation of Actions Reconsidered". In: Hook, S. (Hg.) (1963): 103-135. Earman, J. (1992): Bayes or Bust? A Critical Examination of Bayesian Confirmation Theory. Cambridge, Mass., u. a.: MIT Press. Feigl, H./Maxwell, G. (Hgg.) (1962): Scientific Explanation, Space, and Time. Minnesota Studies in the Philosophy of Science, Bd. III. Minneapolis: University of Minnesota Press. Feigl, H./Scriven, M./Maxwell, G. (Hgg.) (1959): Concepts, Theories, and the Mind-Body Problem. Minnesota Studies in the Philosophy of Science, Bd. II. Minneapolis: University of Minnesota Press. Fetzer, J. H. (1974): „A Single-Case Propensity Theory of Explanation". In: Synthese, 28:171-198. Fetzer, J. H. (Hg.) (1988): Probability and Causality: Essays in Honor of Wesley C. Salmon. Dordrecht: Reidel. Fine, A. (1984): „The Natural Ontological Attitude". In: Leplin, I. (Hg.) (1984): 83-107. Fine, A. (1986): „Unnatural Attitudes: Realist and Instrumentalist Attachments to Science". In: Mind, 95: 149-179. Fine, A. (1991): „Piecemeal Realism". In: Philosophical Studies, 61: 79-96. Fine, A ./Leplin, J. (Hgg.) (1989): PSA 1988, Bd. 2. East Lansing, Mich.: Philosophy of Science Association. Fodor, J. (1987): Psychosemantics: The Problem of Meaning in the Philosophy of Mind. Cambridge, Mass., u. a.: MIT Press. Friedman, M. (1974): „Explanation and Scientific Understanding". In: The Journal of Philosophy, 71: 5-19. Gardiner, P. (1959): Theories of History. New York: The Free Press. Glymour, C. (1984): „Explanation and Realism". In: Leplin, J. (Hg.) (1984): 173-192. Goldstein, M. (1983): „The Prevision of Prevision". In: Journal of the American Statistical Association, 78: 817-819.

Literaturverzeichnis

341

Goodman, Ν. (1955): Fact, Fiction, and Forecast. Cambridge, Mass.: Harvard University Press. Greeno, J. G. (1971): „Explanation and Information". In: Salmon, W. C. (1971): 89-104. - Wiederabdruck von: Greeno, J. G. (1970): „Evaluation of Statistical Hypotheses Using Information Transmitted". In: Philosophy of Science, 37: 279-293. Hacking, I. (1983): Representing and Intervening. Cambridge: Cambridge University Press. Hall, N. (2000): „Causation and the Price of Transitivity". In: The Journal of Philosophy, 97: 198-222. Hanen, M./Kelley, J. (1989): „Inference to the Best Explanation in Archaeology". In: Pinsky, V./Wylie, A. (Hgg.) (1989): 14-17. Hanna, J. (1978): „On Transmitted Information as a Measure of Explanatory Power". In: Philosophy of Science, 45: 531-562. Harman, G. (1965): „The Inference to the Best Explanation". In: Philosophical Review, 74: 88-95. Harman, G. (1997): „Pragmatism and Reasons for Belief'. In: Kulp, C. B. (Hg.) (1997): 123-147. Harper, W./Hooker, C. (Hgg.) (1976): Foundations of Probability Theory, Statistical Inference, and Statistical Theories of Science. Dordrecht: Reidel. Hempel, C. G. (1942): „The Function of General Laws in History". In: The Journal of Philosophy, 39: 35-48. Hempel, C. G. (1960): „Inductive Inconsistencies". In: Synthese, 12: 439-469. Hempel, C. G. (1962a): „Deductive-Nomological vs. Statistical Explanation". In: Feigl, H./Maxwell, G. (Hgg.) (1962): 98-169. Hempel, C. G. (1962b): „Explanation in Science and in History". In: Colodny, R. G. (Hg.) (1962): 7-34. Hempel, C. G. (1965a): „Aspects of Scientific Explanation". In: Hempel, C. G. (1965b): 331-496. Hempel, C. G. (1965b): Aspects of Scientific Explanation and Other Essays in the Philosophy of Science. New York: The Free Press. Hempel, C. G. (1966): Philosophy of Natural Science. Englewood Cliffs, N.J.: Prentice-Hall. Hempel, C. G. (1968): „Maximal Specificity and Lawlikeness in Probabilistic Explanation". In: Philosophy of Science, 35: 116-133.

342

Literaturverzeichnis

Hempel, C. G. (1976): „Nachwort 1976: Neuere Ideen zu den Problemen der statistischen Erklärung". In: Hempel, C. G. (1977): 98-123. Hempel, C. G. (1977): Aspekte wissenschaftlicher Erklärung. Berlin/ New York: de Gruyter. Hempel, C. G./Oppenheim, P. (1948): „Studies in the Logic of Explanation". In: Philosophy of Science, 15: 135-175. Hintikka, J. (1998): „What is Abduction? The Fundamental Problem of Contemporary Epistemology". In: Transactions of the Charles S. Peirce Society, 34: 503-533. Hitchcock, C. (1995): „Discussion: Salmon on Explanatory Relevance". In: Philosophy of Science, 62: 304-320. Holcomb, H. R. (1996): „Just So Stories and Inference to the Best Explanation in Evolutionary Psychology". In: Minds and Machines, 6: 525-540. Hook, S. (Hg.) (1963): Philosophy and History. New York: New York University Press. Howson, C. (1993): „Dutch Book Arguments and Consistency". In: Proceedings of the Biennial Meetings of the Philosophy of Science Association, 1992, Bd. II: 161-168. Howson, C./Urbach, P. (1989): Scientific Reasoning: The Bayesian Approach. La Salle, 111.: Open Court. Jeffrey, R. C. (1969): „Statistical Explanation vs. Statistical Inference". In: Rescher, N. (Hg.) (1969): 104-113. Jeffrey, R. C. (21983): The Logic of Decision. Chicago: University of Chicago Press. Jeffrey, R. C. (Hg.) (1980): Studies in Inductive Logic and Probability, Bd. II. Berkeley: Berkeley University Press. Johnson, J. L. (1993): „Inference to the Best Explanation and the New Teleological Argument". In: Southern Journal of Philosophy, 31: 193-203. Jones, T. (1995): „How the Unification Theory of Explanation Escapes Asymmetry Problems". In: Erkenntnis, 43: 229-240. Kahnemann, D./Slovic, P./Tversky, A. (Hgg.) (1982): Judgment Under Uncertainty: Heuristics and Biases. Cambridge: Cambridge University Press. Kapitan, T. (1992): „Peirce and the Autonomy of Abductive Reasoning". In: Erkenntnis, 37: 1-26.

Literaturverzeichnis

343

Kim, J. (1973): „Causes and Counterfactuals". In: The Journal of Philosophy, 70: 570-572. Kirkham, R. L. (1992): Theories of Truth: A Critical Introduction. Cambridge, Mass., u. a.: MIT Press. Kitcher, P. (1976): „Explanation, Conjunction, and Unification". In: The Journal of Philosophy, 73: 207-212. Kitcher, P. (1981): „Explanatory Unification". In: Philosophy of Science, 48: 507-531. Kitcher, P. (1984): „1953 and All That. A Tale of Two Sciences." In: Philosophical Review, 93: 335-373. Kitcher, P. (1985a): „Two Approaches to Explanation". In: The Journal of Philosophy, 82: 632-639. Kitcher, P. (1985b): „Darwin's Achievement". In: Rescher, N. (Hg.) (1985): 127-189. Kitcher, P. (1985c): Vaulting Ambition: Sociobiology and the Quest for Human Nature. Cambridge, Mass.: MIT Press. Kitcher, P. (1989): „Explanatory Unification and the Causal Structure of the World". In: Kitcher, P./Salmon, W. C. (Hgg.) (1989): 410505. Kitcher, P./SaImon, W. C. (1987): „Van Frasssen on Explanation". In: The Journal of Philosophy, 84: 315-330. Kitcher, Ρ ./Salmon, W. C. (Hgg.) (1989): Scientific Explanation. Minnesota Studies in the Philosophy of Science, Bd. XIII. Minneapolis: University of Minnesota Press. Kolmogorov, A. N. (1950): Foundations of the Theory of Probability. New York: Chelsea Publishing Company. Künne, W. (1985): „Wahrheit". In: Martens, E./Schnädelbach, H. (Hgg.) (1985): 116-171. Künne, W. (2000): „Truth and a Kind of Realism". In: Nida-Rümelin, J. (Hg.) (2000): 17-41. Kulp, C. B. (Hg.) (1997): Realism/Antirealism and Epistemology. Lanham, Md.: Rowman & Littlefield. Kyburg, H. E. (1965): „Reply to Wesley C. Salmon's Paper, 'The Status of Prior Probabilities in Statistical Explanation'". In: Philosophy of Science, 32: 147-151. Kyburg, H. E./Smokler, H. E. (Hgg.) (1964): Studies in Subjective Probability. New York u. a.: Wiley & Sons.

344

Literaturverzeichnis

Ladyman, J./Douven, I./Horsten, L./van Fraassen, B. C. (1997): „A Defence of van Fraassen's Critique of Abductive Inference: Reply to Psillos". In: The Philosophical Quarterly, 47: 305-321. Laudan, L. (1981): „A Confutation of Convergent Realism". In: Philosophy of Science, 48: 19-49. Leplin, J. (1984): „Introduction". In: Leplin, J. (Hg.) (1984): 1-7. Leplin, J. (Hg.) (1984): Scientific Realism. Berkeley u. a.: University of California Press. Lewis, D. K. (1973a): „Causation". In: The Journal of Philosophy, 70: 556-567. Lewis, D. K. (1973b): Counterfactuals. Oxford: Blackwell. Lewis, D. K. (1980): „A Subjectivisms Guide to Objective Chance". In: Jeffrey, R. C. (Hg.) (1980): 263-294. Lewis, D. K. (1986a): „Causal Explanation". In: Lewis, D. K. (1986f): 214-240. Lewis, D. K. (1986b): „Causation". In: Lewis, D. K. (1986f): 159172. - Erstmals als: Lewis, D. K. (1973a). Lewis, D. K. (1986c): „Counterfactuals and Comparative Possibility". In: Lewis, D. K. (1986f): 3-31. - Erstmals in: Journal of Philosophical Logic, 2 (1973): 418-446. Lewis, D. K. (1986d): „Events". In: Lewis, D. K. (1986f): 241-269. Lewis, D. K. (1986e): On the Plurality of Worlds. Oxford u. a.: Blackwell. Lewis, D. K. (1986f): Philosophical Papers. Bd. II. New York/Oxford: Oxford University Press. Lewis, D. K. (1986g): „Postscript E: Redundant Causation". In: Lewis, D. K. (1986f): 193-212. Lewis, D. K. (1986h): „Postscript F: Self-Causation". In: Lewis, D. K. (1986f): 212-213. Lewis, D. K. (1986i): „The Paradoxes of Time Travel". In: Lewis, D. K. (1986f): 67-80. - Erstmals in: American Philosophical Quarterly, 13 (1976): 145-152. Lewis, D. K. (1994): „Humean Supervenience Debugged". In: Mind, 103: 473-490. Lewis, D. K. (1999a): Papers in Metaphysics and Epistemology. Cambridge u. a.: Cambridge University Press. Lewis, D. K. (1999b): „Why Conditionalize?". In: Lewis (1999a): 403-407.

Literaturverzeichnis

345

Lewis, D. K. (2000): „Causation As Influence". In: The Journal of Philosophy, 97: 182-197. Lipton, P. (1991): Inference to the Best Explanation. London/New York: Routledge. Lipton, P. (1993): „Is the Best Good Enough?". In: Proceedings of the Aristotelian Society, 93: 89-104. Maher, P. (1992): „Diachronic Rationality". In: Philosophy of Science, 59: 120-141. Maher, P. (1993): Betting on Theories. Cambridge: Cambridge University Press. Martens, E./Schnädelbach, H. (Hgg.) (1985): Philosophie. Ein Grundkurs, Bd. 1. Reinbek bei Hamburg: Rowohlt. Maxwell, G. (1962): „The Ontological Status of Theoretical Entities". In: Feigl, H./Maxwell, G. (Hgg.) (1962): 3-27. McLaughlin, R. (Hg.) (1982): What? Where? When? Why? Essays on Induction, Space and Time, Explanation. Dordrecht: Reidel. Meggle, G. (Hg.) (1997): Analyomen 2, Bd. I: Logic, Epistemology, Philosophy of Science. Berlin u. a.: de Gruyter. Mellor, D. H. (1988): „On Raising the Chances of Effects". In: Fetzer, J. H. (Hg.) (1988): 229-239. Mill, J. S. (1843): A System of Logic. London: John W. Parker. Mixie, J. (1994): „The Teleological Argument". In: Thomist, 58: 635654. Moser, P. K. (1989): Knowledge and Evidence. Cambridge u. a.: Cambridge University Press. Mulligan, K. (Hg.) (1992): Language, Truth and Ontology. Dordrecht u. a.: Kluwer. Musgrave, Α. (1988): „The Ultimate Argument for Scientific Realism". In: Nola, R. (Hg.) (1988): 229-252. Newton-Smith, W. H. (1981): The Rationality of Science. London: Routledge & Kegan Paul. Nida-Rümelin, J. (Hg.)(2000): Rationalität, Realismus, Revision. Berlin/New York: de Gruyter. Niiniluoto, I. (1984): Is Science Progressive?. Dordrecht u. a.: Reidel. Nola, R. (Hg.) (1988): Relativism and Realism in Science. Dordrecht u. a.: Kluwer. Nozick, R. (1974): Anarchy, State, and Utopia. New York: Basic Books.

346

Literaturverzeichnis

Okasha, S. (2000): „Van Fraassen's Critique of Inference to the Best Explanation". In: Studies in History and Philosophy of Science, 31: 691-710. Pargetter, R. (1984): „The Scientific Inference to Other Minds". In: Australasian Journal of Philosophy, 62: 158-163. Paul, L. (2000): „Aspect Causation". In: The Journal of Philosophy, 97: 235-256. Peacocke, A. (2000): „Science and the Future of Theology: Critical Issues". In: Zygon, 35: 119-140. Pearce, G./Maynard, P. (Hgg.) (1973): Conceptual Change. Dordrecht u. a.: Reidel. Pearl, L. (1988): „Miracles: The Case for Theism". In: American Philosophical Quarterly, 25: 331-337. Peirce, C. S. (1931-58): Collected Papers of Charles Sanders Peirce, 8 Bde. Hg. v. C. Hartshorne, P. Weiss und A. W. Burks. Cambridge, Mass.: Harvard University Press. Pinsky, V./Wylie, A. (Hgg.) (1989): Critical Traditions in Contemporary Archaeology: Essays in the Philosophy, History, and SocioPolitics of Archaeology. Cambridge u.a.: Cambridge University Press. Popper, K. R. (1963): Conjectures and Refutations. The Growth of Scientific Knowledge. London: Routledge. Popper, K. R. (101994): Logik der Forschung. Tübingen: Mohr. Psillos, S. (1996): „On van Fraassen's Critique of Abductive Reasoning". In: The Philosophical Quarterly, 46: 31-47. Psillos, S. (1999): Scientific Realism: How Science Tracks Truth. London/New York: Routledge. Putnam, H. (1973): „Explanation and Reference". In: Pearce, G./Maynard, P. (Hgg.) (1973): 199-221. Putnam, H. (1975a): Mathematics, Matter and Method. Philosophical Papers, Bd. 1. Cambridge u. a.: Cambridge University Press. Putnam, H. (1975b): „What Is Mathematical Truth?". In: Putnam, H. (1975a): 60-78. Quine, W. V. O. (41982): Methods of Logic. Cambridge, Mass.: Harvard University Press. Railton, P. (1978): „A Deductive-Nomological Model of Probabilistic Explanation". In: Philosophy of Science, 45: 206-226.

Literaturverzeichnis

347

Railton, P. (1981): „Probability, Explanation, and Information". In: Synthese, 48: 233-256. Railton, P. (1989): „Explanation and Metaphysical Controversy". In: Kitcher, P./Salmon, W. C. (Hgg.) (1989): 220-252. Ramsey, F.P. (1926): „Truth and Probability". In: Ramsey, F.P. (1931): 156-198. - Wiederabgedruckt in: Kyburg, H. E./Smokler, H. E. (Hgg.) (1964): 61-92. Ramsey, F.P. (1931): The Foundations of Mathematics and Other Logical Essays. Hg. v. R. B. Braithwaite. London: Routledge & Kegan Paul. Rescher, N. (Hg.) (1969): Essays in Honor of Carl G. Hempel. Dordrecht: Reidel. Rescher, N. (Hg.) (1985): Reason and Rationality in Natural Science. Lanham, Md.: University Press of America. Rescher, N. (Hg.) (1987): Scientific Inquiry in Philosophical Perspective. Lanham, Md.: University Press of America. Resnik, D. B. (1989): „Adaptionist Explanations". In: Studies in History and Philosophy of Science, 20: 193-213. Rogers, B. (1981): „Probabilistic Causality, Explanation, and Detection". In: Synthese, 48: 201-223. Ruben, D.-H. (Hg.) (1993): Explanation. Oxford u. a.: Oxford University Press. Russell, B. (1948): Human Knowledge: Its Scope and Limits. London: Allen and Unwin. Salmon, W. C. (1965): „The Status of Prior Probabilities in Statistical Explanation". In: Philosophy of Science, 32: 137-146. Salmon, W. C. (1970): „Statistical Explanation". In: Colodny, R. G. (Hg.) (1970): 173-231. Salmon, W. C. (1971): Statistical Explanation and Statistical Relevance. Mit Beiträgen von J. G. Greeno und R. C. Jeffrey. Pittsburgh: University of Pittsburgh Press. Salmon, W. C. (1977): „An 'At-At' Theory of Causal Influence". In: Philosophy of Science, 44: 215-224. Salmon, W. C. (1978): „Why Ask, "Why?"?: An Inquiry Concerning Scientific Explanation". In: Proceedings and Addresses of the American Philosophical Association, 51: 683-705. - Seitenangaben nach dem Wiederabdruck in Salmon (1998b: 125-141).

348

Literaturverzeichnis

Salmon, W. C. (1981): „Causality: Production and Propagation". In: Asquith, P. D./Giere, R. N. (Hgg.) (1981): 49-69. - Seitenangaben nach dem Wiederabdruck in Salmon (1998b: 285-301). Salmon, W. C. (1982): „Comets, Pollen, and Dreams: Some Reflections on Scientific Explanation". In: McLaughlin, R. (Hg.) (1982): 155-178. Salmon, W. C. (1984): Scientific Explanation and the Causal Structure of the World. Princeton: Princeton University Press. Salmon, W. C. (1985): „Scientific Explanation: Three Basic Conceptions". In: Asquith, P. D./Kitcher, P. (Hgg.) (1985): 293-305. - Seitenangaben nach dem Wiederabdruck in Salmon (1998b: 320-329). Salmon, W. C. (1989): „Four Decades of Scientific Explanation". In: Kitcher, P./Salmon, W. C. (Hgg.) (1989): 3-219. Salmon, W. C. (1990a): „Causal Propensities: Statistical Causality versus Aleatory Causality". In: Topoi, 9:95-100. Salmon, W. C. (1990b): „Scientific Explanation: Causation and Unification". In: Crítica, 22 (66): 3-23. - Seitenangaben nach dem Wiederabdruck in Salmon (1998b: 68-78). Salmon, W. C. (1994): „Causality Without Counterfactuals". In: Philosophy of Science, 61: 297-312. Salmon, W. C. (1997): „Causality and Explanation: A Reply to Two Critics". In: Philosophy of Science, 64: 461-477. Salmon, W. C. (1998a): „A New Look at Causality". In: Salmon, W. C. (1998b): 13-24. Salmon, W. C. (1998b): Causality and Explanation. New York u. a.: Oxford University Press. Salmon, W. C. (1998c): „Introduction". In: Salmon, W. C. (1998b): 3-10. Salmon, W. C. (1998d): „The Importance of Scientific Understanding". In: Salmon, W. C. (1998b): 79-91. . Schaffer, J. (2000): „Trumping Preemption". In: The Journal of Philosophy, 97: 165-181. Schurz, G. (1988): „Was ist wissenschafüiches Verstehen? Eine Theorie verstehensbewirkender Erklärungsepisoden". In: Schurz, G. (Hg.) (1988): 235-298. Schurz, G. (1997): „Unification and Understanding". In: Meggle, G. (Hg.) (1997): 481-494.

Literaturverzeichnis

349

Schurz, G. (1998): „Neue Entwicklungen in der strukturalistischen Wissenschaftstheorie". In: Conceptus, 31 (79): 263-275. Schurz, G. (1999): „Explanation as Unification". In: Synthese, 120: 95-114. Schurz, G. (Hg.) (1988): Erklären und Verstehen in der Wissenschaft. München: Oldenbourg. Schurz, G./Lambert, K. (1994): „Outline of a Theory of Scientific Understanding". In: Synthese, 101: 65-120. Scriven, M. (1956): Explanations. Dissertation, Universität Oxford. Scriven, M. (1959a): „Truisms as the Grounds for Historical Explanations". In: Gardiner, P. (Hg.) (1959): 443-475. Scriven, M. (1959b): „Definitions, Explanations, and Theories". In: Feigl, H./Scriven, M/Maxwell, G. (Hgg.) (1959): 99-195. Scriven, M. (1962): „Explanations, Predictions, and Laws". In: Feigl, H ./Maxwell, G. (Hgg.) (1962): 170-230. Scriven, M. (1963a): „The Temporal Asymmetry of Explanations and Predictions". In: Baumrin, B. (Hg.) (1963a): 97-105. Scriven, M. (1963b): „The Limits of Physical Explanation". In: Baumrin, B. (Hg.) (1963b): 107-135. Skyrms, B. (1984): Pragmatics and Empiricism. New Haven u. a.: Yale University Press. Skyrms, B. (1987a): „Dynamic Coherence and Probability Kinematics". In: Philosophy of Science, 54: 1-20. Skyrms, B. (1987b): „Coherence". In: Rescher, N. (Hg.) (1987): 225241. Skyrms, B. (1993): „A Mistake in Dynamic Coherence Arguments?". In: Philosophy of Science, 60: 320-328. Smart, J . J . C . (1963): Philosophy and Scientific Realism. London: Routledge & Kegan Paul. Sober, E. (1987): „Explanation and Causation". In: British Journal for the Philosophy of Science, 38: 243-257. Sober, E. (Hg.) (1994): Conceptual Issues in Evolutionary Epistemology. Cambridge, Mass.: MIT Press. Stalker, D. (Hg.) (1994): Grue. Chicago: Open Court. Stegmüller, W. (21983): Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Bd. I: Erklärung - Begründung - Kausalität. Berlin u. a.: Springer.

350

Literaturverzeichnis

Steiner, M. (1978): „Mathematical Explanation". In: Philosophical Studies, 34: 135-151. Swoyer, C. (1983): „Realism and Explanation". In: Philosophical Inquiry, 5: 14-28. Swoyer, C. (1996): „Theories of Properties: From Plenitude to Paucity". In: Philosophical Perspectives, 10: 243-264. Swoyer, C. (1999): „How Ontology Might Be Possible: Explanation and Inference in Metaphysics". In: Midwest Studies in Philosophy, 23: 100-131. Teller, P. (1973): „Conditionalization and Observation". In: Synthese, 26: 218-258. Teller, P. (1976): „Conditionalization, Observation, and Change of Preference". In: Harper, W./Hooker, C. (Hgg.) (1976): 205-233. Thagard, P. R. (1978): „The Best Explanation: Criteria for Theory Choice. In: The Journal of Philosophy, 75:76-92. Tipler, P. A. (1994): Physik. Heidelberg u. a.: Spektrum Akademischer Verlag. van Fraassen, Β. C. (1977): „The Pragmatics of Explanation". In: American Philosophical Quarterly, 14: 143-150. van Fraassen, B. C. (1980): The Scientific Image. Oxford: Clarendon Press. van Fraassen, B. C. (1984): „Belief and the Will". In: The Journal of Philosophy, 81: 235-256. van Fraassen, B. C. (1985): „Empiricism in the Philosophy of Science". In: Churchland, P. M./Hooker, C. A. (Hgg.) (1985): 245308. van Fraassen, B. C. (1989): Laws and Symmetry. Oxford: Clarendon Press. van Fraassen, B. C. (1994): „Gideon Rosen on Constructive Empiricism". In: Philosophical Studies, 74: 179-192. van Fraassen, B. C. (1999): „Conditionalization, a New Argument for". In: Topoi, 18: 93-96. Vogel, J. (1990): „Cartesian Skepticism and Inference to the Best Explanation". In: The Journal of Philosophy, 87:658-666. Weber, E. (1995): „Some Problems for Kitcher's Unification Account of Explanation". In: Communication and Cognition, 28: 441-455. Weston, T. (1992): „Approximate Truth and Scientific Realism". In: Philosophy of Science, 59: 53-74.

Literaturverzeichnis

351

Woodward, J. (1989): „The Causal Mechanical Model of Explanation". In: Kitcher, P./Salmon, W. C. (Hgg.) (1989): 357-383. Wright, L. (1976): Teleological Explanation. Berkeley/Los Angeles: University of California Press.

Personenregister Armendt, Β., 253 Armstrong, D. M., 3 f., 8, 160, 216

Dowe, P., 173,181-184, 188191 Dray, W., 28

Barnes, E., 121 Bartelborth, T., 2,67,110, 113,116, 119,121,161, 307 Ben-Menahem, Y., 283 ff., 288 f., 313 Bonjour, L., 3,7 Boyd, R., 223,234, 302, 322326 Bradie, M„ 223 Brink, C„ 226 Bromberger, S., 49 f., 193

Earman, J„ 251, 254, 256

Carrier, M., 188,190 ff., 202 Christensen, D., 253, 280 Clark, K. J., 5 Clayton, P., 5 Coffa, J. Α., 52 ff. Currie, G., 3 Darwin, C„ 2, 8,105 Day, T., 282,289 de Finetti, B„ 251,278 Douven, I., 232,236,241 f., 276-283,285,295 f.

Fetzer, J. H., 54 Fine, Α., 299, 315 f., 322, 325 f. Fodor, J., 2 f. Friedman, M„ 15, 6 6 - 9 6 , 9 8 106,112 f., 121-125, 197, 321 Glymour, C., 2 Goldstein, M., 250 Goodman, N., 44 f. Greeno, J. G„ 193 Hacking, I., 16, 302 Hall, N„ 150 Hanen, M„ 2 Hanna, I., 193 Harman, G., 6 f., 289 Hempel, C. G., 25-29, 31-34, 36-40,42-46, 48, 53 ff., 57,62,65 f., 68, 82, 90,98, 117,126,130,206 Hintikka, J., 12

354

Personenregister

Hitchcock, C , 173, 189 f., 196, 203-206 Holcomb, H. R., 2 Horsten, L„ 232,236,241 f. Howson, C., 248,253,256, 258, 280,296

Maxwell, G., 197, 303 Mellor, D. H., 183 Mill, J. S., 29,126 Mixie, J., 5 Moser, P. K„ 5 f. Musgrave, Α., 302

Jeffrey, R. C., 47 f., 249, 251, 253, 258 Johnson, J. L„ 5 Jones, T., 121

Newton-Smith, W. H., 302 Niiniluoto, I., 226 Nozick, R., 307

Kahnemann, D., 249 Kapitan, T., 12 Kelley, J., 2 Kim, J„ 146 Kincaid, H., 282, 289 Kirkham, R. L., 21 Kitcher, P., 15,48,66 f., 84, 87, 89 f., 92,98,101-129, 173, 181, 183 f., 187 f., 201,203, 321 Kolmogorov, Α. N., 296 Künne, W„ 21 Kyburg, H. E., 50 Ladyman, J., 232,236,241 f. Laudan, L„ 223-226, 243, 311 Leplin, J„ 19,300 Lewis, D. K„ 1 6 , 4 5 , 1 3 1 167,169,174, 184, 187, 191,196, 202 ff., 206, 209, 211,250,253, 280 Lipton, P., 217-220, 222, 234, 282, 301, 307, 317-320 Mäher, P., 280

Okasha, S., 286-290,293 f. Oppenheim, P., 25,29 Pargetter, R., 5, 8 Paul, L„ 150,191, 253 Peacocke, Α., 5 Pearl, L., 4 Peirce, C. S., 12,112 Popper, K. R., 29, 226 Psillos, S., 227, 231-237, 240 f., 302 f., 322-327 Putnam, Η., 299, 302,313 Quine, W. V. O., 142 Railton, P., 54, 128,201 Ramsey, F. P., 251,280 Resnik, D. B„ 2 Rogers, B„ 172 f. Ruben, D.-H., 131 Russell, Β., 175 Salmon, W. C., 16,25,38,41, 45, 47 f., 50 f., 76, 84 ff., 90,120,129, 131,169-175, 177-211 Schaffer, J„ 149

Personenregister

Schurz, G., 67 Scriven, M., 45 ff. Skyrms, B„ 253,280 Slovic, P., 249 Smart, J. J. C., 303 Sober, E., 173, 181 Stalker, D., 44 Stegmüller, W„ 25 Steiner, M„ 160 Swoyer, C., 4 Teller, P., 253 Thagard, P. R., 2 Tipler, Ρ. Α., 100 Tversky, Α., 249

355

Urbach, P., 248, 254,256, 258, 280,296 van Fraassen, B. C„ 16,18, 79,120,141 f., 193,203, 217,227-237,239-243, 245,250 f., 253, 258 f., 261,267-272, 275 ff., 279289,291-296, 302, 306 ff., 331 Vogel, J., 6 Weber, E„ 121 Weston, T., 226 Woodward, J., 203 Wright, L., 199