Die Logik des Experiments in den Sozialwissenschaften [1 ed.] 9783428414062, 9783428014064

125 98 31MB

German Pages 254 Year 1965

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Die Logik des Experiments in den Sozialwissenschaften [1 ed.]
 9783428414062, 9783428014064

Citation preview

Soziologische Schriften Band 2

Die Logik des Experiments in den Sozialwissenschaften Von

Wigand Siebel

Duncker & Humblot · Berlin

WIGAND

SIEBEL

Die Logik des Experiments in den Sozialwissenschaften

Soziologische

Schriften

Band 2

Die Logik des Experiments i n den Sozialwissenschaften

Von

Wigand Siebel

DUNCKER

& HUMBLOT

/

BERLIN

Als Habilitationsschrift auf Empfehlung der Rechts- und Staatswissenschaftlichen Fakultät der Westfälischen Wilhelms-Universität i n Münster gedruckt m i t Unterstützung der Deutschen Forschungsgemeinschaft.

Alle Rechte vorbehalten © 1965 Duncker & Humblot, Berlin Gedruckt 1965 bei Berliner Buchdruckerei Union GmbH., Berlin 61 Printed in Germany

Vorwort Die Frage nach der Forschungslogik, also die Frage nach den Voraussetzungen und der Form der Gewinnung neuen Wissens i m Zuge des wissenschaftlichen Forschens — durch die Erfahrung auf dem Wege über die Bildung von Hypothesen, deren Verifizierung oder Falsifizierung bis zur begründeten wissenschaftlichen Theorie — ist mehr oder weniger dringend für alle empirischen Wissenschaften gestellt. Die vorliegende Arbeit sucht aus dem Gesichtspunkt der Sozialwissenschaften, speziell der Soziologie, von einem als methodischen Drehpunkt betrachteten Vorgehen aus, nämlich dem Experiment, die zu Grunde liegenden methodischen Probleme aufzudecken und neu zu durchdenken. E i n solcher einzelwissenschaftlicher Ansatz führt damit unmittelbar i n die philosophische Problematik hinein, speziell unter den Hauptaspekten der Wissenschaftstheorie. Die kritische Prüfung, inwieweit die bisherigen Ergebnisse der Wissenschaftstheorie für die Ansätze der Einzelwissenschaften tragfähig sind, bedeutet i n diesem Zusammenhang auch eine kritische Durchsicht der einzelwissenschaftlichen Methodik. Die Arbeit liegt insofern i n einem Grenzgebiet zweier Wissenschaften und hat alle Nachteile und Vorteile einer solchen Lage zu tragen. Bei der Darstellung wurde darauf Bedacht genommen, alle angesprochenen Probleme, Vorgehensweisen und Techniken so weit zu behandeln, daß sie i n ihrer Eigenbedeutung und i n ihrem Verhältnis zur Methodologie jeweils genügend deutlich werden. Diesem, die sozialwissenschaftliche Methodik und die Grundfragen der Wissenschaftstheorie für den Interessierten aufschließenden Zweck dient auch das umfangreiche Register. Die Untersuchung stellt die ergänzte und erweiterte Fassung einer Arbeit dar, die von der Rechts- und Staatswissenschaftlichen Fakultät der Westfälischen Wilhelms-Universität i n Münster als Habilitationsschrift angenommen wurde. Der Abschnitt über „Experiment und Modell" kam als ganzer neu hinzu. Den Herren Professoren Dr. Dieter Ciaessens, Dr. Helmut Schelsky, Dr. E r i k Böttcher und Dr. Hans K a r l Schneider danke ich für die Aufmerksamkeit, die sie der Arbeit w i d meten, sowie für kritische Anmerkungen. Darüber hinaus gilt mein Dank Herrn Professor Dr. Johannes Chr. Papalekas für seine persönliche Anteilnahme am Entstehen der Schrift und seine grundsätzliche Unterstützungsbereitschaft. Wigand Siebel

Inhalt Einleitung I . Gegenwärtige Theorie

9 12

1. Begriff

12

2. A r t e n des Experiments

17

3. Formen der K o n t r o l l e a) Feststellung der bedeutsamen Faktoren b) Gleichsetzung der Faktoren c) M a x i m a l e Zufallsstreuung

22 22 25 27

4. Bekannte Problematik

28

I L Kritik

32

1. Kausalzusammenhang a) Kausalstudie u n d Analyse b) Kausalstudie u n d Vergleich

32 32 42

2. Experimentiersituation a) Faktoren u n d Variable b) Ex-post-facto-Experiment

49 49 57

3. K o n t r o l l e a) Kontrollphasen b) Kontrollgruppe

66 66 73

4. Ergebnisermittlung a) Zeitfaktor b) Techniken

82 82 85

I I I . Wissenschaftstheoretische Grundlegung 1. Kausalität, Gesetz u n d Eigenschaft

92 92

2. Hypothese u n d Begriff

109

3. Prüfung von Hypothesen

123

4. Methodologische Grundkategorien a) Klassenbildung b) Klassifizierung c) E r k l ä r u n g d) Prognose

150 150 154 158 165

5. Allgemeine F u n k t i o n des Experiments

169

Inhalt

8

I V . Stellung in der sozialwissenschaftlichen Forsdrang 1. Der sozialwissenschaftliche Gegenstand

179 179

2. I n h a l t u n d A n w e n d u n g

188

3. Experiment u n d Modell

195

4. Experiment u n d Theorie

215

Literaturverzeidinis

227

Namen- und Sachregister

240

Einleitung Der vorliegende Versuch, die „Logik des Experiments" zu analysieren und den Platz genauer zu bestimmen, der dieser Vorgehensweise innerhalb der sozialwissenschaftlichen Methode zusteht, mag als ein abgelegenes Unterfangen erscheinen. Gibt es doch i n Deutschland kaum eine sozialwissenschaftliche Untersuchung, die die hauptsächlich i n den Vereinigten Staaten entwickelten Techniken des Experiments benützt hat. Diese Feststellung ist natürlich davon abhängig, was man unter dem Begriff des „Experiments" versteht. Aber auch bei einer weiten Auslegung des Begriffsinhalts gibt es nur wenige Studien — überwiegend sogenannte „Gruppen-Experimente" —, die als Experimente gezählt werden könnten. Obwohl beispielsweise für Ex-post-facto-Experimente genügend Material i n Forschungsinstituten und Verwaltungen zur Verfügung steht, wurde bisher kein solches Experiment i n Deutschland durchgeführt. Auch projektive Experimente haben bisher kaum ein bemerkenswertes Interesse bei der deutschen Sozialforschung gefunden. Man mag das bedauern oder begrüßen. Fest steht jedenfalls, daß die Naturwissenschaften und besonders auch die Psychologie die experimentelle Vorgehensweise zu einer hohen Vollendung geführt und überall zu einem unentbehrlichen Instrument der Forschung gemacht haben. U m so mehr kann aber die Frage gestellt werden, warum das sozialwissenschaftliche Experiment zum Gegenstand einer methodisch-kritischen Studie gemacht werden soll, scheint es doch viel näher zu liegen, zunächst einmal zu untersuchen, warum das Experiment eine vergleichsweise viel geringere Fruchtbarkeit i n den Sozialwissenschaften — das gilt auch für die Vereinigten Staaten — entwickelt hat. Eine solche Untersuchung setzt aber die methodisch-kritische Beurteilung der Logik des Experiments voraus. Ein weiterer Grund für diese Studie liegt i n der zentralen Bedeutung, die das Experiment i n der Wissenschaftstheorie besitzt. Seine Beurteilung ist i n vielen Hinsichten maßgebend für die Beurteilung der übrigen wissenschaftlichen Vorgehensweisen. Obwohl die starke Ausweitung der empirischen Sozialforschung nach dem Kriege merkwürdigerweise vor dem Experiment haltgemacht hat, spielt es für die methodische Grundeinstellung doch eine erhebliche Rolle. Die wissenschaftstheoretische Haltung vieler Forscher beruht auf einer Einschätzung des Experiments, die seine Stellung i n der Logik des Forschungsprozesses außerordentlich hoch bewertet.

10

Einleitung

So gelangt F. Stuart Chapin zu folgender Beurteilung: „Die experimentelle Methode hat i n weitem Ausmaß zu den eindrucksvollen Errungenschaften der modernen Wissenschaft beigetragen. Diese Methodik erlaubt uns, die Relationen von Ursache und W i r k u n g schneller und eindeutiger zu analysieren als durch andere Methoden. Sie läßt eine Verifizierung durch viele Beobachter zu. Sie hat unbegründete Vorurteile durch ein eindeutiges Beweisverfahren ersetzt, das genügend Sicherheit besitzt, u m Prognosen zu rechtfertigen" 1 . Dementsprechend bedeutet die Übernahme der experimentellen Vorgehensweise i n die Sozialwissenschaften einen zentralen Wendepunkt. „ M i t der Einführung des Experiments beginnt moderne Sozialforschung. Die historischen Vorläufer werden von den Systematikern abgelöst" 2 . Denn, wie Paul F. Lazarsfeld sagt, „die Idee des kontrollierten Experiments besitzt eine Bedeutung, die weit über die empirischen Ergebnisse hinausgeht, die es erreichen mag. Es ist w i r k l i c h der zentrale Ansatzpunkt für jedes systematische Denken über Probleme der sozialen Verursachung" 8 . Von hier aus ist es nicht mehr weit, das Experiment sogar als „logische N o r m für die empirische Forschung" 4 zu bezeichnen. Die Untersuchung der Logik des Experiments ist nicht zu trennen von der noch nicht endgültig entschiedenen methodologischen Frage nach der Differenz zwischen naturwissenschaftlicher und sozialwissenschaftlicher Vorgehensweise. Die positivistische Forderung nach einer einheitlichen Methode aller Wissenschaften oder nach der Begründung der Einheit der Wissenschaften aus der gleichen Methode enthält i n zentraler Weise das Problem der Stellung des Experiments i m Forschungsprozeß. Aber auch die strenge Unterscheidung zwischen geistes- und sozialwissenschaftlicher Methodik einerseits und naturwissenschaftlicher Methodik andererseits betrifft kaum weniger die Forschungslogik des Experiments, auch wenn man es nur als Kennzeichen der Naturwissenschaften gelten lassen w i l l 5 . Daraus folgt, daß die Logik des Experiments i n den Naturwissenschaften i n dieser Untersuchung nicht umgangen werden kann. — Bezüglich des psychologischen Experiments bedarf das gleiche w o h l keiner besonderen Erwähnung. — Die Kenntnis der Logik des Experiments i n den Naturwissenschaften ist i n gewisser Weise sogar 1 Francis Stuart Chapin: Experimental designs i n sociological research, New Y o r k u n d London 1947, S. 1; K u r z t i t e l : [Experimental designs]. 2 Gerhard Schmidtchen: Sozialforschung, in: Staatslexikon — Recht, W i r t schaft, Gesellschaft, Bd. 7, Freiburg 1962, Sp. 284. 3 Paul Felix Lazarsfeld : Foreword, in: E. Greenwood: Experimental sociology — A study i n method, New Y o r k 1945, S. V I I I . 4 Robert Pages: Das Experiment i n der Soziologie, in: Handbuch der empirischen Sozialforschung, Hrsg. R . K ö n i g , Bd. I, Stuttgart 1962, S. 445; [Experiment i n der Soziologie]. 5 So z. B. Heinz Haller: Typus u n d Gesetz i n der Nationalökonomie — V e r such zur K l ä r u n g einiger Methodenfragen der Wirtschaftswissenschaften, Stuttgart u n d K ö l n 1950, S. 49.

Einleitung

Voraussetzung für die Einsicht i n die Formen des sozialwissenschaftlichen Experimentierens. Wenn die Logik des Experiments i n den Sozialwissenschaften die gleiche ist wie die Logik des Experiments i n den Naturwissenschaften, so bliebe immer noch zu fragen, w o r i n die Logik des Experiments i n den Naturwissenschaften besteht. Es ist aber keineswegs sicher, daß es diese Übereinstimmung w i r k l i c h gibt. Von hier aus kann das Verhältnis von Empirie und Theorie, oder, anders gesagt, der Weg der sozialwissenschaftlichenen Erkenntnisgewinnung unter neuen Aspekten beleuchtet werden. Zwar ist weitgehend anerkannt, daß — wenn man beide überhaupt trennen w i l l — zwischen Empirie und Theorie ein Wechselspiel i m Gange der Forschung besteht. Trotz des vielfältig verbreiteten methodischen Interesses kann dieser Zusammenhang aber bisher keineswegs als geklärt angesehen werden. Danach läßt sich die Zielsetzung dieser Untersuchung formulieren. Sie besteht darin, 1. die allgemeine Logik des Experiments festzulegen, 2. die Stellung des Experiments i n der Methodik der Sozialwissenschaften zu umreißen und 3. das Verhältnis zwischen Theorie und Empirie i n den Sozialwissenschaften einer Klärung näher zu führen.

I . Gegenwärtige Theorie 1. Begriff Die begriffliche Erfassung der experimentellen Vorgehensweise hat i m Rahmen der von Greenwood entwickelten methodischen Theorie die bisher eindeutigste und gesichertste Formel gefunden. M i t seiner A r b e i t 1 fand die bisherige Experimenttheorie innerhalb der Sozialwissenschaften einen gewissen Abschluß. Kritische Auseinandersetzungen m i t den von Greenwood vertretenen Auffassungen erstrecken sich fast nur auf Teilprobleme. Chapin, einer der Pioniere der experimentellen Vorgehensweise, besonders ihrer praktischen Erprobung, hat sich ausdrücklich auf Greenwood bezogen und seine Theorie anerkannt 2 . Ein neueres Beispiel für die grundsätzliche Übereinstimmung m i t der von Greenwood entwickelten Theorie ist die Darstellung der sozialwissenschaftlichen Methodik durch Duverger 3. I n Abgrenzung gegen die kontrollierte Beobachtung, aber auch gegen das Experiment nach Versuch und I r r t u m (trial and error) ist nach Greenwood die experimentelle Vorgehensweise folgendermaßen zu definieren: „ E i n Experiment ist die Prüfung (proof) einer Hypothese, die zwei Faktoren i n eine ursächliche Beziehung zueinander zu bringen sucht, durch eine Untersuchimg i n unterschiedlichen Situationen. Dabei werden diese Situationen i n bezug auf alle Faktoren kontrolliert m i t Ausnahme des einen, der Gegenstand des Interesses ist, da er entweder die hypothetische Ursache oder die hypothetische W i r k u n g darstellt" 4 . A n anderer Stelle präzisiert Greenwood diese Definition, indem er das Experiment als „Prüfung einer Kausalhypothese durch die Untersuchung zweier kontrollierter, gegensätzlicher Situationen" 5 bezeichnet. Die zentralen Elemente der Definition sind: „1. eine Kausalhypothese; 1

Ernest Greenwood : Experimental sociology — A study i n method, New Y o r k 1945, 5. unveränderter Neudruck 1949; [Experimental sociology]. 2 Chapin : [Experimental designs], S. I X . 3 Maurice Duverger: Méthodes des sciences sociales, Paris 1961, S. 356 ff.; [Méthodes]. — Eine der besten Zusammenfassungen der experimentellen Vorgehens weise i m Anschluß an Chapin findet sich bei Paul H a n l y Furfey: The scope and method of sociology — A metasociological treatise, New Y o r k 1953, S. 402—423. 4 [Experimental sociology], S. 28. 5 Ebd., S. 72.

1. Begriff

13

2. diese w i r d durch eine Reihe unterschiedlicher Situationen geprüft; 3. die unterschiedlichen Situationen werden kontrolliert" 6 . Grundvoraussetzung des Experiments ist also eine Kausalhypothese, eine Vermutung über einen Kausalzusammenhang nach dem Schema: „Wenn A, dann B". Erst durch eine solche Hypothese bekommt das Experiment seine klare Ausrichtung. Das Experiment „beweist" oder wenigstens „ p r ü f t " dann die Stichhaltigkeit eines vermuteten Kausalzusammenhanges. Die Prüfung einer Kausalhypothese verläuft i n der Form, daß eine bestimmte soziale Situation abgegrenzt und aus dem sozialen Geschehen physisch oder gedanklich herausgehoben oder überhaupt erst konstitutiert wird. A u f diese läßt man den zu prüfenden Kausalfaktor einwirken („Experimentiergruppe"), u m das auf i h n zurückzuführende Resultat zu gewinnen, oder man versucht von einer bereits eingetretenen W i r k u n g aus die Ursachen zu erschließen. Es w i r k t jedoch niemals ein einzelner Faktor allein auf eine soziale Situation ein, sondern jeder Faktor steht i n seiner E i n w i r k i m g immer neben einer Vielzahl anderer Faktoren. E i n Hauptproblem liegt deshalb für den Experimentator darin, die nicht zu untersuchenden Faktoren i n ihrer E i n w i r k u n g zu neutralisieren. Da sie nicht alle auszuschalten sind, behilft man sich damit, sie zu „kontrollieren". Die „Kontrolle" besteht zunächst darin, die auf das mögliche Ergebnis einwirkenden Faktoren überhaupt zu bestimmen. Die Identifizierung der i n gleicher (oder umgekehrter) Richtung wirkenden Faktoren von bemerkenswertem Einfluß („relevante Faktoren") ist eine vor Beginn des Experiments zu leistende Aufgabe. Sie ist i n erheblichem Maße vom Scharfsinn des Experimentators abhängig und n i m m t auf die bisherige Erfahrung Bezug. Beobachtungen gehen insofern i n jedem Fall dem Experiment voraus. Nach der Bestimmung der relevanten Faktoren ist eine Entscheidung darüber zu treffen, welche davon kontrolliert werden sollen und i n welcher Form. Erst i m Anschluß daran ist es möglich, eine andere soziale Situation zu schaffen oder auszuwählen, die i n den einwirkenden Faktoren der ersten möglichst weitgehend entspricht. Diese zweite soziale Situation („Kontrollgruppe") w i r d dann m i t der ersten sozialen Situation i n Beziehung gesetzt. Das geschieht dadurch, daß man die eine Situation dem Einfluß des zu untersuchenden Faktors aussetzt, während die andere ohne diese E i n w i r k u n g verbleibt. Die zu Grunde liegende Idee ist, daß sich aus der Differenz der beiden Situationen nach beendeter E i n w i r k u n g des zu untersuchenden Faktors dessen W i r k u n g 6 Ebd., S. 29. So sinngemäß auch i n René König (Hrsg.) : Beobachtimg u n d Experiment i n der Sozialforschung, K ö l n 1956, S. 320 (Glossar). Ä h n l i c h auch Marie Jahoda, M o r t o n Deutsch u n d Stuart W.Cook: Research methods i n social relations — W i t h especial reference to prejudice, Part. 1, Basic processes, New Y o r k 1951, S. 63; [Research methods].

14

I . Gegenwärtige Theorie

ablesen läßt. Der Idealfall der Experimentalanordnung wäre eine Identität der „Experimentiergruppe" und der „Kontrollgruppe" vor Beginn der E i n w i r k u n g des zu prüfenden Faktors 7 . I n diesem Fall läge i n der Differenz der beiden Situationen die Wirkung des zu untersuchenden Faktors. Es ließe sich dann nicht nur feststellen, ob der untersuchte Faktor überhaupt eine W i r k i m g i n der fraglichen Situation zeitigt, sondern auch das Maß der Einwirkung. Tatsächlich kann ein solcher Vergleichszustand jedoch nie erreicht werden, identische Situationen gibt es — zumal i m Objektbereich der Sozialwissenschaften — nicht. Das Problem der Durchführung von Experimenten besteht daher immer darin, dem Idealzustand der Identität der zu vergleichenden sozialen Situationen möglichst nahe zu kommen. Die Schwierigkeit der Bewältigung dieser Aufgabe zwingt dazu, eine eindeutige und enge Kausalhypothese aufzustellen. Ohne solche Hypothese ist i n dieser Form des Experiments eine Kontrolle der relevanten Faktoren, d. h. derjenigen Faktoren, die das mögliche Ergebnis beeinflussen könnten, ausgeschlossen. Mehrere Wirkungen eines Faktors einzukalkulieren, heißt für ein sozialwissenschaftliches Experiment i m allgemeinen Verlust der Kontrolle. Die Grundform des Experiments verlangt also die folgenden methodischen Schritte: 1. Aufstellung einer Kausalhypothese, d. h. es w i r d eine bestimmte W i r k u n g für einen zu prüfenden Faktor postuliert, 2. Herstellung bzw. Auswahl zweier möglichst gleichartiger sozialer Situationen (Experimentier- und Kontrollgruppe), 3. Erfassung der Wirkung aus der Differenz der beiden Situationen nach beendeter Einwirkung des Faktors. Zwischen den Vertretern dieser Experimentiertheorie, für die hier maßgeblich Greenwood herangezogen wurde, und den ausschließlich oder überwiegend statistisch orientierten Gelehrten, die sich m i t dem gleichen Gegenstand zu befassen vorgeben, besteht eine merkwürdige Diskrepanz. Diese nehmen kaum Notiz von den Ergebnissen der genannten Experimenttheorie, das gilt selbst dann, wenn sie ausdrücklich den sozialwissenschaftlichen Gegenstand einbeziehen 8 . Nach ihrer A u f fassung sind statistisches und experimentelles Vorgehen i m wesentlichen identisch, zwei verschiedene Aspekte der gleichen Sache. Oder das experimentelle Verfahren w i r d einfach als eine Anwendung der Statistik verstanden. Maßgebend für diese Auffassung war die statistische Theorie R. A. Fishers. Danach sind „statistische und experimentelle Vorgehensweise nur zwei verschiedene Aspekte des gleichen Ganzen, und dieses Ganze umfaßt alle logischen Erfordernisse zu dem voll7

Greenwood: [Experimental sociology], S. 27. s So etwa bei Robert Pages: [Experiment i n der Soziologie].

1. Begriff

15

ständigen Prozeß, das Wissen über die Natur experimentell zu vermehren" 9 . Wäre das w i r k l i c h der Fall, so wäre eine Theorie des Experiments nur als eine statistische Theorie zu entwickeln. Eine Theorie der Häufigkeitsverteilungen und ihre Verbindung m i t der Wahrscheinlichkeitstheorie enthält jedoch keineswegs eine spezifische eigene Logik als Vorgehensweise. Sie ist vielmehr unter sehr vielen Bedingungen und Forschungsweisen anwendbar, die ihre eigene Logik besitzen. Wie besonders die neuere Wissenschaftstheorie deutlich gemacht hat, besteht ein grundlegender Unterschied zwischen der an der Auszählung von Häufigkeiten orientierten Wahrscheinlichkeitstheorie und der Forschungslogik als solcher, innerhalb derer die Wahrscheinlichkeitstheorie n u r einen Platz beanspruchen kann. So kann die Statistik auch sinnvollerweise m i t dem Experiment verbunden werden. Die Logik des Experiments ist jedoch unabhängig von statistischen Überlegungen. Das zeigt sich bereits daran, daß ein Experiment ohne Beachtung irgendeiner Häufigkeitsverteilung durchführbar ist. Fisher selbst scheint sich nicht so sicher zu sein, ob die von i h m vorgenommene Gleichsetzung berechtigt ist, denn er hofft, daß „ m i t der Verbesserung des experimentellen Verfahrens die Prinzipien klar werden dürften, durch die dieses Planen und Vorgehen ihren Zweck erhalten" 1 0 . Dugué und Girault haben versucht, den Unterschied beider Ansichten auf eine Formel zu bringen, indem sie zwischen dem „deterministischen oder klassischen Experiment" und dem „wahrscheinlichkeitstheoretischen Experiment " unterscheiden 11 . Das Ergebnis des klassischen E x periments ist danach unter den gegebenen Bedingungen völlig determiniert. Die i n die Situation hineinwirkenden Faktoren sind nicht nur völlig bekannt, sondern können auch beliebig vom Experimentator ausgesucht werden. Beispiel eines klassischen Experiments wäre etwa eine Untersuchung des elektrischen Widerstandes eines Metalldrahtes. Dabei können die als relevant angesehenen Faktoren (z. B. die A r t des Metalls, 9

Ronald A. Fisher: The design of experiments, 7. Auflage Edinburg und London 1960, S. 3, zuerst 1935 und ders.: Statistical methods for research workers, London und Edinburg 1925, 13. Auflage 1958. — Z u dieser Richtung können u. a. gezählt werden: Cyril H. Goulden: Methods of Statistical analysis, New York und London 1939, 2. Aufl. 1952; Frank Yates: Sampling methods for censuses and surveys, London 1949; Owen L.Davies (Hrsg.): The design and analysis of industrial experiments, London und Edinburg 1954; W i l l i a m G. Cochran, Gertrude M. Cox: Experimental designs, New York und London 1950, 2. Auflage 1957; Oscar Kempthorne: The design and analysis of experiments, New Y o r k und London 1952; Erich Mittenecker: Planung und statistische Auswertung von Experimenten — eine Einführung für Psychologen, Biologen und Mediziner, 3. Auflage, Wien 1960; D. R. Cox: Planning of experiments, New Y o r k und London 1958.

10 Fisher , ebd., S. 8.

11

Daniel Dugué, Maurice Girault: rience, Paris 1959, S. 1 ff.

Analyse de variance et plans d'expé-

16

I. Gegenwärtige Theorie

Oberfläche des Schnitts, Länge, Temperatur) beliebig variiert werden. Veranstaltet man nicht nur ein Experiment, sondern eine Experimentierreihe, bei der jeweils ein Faktor verschiedene Werte erhält, so lassen sich deterministische funktionelle Beziehungen zwischen den einzelnen Faktoren bzw. Faktorengruppen herstellen. Etwas ganz anderes ist es, den Getreideertrag i n einem bestimmten Landstrich festzustellen. Die Faktoren (z. B. A r t des Getreides, Dünger, Bodenbeschaffenheit, Wetter) sind nicht mehr alle beliebig variierbar. Daher ist die Einführung eines Wahrscheinlichkeitsmodells notwendig. Zwar können verschiedene Getreidesorten angepflanzt und jede Sorte m i t mehreren Düngerarten behandelt werden. Das Wetter ist jedoch unvorhersehbar, so daß die Ergebnisse selbst der gleichen Zusammenstellungen nicht i n jedem Jahr übereinstimmen. Die nicht kontrollierten Faktoren sind hier variabel, aber nicht willkürlich, so daß sie ein Wahrscheinlichkeitsgesetz zulassen. Der mittlere Wert der Ernteergebnisse bei einer genügend großen Zahl von Experimenten m i t der gleichen Zusammenstellung läßt dann einen Wahrscheinlichkeitsschluß auf die jeweilige Getreidequalität zu 1 2 . Der entscheidende, wenn nicht der einzige, Grund für die Unterscheidung von klassischen und wahrscheinlichkeitstheoretischen Experimenten liegt also für Dugué und Girault i n der Frage der Kontrollierbarkeit der relevanten Faktoren. Da die Faktoren nicht genügend kontrolliert werden können, ist die Einführung des wahrscheinlichkeitstheoretischen Experiments nötig. Die gleiche Überzeugimg liegt auch dem Ansatz Fishers zugrunde. Ob unter diesem Gesichtspunkt aber die Forschungslogik des Experiments erfaßt werden kann, ist mehr als fraglich. I m erstgenannten Beispiel schien der Zweck des (deterministischen) Experimentes i n der Gewinnung funktionaler Beziehungen oder Gesetze zu liegen. Das zweitgenannte Beispiel (wahrscheinlichkeitstheoretisches Experiment) war an einer bestmöglichen Zusammenstellung von Faktoren orientiert. Worin die Gemeinsamkeit beider Arten von Experimenten liegt, ist jedenfalls von hier aus nicht deutlich geworden. Die bereits an dieser Stelle zu ziehenden Folgerungen bestehen darin, den wahrscheinlichkeitstheoretisch - statistisch ausgerichteten Ansatz vorläufig außer Betracht zu lassen. Eine eigenständige Auffassung, die für die Logik des Experiments von Belang sein könnte, liegt hier nicht v o r 1 3 . Das besagt jedoch nicht, daß wahrscheinlichkeitstheoretische Vgl. dazu auch Pages: [Experiment i n der Soziologie], S. 428 ff. Eine klare Abgrenzung gegenüber der wahrscheinlichkeitstheoretischen Auffassung w i r d jedoch v o n den Experimenttheoretikern nicht immer v o r genommen. Das gilt besonders für Chapin. Hauptsächlich i n seinen neueren Veröffentlichungen erscheint die Faktorenkontrolle (matching) nur als Ersatz der eigentlich zu erstrebenden Zufallsstreuung. Vgl. Explanation of the use 18

2. A r t e n des Experiments

17

Überlegungen nicht auch i m Rahmen der Theorie des Experiments eine erhebliche Bedeutung besitzen. 2. A r t e n des Experiments

Die bisher aufgestellten Typologien der Arten des Experiments besitzen ihren Wert zum Teil darin, daß sie zur begrifflichen Abgrenzung der experimentellen Vorgehensweise gegenüber anderen Verfahren herangezogen werden können, ohne daß sie notwendig die möglichen Strukturen eines Experiments kennzeichnen. Eine solche Gruppenbildung liegt i n der Unterscheidung Greenwoods vor nach 1. reinem Experiment, 2. unkontrolliertem Experiment, 3. Ex-post-facto-Experiment, 4. Probier-Experiment und 5. kontrollierter Beobachtung 14 . Diese Reihenfolge läßt sich nach dem Grade der Kontrolle für jedes Verfahren ordnen. Die geringste Kontrolle weist dann 1. das Probier-Experiment auf, es folgen 2. die kontrollierte Beobachtung, 3. das unkontrollierte Experiment, 4. das Ex-post-facto-Experiment und 5. das reine Experiment. Das „Probier-Experiment " (nach Versuch und I r r t u m ; t r i a l and error) bedeutet i m wesentlichen eine Probiermethode. Ohne eine klare K o n zeption der Verfahrensweise, ohne spezifische Hypothese und Kontrolle der einwirkenden Faktoren versucht man die erstrebte Wirkung zu erzielen. Das damit gegebene weite Verständnis des Experiments läßt es zu, nahezu alle sozialen Veränderungen als „Experiment" zu begreifen. Diese Vorgehensweise ist i m starkem Maß ein Ausdruck des praktischen Verhaltens. Man darf jedoch nicht vergessen, daß die Experimente zu Beginn der Entwicklung der experimentellen Wissenschaften eine große Ähnlichkeit m i t den Experimenten nach Versuch und I r r t u m besaßen. Das mangelnde Wissen über den Zusammenhang der Faktoren bestimmte i n erster Linie dieses Verhalten. Das „Experiment nach Versuch und I r r t u m " kann entsprechend der vor auf gegangenen Definition jedoch nicht mehr als ein Experiment i m strengen Sinn angesehen werden. Bisweilen w i r d -auch die „kontrollierte Beobachtung " insgesamt als experimentell bezeichnet. Eine Reihe von Gemeinsamkeiten m i t dem Experiment liegen z. B. i n der Künstlichkeit der Situation, der Ausschaltung von störenden Faktoren und der gegenseitigen Kontrolle der of the t i t l e „Experimental designs i n sociological research", in: International Journal of Opinión and A t t i t ü d e Research, Vol. 3 (1949), S. 45 u n d The experimental method i n the study of human relations, in: The Scientific Monthly, Vol. 68 (1949), S. 139, ferner besonders deutlich i n seinem Beitrag zum Seminar on experimental method, in: Transactions of the fourth w o r l d congress of sociology, Vol. 3, Löwen 1961, S. 285, 289. 14 Greenwood: [Experimental sociology], S. 7 ff. 2 Siebel

I. Gegenwärtige Theorie

18

Beobachter i m genauen Beobachtungsplan. Dennoch bleibt eine grundlegende Unterscheidimg bestehen. Die Beobachtung ist i n der Hauptsache auf die Beschreibung einer sozialen Situation h i n angelegt, das Experiment dagegen erstrebt die Erfassung von Kausalzusammenhängen, mögen sie auch i m einzelnen oft sehr spezieller A r t sein. Die Kontrolle bedeutet jedoch i n der Beobachtung i n der Regel nur das Vorgehen nach einem vorher gefaßten Kategorienschema, ohne daß die einzelnen Faktoren weitergehend kontrolliert würden. Meist w i r d kein Faktor eingeführt, entsprechend fehlen Kontrollgruppen. Zwar „ist die Grenze zwischen Beobachtung und Experiment nicht scharf gezogen. Die Beobachtung tendiert dahin, allmählich den Charakter eines Experiments anzunehmen" 1 5 . Doch kann auch die kontrollierte Beobachtung, wie das Experiment nach Versuch und Irrtum, nach der vorangegangenen Definition nicht als Experiment angesehen werden. Als „unkontrollierte Experimente " werden solche sozialen Vorgänge angesprochen, die von ihrem Ansatz her nicht als Experimente geplant werden und doch einige Eigenschaften des Experiments aufweisen, so eine — wenn auch oft unscharfe — Kausalhypothese und die Einführung einer Ursache i n eine soziale Situation. Es fehlt bei dieser Form des Experiments jedoch an einer Kontrolle der i n die Situation hineinwirkenden relevanten Faktoren. Deshalb ist es umstritten, ob man die „unkontrollierten Experimente" zu den Experimenten zählen soll. Es ist jedoch denkbar, daß die Kontrolle der Faktoren — nach Ablauf des Geschehens durch den Forscher — i n ausreichendem Maße gelingt. Unter dieser Voraussetzung lassen sich einige unkontrollierte Experimente als Experimente i m definierten Sinn bezeichnen 16 , obwohl diese Möglichkeit nur selten erreicht werden kann. Beispiele für unkontrollierte Experimente finden sich vor allem i n der Sozialgesetzgebung. Da die Bezeichnung des „unkontrollierten Experiments" dem Begriff des Experiments, zu dem die Kontrolle wesentlich gehört, widerspricht, wurden auch andere Bezeichnungen für diese Experimentart benutzt, so der Ausdruck „Teilexperiment" 17 , w e i l hier nur eine teilweise Kontrolle erreichbar sei. Chapin war ursprünglich für die unkontrollierten, oder wie er es nannte, „natürlichen" Experimente eingetreten, war dabei aber auf heftige K r i t i k gestoßen. Er versuchte daher ein Verfahren zu entwickeln, das auf nicht vom Experimentator geplante Vorgänge anzuwenden sein sollte und doch ein Höchstmaß von Kontrolle enthielt 1 8 . Diese Vorgehensweise nannte er Ex-post-facto-Experiment. 15

Chapin: [Experimental designs], S. 1. Greenwood: [Experimental sociology], S. 45. 17 F r a n k l i n Henry Giddings: The scientific study of h u m a n society, Chapel H i l l und London 1924, S. 56. 18 Francis Stuart Chapin: The advantages of experimental sociology i n the study of family group pattems, in: Social Forces, Vol. 11 (1932/33), S. 200—207. 16

2. A r t e n des Experiments

19

Das „Ex-post-facto-Experiment" erlaubt es, auf die Vergangenheit zurückzuschließen. Die Ursache für eine bestimmte Erscheinung hat bereits ihre Wirksamkeit begonnen oder auch abgeschlossen. Die W i r kung w i r d für die Gegenwart untersucht, kann aber ebenfalls i n die Vergangenheit hinein verfolgt werden. Die Kontrolle über die relevanten Faktoren w i r d i m Unterschied zum projektiven Experiment nicht physisch ausgeübt, sondern nur gedanklich, d. h. die Mitglieder der Gruppen werden nach ihren Eigenschaften ausgewählt, nicht passende Personen ausgeschieden. Durch diese „gedankliche Manipulierung" ist es jetzt möglich, eine Angleichung i n den relevanten Faktoren für Experimentier- und Kontrollgruppen zu erreichen. Die Unterscheidung zwischen beiden Gruppen liegt wieder darin, daß i n einem Fall die angenommene Ursache nicht einwirken konnte. Die höchste Form der Kontrolle ist schließlich zu erreichen i m „reinen ExperimentEs stellt „das Ideal der experimentellen Methode dar, das Modell, auf das alle anderen Typen ausgerichtet sind" 1 9 . Dieses Experiment i m engsten Sinne des Begriffs findet sich hauptsächlich i n den Laboratorien der Physik. „Das bedeutet: Herstellung von natürlichen Zuständen, Einführung eines Stimulus i n die geschaffene Situation durch den Experimentator selbst, die strenge Kontrolle aller relevanten Bedingungen, den Gebrauch von Instrumenten, u m die Wirkung des Stimulus festzustellen, und schließlich die unbegrenzte Wiederholung der experimentellen Anordnung m i t Änderung jeweils eines oder mehrerer Faktoren" 2 0 . I n diese Zusammenstellung kann auch die von Mill stammende Begriff sbildung eingefügt werden 2 1 . M i l l unterscheidet zwischen „natürlichem" und „künstlichem ExperimentMaßgebend ist, ob das Experiment durch natürliche Gegebenheiten spontan geschaffen wurde, oder ob die experimentellen Bedingungen vom Forscher hergestellt wurden. Beim natürlichen Experiment w i r d die W i r k u n g nicht absichtlich erzeugt. Daher ist es schwierig, die an der Situation beteiligten Faktoren so zu kontrollieren, daß die Ergebnisse eindeutig zugeordnet werden können. Das künstliche Experiment ermöglicht eine faktische Manipulierung des Forschungsgegenstandes i n Richtung auf das Forschungsziel. Aus diesem Grunde ist die weitaus überwiegende Mehrzahl der Experimente zu den künstlichen Experimenten zu rechnen. Man braucht bei dieser Form nicht auf den E i n t r i t t bestimmter Ereignisse zu warten. Damit gewährt das künstliche Experiment eine wirksamere Kontrolle 19

Greenwood: [Experimental sociology], S. 44. Ebd., S. 7. John Stuart Mili: A system of logic, 8. Auflage, London 1889, S. 249, 574; dt. System der deductiven u n d inductiven Logik, 3. Auflage, Braunschweig 20

21

1868. 2*

20

I. Gegenwärtige Theorie

und eine höhere Genauigkeit. Das künstliche Experiment entspricht vollständig dem reinen Experiment. Dagegen ist das natürliche Experiment nicht ganz so eindeutig m i t einer der bisher genannten Formen des Experiments gleichzusetzen. I m wesentlichen stimmen natürliches und unkontrolliertes Experiment überein. Allerdings ist der Gesichtspunkt der Kontrolle für M i l l nicht allein für die Unterscheidung von Bedeutung. Daher ist Greenwood davon überzeugt, daß das Ex-postfacto-Experiment ein natürliches Experiment i m Sinne Mills i s t 2 2 . Nicht ohne weiteres m i t dem hier verfolgten Begriff des Experiments ist der Gegenstand des „„Gruppenexperiments" vereinbar. Diese Vorgehensweise besteht i n einer nur wenig gelenkten Form der Diskussion innerhalb von Gruppen. Nach einem Grundreiz werden die Teilnehmer zur Diskussion von bestimmten Themen veranlaßt, vorbereitete A r g u mente werden später eingeführt. Das Erkenntnisziel liegt i n diesem Falle nicht unmittelbar i n der Erfassung von Kausalzusammenhängen, sondern i n der Freilegung von Denk- und Motivationsstrukturen. A l l e r dings enthalten diese Gruppendiskussionen auch ein gewisses Maß an Manipulierung, so daß eine für den Teilnehmer ähnliche Situation wie i n einem Laboratoriumsexperiment entstehen k a n n 2 3 . Schließlich gehört auch das Quasiexperiment, w i e der Name besagt, nicht zu den A r t e n der experimentellen Vorgehensweise. V o m Quasiexperiment spricht man z. B. dann, wenn Ergebnisse der Meinungsforschung die Einflüsse bestimmter Faktoren, etwa i m politischen Bereich, auf bestimmte Einstellungen und Haltungen m i t Hilfe festgestellter Korrelationen verdeutlichen. Gegenüber diesen begrifflichen Unterscheidungen liegt eine der gebräuchlichsten Differenzierungen i n der Trennung von Laboratoriumsund Feldexperiment. Das Laboratoriumsexperiment ist dadurch gekennzeichnet, daß der Forscher die Situation m i t genau den Bedingungen herstellt, die er zu haben wünscht. Diese Form des Experiments erlaubt eine hohe Kontrolle der i n der Situation anwesenden Faktoren und die Manipulierung des zu prüfenden Faktors 2 4 . Das Laboratoriumsexperiment stimmt daher überein m i t dem reinen Experiment. Dagegen 22

Greenwood: [Experimental sociology], S. 30. Vgl. Friedrich Pollock: Gruppenexperiment, Frankfurt am M a i n 1955 und Werner Mangold: Gegenstand und Methode des Gruppendiskussionsverfahrens, Frankfurt am M a i n 1960. — Desgl. sind die von Duverger: ([Méthodes], S. 361) zu den Laboratoriumsexperimenten gezählten Techniken des von Moreno geschaffenen Soziodramas kaum zum Experiment zu rechnen, da sie weniger theoretischen als therapeutischen Zwecken dienen. So entfällt z. B. bereits eine Kausalhypothese. 24 Für eine umfassende Darstellung vgl. Leon Festinger: Laboratory experiments, in: L. Festinger, W. Katz (Hrsg.): [Research methods], S. 136—172; [Laboratory experiments], ferner Robert F. Bales, Ned A. Flanders : Planning an Observation room and group laboratory, in: American Sociological Review, Vol. 19 (1954), S. 771—781. 23

2. A r t e n des Experiments

21

ist das Feldexperiment bisher noch nicht ausdrücklich behandelt worden. Eine gewisse Nähe zeigt sich nur zum unkontrollierten Experiment. Eine scharfe Grenzlinie zwischen Laboratoriumsexperiment und Feldelement läßt sich nicht ziehen. Es gibt eine Reihe von Übergangsformen, die nicht eindeutig einzuordnen sind. Entscheidend ist nicht, ob die sozialen Phänomene i n einem „Laboratorium" oder i n einer Schule oder i n einer anderen .Einrichtung ablaufen, sondern ob die untersuchten Phänomene wirkliche soziale Vorgänge sind, auf die alle normalerweise gegebenen Faktoren einwirken und nicht nur ein Teil i n beschränkter oder verkürzter Weise. Daher ist eine ausreichende Kontrolle i m Feldexperiment viel schwieriger als i m Laboratoriumsexperiment zu erreichen 25 . Für den Ablauf eines Forschungsvorhabens w i r d häufig angenommen, daß die zu untersuchende Hypothese zuerst i n einem Laboratoriumsexperiment, dann erst i n einem Feldexperiment geprüft werden müsse 26 , bisweilen erscheint der Forschungsgang auch als umgekehrt orientiert 2 7 . Die von Greenwood selbst entworfene Typologie umfaßt vier A r t e n des Experiments: 1. das projektiv-sukzessive Experiment, 2. das projektiv-simultane Experiment, 3. das Ex-post-facto-Experiment m i t der Forschungsrichtung von der Ursache zur Wirkung und 4. das Ex-postfacto-Experiment von der W i r k u n g zur Ursache 28 . Ähnlich lautet die von Chapin entwickelte Klassifizierung: 1. Querschnittsexperiment (cross-seetional experiment), 2. projektives Experiment und 3. Ex-postfacto-Experiment. Beide erwähnen für jede Form des Experiments eine Reihe von Beispielen — z. T. die gleichen — ohne daß aber die deflatorische Abgrenzung zwischen den Formen immer genügend klar wird. Für Chapin 29 ist die getroffene Unterscheidung allein eine Frage der zeitlichen Betrachtung. I n allen Fällen enthält die experimentelle A n ordnung sowohl eine Experimentier- als auch eine Kontrollgruppe. I m Querschnittsexperiment werden zu gleicher Zeit, nämlich i n der Gegenwart, zwei Gruppen untersucht. Das projektive Experiment bezieht sich auf die Untersuchung eines „Vorher" und „Nachher". Es geht von der Gegenwart aus und stellt die Auswirkungen des zu prüfenden Faktors i n der Zukunft fest. I m Ex-post-facto-Experiment schließlich w i r d eine i n der Gegenwart feststellbare Auswirkung auf eine hypothetische Gesamtheit von ursächlichen Faktoren i n der Vergangenheit zurückverfolgt. Dafür muß Material verwendet werden, das aus der Vergangen25 Vgl. John R. P. French: Experiments i n field settings, in: L. Festinger, W. K a t z (Hrsg.): [Research methods], S. 98—135; [Field settings]. 28 Ebd., S. 100. 27 Ronald Lippitt: The strategy of sociopsychological research, in: J . G . M i l l e r (Hrsg.): [Experiments], S. 24, 26. 28 [Experimental sociology], S. 49 ff. 29 [Experimental designs], S. 32 f.

22

I . Gegenwärtige Theorie

heit zur Verfügung steht, hauptsächlich Aufzeichnungen, da unmittelbare Messungen für den vergangenen Zustand nicht vorgenommen werden können. Greenwood dagegen unterscheidet seine Typen nach zwei Kriterien, nämlich nach dem zeitlichen Gesichtspunkt und nach der Zahl der i n der Anordnung befindlichen Gegenstände, Gruppen oder Fälle. Der zeitliche Gesichtspunkt kommt i n der • Differenzierung zwischen projektivem und Ex-post-facto-Experiment zum Ausdruck; ein nur auf die Gegenwart bezogenes Querschnittsexperiment gibt es bei Greenwood nicht. Die A r t der experimentellen Anordnung kann sukzessiv oder simultan sein. E i n sukzessives Experiment liegt dann vor, wenn nur ein einziges Objekt i m Zeitablauf untersucht wird. So kann eine bestimmte Gruppe vor Beginn der Einführung des zu prüfenden Faktors und nach beendeter E i n w i r k u n g untersucht werden. Da die Eigenschaften des Gegenstandes gleich geblieben sind m i t Ausnahme des eingeführten Faktors und seiner Wirkungen, handelt es sich auch in diesem F a l l u m kontrollierte gegensätzliche Situationen. Bei einem simultanen Experiment dagegen sind i n der experimentellen Anordnung zwei Gruppen (oder andere Gegenstände) enthalten, von denen nur eine der Einwirkung der hypothetischen Ursache unterworfen wird. Es w i r d dann bevorzugt, wenn störende Einflüsse aus dem sozialen Wandel zu befürchten sind. Sowohl das projektive als auch das Ex-post-factoExperiment können von sukzessiver oder von simultaner A r t sein. Dagegen ist die Forschungsrichtung beim projektiven Experiment festgelegt, während man i m Ex-post-facto-Experiment sowohl von der Ursache als auch von der Wirkung ausgehen kann. Insgesamt kommt Greenwood damit auf sechs verschiedene Experimenttypen. Allerdings kann er noch kein durchgeführtes sukzessives Ex-post-facto-Experiment nennen, obwohl er eine Durchführung dieser Anordnungen grundsätzlich für möglich hält. Grund dafür ist, daß für das Ex-post-factoExperiment bisher nur besondere, die simultane Form fordernde, Kontrolltechniken entwickelt wurden, die dazu dienen sollen, die W i r k samkeit des projektiven Typs zu erreichen. 3. F o r m e n der Kontrolle

a) Feststellung

der bedeutsamen Faktoren

Die Kontrolle bildet den zentralen Punkt i m Rahmen des experimentellen Forschungsvorgehens, an dem sich nicht nur die Qualität des Ergebnisses entscheidet, sondern der für das Experiment schlechthin grundlegend ist. „Eine wirkungsvolle Kontrolle ist der Schlüssel zum gesamten experimentellen Verfahren. Sie ist entscheidend für die Ge-

3. Formen der K o n t r o l l e

23

nauigkeit der Schlußfolgerungen" 30 . Die Kontrolle w i r d erreicht, wenn die Messung der variablen Faktoren i n zwei gegensätzlichen Situationen die gleichen Werte ergibt 3 1 . Der Vorgang der Kontrolle spielt sich für das Experiment i n zwei Phasen ab. Zunächst sind die bedeutsamen (relevanten) Faktoren erst einmal festzulegen, sodann muß entschieden werden, i n welcher Form und i n welcher Intensität diese Faktoren i n ihrem Einfluß konstant gehalten werden sollen. Voraussetzung ist für diese Formulierung, daß immer Experimentier- und Kontrollsituation gleichzeit geschaffen werden. Die eigentliche Kontrolle und damit auch die verschiedenen Kontrollformen setzen also erst nach der Auswahl der bedeutsamen Faktoren an. Die Bestimmung dieser Faktoren ist aber eine notwendige Vorbedingung und i m Forschungsablauf der erste Schritt der Kontrolle. Ein bedeutsamer Faktor ist dann gegeben, wenn er „zu der untersuchten W i r k u n g beiträgt" 3 2 . Gelegentlich w i r d i m eingeschränkten Sinn nur von den Faktoren als „bedeutsamen Faktoren" gesprochen, die i n bemerkenswerter Weise auf das mögliche Ergebnis einzuwirken vermögen. Diejenigen Faktoren, die voraussichtlich das Resultat des Experiments nicht beeinflussen, werden nicht oder nur wenig kontrolliert. Die experimentelle Kontrolle ist daher kaum jemals eine absolute Kontrolle, die alle Faktoren umgreift, sondern immer eine selektive Kontrolle, die nur die als bedeutsam angesehenen Faktoren erfaßt und konstant zu halten sucht. Die Gewinnung der bedeutsamen Faktoren setzt eine tiefergehende Vertrautheit m i t dem Material voraus. Sie kann als „unmittelbare Einsicht, Verstehen" 3 3 u. a. bezeichnet werden. Eine eindeutige Technik für die Auswahl der bedeutsamen Faktoren aus den zahlreichen Bedingungen für das Experiment gibt es nicht. Chapin glaubt, daß nur das Vorgehen nach „Versuch und I r r t u m " zur Erkenntnis der relevanten Faktoren führt. Er schließt daran die kritische Überlegung an, es sei „berechtigt, zwei Stadien i n der Entwicklung der experimentellen Methode zu unterscheiden — ein Pionierstadium des empirischen Experimentierens mittels der rohen Methode nach Versuch und I r r t u m und ein exaktes Stadium, i n dem viele Bedingungen bekannt und kontrolliert sind. Wenn diese Unterscheidung annäherungsweise wahr ist, dann dürfte ein Bericht über soziales Experimentieren zeigen, daß sich der 80

Greenwod: [Experimental sociology], S. 72. Francis Stuart Chapin: Social theory and social action, in: American Sociological Review, Vol. 1 (1936), S. 8. — Desgl. Greenwood: [Experimental sociology], S. 34. Die Probleme der Kontrolle werden bei Greenwood (S. 72 ff.) ohne Berücksichtigung des sukzessiven Experiments, aber auch ohne dessen ausdrückliche Ausschließung behandelt. 32 Greenwood: [Experimental sociolgy], S. 73. 88 Ebd., S. 74. 81

24

I. Gegenwärtige Theorie

Soziologe noch i m ersten Stadium der experimentellen Methode befindet" 3 4 . „Wenn aber genügend Zeit für Verbesserungen der Techniken zur Verfügung steht, besteht kein Grund zu glauben, unsere Fähigkeit zusätzliche Faktoren zu identifizieren und zu kontrollieren würde nicht wachsen" 35 . Jedenfalls kann nur die Kenntnis der Zusammenhänge eine solche Einsicht gewähren. Das Experiment muß daher durch andere Verfahren ergänzt werden. Insbesondere ist nach Greenwood „die Einzelfallstudie dem Experiment voranzustellen" 8 8 . Für den Erfolg des Experiments ist die Vertrautheit m i t dem Material entscheidend. Sind die bedeutsamen Faktoren auf Grund der Kenntnis der experimentellen Bedingungen ausgewählt worden, so w i r d die Gesamtheit dieser Faktoren darauf geprüft, ob sie auch wirksam kontrolliert werden können. I m Idealfall sind sämtliche relevanten Faktoren kontrollierbar. Gründe dafür, daß dieser Idealfall kaum je erreicht wird, liegen einerseits darin, daß sich einige Faktoren beim gegenwärtigen Stand der Sozialforschung nur schwer oder gar nicht kontrollieren lassen und andererseits darin, daß Zeit- und Finanzbedarf eine vollständige Kontrolle unter den jeweils gegebenen Bedingungen kaum jemals zulassen. Diejenigen Faktoren, die nicht kontrolliert werden können, w e i l die entsprechenden Werkzeuge, Unterlagen usw. fehlen oder bei denen sich der Faktor einer notwendigen Erfassung und Manipulation verschließt, müssen notgedrungen außerhalb einer intensiven Kontrolle bleiben. Stellt der verfügbare Zeit- und Geldaufwand Grenzen der Erfassung der verbleibenden bedeutsamen Faktoren dar, so muß aus diesen Faktoren eine Auswahl getroffen werden. Vor einer solchen Beschränkung steht nahezu jedes sozialwissenschaftliche Experiment. Unter diesen Umständen werden die Faktoren i n einer bestimmten Rangfolge geordnet. Das ist möglich, weil es so etwas gibt, „ w i e eine Stufung i n der relativen Wichtigkeit der bedeutsamen sozialen Faktoren" 3 7 . Die wichtigsten Faktoren werden dann einer Kontrolle durch Gleichsetzung der Faktoren unterworfen, während man die weniger wichtigen Faktoren unkontrolliert läßt oder durch Herstellung einer Zufallstreuung i n ihrem Einfluß i n Experimentier- und Kontrollsituation konstant zu halten sucht. Je nach der A r t des Experiments gelangen andere Formen der Kontrolle zur Anwendung. Bei der direkten Kontrolle w i r d eine physische Manipulierung des Beobachtungsmaterials vorgenommen. Bei der 34 35 36 37

[Experimental designs], S. 17. Ebd., S. 31. [Experimental sociology], S. 76. Ebd., S. 80.

3. Formen der K o n t r o l l e

25

indirekten Kontrolle handelt es sich dagegen um eine gedankliche oder symbolische Manipulierung. Die physische Kontrolle, bei der die Faktoren selbst durch den Forscher zusammengestellt werden, läßt sich i m Ex-post-facto-Experiment nicht anwenden. Statt dessen muß zur gedanklichen (symbolischen) Kontrolle gegriffen werden, bei der Symbole anstelle bestimmter dahinterstehender Sachverhalte der Manipulierung, d. h. konkret der Gruppenzusammenstellung, unterworfen werden. So benutzt man häufig als Symbole i m Ex-post-facto-Experiment Kärtchen für einzelne Personen, auf denen die für die Person zutreffenden relevanten Faktoren verzeichnet sind. Diese Kärtchen lassen sich dann beliebig für die Erforschung des zu prüfenden zurückliegenden Kausalzusammenhanges manipulieren. b) Gleichsetzung

der Faktoren

Für die endgültig ausgewählten Faktoren gibt es zwei Arten von Kontrollverfahren. Beide suchen die Wirkung der bedeutsamen Faktoren dadurch zu kontrollieren, daß man i n der experimentellen und i n der Kontrollgruppe den gleichen Faktor jeweils i n gleicher Stärke zur Geltung kommen läßt, also die Gruppen (Situationen) homogenisiert. Die strengere Form der Kontrolle besteht i n der Präzisionskontrolle, die weniger strenge i n der Kontrolle der Häufigkeitsverteilungen. Bei der Präzisionskontrolle w i r d die Gleichsetzung der Faktoren i n Kontrollund Experimentiergruppe (matching) so weit vorangetrieben, daß jedes Mitglied der einen Gruppe einem Mitglied i n der anderen Gruppe i n bezug auf die bedeutsamen Faktoren gleicht. Sind etwa Geschlecht, Alter, Religion, Beruf, Einkommen für zu kontrollierende Faktoren erklärt worden, so werden zwei Personen gesucht, die sich i n diesen Eigenschaften gleichen, also das gleiche Geschlecht, das gleiche Alter, die gleiche Religion usw. aufweisen. Geht man dabei von einer bestimmten zur Verfügung stehenden Menge von Personen aus, deren Merkmale bekannt sind, so w i r d m i t steigender Zahl der zu kontrollierenden Faktoren die Zahl der den Ansprüchen genügenden Paare zurückgehen. Nach der Erfahrung ist der Rückgang i n der Zahl der geeigneten Personen ziemlich rapide und verstärkt sich m i t jedem weiteren kontrollierten Faktor. Bei einer bestimmten Zahl von Kontrollen läßt sich aus der vorgegebenen Gesamtheit schließlich überhaupt kein Paar mehr finden, das alle geforderten Eigenschaften i n gleicher Weise besitzt. Je größer die Zahl der zu kontrollierenden Faktoren, desto schwieriger ist es also, genügend große Gruppen zu bilden. Die Erweiterung der Anfangsmenge ist nicht immer möglich, ganz abgesehen davon, daß die Suche nach geeigneten Personen

26

I. Gegenwärtige Theorie

den Zeit- und Finanzbedarf vervielfältigt. Die Größe der Gruppen für das Experiment ist aber „ f ü r die Beurteilung der experimentellen Ergebnisse ein sehr wichtiger Faktor" 3 8 . Der Forscher kann so i n schwer zu bewältigende Schwierigkeiten geraten. Kontrolliert er sehr sorgfältig, so nehmen die Gruppen ab, dadurch verringert sich aber auch die Zuverlässigkeit der Ergebnisse. Kontrolliert er nur grob, so verletzt er ein Grundgebot der idealen experimentellen Vorgehensweise. U m eine zu starke Schrumpfung zu vermeiden, w i r d man bei der Zusammenstellung der Paare nicht allzu genau vorgehen. Man w i r d z. B. Altersgruppen bilden und die Gleichsetzung nicht nach dem Geburtsmonat oder -jähr, sondern nach einer Mehrjahresgruppe vornehmen. Da die Meßinstrumente noch sehr unvollkommen sind, ist es erlaubt, kleine Abweichungen ruhig zu übersehen. Es wurde aber noch eine weitere Möglichkeit entwickelt, die i n der Präzisionskontrolle auftretende Schrumpfung i n Grenzen zu halten, die Gleichsetzung von Untergruppen 39. Die Personen i n Experimentier- und Kontrollgruppen werden danach eingeteilt i n Untergruppen, so daß i n jeder dieser Kategorien bei allen Personen vollständige Übereinstimmung der kontrollierten Faktoren herrscht. Stimmt die Zahl der M i t glieder der Experimentiergruppe i n einer solchen Kategorie nicht mit der Zahl der Mitglieder der Kontrollgruppe i n der gleichen Kategorie überein, so verlangt die Präzisionskontrolle eigentlich die Entfernung der überzähligen Personen. Bei diesem Verfahren können diese jedoch belassen werden. Mindesterfordernis ist jedoch, daß eine Person sowohl für Experimentier- als auch für Kontrollgruppe i n jeder Kategorie enthalten ist. Aus den Ergebnissen des Experiments w i r d dann ein Durchschnitt für jede der beiden Gruppen innerhalb einer Kategorie und ihre Differenzen errechnet. Die Serie der Differenzen i n den einzelnen Untergruppen w i r d abschließend einem Signifikanztest unterworfen. U.a. wurde von Guttman eine Formel für eine solche Prüfung entworfen 4 0 . Die Präzisionskontrolle bietet den Vorteil, daß für jede einzelne Variable die Werte für die Verteilung i n den beiden Gruppen gleich sind. Mittelwerte und Streuungen entsprechen sich für jeden kontrollierten Faktor. Läßt sich eine Präzisionskontrolle nicht durchführen, so kann an ihre Stelle eine Kontrolle der Häufigkeitsverteilung treten. Bei dieser Form der Kontrolle sucht man die bedeutsamen Faktoren i n 38

Ebd., S. 82. Bereits bei Chapin ( A n experiment on the social effects of good housing, i n American Sociological Review, Vol. 5 [1940], S. 874 f.) verwendet. 40 I n Julius A . Jahn: A control group experiment on the effect of W. P. A . w o r k relief as compared to direct relief upon the personal-social morale and adjustment of clients i n St. Paul, 1939. M . A . Thesis, University of Minnesota 1942; zitiert i n Greenwood: [Experimental sociology], S. 119. 89

3. Formen der Kontrolle

27

Kontroll- und Experimentiergruppe nicht mehr für jedes Mitglied der Gruppe gleichzusetzen, sondern nur eine gleiche Häufigkeitsverteilung der bedeutsamen Faktoren für die Gruppen als Gesamtheit zu erreichen. Dabei w i r d erstrebt, bestimmte Werte für beide Gruppen i n gleicher Weise dadurch zu erhalten, daß man die einzelnen Personen entsprechend den zu erreichenden Maßen wie z. B. arithmetisches Mittel, Median, gleiche Abweichungen davon, Indices der Häufungen auswählt. Die beiden Gruppen stimmen damit i n der Verteilung der Faktoren innerhalb gewisser Grenzen überein. Auch bei diesem Vorgehen läßt sich von einer Gleichsetzung der Faktoren reden, obwohl die Kontrolle allgemein als weniger streng gilt als bei der Gleichsetzung von Personen. c) Maximale

Zufallsstreuung

Die Kontrolle durch maximale Zufallsstreuung ist ein Verfahren, u m die nicht durch Gleichsetzung kontrollierter Faktoren nach Wahrscheinlichkeitsüberlegungen zu einer möglichst gleichen Einwirkung auf Kontroll- und Experimentiergruppe zu bringen. Für das sozialwissenschaftliche Experiment w i r d man etwa die Zuteilung der nach der Präzisionskontrolle ausgewählten Personen aus jedem Paar zu der einen oder der anderen Gruppe m i t einer Zufallsauswahl vornehmen. Das Verfahren läßt sich nicht nach einer Kontrolle der Häufigkeitsverteilung anwenden, weil hier die Verteilung der Personen auf die Gruppen bereits festliegt. Desgleichen ist die Kontrolle durch maximale Zufallsstreuung nicht i n einem Ex-post-facto-Experiment zu erreichen. Bei dieser Form des Experiments handelt es sich ja u m ein natürliches Experiment. Die erfaßten Personen sind bereits dem Einfluß ausgesetzt worden oder nicht, die Entscheidung darüber ist bereits gefallen. N u r i n einem projektiven Experiment kann über die Verteilung der Faktoren etwa durch einen Münzwurf entschieden werden. Diese Form der K o n t r o l l e 4 1 stellt jedoch nur ein Hilfsverfahren für die Präzisionskontrolle dar. „Wo irgend möglich, ist die Präzisionskontrolle zu verwenden" 4 2 . Erst wenn die Präzisionskontrolle auf Schwierigkeiten stößt oder wenn die Schrumpfung der Gruppen zu stark zu werden droht, sollte die Kontrolle durch maximale Zufallsstreuung eingeführt werden. Grundsätzlich ist es möglich, auf jedem Punkt des Kontrollprozesses eine maximale Zufallsstreuung herzustellen. So ließe sich nach der Gleichsetzung eines Faktors bereits dieses Verfahren an41 Fisher hatte bei seiner Einführung des Verfahrens der maximalen Z u fallsstreuung keinesfalls an ein Hilfsverfahren gedacht, sondern grundsätzlich die Unkontrollierbarkeit aller Faktoren vorausgesetzt; vgl. [Design of experiments], S. 17 ff. 42 Greenwood: [Experimental sociology], S. 91.

I . Gegenwärtige Theorie

28

wenden. Es würde aber zu unbefriedigenden Ergebnissen führen, wie sich mathematisch demonstrieren läßt. 4. Bekannte Problematik

Eine der größten Schwierigkeiten des experimentellen Verfahrens besteht darin, die bedeutsamen Faktoren i n der geplanten Experimentiersituation herauszufinden. Welche Faktoren bedeutsam sind, läßt sich nicht immer aus der Beobachtung des Gegenstandes herausfinden, w e i l das sozialwissenschaftliche Experiment i n der Mehrzahl der Fälle ein künstliches Experiment bildet. Die Bestandteile der Experimentiersituation werden bei diesem meist erst ausgewählt und zusammengesetzt zu Beginn des Experiments. Es muß also anderes Wissen zur Bestimmung der relevanten Faktoren herangezogen werden. Eine Technik zur Gewinnung der Faktoren, die auch bei der Anwendung durch andere Forscher zur gleichen Auswahl käme, gibt es nicht. Desgleichen ist die Gewichtung der Faktoren nach ihrer Bedeutsamkeit weitgehend i n das subjektive Ermessen gestellt, das sich allerdings an den Ergebnissen anderer empirischer Untersuchungen, speziell anderer Experimente zu orientieren hat. Die Problematik der Erfassung der bedeutsamen Faktoren w i r d dadurch unterstrichen, daß man auf die Komplexität der sozialen Zusammenhänge verweist. Weil das soziale Geschehen zu komplex ist, ist es nicht nur möglich, sondern sogar wahrscheinlich, daß bedeutsame Tatsachen der Aufmerksamkeit des Forschers entgehen. Eine pessimistische Beurteilung der Vorgehensweise des Experiments w i r d auch dadurch gestärkt, daß es bisher nicht gelang, eine vollständige Liste aller Faktoren, die i n eine soziale Situation eintreten können, aufzustellen. Dagegen w i r d jedoch geltend gemacht, daß die Komplexität eine Folge der ungenügenden Vertrautheit m i t dem Material und damit nur scheinbar gegeben sei. M i t dem Fortschritt der Wissenschaft werde die Komplexität soziologischer Daten zurückgehen 43 . M i t diesen Schwierigkeiten verbindet sich die Problematik der Kontrolle der als bedeutsam angesehenen Faktoren. Zwar ist die Kontrolle durch Gleichsetzung der Faktoren bei entsprechend intensiven Bemühungen der Forscher i n den meisten Fällen wenigstens theoretisch erreichbar, man darf sich jedoch nicht dadurch täuschen lassen, als sei damit eine vollkommene Gleichsetzung wirklich erreicht. Das ist schon deshalb nicht der Fall, w e i l i n einer Gleichsetzung immer nur die wichtigsten Faktoren berücksichtigt werden können. Aber auch diese Faktoren sind sich nur innerhalb grober Umrisse ähnlich. Denn es sind ja „Symbole", m i t deren Hilfe die zu kontrollierenden Eigenschaften der 43

So Greenwood:

[Experimental sociology], S. 78.

4. Bekannte Problematik

29

einzelnen Personen erfaßt werden sollen 44 . N i m m t man z. B. das A l t e r als einen bedeutsamen Faktor an, so unterstellt man, daß damit der Reifegrad von Personen zu erfassen sei. Setzt man aber zwei Personen i n bezug auf das Alter gleich, so ist doch offensichtlich, daß der Reifegrad trotzdem recht verschieden sein kann. Auch unter der gleichen Berufsbezeichnung verbergen sich oft i n vielen Hinsichten voneinander abweichende Positionen und Qualifikationen. Ähnliches gilt für fast alle bedeutsamen Faktoren. Die Gleichsetzung kann immer nur grob sein, weil das scheinbar Gleiche bei sozialen Daten nicht immer gleich ist. Ob die Gleichsetzung wirksam ist, hängt von der Wirkung ab, die untersucht werden soll. Hier erscheint wieder das Problem der Auswahl der bedeutsamen Faktoren, nämlich ob es ausreicht, den ausgewählten Faktor global zu kontrollieren oder ob bestimmte Merkmale dieses Faktors ebenfalls kontrolliert werden müssen. So kann es sein, daß für bestimmte Untersuchungen nicht die paarweise Gleichsetzung des Alters ausreicht, sondern daß auch eine Gleichsetzung i n bezug auf den geistigen, seelischen oder körperlichen Reifegrad erforderlich ist. Behält der Forscher beide Schwierigkeiten i m Auge, so ist es für i h n naheliegend, nur solche experimentellen Situationen zu untersuchen, die möglichst übersichtlich, unkompliziert und vereinfacht sind. Bei diesen ist am ehesten einige Sicherheit vorhanden, daß die bedeutsamen Faktoren erkannt und genügend kontrolliert werden. Die Folge ist aber, daß diese Untersuchungen völlig unbedeutende, gleichgültige oder längst allgemein bekannte Ergebnisse zutage fördern. Entsprechende K r i t i k e n sind gegenüber der Sozialforschung, speziell aber auch gegenüber dem Experiment schon früh geäußert worden. Kennzeichnend ist dafür die Stellungnahme Sorokins, der selbst einige Experimente durchgeführt hat 4 5 . Er nennt einen Teil der Experimentatoren i n der Sozialwissenschaft Tatsachenfinder (fact-finder). Wenn ein solcher Tatsachenfinder ein Experiment veranstalten w i l l , kann er nur solche Probleme studieren, die i n einer begrenzten Zeitspanne und i n begrenztem Raum kontrolliert werden können. Aber unter diesen begrenzten Bedingungen können nur die simpelsten und bestbekannten sozialen Phänomene untersucht werden. Die komplexeren und daher gewöhnlich wichtigeren und bedeutsameren Phänomene können nicht experimentell studiert werden, w e i l sie zu breit und zu kompliziert sind. Wenn diese K r i t i k nun allerdings für viele Forschungen zutrifft 4 6 , so gilt sie jedoch nicht für alle Untersuchungen. Es ist auch nicht notwendig so, daß komplexere 44

Ebd., S. 83. P i t i r i m A. Sorokin: Improvement of scholarship i n the social sciences, in: Journal of Social Philosophy, Vol. 2 (1937), S. 237—245; zitiert bei Greenwood: [Experimental sociologyl, S. 93. 46 Greenwood: [Experimental sociology], S. 93. 45

30

I. Gegenwärtige Theorie

soziale Zusammenhänge nicht experimentell erforscht werden können. Wenigstens ist es möglich, durch Teiluntersuchungen Einblicke i n die Gesamtphänomene zu erhalten. Die Problematik des Experiments erweitert sich durch den Hinweis auf die Künstlichkeit vieler experimenteller Anordnungen. Weil die Mehrzahl der Experimente i n einer Laboratoriumssituation stattfindet, ist es nur schwer zu erreichen, daß die einzelnen Personen wie i n einer Normalsituation handeln. Die Bewußtheit des Experiments verliert sich häufig nur schlecht oder gar nicht, so daß das soziale Handeln ganz anders verlaufen kann als i n der gewohnten Umwelt. Eine der Hauptaufgaben bei der Anlage und Durchführung des sozialwissenschaftlichen Experiments ist es daher, das Bewußtsein des Experiments bei den Teilnehmern der Experimentiergruppen möglichst aufzuheben. M i t t e l dafür sind, nur wenige Beobachter einzusetzen oder sie unsichtbar zu machen, so daß sie zwar die Experimentiersituation übersehen können, aber von hier aus nicht zu bemerken sind. Der Beobachter kann auch als Teilnehmer der Experimentiergruppe fungieren. Ferner ist es nötig, auch die Einflüsse, die durch die Feststellung der Faktoren zu Beginn des Experiments eintreten können, möglichst gering zu halten. Die Künstlichkeit vieler Experimente w i r d andererseits dadurch hervorgerufen, daß eine Reihe von Faktoren, die i n der Normalsituation wirken, eliminiert sind. Das Experiment ist daher i n der Regel nur ein sehr kleiner Ausschnitt aus der Gesamtheit des gesellschaftlichen Handelns. Daraus ergibt sich wieder, daß die Ergebnisse auch nur sehr partielle Bereiche betreffen. Die Bedeutsamkeit für die soziologische Theorie schwindet. Der Grad der erreichten Genauigkeit des Ergebnisses vermag dieses aber nicht aufzuwiegen. Schließlich weist das Experiment auch eine Problematik auf, die sich nicht aus der Anlage und Durchführung des experimentellen Verfahrens an sich ergibt, sondern aus dem Forschungsgegenstand. „Soziale Einheiten sind komplex, verglichen m i t den relativ einfachen Einheiten anderer Wissenschaften. I n der Physik sind die Einheiten homogen, standardisiert; gleich ob i n China oder Amerika, das Experiment w i r d bei gegebenen kontrollierten Bedingungen gelingen und kann wiederholt werden. Aber i n der Soziologie sind die Einheiten nicht homogen und standardisiert; jede Einheit ist einmalig, individuell und verschieden. Darüber hinaus besteht eine ständige Störung i n Rasse, Regierung, Lebensstandard und politischen Ideen. Ein Experiment i n China besagt wenig oder nichts für A m e r i k a " 4 7 . Also selbst wenn komplexe 47 Chapín: [Experimental designs], S. 21 f. — A u f diese Schwierigkeit wies bereits ausdrücklich h i n Robert C. Angell: The difficulties of experimental sociology, in: Social Forces, Vol. 11 (1932/33), S. 210.

4. Bekannte Problematik

31

Zusammenhänge experimentell erfaßt werden könnten, wäre damit die Frage der Verallgemeinerbarkeit der Ergebnisse noch nicht gelöst. Der Gegenstand des sozialwissenschaftlichen Experiments besteht immer aus Personen. Damit ist aber auch eine totale Manipulierbarkeit des Gegenstandes wie i n den Naturwissenschaften i n der Soziologie grundsätzlich ausgeschlossen. Bereits die Neigung, sich als „Versuchskaninchen" behandeln zu lassen, ist nicht eben sehr stark ausgeprägt. Darüber hinaus steht das soziale Handeln i m Rahmen eines Experiments sowohl für denjenigen, der sich für ein Experiment zur Verfügung stellt, als auch für den Forscher immer unter sozialen Normen und damit unter ethischen Gesichtspunkten, die notwendig das Aktionsfeld einschränken. So sind alle Experimente, die dem Experimentteilnehmer körperlich oder moralisch Schaden zufügen könnten, zu unterlassen. Auch'Täuschungen sind höchstens i n einem geringen Umfang zugelassen. Etwas anders liegen die Dinge, wenn die Versuchspersonen sich für ein Experiment freiwillig zur Verfügung stellen. Die Möglichkeiten des Experimentierens sind hier etwas erweitert, kaum zu überwindende Grenzen bleiben aber auch hier bestehen. Außerdem besitzt eine freiwillige Teilnahme an soziologischen Experimenten andere Nachteile. Durch die mögliche Selbstauswahl können etwa bereits bestimmte Haltungen präformiert worden sein. Ferner kann der Fall eintreten, daß die Teilnehmer bewußt oder unbewußt ein Interesse daran haben, daß das Ergebnis i n der einen oder i n der anderen Richtung ausfällt. A l l e bisher behandelten Schwierigkeiten betreifen fast ausschließlich die projektiven Experimente und hier wiederum überwiegend die simultanen Formen. Der zuletzt zu nennende Problembereich erstreckt sich aber i n gleicher Weise auf das Ex-post-facto-Experiment. Dieser besteht i m erheblichen Einfluß des Zeitfaktors auf die experimentellen Anordnungen. Die Experimentier- und die Kontrollgruppe können sich bei längerer Zeitdauer gegenseitig beeinflussen. Ferner spielt der zu erforschende soziale Wandel selbst i n das sozialwissenschaftliche Experiment oft i n erheblichem Maße hinein. Aber selbst wenn keine bemerkenswerten Einflüsse durch den sozialen Wandel eintreten, sind die Experimentier- und Kontrollsituationen doch bei längerer Zeitdauer fast immer von der sozialen Mobilität bedroht, sei es daß die Experimentteilnehmer an andere Orte ziehen, sterben oder auch einfach nicht mehr i n den Experimentierräumen erscheinen.

II. Kritik 1. Kausalzusammenhang

a) Kausalstudie

und Analyse

Erklärtes Ziel der experimentellen Vorgehensweise ist die Prüfung von vermuteten Kausalzusammenhängen. Die Aufstellung einer Kausalhypothese wurde daher als Begriffsbestandteil des Experiments formuliert. Das Ergebnis einer experimentellen Untersuchung enthält somit ein Urteil darüber, ob der geprüfte Kausalzusammenhang besteht oder nicht und inwieweit diese Aussage als zuverlässig angesehen werden kann. Dieser laut Definition unentbehrliche Bestandteil des Experiments kommt jedoch i n vielen Untersuchungen nicht zum Ausdruck, die von der gegenwärtigen Experimenttheorie durchaus als Experiment bezeichnet, j a paradigmatisch ausführlich behandelt werden. I n diesen Fällen könnte es natürlich möglich sein, daß die Tatsache der Kausalstudie nur nicht deutlich genug herausgearbeitet wurde, daß jedoch implizit die Prüfung eines Kausalzusammenhangs vorgenommen wurde. Es ist aber auch denkbar, daß diese Studien eine andere Logik verfolgen als das Experiment. U m diesen Sachverhalt zu entscheiden, ist es nötig, einige der i n Frage stehenden Experimente genauer darzulegen. Außer Experimenten können auch andere Untersuchungen als Kausalstudien bezeichnet werden, z.B. eine Erforschung der Ursache eines Streiks, wenn sie nur Dokumente benutzt. Z u erwähnen ist zunächst ein von Fisher entwickeltes und 1935 zuerst publiziertes „hypothetisches Experiment" 1 . Es w i r d von Greenwood herangezogen und ausführlich behandelt i m Zusammenhang der Beschreibung der Kontrolle durch maximale Zufallsstreuung 2 . Dieses Experiment hat folgenden Inhalt: Eine Frau behauptet, sie könne am Geschmack einer Tasse Tee beim Trinken unterscheiden, ob Milch oder Tee zuerst i n die Tasse gegossen worden sei. Das Experiment, das ihre Behauptung überprüfen soll, besteht darin, daß von acht Tassen Tee je vier auf die eine und je vier auf die andere Weise zubereitet werden. Man sagt der Frau, w o r i n der Test besteht, daß sie von acht Tassen zu probieren habe, von denen je vier von jeder Zubereitungsart seien und 1 2

Fisher: [Design of experiments], S. 11 ff. Greenwood: [Experimental sociology], S. 87 f.

1. Kausalzusammenhang

33

daß sie aus der zufälligen Reihenfolge die Tassen i n zwei Gruppen zu je vier aufzuteilen habe. Fisher schließt an diesen konstruierten F a l l eine Reihe von Überlegungen an, die auf Grund der Wahrscheinlichkeitstheorie zu einem statistischen Signifikanztest führen. Geprüft w i r d die Nullhypothese, die er als zentralen Bestandteil des Experiments ansieht. Sie besteht aus der Annahme, daß ein bestimmter Faktor keine W i r k u n g besitzt, hier daß die Frau nicht häufiger richtig urteilt als sie entsprechend dem Zufall t u n würde 3 . Diese Hypothese kann durch die Ergebnisse widerlegt werden, während eine positive Formulierung nicht statistisch zu sichern ist. Fisher versucht einen Kausalzusammenhang aufzustellen, der von der Reihenfolge des Eingießens ausgeht und seine (mögliche) W i r k u n g i m Urteil der untersuchten Person hat 4 . Aus dem gleichen Grunde versucht er die Faktoren, die den Geschmack bestimmen könnten, festzulegen und bei allen Tassen gleichzusetzen. Nach Fisher genügt es nicht, darauf zu bestehen, daß alle Tassen i n jeder Hinsicht m i t Ausnahme des zu prüfenden Faktors gleich sind 5 . Denn das ist unmöglich und gilt entsprechend für alle anderen Formen des Experiments. Die unkontrollierten Faktoren, die das Ergebnis beeinflussen, sind stets unzählig. I n diesem Fall wären u. a. zu nennen: die Dicke und Glätte der Tassen, Differenzen i n der hinzugefügten Milchmenge oder Teemenge und unterschiedliche Wärme der Tassen beim Probieren. Als Mittel, u m diesen Wirkungen zu begegnen, schlägt Fisher vor, eine maximale Zufallsstreuung vorzunehmen. Greenwood kommt bei der Darstellung dieses Experiments zu dem Schluß, daß Fishers Technik der maximalen Zufallsstreuung die experimentelle Sozialwissenschaft von dem hoffnungslosen Schicksal befreit habe, zu dem sie Mill verbannt hatte 6 . Ferner beruft sich Pages ausführlich auf Fisher und das genannte Beispiel, das von i h m noch weiter ausgebaut w i r d 7 . Die verschiedenen Getränkesorten verhalten sich nach i h m „wie verschiedene experimentelle ,Ein Wirkungen 4 " und bilden jeweils die unabhängige Variable. Die abhängige Variable liegt i n der richtigen oder falschen Wahl, so daß die zutreffende oder unzutreffende Wahl als Wirkung der Getränkesorte erscheint. 3 „Every experiment may be said to exist only i n order to give the facts a chance of disproving the n u l l hypothesis", S. 16. 4 Ebd., S. 15 f. Die Tatsache, daß es sich hier u m ein wahrscheinlichkeitstheoretisches Experiment handelt, k a n n i n diesem Zusammenhang außer Betracht bleiben. s Ebd., S. 18. 6 Greenwood: [Experimental sociology], S. 91. Nämlich die experimentelle Methode nicht nützen zu können, w e i l es i n der Sozialwissenschaft keine zwei genau gleichen Ereignisse gibt ( M i l l : [Logic], Buch V I , Kap. 7, 2). 7 Pages: [Experiment i n der Soziologie], S. 432 ff.

3 Siebel

II. Kritik

34

Diese Überlegungen sind bei dem von Fisher vorgetragenen Forschungsplan jedoch i m wesentlichen müßig. Wenn die hypothetische Ursache i n den Getränken läge, so müßte die Forschungshypothese etwa lauten: „Eine Tasse Tee m i t beigemischter Milch kann Ursache dafür sein, daß die Wirkung i n der Erkenntnis eines Menschen besteht, i n welcher Form die Beimischung erfolgte." Daß hier kein Kausalbezug vorliegt, wie er i n einem Experiment zu prüfen wäre, sondern ein Erkenntnisvorgang, leuchtet ein, auch wenn man der Hypothese vielleicht eine andere Form geben würde. Andernfalls müßte grundsätzlich gefragt werden, ob ein Gegenstand dadurch, daß er erkannt wird, ein UrsacheWirkungs-Verhältnis begründet, das einem Experiment ausgesetzt werden kann. Auch die Überlegungen über die störenden Faktoren gehören kaum i n diesen Forschungsansatz. Das eigentlich zu Grunde liegende Forschungsziel oder die Hypothese enthält bereits eine Vorwegnahme dieser Faktoren. Sowohl die Person, die eine Behauptung über ihre geschmacklichen Fähigkeiten aufstellt als auch derjenige, der eine solche Behauptung prüfen w i l l , muß davon ausgehen, daß diese Eigenschaft sich unter verschiedenen Bedingungen bewährt. D. h. unter allen Normalbedingungen, die üblicherweise beim Teetrinken gelten, muß sich die behauptete Eigenschaft durchsetzen. Das ist möglich, w e i l es sich hier nicht u m eine deterministisch bestimmte Reaktion auf verschiedenartige Bedingungen handelt, sondern u m zielgerichtetes Handeln, das auch unter andersartigen Bedingungen bestimmte gleiche Sachverhalte erkennen läßt. Wäre diese Eigenschaft nicht als unter den Normalbedingungen des Teetrinkens wirksam verstanden worden, so hätte sie genauer definiert werden müssen, etwa: „ . . .behauptet, fähig zur Unterscheidung zu sein, wenn die Tasse aus Porzellan m i t einer Randstärke von höchstens x Zentimeter ist" oder „ . . . die Flüssigkeit eine Wärme von zwischen x und y Grad besitzt" usw. Eine solche oder ähnliche, evtl. noch genauere Definition lag aber weder als Behauptung detf Versuchsperson noch als Forschungshypothese vor. Vielmehr w a r die Versuchsanordnung darauf ausgerichtet festzustellen, ob eine Person eine bestimmte Eigenschaft besitzt oder nicht. Ähnliche Überlegungen gelten gegenüber einem zweiten von Fisher dargestellten Experiment 8 , das ebenfalls von Greenwood zur Begründung seiner Experimenttheorie übernommen wurde 9 . Fisher greift hier eine von Darwin durchgeführte Untersuchung auf 1 0 . D a r w i n versuchte nachzuweisen, daß selbstbefruchtete Pflanzen den fremdbefruchteten 8

Ebd., S. 27 ff. [Experimental sociology], S. 88. 10 Charles Darwin: The effects of cross and selffertilisation i n the vegetable kingdom, 2. Aufl., London 1878, besonders Kap. 1. 9

1. Kausalzusammenhang

35

Pflanzen bei bestimmten Pflanzenarten i m Größenwachstum unterlegen sind. Er pflanzte i n verschiedene Töpfe jeweils eine gleiche Anzahl von aus Selbstbefruchtung und aus Fremdbefruchtung stammenden Samen. Beide Arten von Samen wurden deshalb i n einen Topf gepflanzt, w e i l die bedeutsamen Faktoren wie Bodenfruchtbarkeit, Beleuchtung und Feuchtigkeit konstant gehalten werden sollten. Von Fisher w i r d n u n kritisiert, daß D a r w i n bei der Auswahl der Plätze für die einzelnen Pflanzen keine maximale Zufallsstreuung hergestellt habe 1 1 , denn auf den verschiedenen Plätzen innerhalb eines Topfes könnten die einzelnen Bedingungen eine verschiedene Stärke entfalten. Auch bei dieser Versuchsanordnung ist die Frage zu stellen, wo hier ein Kausalzusammenhang zu suchen ist und damit, w o r i n die zu prüfende Ursache liegt. Als die W i r k u n g beeinflussende Faktoren können Bodenqualität, Feuchtigkeit, Sonnenbestrahlung u. a. genannt werden. Unter diesen und ähnlichen Faktoren liegt jedoch nicht die hypothetische Ursache. Diese könnte i n der A r t der Pflanzen begründet liegen. Dann wäre etwa die Fremdbefruchtung als zu prüfender Faktor anzusehen. N u n ist aber die Tatsache der Fremdbefruchtung i n keiner Weise von der zu untersuchenden Situation ablösbar. Die hypothetische Ursache ist also bereits zu Beginn der Untersuchung Bestandteil der Situation. Genau genommen ist aber j a nicht die Fremdbefruchtung Gegenstand der Untersuchung, sondern es sind die fremdbefruchteten Pflanzen, also Pflanzen m i t einer bestimmten Eigenschaft. Wäre aber die Fremdbefruchtung Ursache, so wäre zu fragen, was die Wirkung ist. Liegt diese i m Größenwachstum, so fallen Effekt und Kausalfaktor i n der Pflanze zusammen. Beide müssen aber voneinander unabhängig sein, sonst läßt sich ein Kausalbezug nicht feststellen. D. h. der zu prüfende Faktor kann erst zu Beginn eines Experiments i n die Experimentiersituation eingeführt werden. Sonst ist es absolut unentscheidbar, auf welchen Faktor eine W i r k u n g zurückgeht. I m Vergleich m i t der eben dargelegten Versuchsanordnung zur Prüfung der Eigenschaft der Teetrinkerin ergeben sich jedoch bei dieser Untersuchung einige bemerkenswerte Unterschiede. Während dort eine zielgerichtete Eigenschaft geprüft wurde, auf die kaum relevante Faktoren einwirken, wenn man von der gerade gegebenen körperlichen Konstitution (Krankheiten u. a.) absieht, w i r k e n auf diese Eigenschaft eine Reihe relevanter Faktoren ein. Ferner w i r d i m Falle der Pflanzen die Eigenschaft erst i n einem längeren Zeitabschnitt deutlich, während bei der Teetrinkerin die Eigenschaft jederzeit aktualisiert werden kann. Dieser Sachverhalt führt dazu, bei der botanischen Untersuchung die 11

3*

[Design of experiments], S. 41 ff.

36

II. Kritik

relevanten Faktoren, die das Ergebnis beeinflussen, zu kontrollieren. Eine solche Kontrolle ist nicht zuletzt deswegen nötig, weil es sich bei dieser Untersuchung nicht nur um ein Versuchsobjekt handelt, sondern um mehrere. Die fremdbefruchteten Pflanzen stellen also nicht eine Kontrollgruppe zu den selbstbefruchteten Pflanzen dar oder umgekehrt, sondern beide sind einem Vergleich unterliegende Gegenstände verschiedener A r t . Daß es i n dieser Versuchsanordnung keine Kontrollgruppe gibt, zeigt sich auch bereits daran, daß beide Gruppen nicht voneinander räumlich getrennt sind. Dies ist aber nach allgemeiner Ansicht ein Grunderfordernis für die experimentelle Logik. Denn ohne Trennung wären beide Gruppen i n jeder Hinsicht den gleichen Faktoren, also auch der hypothetischen Ursache ausgesetzt; m i t anderen Worten, Experimentier- und Kontrollsituation wären dieselbe. Die Überlegungen über das Pflanzenexperiment gingen bisher von dem Zeitpunkt aus, an dem die verschiedenen Samen i n die Erde eingepflanzt wurden. Tatsächlich war dies aber i n der Forschung Darwins, die sich über elf Jahre erstreckte, nur der letzte Abschnitt. Es könnte daher gefragt werden, ob nicht doch noch ein Kausalzusammenhang herausgefunden werden könnte, wenn man weiter i m Zeitablauf zurückgeht und damit das gesamte Vorgehen bis zur Intention erfaßt. Zunächst bestand Darwins Aufgabe darin, Samen zu gewinnen, die i n möglichst vielen Hinsichten übereinstimmten m i t Ausnahme der A r t der Befruchtung. Das versuchte er dadurch zu erreichen, daß die Samen von den gleichen Elternpflanzen genommen wurden. Die eine Hälfte der Samen wurde durch Selbstbefruchtung, die andere durch Fremdbefruchtung hervorgebracht. Die Gewinnung der verschiedenen Samenarten könnte nun als die Gewinnung des unabhängigen Faktors, der hypothetischen Ursache angesehen werden. Dann wäre das aber nur eine Vorbedingung für die Aufstellung einer experimentellen Versuchsanordnung. Die aufgezeigten Schwierigkeiten ändern sich bei einer solchen Betrachtungsweise nicht. Läßt man schließlich die Experimentiersituation bereits bei dem Aussuchen der geeigneten Elternpflanzen beginnen, so entsteht dieser Interpretation ein schwerwiegendes Hindernis dadurch, daß m i t der Gewinnung der Samen sich die Situation so grundlegend gewandelt hat, daß eine Beendung des Experiments angenommen werden muß. Sind nämlich neue Faktoren m i t einer gewissen Konstanz geschaffen worden, so reicht die ursprüngliche Definition der Situation nicht mehr aus, die Reaktionen und Zusammenhänge werden dadurch u. U. vollständig um-

1. Kausalzusammenhang

37

strukturiert. Eine solche Neubildung von Faktoren (Gegenständen) findet sich besonders häufig i m chemischen Versuch, wenn eine neue Verbindung zustande gekommen ist, die völlig andere Qualitäten besitzen kann, als sie die Ausgangsstoffe hatten. Auch m i t der Entstehung neuer Samen muß eine Neubildung nicht nur von Faktoren, sondern der Situation als ganzer angenommen werden, die es nicht erlaubt, das Experiment noch als weiterdauernd anzusehen. Allerdings kann an ein solches Ergebnis ein weiteres Experiment angeschlossen werden. Wegen dieses Effektes der Neubildung läßt sich bereits kaum annehmen, daß die gesamte Untersuchung ein Experiment darstellte. Darüber hinaus fehlt unter diesemBlickwinkel auch eindeutig die hypothetische Ursache. Als letztes Experiment ähnlicher A r t ist eine sozialwissenschaftliche Untersuchung zu nennen, die von Coch und French durchgeführt wurde 1 2 . Bei dieser Untersuchung ging es u m das praktische Problem einer Betriebsleitung, wie man am besten erforderliche Neuerungen i m Betrieb einführen solle, u m den üblichen Leistungsabfall i n der Arbeitstätigkeit zu vermeiden. Es wurden drei experimentelle Gruppen und eine Kontrollgruppe einbezogen, die sich i n bezug auf den Faktor A r beitsleistung vor der Einführung der Neuerung, i n bezug auf den Grad des Wandels der Arbeitsbedingungen und i n bezug auf die Stärke des „Wir-Gefühls" gleichsetzen ließen. Die erste Experimentiergruppe wählt einige Arbeiter aus ihrer Mitte, u m die Änderungen, die an den Arbeitsplätzen vorzunehmen waren, m i t Führungskräften zu besprechen. Die anderen beiden Experimentiergruppen nahmen vollständig an diesen Gesprächen teil. Die Kontrollgruppe wurde auf die übliche Weise über die bevorstehenden Änderungen informiert. Es zeigte sich, daß die Gruppe m i t vollständiger Teilnahme den geringsten, die Kontrollgruppe den größten Leistungsabfall nach Einführung der Neuerung aufwies. Die Ursache könnte i n diesem Fall entweder i n der A r t und Weise der Information oder i n der Einführung der Neuerung liegen. Gegen die erste Annahme spricht, daß die Neuerung dann nicht mehr interpretiert werden kann. I n der Neuerung liegt die W i r k u n g nicht. Diese kann nur i n der Gruppenleistung bestehen. Auch als hinzukommender weiterer Faktor kann die Neuerung nicht angesehen werden. Dafür ist die Neuerung für das gegebene Forschungsziel von zu großer Bedeutung. Die jeweilige Information muß also bereits als Bestandteil der entsprechenden Gruppe angesehen werden, die bei Einführung der Neue12 Lester Coch and John R. P. French: Overcoming resistance to change, i n : H u m a n Relations, V o l . 1 (1947/48), S. 512—532; vgl. auch John R. P. French: Field experiments — Changing group productivity, in: J . G . M i l l e r (Hrsg.): [Experiments], S. 88 ff.

38

II. Kritik

rung von der Situation (Gruppe) nicht mehr getrennt werden kann. Gegen die zweite Annahme, nämlich daß die Ursache i n der Neuerung, die Wirkung i n der Leistung liegt, spricht, daß das Experiment dann überflüssig wäre. Denn diese Eigenschaft der Neuerung war bereits bekannt. Das Forschungsziel bestand vielmehr darin, verschiedene Gruppenstrukturen daraufhin zu untersuchen, welche eine bestimmte Eigenschaft am intensivsten habe. Damit ergibt sich aber eindeutig, daß es sich bei dieser Forschung nicht u m eine Kausalstudie handeln kann. Die Logik dieser sozialwissenschaftlichen Studie stimmt weitgehend mit dem beschriebenen botanischen Experiment Darwins überein. U m sich das zu verdeutlichen, braucht man nur die A r t der Befruchtung m i t der A r t der Information, die Einpflanzung m i t der Neuerung und den Ertrag m i t der Leistung gleichzusetzen 13 . Die beschriebenen drei als Experimente bezeichneten Untersuchungen sind hier nicht wegen ihres Forschungsziels, ihres Aufbaus oder ihrer Durchführung zu kritisieren. Vielmehr sollte an diesen Beispielen demonstriert werden, daß diese keine Kausalstudien sind und damit auch nicht unter den definierten Begriff des Experiments fallen können. Wenn nun die Logik des Experiments offenbar i n diesen Forschungsansätzen nicht enthalten ist, so kann doch noch geprüft werden, ob i n ihnen nicht eine eigene Logik liegt. Das ist i n der Tat der Fall. Die drei dargelegten Beispiele besitzen eine Forschungsintention, die sehr häufig m i t der des Experiments verwechselt w i r d und deswegen unbedingt bereits an dieser Stelle von der des Experiments abzugrenzen ist. Die Aufgabe dieser Forschungsansätze ist nicht, einen Kausalzusammenhang freizulegen, der allgemeine begriffliche Aussagen erlauben würde, sondern i h r Ziel ist der Nachweis der Existenz oder Nicht-Existenz bestimmter, bereits bekannter Eigenschaften beim Forschungsobjekt — bei Dingen oder Personen. Statt des Nachweises von Eigenschaften können auch Gegenstände als solche identifiziert werden. Diese Vorgehensweise soll Analyse genannt werden. Die Absicht der erstgenannten Untersuchung war auf einen einzigen Fall beschränkt, nämlich die Frau, die die Behauptung über ihre geschmacklichen Fähigkeiten aufgestellt hatte. Z u prüfen war allein diese individuelle Eigenschaft. Eine Verallgemeinerung auf andere Fälle, 13 Als i n ihrer Logik ähnlich aufgebaute Untersuchung können u. a. genannt werden: A l e x Bavelas: Communication patterns i n taskoriented groups, in: D. Lerner, H . D . Laswell (Hrsg.): [Policy sciences], S. 193—202; ferner Raymond H. van Zelst: Validation of a sociometric regrouping procedure, i n : Journal of A b n o r m a l and Social Psychology, Vol.47 (1952), S. 299—301; u n d Harold Guetzkow u n d Anne E. Bowes: The development of organisations i n a laboratory, in: Management Science, Vol. 3 (1957), S. 380—402.

1. Kausalzusammenhang

39

Situationen, wie bei der Erfassung eines Kausalzusammenhangs, mußte hier ausgeschlossen werden. Das zweitgenannte Beispiel enthält die Forschungsintention, die Eigenschaften zweier verschiedener Sorten von Getreide zu entdecken bzw. zu demonstrieren. Hier ist eine Verallgemeinerung des Ergebnisses möglich innerhalb bestimmter Wahrscheinlichkeiten. Die drittgenannte Untersuchung endlich bezweckte, bestimmte Eigenschaften von verschiedenen Arten von Arbeitsgruppen unter Beweis zu stellen. Auch diese Ergebnisse lassen sich i n einem gewissen Umfang verallgemeinern. Bei der Trennung von Analyse und Experiment handelt es sich u m eine für die Logik des Experiments grundlegende Unterscheidung. Beide Vorgehensweisen sind i n ihrem Ziel von anderer A r t ; dementsprechend untersucht der wissenschaftliche Forschungsgang i n beiden Fällen auch andere Gesichtspunkte. Dennoch gleichen sich Experiment und experimentelle Analyse i n einigen besonders auffälligen Hinsichten. Es ist daher nicht verwunderlich, daß eine klare Trennung zwischen beiden Sachverhalten bisher kaum vorgenommen wurde, obwohl sich aus der Vermengung beider einige Widersprüche ergeben. Der Begriff der „Analyse" kann i n einem weiteren Wortsinn verstanden werden, die „experimentelle Analyse" ist dann eine besonders ausgeprägte Unterform der Analyse. Analyse bedeutet den Erkenntnisakt oder die wissenschaftliche Vorgehensweise, die einen bestimmten, konkret gegebenen Sachverhalt i m Hinblick auf seine Bestandteile zerlegt. Voraussetzung hierbei ist, daß die Begriffe für die einzelnen Bestandteile vor Beginn der Analyse bekannt sind und damit auch die erkennbaren Eigenschaften festliegen. Erscheinen diese Eigenschaften dem Beobachter i m Sachverhalt, so kann er die Existenz der begrifflich festgelegten Bestandteile damit nachweisen. Das Ergebnis einer solchen Untersuchung ist die Klarlegung des inneren Gefüges des fraglichen konkreten Sachverhaltes i n seinen Faktoren bzw. deren strukturellen Eigenschaften oder die Heraushebung eines bestimmten Gegenstandes aus dem Sachverhalt (Identifizierung). Es ist einleuchtend, daß eine solche Analyse auf unmittelbare Einsichtigkeit des Sachverhaltes h i n angelegt ist, d.h. sie kann die Eigenschaften des i m Sachverhalt (Situation) anwesenden Gegenstandes erfassen, die unmittelbar wahrnehmbar sind, sei es durch das Auge, sei es durch Geruch, Gefühl usw. Diese für jeden erkennbaren und am häufigsten aufleuchtenden „unverdeckten Eigenschaften" werden auch meistens zur Definition des Gegenstandes verwendet. Jeder Gegenstand und damit jeder Sachverhalt hat n u n aber auch eine Anzahl von Eigenschaften, die verdeckt sind, sei es, daß sie nur zu bestimmten Zeiten, sei es, daß sie nur unter besonderen

40

II. Kritik

Bedingungen, sei es, daß sie überhaupt nicht unmittelbar wahrnehmbar sind. Sie lassen sich erst dadurch erkennen, daß sie auf eine erkennbare Eigenschaft zurückgeführt werden. So ist z. B. große Hitze und große Kälte nicht mehr unmittelbar erkennbar, sondern nur durch ein A n zeigegerät. Darüber hinaus ist auch die Genauigkeit der unmittelbaren Erkenntnis oft nur gering, so daß auch die Genauigkeit als „verdeckte Eigenschaft" verstanden werden kann. I n der experimentellen Analyse versucht man, nun auch die „verdeckten Eigenschaften" und über die „verdeckten Eigenschaften" die Träger dieser Eigenschaften (Faktoren, Gegenstände) zu erfassen. Sie dient also besonders der Identifizierung von Gegenständen, Faktoren oder Eigenschaften. Man bringt z. B. den Gegenstand unter spezifische Bedingungen, unter denen die Eigenschaft, wenn sie vorhanden ist, auftreten muß. Oder man setzt irgendein Medium ein, daß als Zeichen oder Repräsentant für die Eigenschaft w i r k t , wie man weiß. Aus seiner Reaktion läßt sich dann erkennen, ob die Eigenschaft vorhanden ist und u. U. auch, i n welcher Stärke sie vorhanden ist. So weiß man aus der Reaktion des Lackmuspapiers, ob es sich beim Gegenstand u m eine Lauge oder eine Säure handelt. M i t Hilfe eines Voltanzeigegeräts läßt sich feststellen, ob ein Gegenstand unter Spannung steht. Auch bei der experimentellen Analyse muß also vorher bereits bekannt sein, aus welcher Eigenschaft (Symptom, Indikator) oder aus welcher Eigenschaftenkombination auf einen bestimmten Faktor und (oder) auf seine Stärke geschlossen werden kann. I n diesem Punkt, der Erfassung verdeckter Eigenschaften, stimmen experimentelle Analyse und Experiment überein. Beide weisen daher die „künstlichen" Versuchsanordnungen auf. D. h. i n beiden Fällen w i r d der zu untersuchende Gegenstand i n selten oder gar nicht i n der Natur vorkommende Situationen gebracht, u m seine verdeckten Eigenschaften feststellen zu können. Z u dieser äußeren Übereinstimmung i n der Versuchsanordnung t r i t t außerdem noch die Ähnlichkeit darin, daß vor Beginn der Untersuchung Hypothesen aufgestellt werden, die die Richtung für die Vorgehensweise angeben. Die Logik der Vorgehensweise ist jedoch bei der experimentellen Analyse eine ganz andere als beim Forschungsexperiment. I n der experimentellen Analyse geht es darum, festzustellen, welche A r t Faktoren i n einer bestimmten konkreten Situation, die i n sich nicht unmittelbar einsichtig ist, vorhanden sind oder speziell, ob ein bestimmter Faktor i n einer solchen Situation enthalten ist oder welche Stärke der Faktor besitzt. U m diese Faktoren oder eine ihrer Eigenschaften als i n dieser Situation existent nachzuweisen, muß notwendig das Wissen über die Eigenschaft (Untereigen-

1. Kausalzusammenhang

41

schaft) des Faktors, die als Zeichen für dessen Anwesenheit gelten kann, bereits vorhanden sein. Die Analyse ordnet also immer einen konkreten Einzelfall bestimmten bereits vorher formulierten Kategorien unter. Man kann statt dessen auch sagen, die experimentelle Analyse stellt fest, ob bestimmte Zustände, die an sich bekannt sind, i n einer gegebenen Situation herrschen. Wenn der angenommene Zustand i n der Situation herrscht, muß er unter bestimmten bekannten Bedingungen sich als solcher zu erkennen geben. Die vor Beginn der Untersuchung aufzustellende Hypothese geht demnach dahin, die Eigenschaften, die möglicherweise i n der zu prüfenden Situation enthalten sind, aufzuführen und danach die Bedingungen für die Situation oder Teile davon so zu setzen, daß sich die Anzeige-Eigenschaft, wenn der Faktor vorhanden ist, zeigt. Die Anwesenheit des vermuteten Faktors w i r d also auf Grund seiner bekannten, kennzeichnenden Eigenschaften bestätigt. I m Unterschied zur experimentellen Analyse geht es beim Forschungsexperiment nicht darum, einen Sachverhalt i n die i n i h m wirkenden — an sich bekannten — Faktoren zu zerlegen, sondern darum, bei einem Gegenstand zu erweisen, ob er als ganzer eine bestimmte Eigenschaft i m Verhältnis zu anderen Gegenständen besitzt. Daraus folgt, daß i n einem Experiment die i n der Situation vorhandenen bedeutsamen Faktoren einer strengen Kontrolle unterworfen werden müssen. Sonst ließe sich die Wirkung ja ebensogut auf sie zurückführen. Dagegen ist eine solche Kontrolle i n der Analyse weitgehend überflüssig. Denn hier können nur solche Eigenschaften (bzw. Kombinationen davon) als Indikatoren verwendet werden, von denen man sicher weiß, daß sie nur bei einem bestimmten Gegenstand und bei keinem anderen vorkommen. Wenn nun Forschungsexperiment und experimentelle Analyse auch eine zu unterscheidende Logik aufweisen, so sind sie doch, wenn man den wissenschaftlichen Forschungsprozeß ins Auge faßt, nicht unabhängig voneinander. Dieses Verhältnis ist kompliziert und kann erst i m Zusammenhang der wissenschaftstheoretischen Grundlegung genauer behandelt werden. N u r so viel ist bereits jetzt zu sagen, das Experiment bedarf der Analyse — wenn auch nicht immer der experimentellen Analyse. So ist vor Beginn des Experiments die Experimentiersituation zu analysieren i n Richtung auf die bedeutsamen Faktoren. Eine Analyse w i r d auch vorgenommen zu Ende des Experiments, u m Kontroll- und Experimentiersituation zu vergleichen und somit die W i r k u n g des zu prüfenden Faktors zu erfassen. Somit dürfte klar geworden sein, daß die experimentelle Analyse kein Experiment darstellt, w e i l sie keinen Kausalzusammenhang verfolgt. Kausalstudie und Analyse besitzen je eine andere Logik. Eine Verwechslung beider kann zu Konsequenzen führen, die ein sinnvolles Ergebnis einer Untersuchung i n Frage stellen.

42

II. Kritik

b) Kausalstudie

und Vergleich

Der Aufgabe des Experiments, vermutete Kausalzusammenhänge zu prüfen, werden nicht nur die Forschungen nicht gerecht, die experimentelle Analysen genannt wurden. Es gibt noch eine weitere A r t von Untersuchungen, die dieser Anforderung nicht entsprechen, dennoch aber als Experiment bezeichnet werden. Auch bei diesen Forschungen ist genau festzustellen, ob bei ihnen nicht vielleicht doch von Kausalstudien gesprochen werden kann. Sollte es nicht der Fall sein, so ist wiederum zu prüfen, ob i n diesen Forschungsansätzen eine eigene Logik zu finden ist. I n diesem Zusammenhang soll eine von Festinger durchgeführte Studie 1 4 kritisch daraufhin beleuchtet werden, ob es sich dabei, wie behauptet 1 5 , u m ein Experiment handelt. Das Untersuchungsziel bestand darin, zu erkunden, welche Wirkung die Kenntnis der religiösen Gruppenzugehörigkeit auf das Wahlverhalten ausübt. Der Inhalt der Untersuchung bestand i n folgendem: Studentinnen verschiedener Colleges aus dem Raum Boston wurden nach Freiwilligenmeldung zur Teilnahme an einem dem Inhalt nach unbekannten Experiment ausgewählt. Die Studentinnen waren zur einen Hälfte katholisch, zur anderen jüdisch. Es wurden drei verschiedene Anordnungen aufgestellt:'Bildung von kleinen Experimentiergruppen, von kleinen Kontrollgruppen und von einer großen Experimentiergruppe. Aufgabe aller dieser Gruppen war die Betätigung als Klubversammlung m i t der Wahl eines Vorstandes. Die Grupenversammlungen wurden so eingerichtet, daß die teilnehmenden Studentinnen einander zunächst fremd waren, u m den Faktor der Bekanntheit auszuschalten. Ferner versuchte man zu verhindern, daß der Faktor der persönlichen Sympathie einen Einfluß ausübte, und zwar durch bezahlte Teilnehmerinnen. Bei der ersten Anordnung wurden zwölf Gruppen zu je zehn Studentinnen gebildet. Den Teilnehmern erklärte man, jede Studentin komme aus einem anderen i m Gebiet von Boston liegenden College. Tatsächlich kamen bei den einzelnen Gruppen nur jeweils sechs Studentinnen aus verschiedenen Colleges, davon immer drei Katholikinnen und drei Jüdinnen. Die anderen vier Mädchen waren bezahlte Teilnehmerinnen, die vorher unterrichtet worden waren, wie sie sich verhalten sollten. Während der ersten Hälfte der Zusammenkunft verkehrten die Teilnehmer so miteinander, daß sie Nummern verwendeten, die den einzelnen zugeteilt waren, damit keiner den Namen oder das religiöse Bekenntnis eines anderen Teilnehmers i n der Gruppe kennenlernen konnte. Unter dieser Voraussetzung wurden zwei Wahlen durchgeführt. Nachdem die erste Hälfte der Zusammenkunft abgelaufen war, wurden

1. Kausalzusammenhang

43

unter einem Vorwand die Namen und die religiösen Bekenntnisse der Teilnehmer auf eine Wandtafel jeweils neben die zugeteilten Nummern geschrieben. Dann schritt man zu weiteren Wahlen. Von den bezahlten Teilnehmerinnen bezeichneten sich jeweils zwei als katholisch und zwei als jüdisch. Von Gruppe zu Gruppe wechselten diese die Angaben über ihre Kpnfession. A u f diese Weise wurde festgestellt, wieviel Stimmen die gleichen Personen erhielten, wenn man sie einmal für Juden und ein anderes M a l für Katholiken hielt. Es stellte sich heraus, daß vor der Bekanntgabe der Religionszugehörigkeit sowohl die katholischen als auch die jüdischen Mädchen ihre Stimmen gleichmäßig auf Juden und Katholiken verteilten. Nachdem die Teilnehmer aber die Religionszugehörigkeit erfahren hatten, gaben die katholischen Mädchen ihre Stimmen mehr katholischen Teilnehmerinnen als jüdischen, während die jüdischen Mädchen ihre Stimmen noch ziemlich gleichmäßig auf Juden und Katholiken aufteilten. I n den fünf kleinen Kontrollgruppen lief das gleiche Programm der Klubversammlungen ab, nur wurde i n diesen nicht die Religionszugehörigkeit bekanntgegeben. Die dritte Anordnung bestand i n einer großen Gruppe aus 48 Teilnehmern. Zehn Teilnehmer, darunter die bezahlten Teilnehmerinnen, saßen als zu wählende Personen je neunzehn Jüdinnen und Katholikinnen gegenüber. Bei dieser Anordnung wurden nur die zu wählenden, nicht aber die Wähler nach ihrer Religionszugehörigkeit identifiziert. Hier reagierten die jüdischen Mädchen wie i n den kleinen Experimentiergruppen die katholischen, d. h. sie wählten mehr Mädchen ihrer eigenen Religion. Zum Abschluß wurden alle Studentinnen über verschiedene Punkte interviewt. Festinger behauptet, daß die hypothetische Ursache, der zu prüfende Faktor, i n der Kenntnis der Religionszugehörigkeit liege. Als zu kontrollierende Faktoren werden die Kenntnis der Personen und die persönliche Sympathie genannt. Die Wirkung w i r d i m Wahlverhalten gesehen. Als Kontrollgruppen erscheinen Gruppen ohne Bekanntgabe der Religionszugehörigkeit. Trotz dieser auf den ersten Blick einleuchtenden Aufzählung, die alle wesentlichen Elemente eines Experiments zu enthalten scheint, muß i n diesem Fall eindeutig festgehalten werden, daß hier kein Experiment i m definierten Sinne vorliegt. 14 Leon Festinger: The role of group belongingness i n a voting situation, in: H u m a n Relations, Vol. 1 (1947), S. 154—180; ferner ders.: Laboratory experiments — The role of group belongingness, in: J . G . M i l l e r (Hrsg.): [Experiments], S. 31—46. 15 Festinger sagt über seine eigene Untersuchung: „a laboratory experiment w i t h a relatively h i g h degree of control and precision", [Laboratory experiments], S. 138.

44

II. Kritik

Zunächst fällt auf, daß sowohl der zu prüfende Faktor als auch die relevanten Faktoren besonderer A r t sind. Sie sind weder physische Gegenstände, noch sind sie Handlungsnormen. Die Kenntnis ist aber auch keine Eigenschaft eines Faktors, während die Sympathie, die jemand erweckt, als Eigenschaft dieser Person verstanden werden kann. Bei der Kenntnis handelt es sich auch nicht u m einen einzelnen Faktor. Wenn sie ein Faktor wäre, müßte sie i n einer Situation als Bezugspunkt des Handelns verbleiben und weiter Einfluß ausüben. Ist eine Kenntnis aber erlangt, so ist sie als wirkender „Faktor" durch die einmalige Wirkung aufgehoben. Vielmehr handelt es sich bei der Kenntnis um eine spezielle, bewußtseinsmäßige Anerkennung bestimmter Eigenschaften eines konkreten Faktors i n der Situation, nicht aber u m eine Eigenschaft der Situation selbst. Diese Eigenschaften des Faktors sind zunächst verdeckte Eigenschaften, die die i n der Situation anwesende Versuchsperson nicht ohne weiteres erkennen kann. Die Situation ist also für sie völlig anders strukturiert, bevor sie die Kenntnis über bestimmte Faktoren i n der Situation besitzt und nachdem sie die Kenntnis erhalten hat. Sie w i r d sich demnach anders verhalten, nachdem sie genauer über ihren Handlungsraum orientiert wurde. Ebenso w i r d für jemand eine ganz andere Situation eintreten, der ein Geschenkpaket erhalten hat und dann von jemand erfährt, es handle sich u m eine Höllenmaschine. Aus diesen Überlegungen ist zu folgern, daß m i t der Aufdeckung einer unbekannten Eigenschaft von Faktoren i n der Situation sich für die teilnehmenden Versuchspersonen der Handlungsraum und damit die Situation selbst ändert. Die Übermittlung der Kenntnis an die Versuchspersonen stellt also keinesfalls eine zu prüfende Ursache dar, sondern schafft eine neue, zweite Situation, die sich i n bemerkenswerter Weise von der zunächst geschaffenen unterscheidet. Auch die Kenntnis einer der beteiligten Personen durch eine andere stellt keinen selbständigen, zu kontrollierenden relevanten Faktor dar. Zweifellos hätte das Wissen über die anderen Personen das Handeln der einzelnen Personen besonders i n der noch relativ unstrukturierten Anfangssituation stärker beeinflußt. Deshalb wurden ja auch nur solche Personen vom Versuchsleiter ausgewählt, denen die anderen Teilnehmer unbekannt waren. Gegen die Vermutung eines bedeutsamen Faktors spricht bereits, daß dieser „Faktor" vollständig aus der Versuchssituation ferngehalten werden konnte. Aber selbst wenn die Kenntnis nicht „kontrolliert" worden wäre, hätte sie sich gar nicht bei allen Teilnehmern auffinden lassen. Wenn aber ein Faktor kontrolliert werden

1. Kausalzusammenhang

45

soll, so muß er sich bei allen i n der Situation anwesenden Personen kontrollieren lassen 16 . Wäre eine Person m i t Kenntnis einer anderen Versuchsperson unter die Versuchspersonen genommen worden, so wäre die Situation für die Versuchspersonen nicht identisch gewesen. Die Versuchspersonen hätten also i n anders strukturierten Handlungsräumen gehandelt, obwohl sie formal i n der gleichen (physischen) Situation anwesend waren. I m normalen sozialen Handeln sind solche Divergenzen nicht der Ausnahmefall, sondern fast die Regel. Auch wenn eine gegenseitige>Kenntnis der Versuchspersonen zu Beginn des ersten Versuchs i n keiner Hinsicht vorhanden war, so ist diese doch i n kurzer Zeit sehr gewachsen durch die A r t des beobachtbaren Verhaltens der einzelnen Personen. Aber diese Kenntnis über die Versuchsteilnehmer w i r d von Versuchsperson zu Versuchsperson verschieden intensiv sein. Auch dadurch entstehen Divergenzen i n der Interpretation der Situation. Wenn nun i n der Untersuchung Festingers nicht eine Kausalhypothese geprüft wurde, sondern verschiedene Situationen einander gegenübergestellt wurden, so ist zu fragen, w o r i n der Inhalt der Untersuchung eigentlich bestand, und welche Aussagen als Ergebnis der Untersuchung gemacht werden können. Da die Aufmerksamkeit auf eine vermeintlich bestehende Kausalbeziehung gerichtet wurde, ist die Interpretation der Ergebnisse nicht zufriedenstellend. So ist es unklar geblieben, ob w i r k lich die Religion eine ausschlaggebende Komponente für das Wahlverhalten ist. Abgesehen von der über das Aussehen und Verhalten der Versuchspersonen („persönliche Sympathie") gewonnenen Einsicht i n deren Eigenschaften, eine Einsicht die als gering angesehen werden muß, stand nur das Beurteilungsmerkmal der Religion zur Verfügung. A n Hand dieser beiden Merkmale mußte die Wahl vorgenommen werden. Es ist so kein Wunder, daß das einzige eindeutige (oder wenigstens klarer umrissene) Merkmal sich als Orientierungspunkt für das Handeln, sei es i n der einen oder i n der anderen Richtung, erwies. Wären andere Merkmale wie Mitgliedschaft i n Vereinen, Nationalität, soziale Schicht usw. allein über die Versuchspersonen i n der Situation bekannt gewesen, so hätten statt dessen diese das Handeln orientiert. Wären solche Merkmale aber zusätzlich bekannt gewesen, so wäre es eine offene Frage, ob die Religionszugehörigkeit überhaupt eine signifikante Rolle für die Entscheidung gespielt hätte. Jedenfalls hat die Untersuchung ergeben, daß das Handeln von der Kenntnis des Handlungsraumes und von befürchteten Rückwirkungen abhängig ist. 18 Festinger hat selbst die Problematik des Faktors „ K e n n t n i s " gesehen, aber nicht durchschaut. „ I t is probable that a variable such as whether or not the subjects know the religions affiliation of the other numbers is still not a fine or precise factor; it is probably . . . a Cluster of factors"; [Laboratory experiments], S. 139.

46

II. Kritik

Als weitere Untersuchung ähnlicher A r t soll die sehr bekannt gewordene Studie von Lewin, Lippitt und White kritisch herangezogen werden 1 7 . Diese Untersuchung befaßte sich m i t der W i r k u n g von demokratischer und autokratischer Gruppenführung auf Jungen bei einer organisierten Freizeitbeschäftigung. Bei Greenwood w i r d diese Studie als ein projektiv-simultanes Experiment bezeichnet 18 . Die Autoren veranlaßten die Zusammenfassung von Schulkindern i m A l t e r von zehn Jahren i n Klubs, die sich einmal wöchentlich trafen, u m Masken herzustellen. Besondere Sorgfalt wurde darauf verwandt, eine strenge Faktorenkontrolle unter den verschiedensten Gesichtspunkten zu erreichen. Dabei konnte auf eine große Zahl von Freiwilligenmeldungen zurückgegriffen werden. Die beiden geschaffenen Klubs hatten jeder einen erwachsenen Gruppenführer. Der Gruppenführer verhielt sich i n der einen Gruppe „autokratisch", indem er alle Entscheidungen allein traf, freie Gestaltungen und persönliche Meinungen unterdrückte, die Gruppenaktivität selbst plante und Befehle erteilte. I n der anderen Gruppe verhielt er sich „demokratisch" dadurch, daß er den Jungen half, Entscheidungen zu treffen, die von allen unterstützt wurden, die Gruppenaktivität zusammen m i t den Mitgliedern plante, ihnen Ratschläge erteilte und dabei beträchtliche persönliche Handlungsfreiheit beließ. Die Versuchsanordnung wurde so gestaltet, daß die Persönlichkeit des Führers keinen Einfluß ausübte. Beobachter konnten die verschiedenen Gruppen,,atmosphären" und ihre W i r k u n g auf die Kinder und die Gruppeneinheit feststellen. Die Beobachtung des Verhaltens der Gruppen zeigte, daß sich unter „autokratischer" Führung andere Verhaltensformen ausprägten als unter „demokratischer". Unter autokratischer Führung wiesen die Gruppenmitglieder geringere Leistungen auf, zeigten weniger Unternehmungslust und aggressiveres Verhalten untereinander und gegenüber dem Führer. Bei Abwesenheit des Führers fiel die autokratische Gruppe fast ganz auseinander, während die demokratische ihre A k t i v i t ä t fortsetzte. Die demokratische Gruppe versuchte, alle Mitglieder i n ihre Tätigkeit einzubeziehen, die autokratische dagegen machte ständig einen Sündenbock zum Gegenstand ihrer Angriffslust 1 9 . 17 K u r t Lewin, Ronald Lippitt und Ralph K . White: Patterns of aggressive behavior i n experimentally created „social climates", in: Journal of Social Psychology, Vol. 10 (1939), S. 271—299; ferner Ronald Lippitt: Field theory and experiment i n social psychology — Autocratic and democratic group atmospheres, i n : American Journal of Sociology, Vol. 45 (1939/40), S. 26—49; und ders.: A n experimental study of the effect of democratic and authoritarian group atmospheres, in: University of Iowa Studies, Studies i n child welfare, Studies i n topological and vector psychology I, 1940, S. 45—195. 18 [Experimental sociology], S. 59 f. 19 Während die Anfangsuntersuchung ziemlich eindeutige Ergebnisse erbrachte, verloren sich diese bei den Anschlußuntersuchungen teilweise wieder.

1. Kausalzusammenhang

47

Bei dieser Versuchsanordnung soll ebenfalls keine ins einzelne gehende K r i t i k der verwendeten Konzepte und der Durchführung erfolgen, sondern n u r eine Klarlegung der methodischen Grundlinien. Die ausgedehnte Kontrolle der relevanten Faktoren ist ein Hinweis darauf, daß es sich bei den gebildeten Gruppen u m Experimentier- und Kontrollgruppe handeln könnte. Die Kontrollgruppe unterscheidet sich aber von der Experimentiergruppe laut Definition dadurch, daß der zu prüfende Faktor i n i h r fehlt. Eine Differenz bezüglich einer vermuteten Ursache besteht jedoch zwischen den beiden Gruppen nicht. Entweder ist i n beiden jeweils ein zu prüfender Faktor enthalten oder i n keiner von beiden. Wenn von einem zu prüfenden Faktor gesprochen werden soll, so könnte er nur i n der „demokratischen" bzw. „autokratischen" Führung und damit konkret i n den jeweiligen Gruppenführern liegen Die Gruppenführer wurden aber nicht als zu prüfender Faktor i n eine bestehende Situation eingeführt. Vielmehr waren sie ein integrativer Bestandteil der Gruppenstruktur von Beginn der Gruppenexistenz ab. Auch diese Untersuchung ist also keine Kausalstudie. Das erhellt des weiteren daraus, daß überhaupt keine spezifische Kausalhypothese aufgestellt wurde und auch nicht aufgestellt werden konnte. Beide Studien haben sich damit nicht als Experiment erwiesen 2 0 . Doch weisen beide einige gemeinsame Grundzüge auf, und diese bestehen i n der Intention des Vergleichs. I n der erstgenannten Untersuchung wurden Juden und Katholiken i n ihrem Verhalten i n verschiedenen Situationen miteinander verglichen, i n der letztgenannten zwei Gruppen m i t verschiedenen Führungsstilen. Beide unterscheiden sich dadurch, daß i m ersten Fall mehr einzelne Personen, allerdings als Mitglieder bestimmter sozialer Gruppen, i m letzten mehr eine Gruppenstruktur Forschungsobjekt waren. Während f ü r die letzte mehr die Regeln der Einzelfallstudie gelten, sind es für die andere mehrstatistisch-wahrscheinlichkeitstheoretische Überlegungen. So ließe sich fragen, ob die Ergebnisse für die Katholiken bzw. Juden verallgemeinert werden können, also ob sie für College-Studentinnen m i t diesem Material für Boston, für die Vereinigten Staaten oder gar für Katholiken (bzw. Juden) allgemein gelten. Solche Ergebnisse sind vor allem deshalb schwerlich zu formulieren, w e i l die Versuchspersonen nicht durch eine Zufallsstichprobe ausgewählt wurden. Aber auch andere Gesichtspunkte, die für die Repräsentativität sprechen könnten, sind nicht erwähnt. 20 Als Experiment bezeichnete Vergleichsstudien sind außerordentlich häufig. Vgl. z.B. W i l l i a m M. Evan, Morris Zelditch jr.: A laboratory experiment on bureaucratic authority, in: American Sociological Review, Vol. 26 (1961), S. 883—893; ferner A r t h u r M . Cohen, Warren G. Bennis: Continuity of leadership i n communication, in: H u m a n Relations, Vol. 14 (1961), S. 351 bis 367; u n d John R. P.French: Organized and unorganized groups under fear and frustration, in: University of Jowa Studies; Studies i n child welfare, Vol. 20, Studies i n topological and vector psychology I I I , 1944, S. 229—308.

48

II. Kritik

Während durch ein Forschungsexperiment bestimmte Relationseigenschaften eines zu prüfenden Faktors unter intensiver Kontrolle festgestellt werden sollen, gehört der Vergleich i n den Bereich einer Beschreibung. Dabei werden die strukturellen Unterschiede und Gemeinsamkeiten zweier oder mehrerer Gegenstände hervorgehoben und Bezüge anderer A r t zwischen ihnen festgestellt. Ziel ist die Veranschaulichung von Strukturen und die Bildung von Strukturbegriffen. Dem Vergleich inhärent ist die Analyse der ähnlichen, verwandten oder auf einem Kontinuum (Variable) anzuordnenden Eigenschaften. Eine Kontrolle der zu vergleichenden Gegenstände i m Sinne der Erzielung einer möglichst großen Gleichheit würde i m Extremfall einen Vergleich ausschließen, w e i l identische Gegenstände nicht zu vergleichen sind. Ein Vergleich setzt also Unterschiede i n bestimmten Hinsichten voraus. Je nach den strukturellen Eigenschaften, die besonders für den Vergleich herangezogen werden sollen, w i r d man jedoch darauf achten, daß diese verschieden, andere Eigenschaften (oder die Gesamtstruktur) gleich sind. Entsprechend hat die „Kontrolle" i m sozialwissenschaftlichen Vergleich einen ganz anderen Sinn. I n der Auswahl der Gegenstände für einen Vergleich werden nicht nur die „relevanten" Faktoren berücksichtigt, sondern alle strukturtragenden Eigenschaften. Es gibt ja auch keinen Maßstab wie die hypothetische Wirkung i m Experiment, der die Auswahl der relevanten Faktoren bestimmen und erlauben würde. Die „Kontrolle" von sozialen Gruppen für einen Vergleich hat also nur den Sinn, geeignete Studienobjekte zu schaffen. Dabei gibt es für diese Auswahl kein zwingendes Kriterium. Während zwischen Experiment einerseits und Analyse und Vergleich (Beschreibung) andererseits eine strenge Grenze gezogen werden kann, ist das zwischen Analyse und Vergleich nicht i m gleichen Sinn möglich. I n der Analyse soll ein Gegenstand identifiziert, eine Eigenschaft als solche oder i n ihrem Maß festgestellt werden. Die Forschungsintention kann also präzise formuliert werden. Bestandteil der Vorgehensweise ist nicht selten eine Gegenüberstellung von verschiedenen Gegenständen (Situationen) und insofern ein „Vergleich". I n der analytischen Vorgehensweise ist der „Vergleich" aber tendenziell beschränkt auf eine einzige Eigenschaft. Anders erstreckt sich der Vergleich i m eigentlichen Sinn auf eine Vielzahl von Eigenschaften, w e i l sein Ziel ja mehr die Veranschaulichung von Strukturen und die Bildung von Strukturbegriffen ist. Beschränkt man sich methodisch auf die Erfassung nur sehr weniger Eigenschaften, so w i r d die Ähnlichkeit m i t der Analyse größer. Insofern kann man sagen, daß die erstgenannte Studie der Analyse näher steht als die zweite. Der Versuch, i n Analogie zum Begriff der experimentellen Analyse einen Begriff des experimentellen Vergleichs zu formulieren, ist aus den

2. E x p e r i m e n t e r i t u a t i o n

49

angeführten Gründen kein sehr glückliches Unternehmen 2 1 . Ein Vergleich setzt die Gegenüberstellung der beiden Gegenstände voraus, u m Strukturen zu gewinnen, hat also höchstens mittelbar m i t verdeckten Relationseigenschaften zu tun. Eine Hypothese braucht nicht formuliert zu werden. Eine intensive Kontrolle ist nicht erforderlich, da ja Strukturelemente erfaßt werden sollen. Daraus ist zu folgern, daß ein Vergleich nicht nur kein Experiment ist, sondern auch kaum als experimentelle Vorgehensweise angesprochen werden kann. 2. Experimentiersituation

a) Faktoren und Variable Die Gesamtheit der Gegenstände, Faktoren und Eigenschaften, auf die sich das Experiment erstreckt einschließlich des Faktors, an dem die vermutete W i r k u n g auftreten soll, soll i m folgenden Experimentiersituation genannt werden. Diese Experimentiersituation besteht aus einer Reihe von Faktoren, die i n einem gemeinsamen Beziehungsfeld stehen. A l l e diese Faktoren beeinflussen sich gegenseitig, allerdings i n einem sehr unterschiedlichen Maß. So kann der Einfluß eines Faktors auf einen anderen unter bestimmten Bedingungen gegen N u l l tendieren. Der gegenseitige Einfluß ruft bisweilen ein gewisses Gleichgewicht hervor. Ein solcher Zustand, wenn er überhaupt erreicht wird, steht jedoch am Anfang oder am Ende des geplanten Eingriffes i n die Situation. Der Begriff der Situation findet sich i m Ansatz bereits bei Greenwood, w i r d dort jedoch nicht weiter ausgeführt und strukturiert 2 2 . Die i n der Experimentiersituation anwesende Personenmehrheit, oft „Experimentiergruppe" genannt, ist nur ein Teil der gesamten Situation. Sowohl unter dem Gesichtspunkt der Beschreibung als auch unter dem Gesichtspunkt der Kontrolle ist die Experimentiersituation auf die i n ihr wirkenden Kräfte hin zu analysieren. Voneinander räumlich und begrifflich trennbare Dinge sowie Personen sollen als Gegenstände 23, die Teile der Gegenstände, die als wirkende Einheiten begrifflich herausgehoben werden können, sollen Faktoren genannt werden. Dabei soll auch die Zusammenfassung der Faktoren gleicher A r t von verschiedenen Gegenständen als Faktor bezeichnet werden. Die Faktoren m i t Aus21 Duverger, [Méthodes], S. 358, hat versucht, den Begriff des vergleichenden Experiments einzuführen. Ä h n l i c h ist die Begriffsbildung Dürkheims, der die Methode des indirekten Experiments m i t der vergleichenden Methode gleichsetzt. Diese hat die Kausalitätsbeziehungen aufzustellen, da sich die sozialen Phänomene der A n w e n d u n g des (manipulierenden) Experiments entziehen. Emile Dürkheim: Les règles de la méthode sociologique, 11. Auflage, Paris 1950, S. 124 ff.; dt. Die Regeln der soziologischen Methode, Neuwied 1961, S. 205 ff. 22 [Expérimental sociology], S. 38. 28 V o m I I I . Abschnitt ab werden als Gegenstände auch die geistigen (logischen) Einheiten bezeichnet, sofern sie i m Blickfeld der Forschung stehen.

4 Siebel

50

II. Kritik

nähme der hypothetischen Ursache und der hypothetischen Wirkung werden häufig auch als Bedingungen bezeichnet. Eine Untergliederung der Faktoren stellen die Eigenschaften (Merkmale, Attribute) dar. Grundsätzlich sind diese wieder i n Untereigenschaften aufgliederbar. Für die Allgemeinheitsstufe ist jeweils der Bezugspunkt maßgebend. Die i n der Situation anwesenden Gegenstände können auch als Eigenschaften der Situation, die Faktoren entsprechend als Untereigenschaften der Situation angesehen werden. Inwieweit und i n welcher Form die Faktoren und damit die Eigenschaften der Situation aufgegliedert werden sollen, ist eine Frage der Begriffsbildung und damit abhängig von der vorliegenden wissenschaftlichen Theorie und dem Untersuchungsansatz. Wenn man das Verhältnis zwischen der Situation und den i n ihr enthaltenen Gegenständen wie das Verhältnis zwischen den Eigenschaften eines Faktors und dem Faktor als eine begriffliche Überordnung ansieht, muß man jedoch berücksichtigen, daß die Situation i n sich viel weniger strukturiert und gefestigt ist als ein Gegenstand oder Faktor. Die Situation trägt viel mehr den Charakter der Zufälligkeit und ist daher i n viel größerem Maße dem Zerfall ausgesetzt. Die i n der Situation enthaltenen Elemente sind viel weniger auf ein bestimmtes Ziel oder eine Zielkombination hin angelegt als die Elemente eines Gegenstandes. Gegenstand und Faktoren erweisen sich damit als einfacher begrifflich abgrenzbare Einheiten (Systeme), die aus sich als i n wesentlichen Bezügen konsistent erscheinen, während die Experimentiersituation hauptsächlich aus der Intention des Experimentators ihre begriffliche A b grenzung erfährt. Natürlich bedeutet eine begriffliche Abgrenzung der Experimentiersituation ebensowenig wie eine örtliche, daß die Vorgänge i m Experiment wirklich von der umgebenden Welt vollständig isoliert werden können. Die Isolierung ist i n jedem Experiment nur partiell zu erreichen. Bekannte und unbekannte Faktoren w i r k e n m i t verdeckten und unverdeckten Eigenschaften i n das Experiment hinein. Ihre Erfassung und Begrenzung bilden das eigentliche Problem des Experiments. Die Unsicherheit über die Frage, wie groß der Ausschnitt aus der Welt i n der Experimentiersituation sein soll und wo man die „effektiven" Grenzen setzen soll, ist besonders beim sozialwissenschaftlichen Experiment ein kennzeichnendes Merkmal. Damit verbindet sich die Schwierigkeit, die ganze Situation i n ihren Bestandteilen ausreichend zu erfassen. Werden nur die „bedeutsamen Faktoren" erfaßt, so kann ein späterer Begutachter die möglicherweise nicht berücksichtigten wichtigen Einflüsse nicht mehr rekonstruieren. Eine vollständige Beschreibung der Situation und der hypothetischen Ursache sowie des Ablaufs des Experiments ist allein schon wegen einer ins Auge zu fassenden Wiederholung durch andere Forscher unbedingt notwendig.

2. Experimentier Situation

51

Trotz dieser Schwierigkeiten muß die experimentelle Situation als begrifflich erfaßbare und beschreibbare Einheit verstanden werden, w e i l sonst das Forschungsziel, die Prüfung einer Kausalhypothese überhaupt nicht zu erreichen wäre. Die genannten Schwierigkeiten können unter bestimmten Bedingungen als irrelevant vernachlässigt oder wenigstens systematisch eingegrenzt und verringert werden. Der begrifflichen Einheit entspricht die tatsächliche Einheit der Situation. Die Interaktion der verschiedenen Faktoren erlaubt es nicht, einen der Faktoren als alleinige Ursache eines Geschehens, einer Wirkung anzusehen. Die Konstellation als ganze muß jeweils herangezogen werden. Deshalb ist es für das Experiment entscheidend, daß der zu prüfende Faktor, die hypothetische Ursache, zunächst von der Situation getrennt gehalten worden ist. N u r wenn — unter sonst kontrollierten Bedingungen — nach der Einführung des zu prüfenden Faktors eine Änderung i n der Situation eintritt, kann diese auf den zu prüfenden Faktor zurückgeführt werden. Diese Rückführung der Ursache ist allerdings keine genaue Zumessung i m Vergleich zu den anderen Faktoren, denn alle i n der Situation anwesenden Faktoren können beteiligt gewesen sein. Vielleicht war die hypothetische Ursache nur der letzte Anlaß, u m die hypothetische W i r k u n g auszulösen. Die Rückführung betrifft vielmehr nur die Relation zwischen zu prüfendem Faktor und Situation als ganzer 24 . Das Ursache-Wirkungs-Verhältnis ist i m Experiment erfaßt als ein Ereignis, das eintrifft, wenn zwei verschiedene Situationen i n Wechselw i r k u n g treten. Denn der zu prüfende Faktor kann vor Einführung i n die Experimentiersituation ebenso als Situation bezeichnet werden wie die Situation selbst. Die Experimentiersituaton macht insofern drei Phasen durch: Die Anfangssituation, die neben dem zu prüfenden Faktor existiert, die Situation nach Einführung des Faktors und die Endsituation nach E i n t r i t t der hypothetischen W i r k u n g bzw. nach Abbruch des Experiments. Sowohl Anfangs- als auch Endsituation sind besonders der Beobachtung und der Analyse unterworfen und entsprechen wenigstens tendenziell einem Gleichgewichtszustand. Zu der Gesamtheit der Faktoren gehört nach seiner Einführung i n die Experimentiersituation auch der zu prüfende Faktor, die hypothetische Ursache . Dieser Faktor ist der, dem i n erster Linie die Aufmerksamkeit des Forschers gilt. Er ist jedoch während des Ablaufs des Experiments nur einer von mehreren Faktoren, die das Ergebnis beeinflussen 24 V o n hier aus gesehen verliert die Stellungnahme Paul F. Lazarsfelds (Problems i n methodology, i n : R. K . Merton, L . Broom u n d L . H. Cottrell: [Sociology], S. 67) gegen Herbert Blumer ihren gegensätzlichen Charakter. Blumer v e r t r i t t die Ansicht, daß n u r zwei Variable jeweils zu betrachten seien. Lazarsfeld läßt die „kompetente Sozialforschung" erst bei der M u l t i variationsanalyse, die mehr als zwei Variable untersucht, beginnen. Beide Standpunkte brauchen sich nicht zu widersprechen.



II. Kritik

52

können. Andererseits erstreckt sich die Wirkung des zu prüfenden Faktors immer auf alle i n der Situation anwesenden Faktoren. Er ruft also keinesfalls nur die zu prüfende Wirkung hervor, sondern immer auch eine Reihe von weiteren Wirkungen, die i n der Folge die zu prüfende Wirkung beeinflussen und sogar wieder aufheben können 2 5 . Der zu prüfende Faktor unterscheidet sich von allen übrigen Faktoren nicht nur durch die Aufmerksamkeit, die i h m der Forscher i n erster Linie schenkt, und durch die Isolierung von den übrigen Faktoren vor Beginn des eigentlichen Experiments. Dazu kommt — jedenfalls für die sozialwissenschaftliche Forschung — noch eine weitere wichtige Differenz. Man kann nämlich für fast alle sozialwissenschaftlichen Experimente annehmen, daß der Kausalfaktor unter den i n gleicher Richtung wirkenden Faktoren der bedeutsamste oder stärkste ist. Wäre das nicht der Fall, so wäre es außerordentlich erschwert, die Wirkung festzustellen. Geringe Schwankungen i n der W i r k u n g der relevanten Faktoren könnten u. U. schon größer sein als die hypothetische Wirkung des zu prüfenden Faktors. Es besteht daher eine der wesentlichsten Aufgaben des Forschers darin, Faktoren, die bedeutsamer als der zu prüfende Faktor sind, aus dem Experimentierablauf vollständig herauszuhalten. Die von Anfang i n der Experimentiersituation anwesenden Faktoren, die (wahrscheinlich) i n gleicher Richtung wie der zu prüfende Faktor wirken, sollen Parallelfaktoren genannt werden. Sie decken sich zu einem großen Teil m i t den relevanten Faktoren. Z u diesen nicht vollständig zu eliminierenden Faktoren m i t gleichgerichteter Wirkung kommen jedoch immer auch noch eine größere Zahl von Faktoren, die zwar auch i n irgendeiner Richtung wirken, jedoch nicht unmittelbar die hypothetische W i r k u n g hervorbringen. Diese W i r k u n g kann sich auf einen der relevanten Faktoren erstrecken und diesen stärken oder schwächen, so daß damit auch die beobachtete Gesamtwirkung beeinflußt wird. Es ergibt sich damit, daß auch die zunächst als neutral angesehenen Faktoren durchaus störend das Experimentierergebnis beeinflussen können. Das gilt u m so mehr, je länger die Zeitdauer des Experiments ist. Faktoren, die i n bezug auf die hypothetische Wirkung w i r k l i c h neutrale Faktoren sind, gibt es — zumal unter langfristiger Betrachtung — i m sozialwissenschaftlichen Experiment nur als theoretischen Grenzfall. Das liegt allein schon daran, daß die i m Experimentierablauf auftretenden Faktoren von den Versuchspersonen erkannt werden und damit bereits wirken. Dadurch w i r d dann natürlich das Handeln der Versuchspersonen wieder bestimmt. Es ist aber nicht nur so, daß die Faktoren m i t nichtparalleler Wirkung die übrigen Faktoren beeinflussen. Auch die parallelen Faktoren veranlassen nichtparallele Wirkungen. 25

Vgl. die negativen Nebenwirkungen aller Heilmittel.

2. E x p e r i m e n t e r i t u a t i o n

53

Unter den nicht unmittelbar parallel wirkenden Faktoren muß man grundsätzlich die Existenz von katalytischen Faktoren, d. h. von solchen, ohne deren Anwesenheit die hypothetische Ursache nur zu einer eingeschränkten oder zu gar keiner Wirksamkeit kommen würde, annehmen. Diese Faktoren w i r k e n i m Unterschied zu den relevanten Faktoren nicht bereits ohne den zu prüfenden Faktor (Kausalfaktor) i n der gleichen Richtung wie dieser. Natürlich kann ein katalytischer Faktor, auch andere Faktoren, seien sie nun kontrolliert oder nicht, bei Eint r i t t des zu prüfenden Faktors zur Wirksamkeit bringen, also zu Parallelfaktoren machen. Diese Faktoren haben insbesondere i n der Chemie eine erhebliche Bedeutung erlangt 2 6 , sie sind aber für die Sozialwissenschaften keineswegs auszuschließen. Ferner ist i n diesem Zusammenhang auch der Faktor zu erwähnen, der die hypothetische Wirkung anzeigen soll. Auch dieser kann nicht nur als ein neutraler Faktor angesehen werden, er w i r k t vielmehr häufig aktiv auf die übrigen Faktoren ein. Es versteht sich von selbst, daß der die W i r k u n g aufzeigende Faktor nicht immer ein einzelner Faktor sein braucht. Die Wirkung kann auch an mehreren Faktoren festgestellt werden. Dieser, die Wirkung aufzeigende Faktor soll — i m Unterschied zu dem Träger der Wirkung — Indikationsfaktor genannt werden. Der Indikationsfaktor besteht i n vielen Fällen aus einem Meßgerät. Meistens zeigen Meßgeräte nicht unmittelbar die W i r k u n g an, sondern nur eine der weiteren Wirkungen des durch das Experiment neu geschaffenen Faktors (Eigenschaft). Der Indikationsfaktor kann aber ebensogut i n einem Menschen liegen. Besonders i m sozialwissenschaftlichen Experiment spielt der Einfluß, den der Experimentator bei den verschiedenen vorzunehmenden Analysen ausüben kann, eine erhebliche Rolle. Z u unterscheiden sind schließlich noch die i n der Anfangssituation anwesenden Faktoren (einschließlich des zu prüfenden Faktors) und die intervenierenden Faktoren. Intervenierende Faktoren sind solche Faktoren, die ungeplant und daher unkontrolliert nach Beginn des Experiments i n die Situation einwirken. Ihre Ausschaltung oder wenigstens Zurückdrängung stellt besonders für das Feldexperiment ein schwer zu lösendes Problem dar. Bisweilen werden alle Faktoren, die für das Experiment Bedeutsamkeit besitzen, als Variable bezeichnet. Damit ist das Problem der Messung angeschnitten. Die Bezeichnung „Variable" soll ausdrücken, daß ein Gegenstand verschiedene Zustände annehmen kann, ein Faktor eine veränderliche Größe ist. Dabei ist die A r t der Veränderlichkeit festzulegen sowie der Maßstab für den jeweils eingenommenen Zustand auf 26 Vgl. z. B. A l w i n Mittasch: Über Kausalität i n der Chemie, in: Studium Generale, l . J g . (1947/48), S. 366—375. Mittasch sieht i n der Katalyse eine spezifische Form der Kausalität i n der Chemie.

54

II. Kritik

dem zugehörigen Wertbereich. Eine Variable kann dann alle möglichen Werte eines bestimmten Wertbereichs bzw. Intervalls zwischen zwei Größen oder auch eines unbegrenzten Wertbereichs einnehmen. Als unabhängige Variable w i r d der zu prüfende Faktor, als abhängige Variable die hypothetische Wirkung oder der Träger der hypothetischen Wirkung bezeichnet. Vom zu prüfenden Faktor sind aber mehr oder weniger alle Faktoren abhängig, nicht allein der Träger der hypothetischen Wirkung. Es interessiert jedoch nur eine Form der Wirkung, nämlich die hypothetisch festgelegte Wirkung. Von allen anderen W i r kungen w i r d abgesehen. Unter diesem Aspekt berührt sich das Experiment mit dem Modell. Dieser Zusammenhang soll hier aber nicht weiter erörtert werden. Eine Variable ist also ein Faktor, der sich i m Rahmen eines Maßstabes bewegt bzw. bewegen kann. Ein Maßstab läßt sich immer nur unter einem Bezugspunkt entwickeln 2 7 . Dieser Bezugspunkt für einen Maßstab kann von verschiedener A r t sein. Eindimensionale Maßstäbe weisen nur einen einzigen, nicht untergliederbaren Bezugspunkt auf. Solche Maßstäbe finden sich vor allem i m physikalisch-chemischen Bereich, so z. B. für Temperatur, Länge, Gewicht, Lautstärke. Die eindimensionalen Maßstäbe sind am einfachsten auf ein Meßgerät zu übertragen, bei ihnen ist der subjektive Einfluß beim Messen am besten zurückzudrängen. Mehrdimensionale Maßstäbe enthalten mehrere rangmäßig untergliederte Teilbezugspunkte (z. B. Gedächtnis, Reaktionsgeschwindigkeit usw. bei Intelligenzskala). I m sozial wissenschaftlichen Experiment werden meist mehrdimensionale Maßstäbe verwendet. Ihre Entwicklung und Anwendung enthält bedeutende Probleme. Neben dem Maßstab für die hypothetische W i r k u n g gibt es für die Anfangs- und Endsituation des Experiments keinen weiteren Maßstab. A l l e i n der Experimentiersituation enthaltenen Faktoren sind als Variable also nur anzusprechen, soweit sie auf dem Maßstab der hypothetischen Wirkung zu variieren vermögen. Alle andere Variabilität ist beliebig und muß unberücksichtigt bleiben, w e i l für das gegebene Experiment gleichgültig. Aus diesem Grund ergibt sich bereits, daß es wenig zweckmäßig ist, alle i m Experiment anwesenden Faktoren als Variable zu bezeichnen. N u n werden häufig zu den bedeutsamen und somit zu den Parallelfaktoren solche Faktoren gerechnet wie Geschlecht, Beruf, Konfession, Alter. Bei diesen Faktoren muß grundsätzlich die Frage gestellt werden, ob es berechtigt ist, sie als Variable zu bezeichnen, wie es des öfteren geschieht. Von Variabilität läßt sich i n bezug auf drei verschiedene Aspekte sprechen: 1. i n bezug auf einzelne Gegenstände, 2. i n bezug auf eine ge27 Der Bezugspunkt w i r d gelegentlich „nominale Definition", der Maßstab „operationale Definition" genannt.

2. E x p e r i m e n t e r i t u a t i o n

55

gebene Situation und 3. i n bezug auf eine mögliche, zu bildende Situation. Der erste Aspekt ist der wichtigste. Er ergibt wie die anderen beiden eine dreifache Unterscheidung; danach kann als Variable bezeichnet werden a) ein Gegenstand, der verschiedene Zustände i n einem Wertbereich annehmen kann, b) ein Maßstab als begriffliche Einheit zur Messung der Zustände eines Gegenstandes und c) ein Maßstab als begriffliche Einheit zur Messung von verschiedenen Gegenständen m i t verschiedenen Zuständen. Die letztgenannten beiden Verständnismöglichkeiten hängen eng zusammen, beide bezeichnen die begriffliche Einheit für eine Variable, den Maßstab selbst. Diese Variablen treten i n zwei Formen auf, als primäre und als sekundäre Variable. Primäre Variable sind Maßstäbe i m engeren Sinn. Für sie ist kennzeichnend, daß für sie weder ein kritischer Bereich noch eine Grenze auf ihrem Wertbereich relevant ist. Diese Variablen können also ihren Charakter nicht verlieren; wenn eine bestimmte Grenze überschritten wird, schlagen sie nicht i n einen anderen Begriff um. Als eindimensionale Maßstäbe fallen hierunter z. B. Länge, Temperatur, Gewicht, Alter, als mehrdimensionale z. B. Intelligenz, sexuelle Ausprägung, Keife, Religiosität. Die sekundären Variablen besitzen dagegen einen kritischen Bereich oder eine scharfe Grenze auf ihrem Wertbereich, wo ein Umschlag i n eine andere begriffliche Einheit erfolgt. Der kritische Bereich liegt mindestens auf einer Seite des Wertbereichs, unter Umständen aber auch auf beiden Seiten. Als sekundäre Variable können fast alle Klassenbegriffe angesprochen werden. Rein äußerlich heben sie sich von den primären Variablen dadurch ab, daß man ihnen etwas gegenüberstellen kann, was nicht zur Klasse gehört, z. B. Hitze — Nichthitze, Arzt — Nichtarzt, Tier — Nichttier, Uran — Nichturan. Das ist bei den primären Variablen nicht möglich. Eine Nicht-Temperatur gibt es ebensowenig wie eine Nicht-Intelligenz. Zwar kann die Temperatur oder die Intelligenz sehr gering sein, aber sie ist logisch nie völlig auszuschließen. Die Hitze dagegen geht bei einem bestimmten kritischen Bereich i n die Kälte, der Arzt i n den Kurpfuscher, das Tier i n die Pflanze, das Uran i n Radium über. Die Betrachtung eines Klassenbegriffs als Variable erfordert häufig die Aufstellung sehr komplizierter mehrdimensionaler Maßstäbe; i n vielen Fällen sind die Schwierigkeiten so groß, daß man auf eine genaue Formulierung des Maßstabes überhaupt verzichtet. Primäre Variable bilden selbst nicht unmittelbar eine begrenzte Klasse, sondern eine Klassenreihe. Sie sind Eigenschaften, die zur Klassenbildung herangezogen werden. Sekundäre Variable dagegen bezeichnen einzelne Klassen. Diese bilden jedoch wieder einen Bezugspunkt für primäre Variable, z. B. Arzt für Arzt-sein (ärztlich), Tier für tierisch usw.

56

II. Kritik

Betrachtet man nun nicht einzelne Gegenstände, sondern Situationen, so erweitert sich der Zusammenhang auf Häufigkeiten. D. h. Gegenstände, die m i t dem gleichen Maßstab gemessen werden können, treten mehrfach auf. Dann ist zu entscheiden, i n welcher Form mehrere Gegenstände unter dem Blickpunkt des Bezugspunkts zusammengefaßt werden können. Die genannten Faktoren Geschlecht, Beruf, Konfession erweisen sich nach diesen Überlegungen nicht als eigentliche Variable, sondern als sekundäre Variable. Sie sollten daher nur dann als Variable bezeichnet werden, wenn man sich ausdrücklich den Unterschied zu den primären Variablen k l a r macht. Das A l t e r (als Klassenreihe nach Alters jähren) dagegen erweist sich als eine primäre Variable. Allerdings besitzt der Gegenstand dieser Variablen eine ganz spezifische, bei anderen Variablen kaum vorkommende Eigenschaft. Bei den gemessenen Gegenständen ist die Eigenschaft nicht reversierbar, der Gegenstand ändert seine Zustände nur i n einer Richtung auf dem Wertebereich. Außerdem ist der Gegenstand dieser Variablen absolut unbeeinflußbar wie die Zeit. Auch beim A l t e r sollte deshalb der Begriff der Variablen nur unter Betonung der spezifischen Unterschiede verwendet werden. Bei einigen Experimenten kann der Gesichtspunkt der Variablen, soweit er sich auf bestimmte Gegenstände bezieht, entfallen. Das gilt z. B. für viele chemische Experimente. Der Gesichtspunkt für Häufigkeiten (Menge) ist allerdings unverzichtbar. I m sozialwissenschaftlichen Experiment erscheint — obwohl nicht notwendig — vor allen Faktoren die hypothetische W i r k u n g als Variable. N u r wenn diese als Variable verstanden wird, ist der Begriff des relevanten Faktors sinnvoll. Darüber hinaus kann auch dem zu prüfenden Faktor der Charakter einer Variablen beigemessen werden. Das ist unter der Voraussetzung der Fall, daß eine größere Zahl von Experimenten durchgeführt wird, die sich (möglichst) nur dadurch unterscheiden, daß die „unabhängige Variable" von Experiment zu Experiment i n ihrer Größe geändert wird. Ähnliches gilt, wenn die hypothetische Ursache als solche nicht neu eingeführt, sondern nur intensiviert w i r d (z. B. Dauer der Mitgliedschaft). Der Maßstab für die Veränderung der hypothetischen Ursache ist allerdings nicht der gleiche Maßstab wie der für die Messung der Wirkung. W i r d der gleiche Maßstab für verschiedene Erscheinungen („hypothetische Ursache" und „hypothetische Wirkung") verwendet, so ist das ein Hinweis darauf, daß kein Experiment, sondern eine Analyse vorliegt. Unter diesen Überlegungen gewinnt das Problem der Auswahl der bedeutsamen Faktoren besonderes Gewicht. Teilt man dem Experiment die Aufgabe zu, überhaupt erst einmal festzustellen, ob ein Kausalzusammenhang besteht, so setzt das praktisch voraus, daß die Parallel-

2. E x p e r i m e n t e r i t u a t i o n

57

faktoren selbst bereits einer Prüfung unterworfen gewesen sind. Denn sonst könnte man niemals sicher sagen, ob das Ergebnis nicht auch ohne den zu prüfenden Faktor entstanden wäre. Versteht man das Experiment aber nur als letzte Prüfung eines sowieso bekannten Sachverhaltes, so muß von den Parallelfaktoren angenommen werden, daß sie i n ihrer Wirkung auch allgemein bekannt sind. b) Ex-post-facto-Experiment Nach der Klärung der Struktur der Experimentiersituation kann nun die Frage danach gestellt werden, ob das Ex-post-facto-Experiment auch eine Experimentiersituation besitzt, welcher A r t diese ist und ob die Ergebnisse es zulassen, diese Vorgehensweise als eigenständige Form des Experiments zu bezeichnen. Das Ex-post-facto-Experiment wurde i n erster Linie von Chapin propagiert als eine besonders für die Sozialwissenschaften geeignete Experimentierform, die viele Schwierigkeiten des projektiven Experiments umgeht. Gegen das Ex-post-facto-Experiment wurde geltend gemacht, es sei deshalb kein Experiment, weil es auf Bedingungen beruhe, die nicht vom Forscher geschaffen wurden, sondern natürlicherweise auftreten. Die von Mill getroffene Unterscheidung zwischen „natürlichem" und „künstlichem" Experiment geht davon aus, wie eine experimentelle Situation zustande kam. Grundsätzlich muß dazu M i l l beigestimmt werden, daß die A r t der Entstehung einer Untersuchungssituation gleichgültig für die Logik des Experiments ist. Auch beim natürlichen Experiment handelt es sich u m ein Experiment, wenn die i n der Situation enthaltenden Faktoren entsprechend den Regeln des Experiments kontrolliert werden. Allerdings genügt i n der Regel ein künstliches Experiment den Anforderungen der Kontrolle i n höherem Maße, ist dementsprechend auch genauer. Von daher ist es dem natürlichen Experiment überlegen. Greenwood 28 setzt das Ex-post-facto-Experiment m i t dem natürlichen Experiment gleich. Daher hat das Ex-post-facto-Experiment teil an den Mängeln des natürlichen Experiments, ist aber wie dieses als Experiment anzusehen. „Das Ex-post-facto-Experiment unterscheidet sich logisch i n keiner Weise von dem i m voraus geplanten Experiment. Es verwendet ebenfalls eine Kontroll- und eine experimentelle Gruppe. Wo w i r nach der Ursache einer bestimmten Wirkung forschen, ist die experimentelle Situation diejenige, i n der die Wirkung schon erzielt worden ist, während i n der Kontrollsituation diese Wirkung nicht besteht. Wo w i r nach der W i r k u n g einer bestimmten Ursache suchen, ist die experimentelle Situation dadurch gekennzeichnet, daß die Ursache i n i h r schon 23 [Experimental sociology], S. 29 ff.

II. Kritik

58

wirksam geworden ist, während i n der Kontrollsituation die Ursache nicht i n Erscheinung getreten i s t " 2 9 . Während hier bei Greenwood unterstellt ist, „daß das natürliche Experiment i n beiden Richtungen verlaufen k a n n " 8 0 , also entsprechend auch das Ex-post-facto-Experiment sowohl von der W i r k u n g als auch von der Ursache her aufgerollt werden kann, beschränkt Chapin das Ex-post-facto-Experiment auf eine Richtung. „ W i r beginnen m i t einer Beschreibung der gegenwärtigen Situation, die als W i r k u n g von i n der Vergangenheit tätigen ursächlichen Faktoren aufgefaßt wird, und versuchen anschließend den während einer bestimmten Zeit durchschrittenen Weg bis zu einem hypothetischen Komplex von Faktoren zurückzuverfolgen, die i n einem früheren Zeitpunkt zu w i r k e n angefangen haben" 3 1 . Zunächst ist festzuhalten, daß es für ein Experiment durchaus gleichgültig ist, auf welche Weise die zu Grunde zu legende Kausalhypothese zustande kommt. Ob diese Hypothese aus vorangegangenen Forschungen, aus der Alltagserfahrung, aus der Literatur oder aus anderen Quellen gewonnen wurde, ist zwar nicht für die Relevanz der Ergebnisse, w o h l aber für die Logik des Experiments gleichgültig. Aus dem gleichen Grunde ist es unwesentlich, ob eine Kausalhypothese aus bestimmten Wirkungen oder aus einer bestimmten Ursache entwickelt wurde. Auch bei projektiven Experimenten dürften die Hypothesen zum Teil mehr aus der Blickrichtung der Wirkung, zum Teil mehr aus der der Ursache entwickelt worden sein. Entscheidend ist, daß i n der Kausalhypothese ein Zusammenhang zwischen Ursache und W i r k u n g hergestellt w i r d . Die Unterscheidung zwischen Ex-post-facto-Experiment und projektivem Experiment kann also nicht darin liegen, daß die Kausalhypothese von den Wirkungen her gewonnen wird. Wenn also davon gesprochen wird, daß man von der W i r k u n g ausgehen müsse, u m zur Ursache zu gelangen, so kann damit nur eine bestimmte Situation, ein bestimmtes Phänomen gemeint sein, die man als W i r k u n g versteht, u m von hier ausgehend die Ursache zu erforschen. Dieser Forschungsansatz gleicht einer historischen Untersuchung, die die Vielzahl der Ursachen, die maßgeblich einen Gegenstand beeinflußten und formten, aus der Vergangenheit herauszuheben hat. Eine genaue Zurechnung der W i r k u n g der Faktoren auf die gegebene Situation ist dabei allerdings nicht möglich. Eine Prüfung einer Kausalhypothese i m 29 Ebd., S. 32. — Die These von der Übereinstimmung („Identität") der L o g i k von p r o j e k t i v e m u n d Ex-post-facto- (natürlichem) Experiment w i r d von vielen Methodologen vertreten. Vgl. z. B. W i l l i a m J. Goode, Paul K . Hatt: Methods i n social research, New York, Toronto, London 1952, S. 97; [Methods] u n d Paul H a n l y Furfey: The scope and method of sociology, New Y o r k 1953, S. 404.

30 Greenwood, ebd., S. 32.

81 [Experimental designs], S. 95. Chapin spricht hier zwar v o n Faktorenkomplex, später aber von zwei Variablen, die zu untersuchen seien.

2. Experiment] er Situation

59

experimentellen Sinn ist etwas ganz anderes. Eine Kontrollsituation wäre bei diesem Ansatz außerdem überflüssig. Es muß also festgehalten werden, daß eine bestimmte Situation (Wirkung) immer durch eine Vielfalt von Faktoren verursacht ist. Denn alle Faktoren einer Situation, nicht allein der zu prüfende Faktor, können für eine Wirkung verantwortlich sein. A u f jeden F a l l sind aber die Faktoren der Situation, ohne die das Ergebnis nicht zustande gekommen wäre, als Ursachen genauso heranzuziehen wie die hypothetische Einzelursache, die ja von den Bedingungen der Situation abhängig ist, u m zu ihrer Wirkung zu gelangen. Ferner ist grundsätzlich nicht auszuschließen, daß die gleiche Situation (Wirkung) auch unter völlig anderen Bedingungen entstanden wäre. Die hypothetische Ursache könnte also i n der Anfangssituation und später gefehlt haben, obwohl das gleiche Phänomen entstand. Das Ergebnis ändert sich nicht, wenn man i n die Überlegungen eine Kontrollsituation einbezieht. Die experimentelle Situation ist dann, wie Greenwood sagt, diejenige, i n der die W i r k u n g schon erzeugt ist, während i n der Kontrollsituation die Wirkung nicht besteht. Das Problem liegt hier darin, wie die Kontrollsituation gefunden werden soll. Denn Situationen, die eine bestimmte Wirkung nicht aufweisen, gibt es unzählige. Die Unterscheidung, die sich treffen läßt, ist eine w i l l k ü r l i c h festgelegte Differenz i n der „Wirkung", wenn man die Wirkung als Variable versteht. Statt dessen w i r d als W i r k u n g meist eine Konstante herangezogen. Die Kontrollsituation hat also die Wirkung nicht i n einem geringeren Maß als die Experimentiergruppe, sondern überhaupt nicht. Auch bei dieser Festlegung ist die Auswahl der Kontrollsituation relativ willkürlich. Hat man sich aus irgendwelchen Gründen entschlossen, eine der so von der Experimentiersituation unterschiedenen Situationen als Kontrollsituation anzusehen, so ließen sich jetzt einige der aufgestellten Kausalhypothesen bei beiden Situationen verfolgen. Dabei entsteht eine neue Schwierigkeit i n der Festlegung des Zeitpunkts, zu dem man die Anfangssituation festlegen soll. Ob es für beide Situationen der gleiche Zeitpunkt sein muß, läßt sich m i t guten Gründen bestreiten. Darüber hinaus ist die Festlegung des Zeitpunktes (der Zeitpunkte) wieder ein A k t der W i l l k ü r . Hat man die beiden (End)-Situationen bestimmt und versucht die Ursachen zu erforschen, so w i r d man nicht selten zu dem Ergebnis kommen, daß die hypothetische Ursache i n beiden Fällen einwirkte. Die aufgestellte K