Zeitschrift für Sozialpsychologie: Band 7, Heft 3 1976 [Reprint 2021 ed.]
 9783112468364, 9783112468357

Citation preview

H ERAUSGEBER HUBERT FEGER

C. F. G R A U M A N N KLAUS HOLZKAMP MARTIN IRLE

BAND 7 1976

HEFT 3

V E R L A G HANS HUBER BERN STUTTGART WIEN

Zeitschrift für Sozialpsychologie 1976, Band 7, Heft 3 INHALT

Zu diesem Heft

215

Theorie F. & KNOPF, M.: Probleme bei der Messung von Einstellungsänderungen II - Neuere Entwicklungen und Konzepte 217 BORG, I.: Facetten- und Radextheorie in der multidimensionalen Skalierung 231 WERBIK, H.: Grundlagen einer Theorie sozialen Handelns Teil I. Aufbau der handlungstheoretischen Terminologie 248

PETERMANN,

Empirie G., KNOSPE, M . & WITTE, E . H . : Nicht sprachgebundenes Denken: ein theoretisches Konzept und eine experimentelle Untersuchung . . . . LAMM, H. & KAYSER, E.: Verhandlungsvorbereitung und Verhandlungsverhalten bei verschiedenen Kommunikations- und visuellen Kontaktmöglichkeiten

BARTSCH,

262

279

Diskussion H. J.: Multidimensionale Skalierung: Ein Hilfsmittel zum Theorietesten? TAJFEL, H . & MOSCOVICI, S.: Die Wiedergeburt alter Mythen in der Sozialpsychologie: ein sonderbares Irrlebnis IRLE, M.: Antwort auf eine Erwiderung AHRENS,

Mitteilungen

286 292 298 300

Literatur Neuerscheinungen Titel und Abstracto

302 304

Autoren

306

Vorankündigungen

307

Copyright 1976 by Verlag Hans Huber Bern Stuttgart Wien Druck: Lang Druck AG, Liebefeld-Bern Printed in Switzerland Library of Congress Catalog Card Number 78 - 1 2 6 6 2 6 Die Zeitschrift für Sozialpsychologie wird in Social Sciences Citation Current Contents/Social and Behavioral Sciences erfaßt.

Index (SSCIJ und

Zeitschrift für Sozialpsychologie 1976, 7

215

Zu diesem Heft In einigen der folgenden Beiträge verdeutlicht sich eine allgemeine Fragestellung, aus der grundsätzliche Diskussionen in den nächsten Heften hervorgehen könnten. Die Rahmenproblematik ist gesetzt mit der hier auslaufenden Kontroverse zwischen TAJFEL & MOSCOWICI und IRLE: T. & M. werfen I., der das Kriterium der empirischen Prüfbarkeit von Theorien hervorhebt, vor, er vernachlässige in „positivistischer" Blickverengung die gesellschaftlich-kulturelle Determiniertheit und weltanschauliche Geprägtheit von Theorien, in welchen das wesentliche Interesse der Theoretiker beschlossen liegt. IRLE insistiert demgegenüber darauf, daß „... die empirische Brauchbarkeit... einer Theorie nicht durch ihren Entdeckungs- und Entstehungszusammenhang entschieden werden" kann. — Es sieht also so aus, als wenn T. & M. gegenüber der gesellschaftlich-kulturellen Bedeutung von Theorien die Notwendigkeit ihrer strengen empirischen Überprüfung relativieren, während IRLE die gesellschaftliche Herkunft der Theorie und das weltanschauliche Interesse des Theoretikers als gegenüber dem eigentlichen wissenschaftlichen Herleitungs- und Begründungsprozeß irrelevante bloße Faktizität aus der wissenschaftstheoretischen Diskussion eliminieren will. Allein, es fragt sich: Ist die scharfe Trennung zwischen Entstehungs- und Geltungszusammenhang hier richtig? Kann die Entstehung von Theorien, die in Wirklichkeit immer auch Herstellung durch den Theoretiker ist, nicht selbst nach wissenschaftlichen Geltungskriterien beurteilt werden? Sind wirklich nur Hypothesen als Zusammenhangsaussagen wissenschaftlich prüfbar und nicht auch Grundbegriffe? Muß es nicht möglich sein, etwa das Problem der größeren Adäquatheit SR-theoretischer oder kognitionstheoretischer Begriffsbildung nach wissenschaftlichen Kriterien zu klären und nicht, weil durch Hypothesenprüfung unentscheidbar, der außerwissenschaftlich-faktischen Forscher-Biographie zu überantworten? Damit stellt sich natürlich sofort die Frage nach dem Verfahren, mit dem man die Grundbegrifflichkeit einer Theorie wissenschaftlich prüfen könnte.

Auf andere Weise deutet sich die gleiche Problematik in der Arbeit von BORG an. B. stellt mit der Facettenanalyse ein Verfahren vor, in bestimmten Zusammenhängen bei multidimensionaler Skalierung die Fragwürdigkeit von ExPost-Interpretationen, damit die „potentielle Erzeugung von psychologisch-theoretischem Nonsens durch zusammenfassende Interpretation von nicht Zusammengehörigem" zu vermeiden, indem die MDS in einer gewissen Hinsicht die Funktion eines empirischen Prüfverfahrens vorgängig formulierter theoretischer Annahmen gewinnen kann. Der forschungsstrategische Nutzen einer solchen Funktionsveränderung der MDS ist unzweifelhaft. Jedoch scheint die allgemeine Frage, wie „psychologisch-theoretischer Nonsens" durch „zusammenfassende Interpretation von nicht Zusammengehörigem" vermieden werden kann, dadurch kaum hinreichend gelöst. Wieweit eine Theorie „Nonsens" ist und nicht Zusammengehöriges in Zusammenhang bringen will, ist doch wohl nicht notwendig davon abhängig, ob sie am Anfang des Forschungsprozesses oder an dessen Ende, als nachträgliche Interpretation erscheint. Prinzipiell können auch theoretische Ausgangsannahmen unsinnig sein, ebenso wie Ex-Post-Interpretationen sinnvoll (wenn hier auch praktisch die Gefahr unsinniger Deutungen größer ist). Wie kommt man also zu Theorien, die nicht Nonsens sind, und in denen Zusammengehöriges in Zusammenhang gebracht wird, ob nun vorher oder nachher? Die MDS kann hier nicht weiterhelfen, da auch in ihrer von BORG aufgewiesenen Funktion nur schon vorhandene Theorien übeiprüft werden können. Damit stehen wir wieder vor der gleichen Frage: Gibt es ein Verfahren der wissenschaftlichen Begründung der Aufstellung von Theorien? Gerade an dieser Grundfrage aber setzt der Beitrag von WERBIK an: Er geht davon aus, daß jede Theorie nicht nur faktisch ein erkenntnisleitendes Interesse hat, sondern daß die explizite Formulierung dieses Interesses als ehtische Wertung die erste Stufe der Theorienbildung selbst sein muß, erhebt diese Wertung also zur

216 wissenschaftstheoretischen Vorschrift. Die Begründung dieser Wertung (hier: dem ethischen Prinzip der Konfliktlösung) ergibt sich aus deren praktischen Konsequenzen, die man wollen oder nicht wollen kann. Falls man auf diese Weise die Eingangswertung akzeptiert hat, ergeben sich daraus logisch konsistent die Grundbegriffe, Operationalisierungsregeln und empirischen Hypothesen einer psychologischen Handlungstheorie, womit ein nahtloser Ubergang von wissenschaftslogischer Voraussetzungsklärung zu einzelwissenschaftlich-empirischer Theorienbildung hergestellt ist. Von diesem Ansatz läßt sich dann auch die Grundbegrifflichkeit anderer Theorien kritisieren, so etwa aufweisen, daß die SR-theoretische Begriffsbildung mit dem Konfliktlösungs-Prinzip nicht vereinbar ist. — Damit ist die Unterscheidung zwischen Entstehungs- und Geltungsbedingungen sicherlich nicht vom Tisch. Die Übernahme der Ausgangswertung erscheint auch hier als biographischfaktische Entscheidung des Wissenschaftlers. Jedoch wird dabei nicht, wie im kritischen Rationalismus, der gesamte Prozeß der Theorienentstehung in die Unkontrollierbarkeit der

Forscherbiographie zurückverlegt, die Theorienbildung ist vielmehr bei Voraussetzung der Ausgangswertung nach explizit angebbaren wissenschaftlichen Kriterien ableitbar, und Grundbegriffe können nach diesen Kriterien beurteilt und kritisiert werden. Weiterhin wird die vorgängige ethische Wertung hier nicht als außerwissenschaftlich von dem eigentlichen Wissenschaftsprozeß abgetrennt, damit rational nicht faßbar bzw. der Zuständigkeit des Wissenschaftlers enthoben, sondern ausdrücklich als erster Schritt des wissenschaftlichen Forschungsprozesses selbst herausgestellt. Der Werbiksche Versuch der Lösung der Frage nach der Möglichkeit von gemäß wissenschaftlichen Kriterien vollziehbarer psychologischer Theorien- und Begriffsbildung mag manchem problematisch erscheinen (mir erscheint er problematisch). Die Frage sollte damit aber in der Diskussion innerhalb der Zeitschrift nicht wieder untergehen: Es handelt sich dabei, wie vielleicht bei späteren Beiträgen deutliH H eher werden wird, um eine Lebensfrage der Sozialpsychologie. Klaus Holzkamp I — J

217

Zeitschrift für Sozialpsychologie 1976, 7, 2 1 7 - 2 3 0

Theorie Probleme bei der Messung von Einstellungsänderungen II — Neuere Entwicklungen und Konzepte F R A N Z PETERMANN, MONIKA K N O P F

Psychologisches Institut der Universität Heidelberg

Als neuere Entwicklungen, die zumindest teilweise die Schwächen u n d Grenzen der im ersten Teil vorgestellten V e r f a h r e n überwinden, w e r d e n Ansätze zur Beschreibung von Veränderungsaussagen diskutiert. Zunächst w e r d e n als eine Möglichkeit der Veränderungsmessung innerhalb der Klassischen Testtheorie änderungssensitive I t e m s vorgestellt. Eine andere Strategie ergibt sich aus den Ansätzen der Probabilistischen Testmodelle. Im R a h m e n der B e t r a c h t u n g über Einzelpersonen k ö n n e n Single-Subject-Design, P-Technik und ihre M o d i f i k a t i o n e n u n d die Zeitreihenanalyse zur Veränderungsmessung herangezogen werden. Abschließend werden die Möglichkeiten der m a t h e m a t i s c h e n Modellbildung (nicht-numerische Modelle, Differentialgleichungs- u n d M a r k o f f m o d e l l e ) behandelt.

Recent methodological and theoretical d e v e l o p m e n t s in the m e a s u r e m e n t of change are outlined and discussed as their consideration is at least partially able t o avoid t h e deficiencies described in t h e i n t r o d u c t i o n t o this paper. Within classical test t h e o r y , t h e use of changesensitive test items is m e n t i o n e d as a useful means f o r measuring change. T h e applicability of strategies developed within probabilistic test models is also analyzed. Taking an individual case perspective, single-subjectdesign, variations of the P-technique and time-seriesanalyses are p r o p o s e d . Finally, the possible use of mathematical model building (non-numerical, differentiale q u a t i o n and Markoff models) is discussed.

Einleitung

theorie und den Ansätzen der Probabilistischen Testmodelle, die sich auf Fragen der Messung und Auswertung beschränken, wird bei Einzelfallbetrachtungen auch der Planungsaspekt angesprochen und zusätzlich die Aussagekraft des klassischen Experiments grundlegend hinterfragt. Als Verfahren werden in diesem Teil das Single-Subject-Design, die P-Technik samt ihren Modifikationen und die Möglichkeiten der Zeitreihenanalyse vorgestellt. Abschließend seien die Möglichkeiten der Beschreibung von Einstellungsänderungen anhand mathematischer Modelle skizziert. Im einzelnen werden vorgestellt: nicht-numerische Modelle (Graphentheorie und Computersimulation), Differentialgleichungsmodelle und Markoffmodelle. Alle Ansätze stellen für sich betrachtet Wege dar, Veränderungen im Einstellungsbereich zu beschreiben.

Im ersten Teil unserer Darstellung wurden grundlegende Fragen und Konzepte der Messung von Einstellungsänderungen vorgestellt, und als Fortführung sollen im Folgenden neuere Entwicklungen zur Beschreibung von Veränderungsaussagen diskutiert werden. Eine Modifikation der Ansätze der Klassischen Testtheorie stellt das Konzept der änderungssensitiven Items dar, in dem Items aufgrund ihrer Sensitivität zur Messung von Änderungen (RENN 1973) herangezogen werden. Weiterentwicklungen des Raschmodells, wie sie von FISCHER (1974a; 1974b) und KEMPF (1974a; 1974b) vorgetragen werden, machen es möglich, Schwierigkeiten und Grenzen der Klassischen Testtheorie weitgehend zu überwinden. Im Gegensatz zu Modifikationen der Klassischen Test-

218

Petermann & Knopf: Einstellungsänderungen II

Änderungssensitive Items schlug vor, im Rahmen der Veränderungsmessung änderungssensitive Items („change items") zu verwenden. Das Konzept der änderungssensitiven Items geht davon aus, daß Items im verschiedenen Maße die Fähigkeit aufweisen, die Attitüdenvariabilität zu erfassen. R E N N ( 1 9 7 3 ) entwickelte in neuerer Zeit diese Konzepte im Rahmen der Einstellungsänderung weiter. Im Gegensatz zu den Meßeinheiten der Klassischen Testtheorie, die auf exakte Erfassung eines stabilen Merkmals angelegt sind, wird für änderungssensitive Items ein Kennwert bestimmt, der dokumentiert, wie gut das jeweilige Item Veränderungen erfassen kann. R E N N ( 1 9 7 3 ) definiert das Ausmaß der Änderungssensitivität eines Items als Grad der Regelmäßigkeit, mit der es bei Individuen unterschiedliche Ausmaße an Attitüdenänderung anzeigt. Da die Streuung der Meßwertdifferenzen innerhalb einer Stichprobe (sd = y — x) diese Regelmäßigkeit wiedergeben kann, wird die Varianz der Verteilungen der Meßwertdifferenzen (s d 2 ) als Kriterium der Änderungssensitivität gewählt. Ein Item ist immer dann änderungssensitiv, wenn s d 2 > 0. Nach einer z-Transformation der beiden beobachteten Meßwertreihen x und y in Meßwertreihen mit gleichem Mittelwert und gleicher Standardabweichung, gelingt die Uberführung des ebenfalls standardisierten Kriterienmeßwerts C = s z 2 (d) in einen Korrelationskoeffizienten zwischen den zeitverschobenen Beobachtungsreihen. Eine rechnerische Bestimmung der Änderungssensitivität eines Items läßt sich demnach über das Kriterium BEREITER ( 1 9 6 3 )

C=

2(l-r

z z

x y

)

vornehmen. Da man bei der Bestimmung des Indexes der Änderungssensitivität auf beobachtete Werte angewiesen ist, die neben dem wirklichen Ausmaß an Attitüdenänderung auch einen Fehleranteil widerspiegeln, scheint eine Korrektur der Fehlergrößen angebracht. Über die Kovarianz verschiedener Items, die als voneinander unabhängige Indikatoren der Attitüdenänderung angesehen werden, gelingt die Bestimmung der echten Attitüdenvariabilität, die im jeweiligen Änderungs-

betrag dokumentiert sind ( R E N N 1973). In den Erziehungswissenschaften wurde die Möglichkeit diskutiert, änderungssensitive Items zu verwenden, um auftretende Lerneffekte zu beschreiben (vgl. GRUBER & WEITMAN 1962; SAUPE 1966; KLEIN 1971). An dieser Stelle sei auch auf eine Diskussion verwiesen, die sich mit Auswahltechniken für kriteriumsorientierte Testaufgaben (vgl. lehreffektorientierte Tests; FRICKE 1974) beschäftigt. Es zeigt sich, daß von einigen Autoren (Cox & VARGAS 1973; HALADYNA 1974; HARRIS 1974; POPHAM 1971) nicht die Inhaltsvalidität der Items in den Vordergrund gestellt, sondern Items nach der Sensitivität für Effekte eines stattgefundenen Unterrichts ausgewählt werden ( F R I C K E 1974, S.78). So ist etwa bei Cox & VARGAS (1973) das Auswahlkriterium für trennscharfe Items eine maximale VortestNachtest-Differenz.

Resümee Unter den Annahmen der Klassischen Testtheorie kann man mit Hilfe eines neu entwickelten statistischen Kennwertes ( R E N N 1973) die Variablen auswählen, die in einem „hohen Grad änderungssensitiv sind und sich somit zu einer zuverlässigen Messung von individuellen Ättitüdenänderungen eignen" ( R E N N 1973, S. 70). Die Frage ist nun, inwieweit hier zwar zuverlässige Messungen der individuellen Attitüdenänderung möglich sind, diese jedoch auf Kosten der Validität des Tests? Trotz der Schwierigkeiten, die durch die Verwendung änderungssensitiver Items entstehen, sollte man die Kriterien der Änderungssensitivität (vgl. etwa bei den kriteriumsorientierten Tests) zur Konstruktion von Tests, die zur Veränderungsmessung herangezogen werden, berücksichtigen.

Ansätze der probabilistischen Testmodelle Wie wir gezeigt haben, besteht das Grundproblem der Klassischen Testtheorie darin, eine optimale Beschreibung des Zusammenhangs zwischen manifestem Testverhalten (beobachteter Wert) und der latenten Eigenschaft (wahrer Wert) zu ermöglichen. Ziel einer solchen Darstellung ist es vor allem, „daß diese Modelle

219

Zeitschrift für Sozialpsychologie 1976, 7, 2 1 7 - 2 3 0

auch den Zufallsprozeß beschreiben, welcher die Ursache der Meßfehler ist" (FISCHER 1974b, S. 145). Solchen Anforderungen werden Probabilistische Testmodelle gerecht. Spezielle Probabilistische Modelle zur Veränderungsmessung wurden u. a. von RAPOPORT (1963) und COLEMAN (1964, 1968) vorgestellt und diskutiert. FISCHER (1974a) bezeichnet diese Ansätze als Makromodelle, da sie nur Gesamtveränderungen beschreiben können. Diese Strategien lehnen sich nach FISCHER (1974a) stark an Modelle der Biostatistik und dort speziell der Epidemiologie an, „wo ein biologisch gleichartiges Reagieren der einzelnen Organismen auf Einflüsse (z. B. Infektionen) plausibel ist" (FISCHER 1974a, S. 84). Diese Homogenität der Veränderungen läßt sich bei sozialen Prozessen nur schwer konstruieren, und somit sind diese Ansätze als zu undifferenziert zurückzuweisen. Ein spezifischeres Modell stellt das Probabilistische Testmodell von RASCH (1960) dar. Es steht in der Reihe der Latent-trait-Modelle nicht alleine, sondern stellt einen vorläufigen Endpunkt in der Reihe der Modelle zur Beschreibung der latenten Dimensionen dar. Die Entwicklung solcher Modelle — gerade für die Einstellungsmessung — erfuhr mit der Konstruktion und dem Einsatz der Guttman-Skala ( G U T T MAN 1950) einen Aufschwung.

Raschmodell

und

Einstellungsänderung

Wir können hier nicht auf das Raschmodell explizit eingehen und verweisen deshalb auf eine allgemeine und leicht verständliche Einführung bei FRICKE (1972). Im Bereich der Einstellungsforschung wurde es für folgende Fragestellungen erfolgreich angewandt (vgl. TRIANDIS 1975, S. 7 3 f.): — Konstruktion einer Einstellungsskala zur Erfassung perzipierter väterlicher und mütterlicher Strenge bzw. Unterstützung ( S T A P F 1970; STAPF et al. 1972); — Konstruktion einer Einstellungsskala zur Erfassung des Themenkomplexes Sexualmoral und Strafrechtsreform (WAKENHUT 1974a, 1974b); — Konstruktion einer Einstellungsskala zur Er-

fassung der Arbeitszufriedenheit und des Betriebsklimas (ACE & BARTH 1973). FISCHER (1974a, 1974b) diskutiert die Möglichkeiten der Beschreibung von Einstellungsund Verhaltensänderungen mit Hilfe des Raschmodells. Im Rahmen von Versuchsplänen mit abhängigen Beobachtungen wird hier ein Kriterienparameter in Abhängigkeit von auftretenden Haupteffekten, Wechselwirkung und Transfer definiert. Alle Parameter können auf diese Weise unabhängig von der Personenstichprobe und den verwendeten Kriterien geschätzt werden (vgl. FISCHER 1974b, S.508ff.).

Dynamisches

Testmodell

KEMPF (1974a, 1974b) und KEMPF et al. (1975) gehen bei der Konstruktion des dynamischen Modells von der Annahme der lokalen stochastischen Unabhängigkeit, wie sie vom Raschmodell gefordert wird, ab und versuchen ein Modell zu konstruieren, das ohne diese Prämisse auskommt, jedoch die Vorteile des Raschmodells besitzt. Im Gegensatz zum Raschmodell ergeben sich im Rahmen des dynamischen Modells einige Restriktionen bezüglich der Modellparameter. So muß der Itemparameter in seiner Größe den Transferparameter übersteigen, d.h. das jeweilige Item muß eine Restschwierigkeit aufweisen. Ferner besteht Abhängigkeit der Schätzung einzelner Parameter voneinander: zwar können Item- und Personenparameter unabhängig voneinander bestimmt werden, jedoch nicht unabhängig von den Transferparametern.

Resümee

Insgesamt betrachtet zeigt das dynamische Modell dieselben Eigenschaften wie das Testmodell von Rasch, d.h. es erlaubt spezifisch objektive Vergleiche von Personen bzw. Items und bedingte Maximum-Likelihood-Parameterschätzungen für die Modellparameter. Prinzipiell scheint das dynamische Modell für die Veränderungsmessung einsetzbar, da es imstande ist, Lernund Übungseffekte zu berücksichtigen. Eine stärkere Auseinandersetzung der Veränderungsmessung mit Probabilistischen Modellen, insbe-

220 sonders mit dem dynamischen Modell, wäre wünschenswert. Hierbei darf jedoch nicht unbeachtet bleiben, daß die Diskussion bezüglich der Annahmen des Raschmodells und seiner Weiterentwicklungen noch nicht abgeschlossen ist.

Petermann & Knopf: Einstellungsänderungen II

Vornehmlich aus ökonomischen Gründen sollte bei Mehrzeitpunktuntersuchungen die Bedeutung dieser Forschungsstrategie auch für die Sozialpsychologie bedacht werden. Neben der Schwierigkeit der Bestimmung eines Zeitintervalls für die Wiederholungserhebungen (,,timing-Problem"), das auf dem Hintergrund einer theoretischen Konzeption gelöst Betrachtungen über Einzelpersonen werden muß (vgl. R E N N 1973, S.42: „Prozeßadäquanz der untersuchten Zeitintervalle"); DUKES (1965) zählte im Zeitraum von 1940— der Wahl der günstigsten Abfolge der Behand1965 246 ,,single-subject"-Untersuchungen, die lungssituationen bei Untersuchungen mit wievorwiegend anhand von qualitativen Daten Zustandsbeschreibungen bzw. Merkmalsveränderun- derholtem Treatment (SHEENE & BROSS 1961; NAMBOODIRI 1972; BARLOW & HERSEN 1973), gen dokumentieren sollen. Ein Großteil dieser sind es vornehmlich die Probleme der statistiArbeiten entstand im Bereich der Klinischen schen Behandlung von Daten aus sukzessiven Psychologie, wo im Rahmen der Diagnostik soBeobachtungen, die Einzelfalluntersuchungen wie Kontrolle von Therapieeffekten zwangsläukompliziert machen. Der wiederholte Einsatz fig kleine Untersuchungseinheiten anzutreffen des gleichen Meßinstruments führt zu Ubungs-, sind. Angeregt durch die evaluativen Ansprüche Ermüdungs- und Adaptationseffekten und dader Verhaltenstheoretiker zeigt sich in neuerer Zeit verstärkt die Tendenz mit nur wenigen Ver- mit zur Abhängigkeit der Beobachtungen vonsuchspersonen — im Extremfall mit N = 1 — ex- einander. Die seriale Abhängigkeit der sukzessiven Beobachtungen kann zusätzlich für unterperimentell zu arbeiten und die Therapiekontrolle anhand quantitativer Daten vorzunehmen. schiedliche Erhebungszeitpunkte erheblich variieren (vgl. HOLTZMAN 1963, S.249; HUBER Gegenüber dem klassischen Experiment zeich1967, S. 289). Auf den Einsatz der herkömmlinen sich Einzelfalluntersuchungen durch ihre chen statistischen Auswertungsprozeduren, die ökonomische Untersuchungsstrategie aus. HUUnabhängigkeit der Einzelbeobachtungen verBER (1973, S. 38ff.) faßt die zusätzlichen Vorlangen, muß aus diesem Grunde verzichtet werteile von Einzelfallexperimenten in folgenden den. SCHEFFE (1959), GASTWIRTH & COHEN Punkten zusammen: (1970) und GLASS et al. (1973) zeigen, wie — das Einzelfallexperiment ermöglicht eine Un- schwache Ausprägungen der serialen Abhängigtersuchung von zeitlich und räumlich selten keit der Einzelbeobachtungen die Verläßlichvertretenen Ereignissen; keit der Signifikanzprüfungen von herkömmli— es bietet sich an, wenn es nicht möglich ist, chen Testverfahren erheblich vermindern. Die eine hinreichend homogene und angemessen Qualität von Auswertungsverfahren für Daten große Probandenstichprobe zu ziehen (hetero- aus abhängigen Messungen muß deshalb danach gene Stichprobe); beurteilt werden, wie gut sie imstande sind, die — es sollte zum Einsatz kommen, wenn die Un- seriale Abhängigkeit zu korrigieren. Andererabhängigkeit individueller Beobachtungswerte seits kann dieser so ökonomische Ansatz nur durch „ansteckende Effekte" nicht gewährdann praktische Anwendung finden, wenn es leistet ist; adäquate Strategien gibt, Daten aus Einzelfall— das Einzelexperiment bietet Experimentieruntersuchungen zu verarbeiten. möglichkeiten auch dort, wo der Begriff .ZuEine Durchsicht der empirischen Arbeiten fallsstichprobe' nicht mehr zutrifft (wenn es ergibt, daß sich die Verfahrensweise der Einzelsich beispielsweise um eine anfallende Stichfalluntersuchungen unter drei große Gruppen probe handelt!); subsumieren lassen: — es empfiehlt sich, wenn aufwendige Längsschnittuntersuchungen durchgeführt werden — das „single-subject" Design, müssen; — die P-Technik und ihre Modifikationen und — die Zeitreihenanalysen. — es sollte zum Einsatz kommen, wenn ethische Bedenken angebracht sind.

221

Zeitschrift für Sozialpsychologie 1 9 7 6 , 7, 2 1 7 - 2 3 0

„Single-subject"

Design

Untersuchungen nach dem „single-subject" Design lassen bereits die ökonomische Experimentierweise erkennen, rekurrieren jedoch auf die herkömmlichen Auswertungskonzepte (vgl. SHINE & BOWER 1971; SHINE 1973a, 1973b, 1974, 1975). Kerngedanke dieser experimentellen Vorgehensweise ist der, daß sich die wahre Merkmalsausprägung einer Person zum Zeitpunkt nicht nur über den durchschnittlichen Stichprobenmittelwert einer homogenen Stichprobe bestimmen läßt, sondern ebenso als mittlerer individueller Reaktionswert der untersuchten Person. Dementsprechend wird eine Versuchsperson zu jedem Untersuchungszeitpunkt wiederholt getestet und ihr durchschnittlicher Reaktionswert, als wahrer Wert, rechnerisch bestimmt. Voraussetzung für dieses Schätzverfahren ist jedoch, daß die einzelnen Messungen jedes Untersuchungszeitpunktes unabhängig voneinander sind und eine Normalverteilung in bezug auf die wirkliche Merkmalsausprägung aufweisen. Diese Prämissen sind bei wiederholtem Einsatz des gleichen Meßinstruments nicht haltbar. Die „wahren" Merkmalsausprägungen aus Untersuchungen nach dem „single-subject" Design sind damit in aller Regel sowohl durch Abhängigkeiten der Messungen über die Zeitspanne als auch Abhängigkeiten der Einzelbeobachtungen verzerrt. Zudem wurde der wichtige Schritt der Generalisierung von Einzelbefunden im Hinblick auf Gruppenaussagen in dieser Art Untersuchungen noch nicht vollzogen.

P-Technik und ihre

Modifikationen

Die P-Technik geht auf frühe Arbeiten von CAT(1946, 1951a, 1951b) zurück und wurde umfassend von CATTELL (1963, 1966a, 1966b) diskutiert. Gemäß ihrer Position im CATTELLschen Kovariationswürfel bietet sie die Möglichkeit, mehrere Meßwertreihen einer Person auf ihre faktorielle Struktur zu reduzieren. Besonders ANDERSON (1958, 1963) und HOLTZMAN (1962) haben daraufhingewiesen, daß sie diesem Anspruch nicht gerecht werden kann, weil sie auf die Unabhängigkeit der Beobachtungen angewiesen ist. Unabhängige Beobachtungen sind in Mehrzeitpunktuntersuchungen in aller TELL

Regel nicht anzutreffen. Auf weitere Schwächen der P-Technik gehen ANDERSON ( 1 9 6 3 ) und ÜBERLA ( 1 9 7 1 ) ein. So ist sie nicht imstande, die Richtung der Wirkungen in einer Meßwertsequenz offenzulegen. Dies bedeutet, daß man die Meßwerte einer Zeitreihe in beliebiger Abfolge in die Analyse eingehen lassen könnte, ohne daß sich die Faktorenstruktur verändern würde. Diese Tatsache schwächt die Interpretationsbasis für die Faktoren entscheidend. Daneben erlaubt sie keine Relativierung der Bedeutung von einzelnen Variablen. Variablen, die potentielle Verursacher von Merkmalsänderungen sein können, werden ebenso verarbeitet wie Variablen, die keinerlei Wirkungen auf andere ausgeübt haben (vgl. P-Analyse von MEFFORD, MORAN & KIMBLE 1 9 5 8 ; in dieser Analyse kann die Ausprägung der Temperatur die der Leistung beeinflussen, eine Wirkung in umgekehrter Richtung ist nicht vorstellbar). CATTELL (1957) erhoffte sich vom Einsatz von Markiervariablen aus R-Analysen wichtige Hinweise für die Interpretation von individuellen Faktoren. Diese Modifikation der P-Technik wird von ANDERSON (1963) kritisiert, da nicht angenommen werden kann, daß Repräsentanten von Gruppenfaktoren gleichzeitig Repräsentanten der Veränderung bei Individuen sind. Neuere Modifikationen der P-Technik, wie die zeitkorrigierte P-Technik („time corrected lead and lagtechnique"; CATTELL 1966b) scheinen einen Schritt weiterzuführen, da sie bereits die seriale Abhängigkeit der Meßwerte zu kontrollieren suchen.

Zeitreihenanalysen Zeitreihenanalysen fassen die Merkmalsausprägungen zu verschiedenen Beobachtungszeitpunkten als Ausdruck eines prozessualen Verlaufs auf und intendieren die Zerlegung in die Komponenten ihrer Entwicklung. HOLTZMAN (1963), der Wesentliches dazu beitrug, daß solche Verfahren in psychologischen Mehrzeitpunktuntersuchungen zur Anwendung kamen, unterschied drei Komponenten einer Meßwertsequenz: — den Trend oder die Langzeitbewegung, der „die Positionseffekte entlang der Zeitachse dokumentiert" (vgl. auch HUBER 1967, S. 290; BALDWIN 1950);

222 — die Oszillation um den Trend und — die Fehlerkomponenten oder Restkomponente, die Schwankungen um eine für das Individuum charakteristische Merkmalsausprägung anzeigt (HUBER 1967, S. 290). Man kann nun systematisch die einzelnen Komponenten schätzen und damit die Frage beantworten, welchen Anteil die Einzelkomponenten am Verlauf des Gesamtprozesses haben. Einen Dekompensationsprozeß, bei dem der Gesamtverlauf sukzessiv in seine Komponenten zerlegt wird, zeigt HUBER (1967). Zur Strukturierung der Zeitreihen können wir von folgender graphischen Darstellung aus-

Petermann & Knopf: Einstellungsänderungen II

Stochastische Prozesse In der graphischen Darstellung (Abb. 1) werden stochastische Prozesse in stationäre, in denen „Mittelwert und Varianz der Meßwerte und die Wahrscheinlichkeitsstruktur von der Zeit unabhängig sind" (FAHRENBERG 1968, S. 66), charakterisiert dadurch, daß sie um einen konstanten mittleren Level pendeln. Die nicht-stationären Prozesse sind transformationsinvariant hinsichtlich der Zeitachse, d.h. sie enthalten Periodizitäten und monotone Trends (vgl. FAHRENBERG 1968). Die D e k o m p e n s a t i o n solcher

Meßwertabfolgen ist für die Erforschung von Veränderungen im psychologischen Bereich von eigentlicher Bedeutung. Auf eine weitere Klassifizierung der Zeitreihen durch COLEMAN (1968)

sei lediglich verwiesen.

Stationäre Prozesse HOLTZMAN ( 1 9 6 3 ) schlägt als D e k o m p e n s a t i o n s -

strategie für stochastische Prozesse vor, zunächst Autokorrelationskoeffizienten zu bestimmen, die Hinweise dafür geben können, wie sehr die

Abb. 1: Modelle der Zeitreihenanalyse (Drei-Komponenten-Modell).

Fall (1) - Autokorrelation VARa

1 2 3 4 5

VARa

(lag = 3) n

1 2 3 4 5 (n-3)(n-2)(n-l) n

gehen (vgl. Abb. 1); sie basiert auf den unterschiedlichen Möglichkeiten der Meßwertzerlegung und zeigt, daß Zeitreihen als deterministische Beschreibungsmodelle (deterministische Prozesse) oder stochastische Prozesse aufgefaßt werden können. Nur für Veränderungen im physikalischen Bereich dürfte es möglich sein, deterministische Beschreibungsmodelle zu erstellen, die die vollständige Bestimmung der Zustandsausprägung zu jedem Zeitpunkt erklären

VARa

1 2 3 4 5

n

VARb

1 2 3 4 5

n

(vgl. B o x & JENKINS 1 9 7 0 ; ANDERSON 1 9 7 1 ) . I m

Fall (3) -

Bereich der psychologischen Forschung treten im Untersuchungszeitraum jeweils eine Anzahl unbekannter Störfaktoren auf, so daß vor allem stochastische Modelle die dort beobachteten Zeitreihen beschreiben können. Änderungsverläufe können demnach immer nur mit einer bestimmten Wahrscheinlichkeit erklärt und vorhergesagt werden.

(zwischen VAR a und VAR a liegt eine Zeitverschiebung von lag = 3 vor) Fall (2) -

Serialkorrelation

(zwischen VAR a und VAR b liegt keine Zeitverschiebung vor)

VARa VARb

Serialkorrelation

1 2 3 4 5 1 2 3 4 5

(lag = 2) n (n-2)(n-l)n

(zwischen VAR a und VAR b liegt eine Zeitverschiebung von lag = 2 vor) Abb. 2: Darstellung der Serialkorrelation und Autokorrelation (in Anlehnung an CATTELL 1966b).

223

Zeitschrift für Sozialpsychologie 1976, 7, 2 1 7 - 2 3 0

sukzessiven Beobachtungen voneinander abhängig sind (Fehlerkomponente). Hierbei korreliert er jede individuelle Merkmalsentwicklung mit den zeitverschobenen gleichen Meßwertsequenzen (time lag 1, 2, 3 ...; vgl. Abb. 2: Fall 1). Zur Signifikanzprüfung der Autokorrelationen greift HOLTZMAN (1963) auf die herkömmlichen Prüfverfahren für Rangkorrelationen zurück. Im Fall der signifikanten Ausprägung der Autokorrelationen liegen Veränderungen vor, die durch Abhängigkeit der Messungen voneinander geprägt sind. Diese sollten nach HOLTZMAN (1963) anhand von Markoff-Ketten beschrieben werden. Herkömmliche statistische Auswertungsmethoden (t-Test; P-Technik, usw.) sind im Falle nicht-signifikanter stationärer Meßwertsequenzen anwendbar.

Nicht-stationäre

Zusammenhänge mit Drittvariablen prüft über seriale Korrelationskoeffizienten (vgl. Abb. 2: Fall 2 und 3). Signifikanzprüfungen von serialen Korrelationen ermöglicht der BARTLEIR-Test ( B A R T L E T T 1 9 3 5 ) bei mehr als 30 Beobachtungen in der Meßwertsequenz. Dieser korrigiert den Grad der Autokorrelation in den beiden korrelierten Änderungsverläufen über eine Reduktion der Freiheitsgrade (vgl. auch HOLTZMAN 1 9 6 2 ) . Zeitverschobene Serialkorrelationen lassen sich über den von QUENOUILLE ( 1 9 5 2 ) entwickelten „lagged partial correlation coefficient" berechnen. Nach QUENOUILLE ( 1 9 5 7 ) können auch multiple zeitverschobene Interkorrelationen zwischen einzelnen Merkmalsentwicklungen errechnet werden.

Die Kritik an der oben diskutierten Unterteilung in drei Prozeßkomponenten (Drei-Komponenten-Modell) blieb nicht aus (vgl. HEILER 1970), und es ist gerade in der Psychologie schwer bestimmbar, welche Prozesse längerfristige und welche kurzfristige Veränderungen hervorrufen. Für eine solche Betrachtung fehlen theoretische Vorannahmen, wie etwa über den Prozeß der kurz- und längerfristigen Änderung von Einstellungen. So geben neuere Modelle der Analyse von Zeitreihen, wie die Spektralanalyse (vgl. FAHRENBERG 1968, S. 66 ff.; H E I LER 1970), eine Trennung der Prozeßkomponenten auf. Sie fassen die Merkmalsentwicklung als Realisation eines schwach stationären Prozesses auf (vgl. G A R B E R S 1970; WETZEL 1970). G A R B E R S (1970) diskutiert die Möglichkeiten des Einsatzes von Spektralanalysen bei nichtstationären Zeitreihen.

HOLTZMAN ( 1 9 6 3 )

Einige Anwendungsbeispiele für die Analyse von stationären Veränderungsprozessen finden sich bei D A H M E et al. ( 1 9 7 6 ) und H U B E R ( 1 9 7 4 ) ,

Prozesse

Mit dem „integrated moving average model of second order" (GoTTMAN-Modell) stellt G O T T MAN (1973, S. 102) eine Auswertungsstrategie vor, mit der nicht-stationäre Prozesse analysiert werden können. FREDERICSEN (1974) zeigt, wie auch multiple Zeitreihen dekompensiert werden. Solche Analysen wurden in der Ökonometrie auf der Suche nach „lead indicators" ( G O T T MAN 1973, S. 100), die als Prädiktoren für Fluktuationen in anderen Merkmalsbereichen gelten, schon früher durchgeführt.

Spektralanalyse

d i e m i t d e m B O X - T I A O - V e r f a h r e n ( B o x & TIAO

1965) stationäre autoregressive Prozesse erster Ordnung analysieren. Ferner bei D A H M E ( 1 9 7 5 ) , der mit Hilfe autoregressiver Analysen (SCHNEEWEISS 1 9 7 1 ) Autokorrelationen und Serialkorrelationen bestimmt. GOTTMAN ( 1 9 7 3 , S. 1 0 2 ) demonstriert, daß das Box-TiAO-Verfahren ( 1 9 6 5 )

auch auf nicht-stationäre Änderungsprozesse anwendbar ist, solange lediglich die Oszillationskomponente einer nicht-stationären Veränderung unterworfen ist. JONES et al. ( 1 9 6 9 ) liefern hierzu ein Analysebeispiel.

Resümee

Der allgemeine Wert der Verfahren zur Analyse von Zeitreihen wird stark diskutiert (vgl. SCHÄFER 1970: Konventionelle Methoden; G A R B E R S 1970, WETZEL 1970: Spektralanalysen). Die Bedeutung dieser Analysekonzepte für psychologische Fragestellungen der Veränderungsmessung beginnt sich erst abzuzeichnen. Wir teilen die Auffassung FAHRENBERGS (1968, S.76), daß Zeitreihenanalysen zu den methodischen Konzepten gehören, die Möglichkeiten einer exakten quantitativen Beschreibung von dynami-

224

P e t e r m a n n & K n o p f : E i n s t e l l u n g s ä n d e r u n g e n II

sehen Prozessen zu eröffnen scheinen. Doch reichen die vielfältigen vorliegenden Strategien aus der Ökonometrie für die Analyse von psychologischen Veränderungen nicht aus. Eine Sichtung der brauchbaren Verfahren und eine Ergänzung des Analysespektrums im Hinblick auf psychologische Änderungsverläufe scheint notzutun. Das Problem der Generalisierung von Befunden aus individuellen Verlaufsanalysen auf Gruppen ist noch weitgehend ungelöst. LIENERT (1971) zeigt eine Verfahrensweise, wie individuelle Verlaufsmuster mittels hierarchischer Klassifikation gruppiert werden können. HUBER (1973, S. 243) sieht dieses Problem als Analogon zu Schwierigkeiten der experimentellen Psychologie, Ergebnisse aus unterschiedlichen Stichproben zu kombinieren. Für beide scheinen Lösungen noch nicht vorzuliegen.

delle liegen dann vor, wenn einer Klasse von psychologischen Aussagen eindeutig bestimmte mathematische Beschreibungselemente zugeordnet werden können, und wenn über den Vergleich der mathematischen Relationen ein Vergleich der psychologisch-inhaltlichen Konzeptionen möglich wird. Das Hauptproblem der Konstruktion solcher Modelle besteht darin, einerseits hinreichende Spezifität der Modellstruktur herzustellen, so daß bestimmte psychologische Theorien durch das Modell ausgeschlossen werden bzw. das Modell durch empirische Befunde falsifiziert wird; andererseits keine „unrealistischen Modelle" ( K E M P F 1974a) zu konstruieren, die von beliebigen Daten widerlegt werden.

Nicht-Numerische

Modelle

Graphentheorie Mathematische Modellbildung Die Konstruktion von mathematischen Modellen intendiert im wesentlichen zwei Ziele (vgl. KEMPF 1974a, S.16): — die Präzisierung psychologischer Konzepte und — die Herstellung einer eindeutigen Zuordnung zwischen inhaltlich-psychologischen Theorien und den Methoden ihrer Überprüfung. Zur Realisierung dieser Anliegen stellt KEMPF (1974a, S. 17) an die komplexeren explikativen Modelle zwei Grundforderungen: — die eindeutige Interpretierbarkeit der Modellstruktur und der Modellparameter muß gewährleistet sein; d.h. das Modell darf nur solche Annahmen enthalten, die inhaltlichpsychologische Äquivalente besitzen; — das Modell muß mathematisch handhabbar sein. Diese Forderung impliziert eine einwandfreie Bestimmung der Modellparameter, die Vergleichbarkeit der Modellparameter und die einwandfreie Prüfbarkeit der Modellstruktur. Die Vorzüge von mathematischen Modellen in der Sozialpsychologie werden u. a. von MCPHEE ( 1 9 6 3 ) MESSICK ( 1 9 6 8 ) , ROSENBERG ( 1 9 6 8 ) u n d TACK ( 1 9 6 9 )

diskutiert. Mathematische Mo-

Diese Modelle versuchen Personen und Gegenstände durch Punkte und die Beziehungen zwischen Personen und Gegenständen durch Linien zwischen diesen Punkten zu repräsentieren (vgl. COOMBS et al. 1 9 7 5 , S . 9 8 ) . Besonders bekannt sind hier Arbeiten von CARTWRIGHT & HARARY ( 1 9 5 6 ) u n d H A R A R Y , NORMAN & CARTWRIGHT ( 1 9 6 5 ) . Diese Autoren veranschaulichten durch die Graphentheorie das HEiDERsche Balance Modell ( H E I D E R 1 9 5 8 ) , und sie versuchten dabei die Einflußparameter des Meinungswandels, die interpersonalen Beziehungen (P-O-X), in Relation zu setzen und zu verdeutlichen (vgl. auch MAYNTZ 1 9 6 7 ) . Wenn man davon absieht, daß mit Hilfe der Graphentheorie das Balance-Modell von HEIDER generalisiert und erweitert werden konnte ( O E R T E R 1 9 7 0 , S. 2 6 f f . ; REINECKER 1 9 7 5 ) , dann erkennt man die engen Grenzen dieser Formalisierungsversuche, die die Vielfalt und Komplexität der Prozesse des Attitüdenwandels nur schwer in diesem System zu erfassen und widerzuspiegeln vermögen (vgl. OERTER 1 9 7 0 , S.30f.).

Computersimulation Computersimulationen sind nicht-numerische Verhaltensmodelle, „denn es wird eine Entsprechung zwischen einem empirischen Prozeß und

225

Z e i t s c h r i f t für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7, 2 1 7 - 2 3 0

einem formalen Relativ, das aus den Anweisungen des Programms besteht, hergestellt; das Programm selbst ist das Modell" (COOMBS et al. 1975, S. 127). Solche Modelle werden von ABELSON & CARROLL (1965) diskutiert. Den Prozeß der Einstellungsänderung während einer Gruppendiskussion zum Thema der Fluorisierung des Trinkwassers erfaßt ABELSON (1964) in einem Modell, das Einstellungsänderungen als Funktion von 27 Determinanten beschreibt. Variablen wie „Interesse am Thema", „Einstellung gegenüber den Diskussionsteilnehmern", „Art und Anzahl der bekannten Argumente für oder gegen die Fluorisierung" müssen dabei als zeitlich variable Größen berücksichtigt werden. Die Möglichkeit der Formalisierung von beliebigen Kombinationen der einzelnen Wirkgrößen läßt zugleich die Hauptschwäche der Simulation erkennen: ein komplexes Modell ist durch widersprechende empirische Daten nur schwer zu Fall zu bringen, da über Variationen der Teilsysteme stets Modifikationen des Modells erzielt werden können. Umgekehrt vermögen empirische Daten auch ein falsches Modell zu bestätigen, wenn die Mängel des Modells sich gegenseitig aufheben. Eine umfassende Arbeit legen GULLAHORN & im Rahmen der Soziologie vor, wo die meisten Formalisierungsversuche über Computersimulation vorliegen (vgl. auch GULLAHORN ( 1 9 6 5 )

COLEMAN e t a l . 1 9 6 2 ; M C P H E E 1 9 6 3 ) . E s w e r -

den dort häufig prognostische Simulationen durchgeführt, in denen versucht wird, Meinungsänderungen im Rahmen von Wahlvoraussagen zu bestimmen (vgl. EYFERTH & KREPPNER 1 9 7 2 ) . Eine abschließende Wertung des Nutzens der Simulationstechniken ist schwer möglich (vgl. HARBORDT 1974a, 1974b). So glaubt ANDERSON (1968) in der Computersimulation eine hervorragende Möglichkeit der Integration empirischen und theoretischen Wissens gefunden zu haben. Andererseits konnten GULLAHORN & GULLAHORN (1972) nach sehr umfassenden Forschungsbemühungen den erwarteten Gewinn der Simulation als Instrument der Theorienentwicklung und der Theorienprüfung nicht voll erfüllt sehen.

Differen tialgleich

ungsmodelle

Mit Hilfe von Differentialgleichungen in der Veränderungsmessung ist es möglich, Veränderungen nicht lediglich stochastisch zu beschreiben, sondern deterministische Beziehungen zwischen Veränderungsursachen und Effekten zu erfassen. FAHRENBERG (1968) stellt vornehmlich Anwendungsbeispiele durch biokybernetisch orientierte Physiologen dar, die die Reaktion von physiologischen Prozessen auf äußere Eingriffe im Sinne von Regelkreisen auffassen und die Übergangsfunktionen anhand von Differentialgleichungen beschreiben. ABELSON (1964) stellt Anwendungsbeispiele dieses Konzepts im Bereich der Einstellungsforschung vor. Um FRENCHS „theory of social power"(1965) zu überprüfen, registriert er die Interaktion einer Gruppe Arbeiterinnen in einem symmetrischen Kommunikationssystem (vgl. auch GULLAHORN 1952) und dokumentiert die Ergebnisse in einer Kontakthäufigkeitsmatrix. Aus dem kommunikativen Übergewicht einzelner Partner schließt er auf Wirkungen dieser aktiveren Teilnehmer gegenüber anderen. Da gegenseitige Interaktion möglich ist, gehen die Wirkungen über einzelne Partner hinaus, so daß das gesamte System der endgültigen gemeinsamen Position zustrebt. Die „attitude-entropy" (ABELSON 1964, S. 164) geht verloren. Mit Hilfe von Kommunikationsvektoren, die die Polaritäten zwischen den einzelnen Gruppenteilnehmern hinsichtlich eines Diskussionsgegenstandes darstellen, gelingt es, den Veränderungsprozeß zu verfolgen. Das System ist wieder im Gleichgewicht, wenn die Veränderungsindikatoren über alle Gruppenteilnehmer Null sind. Prinzipiell können zwei Diskussionsergebnisse diese mathematische Lösung bedingen: sehr kontroverse Themen führen zum Diskussionsende, ohne die gemeinsame Lösung erbracht zu haben (vgl. auch COLEMAN 1957); weniger umstrittene Themen führen approximativ zum gemeinsamen Ergebnis. Es ist jedoch mathematisch entscheidbar, welche der beiden Lösungen vorliegt. Die Erfassung von komplexeren sozialpsychologischen Theorien zur Einstellungsänderung verlangt Modifikationen des einfachen mathematischen Modells. Für die Theorien von THIBAUT & KELLY (1954), TANNENBAUM (1956) und SHERIF & H O V L A N D (1961), die für Indivi-

226 duen mit extremen Ausgangspositionen eine besondere Resistenz gegenüber Änderungen vorhersagen, erfolgte eine Modifikation in ein nichtlineares Modell. Eine Revision der ursprünglichen Konzeption liegt auch für Theorien vor, die die Variablen der Glaubwürdigkeit („persuasiveness — persuability") berücksichtigen. Weitere Revisionen wurden angeregt (vgl. CERVIN & HENDERSON 1 9 6 1 ) . Differentialgleichungsmodelle weisen starke Restriktionen auf, und dies kann oft zu Falsifikationen eines Modells führen; jede Falsifikation aber ist mit einem neuen Erkenntnisgewinn verbunden. Insgesamt besteht jedoch die Gefahr des unökonomischen „Konstruierens und Probierens" mit Differentialgleichungsmodellen zur Beschreibung der Einstellungsänderung.

Markoffmodelle

Eine weitere Möglichkeit, Einstellungsänderungen zu beschreiben und vorherzusagen, ergibt sich aus der Anwendung von Markoffmodellen. Eine kurze einführende Ubersicht über grundlegende Begriffe und die Einordnung der Markoffmodelle in die Theorie der stochastischen Prozesse geben RHENIUS ( 1 9 7 4 ) und COOMBS et al. ( 1 9 7 5 ) . Solche Markoffmodelle, d.h. Markoffketten bei diskreten Zeitzuständen und stochastische Prozesse bei kontinuierlichen Zeitzuständen, wurden schon relativ früh zur Beschreibung von Einstellungsänderungen eingesetzt (ANDERSON 1 9 5 5 ; LAZARSFELD 1 9 6 5 ) . ANDERSON ( 1 9 5 5 ) analysiert beispielsweise Ergebnisse einer Panelbefragung vor den Präsidentschaftswahlen von 1940 in den USA mit Hilfe eines Markoffketten-Modells. Er geht dabei von Fluktuationstabellen mit veränderlichen Randverteilungen aus, in denen die Antworten zu zwei verschiedenen Zeitpunkten hinsichtlich einer politischen Frage abgetragen sind. A N D E R SON (1955) erhält als Endzustand der Meinungsbildung einen Prozeß, der sich im Gleichgewicht befindet, d.h. gleich viele Personen ändern sich in die eine und die andere Richtung, und somit bleibt die Randverteilung konstant. Es werden damit von ANDERSON ( 1 9 5 5 ) konstante Übergangswahrscheinlichkeiten ( a n und a 21 ) vorausgesetzt (vgl. NEHNEVAJSA 1 9 7 4 ) . Diese Übergangswahrscheinlichkeiten geben die empirische

P e t e r m a n n & K n o p f : E i n s t e l l u n g s ä n d e r u n g e n II

Wahrscheinlichkeit an, in der ein Befragter sich zu einem Zeitpunkt t, im Zustand i, und zu einem anderen Zeitpunkt t + 1, im Zustand k, befindet. Ist i = k, dann hat sich die Meinung der Befragten nicht verändert. Dieses relativ einfache Konzept wurde von COLEMAN ( 1 9 6 4 ) weiterentwickelt. Er geht von Markoffketten m-ter Ordnung aus, wobei die Übergangswahrscheinlichkeiten zwischen t und t + 1 von m vorhergehenden Zuständen abhängen. COLEMAN ( 1 9 6 4 ) untersucht die Bedingungen, „die sich ergeben, wenn man in dem dynamischen System außer dem zugrundeliegenden Markoffprozeß auch Meßfehler berücksichtigt" (NEHNEVAJSA 1 9 7 4 , S. 2 0 0 ) . In einem weiteren Entwicklungsschritt wurden diese Modelle, die von diskreten Prozessen ausgehen, auf kontinuierliche Prozesse ausgedehnt (vgl. Modelle mit kontinuierlichen Übergangswahrscheinlichkeiten in u. a. BARTHOLOMEW 1 9 6 7 ) . COLEMAN versuchte im Rahmen dieser Weiterentwicklung die Übergangsraten (vgl. COLEMAN 1 9 6 4 ) in Effekte zu trennen, die durch den Zufall (Zufallsschwankung, Oszillation) und durch reale Variation der Variablen (Trend) hervorgerufen wurden. An dieser Stelle zeichnen sich die Anwendungsmöglichkeiten der Marko ffmodelle zur Beschreibung von Veränderungsaussagen ab.

Ausblick Die vorgestellten neueren Entwicklungen zur Analyse von Veränderungsaussagen zeigen auf verschiedenen Ebenen Wege, Mehrzeitpunktuntersuchungen durchzuführen und auszuwerten. Eine Weiterentwicklung kann sich in verschiedener Richtung vollziehen. So bringt eine Konstruktion mathematischer Modelle eine Präzisierung psychologischer Konzepte mit sich, wobei das Grundproblem in einer adäquaten Beschreibung von psychologischen Prozessen durch mathematische Termini besteht; diese Schwierigkeiten können durch eine wechselseitige Modifikation von mathematischen Modellen einerseits und inhaltlich-psychologischen Theorien andererseits behoben werden. Die Zeitreihenanalyse kann unter Berücksichtigung der spezifischen psychologischen Konzepte und Fragestellungen sehr vorteilhaft zur Analyse von Veränderungen eingesetzt werden.

Zeitschrift für Sozialpsychologie 1976, 7, 2 1 7 - 2 3 0

Dieser Ansatz hinterfragt die herkömmliche Experimentierweise, die grundlegende Schwierigkeiten bei der Untersuchung von Veränderungen nicht überwinden konnte. Die Zeitreihenanalyse kann so in positiver Weise auf die Problemstellungen der Veränderungsmessung rückwirken. Literatur ABELSON, R.P. 1964. Mathematical models of the distribution of attitudes under controversy. In: N.Frederiksen & H.Gulliksen (Eds.): Contributions to mathematical psychology. New York: Holt, Rinehardt & Winston. ABELSON, R.P. 1968. Simulation of social behavior. In: G.Lindzey & E. Aronson (Eds.): H a n d b o o k of social psychology. Vol. 2. Reading, Massachusetts: Addison — Wesley Publishing Company, 2 7 4 - 3 5 6 . ABELSON, R.P. & CARROLL, J . D . 1965. Computer simulation of individual belief systems. American Behavioral Scientist, 8, 2 4 - 3 0 . ACE, M.E. & BARTH, R.T. 1973. The Rasch model in attitude measurement. Proceedings 81st Annual Convention APA. ANDERSON, T.W. 1955. Probability models for analyzing time changes in attitudes. In: P. F. Lazarsfeld (Ed.): Mathematical thinking in the social sciences. Glencoe, Illinois: The Free Press. ANDERSON, T.W. 1958. Comments on factor analysis of multiple time series. Paper presented at Symposium on multivariate analysis of repeated measurements on the same individual. American Psychological Association, Washington. ANDERSON, T.W. 1963. The use of factor analysis in the statistical analysis of multiple time series. Psychometrika, 28, 1 - 2 5 . ANDERSON, T.W. 1971. Time series analysis. New York: Wiley. BALDWIN, A.L. 1950. Statistical problems in the treatment of case custries. Journal of Clinical Psychology 6, 6—12. BARLOW, D.H. & HERSEN, M. 1973. Single-case experimental designs. Archives of general psychiatry 29, 319-325. BARTHOLOMEW, D.J. 1967. Stochastic models for social processes. New York: Wiley. BARTLETT, M.S. 1953. Some aspects of the time-correlation problem in regard to tests of significance. Journal of Royal Statistical Society 98, 5 3 6 - 5 4 3 . BEREITER, C. 1963. Some persisting dilemmas in the measurement of change. In: C.W.Harris (Ed.): Problems in measuring change. Madison, Milwaukee and London: The University of Wisconsin Press, 3—20. BJORK, B. A. 1973. Why mathematical models? American Psychologist 28, 4 2 6 - 4 3 3 . BOUDON, R. 1973. Mathematische Modelle und Methoden. F r a n k f u r t : Ullstein.

227 BOX, G.E.P. & JENKINS, G.M. 1970. Time series analysis: Forecasting and control. San Francisco: HoldenDay. B o x , G.E.P. & TIAO, G.C. 1965. A change in level of a non-stationary time series. Biometrika 52, 1 8 1 - 1 9 2 . CARTWRIGHT, D. & HARARY, F. 1956. Structural balance: A generalization of Heider's theory. Psychological Review 63, 2 7 7 - 2 9 3 . CATTELL, R. B. 1946. The description and measurement of personality. New York: World Book Company. CATTELL, R.B. 1951a. On the disuse and misuse of P, Q, Q' and O techniques in clinical psychology. Journal of clinical psychology 7, 203—214. CATTELL, R.B. 1951b. P-technique, a new m e t h o d for analyzing the structure of personal motivation. Academic Science Series II, 14, 2 9 - 3 4 . CATTELL, R.B. 1957. Personality and motivation: Structure and measurement. Yonkers on Hudson: World Book. CATTELL, R.B. 1963. The structuring of change by P-technique and incremental R-technique. In: C.W. Harris (Ed.): Problems in measuring change. Madison, Milwaukee and London: The University of Wisconsin Press, 167—198. CATTELL, R.B. (Ed.) 1966a. H a n d b o o k of multivariate experimental psychology. Chicago: Rand McNally. CATTELL, R.B. 1966b. Patterns of change: Measurement in relation to state-dimension, trait change, lability and process concepts. In: R.B.Cattell (Ed.): H a n d b o o k of multivariate experimental psychology. Chicago: Rand McNally. CERVIN, V.B. 1957. Relationship of ascendant-submisse behavior in dyadic groups of h u m a n subjects to their emotional responsiveness. Journal of Abnormal and Social Psychology 54, 241—249. CERVIN, V.B. & HENDERSON, G.P. 1961. Statistical theory of persuasion. Psychological Review 68, 157-166. COLEMAN, J.S. 1957. C o m m u n i t y conflict. New York: The Free Press. COLEMAN, J.S. 1962. Analysis of social structures and simulation of social processes with electronic computers. In: H.Guetzkow (Ed.): Simulation in social science. New York: Englewood Cliffs, 6 1 - 6 9 . COLEMAN, J.S. 1968. The mathematical study of change. In: H.Blalock & A.A.Blalock (Eds.): Methodology in social research. New York: McGraw Hill, 428-478. COOMBS, C . H . , DAWES, R . M . & T V E R S K Y , A . 1 9 7 5 .

Mathematische Psychologie. Weinheim u n d Basel: Beltz. COX, R.C. & VARGAS, I.S. 1973. Ein Vergleich von Itemauswahltechniken für normbezogene und kriterienbezogene Tests. In: P. Strittmatter (Hrsg.): Lernzielorientierte Leistungsmessung. Weinheim: Beltz, 104-114. DAHME, B. 1975. Zeitreihenanalyse des Psychotherapeutischen Prozesses. In: W.H.Tack (Hrsg.): Bericht über den 29. Kongreß der Dt. Gesellschaft für Psychologie. Göttingen: Hogrefe.

228 DAHME, B., MINSEL, W . R . & URSPRUCH, M. 1 9 7 6 . Be-

ziehungen zwischen gesprächspsychotherapeutischen Verhaltensmerkmalen und physiologischen Meßdaten eines Therapeuten und eines Klienten. Zeitschrift für klinische Psychologie (im Druck). DUKES, W.F. 1965. N = 1. Psychological Bulletin 64, 74-79. EYFERTH, K. & KREPPNER, K. 1 9 7 2 . E n t s t e h u n g , K o n -

stanz und Wandel von Einstellungen. In: C. F.Graumann (Hrsg.): Handbuch der Psychologie. Band 7, 2. Göttingen: Hogrefe, 1 3 4 2 - 1 3 7 0 . FAHRENBERG, J. 1968. Aufgaben und Methoden der psychologischen Verlaufsanalyse (Zeitreihenanalyse). In: K. J. Groffmann & K.H.Wewetzer (Hrsg.): Person als Prozeß. Bern und Stuttgart: Huber, 4 1 - 8 2 . FISCHER, G.H. 1972. A measurement model for the effect of massmedia. Acta Psychologica 36, 2 0 7 220.

FISCHER, G.H. 1974a. Einführung in die Theorie psychologischer Tests. Grundlagen und Anwendungen. Bern und Stuttgart: Huber. FISCHER, G. H. 1974b. Lineare logistische Modelle zur Beschreibung von Einstellungs- und Verhaltensänderungen unter dem Einfluß von Massenkommunikation. In: W. F.Kempf (Hrsg.): Probabilistische Modelle in der Sozialpsychologie. Bern und Stuttgart: Huber. FISHBEIN, M. (Ed.) 1967. Readings in attitudes theory and attitude measurements. New York: Wiley. FREDERIKSEN, C.H. 1974. Models for the analysis of alternative sources of growth in correlated stochastic variables. Psychometrika 39, 2 2 3 - 2 4 5 . FRENCH, J.R.P. 1965. A formal theory of social power. Psychological Review 63, 181—194. FRICKE, R. 1972. Meßmodelle in der Schulleistungsdiagnostik. Düsseldorf: Schwann. FRICKE, R. 1974. Kriteriumsorientierte Leistungsmessung. Stuttgart und Berlin: Kohlhammer. GARBERS, H. 1970. Probleme bei der praktischen Anwendung spektralanalytischer Methoden auf ökonomische Zeitreihen. In: W. Wetzel (Hrsg.): Neuere Entwicklungen auf dem Gebiet der Zeitreihenanalyse. Sonderhefte zum allgemeinen statistischen Archiv. Göttingen: Vandenhoeck & Ruprecht, 1, 47—65. GASTWIRTH, J . L . & COHEN, M . L . 1 9 7 0 . S m a l l s a m p l e

behavior of robust linear estimators of location. Journal of the American Statistical Association 65, 946-973. GLASS, G. V., WILLSON, V . K . & GOTTMAN, J . M . 1 9 7 3 .

The design and analysis of time series experiments. Boulder, Colo.: Laboratory of educational research Press. GOTTMAN, J.M. 1973. N-of-one and N-of-two research in psychotherapy. Psychological Bulletin 80, 9 3 105. GOTTMAN, J . M . , MCFALL, R . M . & BARNETT, J . T . 1 9 6 9 .

Design and analysis of research using time series. Psychological Bulletin 72, 2 9 9 - 3 0 6 . GRUBER, M.E. & WEITMAN, M. 1962. Item analysis and measurement of change. Journal of Educational Research 55, 2 8 7 - 2 8 9 .

Petermann & Knopf: Einstellungsänderungen II GULLAHORN, J.T. 1952. Distance and friendship as factors in the cross interaction matrix. Sociometry 15, 123-134. GULLAHORN, J . T . & GULLAHORN, J . E . 1 9 6 5 . S o m e

computer applications in the social sciences. American Sociological Review 30, 353—365. GULLAHORN, J . T . & GULLAHORN, J . E . 1 9 7 2 . A n o n -

random walk in the Odyssey of a computer model. In: M. Inber & C. S. Stoll (Eds.): Simulation and gaming in the social science. New York and London: The Free Press, 1 8 9 - 2 0 4 . GULLIKSEN, H. 1950. Theory of mental tests. New York: Wiley. GUTTMAN, L. 1950. The basis of scalogram analysis. In: S.A.Stouffer (Ed.): Studies in social psychology in world war II. Vol. IV. Princeton and New York: Princeton University Press. HARARY, F . , NORMAN, R . Z . & CARTWRIGHT, D. 1 9 6 5 .

Structural models: an introduction to the theory of directed graphs. New York: Wiley. HARBORDT, S. 1974a. Computersimulation in den Sozialwissenschaften. Einführung und Anleitung. Hamburg: Rowohlt. HARBORDT, S. 1974b. Computersimulation in den Sozialwissenschaften. Beurteilung und Modellbeispiele. Hamburg: Rowohlt. HARRIS, N.D.C. 1974. An index of effectiveness for criterionreferenced items used in pre-tests and posttests. Programmed Learning and Educational Technology 11, 1 2 5 - 1 3 2 . HEIDER, F. 1958. The psychology of interpersonal relations. New York: Wiley. HEILER, S. 1970. Theoretische Grundlagen des „Berliner Verfahrens". In: W. Wetzel (Hrsg.): Neuere Entwicklungen auf dem Gebiet der Zeitreihenanalyse. Sonderhefte zum allgemeinen statistischen Archiv, Heft 1. Göttingen: Vandenhoeck & Ruprecht. HIMMELFARB, S. & EAGLY, A . H . ( E d s . ) 1 9 7 4 . R e a d -

ings in attitude change. New York: Wiley. HOLTZMAN, W.H. 1963. Statistical models for the study of change in the single case. In: C.W.Harris (Ed.): Problems in measuring change. Madison, Milwaukee and London: The University of Wisconsin Press, 1 9 9 - 2 1 1 . HUBER, H.P. 1967. Zeitreihenanalyse im diagnostischen Einzelfall. In: M.Irle (Hrsg.): Bericht über den 25. Kongreß der Dt. Gesellschaft für Psychologie. Göttingen: Hogrefe, 2 8 8 - 2 9 4 . HUBER, H.P. 1973. Psychometrische Einzelfalldiagnostik. Weinheim und Basel: Beltz. HUBER, H.P. 1974. Zur zufallskritischen Beurteilung behandlungsbedingter Veränderungen bei Zeitreihenplänen. Vortrag zum 29. Kongreß der Dt. Gesellschaft für Psychologie in Salzburg. INSKO, C. A. 1967. Theories of attitude change. New York: Appleton-Century-Crofts. JONES, R . H . , CROWELL, D . H . & KAPUNIAI, L . E . 1 9 6 9 .

Change detection model for serially correlated data. Psychological Bulletin 71, 3 5 2 - 3 5 8 . KEMPF, W.F. 1974a. Dynamische Modelle zur Messung

Zeitschrift für Sozialpsychologie 1976, 7, 2 1 7 - 2 3 0

sozialer Verhaltensdispositionen. In: W . F . K e m p f (Hrsg.): Probabilistische Modelle in der Sozialpsychologie. Bern u n d S t u t t g a r t : Huber. KEMPF, W.F. 1974b. A d y n a m i c m o d e l f o r measuring individual and situative influences o n social behavior. In: G. B r u c k m a n n , F. Ferschl & L. S c h m e t t e r e r (Eds.): C o m p s t a t 1974. Proceedings in c o m p u t a t i o n a l statistics. Wien: Physica-Verlag. KEMPF, W.F., HAMPAPA, P. & MACH, G. 1975. Conditional m a x i m u m likelihood estimation f o r a d y n a m i c test model. Institut für die Pädagogik der Naturwissenschaften. IPN Arbeitsberichte No. 13, Kiel. KIESLER, C.A., COLLINS, B . E . & MILLER, N. 1969. A t t i t u d e change. New Y o r k : Wiley. KLEIN, S.P. 1971. T h e uses and limitations of standardized tests in meeting the d e m a n d s f o r accountability. Evaluation C o m m e n t 2, 1—7. KRIZ, J. 1973. Statistik in den Sozial Wissenschaften. Hamburg: R o w o h l t . LAZARSFELD, P. F. 1965. Repeated observations on a t t i t u d e and behavior items. In: S.Sternberg (Ed.): Mathematics and social sciences. Paris: M o n t o n & C o . , 121-142. LIENERT, G. A. 1971. Hierarchische Klassifikation individueller Verlaufskurven. Psychologische Beiträge 13, 487-498. MALADYNA, T.M. 1974. E f f e c t s of d i f f e r e n t samples on item and test characteristics of criterion-referenced tests. J o u r n a l of E d u c a t i o n a l Measurement 11, 93-99. MAYNTZ, R. (Hrsg.) 1967. Formalisierte Modelle in der Soziologie. Neuwied u n d Berlin: L u c h t e r h a n d . MCPHEE, W.N. (Ed.) 1963. F o r m a l theories of mass behavior. New Y o r k : Free Press. MEFFERD, R.B., MORAN, I.J. & KIMBLE, J . P . 1958. Use of f a c t o r analytic technique in the analysis of long t e r m repetitive m e a s u r e m e n t s made u p o n a single schizophrenic patient. Paper presented at Symposium on multivariate analysis of repeated measurem e n t s on the same individual. American Psychological Association, Washington. MESSICK, S. (Ed.) 1968. Mathematical thinking in behavioral sciences. San Francisco: F r e e m a n . NAMBOODIRI, N . K . 1972. E x p e r i m e n t a l designs in which each subject is used repeatedly. Psychological Bulletin 77, 5 4 - 6 5 . NEHNEVAJSA, J. 1974. Analyse von Panel-Befragungen. In: R . K ö n i g (Hrsg.): H a n d b u c h der empirischen Sozialforschung. Band 2. Stuttgart: E n k e , 1 9 1 - 2 2 7 . OERTER, R. 1970. S t r u k t u r u n d Wandlungen von Werthaltungen. München u n d Wien: Oldenburg. POPHAM, W. J. 1971. Indices of adequacy f o r criterionreferenced test items. In: W . J . P o p h a m (Ed.): Criterion-referenced m e a s u r e m e n t . New Y o r k : Educational Technology Publications. QUENOUILLE, M.H. 1952. Associated measurements. New Y o r k : Academic Press. QUENOUILLE, M.H. 1957. T h e analysis of time series. New Y o r k : Hafner. RAPOPORT, A. 1963. Mathematical models of social in-

229 teraction. In: R. D. Luce, R. R. Bush & E. Galanter (Eds.): H a n d b o o k of m a t h e m a t i c a l psychology. New Y o r k : Wiley. RASCH, G. 1960. Probabilistic models f o r some intelligence and a t t a i n e m e n t tests. K o p e n h a g e n : Nielson & Lydicke. REINECKER, H. 1975. Modelltheoretische Kriterien für ein graphentheoretisches Modell der Gleichgewichtstheorie von F. Heider. In: W . H . T a c k (Hrsg.): Bericht über den 29. K o n g r e ß der Dt. Gesellschaft für Psychologie. Göttingen: Hogrefe, 3 8 7 - 3 8 9 . RENN, H. 1973. Die Messung von Sozialisierungswirkungen. München u n d Wien: Oldenburg. RHENIUS, D. 1974. E i n f ü h r u n g in die Theorie der Markov-Ketten. In: L.Eckensberger (Hrsg.): Bericht über den 28. K o n g r e ß der Dt. Gesellschaft für Psychologie. G ö t t i n g e n : Hogrefe, 1 2 7 - 1 3 6 . ROSENBERG, S. 1968. Mathematical models of social behavior. In: G . L i n d z e y & E . A r o n s o n (Eds.): T h e h a n d b o o k of social psychology. Vol. 1. Reading, Massachusetts: Addison-Wesley. SCHÄFER, K.A. 1970. Beurteilung einiger herkömmlicher M e t h o d e n zur Analyse von ö k o n o m i s c h e n Zeitreihen. In: W. Wetzel (Hrsg.): Neuere Entwicklungen auf d e m Gebiet der Zeitreihenanalysen. Sonderh e f t e z u m allgemeinen statistischen Archiv. Göttingen: V a n d e n h o e c k & R u p r e c h t , 1, 1 3 1 - 1 6 4 . SCHEFFE, H. 1959. T h e analysis of variance. New Y o r k : Wiley. SCHNEEWEISS, H. 1971. Ö k o n o m e t r i e . Würzburg: Physica-Verlag. SHINE, L.C. 1973a. A multi-way analysis of variance f o r single-subject designs. E d u c a t i o n a l and Psychological Measurement 33, 633—636. SHINE, L.C. 1973b. A design combining the single-subject and multi-subject a p p r o a c h t o research. Educational and Psychological Measurement 33, 763—766. SHINE, L.C. 1974. An extension of t h e Shine combined analysis of variance. E d u c a t i o n a l and Psychological Measurement 34, 47—52. SHINE, L.C. 1975. I n d e p e n d e n c e p r o b l e m s f o r certain tests based on t h e Shine-Bower error term. Educational and Psychological Measurement 35, 535 — 537. SHINE, L.C. & BOWER, J.M. 1971. A one-way analysis of variance f o r single-subject designs. E d u c a t i o n a l and Psychological Measurement 31, 105—113. SHEEHE, P.R. & BROSS, I.D. 1961. Latin square t o balance immadiate residual and o t h e r effects. Biometrics 17, 4 0 5 - 4 1 4 . SHERIF, M. & HOVLAND, C.I. 1961. Social j u d g e m e n t . New Haven: Yale University Press. SIMON, H.A. 1957. Models of man. N e w Y o r k : Wiley. STAPF, K.H. 1970. Praktische E r f a h r u n g e n mit d e m Meßmodell von Rasch bei der K o n s t r u k t i o n erziehungsspezifischer Einstellungsskalen. Psychologische Beiträge 12, 8 3 - 1 1 4 . STAPF, K.H., HERRMANN, T., STAPF, A. & STÄCKER, K.H. 1972. Psychologie des elterlichen Erziehungsstils. Stuttgart: H u b e r / K l e t t . TACK, W.H. 1969. Mathematische Modelle in der So-

230 zialpsychologie. In: C. F. Graumann (Hrsg.): Handbuch der Psychologie. Band 7.1. Göttingen: Hogrefe. TANNENBAUM, P.H. 1965. Initial attitude toward source and concept as factors in attitude change through communication. Public Opinion quarterly 20, 4 1 3 - 4 2 5 .

THIBAUT, J.W. & KELLEY, H.H. 1954. Experimental studies of group problem solving and process. In: G.Lindzey (Ed.): Handbook of social psychology. Reading, Massachusetts: Addison-Wesley Publishing Company. THOULESS, R.H. 1953. Test unreliability and f u n c t i o n fluctuation. Journal of Psychology 26, 3 2 5 - 3 4 3 . TRIANDIS, H.C. 1975. Einstellungen und Einstellungsänderungen. Weinheim und Basel: Beltz. ÜBERLA, K. 1971. Faktorenanalyse. Berlin, Heidelberg und New York: Springer.

Petermann & Knopf: Einstellungsänderungen II WAKENHUT, R. 1974a. Eine empirische Untersuchung zur Anwendung des eindimensionalen Meßmodells von Rasch in der Attitüdenmessung. In: L.Eckensberger (Hrsg.): Bericht über den 28. Kongreß der Dt. Gesellschaft für Psychologie, Saarbrücken 1972. Göttingen: Hogrefe. WAKENHUT, R. 1974b. Messung gesellschaftlich-politischer Einstellungen mithilfe des Raschmodells. Bern und Stuttgart: Huber. WETZEL, W. 1970. Hinweise auf einige theoreitsche Grundlagen der Spektralanalyse von stationären Prozessen. In: W. Wetzel (Hrsg.): Neuere Entwicklungen auf dem Gebiet der Zeitreihenanalysen. Sonderhefte zum allgemeinen statiI^^H stischen Archiv. Göttingen: Vandenhoeck ^ & Ruprecht 1, 5 - 4 5 . I

231

Zeitschrift für Sozialpsychologie 1976, 7, 231—247

Facetten- und Radextheorie in der multidimensionalen Skalierung INGWER BORG

University of Michigan

Das geringere Gewicht, das neuerdings dem Stresswert in der multidimensionalen Skalierung (MDS) beigemessen wird, führt dazu, daß der Forscher sich nun einer neuen Situation gegenübersieht, in der die Auswahl einer Lösung mitbestimmt sein soll durch bislang wenig gründlich untersuchte Kriterien wie „Sinnhaftigkeit" der Konfiguration. Es wird eine Theorie vorgestellt, die sinnvolle Planung von MDS-Studien erlaubt und direkten Bezug zu einer Reihe von Daten- und Konfigurationsstrukturen herstellt. Bei konfirmatorischer Verwendung dieser Strukturen erscheinen sie dimensionalen und clusterartigen Interpretationsansätzen im allgemeinen überlegen.

Since the stress value in multidimensional scaling is presently considered to have less importance the researcher finds himself in a new situation: The selection of the best solution should now also be determined by criteria that have been less thoroughly investigated like „meaning" of configurations. A theory is discussed that allows reasonable planning of MDS studies. It also is directly related to a number of structures in the data and their configurations. If used in a confirmatory approach these structures seem to be generally superior to dimensional or cluster interpretations.

Die in jüngster Zeit beginnende Anwendung nicht-metrischer multidimensionaler Skalierungsverfahren (MDS) in verschiedenen Gebieten der Sozial- und Wirtschaftswissenschaften (siehe z.B.: G R E E N & C A R M O N E 1 9 7 0 ; G R E E N &

on the most useful and generalizable specifications [d.h. vor allem: Vektor-, Distanz- oder Topologie-Modell; Metrik; Dimensionalität] for the substantive area of the data." Deutlicher als Shepard erkennt Guttman hier den engen Zusammenhang zwischen Theorie, Technik und Lösung/Interpretation. Im übrigen hat Shepard zur Interpretation von MDS-Konfigurationen praktisch auch außer dem dimensionalen Ansatz nur die Cluster-Methode anzubieten: Sein Versuch einer Simplex-Deutung ist dagegen nicht akzeptierbar — wie noch dargestellt wird — und offenbar konfundiert mit seinem Konzept „intrinsischer" Dimensionalität (SHEPARD

R A O 1 9 7 2 ; ROMNEY e t a l . 1 9 7 2 ; G R E E N & W I N D

1 9 7 3 ; FEGER 1 9 7 4 , 1 9 7 5 ) zeigt vielfach noch deutlich, daß die Verfahren hinsichtlich des Vorgehens bei der Datensammlung und vor allem bezüglich inhaltlicher Deutung der erzeugten Lösung noch nicht genügend theoretisch eingebettet sind. Wie SHEPARD ( 1 9 7 4 ) beklagt, wird dem Stress-Wert meist allzu große Bedeutung beigemessen, während statistische und inhaltliche Überlegungen oft weniger wichtig erscheinen. Shepard diskutiert einige Gründe hierfür, bleibt dabei jedoch innerhalb der engeren MDSProbleme, d.h. läßt Hypothesen und Theorien, die einer derartigen Untersuchung vorausgehen und mit ihr interagieren, weitgehend aus. Im übrigen hat der von der Shepard-Kruskal-Schule verwendete Terminus der „recovery" einer Struktur auch nicht gerade zur Klärung der Methoden beigetragen; hierzu schreibt G U T T M A N

( 1 9 6 7 , S. 75): „ A representation is n o t in gen-

eral something to be ,recovered' from the nonmetric data. The scientific problem is to decide

& CARROLL 1 9 6 6 ) .

Dieser Artikel soll nun einen Weg aufzeigen, wie die Guttmansche Facetten-Theorie bei MDS-Studien verwendet werden kann (Hypothesen- und Planungsproblem), und wie die erzeugte Konfiguration mit Hilfe von ordinal formulierten Simplex-, Circumplex- und RadexStrukturen sinnvoll interpetierbar ist.

Hypothesen und Itemkonstruktion Die Forderung, den Stress-Wert nicht mehr als

Borg: Facetten- und Radextheorie

232

einziges oder zumindest wichtigstes Kriterium für die Selektion einer Konfiguration aus einer Menge verschiedener Lösungen einer multidimensionalen Skalierung zu verwenden, sondern vor allem auch die Interpretierbarkeit der Konfiguration zu berücksichtigen, führt sofort zu zwei miteinander verbundenen Problemen: (a) In welcher Weise kann und sollte die Interpretation vorgenommen werden und (b) wie objektiv ist dann das Ergebnis. Es kann kein Zweifel darüber bestehen, daß insbesondere Psychologen mit ihren vielfältigen und komplexen Theoriesystemen auch noch so komplizierte Konfigurationen a posteriorisch immer interpretieren können. Dies hat z. B. dazu geführt, daß die konfirmatorische Faktorenanalyse (siehe z . B . : JÖRESKOG 1 9 6 9 ; MULAIK 1 9 7 2 ) den älteren explorativen Ansatz in seiner wissenschaftlichen Bedeutung weitgehend verdrängt hat. Die Tatsache, daß eine Lösung leichter oder plausibler interpretierbar ist als eine andere, kann also kein Kriterium für ihre Güte sein. Die Situation ändert sich jedoch fundamental, wenn eine Hypothese darüber existiert, welche Struktur den Daten zugrundeliegt: Das MDS-Verfahren ist dann lediglich ein Glied in einem auf Bestätigung dieser Hypothesen abzielenden Untersuchungsprozeß, der vervollständigt wird durch inferenzstatistische Methoden und Außenkriterien. Die Wichtigkeit der Hypothesenbildung vor der Datensammlung kann nicht überbetont werden. Findet man seine Hypothesen nicht bestätigt und drängt sich eine andere Interpretation auf, so muß die Untersuchung entweder repliziert werden oder — was weniger befriedigend ist — durch andere, simultan erhobene Messungen untermauert werden. Der Theorietyp, der für Untersuchungen in multivariaten Gegenstandsbereichen besonders geeignet ist, ist die Guttmansche Facettentheorie. „Theorie" hat hier eine direkt mit dem Meßprozeß verbundene Bedeutung, von Guttman bezeichnet als „a hypothesis of a correspondence between a definitional system for a universe of observations and an aspect of the empirical structure of those observations, together with a rationale for such a hypothesis (GUTTMAN, zitiert nach: GRATCH 1973, S.35)." Eine Theorie ist somit schlicht die Formulierung eines Homomorphismus von einem bestimmten empirischen in ein bestimmtes for-

males Relativ, ergänzt durch eine realwissenschaftliche Begründung dieser Korrespondenz. Der erste Teil dieser Definition entspricht bei flüchtiger Betrachtung derjenigen eines Meßmodells i. S. von KRANTZ et al. (1971). Die Hinzunahme des „Universums der Beobachtungen", für die dieses Meßmodell gelten soll, ist jedoch wesentlich: Hiermit sind sowohl eine Grundgesamtheit von Individuen, als auch von Items/ Variablen/Attributen/usw. umfaßt. Die Technik der „mapping sentences" (MS), die mit dieser Theorie-Definition eng verknüpft ist, macht das hiermit Gemeinte deutlich. Ein MS ist die präzise Formulierung, in welcher Art die Beobachtungsstichprobe für ein bestimmtes Universum von Beobachtungen zusammengesetzt ist und in welcher Form die Beobachtungen datenmäßig dargestellt sind. Ein MS umfaßt somit den gesamten Forschungsplan, d.h. er ordnet jeder Vp v ein Element des Bildbereichs b für jedes Item abc ... JC zu, wobei dieses Item durch seine jeweilige Kategorienzugehörigkeit bezüglich der Facetten des Definitionsbereichs der Items, also des bestimmten Universums der Items (universe of content), gekennzeichnet ist. Dies klingt kompliziert, ist aber trivial. Man kann dafür kürzer \ABC... X -* B schreiben. Die Symbolfolge links des Pfeils bezeichnet dabei die kartesische Menge aller möglichen Kombinationen von Individuen einer Population, V, mit allen möglichen Items der kartesischen Menge A x B x... x X, dem Universum der Items. Die Abbildung ist injektiv, d. h. jedem Element des Definitionsbereichs wird genau 1 Element des Bildbereichs, also der Datenmenge, zugeordnet, jedoch muß nicht auch jedem b e B ein Element des Definitionsbereichs entsprechen (manche Responsen werden nicht beobachtet). Ein Beispiel aus LEVY (1976) mag die Prinzipien verdeutlichen. Es wird dabei von Guttmans Einstellungsdefinition ausgegangen: „Ein Item gehört zum Universum der Einstellungsitems, wenn und nur wenn sein Definitionsbereich sich auf Verhalten (kognitiver) (affektiver) (instrumenteller)

Art bezüglich eines Objektes bezieht und sein Bildbereich

(sehr positiv) bezüglich dieses Objektes von (bis) geordnet ist (GUTTMAN, (sehr negativ) zitiert nach

233

Zeitschrift für Sozialpsychologie 1976, 7, 231-247

GRATCH 1 9 7 3 , S . 3 6 ) . " K o n k r e t i s i e r e n w i r die-

sen allgemeinen MS für Einstellungsitems einmal, so läßt sich z. B. folgender (vereinfachter) MS für das Universum der Items, die „Zufriedenheit mit verschiedenen Lebensbereichen" (satisfaction with areas of life) bezeichnen, konstruieren: Die Zufriedenheit des Individuums v e V mit

A

B

(fli- Zustand) seiner (a 2 : Möglichkeiten) Betätigungen in den Lebensbereichen

Erziehung) (¿2 Wirtschaft) (b3 Wohnung) (b4 Freizeit) ib s Familie) (b6 Gesundheit) ( é . Arbeit) » 8 allgemein)

B (sehr positive) (bis) (sehr negative)

Zufriedenheit

Abgekürzt ergibt sich hier also WAB -*• B, wobei die Facette A zwei-, die Facette B achtkategorial ist. Für B wird die Kategorienzahl bestimmt durch den gewählten Modus der Responseerfassung, also z. B. eine 6-Punkt Ratingskala oder eine dichotome Ja-Nein-Klassifizierung. Die Teilmenge AB von XAB ergibt hier 16 mögliche Itemtypen. Es ist klar, daß das Universum der Items, die „Zufriedenheit mit verschiedenen Lebensbereichen" ausdrücken, auch wesentlich weiter definiert werden kann. Man könnte etwa B erweitern oder weitere Facetten C, D usw. einfügen. Ein Beispiel für einen wesentlich komplizierteren MS, wo sich die Items auf „Lebensqualität" (well-being) beziehen, gibt LEVY & GUTTMAN ( 1 9 7 5 ) . G r u n d s ä t z l i c h h a n d e l t es

sich aber immer um die Repräsentation eines Universums bestimmter Bedeutung, das definitorisch abgegrenzt wurde und somit dem Guttmanschen Theoriekonzept entspricht. Konkrete Items sind nun konstruierbar ausgehend vom obigen MS, z.B.: „Ganz allgemein gefragt: Sind Sie zur Zeit zufrieden?". Das Item enthält hier die Facetten-Kategorien afig. Es ist somit durch dieses „structupel" (von: „Struktur" und „n-tupel") gekennzeichnet. Sein Bildbereich sei: Ja-ja-nein-NEIN (siehe Schema unten). Auf diese Weise konstruiert man eine Stichprobe aller möglichen Items eines wohldefinierten Typs, also des Universums dieser Items. Es lassen sich nun verschiedene Hypothesen formulieren über die innere Struktur dieses Universums. Ein einfaches Prinzip ist dabei die Kontiguitäts-Methode (FOA, 1958), die besagt, daß Items, die sich hinsichtlich ihrer Facetten-Struktur wenig unterscheiden, ähnlicher von den Vpn erlebt werden sollten als solche, deren Structupel sehr verschieden sind. Die Hypothese ist erweiter- und präzisierbar, indem man Ähnlichkeiten innerhalb und zwischen den einzelnen Facetten unterscheidet. Man kann dann z. B. postulieren, daß sich die Items innerhalb der Facetten in bestimmter Aufreihung gruppieren und daß sich die Facetten selbst in Cluster inhaltlicher Ähnlichkeit ordnen lassen. Einige Prinzipien dieser Art diskutiert FOA ( 1 9 6 5 ) ; weitere ergeben sich aus der jeweiligen Theorie, die der empirischen Untersuchung zugrundeliegt. Ausgehend von der obigen Definition für Einstellungsitems eines Universums, die Items als bezogen auf ein Bezugsobjekt beschreibt, läßt sich hier auch fragen, ob die „Lebensbereiche" von B tatsächlich die Objekte darstellen, die die Response determinieren. Es ist denkbar, daß sie ein übergeordnetes Objekt haben, etwa „Leben allgemein". Wäre das so, müßte man erwarten, daß alle Items positiv untereinander korrelieren. In jedem Fall sollte

Item

Inhalt

structupel

Bildbereich

i j

„...Gesundheit...?" „...Bildung...?"

a ^ axbx

sehr gut/gut/schlecht/s. s. sehr zufrieden/...

234

aber eine systematische Beziehung zwischen den Facetten-Kategorien und den den Korrelationen immanenten Strukturen aufzufinden sein, also das Kontiguitätsprinzip gelten, obwohl es hier schwerfällt, es genauer zu formulieren. Es ergibt sich jedenfalls für 15 Zufriedenheitsitems, die von LEVY ( 1 9 7 6 ) einer Studie von ANDREWS ( 1 9 7 4 ) nach Maßgabe des obigen MS entnommen und deren Interkorrelationen multidimensional skaliert wurden, eine recht gute Radex-Struktur (s.u.), in der die ^-Kategorien polarisierend wirken, während die yl-Facette die 2-dimensionale Konfiguration in zwei konzentrische Regionen um den Ursprung gliedert; im Ursprung selbst findet sich das Item „Zufriedenheit mit dem Leben allgemein" (Fig. 1).

Borg: Facetten- und Radextheorie

Das Beispiel macht den Wert geplanten und theoriegestützten Vorgehens deutlich. Ohne Strukturhypothesen wäre die Konfiguration schwer zu deuten gewesen. Oft ist die geometrische Repräsentation noch weit komplizierter — etwa 4-dimensionale Zylindrex-Strukturen (LEVY & GUTTMAN 1 9 7 5 ; LEVY 1 9 7 5 ) ; in solch einem Fall ist die ungeleitete Interpretation dann entweder unmöglich oder aber ziemlich willkürlich. Aus Fig. 1 wird weiter die Begrenztheit der „klassischen" dimensionalen Interpretation klar: Versucht man hier etwa Komponenten zu interpretieren, so ist die Information, die die Konfiguration enthält, nicht artikulierbar. Dimensionale Deutungen sind in jedem Fall nur

235

Zeitschrift für Sozialpsychologie 1976, 7, 2 3 1 - 2 4 7

eine Möglichkeit, die man dann versuchen sollte, wenn theoretische Gründe dafür vorliegen. Andere Interpretationsmethoden von allgemeinerem Wert seien nun im folgenden dargestellt.

Simplex Es sei nun etwas genauer auf einige prototypische Ordnungsstrukturen eingegangen. Wie bereits oben angedeutet, sind insbesondere das Guttmansche Radex-Konzept und seine Spezialfälle äußerst nützlich. Interessanterweise ist der Radex jedoch bisher nie sonderlich populär geworden, was wahrscheinlich daran liegt, daß seine nicht-metrischen Eigenschaften nicht weiter untersucht worden sind. Aus historischen Gründen und um von Bekanntem auszugehen, sei aber trotzdem eine Einführung ausgehend von einer faktorenanalytischen, also einer metrischen, Struktur gegeben, dem Spearmanschen Intelligenzfaktor-Modell. Diese Theorie besagt, daß die Interkorrelationen der Items eines Intelligenztests zerlegbar sind in einen Varianzanteil, der durch einen allgemeinen (general) Faktor erklärbar ist, und einen dazu orthogonalen Fehlerbestandteil, der spezifisch für jedes Item ist. Da diese Theorie von Spearman in Regressionstermini präzisiert ist [r^ , g = 0, i j ] , also ein metrisches Vektormodell vorliegt, läßt sich die Interkorrelationsmatrix R, die eine solche Vektorkonfiguration repräsentiert, ableiten. Nach entsprechender Gruppierung weist R folgendes typisches Muster auf (Tab. 1). R enthält also eine einfache hierarchische oder OrdnungsAussage: Je niedriger zwei Items mit dem g-Faktor korrelieren, umso niedriger korrelieren sie untereinander. Da die Spearmansche Intelligenzfaktor-Theorie nicht haltbar war, wurden andere Strukturmodelle entworfen, insbesondere die ThurstoneTab. 1: R-Matrix des Spearman-Typ; Hauptdiagonale enthält Kommunalitäten .81 .63 .45 .27 .09

.63 .49 .35 .21 .07

.45 .35 .25 .15 .05

.27 .21 .15 .09 .03

.09 .07 .05 .03 .01

sehe multiple Faktorenanalyse, die eine inhärent indeterminierte Lösung erzeugt (Rotationsproblem) und somit kein typisches R-Muster wie in Tab. 1 aufweisen kann (es sei hierbei voller Rang von R und das strenge Extraktionskriterium angenommen). Die extrahierten Faktoren sind selbst ungeordnet. Auch die erklärte Varianz pro Faktor erzeugt nur eine scheinbare, rotationsmechanisch bedingte Hierarchie. Das ist ein äußerst unbefriedigender Sachverhalt, der zu einem großen Teil für die relativ dürftigen faktorenanalytischen Forschungsergebnisse verantwortlich ist. Das Problem, das sich hier stellt, ist also, wie man das Konzept hierarchischer Ordnung der Variablen (Items, Tests usw.), das Spearman verwendete, verallgemeinert wieder einführen kann. Nehmen wir hierzu ein Hauptkomponenten-Modell an, in dem die Variable 1 nur auf Faktor 1, Variable 2 auf Faktor 1 und 2,..., Variable n auf den Faktoren 1,..., n lädt. Es ergibt sich dann sofort eine Ordnung der Variablen gemäß ihrer faktoriellen Komplexität. An Stelle von n Faktoren, die den Variablen-Raum aufspannen, könnte man auch einen g-Faktor postulieren, auf dem die Tests in unterschiedlichem, geordnetem Ausmaß laden. Es ergibt sich dann im Vergleich zu Spearman: Spearman: r^ . g = 0, i j Simplex: r i g . j = 0, i < j

(1) (2)

Der Unterschied beider Formulierungen liegt darin, daß in (2) die Tests nicht einfach einen „beliebigen", sondern sozusagen einen ganz bestimmten Anteil von g aufweisen. Damit ist g natürlich kein Faktor mehr i. S. der klassischen Faktorenanalyse, die nur quantitative Ladungsunterschiede kennt 1 . Offenbar kann man aber gleich das Faktormodell wieder fallenlassen, wenn man statt dessen folgende partielle Korrelationsannahmen formuliert: rin.j = 0 , i < j < n ,

(3)

wobei i,j und n Indices für Items und n das letzte, „komplexeste" Item ist. Die Gleichung (3) besagt: Extrahieren wir den Bestandteil aus 1 Es sei angemerkt, daß die Spearman-Hierarchie als Extremfall der Simplex-Struktur beschreibbar ist (siehe: GUTTMAN 1954b, S . 3 1 6 f f . ) .

236

Borg: Facetten- und Radextheorie

i und n, den diese beiden Variablen mit j gemeinsam haben, so bleibt keine gemeinsame Varianz mehr übrig, also auch keine von Null verschiedene Korrelation. Die mathematischen Konsequenzen von (3) seien hier nicht weiter verfolgt; siehe dazu GUTTMAN (1954b, 1955). Wichtig ist hier, welches Muster R aufweist bzw. in welches Muster R permutierbar ist, wenn die Variablen eine derartige Ordnung enthalten. Dies ist in Tab. 2 für einen Spezialfall dargestellt.

ler Korrelation, ganz aufgeben und lediglich die typischen ordinalen Relationen der Elemente in Simplex-Matrizen wie Tab. 2 und 3 zur Definition eines nicht-metrischen Simplex verwenden. Diese typische Ordnung der Elemente ist in Fig. 2 symbolisch dargestellt: Die Ähnlichkeit der Elemente wächst Zeilen- und spaltenweise zur Hauptdiagonalen hin an.

Tab. 2: Metrisch-perfekter, gleichabständiger Simplex (nach GUTTMAN 1954b)

1.00 .60 .36 .22 .13

.60

1.00 .60 .36 .22

.36 .60

1.00 .60 .36

.22 .36 .60

1.00 .60

.13 .22 .36 .60

1.00

Das entstandene Muster und die zugrundeliegende Theorie nennt GUTTMAN (1954b) einen metrischen Simplex. Man sieht, daß benachbarte Items am höchsten miteinander korrelieren; umgekehrt, je weiter sie im Ordnungssinn voneinander entfernt sind, umso niedriger korrelieren sie. Der Simplex weist somit einen Ordnungsfaktor auf. Eine multiple Faktorenanalyse wurde dagegen bei vollständigem Rang von R n - 1 gemeinsame Faktoren extrahieren. Der Simplex in Tab. 2 ist natürlich ein Extremfall, nämlich der sog. gleichabständige (Distanzen bzw. Winkel zwischen entsprechenden Vektorpaaren sind gleich) und perfekte (Gleichung [3] gilt streng). Ein realitätsgerechteres Beispiel ist der folgende Simplex, der nur noch approximativ die Definitionsgleichung (3) erfüllt (Tab. 3); weitere Typen metrischer Simplices diskutiert GUTTMAN (1954b). Man kann nun die metrische Definition des Simplex, also die Formulierung mittels partielTab. 3: Metrischer Quasi-Simplex

1.00 .80 .33 .12 .10

.80

1.00 .40 .14 .13

.33 .40

1.00 .35 .33

.12 .14 .35

1.00 .95

.10 .13 .33 .95

1.00

Fig. 2. Ordnungsstruktur im ordinalen Simplex: Elemente nehmen monoton in Pfeilrichtung zu.

Es ergibt sich aus Fig. 2 natürlich, daß für einen ordinalen Simplex — wie eine Ordnungsstruktur dieser Art genannt sei — eine Korrelationsmatrix nur ein möglicher Typ aus einer Menge von Datenmatrizen ist, deren Elemente die Ähnlichkeit der Eingänge bezeichnen. Gerade bei MDS-Studien wird ja meist nicht von Korrelationsmatrizen, sondern von direkt ermittelten Distanzwerten ausgegangen. Die Hauptdiagonale bleibt hierbei i. d. R. Undefiniert, bzw. es wird uniforme, maximale Ähnlichkeit der Items (Variablen, Tests usw.) mit sich selbst angenommen. Eine simplistische Ordnungsstruktur besagt nun lediglich, daß jeder Eingang der Matrix jedem anderen umso ähnlicher ist, je benachbarter dieser andere liegt. Die definierten Ähnlichkeitsaussagen beziehen sich dabei jedoch nur auf konjunkte Tetraden, d. h. es sind immer nur zwei auf dasselbe Item bezogene Relationen vergleichbar. Eine Aussage über die Beziehung zweier Items relativ zu der zweier anderer ist im Simplex nicht definiert. (Das bedeutet natürlich nicht, daß sie nicht sinnvoll sein kann.

237

Zeitschrift für Sozialpsychologie 1976, 7, 2 3 1 - 2 4 7

Lediglich für den Simplex ist sie nicht relevant. Hierauf wird noch eingegangen.) Diese eingeschränkte Vergleichbarkeit ist bisher vielfach nicht erkannt worden und hat so zu einiger Verwirrung geführt (SHEPARD 1974; VAN DEN WOLLENBERG 1974). Eine ordnungserhaltende Transformation der Zeilen- und Spaltenelemente erhält selbstverständlich den ordinalen Simplex, kann aber durchaus die Rangordnung der Werte bei ««konditionaler Betrachtung der Matrix verändern. Nehmen wir dazu folgendes Beispiel an (Tab. 4; untere Dreiecksmatrix). Tab. 4: Untere Matrix: Ähnlichkeitskoeffizienten; obere Matrix: entsprechende unkonditionale Ähnlichkeitsränge

_ 50 40 30 20

54 35 32

-

10 8 5 1

65



6 2

3 -

9 7 4

-

49 45

Wenn wir für die Werte in Tab. 4 Vergleichbarkeit innerhalb der gesamten Datenmatrix annehmen — in Coombs' Terminologie also eine „unconditional matrix" (COOMBS 1964) - so ergibt sich die oberhalb der Hauptdiagonalen dargestellte Proximitäts-Rangmatrix. Transformieren wir nun die Werte in Tab. 4 durch Vertauschung einiger Elemente derart, daß Tab. 5 (untere Hälfte) entsteht, so bleibt der Simplex erhalten, aber die Rangmatrix, die sich aus einer ««konditionalen Betrachtung ableitet, ist nicht mehr dieselbe wie in Tab. 4. Die konditionale Rangmatrix, die sich entweder aus der Rangordnung der Elemente innerhalb der Spalten oder der Zeilen der Datenmatrix ergibt, wäre hier natürlich unverändert. Die Konsequenzen dieses Sachverhalts für SkalieTab. 5: Untere Matrix: Ähnlichkeitskoeffizienten; obere Matrix: entsprechende unkonditionale Ähnlichkeitsränge

-

54 40 35

-

10 7 5 1

65



9 6 4

8 2

3 50 32 30 20

-

49 45

rung und Interpretation werden noch deutlich werden. Eine monotone Distanzanalyse (MDA) einer solch ordinal-simplistisch geordneten Datenmatrix führt bei konditionaler und unkonditionaler Betrachtung im 2-dimensionalen Raum zu einer Lösung, in der sich die Items auf einer annähernd C-förmigen Kurve befinden [hier wird, wie ausschließlich in diesem Artikel, euklidische Metrik angenommen]. Diese Kurve wird auch als „Hufeisen" (horseshoe) bezeichnet (nach: KENDALL 1971a, b). Sowohl „ C " wie „Hufeisen" sind aber streng genommen im allgemeinen Fall nicht korrekt 2 , sondern nur als mnemonische Bezeichnungen aufzufassen. Eine typische Simplex-MDA-Lösung sieht vielmehr wie folgt aus (Fig. 3).

\

Fig. 3: Typische MDA-Lösung einer simplistischen Datenmatrix (solide Linie) und eine mögliche Projektionsgerade (gestrichelte Linie).

Die Elemente des Simplex, die hier durch die solide Linie verbunden sind, sind z. B. auf die gestrichelte Linie — nicht notwendigerweise senkrecht und gleichartig — projizierbar, ohne daß sich dadurch die Ordnungsverhältnisse der Distanzen zwischen diesen Elementen verändern. In Fig. 3 sieht man, daß für den Punkt A AB < AC gilt (AB = Distanz von A zu B); dieselbe Relation gilt für die Projektion, also für A' gilt 2 Kendall geht hier jedoch von sehr speziellen Simplex-Matrizen aus, die tatsächlich Hufeisen- oder sogar zirkuläre Konfigurationen erzeugen können.

238 A'B' < A'C'. Anders ausgedrückt: Die solide Linie „does not bend back on itself (LINGOES, pers. Mitteilung)", d.h. die Senkrechte auf jedem möglichen Punkt einer dieser Konfiguration gefitteten glatten Kurve schneidet diese Kurve nicht irgendwo anders. Diese Bedingungen für die MDA-Repräsentation eines Simplex sind jedoch nur dann umkehrbar, d.h. eine Konfiguration dieser Art impliziert nur dann eine simplistische Datenordnung, wenn der Stress Null ist, also die Repräsentation perfekt ist. SHEPARD (1974) sieht in der Fehlerhaftigkeit der Datenmatrix, d. h. in der Tatsache, daß das ordinale Simplexmuster für eine empirische Koeffizientenmatrix typischerweise nicht exakt erfüllt ist, den Grund für die C-Form der Simplex-Kurve: „Evidently, by bending away from a one-dimensional straight line, the configuration is able to take advantage of the extra degree of freedom provided by additional dimensions to achieve a better fit to the random fluctuations in the similarity data (S. 386)." Das erscheint plausibel, da die „wahre" SimplexStruktur ja nur eine Dimension erfordert. Es stellt sich jedoch heraus, daß auch ein ordinal perfekter Simplex bei unkonditionaler Analyse nicht im allgemeinen 1-dimensional mit einem Stresswert von Null repräsentierbar ist. Hingegen ist dies bei konditionaler Analyse, etwa via SSA-II der G-L-Serie (LINGOES 1973), immer möglich. Der Grund hierfür liegt darin, daß der Simplex in der Matrix nur Ordnungsrelationen innerhalb der Zeilen und Spalten, jedoch nicht über diese hinweg festlegt. Rechnet man also eine unkonditionale MDA (z. B. mit SSA-I), so versucht der Algorithmus neben der simplistischen Ordnung noch weitere Ordnungsrelationen zu repräsentieren, die dann meist nicht mehr alle perfekt 1-dimensional abzubilden sind, jedoch durch eine C-förmige Kurve darstellbar sind. Der von Shepard angesprochene Einfluß eines leicht imperfekten Simplex (ordinaler Quasi-Simplex) hat dagegen die Wirkung, die die Punkte verbindende, relativ „glatte" C-Kurve zackig zu machen. Interessant ist jedoch, daß auch ein perfekter ordinaler Simplex bei konditionaler Repräsentation in zwei Dimensionen eine C-Kurve ergibt, pbwohl er auf einer Geraden vollständig darstellbar ist. Der Grund hierfür liegt in den heute üblichen Startkonfigurationen von MDA-Algorithmen, die

Borg: Facetten- und Radextheorie

durch Hauptkomponentenanalyse erzeugt werden. Die entstehende zweite Komponente entspricht dann der schon von G U T ™ A N (1950, 1954a) diskutierten Kurve mit einem Wendepunkt (siehe hierzu auch: TORGERSON 1958, S.338ff.; LINGOES 1968). Zufallskonfigurationen können jedoch auch zu S-förmigen Simplexrepräsentationen im 2-dimensionalen Raum führen. In höher-dimensionalen Räumen entstehen i. d. R. kompliziertere Kurven (ein zusätzlicher Wendepunkt für jede weitere Dimension), die jedoch immer die oben diskutierten Restriktionen einer simplistischen Geraden erfüllen. Ein Simplex ist interpretierbar als 1-dimensionale Struktur, die allerdings besondere Eigenschaften aufweist: Vergleichbarkeit ist nur für konjunkte Tetraden gegeben, also für Distanzen, die einen gemeinsamen Endpunkt haben, nicht jedoch für disjunkte Distanzen. Dies ist der bereits diskutierte Sachverhalt der konditionalen Ordnung der Daten. In diesem konditionalen Sinn ist der Simplex also 1-dimensional; die Interpretation weiterer Dimensionen ist daher substantiell sinnlos. Bei unkonditionaler Betrachtungsweise ist dagegen die Situation schwieriger: Meist ist der Simplex mit nur geringem Ansteigen des Stress in einen 1-dimensionalen Unterraum projizierbar, wobei jedoch oft einige Ties entstehen. Abhängig von der für die jeweiligen Daten anzunehmenden Fehlertheorie kann man dann entweder eine 1-dimensionale, unkonditionale Struktur als den Daten zugrundeliegend interpretieren, oder neben der simplistischen noch eine dazu orthogonale, ««konditionale, zweite Dimension, die z. B. bei Einstellungsitems der von GUTTMAN (1954a) diskutierten zweiten Hauptkomponente von Einstellungen entspricht und die Krümmung der Kurve erklärt, inhaltlich deuten. Unbeantwortet muß hier die Frage bleiben, ob eine „leichte" Verletzung der Monotonizitat der Projektion auf eine entsprechende Gerade noch als fehlerbedingte Abweichung oder als Grund für eine Zurückweisung der Simplex-Hypothese angesehen werden soll. Diese Frage hängt davon ab, welche Fehlertheorie man für die dargestellten Daten annehmen will. Ein hierfür und ganz allgemein für das Diskutierte instruktives Beispiel stammt von SHEPARD (1974). In Fig. 4 ist die Konfiguration wiedergegeben, die LEVELT et al. (1966) durch eine nicht-metri-

Zeitschrift für Sozialpsychologie 1976, 7, 2 3 1 - 2 4 7

239

sehe Analyse von Ähnlichkeitsdaten über tonale Intervalle erhielten; die gestrichelte Linie ist dabei die gefittete Kurve von Levelt et al., die solide von Shepard. Levelt et al. versuchten hier eine Interpretation von zwei orthogonalen Achsen, während Shepard glaubt, die Datenmatrix (vgl. SHEPARD 1974, S.388) und die daraus errechnete Konfiguration in Fig. 4 stelle einen Simplex dar. Das ist jedoch nicht der Fall, da sich sowohl die Leveltsche, als auch seine Fitlinie deutlich „auf sich selbst zurückbiegen" und zwar in einem solchen Ausmaß, daß eine Fehlertheorie sicher nicht mehr zu rechtfertigen ist (Tatsächlich ist hier eine Simplex-Struktur sehr unwahrscheinlich, da Shepard noch eine ähnliche Studie mit gleichem Ergebnis berichtet). I (5 : 7) diminished fifth (3 : 4) fourth (4 : 5) major third ( 5 : 6 ) minor third (8 : 9) major second ( 1 5 : 16) minor second

/

I

Fig. 5: MDA-Konfiguration mit mehreren geometrisch möglichen Simplices. 8) minor sixth : 3) fifth (3 : 5) major sixth ( 4 : 7) minor seventh (8 : 15) major seventh ( 1 : 2 ) octave

(4:9) (2:5)

Fig. 4: 2-dimensionale MDA-Konfiguration tonaler Intervalle. Die die Punkte direkt verbindende Linie entspricht der Ordnung der Eingänge in der maximal simplistisch geordneten Datenmatrix (nach SHEPARD 1974).

Natürlich können auch mehrere Simplices simultan in einem solchen 2-dimensionalen Raum liegen (Fig. 5). Die geometrische Form der Simplices ist hier nun nicht mehr immer C-förmig, da auch die Relationen der Elemente verschiedener Simplices die Form der Kurven mitdeterminieren; die Kurven erfüllen jedoch immer die Bedingungen simplistischer Gerader, wenn die Repräsentation stressfrei ist. Ohne eine entsprechende Hypothese darüber,

was zusammengehört, ist offensichtlich eine ganze Reihe verschiedener Simplices in Fig. 5 auffindbar. Hier wird wieder die Bedeutung von Theorien wie der Facetten-Theorie deutlich. Hat man aber keine Hypothese oder keine, die exakt genug ist, und ist die MDA-Lösung nicht stressfrei, so folgt daraus, daß man eine Reihe von Elementen auf einer simplistischen Geraden zusammenfassen kann, noch nicht, daß auch in den Daten ein Simplex vorliegt. Es ist daher zweckmäßig, dies dadurch zu prüfen, daß man z. B. für die in Fig. 5 eingezeichnete simplistisch aussehende Linie mit der Elementenfolge 1-2-5-12-10-3 eine Submatrix mit genau diesen Eingängen in genau dieser Reihenfolge aus der Datenmatrix herauszieht. Weist diese Submatrix dann das typische Simplexmuster auf, so kann die sich zunächst aus der Geometrie ergebende Hypothese, daß diese Elemente einen Simplex bilden, beibehalten werden. Es ist jedoch selbstverständlich von zweifelhaftem Wert, nun blind auf Simplex-Suche zu gehen. Natürlich lassen sich solche Strukturen immer auffinden, wenn man nur wenig genug Punkte berücksichtigt: Die Bedingungen sind immer für m + 1 Punkte, die nicht gleichabständig voneinander sind, erfüllt (m = Dimensionalität des Raums; LINGOES, 1971). Solche explorativen Mini-Simplices sind zumindest bis zu ihrer Be-

240

Borg: Facetten- und Radextheorie

stätigung in einer Replikationsstudie als Hypothesen zu betrachten. Liegt nun statt einer ordinal-simplistisch geordneten Datenmatrix, die Distanzmaße enthält, eine solche, die Skalarprodukte bzw. Korrelationskoeffizienten von Skore-Vektoren aufweist, vor, so entstehen einige interessante Fragen darüber, zu welchem Ergebnis verschiedene Analysen führen. Für den praktisch immer vorliegenden Fall einer Matrix von vollem Rang ergibt sich für eine lineare Faktorenanalyse — selbst bei einem metrisch-perfekten, gleichabständigen Simplex — ein (m-l)-dimensionaler Lösungsraum (TORGERSON 1958, S.312). Dies wird intuitiv deutlich aus dem faktoriellen Modell zunehmender Komplexität in den Tests, mit dem der Simplex oben eingeführt wurde: Der beim m-ten Test hinzukommende Komplexitätsfaktor ist nicht mehr „gemeinsam"; also gibt es m-1 gemeinsame Faktoren. Bei Anwendung von Thurstones schwachem Kriterium

für die Zahl der zu extrahierenden Faktoren würden von diesen m-1 Faktoren jedoch nur die ladungsstärksten bzw. signifikanten beibehalten, die dann in bestimmter Weise rotiert würden. Es ist somit klar, daß infolge der Subjektivität der involvierten Kriterien (Rotation; Kommunalität; Faktorenzahl; Signifikanz = Stichprobengröße) eine ganze Reihe verschiedener Lösungen herauskommen könnte. Ein konkretes Beispiel dafür, in welcher Weise faktorenanalytische Ergebnisse und MDA-Lösungen praktisch zusammenhängen können, zeigt Fig. 6: Die Interkorrelationen von Intelligenztests, die COOMBS (1941) berichtet und faktorenanalysiert, sind hier in eine von GUTTMAN (1965) handberechnete MDA-Lösung eingegliedert.

(32) Arithmetic

Die MDA-Lösung zeigt mehrere zusammenhängende Simplices und andere Strukturen, auf die unten noch eingegangen wird. Es wird sofort deutlich, daß die MDA eine Vielfalt von Informationen aus den Daten repräsentiert, die in einer Faktorenanalyse obskur bleiben. Jede Ordnung der Variablen und der Faktoren (die als neue, aus den Variablen zusammengesetzte Tests auffaßbar sind), geht in einer FA verloren. Die Faktorenstruktur bleibt ungeordnet und die Faktoren selbst sind ziemlich willkürlich zu den Variablen in Beziehung gesetzt (Rotationsproblem). Die substantielle Deutung der FA-Lösung ist daher bestenfalls unvollständig. Zu fragen bleibt nun noch, welche Lösung eine monotone Vektoranalyse (MVA), also eine nicht-metrische Faktorenanalyse 3 , für eine simplistisch geordnete Skalarprodukt- oder Korrelationsmatrix erzeugt. Da in einem Vektormodell die Ähnlichkeiten zweier Items durch den Winkel repräsentiert wird, in dem die sie darstellenden Vektoren zueinander stehen, ist klar, daß selbst dann, wenn die Daten einen perfekten ordinalen Simplex darstellen, eine 1-dimensionale Lösung für den gemeinsamen Faktorraum im allgemeinen nicht möglich ist. Die entstehende Vektorkonfiguration ist 2-dimensional; die Vektorlängen entsprechen den jeweiligen Kommunalitäten. Eine Simplex-Struktur ist hier meist geometrisch nicht identifizierbar oder zumindest schwer auffindbar. Normiert man je-

Fig. 6: 2-dimensionale MDA-Lösung für 17 Tests und 5 Faktoren der Coombs-Studie; Faktoren durch gestrichelte Linien verbunden (nach: GUTTMAN, 1967).

3 Gedacht ist hier an SSA-III (UNGOES & GUTTMAN 1967). Die Kruskal-Shepard MVA (K.& S. 1974) wird hier nicht diskutiert, um einen einfacheren Vergleich der Methoden zu ermöglichen.

(12) Pied X's Factor (i>) / ( I I ) Rowed X's Ì

( 10) Digit Cancellation (13) Identical Numbers / /

/ ( 1) Two-Digit Addition Factor (N) \ (2) Three-Digit Addition (3) Four-Digit Addition \ (4) AB \ (9) Alphabet III \ (5) ABC (15) Size (8) Alphabet II Comparison Factor (/I) /''

(33) Number Series Factor (D)

s

(7) Alphabet I \ (24) Same\ Opposite \ Factor (K) (23) Completion

241

Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7, 2 3 1 - 2 4 7

doch die Vektoren dadurch, daß man sie entsprechend ihrer Kommunalität gewichtet, d. h. auf dieselbe Länge „ 1 " bringt [r^ 0 " =r i -/h j h., für alle i, j ] , so liegen die Vektorendpunkte in der sich dann ergebenden Konfiguration auf einem Kreisbogen. Liegt ein Simplex vor, so beschreibt dieser Kreisbogen einen Winkel von a < 180°: Hierdurch wird die Projizierbarkeit der Distanzen zwischen den Vektorendpunkten auf eine Gerade i. S. des Simplex garantiert (GUTTMAN 1967). Eine Analyse dieser Art ist mit Lingoes' SSA-IV Programm (LINGOES 1973) durchführbar. Wesentlich ist hierbei, daß eine monotone Abbildung der Distanzen zwischen den korrigierten Koeffizienten gesucht wird. (Dies ist im Gegensatz zu allen anderen nichtmetrischen Verfahren und macht das Programm mehr theoretisch als praktisch interessant).

Circumplex In einem Simplex sind die Items derart geordnet, daß immer zwei als Endpunkte dieser Ordnung hervortreten. Stellen wir uns nun vor, diese beiden Endpunkte seien selbst wieder Nachbarn und der Simplex damit kreisförmig geschlossen. Die entstehende Struktur ist dann ein Circumplex. Das klassische Beispiel für eine solch circumplistische Ordnung ist der Farbkreis: Rot ist Nachbar zu Orange, Orange ist Nachbar zu Gelb,..., Violett ist Nachbar zu Rot. Weitere Beispiele werden berichtet für Einstellungen ( R U N K E L & MCGRATH 1972), Intelligenz- und Persönlichkeitstests (GUTTMAN 1954b, 1957, 1967) und interpersonales Verhalten (FOA 1964), um nur einige zu nennen. Ein Circumplex ist jedoch eine empirisch weniger häufig anzutreffende Struktur als ein Simplex. Es sei deshalb hier nur auf den ordinalen Circumplex eingegangen; quantitative Circumplices diskutieren GUTTMAN (1954b, 1965) und (falsch, aber instruktiv) VAN DEN WOLLENBERG (1974). Um das Prinzip der Datenordnung in einem Circumplex klarzumachen, sei zunächst ein sehr spezieller Fall dargestellt: Tab. 6 zeigt ein idealisiertes Circumplex-Muster, in dem die Ähnlichkeitskoeffizienten von der Hauptdiagonalen aus zum unteren linken Eckelement hin zunächst absinken, dann wieder ansteigen; die Ta-

T a b . 6 : Gleichabständiger, u n i f o r m e r , metrisch-perfekter, additiver C i r c u m p l e x (aus: GUTTMAN 1 9 5 4 b )

1.00 .75 .50 .25 .50 .75

.75

1.00 .75 .50 .25 .50

.50 .75

1.00 .75 .50 .25

.25 .50 .75

1.00 .75 .50

.50 .25 .50 .75

.75 .50 .25 .50 .75

.75

1.00

1.00

belle hat in der Diagonale, die die Elemente mit r = 0.25 enthält, gewissermaßen einen „Knick" oder ein „Tal". Eine andere Betrachtungsweise zeigt hier drei überlappende Simplices: Bildet man zur Hauptdiagonalen hin Dreiecksmatrizen, ausgehend jeweils von einem anderen Element mit r = 0.25, so weisen diese simplistische Struktur auf. In einem Circumplex sind mindestens drei Simplices enthalten, die (a) überlappen, (b) keine Untersimplices größerer Simplex-Strukturen sind, und (c) eine zirkuläre Folge bilden. Die Bedingung (c) ist erfüllt, wenn die nicht zu den Simplices gehörigen Ähnlichkeitskoeffizienten, also die Elemente in der linken unteren Ecke der Matrix, zum Eckelement hin größer werden: Die in der Ordnung der Eingänge am weitesten entfernten Items, weisen damit wieder eine relativ große Ähnlichkeit auf. Der Circumplex ist auch definierbar über spalten- und zeilenweise Permutationen, die folgendes Muster erzeugen: Die Zeilen/Spalten-Elemente haben pro Zeile/ Spalte ein kleinstes Element, von dem aus sie beidseitig innerhalb jeder Zeile/Spalte streng monoton ansteigen; das kleinste Element liegt in der ersten und letzten Zeile nicht am Ende und wandert bei weiter in der Mitte der Matrix liegenden Zeilen/Spalten sukzessive in eine Position am Ende der Zeile/Spalte. Diese letztere, etwas umständliche Definition macht deutlich, daß auch im Circumplex wieder nur eine Ordnung konjunkter Ähnlichkeiten festgelegt ist, da eine Zeilen- oder spaltenweise Definition ausreicht. Die Distanzen von jedem Punkt aus gesehen zu allen anderen sind jeweils geordnet, aber über das Verhältnis disjunkter Distanzen ist nichts ausgesagt. Die Konfiguration, die eine MDA für eine circumplistische Datenmatrix erzeugt, ist ein konvexes Polygon (ein „aufgeblähtes" Vieleck) im 2-dimensionalen Raum. Es gilt - analog zum

242 Simplex —: Eine konditionale MDA erzeugt ein Polygon, dessen Elemente unter Erhaltung der circumplistischen Ordnungsrelationen auf einen Kreis projizierbar sind; eine unkonditionale MDA berücksichtigt dagegen auch andere Relationen als diejenigen, die die Circumplex-Definition umfaßt, was i.d.R. zu „Deformationen" der geometrischen Figur führt, die nun durch die Daten, nicht durch die Startkonfiguration bedingt sind. Zur vollständigen Repräsentation (Null-Stress) ist darüberhinaus bei unkonditionaler Betrachtung meist ein 3-dimensionaler Lösungsraum erforderlich. Ob der Circumplex dann in diesem Fall in 2 oder 3 Dimensionen interpretiert wird, ist abhängig davon, ob bei 2 Dimensionen Ties entstehen, die — zusammen mit dem höheren Stress-Wert — noch in die Fehlertheorie für die analysierten Daten passen. Fast immer ist jedoch im 2-dimensionalen Raum eine exzellente Repräsentation möglich. Schwieriger ist hingegen die Deutung der „Deformation", die im unkonditionalen Fall ja Information repräsentiert, die als substantiell relevant angenommen wurde (Bei konditionaler Analyse ist die Deformation bedeutungslos). Für den Farbkreis, den SHEPARD (1962) aus psychophysisch ermittelten Farbähnlichkeits-Daten errechnet, gilt z.B., daß die diametral gegenüberliegenden Elemente „Gelb" und „Blau-Violett" ähnlicher sind, also näher beieinander liegen, als „Grün" und „ R o t " , die ebenfalls einander gegenüber liegen. In einem perfekten Kreis wären natürlich alle Oppositionselemente gleichweit voneinander entfernt. Die Deformation des Shepardschen Farbkreises ist jedoch (a) gering und (b) vor allem theoretisch unerwartet 4 , während die circumplistische Ordnung vorausgesagt war; die Interpretation der Abflachung des Kreises sollte daher — falls man so weitgehende Zuverlässigkeit der Daten annehmen will — als Hypothese, die Replikation erfordert, erfolgen. Entschließt man sich zu einer solchen hypothetischen Interpretation, ist es o f t sinnvoll, weitere Techniken wie etwa die Hauptkomponenten bei einem elliptischen Circumplex oder Cluster von Elementen bei sehr ungleichmäßig gestreuten Circumplex-Konfigurationen einzusetzen. 4

Dies gilt jedenfalls für die v e r w e n d e t e n E k m a n s c h e n Daten. Tatsächlich ist h e u t e z i e m l i c h klar, d a ß der Farbkreis kein perfekter Kreis ist (INDOW 1 9 7 4 ) .

Borg: F a c e t t e n - u n d R a d e x t h e o r i e

Hiermit ist schon angedeutet, daß derart ideale circumplistische Ordnungen wie in Tab. 6 sich empirisch wegen (a) Fehlerhaftigkeit der Daten, (b) nicht-optimaler Variablen-Konstruktion und (c) nur approximativer Gültigkeit der latenten circumplistischen Ordnung nur selten auffinden lassen. Ein Beispiel für einen ziemlich unsauberen Quasi-Circumplex, den GUTTMAN (1965) aus der in Fig. 6 dargestellten Konfiguration a posteriorisch ableitet, ist in Tab. 7 wiedergegeben. Tab. 7: Interkorrelationsmatrix für einige T e s t s aus Fig. 6 (4)

(15)

(24)

(23)

(33)

(3)

i

.49 _

.35 .48

i !

.48 .44

-

.26 .44 .58

I !

.32 .32 .52

.58 .53 .36 .39

.16 .32 .53 .71

.71 .38 .32

-

.26 .32 .36 .38 .38

.38 .25

.79 .52 .39 .32 .25 .36

.36

(1) (1) (4) (15) (24) (23) (33) (3)

i : .49 1 .35 ! .26 1 .16 .26 .79

-

-

Circumplistisch gruppiert sind hier folgende Tests: 1, 4, 15, 24, 23, 33 und 3. Man sieht in Fig. 6, daß diese Tests tatsächlich ein konvexes Ploygon bilden. Ihre Interkorrelationskoeffizienten sind jedoch nicht perfekt circumplistisch geordnet: Es lassen sich nur zwei echte Simplices i. S. der obigen Bedingungen auffinden. Sie sind in Tab. 7 durch die gestrichelten Linien angedeutet. Die Konfiguration macht deutlich, was das hier bedeutet: Zwischen den Tests 33 und 3 „ f e h l t " sozusagen ein Test, d.h. die Struktur ist halb offen. Tatsächlich sieht man, daß die Matrix fast simplistisch ist, wenn man den Test 3 eliminiert. Es wurden hier eben vorliegende Daten analysiert und nicht systematisch geplant im Hinblick auf eine circumplistische Hypothese! Die Interpretation eines Circumplex folgt aus seiner Geometrie. Benachbarte Elemente sind am ähnlichsten, während einander gegenüberliegende am unähnlichsten sind. Geht man von einem Element i aus und wandert auf dem Circumplex entlang, so nimmt die Ähnlichkeit von i zu den Elementen, die man auf dem Weg antrifft, immer mehr ab, bis man schließlich zu einem Element gelangt, das i diametral gegen-

243

Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7, 2 3 1 - 2 4 7

überliegt. Dieses Element ist von i maximal verschieden. Die folgenden Elemente nehmen dann sukzessive wieder in ihrer Ähnlichkeit zu i zu. Es läge nun nahe, diesem formalen Sachverhalt für die Elemente in Tab. 7 eine inhaltliche Deutung zu geben. Man könnte z. B. sagen, die Tests enthalten unterschiedliche Anforderungen an präzis-mechanische und an flexibel-kreative Intelligenz. Eine solche dimensionale Interpretation gibt jedoch die Relationen zwischen den Tests nicht adäquat wieder. Besser wäre hier, Sektoren inhaltlicher Ähnlichkeit wie etwa die Coombschen Faktoren N, V und D zu wählen, wobei in diesem Fall noch eine Bezeichnung für den Sektor mit den Tests 4 und 15 mötig wäre (vgl. hierzu: GUTTMAN 1 9 5 7 ) . Diese Sektoren kann man dann aufreihen wie etwa in Fig. 1. Natürlich können auch mehrere Circumplices — zusammen mit Simplices und anderen Punkten — in einem Raum liegen. Es lassen sich dann i. d. R. die Elemente verschiedenen Strukturen eingliedern. Hierbei sollte man konfirmatorisch oder allgemein theoriegestützt vorgehen, um Artefakte zu vermeiden. Erweiterungen der Circumplex-Struktur in höher-dimensionale Gebilde nennt DEGERMAN ( 1 9 7 2 ) Hyperspheroide. Sie sind jedoch mehr von theoretischem Interesse und seien hier nicht diskutiert, da ihre Eigenschaften zudem nur Extensionen des Dargestellten sind. Wichtig ist jedoch wieder die Frage, zu welchem Ergebnis verschiedene Analysemethoden bei einer circumplistischen Ordnung der Daten kommen. Eine Faktorenanalyse extrahiert m-1 gemeinsame Faktoren, wenn die Matrix vollen Rang hat. Das Komponentenmodell, aus dem dies intuitiv einsichtig wird und aus dem GUTTMAN ( 1 9 5 4 b ) den quantitativen Circumplex ableitet, führt zu weiterem Verständnis dieser Struktur: li=Pli

C

l

+

2=

P2iC2+

P3iC3

P2iC2

P3iC3

+

P4iC4

P3iC3

+

P4iC4

+

P5iC5

P4iC4

+

P5iC5

+

3i= 4i

=

Pli

C

5i=PliCl

l

+ +

P2iC2+

Die Skores brauchen hier nicht zu interessieren und sind nur angegeben, um die Struktur zu vervollständigen. Was wichtig ist, sind die Ladungen: Für sie erkennt man eine zirkuläre Ordnung, die unabhängig davon ist, mit welchem Test das Muster beginnt. Das Muster ist jedoch nur für den metrischen und darüberhinaus noch additiven Circumplex gültig. Für eine nicht-metrische Faktorenanalyse können wir jedoch wieder auf das Konzept kommunalitätskorrigierter Korrelationskoeffizienten zurückgreifen: Die Vektorendpunkte bei MVA liegen dann auf einem Kreis, während unkorrigierte Vektoren i. d. R. kürzer und von verschiedener Länge sind, so daß die cicumplistische Struktur nicht augenscheinlich wird. Bei unkonditionaler Analyse kann die vollständige Repräsentation der Vektoren möglicherweise einen 3-dimensionalen Raum erfordern. Ansonsten gelten die gleichen Argumente wie für den entsprechenden MDAFall.

Radex Eine bestimmte Kombination von Simplex- und Circumplex-Strukturen stellt einen Radex dar. Ein Beispiel für einen sehr unvollkommenen Radex wurde bereits oben im Zusammenhang mit der Facetten-Theorie gegeben (Fig. 1). Um das

P5iC5'

wobei: t 1 4 = Skore von Vp. i auf Test t j ; p H = Komponenten-Skore von Vp. i auf Hauptkomponente 1; Cj = Komponentengewicht von Hauptkomponente 1 bezüglich t r

Fig. 7: R a d e x - K o n f i g u r a t i o n für D a t e n aus Tabelle 8.

244

Borg: Facetten- und Radextheorie

Konzept zu verdeutlichen, ist in Fig. 7 ein ordinal perfekter Radex dargestellt. Wie man sieht, gehört hier jedes Element gleichzeitig zu genau einem Circumplex und einem Simplex, der keine Unterstruktur des Circumplex ist. Dies gilt nicht für ein mögliches Zentralelement, das den Mittelpunkt der konzentrischen Circumplices und den Ursprung der Simplices darstellen würde. Für unsere ordinal definierten Strukturen ist in einem Fall wie Fig. 7 offensichtlich, daß die Simplices 1-2-3-4 und 12-11-10-9 formal als ein Super-Simplex betrachtet werden können. Dasselbe gilt für 4-3-2-1 und 5-6-7-8. Liegen für derartige Supersimplices auch inhaltliche Gründe vor, so sei die Konfiguration u. a. aus Gründen der Kompatibilität mit Guttmans ursprünglicher, metrischer Radexdefinition (GUTTMAN 1954b) nicht als Radex bezeichnet. Ein Radex ist somit keine ein-eindeutig formal definierbare Struktur mehr; dies ist analog einer Datenmatrix bzw. Konfiguration, in der mehrere Simplices und/oder Circumplices enthalten sind. Dem Radexkonzept ist also die Vorstellung eines inhaltlich sinnvollen Ursprungs inhärent. Ein ausgezeichnetes Beispiel dafür ist die oben diskutierte Studie von LEVY (1976), wo das Zentralelement der Radex-Struktur für die verschiedenen Zufriedenheitsitems „life in general" ist.

einfachen Simplex. Darüberhinaus kann ein Radex von vielerlei Gestalt sein, je nach Zahl und Art der in ihm organisierten Unterstrukturen. Für das Beispiel aus Fig. 7 sei aber dennoch zum Vergleich mit den oben diskutierten Strukturen die zugrundeliegende Datenmatrix angeführt (Tab. 8). Die Werte hier sind Korrelationskoeffizienten, die berechnet wurden für Vektoren der Länge „ 5 " , deren Elemente die Punkte in Fig. 7, projiziert in eine Halbkugel über dieser Konfiguration, sind; die Distanzen der sich so ergebenden Vektorendpunkte 1 und 5 (usw.) bzw. 1 und 2 (usw.) sind gleich „ 1 " . In Tab. 8 sind die verschiedenen Unterstrukturen durch die gestrichelten Linien voneinander abgesetzt. Man erkennt: Nicht-überlappende Simplices entlang der Hauptdiagonalen; zwei Typen Spearmanscher „unit rank hierarchies" (THURSTONE 1947), in denen die Koeffizienten Zeilen- und spaltenweise über die Hauptdiagonale hinweg monoton ansteigen und symmetrisch sind. (Datenmatrizen dieser Art führen bei metrischer und — a forteriori — bei nichtmetrischer F A zu einem 1-dimensionalen Lösungsraum, während MD As höherdimensionale Räume erfordern. Dies ist der einzige Fall, wo das Vektormodell weniger Dimensionen als das Distanzmodell benötigt). Die Datenmatrix ist offenbar trotz des einfachen Radex, aus dem sie konstruiert wurde, ziemlich kompliziert und außerdem recht groß, da sie immerhin 120 Koeffizienten enthält. Ein vollständiger Radex erfor-

Die Tatsache, daß sich eine Datenmatrix in eine gewisse ordinale Struktur permutieren läßt, ist also weniger nützlich als etwa bei einem

Tab.8: Korrelationsmatrix für Radex aus Fig. 7 ( K o e f f i z i e n t e n enthalten Rundungsfehler) 1

2

3

4

5

6

7

8

1 2

98

3

92

98

-

4

82

92

98

-

5

98

93

84

6 7

93 84

88

79 71

72 67

8

72

9

96

89

10 11

89

80 67

59 47

98

-

92

98

-

82

92

98

59 77

64

98

93

84

72

77 64

64

46 28

88 80

80 71

67

46

93 84

46

08

72

67

59

47

96

89

77

64

77

64

46

64

46

46

28

12 13

98

93

28 84

14

93

88

79

72 67

15

84

80

71

59

89 77

16

72

67

59

47

64

9

10

11

12

-

1

| 1 1 1 1 1

98 92

-

98

-

92

98

98 92

98

93

84

72 67 59

1 1 98 1 92

47

1

-

93 84

88

28

1 1 1

80

79 71

08

1

72

67

59

1

15

16

|

L |

14

- I-

I

59

13

1 1 1 1 1

I 1 1

_

77 64

1 1 1 1 I 1

98

-

1

82

-

-

245

Zeitschrift für Sozialpsychologie 1976, 7, 2 3 1 - 2 4 7

dert somit bereits eine erhebliche Zahl von Elementen, die nach Möglichkeit schon sehr sorgfältig theoriegestützt (i. S. nicht nur der Repräsentativität der Population, sondern auch des Itemdefinitionsbereichs, also des „universe of content") erhoben werden sollten, um zu vermeiden, was z. B. beim Radex in Fig. 1 deutlich wird: Die Struktur ist unausgewogen durch Elemente bestätigt und daher nicht von maximalem Nutzen. Die Konfigurationen, die metrische und nichtmetrische Vektoranalysen aus einer Matrix wie in Tab. 8 erzeugen, folgen wieder aus den bereits oben gemachten Überlegungen zum Verhältnis von Distanz- und Vektormodell. Der Radex ist erweiterbar zu einer drei- oder mehrdimensionalen Kugel oder zu einem Zylinder „übereinandergestapelter" 2-dimensionaler Radices (Zylindrex), wofür L E V Y (1975) und L E V Y & G U T T M A N (1975) Beispiele aus dem Bereich der Einstellungsforschung berichten. Weitere spezielle Strukturen, die alle aus den drei diskutierten Grundstrukturen abgeleitet sind und z. T. mit anderen geometrischen Konzepten verknüpft sind, seien hier aus Raumgründen nicht diskutiert; siehe hierzu: DEGERMAN 1972.

Diskussion Die vorgestellten Ordnungsstrukturen des Simplex, Circumplex und Radex sind neben der gängigen dimensionalen (siehe hierzu: BAILEY 1974) und der populärer werdenden clusterartigen (siehe hierzu: BAILEY 1975) Interpretation multidimensionaler Skalierungsergebnisse ein dritter Weg der inhaltlichen Deutung der erzeugten Konfigurationen. Es sollte jedoch nunmehr klar sein, daß der Radex-Ansatz nicht notwendigerweise mit den beiden anderen Methoden sinnvoll kombinierbar ist. Dies ergibt sich z.B. aus der Cluster-Interpretation eines Simplex, die statt einer einfachen konditionalen Ordnungssequenz von Elementen diskrete ElementGruppierungen annimmt, die bei hierarchischem Ansatz erst auf dem allgemeinsten Niveau, das interpretatorisch uninteressant ist, Gemeinsamkeit aufweisen. Ähnliches gilt für dimensionale Interpretationen eines Simplex, wo oft mit viel Mühe eine zweite Dimension gedeutet wird, die selbst bei unkonditionaler Betrachtung weder

statistisch noch inhaltlich sinnvoll erscheint. Im übrigen gilt natürlich — wie schon mehrfach bemerkt —, daß auch dann, wenn mehrere Simplices in einem Raum liegen und ihre relative Lage interpretiert wird, die Bezeichnung von Dimensionen meist nicht in der Lage ist, den vorgefundenen Sachverhalt adäquat widerzugeben. All dies ist aber letztlich nur sinnvoll, wenn eine Hypothese darüber vorliegt, welcher Art die Konfiguration sein sollte oder zumindest in welcher Ähnlichkeitsbeziehung die einzelnen Elemente zueinander stehen. Andernfalls ist nicht klar, welcher Interpretation der Vorzug gegeben werden sollte. Das Vorliegen gewisser Erwartungen und Theorien ist auch für die Aussonderung von Teilstrukturen in oft vieldeutigen Konfigurationen notwendig. Eine frühe Kritik von AHMAVAARA & M A R K K A N E N (1958, S. 69f.) erkennt dies bereits: „We can connect points to form simplices in a number of different alternative manners... The requirement that the point scatter should be oblong does not render the selection unique. In fact, this selection is quite arbitrary. It is possible to select from any large test battery of, say, mental abilities a large number of simplexes by combining the tests in a number of alternative ways." Es ist also notwendig, diese Zusammenfassungen weniger arbiträr zu machen und damit gleichzeitig das zu vermeiden, was die Schwäche explorativer Studien ist: die potentielle Erzeugung psychologisch-theoretischen Nonsens durch zusammenfassende Interpretation von nicht Zusammengehörigem. Ein Weg zu sinnvoller Formulierung solcher Hypothesen und insbesondere auch zur Item-Konstruktion ist die Facetten-Theorie.

Literatur AHMAVAARA, Y. & MARKKANEN, T. 1 9 5 8 . T h e U n i f i e d

Factor Model. The Finnish Foundation for Alcohol Studies, Nr. 7. ANDREWS, F.M. 1974. Social indicators of perceived life quality. Social Indicators Research 1, 2 7 9 - 2 9 9 . BAILEY, K. D. 1974. Interpreting smallest space analysis. Sociological Methods and Research 3, 3 - 2 9 . BAILEY, K.D. 1975. Cluster analysis. In: D.R.Heise (Hrsg.) Sociological Methodology 1975. San Francisco: Jossey-Bass, 5 9 - 1 2 8 .

246 COOMBS, C . H . 1 9 4 1 . A factorial study o f n u m b e r ability. P s y c h o m e t r i k a 6, 1 6 1 - 1 8 9 . COOMBS, C . H . 1 9 6 4 . A T h e o r y o f Data. N . Y . : Wiley. DEGERMAN, R . L. 1 9 7 2 . T h e geometric representation o f some simple structures. In: R . N . S h e p a r d ; A . K . R o m n e y & S . B . N e r l o v e Multidimensional Scaling. N . Y . : Seminar Press, B d . I , 1 9 3 - 2 1 1 . F E G E R , H. 1 9 7 4 . Die Erfassung individueller Einstellungsstrukturen. Zeitschrift für Sozialpsychologie 5, 242-254. F E G E R , H. 1 9 7 5 . Längsschnittliche Erfassung intraindividueller Unterschiede bei Einstellungsstrukturen. In: U . M . L e h r & F . E . W e i n e r t (Hrsg.) E n t w i c k l u n g und Persönlichkeit. Stuttgart: K o h l h a m m e r , 3 8 — 4 9 . FOA, U . G . 1 9 5 8 . T h e contiguity principle in the structure o f interpersonal relations. Human R e l a t i o n s II, 229-238. FOA, U . G . 1 9 6 5 . New developments in facet design and analysis. Psychological Review 7 2 , 2 6 2 — 2 7 4 . GRATCH, H. (Hrsg.) 1 9 7 3 . 2 5 Y e a r s o f Social Research in Israel. Jerusalem: Jerusalem Academic Press. GREEN, P . E . & CARMONE, F . J . 1 9 7 1 . Multidimensional Scaling and Related Techniques in Marketing Analysis. B o s t o n : Allyn & B a c o n . GREEN, P . E . & RAO, V . R . 1 9 7 2 . Applied Multidimensional Scaling: A Comparison o f Approaches and Algorithms. N. Y . : Holt, Rinehart & Winston. GREEN, P . E . & WIND, Y . 1 9 7 3 . Multiattribute Decisions in Marketing: A Measurement Approach. Hindsdale, III.: T h e Dry den Press. GUTTMAN, L. 1 9 5 0 . T h e principal c o m p o n e n t s o f scale analysis. In: S. A. S t o u f f e r , L . G u t t m a n , E . A. Suchman, P . F . L a z a r s f e l d , S . A . S t a r & J . A . C l a u s e n Measurement and Prediction. P r i n c e t o n : P r i n c e t o n Univ. Press, 3 1 2 - 3 6 1 . GUTTMAN, L. 1 9 5 4 a . T h e principal c o m p o n e n t s o f scalable attitudes. In: P . F . L a z a r s f e l d (Hrsg.) Mathematical Thinking in the Social Sciences. G l e n c o e , 111.: T h e Free Press, 2 1 6 - 2 5 7 . GUTTMAN, L. 1 9 5 4 b . A new approach to f a c t o r analysis: the radex. In: P. F . Lazarsfeld (Hrsg.) Mathematical Thinking in the Social Sciences. G l e n c o e , 111.: T h e Free Press, 2 5 8 - 3 4 8 . GUTTMAN, L. 1 9 5 5 . A generalized simplex f o r f a c t o r analysis. Psychometrika 2 0 , 1 7 3 — 1 9 2 . GUTTMAN, L. 1 9 5 7 . Empirical verification o f the radex structure o f mental abilities and personality traits. Educational and Psychological Measurement 1 7 , 391-407. GUTTMAN, L. 1 9 6 6 . Order analysis o f correlation matrices. In: R . B . C a t t e l l (Hrsg.) H a n d b o o k o f Multivariate E x p e r i m e n t a l Psychology. Chicago, 111.: RandMcNally, 4 3 8 - 4 5 8 . GUTTMAN, L. 1 9 6 7 . T h e development o f n o n m e t r i c space analysis: a letter to J o h n Ross. Multivariate Behavioral Research 2, 7 1 - 8 2 . INDOW, T . 1 9 7 4 . Applications o f multidimensional scaling in perception. In: E . C . C a r t e r e t t e & M . P . F r i e d man (Hrsg.) H a n d b o o k o f Perception. N. Y . : Academic Press, B d . I I , 4 9 3 - 5 3 1 .

Borg: F a c e t t e n - und R a d e x t h e o r i e

JÖRESKOG, K . G . 1 9 6 9 . A general approach t o confirm a t o r y m a x i m u m likelihood f a c t o r analysis. Psychometrika 3 4 , 1 8 3 - 2 0 2 . KENDALL, D. G. 197 l a . A b u n d a n c e matrices and seriation in archaeology. Zeitschrift für Wahrscheinlichkeitstheorie 17, 1 0 4 - 1 1 2 . KENDALL, D . G . 1 9 7 1 . Seriation from a b u n d a n c e matrices. In: F . R . H o d s o n , D . G . K e n d a l l & P . T a u t u (Hrsg.) Mathematics in the Archaelogical and Historical Sciences. Edinburgh: Univ.Press 2 1 3 — 2 5 2 . KRANTZ, D . H . , LUCE, R . D . , SUPPES, P. & T V E R S K Y , A . 1 9 7 1 . F o u n d a t i o n s o f Measurement: Additive and Polynomial Representations. N . Y . : A c a d e m i c Press, Bd.I. KRUSKAL, J . B . & SHEPARD, R . N . 1 9 7 4 . A n o n m e t r i c variety o f f a c t o r analysis. P s y c h o m e t r i k a 3 9 , 1 2 3 — 157. LEVELT, W. J . M . , VAN DE G E E R , J . P . & PLOMP, R . 1 9 6 6 . Triadic comparisons o f musical intervals. British J o u r n a l o f Mathematical and S t a t i s t i c a l Psychology 19, 1 6 3 - 1 7 9 . LEVY, S. 1 9 7 5 . Political involvement and attitude. Israel Institute o f Applied S o c i a l Research, Nr. SL/530/E. LEVY, S. & GUTTMAN, L. 1 9 7 5 . On the multivariate structure o f well-being. Israel Institute o f Applied Social Research, u n n u m m i e r t . LEVY, S. 1 9 7 6 . Use of the mapping s e n t e n c e for coordinating theory and research: a cross-cultural example. Quality and Q u a n t i t y : European-American J o u r n a l o f Methodology, ( i m Druck). LINGOES, J . C . & GUTTMAN, L. 1 9 6 7 . N o n m e t r i c factor analysis: a rank-reducing alternative t o linear f a c t o r analysis. Multivariate Behavioral R e s e a r c h 2, 4 8 5 505. LINGOES, J . C . 1 9 6 8 . T h e multivariate analysis o f qualitative data. Multivariate Behavioral R e s e a r c h 3, 61— 94. LINGOES, J . C . 1 9 7 1 . S o m e boundary c o n d i t i o n s for a m o n o t o n e analysis o f s y m m e t r i c matrices. Psychometrika 3 6 , 1 9 5 - 2 0 3 . LINGOES, J . C . 1 9 7 3 . T h e G u t t m a n - L i n g o e s N o n m e t r i c Program Series. Ann Arbor, Mich.: Mathesis Press. MULAIK, S . A . 1 9 7 2 . T h e F o u n d a t i o n s o f F a c t o r Analysis. N . Y . : McGraw-Hill. ROMNEY, A . K . , SHEPARD, R . N . & NERLOVE, S . B . (Hrsg.) 1 9 7 2 . Multidimensional Scaling. N . Y . : Seminar Press, B d . I I . RUNKEL, P . J . & MCGRATH, J . 1 9 7 2 . R e s e a r c h on Human Behavior. N . Y . : Holt, Rinehard & Winston. SHEPARD, R . N . 1 9 6 2 . T h e analysis o f proximities: multidimensional scaling with an u n k n o w n distance f u n c t i o n . II. P s y c h o m e t r i k a 2 7 , 2 1 9 — 2 4 6 . SHEPARD, R . N . & CARROLL, J . D . 1 9 6 6 . Parametric representation o f nonlinear data structures. In: P. R. Krishnaiah (Hrsg.) Multivariate Analysis: Proceedings of an International S y m p o s i u m . N . Y . : A c a d e m i c Press 5 6 1 - 5 9 2 . SHEPARD, R . N . 1 9 7 4 . Representation o f structure in similarity data: Problems and prospects. Psychometrika 3 9 , 3 7 3 - 4 2 1 .

247

Zeitschrift für Sozialpsychologie 1976, 7, 2 3 1 - 2 4 7 TORGERSON, W.S. 1958. T h e o r y and M e t h o d s of Sealing. N. Y.: Wiley. THURSTONE, L. L. 1947. Multiple F a c t o r Analysis. Chicago: Univ. of Chicago Press.

VAN DEN WOLLENBERG, A . L . 1974. Smallest space analysis of G u t t m a n ' s r a d e x : is a circular representation possible? Univ. of Nijmegen, R e p o r t 74 MA-01.

B

248

Werbik: T h e o r i e sozialen Handelns I

Grundlagen einer Theorie sozialen Handelns Teil I. Aufbau der handlungstheoretischen Terminologie H A N S WERBIK

Institut für Psychologie und S o n d e r f o r s c h u n g s b e r e i c h 22 der Universität Erlangen-Nürnberg

Der Ansatz zu einer T h e o r i e sozialen H a n d e l n s basiert auf d e m ethischen Prinzip der K o n f l i k t l ö s u n g . Die Theorie bezieht sich auf S i t u a t i o n e n , in d e n e n zwei K o n f l i k t p a r t e i e n u n d ein neutraler V e r m i t t l e r miteina n d e r interagieren. Z u m Z w e c k e der G e w i n n u n g überp r ü f b a r e r H y p o t h e s e n w e r d e n die K o n f l i k t p a r t e i e n d u r c h zwei Versuchspersonen, der V e r m i t t l e r d u r c h den Versuchsleiter repräsentiert. Das Verhältnis zwischen d e m Versuchsleiter u n d jeder der beiden Versuchspersonen ( K o n f l i k t p a r t e i e n ) wird als ideale S p r e c h s i t u a t i o n a u f g e f a ß t . Es wird also u n t e r s t e l l t , d a ß die Versuchspersonen z u m Versuchsleiter das sagen, was sie meinen. Relativ zu einem solchen T y p u s von Situat i o n e n , den wir „ B e r a t u n g s t r i a d e " n e n n e n , w e r d e n der T e r m i n u s „ H a n d l u n g " u n d die kognitiven T e r m i n i „Erw a r t u n g " , „ V o r s a t z " , „ Z i e l " u n d „ O b e r z i e l s y s t e m " eingeführt. Die M e t h o d e der E i n f ü h r u n g der kognitiven Termini u n t e r s c h e i d e t sich von der Erlebnispsychologie e b e n s o wie vom Behaviorismus.

1. Erkenntnisinteresse, Fragestellungen

T h e c o n c e p t i o n of a t h e o r y of social a c t i o n is based on t h e ethic principle of conflict r e s o l u t i o n . T h e t h e o r y is related t o situations in which t w o c o n f l i c t parties and a n e u t r a l m e d i a t o r are interacting. In order t o gain testable h y p o t h e s e s the conflict parties are r e p r e s e n t e d b y t w o subjects, t h e m e d i a t o r by t h e e x p e r i m e n t e r . T h e relation b e t w e e n the e x p e r i m e n t e r and e a c h of t h e t w o subjects w h o are in a conflict w i t h each o t h e r are m e a n t to be based on an ideal c o n d i t i o n in discussion. It is t h u s p r e s u m e d that t h e subjects will tell t h e e x p e r i m e n tar w h a t t h e y really mean. In relation t o such a t y p e of situations, which we call „ B e r a t u n g s t r i a d e " , t h e t e r m „ a c t i o n " and the m e n t a l t e r m s „ e x p e c t a t i o n " , „ i n t e n t " , „ g o a l " , and „ s y s t e m of m a j o r g o a l s " are i n t r o d u c e d . T h e m e t h o d of i n t r o d u c i n g t h e m e n t a l t e r m s d i f f e r s f r o m t h o s e used in i n t r o s p e c t i o n i s m and behaviorism.

turwissenschaften jeweils einschlägt, von entscheidender Bedeutung sind und immer bleiben werden" (WEBER 1904, p. 155). Die wissenschaftstheoretische Diskussion der letzten Jahre (Literaturangaben) hat uns PsychoInsofern Wissenschaft auf intersubjektive Verlogen bewußt gemacht, daß Interessen und Norständigung ausgerichtet ist, gehört die explizite men nicht nur für die Anwendung wissenschaftFormulierung des „normativen Hintergrunds" licher Forschungsergebnisse entscheidend sind, oder der „Wertbasis" (ALBERT 1969) zu den sondern bereits in den Ansatz einer wissenAnforderungen, die an jeden gestellt werden schaftlichen Theorie und der ihr zugeordneten müssen, der einen Beitrag zur Theorienbildung Methodologie eingehen (STRÖKER 1973). Max in der Psychologie leisten will. Wer die AuffasWeber, von dem aufgrund eines weitverbreitesung teilt, daß wissenschaftliche Tätigkeit auf ten Mißverständnisses gesagt wird, er hätte sich intersubjektive Verständigung ausgerichtet ist, dafür ausgesprochen, daß sich der Wissenschaftmuß bereit sein, den „normativen Hintergrund" ler grundsätzlich Werturteilen enthalten solle, oder - anders ausgedrückt — die „Wertbasis" hat sich tatsächlich nur gegen die „Vermischung" einer theoretischen Konzeption ausdrücklich zu von Tatsachenbeschreibung und wertenden Stelmachen. lungnahmen gewandt und ausdrücklich bestätigt, Im folgenden wollen wir versuchen, eine exdaß die „höchsten ,Werte' des praktischen Inplizite Formulierung des erkenntnisleitenden teresses für die Richtung, welche die ordnende Interesses unserer Theorie zu geben: Die konTätigkeit des Denkens auf dem Gebiete der Kulstruktive Philosophie (JANICH 1973; L O R E N Z E N

249

Zeitschrift für Sozialpsychologie 1 9 7 6 , 7, 2 4 8 - 2 6 1

1973) sieht es als die Aufgabe der Wissenschaften an, „Störungen" im Ablauf der alltäglichen Handlungen zu beseitigen oder zu vermeiden. Diese „Störungen" lassen sich einteilen in solche, die aufgrund einer Mangelsituation entstehen, und in solche, die auf eine Konfliktsituation zurückzuführen sind ( L O R E N ZEN & SCHWEMMER 1973, p. 108). Wir sprechen immer dann von einem „Konflikt", wenn zwei Parteien (Personen, Gruppen, Institutionen) unvereinbare Ziele verfolgen, so daß eine Partei nur dann ihr Ziel erreichen kann, wenn die andere Partei ihr Ziel nicht erreicht. Während es Aufgabe der Naturwissenschaften ist, zur Beseitigung von Mangelsituationen beizutragen, ist die Verhinderung bzw. die Lösung von Konflikten Aufgabe der Sozialwissenschaften. & SCHWEMMER

Die Frage, ob es berechtigt ist, jede sozialwissenschaftliche Fragestellung dem Konfliktlösungs-Interesse zuzuordnen, soll uns hier nicht beschäftigen. Uns geht es nur darum aufzuzeigen, wie man aufgrund einer vorläufigen Entscheidung, sich an der Aufgabe der Konfliktlösung zu beteiligen, zu einem bestimmten theoretischen Ansatz und zu einer bestimmten Methodologie kommt, oder, anders ausgedrückt, wie man eine bestimmte theoretisch-methodische Konzeption durch explizite Bezugnahme auf das Konfliktlösungs-Interesse metatheoretisch begründen kann. Für das Verständnis der folgenden Ausführungen ist wesentlich, daß zwischen „Beseitigung" und „Lösung eines Konfliktes" unterschieden wird. Beseitigung ist ein beliebiger Ausgang der Situation, durch welchen der Konflikt faktisch aufgehoben wird. Lösung eines Konflikts ist eine bestimmte, besonders ausgezeichnete Art der Beseitigung eines Konflikts. Die Auszeichnung einer bestimmten Art von Konfliktbeseitigung als „Konfliktlösung" kann nur relativ zu einem bestimmten ethischen Prinzip erfolgen. (1974) hat in Anlehnung an LORENZEN & SCHWEMMER (1973) ein ethisches Prinzip der Konfliktlösung vorgeschlagen, welches durch folgende generelle Aufforderungssätze definiert werden kann: WERBIK

1. Fasse in einer Konfliktsituation jedes Handlungsziel als Mittel für ein Oberziel auf! 2. Suche bei den Konfliktparteien die miteinander verträglichen Oberziele!

3. Ersetze die ursprünglichen Handlungsziele durch solche, die ebenfalls geeignete Mittel für die miteinander verträglichen Oberziele sind, so daß sich insgesamt ein System von miteinander verträglichen Zielsetzungen ergibt! Was als Lösung des Konfliktes gelten kann, wird also durch Befolgung der durch diese drei Aufforderungssätze umschriebenen Methode festgelegt 1 . Eine so verstandene Konfliktlösung kann faktisch nur in der Weise Zustandekommen, daß die am Konflikt Beteiligten sich über diz Interpretationen ihrer Handlungen, nämlich als Mittel für bestimmte Oberziele, verständigen, dabei die gemeinsamen sowie die einander nicht widersprechenden Oberziele entdecken, wechselseitig akzeptieren und dann den Versuch machen, die Mittel zur Erreichung dieser Oberziele so auszutauschen oder abzuändern, daß der ursprüngliche Zustand des Konfliktes aufgehoben ist. Akzeptiert man das Herbeiführen solcher Konfliktlösungen als das Endziel unserer wissenschaftlichen Bemühungen, so ist es Aufgabe der Theorie, Prognosen zu treffen, unter welchen Bedingungen solche Konfliktlösungen tatsächlich Zustandekommen. Nun kann die Lösung eines Konfliktes ja nur in einem Beratungsprozeß erfolgen, in welchem schrittweise die einzelnen für die Konfliktlösung erforderlichen Voraussetzungen hergestellt werden. Eine solche Voraussetzung für die Konfliktlösung ist beispielsweise die Bereitschaft zur Fortsetzung der Beratung. Eine weitere notwendige Bedingung ist die Erreichung eines Konsens über die Interpretation der von den einzelnen Konfliktpartnern beabsichtigten Handlungen. Man kann also bei jedem Schritt, der innerhalb des Konfliktlösungs-Prozesses vorgesehen ist, danach fragen, unter welchen Bedingungen 1

Mein Vorschlag unterscheidet sich von d e m entsprechenden Vorschlag S c h w e m m e r s („Vernunftprinzip" und „Moralprinzip") in f o l g e n d e m Punkt: Während S c h w e m m e r zur Begründung von Zwecksetzungen nur Normen (das sind universelle, d.h. für alle Personen gültige Aufforderungssätze) zuläßt, erlaubt mein Vorschlag auch eine „Begründung" durch Angabe von personengebundenen generellen (d.h. situationsvarianten) Zwecksetzungen. Solche generelle Zwecksetzungen, welche bei S c h w e m m e r Maximen heißen, werden von mir „Oberziele" genannt.

250 miteinander Beratende das für eine spätere Konfliktlösung notwendige Kriterium erreichen können und unter welchen Bedingungen die Konfliktlösungs-Bemühungen nicht aussichtsreich sind. Beispielsweise kann man fragen, unter welchen Bedingungen Konfliktpartner überhaupt bereit sind, in eine Beratung über Ziele einzugehen. Ebenso kann man fragen, unter welchen Bedingungen die Konfliktpartner die Beratung vorzeitig abbrechen, ohne daß die Unmöglichkeit einer Konfliktlösung schon nachgewiesen ist. Oder man kann danach fragen, unter welchen Bedingungen zwischen den Konfliktparteien ein Konsens über die Interpretation von Handlungszielen als Mittel für Oberziele sicherlich nicht herbeigeführt werden kann. Aufbauend auf solchen Prognosen kann man weiter die Frage stellen, ob man durch bestimmte Eingriffe in den Beratungsprozeß, die von einem neutralen Vermittler ausgehen, nicht doch erreichen könnte, daß im Beratunsprozeß eine für eine Konfliktlösung notwendige Voraussetzung verwirklicht wird. Zusammenfassend können wir die Aufgabe, die wir uns gestellt haben, in folgender Weise formulieren: Die zu entwickelnde Theorie sozialen Handelns soll Abweichungen des faktischen Verhaltens der Beratungsteilnehmer von dem gemäß den Prinzipien der Konfliktlösung geforderten Verhalten auf Grundlage von allgemeinen Hypothesen über die Abhängigkeit dieser Abweichungen von bestimmten Bedingungen vorhersagen, erklären und Handlungsvorschläge entwickeln, wie in Beratungssituationen verfahren werden soll, damit das Eintreten von Bedingungen, welche Abweichungen bewirken, vermieden oder die generelle Wirksamkeit dieser Bedingungen überhaupt aufgehoben werden kann.

Werbik: Theorie sozialen Handelns I

Prinzipien der Konfliktlösung hergeleitet werden können und sich auf das Verhalten in konkreten Beratungssituationen beziehen, befolgen. Da die Befolgung dieser spezielleren präskriptiven Sätze aus den generellen Prinzipien analytisch folge, sei die Feststellung des Befolgens dieser Aufforderungssätze kein Problem für eine empirische Untersuchung. Bei dieser Argumentation wird jedoch ganz übersehen, daß die Behauptung, eine Person anerkenne im Grundsatz die ethischen Prinzipien der Konfliktlösung, eine empirische Allgemeinaussage ist, die möglicherweise falsch ist. Selbst dann, wenn die Behauptung der grundsätzlichen Anerkennung der ethischen Prinzipien der Konfliktlösung überprüft und bestätigt wurde, ist es in einer konkreten Beratungssituation dennoch möglich, daß die Person eine Aufforderung, die aus den von ihr anerkannten Prinzipien analytisch folgt, tatsächlich nicht befolgt, etwa weil sie die gegebene Aufforderung nicht mit ihren Prinzipien in Beziehung setzt, so daß sie den Widerspruch zwischen ihrem Verhalten und den von ihr anerkannten Prinzipien gar nicht bemerken kann. Ob die Person in einer gegebenen Situation ihre ethischen Prinzipien „aktualisiert" und die Beschreibung ihres Verhaltens hinsichtlich Übereinstimmung mit den ethischen Prinzipien überprüft, ist eine Frage, die nur aufgrund empirischer Untersuchungen beantwortet werden kann.

2. Der primäre Geltungsbereich der Theorie

Die Unterscheidung eines „primären" von einem „sekundären" Geltungsbereich einer Theorie soll darauf hinweisen, daß Verhaltenstheorien ursprünglich für einen bestimmten Typus von Situationen konzipiert werden (beispielsweise An dieser Stelle ist es angebracht, auf ein bezieht sich die Theorie von Hull primär auf mögliches Mißverständnis unseres Vorhabens das Paradigma des „instrumentellen Konditiohinzuweisen: Auf Grundlage einer strengen Unnierens") und daß in einem zweiten Schritt der terscheidung zwischen solchen Sätzen, die allein aufgrund von Definitionen oder sonstigen sprach- Geltungsbereich einer Theorie erweitert wird, indem ein bestimmtes Verhalten kontrafaktisch lichen Verabredungen wahr sind (analytisch so betrachtet wird, als ob die Situation, in der wahre Sätze), und solchen Sätzen, die aufgrund dieses Verhalten auftritt, dem ursprünglich von der Erfahrung gültig sind (empirisch wahre der Theorie ins Auge gefaßten Situationstyp Sätze), könnte man argumentieren: Wer die entspräche (beispielsweise werden von Dollard ethischen Prinzipien der Konfliktlösung aner& Miller kognitive Vorgänge als „responses" kannt habe, der müsse auch die spezielleren bzw. „cue producing responses" aufgefaßt und Aufforderungssätze, welche aus den ethischen

Zeitschrift für Sozialpsychologie 1 9 7 6 , 7, 2 4 8 - 2 6 1

die Situationen, in denen diese inneren Responses entstehen, so betrachtet, als ob sie dem Situationstyp des „instrumenteilen Konditionierens" gleichartig wären). Da es uns hier nur auf den prinzipiellen Unterschied zwischen dem ursprünglichen Situationsbezug einer Theorie und der nachträglichen Erweiterung ihres Geltungsbereiches ankommt, wollen wir nicht danach fragen, unter welchen Bedingungen eine solche Bezeichnung einer Situation als „gleichartig mit einem bestimmten Situationstypus" sinnvoll ist. Unsere Theorie sozialen Handelns bezieht sich primär auf einen Typus von Situationen, den wir „Beratungstriade" nennen. Unter dieser Bezeichnung verstehen wir eine normierte Interaktions-Situation zwischen zwei Versuchspersonen (abgekürzt P! und P2) und einem Versuchsleiter. Die Normierung der Situation soll so erfolgen, daß die beiden Versuchspersonen miteinander im Konflikt stehen und der Versuchsleiter, welcher die Interaktionen zwischen Pt und P2 beobachtet, weder von P! noch von P2 als Partei wahrgenommen wird, sondern von beiden Versuchspersonen als ein Gesprächspartner betrachtet wird, zu dem man sagt, was man meint. Die Notwendigkeit, die Einstellung der Versuchspersonen zum Versuchsleiter mit in die Definition der „Beratungstriade" aufzunehmen, ergibt sich daraus, daß wir nicht Verhalten schlechthin, sondern das sinnvolle Verhalten, also das Handeln der Konfliktparteien untersuchen wollen. „,Handeln' soll... ein menschliches Verhalten ... heißen, wenn und insofern als der oder die Handelnden mit ihm einen subjektiven Sinn verbinden" ( M A X WEBER 1921). Nun kommt es häufig vor, daß Handelnde, von Handlungen Betroffene und neutrale Beobachter durchaus verschiedene Meinungen darüber haben können, was der „Sinn" eines gegebenen Verhaltens sei. Somit taucht die Frage auf, wer für die Interpretation eines gegebenen Verhaltens zuständig sein soll. Eine analoge Frage muß auch bezüglich der Beschreibung des Verhaltens gestellt werden: Viele verhaltensbeschreibende Prädikate, wie „drohen", „stören", „beleidigen" setzen implizit schon Deutungen der Absichten und Überzeugungen der handelnden bzw. der betroffenen Person voraus (WERBIK 1971). Wir können also die Beschreibung

251 eines Verhaltens nicht logisch unabhängig von der Interpretation eines Verhaltens verifizieren (WRIGHT 1974). Wir bezweifeln, daß es jemals möglich sein wird, universell anwendbare Regeln für die Beschreibung und Interpretation eines gegebenen Verhaltens zu entwickeln. Auf der anderen Seite sind die subjektiven Interpretationen, welche die an einem Konflikt Beteiligten einem Verhalten geben, für den Fortgang der Interaktionen besonders wichtig und können sogar Konflikte produzieren (WATZLAWICK et al. 1974). Folglich ist es für uns unerläßlich festzustellen, welche sprachliche Beschreibungen oder Interpretationen die Konfliktparteien selbst ihrem Verhalten geben. Wir müssen uns also darauf verlassen können, daß die Versuchspersonen zum Versuchsleiter stets das sagen, was sie meinen. Andererseits wissen wir, daß Aussagen von Versuchspersonen nicht unter allen Bedingungen wahrhaftig sind. In Konfliktsituationen kommt es häufig vor, daß die Konfliktparteien zueinander nicht sagen, was sie meinen, sondern durchaus falsche Interpretationen ihrem eigenen Verhalten geben, um den Gegner zu täuschen. Deshalb ist wichtig, daß der Versuchsleiter nicht als eine Konfliktpartei wahrgenommen wird. Andererseits muß eine Theorie sozialen Handelns auch die Grundlagen dafür bereitstellen, um Hypothesen formulieren zu können, unter welchen Bedingungen Konfliktparteien sich verstellen und untereinander falsche Interpretationen ihres Verhaltens austauschen. Eine Feststellung, ob eine Interpretation, die Pj ihrem Verhalten gegenüber P2 gibt, „wahr" oder „falsch" ist, kann seitens des Versuchsleiters nur dann getroffen werden, wenn wir voraussetzen, daß das Verhältnis jeder der beiden Konfliktparteien zum Versuchsleiter als „ideale Sprechsituation" (HABERMAS 1971) aufgefaßt werden kann. Die Auffassung des Verhältnisses zwischen Versuchspersonen und Versuchsleiter als „ideale Sprechsituation" ist zweifellos eine Idealisierung. Indem wir mit der Versuchsperson über ihr Verhalten reden, unterstellen wir unvermeidlich, daß sie sagt, was sie meint, und weiß, was sie tut. Die Methode der Befragung setzt voraus, daß wir die befragte Person für zurechnungsfähig, glaubwürdig und ernsthaftig halten. Indem wir die Methode der Befragung praktizieren, tun wir so, also sei eine ideale

252

Werbik: T h e o r i e sozialen H a n d e l n s I

Sprechsituation gegeben. Ob dieser Vorgriff auf eine ideale Sprechsituation berechtigt ist, können wir mit empirischen Methoden nicht entscheiden, dieser Vorgriff ist vielmehr ein „normatives Fundament" der Empirie 2 ( H A B E R M A S 1971).

Die Erkenntnis, daß bei jeder Befragung der Vorgriff auf die ideale Sprechsituation unvermeidlich ist, führt dazu, daß wir den Umständen, unter denen wir die Methode der Befragung praktizieren, mehr Aufmerksamkeit widmen. Aus alltäglicher Erfahrung 3 wissen wir, daß Personen im Selbstgespräch und im Gespräch mit einem „guten Freund" durchaus das sagen, was sie meinen, jedoch nicht das sagen, was sie meinen, wenn sie befürchten, für ihre Äußerungen bestraft zu werden. Es kommt also darauf an, die Rahmenbedingungen für die Versuchsperson-Versuchsleiter-Interaktion durch bestimmte Regeln so festzulegen, daß die daraus resultierende Sprechsituation dem Situationstypus des Selbstgesprächs bzw. des Gesprächs mit einem guten Freund „genügend ähnlich" ist. Für oder gegen das Aufstellen bestimmter Regeln kann nur durch den Hinweis auf Alltagserfahrungen argumentiert werden. Empirische Daten 4 , die wir auf Grundlage dieser Regeln gewinnen, beziehen sich dann zwangsläufig auf diejenigen Erfahrungen, welche bei der Formulierung der Regeln benützt wurden.

3. Die handlungstheoretische Terminologie 3.1 Handlung Innerhalb der „Beratungstriade" nennen wir ein Verhalten einer Person (P, oder P2) eine „Handlung", wenn a) die Person dieses Verhalten aus einer finiten Menge von möglichen Verhaltensweisen ausgewählt

hat,

b) die Person dem gewählten Verhalten eine bestimmte Beschreibung zuordnet, welcher der Versuchsleiter zustimmen kann, und 2

Zur Unterscheidung zwischen „ E r f a h r u n g " u n d

„ E m p i r i e " siehe KAMLAH ( 1 9 7 2 ) . 3 4

desgleichen. Zur U n t e r s c h e i d u n g zwischen „ E r f a h r u n g " u n d

„ E m p i r i e " siehe KAMLAH ( 1 9 7 2 ) .

c) die Person einen Satz formuliert, der von ihr ebenso wie vom Versuchsleiter als eine an sich selbst gerichtete Aufforderung („Selbstaufforderung") verstanden wird. Dieser Definitionsvorschlag bedarf einiger Erläuterungen: (1) Diese terminologische Bestimmung von „Handlung" ist eine bedingte Definition, da die Ersetzbarkeit des Definiendum durch das Definiens nur unter der Voraussetzung gilt, daß die gegebene Situation als „Beratungstriade" aufgefaßt wird. (2) Ein wichtiges Merkmal einer Handlung ist die Wahl zwischen Verhaltensalternativen (vgl. L A N G E N H E D E R 1 9 7 3 ) . Ist es für die Person unmöglich, zwischen der Ausführung oder Nichtausführung einer Verhaltensweise zu wählen, so kann man diese Verhaltensweise nicht „Handlung" nennen. Ein „Reflex" ist also keine Handlung. (3) Ein Verhalten kann nur dann als „Handlung" bezeichnet werden, wenn Versuchsperson und Versuchsleiter sich über die Beschreibung des Verhaltens verständigen können. Dabei ist zu beachten, daß sich der Versuchsleiter nicht als individueller Sprecher, sondern als Repräsentant aller potentiellen Versuchsleiter mit seiner Versuchsperson verständigt. Es genügt also nicht, eine Verhaltensbeschreibung zu suchen, der faktisch beide zustimmen. Ein faktischer Konsens zwischen Versuchsperson und Versuchsleiter bezüglich einer Verhaltensbeschreibung muß nochmals revidiert werden, wenn der Versuchsleiter einen Grund hat, daran zu zweifeln, daß jeder andere Versuchsleiter der gewählten Verhaltensbeschreibung zustimmen würde. Ein Beispiel: Nehmen wir an, ein bestimmtes Verhalten sei von Versuchsperson und Versuchsleiter übereinstimmend als „drohen" bezeichnet worden. Bezweifelt der Versuchsleiter, daß diese Verhaltensbeschreibung von allen anderen Versuchsleitern akzeptiert würde, so wird er u. U. der Versuchsperson vorschlagen, das gegebene Verhalten lieber als „Faust ballen" zu bezeichnen. (4) Die Definition des Terminus „Handlung" enthält die Redewendung „sich selbst auffordern". Für das Verständnis dieser Redewendung ist vorausgesetzt, daß die Bedeutung des Wortes „auffordern" gelernt ist. Das Verständnis des Wortes „auffordern" erwerben wir in alltäg-

Zeitschrift für Sozialpsychologie 1976, 7, 2 4 8 - 2 6 1

liehen Handlungszusammenhängen, in denen wir andere Personen dazu auffordern, bestimmte Umwelt-Zustände herbeizuführen oder Aufforderungen anderer Personen, die an uns gerichtet sind, zu befolgen (LORENZEN & SCHWEMMER

1973). Das Wort „Selbstaufforderung" bezieht sich darauf, daß eine Person an sich selbst die Aufforderung richtet, einen bestimmten Umweltszustand herzustellen. Manchmal können wir (speziell bei Kindern) tatsächlich beobachten, daß jemand an sich selbst eine Aufforderung richtet (WYGOTSKI 1972, p. 37), insbesondere dann, wenn „Störungen" im Handlungsablauf auftreten. Alltägliche Redewendungen wie „ich will (möchte) a erreichen" oder „ich beabsichtige (habe vor), a zu erreichen" oder auch „ich will a in Kauf nehmen" können sprachlich als Aufforderungssätze dargestellt und daher als Selbstaufforderungen aufgefaßt werden.

3.2 Ergebnis und Folge einer Handlung Für das Verständnis unseres handlungstheoretischen Konzeptes ist nötig, zwischen dem Tun und dem Herbeiführen von etwas zu unterscheiden. Dadurch, daß wir etwas tun, führen wir etwas anderes herbei. Das, was wir tun, wollen wir das Ergebnis, und die Wirkungen unseres Tuns die Folgen unserer Handlung nennen. Zwischen einer Handlung und ihrem Ergebnis besteht kein kausaler, sondern ein analytischer Zusammenhang: „Wenn das Ergebnis nicht zustande kommt, ist die Handlung nicht vollzogen worden. Das Ergebnis ist ein .wesentlicher' Teil der Handlung selbst" (WRIGHT 1974, p. 70). Die Unterscheidung zwischen Ergebnis und Folge ist relativ zu dem Niveau, auf dem ein Handlungszusammenhang betrachtet wird. Ein Beispiel mag dies verdeutlichen: „Wenn ich sage, daß ich das Zimmer dadurch lüfte, daß ich das Fenster öffne, dann ist das Ergebnis meiner Handlung in diesem Fall, daß sich das Fenster öffnet (offen ist). Wenn ich sage, daß ich das Fenster dadurch öffne, daß ich den Griff drehe usw., so ist die Veränderung in der Position des Griffes usw. das Ergebnis, die Veränderung in der Position des Fensters die Folge" (WRIGHT 1 9 7 4 , p. 7 0 ) .

253

3.3 Erwartung Mit dem Wort „Erwartung" bezeichnen wir eine Vorhersage (d.h. eine zeitlich vorweggenommene Beschreibung einer zukünftigen Situation) auf Grundlage einer Allgemeinaussage. Der Terminus „Erwartung" kann als Verallgemeinerung des Terminus „bedingte Prognose" (POPPER 1971) eingeführt werden. „Erwartung" ebenso wie „bedingte Prognose" bezeichnen eine Deduktion aus einem Subsumptions-Schema, das mindestens eine allgemeine Aussage und mindestens eine singulare Aussage (über die „Ausgangslage") als Prämissen enthält. Während in das Subsumptions-Schema für eine wissenschaftliche Prognose für die Allgemeinaussage nur (gemäß bestimmter methodischer Regeln) hinlänglich überprüfte und bestätigte empirische Allgemeinaussagen (Allsätze, Gesetzesaussagen) und für die singulären Sätze über die „Ausgangslage" nur (gemäß bestimmter methodischer Regeln) überprüfte und verifizierte Beobachtungssätze eingesetzt werden dürfen (STEGMÜLLER 1 9 6 9 , 1 ) , entfallen

diese Beschränkungen, wenn von „Erwartungen" gesprochen wird. Als Allgemeinaussagen können beliebige Meinungen oder Überzeugungen und als singulare Sätze beliebige Ansichten über die bestehende „Ausgangslage" eingesetzt werden (vgl. GÄFGEN 1974). Wir k ö n n t e n also

auch sagen: „Erwartung" bezeichnet eine „subjektive Prognose", die aus einer „subjektiven Ansicht" über die Ausgangslage und einem „subjektiven Wissen" über Zusammenhänge zwischen Ausganslage und nachfolgendem Zustand abgeleitet ist.

3.4 Vorsatz und Ziel Ist die Selbstaufforderung, einen bestimmten Umweltzustand herbeizuführen, eine gewisse Zeit konstant, so können wir diese Selbstaufforderung einen Vorsatz nennen (MILLER, GALANTER & PRIBRAM 1973, p. 61). Eine Person, welche den Vorsatz hat, einen bestimmten Zustand herbeizuführen, macht sich daran, einen bestimmten Plan zur Erreichung des Zustandes auszuführen oder sucht nach Wegen, wie sie den Zustand erreichen kann.

254

Werbik: Theorie sozialen Handelns I

Nicht jeder Vorsatz wird ausgeführt. Vorsätze können aufgegeben werden, wenn die Person irgendeinen vorbereitenden Teil des Planes, der zu dem gewünschten Zustand führen soll, für undurchführbar hält, oder wenn Maßnahmen, welche den gewünschten Zustand herbeiführen können, mit der Erwartung des Eintretens so ungünstiger Nebenwirkungen verbunden ist, daß die Person die Nichtausführung des Planes bevorzugt (MILLER, GALANTER & PRIBRAM 1973, p. 70/71). Mit dem Wort „Ziel" bezeichnen wir solche Vorsätze, die ausgeführt werden. Ziel ist jeweils diejenige Folge eines Handlungsergebnisses, welche mit dem Vorsatz übereinstimmt. Ziele können also nur im Nachhinein (nach Vollzug der Handlung) festgestellt werden. Ergänzend wollen wir festhalten, daß die Bezeichnung eines Ereignisses als Folge eines Handlungsergebnisses immer aufgrund des subjektiven Wissens der Person (soweit wir davon Kenntnis haben) erfolgt. Die Person kann ein bestimmtes Ereignis als Folge eines Handlungsergebnisses erwarten oder für möglich halten. Die Nichtübereinstimmung des subjektiven Wissens der Person mit dem „objektiven" Wissen des Beobachters kann ein Grund dafür sein, daß die Person ihr Ziel nicht erreicht. Vorsätze und Ziele beziehen sich immer auf konkrete Umweltsbeschreibungen. In der aktuellen Rede von Personen über ihre Handlungen kann es vorkommen, daß sie Vorsätze äußern, die nicht Umweltsbeschreibungen sind (z. B. jemand sagt, er wolle „glücklich sein"). Um solche Redeweisen auch als Vorsätze im Sinne unserer Terminologie auffassen zu können, müssen wir sie als vorläufige Beschreibungen oder Grobkodierungen (KAMINSKI 1970, p.478) von Umweltszuständen auffassen, die erst im Verlauf der Verfolgung eines Handlungsplanes genauer beschrieben werden.

lungen „verständlich machen": Wir versuchen, eine gegebene Handlung aus Annahmen über die Absichten der Person und über ihren Glauben, welche Maßnahmen sie zur Verwirklichung ihrer Absichten für erfolgversprechend hält, herzuleiten. Bei einer Zweckerklärung beziehen wir uns auf folgendes Schlußschema, welches „praktischer Schluß" genannt wird:

3.5 Oberzielsystem

WRIGHT (1974) weist darauf hin, daß dieses Schlußschema eine Reihe von weiteren Voraussetzungen enthält: Es muß angenommen werden, daß die Person vom Zeitpunkt der Formulierung ihrer Absicht, z herbeizuführen, bis zum Zeitpunkt der Ausführung von h nicht ihre Absichten ändert, daß die Person nicht an der Ausführung von h gehindert wird und schließlich,

Damit die Gründe für die Einführung eines Terminus „Oberzielsystem" verständlich werden, ist es nötig, die Zweckerklärung (teleologische Erklärung) und ihre Problematik kurz darzustellen. Mit einer Zweckerklärung wollen wir Hand-

Die Person beabsichtigt, den Zustand z herbeizuführen Die Person glaubt, daß sie z nur dann herbeiführen kann, wenn sie h ausführt Die Person führt h aus. Dieses Schlußschema können wir zur Erklärung einer gegebenen Handlung und zur Vorhersage einer Handlung aus bestimmten Annahmen über die Absichten und den Glauben der Person benützen. Wir können auch versuchen, bestimmte Annahmen über die Absichten und den Glauben der Person mittels des Schemas durch empirische Feststellung der Handlungen überprüfen. Dabei ist zu beachten, daß Annahmen über Absichten und Annahmen über den Glauben nur simultan überprüft werden können (STEGMÜLLER 1969,1, 410). Das Schlußschema erweist sich aus mehreren Gründen verbesserungsbedürftig. Mit der Ausführung der Handlung h kann nur dann gerechnet werden, wenn h für die Person überhaupt durchführbar ist und wenn die Absicht, den Zustand z zu verwirklichen, -nicht mit einer anderen Absicht, an der die Person unbedingt festhalten möchte, unvereinbar ist. Selbst wenn diese Bedenken durch entsprechende Modifikation des Schlußschemas berücksichtigt werden, kann das Schlußschema nicht als universell gültig angesehen werden. Denn es wird implizit vorausgesetzt, daß die Person als eine rational handelnde angesehen wird (STEGMÜLLER 1969,1, 537).

Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7, 2 4 8 - 2 6 1

daß die Person nicht vergißt, h auszuführen. Wright schlägt daher folgendes erweiterte Schlußschema vor: Von jetzt an beabsichtigt die Person, z zum Zeitpunkt t herbeizuführen. Von jetzt an glaubt die Person, daß sie z zum Zeitpunkt t nur dann herbeiführen kann, wenn sie h nicht später als zum Zeitpunkt t' tut. Folglich macht sich die Person nicht später als zu dem Zeitpunkt daran, h zu tun, wo sie glaubt, daß der Zeitpunkt t' gekommen ist es sei denn, sie vergißt diesen Zeitpunkt, oder sie wird gehindert. Wright faßt also Sätze über die Absichten einer Person als Allsätze auf. Wir fügen hinzu, daß ein Satz über die Absicht einer Person sich in der Regel auf einen bestimmten „Situationshintergrund" bezieht. Es ist also zweckmäßiger, Sätze über Absichten als bedingte Allsätze aufzufassen und die relevanten Situationsbeschreibungen in die explizite Formulierung des Satzes mit aufzunehmen. Eine solche Auffassung von Absichten ist aber nur dann vertretbar, wenn wir das Wort „Absicht" im Sinne von „Gesamtziel" (STEGMÜLLER 1969 I, 386) verstehen. Wollen wir das Schlußschema von Wright dazu verwenden, um Annahmen über die Absichten einer Person (relativ zu ihrem Glauben) zu überprüfen, so müssen wir bedenken: Annahmen über einzelne Ziele der Person können mit Hilfe dieses Schlußschemas nicht überprüft werden, vielmehr können nur Annahmen über den Zusammenhang von Zielen überprüft werden. Haben wir von einer Person die Hypothese, daß sie mehrere Ziele beständig verfolge, so läßt sich mittels des Schlußschemas empirisch überprüfen nur die Hypothese, daß für einen gegebenen Bereich von Situationen das System der Ziele durch eine bestimmte Beschreibung vollständig erfaßt ist, d. h. daß es überflüssig ist, ein weiteres Ziel als für die Handlung h maßgeblich anzusehen. Dieses Ergebnis unserer Überlegungen ist der Grund dafür, daß nun eine Definition für einen neuen Terminus „Oberzielsystem" vorgeschlagen wird. Grundlage für die Definition ist die Erkenntnis, daß wir eine strenge Beziehung

255 zwischen einer Absicht, einem Glauben und der Ausführung (bzw. der Einleitung der Ausführung) einer Handlung dann aufstellen können, wenn (nach Auffassung der handelnden Person) die Ausführung der Handlung h dafür hinreicht, um die Absicht zu verwirklichen. Glaubt die Person, daß der Vollzug von h das einzige ist, was für die Erreichung seines Ziels (im Sinne von „Gesamtziel") hinreicht, dann ist der Vollzug von h ihrer Meinung nach auch notwendig: Also muß sich die Person daranmachen, h zu tun. Glaubt die Person aber, daß sowohl h! als auch h 2 für sein Ziel hinreichend ist, so kann sie zwischen h j oder h 2 wählen. Aber es ist notwendig, daß die Person mindestens eine der beiden Handlungen h[ oder h 2 , die sie für das Herbeiführen von z als hinreichend ansieht, wählt (WRIGHT 1974, p. 95). Wir haben nun vor, eine Beschreibung eines Umweltzustandes S dann und nur dann „Oberzielsystem" der Person zu nennen, wenn die beiden folgenden Bedingungen erfüllt sind (vgl. WERBIK 1974): 1. Hat die Person nur die Wahl zwischen h und der Alternative „nichts tun" (—1H) und erwartet die Person, daß h für S hinreichend ist, so wählt die Person jedenfalls die Alternative h. 2. Steht der Person eine Disjunktion H von jeweils für S hinreichenden Handlungen (h 1 ; h 2 ... h m ) neben der Alternative H zur Verfügung, so wählt die Person eine Handlung aus H. Der folgende Vorschlag für eine Definition 5 des Terminus „Oberzielsystem" bezieht sich auf das Verhalten der Person in Wahlsituationen: Betrachten wir den Fall, daß einer Person eine endliche Menge H von Maßnahmen h j , h 2 ... hj... h n und die Alternative „nichts tun" zur Wahl stehlen. Wir unterstellen, daß jede 5 Diese D e f i n i t i o n u n t e r s c h e i d e t sich v o n der bei WERBIK ( 1 9 7 4 , p. 1 7 3 ) g e g e b e n e n dadurch, d a ß nun nicht mehr die V o r a u s s e t z u n g g e t r o f f e n wird, d a ß die Person keine M a ß n a h m e wählt, v o n der sie nicht erwartet, d a ß ihre Ausführung für S hinreichend ist. Die Gültigkeit einer A n n a h m e über das O b e r z i e l s y s t e m wird also durch die F e s t s t e l l u n g der Wahl einer (bezüglich der Erreichung v o n S) „riskanten" Verhaltensalternative nicht b e e i n f l u ß t .

Werbik: T h e o r i e sozialen H a n d e l n s I

256

dieser Maßnahmen durchführbar ist, also Mißerfolg der Realisierung von h ; ausgeschlossen ist, oder — anders ausgedrückt — der Vorsatz, hj auszuführen, stets das Ergebnis h t nach sich zieht. Nun wollen wir weiters voraussetzen, daß für manche dieser Maßnahmen die Person die Erwartung formuliert, daß die Ausführung der Maßnahme für das Eintreten eines Umweltzustandes S hinreichend ist, wogegen es ausgeschlossen ist, daß der Zustand S „von selbst" (ohne Zutun der Person) eintritt. Wir wollen nur die Teilmenge H* der (nach Ansicht der Person) für S hinreichenden Maßnahmen h j ... h ( j j... h ( m ) (mit < n) und die Alternative — 1H („nichts tun") in Betracht ziehen. Nun können wir eine Reihe von Wahlsituationen konstruieren, indem wir mindestens ein Element aus H* und die Alternative H darbieten und die Person auffordern, eine der Alternativen auszuwählen. Kann nun für alle derartigen Situationen nachgewiesen werden, daß die Person eine für den Umweltszustand S hinreichende Maßnahme (also ein Element aus H*) auswählt, unabhängig davon, welche sonstigen Folgen mit dieser Wahl verbunden sind, und unabhängig von den sonstigen Merkmalen der Situationen, dann wollen wir die Zustandsbeschreibung S das „Oberzielsystem" der Person nennen. Zum Zwecke einer Formalisierung dieser Definition bezeichnen wir die einzelnen Situationen, in denen mindestens eine Maßnahme, von der die Person erwartet, daß sie für S hinreichend ist, und die Alternative „nichts t u n " (~l H) zur Wahl stehen, mit Wj ... wg ... wh und die Menge aller gemäß dieser Vorschrift konstruierbaren Wahlsituationen mit W. Wir bezeichnen dann eine Umweltbeschreibung S genau dann ein „Oberzielsystem", wenn folgende Regel empirisch gültig ist: A w

g

e W :

W

g">Vh(0:h(i)!

In dieser Definition wird der Subjunktor „->" gemäß der konstruktiven Logik (LORENZEN & SCHWEMMER 1 9 7 3 ) als „Versprechenszeichen" interpretiert. Wer die Behauptung aufstellt, die Zustandsbeschreibung S sei sein Oberzielsystem, der verspricht damit, in jeder gemäß obiger Vorschrift konstruierten Entscheidungssituation eine Maßnahme aus der Menge H* der für S hinreichenden Maßnahmen zu wählen. Zur Einlö-

sung dieses Versprechens ist derjenige, der S als sein Oberzielsystem angegeben hat, nur verpflichtet, wenn ihm nachgewiesen wurde, daß eine Wahlsituation von der Art W gegeben ist. Das Versprechen ist stets auch einlösbar, weil die Menge der in der Wahlsituation enthaltenen Maßnahmen h* endlich ist.

3.6 Oberziel Nehmen wir an, wir hätten bereits einen Umweltszustand S innerhalb eines bestimmten Bereichs von Situationen als das „Oberzielsystem" der Person ausgewiesen. Wir wollen jetzt wissen, welche Ziele als „wesentliche Bestandteile" des Oberzielsystems angesehen werden können. Zu diesem Zwecke machen wir den Versuch, das Oberzielsystem S als Konjunktion einzelner „Elemente" s 1 ; s 2 ... s q ... s r darzustellen. Wir behaupten beispielsweise, daß das Oberzielsystem S adäquat durch die Konjunktion sl A s 2 dargestellt werden kann. Nun konstruieren wir wieder Wahlsituationen gemäß den oben genannten Vorschriften. Wir verändern nun die Rahmenbedingungen der Wahlsituationen so, daß in einem Teil der Wahlsituationen s x , aber nicht s 2 hergestellt ist, in einem anderen Teil der Wahlsituationen s 2 , aber nicht Sj hergestellt ist; einen Teil der Wahlsituationen belassen wir so, daß der Beschreibung der Situation weder das Merkmal s l 5 noch das Merkmal s 2 zukommt. Finden wir nun, daß in allen Wahlsituationen, denen das Merkmal Sj, nicht aber das Merkmal s 2 zukommt, der Umweltszustand s 2 Oberzielsystem der Person ist, und finden wir außerdem, daß in allen Wahlsituationen, denen das Merkmal s 2 , nicht aber das Merkmal s, zukommt, der Umweltszustand S! Oberzielsystem der Person ist, dann wollen wir die Beschreibungen S! und s 2 „Oberziele" nennen (natürlich nur innerhalb des Bereichs von Situationen, für den wir festgestellt haben, das der Umweltszustand S das Oberzielsystem der Person ist). Unter diesen Bedingungen halten wir die Behauptung, daß das Oberzielsystem S durch die Konjunktion S! A s 2 dargestellt werden kann, für gültig.

Zeitschrift für Sozialpsychologie 1976, 7, 2 4 8 - 2 6 1

3.7 Allgemeine Bemerkungen zur Einführung der kognitiven Termini Im Rahmen unserer Theorie bezeichnen wir Wörter wie „Erwartung", „Vorsatz", „Ziel", „Oberzielsystem" bestimmte Weisen der aktuellen Rede der handelnden Person über ihre Handlungen. Zur Vorbereitung einer näheren Begründung dieser Auffassung sollen die üblicherweise vertretenen Auffassungen kurz besprochen werden. Innerhalb der Psychologie hat lange Zeit die Auffassung vorgeherrscht, daß „Erwartungen", „Vorsätze" und „Ziele" als quasi-gegenständlich gedachte innere Vorgänge oder Zustände von Personen sind. Nur der erlebenden Person selbst sind diese Vorgänge zugänglich, nur sie selbst kann sie durch Selbstbeobachtung direkt erfassen. Die für den erlebnispsychologischen Ansatz charakteristische Auffassung hat BÜHLER (1927, p. 17) folgendermaßen formuliert: „Jeder hat sein eigenes Ich und sein Gesichtsfeld der inneren Wahrnehmung, in das ihm kein Nachbar unmittelbar hineinschauen kann". Zur Kritik dieser weitverbreiteten Auffassung vergleicht Wittgenstein den erlebnispsychologischen Denkansatz mit einer Situation, in welcher jeder eine Schachtel hat, darin sich etwas befindet, was wir ,Käfer' nennen, jedoch niemand in die Schachtel des anderen schauen kann, und jeder sagt, er wisse nur vom Anblick seines Käfers, was ein Käfer ist: Da könnte es ja sein, daß jeder ein anderes Ding in seiner Schachtel hätte (WITTGENSTEIN 1 9 7 1 I, 2 9 3 ) . Man kann also auf Basis des erlebnispsychologischen Denkansatzes nicht verständlich machen, woher die Person weiß, daß das, was sie da in ihrem Kopfe hat, eine „Erwartung" oder ein „Vorsatz" ist. Der erlebnispsychologische Ansatz vernachlässigt, indem er von der Fiktion des isolierten Individuums ausgeht, daß Sprache zuvor intersubjektiv eingeübt sein muß, bevor sie zur Beschreibung „innerer Vorgänge" herangezogen werden könnte. Man muß also vorrangig die Frage stellen: Wie lernt die Person, Wörter wie „Erwartung" oder „Vorsatz" in der intersubjektiven Kommunikation zu gebrauchen? Ein weiteres Argument gegen den erlebnispsychologischen Ansatz gewinnen wir, wenn wir danach fragen, wie die Wahrheit von Aussa-

257

gen, die wir mittels Selbstbeobachtung gewonnen haben, beurteilt werden kann. Allgemein bezeichnen wir eine Aussage Fx dann und nur dann als „wahr", wenn die Zuordnung des Prädikats „ F " zu x mit den von uns allgemein anerkannten Sprachgebrauchs-Regelungen übereinstimmt. In dem Fall, daß x ein Quasi-Ding ist, das nur demjenigen, der die Aussage Fx formuliert hat, zugänglich ist, ist ein solcher Aussagenvergleich unmöglich. Der behavioristische Ansatz enthält als Voraussetzung den Grundsatz, daß psychologische Aussagen intersubjektiv nachprüfbar sein müssen. Eine intersubjektive Nachprüfung von Aussagen ist aber nur dann möglich, wenn die Sprache, in der diese Aussagen formuliert werden, allgemein verständlich ist. Die Allgemeinverständlichkeit ist nur bei solchen Sprachen gewährleistet, deren Prädikate beobachtbare Dinge (Objekte) bezeichnen (vgl. STEGMÜLLER 1 9 7 0 , II, 296ff.). Denn nur in diesem Fall können wir die Verwendung eines Prädikats durch Hinweis auf Dinge, die Beispiele oder Gegenbeispiele für das Prädikat sind, kontrollieren (KAMLAH & LORENZEN 1 9 6 7 ) .

Auf dieser Grundlage wurden im wesentlichen zwei Auffassungen über die Einführung der kognitiven Begriffe entwickelt. Die logischen Behavioristen oder Operationalisten wollen kognitive Begriffe nur dann verwenden, wenn diese aufgrund von operationalen Definitionen in Aussagen über Verhalten „übersetzt" werden können (FEIGL 1 9 5 8 , S . 3 9 4 ) . Man kann nun einen kognitiven Begriff entweder durch Angabe einer bestimmten Verhaltensbeschreibung (relativ zu einer bestimmten Situation) oder durch Angabe einer gesetzmäßigen Beziehung zwischen Situationsbeschreibung (stimulus) und Verhaltensbeschreibung (response) definieren. Im Alltag verwenden wir kognitive Begriffe in der Regel zur Bezeichnung von Konstanzen in der Vielfalt des Verhaltens der Person, die wir betrachten (die Person habe eine bestimmte Überzeugung ausgebildet; die Person verfolge eine bestimmte Absicht, usw.). Folglich ist es angemessen, kognitive Termini als Dispositionsprädikate aufzufassen und durch Angabe einer gesetzmäßigen Beziehung zwischen Umgebungsbeschreibung (UB) und Verhaltensbeschreibung (VB) operational zu definieren.

258

Werbik: Theorie sozialen Handelns I

Die allgemeine Form solcher operationalen Definition ist D

UB

VB

Nun kann gegen das Verfahren der operationalen Definition ein Einwand vorgebracht werden, der sich auf die klassische Logik stützt: Die klassische Logik geht von Aussagen aus, die schon als „wahr" oder „falsch" prädiziert worden sind (sogenannte „wahrheitsdefinite" Aussagen). Gemäß der Wahrheitstafel für den klassischen Subjunktor „->" ist die Gesamtaussage UB VB nur dann „falsch", wenn zwar die Testbedingung „UB" hergestellt ist, aber das charakteristische Verhalten VB nicht auftritt. In allen Fällen aber, in denen die Person der Testbedingung UB nicht unterzogen wird (UB nicht hergestellt ist), ist die Gesamtaussage UB -»• VB „wahr". Folglich müßte man einer Person, für die niemals die Testbedingung UB hergestellt wurde, das Prädikat D zusprechen — eine Konsequenz, die unserer Intention zuwiderläuft (vgl. STEGMÜLLER 1970, II, 218ff.; H E R R M A N N 1973). Um diese Schwierigkeiten zu beheben, hat Carnap vorgeschlagen, Dispositionsprädikate mit Hilfe von Reduktionssätzen einzuführen: Die Zuordnung des Dispositionsprädikates D auf Basis der Verhaltensbeschreibung VB ist nur unter der Voraussetzung statthaft, daß die Testbedingung UB bereits hergestellt ist. Ein bilateraler Reduktionssatz hat beispielsweise die allgemeine Form UB

(VB

D)

Bilaterale Reduktionssätze sind bedingte Definitionen: Das Definiendum ist mit dem Definiens unter der Bedingung der Gültigkeit von UB verknüpft (SSTEGMÜLLER 1 9 7 0 , II, 2 2 7 f f . ) . Ist die Testbedingung UB nicht realisiert, so kann nichts darüber ausgesagt werden, ob der Person das Dispositionsprädikat D zugesprochen werden soll oder nicht. Dieser Vorschlag enthält als Konsequenz, daß die Forderung kognitive Begriffe in Aussagen über Verhalten zu übersetzen, preisgegeben wird. Kognitive Begriffe gehören demnach einer theoretischen Sprache an, deren Termini durch Zuordnung zu beobachtungssprachlichen Aussagen nur teilweise allgemein-verständlich gemacht werden können.

Allerdings ist die Bevorzugung der Methode der Reduktionssätze an die Voraussetzungen der klassischen Logik gebunden. Wählen wir als Grundlage unserer Überlegungen die konstruktive Logik ( L O R E N Z E N & SCHWEMMER 1973), so entfällt die zuvor genannte logische Schwierigkeit der operationalen Definitionen. Die konstruktive Logik unterscheidet sich von der klassischen Logik dadurch, daß sie nicht von vornherein von Aussagen ausgeht, die schon als „wahr" oder „falsch" prädiziert sind, sondern auch auf solche Aussagen anwendbar ist, deren „Wahrheit" noch nicht feststeht, also auch auf nicht „wahrheitsdefinite" Aussagen. Zu den nicht wahrheitsdefiniten Aussagen zählen die empirischen Allgemeinaussagen, die bekanntlich nicht logisch äquivalent als Konjunktion endlich vieler singulärer Aussagen dargestellt werden können und daher nicht verifizierbar sind. Der Gebrauch des Subjunktors in der konstruktiven Logik entspricht dem Gebrauch des Wortes „Versprechen" in der deutschen Sprache: „Wer einen Bedingungssatz (Subjunktion) behauptet, wird ,wortbrüchig', wenn der Vordersatz erfüllt ist, der Nachsatz aber nicht. Man verpflichtet sich mit einer Subjunktion a -> b, den Nachsatz b zu verteidigen, wenn der Vordersatz a von einem Opponenten verteidigt ist" ( L O R E N Z E N & SCHWEMMER 1973, S. 54). Dieser Gebrauch des Subjunktors kann durch folgende Angriffs-Verteidigungsregel dargestellt werden: Behauptung a^b

Angriff

Verteidigung b

Hier wird vom Proponenten nur verlangt, b zu verteidigen, nachdem a vom Opponenten verteidigt ist. Gelingt dem Opponenten die Verteidigung von a nicht, dann ist der Proponent zu nichts verpflichtet ( L O R E N Z E N & SCHWEMMER 1973,

S.48).

Betrachten wir jetzt nochmals die allgemeine Form operationaler Definitionen: D o UB

VB

Legen wir die konstruktive Interpretation des Subjunktors zugrunde, dann hat diese Zuordnungsregel folgende Bedeutung: Wer einer Person das Dispositionsprädikat D zuspricht, der

Zeitschrift für S o z i a l p s y c h o l o g i e 1 9 7 6 , 7, 2 4 8 - 2 6 1

verspricht damit, daß die Person ein bestimmtes Verhalten VB zeigen wird, wenn die Testbedingung UB realisiert ist. Zeigt die Person unter der Bedingung UB das beschriebene Verhalten nicht, so ist die Behauptung, der Person komme das Dispositionsprädikat D zu, falsch. Solange aber die Testbedingung UB nicht gegeben ist, ist es freigestellt zu behaupten, daß der Person das Dispositionsprädikat D zukomme. Wir sind also nicht gezwungen, einer Person, die niemals der Testbedingung UB unterzogen wurde, das Dispositionsprädikat D zuzusprechen. Damit entfällt die logische Schwierigkeit der operationalen Definitionen, welche zu dem Vorschlag geführt hat, den Zusammenhang zwischen theoretischen Begriffen und Beobachtungsaussagen durch Reduktionssätze festzulegen. Eine grundlegende Schwierigkeit des behavioristischen Ansatzes besteht darin, daß wir nur auf Grundlage bestimmter theoretischer VorAnnahmen Beobachtungsaussagen machen können (POPPER 1969, S. 61). Eine strenge Trennung von „Beobachtungssprache" und „theoretischer Sprache" ist nicht möglich. Der enge Zusammenhang zwischen Vor-Annahmen und Beobachtung wird besonders deutlich, wenn wir die Verwendung verhaltensbeschreibender Prädikate näher analysieren: Prädikate wie „streiten", „drohen", „beleidigen", „helfen", „flirten" setzen implizit bestimmte Annahmen über die Erwartungen und Absichten der handelnden ebenso wie der betroffenen Personen voraus. WRIGHT ( 1 9 7 4 ) geht so weit, die Behauptung aufzustellen und zu begründen, daß die Beschreibung eines Verhaltens grundsätzlich nicht unabhängig von den Zweckbehauptungen vorgenommen, also die Conclusio eines praktischen Schlusses nicht logisch unabhängig von den Prämissen verifiziert werden kann. Dieses grundsätzliche Bedenken gegen den behavioristischen Ansatz führt dazu, daß wir den Versuch aufgeben, kognitive Begriffe über Beobachtungsaussagen einzuführen. Unsere Ansicht wird von STEGMÜLLER (1969,1, 398ff.) unterstützt, indem er anhand des Versuches von BRANDT & KIM (1963), die Bedeutung der Aussage „X will p " durch Angabe von Verwendungsregeln zu explizieren, auf die Schwirigkeit hinweist, dieser „quasi-theoretischen" Aussage bestimmte Beobachtungsaussagen zuzuordnen (vgl. auch HERRMANN 1973, 13 f.). Wenn wir ko-

259

gnitive Begriffe durch Beobachtungsaussagen nicht einführen können, dann sind „operationale Definitionen" nicht als Definitionen im strengen Sinn (Ersetzungsregeln), sondern als Regeln aufzufassen, durch welche wir nachträglich kognitive Begriffe bestimmten regelhaften Zusammenhängen zwischen Situations- und Verhaltensbeschreibungen zuordnen. Einen neuen Ansatz für die terminologische Bestimmung der kognitiven Begriffe innerhalb unserer Theorie gewinnen wir aus der grundlegenden Erkenntnis, daß wir „immer schon" in alltäglichen Handlungszusammenhängen Redeweisen mit Handlungen verknüpfen. Wörter wie „Erwartung", „Hoffnung", „Vorsatz", „Ziel" werden in alltäglichen Gesprächen dazu verwendet, um Handlungen vorzubereiten oder nachträglich zu rechtfertigen. Die dem Denkansatz des „Schachtelmodells" entsprechende und heute auch unter Behavioristen (vgl. SKINNER 1953) weit verbreiteten Auffassung, daß kognitive Wörter „private Vorgänge" bezeichnen, hat dazu geführt, daß wir als Psychologen die „verbalen Reaktionen" mit Mißtrauen betrachten, obwohl wir im alltäglichen Leben uns weitgehend auf die Aussagen anderer Menschen verlassen. Wir schlagen also vor, daß wir auch in der Psychologie die aktuellen Aussagen der Person so betrachten, als ob wir uns auf sie verlassen könnten, und unterstellen, daß die Person — sofern wir eine Sprechsituation vom Typ der „Beratungstriade" geschaffen haben — uns das sagt, was sie meint. Außerdem wollen wir im Gegensatz zum Behaviorismus, der verbales Verhalten „neben" das nonverbale Verhalten stellt und es als operantes Verhalten betrachtet, stärker die Tatsache zur Geltung kommen lassen, daß verbale Kommunikation eine Metaebene zur nonverbalen Kommunikation sein kann und daher kognitive Wörter wie „Erwartung" oder „Ziel" als Wörter der Rede über Handlungen betrachten. Auf Grundlage dieser Auffassung können wir nach dem Gebrauch dieser Wörter fragen und versuchen, Regeln über die Verwendung dieser Wörter aufzustellen. Wir fragen also nicht danach, was Erwartungen, Vorsätze und Ziele sind, sondern wie die Wörter „Erwartung", „Vorsatz" und „Ziel" gebraucht werden (WITTGENSTEIN 1971,1, 370). Dabei interessiert uns auch die Frage, wie der Gebrauch solcher Wörter lehrbar gemacht werden kann und wie die

260 Angemessenheit eines persönlichen Sprachgebrauchs beurteilt werden kann. Zum Zwecke der Lehrbarkeit können die Sprachteile der Rede über Handlungen methodisch rekonstruiert werden (LORENZEN & SCHWEMMER). Aber diese Rekonstruktion stützt sich auf Wörter, deren Gebrauch wir innerhalb unserer Sprachgemeinschaft für übereinstimmend halten. So basieren unsere Einführungsvorschläge für die kognitiven Termini „Vorsatz" und „Ziel" auf dem Wort „Aufforderung", dessen Bedeutung wir nur aus Beispielen für Aufforderungssätze, die in alltäglichen Handlungszusammenhängen gegeben werden, erwerben (LORENZEN & SCHWEMMER 1 9 7 3 , S. 1 1 0 ) .

Auf Basis des unterstellten Verständnisses des Wortes Aufforderung und beispielhafter Redeweisen wie „X will p", „X möchte p " usw. erwerben wir uns den Begriff „Selbstaufforderung". Es ist aber nicht möglich, diesem Begriff eine endliche Liste solcher Redeweisen zuzuordnen; vielmehr kann ein kompetenter Sprecher stets neue Formulierungen für diesen Begriff finden. Man kann den Begriff „Selbstaufforderung" auch nicht „partiell" durch eine Prädikatorenregel (KAMLAH & LORENZEN 1 9 6 7 ) bestimmen, ohne dabei bereits das Verständnis anderer kognitiver Begriffe wie „Erwartung" vorauszusetzen. Eine methodische Rekonstruktion des Sprachgebrauchs durch Angabe von Regeln ist erst bei jenen kognitiven Begriffen möglich, die den Charakter von Dispositionsprädikaten haben. In unserer Theorie werden die Wörter „Erwartung" und „Oberzielsystem" als Dispositionsprädikate aufgefaßt: Wer sagt, er erwarte in der Situation U das Ereignis S, der verspricht damit, das Ereignis S aktuell vorherzusagen, wenn die Situation U gegeben ist und er aufgefordert wird, zwischen der Vorhersage von S oder der Nichtvorhersage von S zu wählen. Wer sagt, für die Situationsklasse U sei das Ereignis S sein Oberzielsystem, der verspricht damit, in allen Wahlsituationen, in denen er aufgefordert wird, zwischen Handlungen und der Alternative „nichts tun" zu wählen, mindestens eine Handlung auszuwählen, von der er erwartet, daß das Erreichen des Handlungsergebnisses für das Eintreten von S hinreichend ist. Damit das Einlösen dieser Versprechen auch überprüft werden kann, ist es nötig, eine „Quasi-

Werbik: Theorie sozialen Handelns I

Beobachtungssprache" zu konstruieren. Die umweltsbeschreibenden Prädikate dieser Sprache müssen so gewählt werden, daß die Beschreibung eines Umweltszustandes in Übereinstimmung mit potentiell allen Sprechern unserer Sprachgemeinschaft erfolgt und nicht von den Behauptungen, deren Einlösung überprüft werden soll, abhängt. Speziell zur Uberprüfung von Behauptungen über Oberzielsysteme muß diese Sprache auch Prädikate zur Beschreibung von Wahlmöglichkeiten enthalten, die ebenfalls so ausgewählt werden, daß die Beschreibung in Übereinstimmung mit potentiell allen Sprechern einer Sprachgemeinschaft erfolgt und nicht von den Oberzielsystem-Behauptungen abhängig ist. Erweisen sich diese Forderungen als erfüllbar, dann sind wir berechtigt, die Allgemeingültigkeit der Behauptung von Wright, daß die Verhaltensbeschreibung nicht unabhängig von den Annahmen über Absichten und Erwartungen der Person verifizierbar ist (WRIGHT 1 9 7 4 , S. 109), zu bestreiten.

Literatur ALBERT, H. 1969. Traktat über kritische Vernunft. Tübingen: J.C.B. Mohr. BRANDT, R. & KIM, J. 1963. Wants as explanations of actions. J.Philos. 60, 4 2 5 - 4 3 5 . BÜHLER, K. 1927. Die Krise der Psychologie. Jena: G. Fischer. FEIGL, H. 1958. The ,Mental' and the ,Physical\ In: Feigl, H., Scriven, M. & Maxwell, G. (Hrsg.): Minnesota Studies in the Philosophy of Science, Bd. 2. GÄFGEN, G. 1974. Theorie der wirtschaftlichen Entscheidung. Tübingen: J.C.B. Mohr (P.Siebeck), 3. erw. Aufl. GIEGEL, H. J. 1969. Logik der seelischen Ereignisse. Frankfurt: Suhrkamp. HABERMAS, J. 1971. Vorbereitende Bemerkungen zu einer Theorie der kommunikativen Kompetenz. In: Habermas, J. & Luhmann, N. (Hrsg.): Theorie der Gesellschaft oder Sozialtechnologie. Frankfurt: Suhrkamp. HERRMANN, TH. 1973. Persönlichkeitsmerkmale. Stuttgart: Kohlhammer. JANICH, P. 1973. Zweck und Methode der Physik aus philosophischer Sicht. In: Hess, G. (Hrsg.): Konstanzer Universitätsreden 65, Konstanz. KAMINSKI, G. 1970. Verhaltenstheorie und Verhaltensmodifikation. Stuttgart: Klett. KAMLAH, W. 1972. Philosophische Anthropologie. Bibliographisches Institut, Mannheim. KAMLAH, W. & LORENZEN, P. 1967. Logische Propä-

Zeitschrift für Sozialpsychologie 1976, 7, 2 4 8 - 2 6 1 deutik, B-I-Hochschultaschenbücher 227/227a. Bibliographisches Institut, Mannheim. LANGENHEDER, W. 1975. Theorie menschlicher Entscheidungshandlungen. Sozialisation und Kommunikation, Bd.II. Stuttgart: Enke. L O R E N Z E N , P . & SCHWEMMER, O . 1 9 7 3 . K o n s t r u k t i v e

Logik, Ethik und Wissenschaftstheorie. B-I-Hochschultaschenbücher 700. Mannheim. MILLER, G . A . , G A L A N T E R , E . & PRIBRAM, K . H . 1 9 7 3 .

Strategien des Handelns. Konzepte Humanwissenschaften. Stuttgart: Klett. POPPER, K . R . 1969. Logik der Forschung. Tübingen: J.C.B. Mohr. POPPER, K. R. 1971. Prognose und Prophetie in den Sozialwissenschaften. In: Topitsch, E. (Hrsg.): Logik der Sozialwissenschaften, 113—125. Köln: Kiepenheuer & Witsch. SCHWEMMER, O. 1975. Deduktion und Argumentation. Unveröffentl. Habilitationsschrift. Erlangen. SKINNER, B.F. 1953. Science and H u m a n Behavior. New York: The Free Press. STEGMÜLLER, W. 1969. Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Bd.I. Berlin: Springer. STEGMÜLLER, W. 1970. Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Bd. II. Berlin: Springer. STRÖKER, E. 1973. Einführung in die Wissenschaftstheorie. München: Nymphenburger Verlagsbuchhandlung.

261 WATZLAWICK, P . , BEAVIN, J . H . & JACKSON, D . D . 1 9 7 4 .

Menschliche Kommunikation. Bern: Huber. WEBER, M. 1904. Die „Objektivität" sozialwissenschaftlicher und Sozialpolitischer Erkenntnis. In: Winckelmann, J. (Hrsg.): Ges. Aufsätze zur Wissenschaftstheorie, 3. Aufl., Tübingen: Mohr 1968. WEBER, M. 1921. Soziologische Grundbegriffe. In: Winckelmann, J. (Hrsg.): Ges. Aufsätze zur Wissenschaftstheorie, 3. Aufl., Tübingen: Mohr 1968. WERBIK, H. 1971. Das Problem der Definition „aggressiver" Verhaltensweisen. Z. f. Sozialpsychologie 2, 233-247. WERBIK, H. 1974. Theorie der Gewalt, UTB 168. München: Fink. WERBIK, H . & KAISER, J . 1 9 7 4 . E i n V e r f a h r e n z u r H e r -

beiführung eines übereinstimmenden Sprachgebrauchs bezüglich der Termini „ E r w a r t u n g " und „Oberziel". I. Theoretische Grundlagen. Forschungsbericht 66 des Sonderforschungsbereichs 22, Sozialwissenschaftliches Forschungszentrum, Nürnberg. WERBIK, H . & SCHWARZ, H . 1 9 7 4 . A n m e r k u n g e n z u

einer Theorie der Überprüfung handlungstheoretischer Aussagen. Psychologische Beiträge 16, 2 3 8 253. WITTGENSTEIN, L. 1971. Philosophische Untersuchungen. F r a n k f u r t : Suhrkamp. WRIGHT, G.H. 1974. Erklären und Verstehen. Fischer Athenäum. ^ ^ B WYGOTSKI, L.S. 1972. Denken und Sprechen. F r a n k f u r t : S.Fischer. I J

262

Bartsch, Knospe & Witte: Nicht sprachgebundenes Denken

Empirie Nicht sprachgebundenes Denken: ein theoretisches Konzept und eine experimentelle Untersuchung GÜNTER BARTSCH, MARION KNOSPE, ERICH H . WITTE Psychologisches Institut I der Universität H a m b u r g

Zentrale Frage dieser Studie ist die Relation zwischen Sprache u n d Denken — ein in Psychologie u n d Nachbarwissenschaften sehr unterschiedlich beurteiltes Problem. Die Reflexion bestehender Ansätze (WHORF, WYGOTSKI, PIAGET, LENNEBERG) u n d ihre Analyse scheint uns einen neuen Ansatz zu rechtfertigen, der eine übergreifende Erklärung des P h ä n o m e n s bietet. Seine Tragfähigkeit h a b e n wir empirisch zu überprüfen versucht. A u f g r u n d der Schwierigkeit, nicht sprachgeb u n d e n e s Denken bei einer normalen, u n b e h i n d e r t e n P o p u l a t i o n experimentell zu erfassen, m u ß t e n hierbei Wege beschritten werden, die den Charakter einer Erstu n t e r s u c h u n g tragen. Es wurde eine Experimentalsituation entwickelt, die gleichzeitig mit der Vorgabe teils verbaler, teils verbalfreier Intelligenztests die P r o b a n d e n zwei verschiedenen Störungen unterzieht, deren spezifische Wirkung auf verbale P e r f o r m a n z k o m p o n e n t e n kontrolliert wurde. Die empirischen Ergebnisse rechtfertigten die A n n a h m e verschiedener P e r f o r m a n z k o n zepte, d. h. auch relativ unabhängige K o m p e t e n z im verbalen u n d nicht-verbalen Bereich.

The central question of this study concerns t h e relationship b e t w e e n language and thinking — a p r o b l e m explained in very different ways by psychology and related sciences fields. A critical review and analysis of existing theories (WHORF, WYGOTSKI, PIAGET, LENNEBERG) suggests a rather d i f f e r e n t a p p r o a c h trying t o explain o u r problem by a m o r e general t h e o r y which will be tested empirically. The difficulties in measuring nonverbal thinking within a n o r m a l p o p u l a t i o n w i t h o u t organic and mental deficiencies required a n e w experimental approach which may be regarded as an impulse f o r f u r t h e r reasearch. O u r experimental c o n d i t i o n s combined the presentation of verbal and nonverbal intelligence-tests with t w o kinds of interference, controlling their specific e f f e c t s on verbal p e r f o r m a n c e . T h e empirical results j u s t i f y o u r assumption of d i f f e r e n t performance-concepts, that also means the a s s u m p t i o n of relative independance of verbal and nonverbal competence.

Modell für die Beziehung zwischen Sprache und Denken

voneinander getrennte Prozesse seien (WYGOTSKI 1971). Wegen der Vielfalt von Ansätzen muß hier auf eine Darstellung der entsprechenden Arbeiten verzichtet werden und eine Beschränkung auf die eigenen theoretischen Überlegungen, die zu den empirisch überprüften Hypothesen geführt haben, erfolgen. Der Terminus ,Sprache' wird hier im engen Sinne der natürlichen verbalen Sprache einer Gesellschaft verstanden. Er umschließt weder alle Kommunikations- und Signalsysteme, wie z. B. Gestik und Mimik, noch Symbolsprachen wie in der Mathematik (vgl. F U R T H 1970, S.40). ,Denken' steht bei uns für intelligentes Verhalten gemeinhin. Es umfaßt Sehen, Erfassen und Begreifen eines Problems sowie die Problemlö-

Die Frage nach der Beziehung zwischen Sprache und Denken, inwieweit Sprache eine notwendige Komponente des Denkvorganges sein muß, oder ob die Sprache Voraussetzung für Denkprozesse ist, also erst Denken ermöglicht, wird in der gängigen wissenschaftlichen Literatur sehr unterschiedlich beantwortet — das Spektrum der Auffassungen reicht von der Annahme, Sprache und Denken seien nahezu identisch ( W U N D T 1969), über Thesen zur gerichteten Abhängigkeit (WHORF 1963) oder Wechselwirkung zwischen beiden (SAPIR 1961), bis zu Aussagen, daß Sprache und Denken zwei verschiedene,

Zeitschrift für Sozialpsychologie 1976, 7, 2 6 2 - 2 7 8

sung selbst. Unser Begriff von .Denken' entspricht dem, was PIAGET ( 1 9 7 2 ) unter .intellektuelle Operationen' subsumiert hat. „Menschliche Kognition bedeutet die Fähigkeit, Umwelt in spezifischer Weise zu kategorisieren — und zwar durch Differenzierung, Generalisierung, Extraktion und Transformation. Sie ist der grundlegende Begriffsbildungsprozeß, der die Relationen der uns umgehenden Gegenstände bestimmt. Die Kategorien der Kognition bilden ein offenes System, in das neue Erkenntnisse mühelos eingeordnet werden können. Die Regeln allerdings, nach denen Erkenntnisse gemacht werden, sind artspezifisch festgelegt. Die Kognition kann als Primärfunktion des menschlichen Verhaltens betrachtet werden, die alle andern möglichen Verhaltenskorrelate — wie z. B. Sprach- oder Denkverhalten — vorbestimmt" (LENNEBERG 1972, 452f.). Modell für die Beziehung und Denken

zwischen

Sprache

Bei der Betrachtung des Zusammenhanges zwischen den genannten Begriffen müssen mindestens zwei Analyseebenen unterschieden werden. Einmal kann man direkt die Beziehung zwischen Kognition, Sprache und Denken ohne individuelle Differenzierung analysieren (Globalaggregate), zum anderen kann man den Zusammenhang der individuellen Denkkompetenz mit der individuellen Sprachkompetenz bzw. der individuellen Denkperformanz mit der individuellen Sprachperformanz betrachten (Individualaggregate). Neben diesen beiden Abstraktionsstufen auf der Reaktionsseite darf noch eine weitere auf der Reizseite angenommen werden, nämlich jeweils eine strukturelle Untergliederung der Bereiche Sprache und Denken — wie sie sich z. B. in faktoriellen Dimensionen der Intelligenz zeigt. Bei jeder Diskussion des Zusammenhanges von Sprache und Denken sollten diese drei Analyseebenen getrennt untersucht werden, da sie mit Sicherheit eigenen Gesetzmäßigkeiten gehorchen. Bei der Untersuchung von Globalaggregaten haben wir es mit sehr komplexen Einheiten zu tun; infolgedessen können nur Gesetzmäßigkeiten auf einem hohen Abstraktionsniveau erforscht werden. Als Untersuchungseinheiten betrachten wir die folgenden Begriffe:

263

Kognition Denkkompetenz Denkperformanz

Sprachkompetenz Sprachperformanz

Wir gehen davon aus, daß die Kognition notwendige Voraussetzung für Sprache und Denken ist. Die Fähigkeit zur Kognition ist artspezifisch und durch Vererbung festgelegt (vgl. LENNEBERG 1972): die Unterschiede auf individuellem Niveau (Individualaggregate) können vorerst unberücksichtigt bleiben. Die Kognition determiniert die Denk- und Sprachkompetenz, die potentielle Fähigkeit, Denk- und Sprechakte zu vollziehen. Sie gibt sozusagen die Grenzen und die Möglichkeiten zur Realisierung von Sprache und Denken an. Bezüglich der Denk- und Sprachkompetenz kann eine teilweise Überschneidung beider Bereiche angenommen werden, wo Sprache und Denken zusammenwirken, sowie die unabhängige Existenz beider Phänomene, wie sie sich in dem nicht sprachgebundenen Denken und der nicht intellektuellen Sprache zeigen. Intellektuelle Sprache dagegen ist nicht allein von der Sprachkompetenz, sondern in einem wesentlichen Ausmaß auch von der Denkkompetenz abhängig, während die vor-intellektuelle, emotional-expressive Sprache unabhängig von letzterer ist. Geht man nun über zu der aktualisierten Denk- bzw. Sprachkompetenz, der Denk- und Sprachperformanz, so bleibt die Beziehung von Sprache und Denken prinzipiell erhalten, allerdings nimmt hier die Rückwirkung von Sprachperformanz auf Denkperformanz zu, denn mit Hilfe eines guten sprachlichen Reservoirs können komplexe Probleme vermutlich besser gelöst werden, da eine differenzierte Abbildung in Sprache eine zweifache Kodierung desselben Problems bedeutet. Die Sprache übernimmt eine Entlastungsfunktion, wenn ihre Performanz entsprechend ausgebildet ist, d. h. wenn adäquate Verbalstrukturen für ein Problem gelernt wurden. Genau diese Rückkoppelung untersucht die Sprachbarrierenforschung, wobei zu sagen ist, daß Individuen viele Probleme auch ohne Verbalstrategien lösen können, wenn sie eine entsprechende Denkperformanz entwickelt haben. Die Entwicklung der Denkperformanz selbst ist ähnlich wie die der Sprachperformanz z.T. abhängig vom Lernangebot der Umwelt, zum anderen gibt aber die hiervon unabhängige Kognition Begriffsbildungs-

264

Bartsch, Knospe & Witte: Nicht sprachgebundenes Denken

Schemata vor. Zur Minderung von milieu- und erziehungsbedingten Leistungsschwächen ist der Weg über den kompensatorischen Sprachunterricht nicht der notwendigerweise beste oder einzig mögliche, vielmehr bietet sich bei entsprechender Problemstellung eine direkte Beeinflussung (Erhöhung) der Denkperformanz mittels operativer Strategien bzw. verbalfreier Lernangebote an. Nach unseren Vorstellungen würde ein Training der Begriffsbildungsfähigkeit, sei es im Sprach- oder Denkbereich, aufgrund der Beziehungen zwischen diesen Bereichen in einem gewissen Ausmaß, nämlich soweit sich die Bereiche überschneiden, auch die Fähigkeiten im anderen Bereich stärken. Die gleichzeitige relative Unabhängigkeit der Bereiche garantiert dagegen unabhängige Entwicklungsmöglichkeiten des Denkens und der Sprache, so daß partielle Ausfälle in einem der Bereiche die Fähigkeiten im anderen nicht blockieren, sondern durch ihn eher kompensiert werden können. Unsere augenblicklichen theo-

aktuelle Akte mit unterschiedlicher Performanzbeeinflussung Abb. 1

emotional expressive Sprache

retischen Annahmen über den Zusammenhang von Sprache und Denken auf der Ebene von Globalaggregaten wird in Abb. 1 schematisch dargestellt. Die Beziehungen in Abb. 1 sind sehr abstrakt und sagen noch nichts über den Zusammenhang zwischen individueller Sprach- und Denkkompetenz aus. Auf dem Niveau der Individualaggregate gibt es mit Sicherheit keine eindeutige Zuordnung der Art, daß eine hohe individuelle Sprachkompetenz einhergeht mit einer hohen individuellen Denkkompetenz. Denn sonst müßten alle Personen, deren hohe Denkperformanz bekannt ist, weil sie schwierige Probleme gelöst haben, auch über eine gute Sprachfähigkeit verfügen. Gegen diese hohe Korrelation spricht die Alltagserfahrung. Ebensowenig sind gute Rhethoriker notwendigerweise mit einer hohen Denkperformanz ausgestattet. Hierbei ist noch anzumerken, daß man die Kompetenz selbst nicht empirisch untersuchen oder beobachten kann. Als Beobachtungsgegenstand hat man nur aktuelle Handlungen - die Performanz — zur Verfügung. Nur durch Rückschluß über die Performanz bei Ausschaltung störender Effekte kann man die Kompetenz ermitteln. Doch wird wegen des Umwelteinflusses schon die Beziehung zwischen Kompetenz und Performanz nicht eindeutig sein, d.h. die beobachteten Fähigkeiten der Individuen werden kaum um r = 1.0 mit den potentiellen Fähigkeiten im Sprach- oder Denkbereich korrelieren. Ferner kann als sicher gelten, daß die Korrelationen zwischen Kompetenz und Performanz als solcher, wie auch speziell zwischen Sprachund Denkperformanz abhängig sind von den gestellten Aufgaben. Damit müssen alle Aussagen ebenfalls auf die bereits angesprochene dritte Gliederungsebene, auf Kompetenz- und Performanzdimensionen im Denk- und Sprachbereich bezogen werden, wobei spezielle Aufgaben mehreren Dimensionen in beiden Bereichen angehören können. Daher ist es möglich, daß derselbe Aufgabentypus von unterschiedlichen Personen mit Hilfe verschiedener Strategien gelöst wird. Gleichzeitig ist vorstellbar, daß die Individuen von einer Strategie zur anderen wechseln, wenn eine der möglichen Lösungsstrategien behindert wird. Folglich hängt auch die Wahl der Strategie von der Umwelt ab und nicht nur die Ausbildung der Performanz. Sind mehrere Strategien

Zeitschrift für Sozialpsychologie 1976, 7, 2 6 2 - 2 7 8

möglich, bestimmt die Situation während der Lösung einer Aufgabe den Lösungsweg. Gewählt wird wohl von den Individuen der Weg, den sie in solchen Situationen anzuwenden gelernt haben. Nur wenn man die Phänomene Denken und Sprache entsprechend komplex angeht, wird man die komplizierten Wechselwirkungen zwischen ihnen entdecken können. Betrachtet man Sprache und Denken als identisch, müssen diese komplizierten Vorgänge unentdeckt bleiben. Bei einer empirischen Untersuchung kann ihre Identität nur eines von möglichen Ergebnissen sein, nämlich dann, wenn Denk- und Sprachkompetenz in allen Dimensionen hoch miteinander korrelieren.

Die Entwicklung einer neuen Experimentalbedingung Bei der Auswahl von sprachgestörten Vpn kann nicht das Zusammenwirken oder Vorhandensein verschiedener Denkstrategien in ein und derselben Person untersucht werden. Wir wollen aber den Nachweis erbringen, daß auch Personen ohne Sprachbeeinträchtigung über mehrere Lösungsstrategien verfügen. Bei dieser Fragestellung m u ß man folglich Lösungsstrategien experimentell separieren. Die Einführung von ,thinking-aloud'-Protokollen soll jedoch vermieden werden, weil auf diesem Wege die Prozesse nur in ihrer sprachlichen Abbildung erfaßt werden und daher unbewußt ablaufende Anteile unerkannt bleiben müßten. Ferner würde man nur die bevorzugten Strategien bei der Lösung spezieller Probleme erhalten, aber nicht den Wechsel auf mögliche andere Lösungsstrategien. Deshalb konnte dieser Ansatz nicht verwendet werden. Als zweiter Weg ist es denkbar, Aufgaben zu konstruieren, die zwei Lösungen haben, wobei die eine Lösung nur mit Hilfe von Verbalstrategien, die andere nur mit Hilfe von verbalfreien Lösungswegen gefunden werden kann. Auch dieser Experimentalansatz läßt es nicht zu, das Umschalten auf unterschiedliche Strategien zu verfolgen. Außerdem ist die Konstruktion solcher Stimuli äußerst schwierig, da fast jede Aufgabe mit inneren Verbalisierungen verbunden werden kann. Aus diesen Überlegungen heraus haben wir uns zu einem dritten Ansatz entschlossen, der

265 durch das Einführen von Störbedingungen gekennzeichnet ist. Durch diesen Weg über das systematische Stören verschiedener Lösungsstrategien kann man überhaupt erst erkennen, ob es alternative zu den durch die Sozialisation vermittelten Lösungsstrategien gibt, die gleich effizient sind wie die üblichen Lösungswege. Diese Technik der Störung spezieller Fähigkeiten kann sich für viele Fragestellungen als fruchtbar erweisen. Man kann damit den Einfluß der Umwelt vermindern, die uns die Anwendung spezieller Strategien gelehrt hat. Nachdem wir mehrere Störbedingungen überprüft hatten, haben wir uns zu der folgenden entschlossen: Als spezifische Störung der verbalen Denkstrategie wurde ein Tonband mit den Farbbezeichnungen ,grün', ,gelb' und ,rot' besprochen. Sie waren in einer durch Würfeln ermittelten Zufallsreihenfolge angeordnet. Ihr Rhythmus betrug 45 Wörter pro Minute und war so angelegt, daß die Vpn sie gerade nachsprechen konnten, ohne zwangsläufig Wörter auslassen zu müssen. Um Störeinflüsse möglichst gering zu halten, wurden die Farbbezeichnungen über Kopfhörer vorgegeben. Die Versuchspersonen hatten also die Aufgabe, die gehörten Farbnamen nachzusprechen. Das bedeutete eine Belastung des Verbalapparates für das Identifizieren von sprachlichen Äußerungen, als auch für das Produzieren von Sprechakten. Durch diese Störbedingungen wollten wir erreichen, daß die Verbalkomponente so stark belastet wird, daß sie kaum noch zur Lösung von Aufgaben, die unter dieser Bedingung gelöst werden sollten, herangezogen werden konnte. Da diese Störbedingung aber nun eine sehr ungewohnte Situation darstellt, ist es notwendig, eine Kontrollbedingung zu schaffen, die alle störenden Elemente bis auf die Störung der Verbalstrategie enthält. Zu diesem Zweck wurde ein Tonband mit einsilbigen Zahlen besprochen und rückwärtslaufend dargeboten, so daß die Bedeutung des Materials unkenntlich blieb, was an den Vpn kontrolliert wurde. Auf Farben wurde hierbei verzichtet, um jede Wiedererkennungsmöglichkeit zu verhindern. Da die Vpn bei der obigen Störbedingung (spezifische Störung = sS) die Farben selbst wiederholen mußten und so durch Hören und Sprechen ein schnellerer Rhythmus entstand als der reinen Anzahl der Wörter auf Tonband

266

Bartsch, Knospe & Witte: Nicht sprachgebundenes D e n k e n

entspricht, wurde bei der unspezifischen Störung (usS) ein Rhythmus von 90 Zahlen pro Minute gewählt. Dieses Material wurde ebenfalls über Kopfhörer dargeboten. So erreichten wir eine Störung, die in Lautstärke, Tonhöhe und Rhythmus möglichst ähnlich war, von der jedoch die verbale Komponente unbelastet blieb. Die Wirkung dieser beiden Störbedingungen wird außerdem noch durch einen verbalen Kontrolltest überprüft.

Entwicklung des Testmaterials Nachdem wir die Störbedingungen festgelegt haben, müssen wir geeignetes Testmaterial suchen: 1. Das Testmaterial soll in Anschauung und Lösung verbalfrei sein. 2. Die Handlungskomponente soll minimiert werden, da sonst mögliche Kontaminationen mit den Störbedingungen auftreten können, die unerwünscht sind. 3. Die einzelnen Item sollen in einem relativ kurzen, in sich geschlossenen Denkschritt lösbar sein. 4. Die Tests sollen verschiedene Intelligenzdimensionen erfassen, um mögliche strukturelle Gesichtspunkte mit bearbeiten zu können. Aufgrund der vorgenannten Bedingungen schien uns die Zusammenstellung von Bezugstests für kognitive Faktoren nach FRENCH (1953) das geeignetste Testmaterial zu enthalten. Hierin entsprechen vor allem die Tests folgender vier Intelligenzdimensionen den aufgestellten 4 Kriterien: a) b) c) d)

Flexibility of closure (CF) Spatial Orientation (S) Spatial Scanning (SS) Perceptual Speed (P)

Zu den genannten Intelligenzfaktoren finden sich in der French-Batterie jeweils mehrere Tests. Um nach unseren 4 Kriterien die am besten geeigneten Tests herauszufinden, haben wir eine kleine Voruntersuchung gemacht, die uns auf Schwierigkeiten bei der Bearbeitung der Tests aufmerksam gemacht hat. Ausgewählt wurden schließlich die folgenden Tests: ada) ad b) ad c) ad d)

Hidden Patterns (HP) Card Rotation (CR) Map Planning (MP) Identical Pictures (IP)

Die Tests HP, CR und IP wurden in der Originalform vorgegeben. Nur MP wurde leicht modifiziert, da Buchstaben und Zahlen im Testmaterial vorkamen. Diese Buchstaben und Zahlen mußten in der Originalform deshalb gewählt werden, weil mehrere Probleme an einer Figur zu bearbeiten waren. Wir haben nun für jedes Problem getrennt eine Figur gezeichnet, so daß Buchstaben und Zahlen überflüssig waren. Die Aufgabenstellung blieb dabei unverändert. Zusammen mit diesen 4 Tests haben wir als Kontrolltest den Untertest 6 (Worteinfall) vom LPS (im folgenden VK genannt) vorgegeben, um den Einfluß unserer Störbedingungen auf verbale Strategien abschätzen zu können. Zusätzlich zu diesen Experimentaltests wurden die Vpn noch mit Hilfe der Kurzform des LPS, den Untertest 1, 4, 5, 9, 12, 14 getestet, um eine bessere Interpretation der gewählten Strategien unter der Störbedingung sS zu ermöglichen.

Hypothesen Man m u ß nach unseren theoretischen Überlegungen zwei Arten von Hypothesen unterscheiden: einmal gibt es Hypothesen, die sich auf Globalaggregate, zum anderen Hypothesen, die sich auf Individualaggregate beziehen. Beide Betrachtungsebenen ziehen unterschiedliche Hypothesen nach sich. So werden sich Hypothesen von Globalaggregaten auf Gruppenstatistiken (Mittelwertsvergleiche) beziehen, wobei die individuellen Beziehungen unberücksichtigt bleiben können. Folglich wird die Methode der Vergleich von Mittelwerten sein. ,H 0 : Die Störbedingungen sS und usS zeigen keinen unterschiedlichen Einfluß auf die mittlere Lösungsfähigkeit bei Tests, die auch nicht-sprachlich bearbeitet werden können. Diese Hypothese ist im Sinne unserer theoretischen Überlegungen formuliert, daß nämlich die Denkperformanz unabhängig von Verbalstrategien eingesetzt werden kann. Sie soll mit Hilfe der Tests IP, HP, CR und MP überprüft werden. Die Alternativhypothese, die aus einer Identität von Sprache und Denken abge-

267

Zeitschrift für Sozialpsychologie 1976, 7, 2 6 2 - 2 7 8

leitet werden kann, ist natürlich einseitig zu verstehen, d.h. es wird angenommen, daß durch sS eine Verringerung der Lösungsfähigkeit herbeigeführt wird. Ihr untergeordnet ist die nächste Hypothese, die der Kontrolle der Effekte unserer Experimentalbedingungen dient. 2 H,:

Die Störbedingung sS beeinträchtigt die Lösungsfähigkeit bei Tests, die notwendig eine sprachliche Bearbeitung bedingen, signifikant höher als die Störbedingungen usS.

Diese Hypothese dient der Kontrolle unserer Annahme, daß die sS im Gegensatz zur usS die Anwendung verbaler Strategien in hohem Maße beeinträchtigt. Sie soll durch den Untertest 6 des LPS (hier: VK) überprüft werden. Neben diesen Hypothesen über Globalaggregate gibt es auch Individualaggregat-Hypothesen, die sich auf die individuellen Meßwerte beziehen und mit Hilfe von Korrelationsstatistiken untersucht werden sollen (Faktoren-, Regressionsanalyse). Sofern die usS den Verbalanteil unverändert läßt und die sS ihn auspartialisiert, wird man vermuten, daß die Korrelationen desselben Tests unter den beiden Bedingungen usS und sS gegenüber der Reliabilität abfallen, wenn Sprach- und Denkperformanz auf individuellem Niveau nicht sehr hoch korrelieren. Diese Abnahme wird abhängen von den Intelligenzdimensionen, da möglicherweise unterschiedlich hohe Verbalant eile auspartialisiert werden. 3H0:

Der Unterschied zwischen dem Reliabilitätskoeffizienten pro Störbedingung und der Korrelation über die beiden Störbedingungen ist auf Fehlerschwankungen zurückzuführen.

Wir nehmen nun nach unseren theoretischen Überlegungen an, daß unabhängig vom Test die 3 H 0 verworfen werden muß. Man kann noch einen Schritt weitergehen, um die Hypothesen auf dem Individualaggregatniveau zu überprüfen, indem man ein gemeinsames Referenzsystem auf individuellem Niveau für die Experimentaltests unter beiden Störbedingungen konstruiert und nur mit Hilfe dieses gemeinsamen Referenzsystems Aussagen formuliert. Das hat den Vorteil, daß man die Beziehun-

gen der Tests untereinander mitberücksichtigen kann. Man beschränkt sich dann auf die für die gemeinsamen Beziehungen auf dem Niveau von Individuen wichtigsten Aspekte und untersucht die Veränderung der Tests durch die Störbedingungen in den Haupt-Komponenten. Als Methode bietet sich hier die Untersuchung von Faktorenladungen und ihre Veränderung durch die Störbedingung an. Man hat sich damit zwar auf ein lineares Modell beschränkt, wie auch schon bei 3 H 0 , das aber beim augenblicklichen Stand der Forschung wegen seiner Einfachheit angemessen ist. Nach diesen Überlegungen gibt es folgende Hypothese: 4H0:

Der Unterschied der Ladungen der Tests auf den gemeinsamen Faktoren gemessen über die beiden Störbedingungen ist nur durch Zufall entstanden und deshalb unsystematisch.

Nach unseren theoretischen Überlegungen würden wir vermuten, daß es einen unterschiedlichen Einfluß auf die Tests gibt, da unterschiedliche Verbalanteile eingewirkt haben können. Gut wäre es, wenn vor allem ein Faktor den Unterschied in den Störbedingungen erklären könnte, da man in diesem Fall davon ausgehen kann, daß es keine Wechselwirkungen zwischen Störbedingungen und Tests gegeben hat, was die Störbedingungen selbst abhängig vom Test werden läßt. Sonst könnte man davon ausgehen, daß bei verschiedenen Tests unterschiedliche Aspekte der Experimentalbedingungen störend gewirkt haben. Folglich wäre die Interpretation der Individualdaten erschwert.

Darstellung des Experiments 1. Die

Stichprobe

Die Vpn sollten eine gewisse Testnaivität besitzen und wenig über den Zusammenhang von Sprache und Denken wissen, um hier nicht Erwartungshaltungen hereinzubringen, die die Ergebnisse verfälschen könnten. Gleichzeitig wollten wir eine zu starke Festlegung auf Verbalstrategien durch Sozialisationsmechanismen vermeiden, andererseits sollte aber der Spracherwerb weitestgehend abgeschlossen sein. Aus

268

Bartsch, Knospe & Witte: Nicht sprachgebundenes Denken

diesem Grunde haben wir Realschüler und Gymnasiasten zwischen 14 und 17 Jahren als Stichprobe gewählt. Es wurden etwa 230 Schüler mit der LPS Kurzform getestet. Um sie für einen weiteren Test zu gewinnen, wurde ihnen angeboten, sie bezüglich ihrer Testergebnisse im LPS über Schul- und Berufswahl zu beraten. Wir haben nach Zufall mit den Schülern Termine ausgemacht, bis wir 96 Vpn unter unseren Experimentalbedingungen untersucht hatten. Die Zahl 96 ergibt sich aus unserem Randomisierungsschema, das unten besprochen wird. Schließlich ergab sich folgende Zusammensetzung: 63 weiblich, 33 männlich, 69 Realschüler, 27 Gymnasiasten 1 .

2. Der

Versuchsplan

Um mögliche Stichprobeneffekte und den Zusammenhang auf dem Niveau von Individualaggregaten untersuchen zu können, mußten alle Vpn unter usS und sS getestet werden. Da wir außerdem Stabilitätskoeffizienten berechnen wollten, mußten die Tests unter den beiden Störbedingungen usS und sS noch jeweils halbiert werden. Somit werden die einzelnen Ex-

perimentaltests in 4 gleiche Teile geteilt, so daß eine Korrelation bestimmt werden konnte, die mögliche Einflüsse durch die zwischengeschaltete andere Störung erfassen konnte. 1

Bei der gemeinsamen Berücksichtigung von Geschlecht und Schulbildung ergibt sich folgendes Vierfelderschema:

Gymnasiasten Realschüler

6

9

5 28

22 44

Daraus wird erkennbar, daß diese beiden Merkmale nicht der experimentellen Kontrolle unterlagen. Dieser Punkt ist für die vorliegende Studie auch nicht wesentlich, da es sich um einen Intragruppenvergleich gehandelt hat, so daß dieselben Personen unter zwei Experimentalbedingungen verglichen werden konnten. Unsere Absicht war in dieser Arbeit, die allgemeine Hypothese der Indentität von Sprache und Denken an einer Normalpopulation, im Sinne von nicht-gestört, zu untersuchen. Diese allgemeine Hypothese läßt sich aber bereits durch ein Gegenbeispiel falsifizieren (vgl. zu dem Problem der Repräsentativität z. B. BREDENKAMP 1972, S. 41 f.). Die Kontrolle spezifischer Gruppencharakteristika bleibt weiteren Untersuchungen vorbehalten.

Tab. 1: Randomisierplan Reihenfolge der Tests

IP IP IP IP IP IP HP HP HP HP HP HP

CR CR CR MP MP MP CR CR CR MP MP MP

HP HP VK HP HP VK IP IP VK IP IP VK

MP VK HP CR VK HP MP VK IP CR VK IP

Reihenfolge der Störungen

VK MP MP VK CR CR VK MP MP VK CR CR

1. sS usS sS usS

2. usS sS usS sS

3. sS usS sS usS

4. usS sS usS sS

18, 20, 21, 23, 27, 32, 30, 36, 38, 15, 34, 5,

39, 10, 81, 82, 83, 3, 4, 85, 86, 87, 42, 88,

45, 14, 44, 47, 45, 8, 6, 58, 59, 61, 62, 63,

65 66 68 69 74 75 78 79 80 91 11 7

5. sS usS sS usS

Die Zahlen bezeichnen Vpn Nummern. uS: spezifisch (verbale Störung usS: unspezifische Störung mittels vergleichbarer Geräuschkulisse

1. usS sS usS sS

2. sS usS sS usS

3. usS sS usS sS

4. sS usS sS usS

19, 22, 24, 28, 29, 31, 35, 33, 37, 40, 16, 41,

25, 26, 12, 13, 2, 90, 84, 1, 92, 93, 43, 96,

50, 51, 52, 49, 48, 53, 54, 56, 57, 60, 64, 55,

67 70 71 72 73 76, 77 89 94 95 17 9

5. usS sS usS sS

...ter Test

269

Zeitschrift für Sozialpsychologie 1976, 7, 2 6 2 - 2 7 8

Da zu Beginn einer Testsitzung bereits die Instruktion bezüglich der sS und usS gegeben werden mußte, sollten an erster Stelle nur solche Tests mit sehr leicht verständlichen Instruktionen stehen. Die im Vorexperiment gewonnenen Erfahrungen hatten ergeben, daß dieses insbesondere bei den Tests HP und IP der Fall ist. Diese Erfahrungen lehrten ferner, daß die Tests CR und MP in ihrer Durchführung einen höheren Schwierigkeitsgrad enthalten. Folglich wurde immer mit HP oder IP begonnen, woran sich entweder CR oder MP anschloß. Der Verbaltest VK (Untertest 6 vom LPS) sollte, um mögliche Frustrationen zu Beginn zu vermeiden, nicht an erster Stelle stehen. Er wurde an 3., 4. oder 5. Stelle dargeboten. Der vollständige Randomisierungsplan ist in Tabelle 1 dargestellt. Die Vpn wurden zufällig auf die Experimentalbedingungen verteilt.

3.

Instruktionen

Die Instruktionen zu den Tests brauchen hier nicht im einzelnen behandelt zu werden, da wir uns an die Standardinstruktionen gehalten haben. Es seien hier nur die Instruktionen für die Störbedingungen wiedergegeben.

Instruktion Wörtliche Instruktion (Nachdem der Kopfhörer aufgesetzt wurde): „Ich spiele Dir jetzt ein Tonband vor, auf dem Du immer drei verschiedene Farben hörst. Diese sollst Du nun immer gleich, nachdem Du sie verstanden hast, wiederholen. Das machen wir jetzt mal zur Übung". (Tonband ab, 15 Sek. lang) - „Stopp, sehr gut. Jetzt werde ich Dir mal die andere Sache vorspielen. Hierbei brauchst Du nicht zu wiederholen". (Tonband ab, 15 Sek. ussS) — „So, jetzt kennst Du die beiden Bedingungen. - Du sollst nun gleich solche Tests wie in der Schule machen ([LPS]), die ich Dir noch erklären werde. Du wirst dann aber immer den Kopfhörer aufhaben und dann, wenn die Farben drankommen, sollst Du sie immer sofort, wenn Du sie gehört hast, wiederholen. Wenn Du alles verstanden hast, erkläre ich Dir jetzt den ersten Test.

([Beispielbogen wurde hinübergereicht].) Hier ist der Beispielbogen." Es folgten die Testinstruktionen zu den einzelnen Tests. Diese Instruktionen wurden den Schülern vorgelesen. Vor den einzelnen Testdurchgängen wurde jeweils angesagt, welche Bedingung folgt. sS: „Jetzt kommt wieder das mit den Farben"; usS: „Jetzt kommt wieder die andere Bedingung"; Wenn usS an erster Stelle stand: „Jetzt kommt das ohne die Farben".

Ergebnisse 1. Überprüfung der

Reliabilitäten

Zuerst einmal ist es notwendig, die Vierteltestkorrelationen zu bestimmen, um die Addition dieser Testwerte zu einem gemeinsamen Wert rechtfertigen zu können. Wir erhalten die folgenden Vierteltestkorrelationen r x y , die nach Spearman-Brown zu Halbtestreliabilitäten aufgewertet wurden (siehe Tab. 2). Tab. 2: Tabelle der Halbtestkorrelationen ( r x y ) und der nach Spearman-Brown aufgewerteten Reliabilitäten (r t t ) der Tests pro Störbedingung Variable IP HP CR MP

VK

r

sS usS sS usS sS usS sS usS sS usS

xy

rtt

98

.99

98

.99

98

.99

97

.98

94

.97

98

.99

82

.90

82

.90

95

.97

96

.98

Es ergeben sich recht gute Zuverlässigkeitskoeffizienten, so daß eine Zusammenfassung der Werte der Vierteltests gerechtfertigt ist.

2. Überprüfung der

Normalverteilung

Bei der Überprüfung der Normalverteilung wol-

270

Bartsch, Knospe & Witte: Nicht sprachgebundenes Denken

len wir Abweichungen nur dann akzeptieren, wenn sie bei a = 0.01 signifikant werden, da der t-Test gegenüber Verzerrungen dieser Art recht unempfindlich ist. Auch eine Diskussion der ,power' erübrigt sich in diesem Falle, da diese Untersuchung nur vorbereitenden Charakter hat. Wir können auf die Darstellung der einzelnen Werte verzichten, da keine der beobachteten Verteilungen der Meßwerte der 5 Experimentaltests unter den Bedingungen sS und usS nach dem Chiquadrattest auf a = 0.01 signifikant von den erwarteten Werten abweicht.

3. Homogenität der Varianzen Als Voraussetzung für die Verwendung des t-Tests muß die Varianzhomogenität gefordert werden. Aus diesem Grund überprüfen wir die Varianzen mit Hilfe des F-Tests auf Signifikanz. Auch in diesem Falle wollen wir wegen der Robustheit des t-Test-Verfahrens erst bei a = 0.01 eine Signifikanz interpretieren. Da es hier ebenfalls keine signifikanten Ergebnisse gibt, können wir auf die Darstellung der genauen Werte verzichten und Varianzhomogenität annehmen. Die Berücksichtigung des ,power'-Aspekts ist in dieser Situation gleichfalls nicht notwendig, da es sich auch nur um eine Vorbereitung für das eigentliche Prüfverfahren handelt.

4. Vergleich der Mittelwerte Der Vergleich zwischen den beiden Mittelwerten jedes einzelnen Tests in den zwei Störbedingungen usS und sS stellt unsere wissenschaftliche Hypothese ,H 0 auf dem Globalaggregat-Niveau dar.

4.1 Ergebnisse Da unsere theoretischen Überlegungen gestützt werden, wenn es keinen Unterschied zwischen beiden Störbedingungen gibt, müssen wir neben dem a-Fehler, der Wahrscheinlichkeit die H 0 zu verwerfen, wenn sie richtig ist, den ß-Fehler berücksichtigen, der uns die

Wahrscheinlichkeit angibt, die H, zu verwerfen, wenn sie richtig ist. Die Diskussion um den Aspekt der ,power' soll hier nicht eingehend geführt werden, hierzu bieten sich vor allem die Bücher von C O H E N (1969) und B R E DENKAMP (1972) an. Wir wollen bei unserem Signifikanztest bereits bei einem a = 0.05 annehmen, daß unsere wissenschaftliche Hypothese ,H 0 verworfen werden soll, was dann gegen unsere theoretischen Überlegungen spricht. Andererseits können wir noch nicht aus dem Nicht-Verwerfen von iH 0 schließen, daß unsere theoretischen Überlegungen durch unser Experiment gestützt werden, wenn wir nicht sicherstellen, daß die Wahrscheinlichkeit, eine richtige |Hj zu entdecken, sehr hoch war. Wenn wir mindesten einen mittleren Effekt, wie C O H E N es genannt hat, (1969, S. 2 2 - 2 5 ) , entdecken wollen, der d =

M, - M, s

= 0 . 5 beträgt, dann ha-

ben wir mit den folgenden ,power'-Werten zu rechnen (Tab. 3). Tab. 3: Darstellung der signifikanzstatistischen Kennwerte zur Überprüfung der Mittel Wertdifferenzen zwischen den beiden Experimentalbedingungen IP HP CR MP VK

a = •05, a = •05,

r u s S s S = .57, r u s S s S = .82, a = •05, r u s S s S = .57, a = •05, r u s S > s S = .00, a = • 05, r u s S s S = .60,

d: a, ß: r usS sS: N:

d d d d d

= = = = =

• 5, N •5, N .5, N .5, N .5, N

= = = = =

96,0