Deutsche Plurale im mentalen Lexikon: Experimentelle Untersuchungen zum Verhältnis von Speicherung und Dekomposition [Reprint 2010 ed.] 9783110949520, 9783484304734

According to the Dual Mechanism Model (Pinker 1999) the distinction between regular and irregular inflection determines

153 14 69MB

German Pages 208 [212] Year 2003

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Deutsche Plurale im mentalen Lexikon: Experimentelle Untersuchungen zum Verhältnis von Speicherung und Dekomposition [Reprint 2010 ed.]
 9783110949520, 9783484304734

Table of contents :
Abkürzungsverzeichnis
Einleitung
Kapitel 1 Die experimentelle Erforschung der Worterkennung: Grundlagen
1.1 Identifizierungsaufgaben
1.1.1 Perzeptuelle Identifizierung
1.1.2 Lukenexperimente
1.2 Neurolinguistische Methoden
1.3 Reaktionszeitexperimente zur Erkennung isolierter Wörter
1.3.1 Theoretische Erklärungen von Frequenzeffekten
1.3.2 Korpusfrequenz und weitere Variablen bei der Erkennung isolierter Wörter
1.3.3 Auditorische und visuelle Worterkennung
1.4 Reaktionszeitexperimente zur Erkennung von Wörtern im Kontext
1.4.1 Methodische Variationen in Primingexperimenten
1.4.2 Semantisches und assoziatives Priming
1.4.3 Indirekte Primingeffekte
1.4.4 Primingeffekte und weitere beeinflussende Faktoren
1.4.5 Bewußtes und automatisches Priming
1.4.6 Die Unterdrückung aufmerksamkeitsbedingter Primingeffekte
Kapitel 2 Die Erkennung morphologisch komplexer Wörter: Theoretische Annahmen
2.1 Morphologie in der psycholinguistischen Forschung
2.2 Worterkennungsmodelle
2.2.1 Assoziative Lexikonmodelle
2.2.2 Morphologisch basierte, unitäre Lexikonmodelle
2.2.3 Morphologisch basierte Modelle mit zwei Verarbeitungswegen
Kapitel 3 Die Erkennung morphologisch komplexer Wörter: Empirische Befunde
3.1 Konnektionistische Lexikonmodelle: Computersimulationen
3.1.1 Computersimulationen zum englischen Past-Tense-System
3.1.2 Computersimulationen zu deutschen Flexionsformen
3.2 Morphologisch basierte Lexikonmodelle: Reaktionszeitstudien
3.2.1 Morphologische Dekomposition auf der Zugriffsebene
3.2.2 Frequenzeffekte
3.2.3 Morphologische Beziehungen im mentalen Lexikon
3.2.4 Ergänzende Evidenz für das Duale Modell
Kapitel 4 Strukturelle Eigenschaften des deutschen Plurals
4.1 Die Pluralallomorphe
4.2 Analysen des Pluralsystems
4.2.1 Regelbasierte Pluralanalysen
4.2.2 Eine schemabasierte Pluralanalyse
4.2.3 Defaultbasierte Pluralanalysen
4.2.4 Eine constraint-basierte Pluralanalyse
4.3 Der -s Plural
4.4 Das deutsche Pluralsystem aus psycholinguistischer Perspektive
Kapitel 5 Reaktionszeitexperimente zu deutschen Pluralen: Lexikalische Entscheidungsaufgaben
5.1 Experiment 1 : Wortformfrequenzeffekte für -er und -s Plurale
5.1.1 Vorhersagen
5.1.2 Materialien und Versuchsplan
5.1.3 Teilnehmer und Methode
5.1.4 Ergebnisse
5.2 Experiment 2: Wortformfrequenzeffekte für -n Plurale
5.2.1 Vorhersagen
5.2.2 Materialien und Versuchsplan
5.2.3 Teilnehmer und Methode
5.2.4 Ergebnisse
5.2.5 Fehleranalyse
5.2.6 Mögliche konfundierende Faktoren
5.2.7 Diskussion
Kapitel 6 Reaktionszeitexperimente zu deutschen Pluralen: Modalitätsübergreifende Primingexperimente
6.1 Experiment 3: Primingeffekte durch -er und -s Plurale
6.1.1 Vorhersagen
6.1.2 Testmaterialien und Versuchsplan
6.1.3 Distraktoren
6.1.4 Teilnehmer und Methode
6.1.5 Ergebnisse
6.1.6 Fehleranalyse
6.1.7 Diskussion
6.2 Experiment 4: Primingeffekte durch Diminutive
6.2.1 Morphologische Eigenschaften des Diminutivs
6.2.2 Vorhersagen
6.2.3 Testmaterialien und Versuchsplan
6.2.4 Distraktoren
6.2.5 Teilnehmer und Methode
6.2.6 Ergebnisse
6.2.7 Diskussion
6.3 Experiment 5: Primingeffekte durch -n Plurale
6.3.1 Vorhersagen
6.3.2 Testmaterialien und Versuchsplan
6.3.3 Distraktoren
6.3.4 Teilnehmer und Methode
6.3.5 Ergebnisse
6.3.6 Fehleranalyse
6.3.7 Diskussion
Kapitel 7 Die Erweiterung des Dualen Modells
7.1 Wortformfrequenzeffekte und Primingeffekte
7.2 Die Repräsentation flektierter Wortformen im erweiterten Dualen Modell
7.3 Die Verarbeitung flektierter Wortformen im erweiterten Dualen Modell
7.4 Diskussion
7.4.1 Defaults und andere Formen
7.4.2 Subreguläre und irreguläre Formen
7.4.3 Der deutsche -n Plural
Zusammenfassung
Literaturverzeichnis
Anhang

Citation preview

Linguistische Arbeiten

473

Herausgegeben von Hans Altmann, Peter Blumenthal, Hans Jürgen Heringer, Ingo Plag, Beatrice Primus und Richard Wiese

Ingrid Sonnenstuhl-Henning

Deutsche Plurale im mentalen Lexikon Experimentelle Untersuchungen zum Verhältnis von Speicherung und Dekomposition

Max Niemeyer Verlag Tübingen 2003

Für Horsi

Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar. ISBN 3-484-30473-1

ISSN 0344-6727

© Max Niemeyer Verlag GmbH, Tübingen 2003 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Druck: Hanf Buch- und Mediendruck GmbH, Darmstadt Einband: Industriebuchbinderei Nadele, Nehren

Danksagung

Die vorliegende Arbeit ist die überarbeitete Fassung meiner Dissertationsschrift, die ich im Rahmen einer Doktorandenstelle im Projekt C7 „Der Erwerb und die Verarbeitung von Flexions- und Derivationselementen des Deutschen", im Sonderforschungsbereich 282 „Theorie des Lexikons", verfaßt habe. Für diese Gelegenheit bin ich der Deutschen Forschungsgemeinschaft sehr dankbar. Trotzdem wäre diese Arbeit nicht möglich gewesen ohne die Unterstützung vieler lieber Menschen. Mein Doktorvater Harald Clahsen hat mich während dieser Arbeit sowohl menschlich als auch fachlich ausgezeichnet betreut. Seine zahlreichen Ratschläge und guten Kommentare haben sehr zur Verbesserung dieser Arbeit beigetragen. Auch Dieter Wunderlich hat an dem Fortgang dieser Arbeit großes Interesse gezeigt. Sonja Eisenbeiß danke ich für jahrelange gute Zusammenarbeit, zahllose inspirierende Gespräche und kluge Ideen und dafür, daß sie immer für mich da war. Meike Hadler hat mir nicht nur mit ihrem Organisationatalent und dem Korrekturlesen dieser Arbeit unschätzbare Hilfe geleistet. Alle formalen und orthographischen Fehler in dieser Arbeit können nur passiert sein, nachdem Meike sie gelesen hat. Axel Huth hat mich bei der technischen Durchführung der Experimente und der Frequenzanalysen der deutschen Pluralformen sehr unterstützt. Er war dabei stets engagiert und freundlich und verlor nie die Geduld. Bei der praktischen Durchführung der Experimente und der statistischen Auswertung haben nur Meike Hadler, Joana Cholin, Rebecca Groß, Axel Huth, Christian Kissing, Kerstin Mauth und Peter Prüfen sehr geholfen. Schließlich haben mir meine Töchter Melanie, Natalie und Nicole immer, besonders in den letzten schweren Monaten, Mut gemacht, den begonnenen Weg zu Ende zu bringen. Ihnen allen möchte ich an dieser Stelle meinen ganz besonders herzlichen Dank aussprechen. Mein größter Dank gilt jedoch meinem geliebten Ehemann Horst Henning. Nur an seiner Seite ist diese Arbeit möglich gewesen. Diese letzten Zeilen muß ich nun ohne ihn schreiben. Ihm sei das Buch gewidmet.

Ingrid Sonnenstuhl-Henning, im Oktober 2002

Inhaltsverzeichnis

Abkürzungsverzeichnis Einleitung Kapitel l

X l

Die experimentelle Erforschung der Worterkennung: Grundlagen 1.1 Identifizierungsaufgaben 1.1.1 Perzeptuelle Identifizierung

7 7 7

1.1.2 Lukenexperimente 1.2 Neurolinguistische Methoden

8 9

l. 3 Reaktionszeitexperimente zur Erkennung isolierter Wörter 10 1.3.1 Theoretische Erklärungen von Frequenzeffekten 12 1.3.2 Korpusfrequenz und weitere Variablen bei der Erkennung isolierter Wörter 15 1.3.3 Auditorische und visuelle Worterkennung 18 l. 4 Reaktionszeitexperimente zur Erkennung von Wörtern im Kontext.... 19 1.4.1 Methodische Variationen in Prirningexperimenten 20 1.4.2 Semantisches und assoziatives Priming 21 1.4.3 Indirekte Primingeffekte 22

Kapitel 2

Kapitel 3

1.4.4 Primingeffekte und weitere beeinflussende Faktoren

23

1.4.5 Bewußtes und automatisches Priming l .4.6 Die Unterdrückung aufmerksamkeitsbedingter Primingeffekte

24

Die Erkennung morphologisch komplexer Wörter: Theoretische Annahmen 2.1 Morphologie in der psycholinguistischen Forschung 2.2 Worterkennungsmodelle 2.2.1 Assoziative Lexikonmodelle 2.2.2 Morphologisch basierte, unitäre Lexikonmodelle 2.2.3 Morphologisch basierte Modelle mit zwei Verarbeitungswegen Die Erkennung morphologisch komplexer Wörter: Empirische Befunde 3. l Konnektionistische Lexikonmodelle: Computersimulationen

26 29 29 31 31 33 36 43 43

3.1.1 Computersimulationen zum englischen Past-Tense-System... 43 3.1.2 Computersimulationen zu deutschen Flexionsformen 3.2 Morphologisch basierte Lexikonmodelle: Reaktionszeitstudien 3.2.1 Morphologische Dekomposition auf der Zugriffsebene 3.2.2 Frequenzeffekte 3.2.3 Morphologische Beziehungen im mentalen Lexikon 3.2.4 Ergänzende Evidenz für das Duale Modell

45 47 48 53 66 78

VIII Kapitel 4

Kapitel 5

Kapitel 6

Strukturelle Eigenschaften des deutschen Plurals

81

4.1 Die Pluralallomorphe 4.2 Analysen des Pluralsystems 4.2.1 Regelbasierte Pluralanalysen 4.2.2 Eine schemabasierte Pluralanalyse 4.2.3 Defaultbasierte Pluralanalysen 4.2.4 Eine constraint-basierte Pluralanalyse 4.3 Der -s Plural 4.4 Das deutsche Pluralsystem aus psycholinguistischer Perspektive

81 83 84 87 88 90 95 97

Reaktionszeitexperimente zu deutschen Pluralen: Lexikalische Entscheidungsaufgaben 5. l Experiment l: Wortformfrequenzeffekte für -er und -s Plurale 5.1.1 Vorhersagen 5.1.2 Materialien und Versuchsplan 5.1.3 Teilnehmer und Methode 5.1.4 Ergebnisse 5.2 Experiment 2: Wortformfrequenzeffekte für -n Plurale 5.2.1 Vorhersagen 5.2.2 Materialien und Versuchsplan 5.2.3 Teilnehmer und Methode 5.2.4 Ergebnisse 5.2.5 Fehleranalyse 5.2.6 Mögliche konfundierende Faktoren 5.2.7 Diskussion

103 104 104 105 106 107 109 110 110 112 112 115 116 116

Reaktionszeitexperimente zu deutschen Pluralen: Modalitätsübergreifende Primingexperimente 6.1 Experiment 3: Primingeffekte durch -er und -s Plurale 6.1.1 Vorhersagen 6.1.2 Testmaterialien und Versuchsplan 6.1.3 Distraktoren 6.1.4 Teilnehmer und Methode 6.1.5 Ergebnisse 6.1.6 Fehleranalyse 6.1.7 Diskussion 6.2 Experiment 4: Primingeffekte durch Diminutive 6.2.1 Morphologische Eigenschaften des Diminutivs 6.2.2 Vorhersagen 6.2.3 Testmaterialien und Versuchsplan 6.2.4 Distraktoren 6.2.5 Teilnehmer und Methode 6.2.6 Ergebnisse 6.2.7 Diskussion

121 121 121 122 124 125 126 128 129 132 132 134 134 135 136 137 138

IX

Kapitel 7

6.3 Experiment 5: Primingeffekte durch -n Plurale 6.3.1 Vorhersagen 6.3.2 Testmaterialien und Versuchsplan 6.3.3 Distraktoren 6.3.4 Teilnehmer und Methode 6.3.5 Ergebnisse 6.3.6 Fehleranalyse 6.3.7 Diskussion

140 140 141 142 142 143 148 149

Die Erweiterung des Dualen Modells 7.1 Wortformfrequenzeffekte und Primingeffekte 7.2 Die Repräsentation flektierter Wortformen im erweiterten Dualen Modell 7.3 Die Verarbeitung flektierter Wortformen im erweiterten Dualen Modell 7.4 Diskussion 7.4.1 Defaults und andere Formen 7.4.2 Subreguläre und irreguläre Formen 7.4.3 Der deutsche -n Plural

151 151 153 156 158 158 161 162

Zusammenfassung

165

Literaturverzeichnis

169

Anhang

183

Abkürzungsverzeichnis

CAT

Computer-Axial-Tomographie

EKP

Ereigniskorrelierte Potentiale

fMRI

funktionelle Magnet-Resonanz-Abbildung (functional Magnetic Resonance Imaging)

ISI

Inter-Stimulus-Intervall

LAN

Left Anterior Negativity

NESU

New Experimental Setup

PET

Positronen-Emissions-Tomographie

RT

Reaktionszeit (Reaction Time)

SOA

Stimulus-Onset-Asynchronie

VP

Versuchsperson

WF

Wortformfrequenz

Einleitung

DAS WORT stellt flir den Linguisten und Psycholinguisten in mancher Hinsicht das dar, was für den Biologen die Zelle ist. Beide zeigen differenzierte Substrukturen und interagieren mit vielen höherrangigen Systemen. So wie die Erforschung der Zelle wesentlich dazu beigetragen hat, die Physiologie des ganzen Körpers zu verstehen, kann das Studium von Wörtern Einsichten in die Beschaffenheit des menschlichen Sprachsystems bieten. Nicht nur in der Psycholinguistik ist deshalb in den letzten Jahren das Wort und mit ihm das MENTALE LEXIKON, der im Langzeitgedächtnis verankerte deklarative Wissensspeicher, in dem die lexikalischen Einheiten einer Sprache repräsentiert sind, in den Mittelpunkt des Interesses gerückt. Die Architektur und Funktionsweise dieses sprachlichen Organs, d.h. die Frage, wie lexikalische Einheiten beschaffen sind, welche Informationen mit ihnen gespeichert sind und wie diese Informationen strukturiert sind, und damit die Frage danach, wie Wörter produziert, verarbeitet und gespeichert werden, bildet seitdem für das Studium der Sprache einen zentralen Forschungsgegenstand. Das war nicht immer so. Ebenso wie die theoretische Linguistik war auch die moderne Psycholinguistik viele Jahre beinahe ausschließlich mit Satzverarbeitung beschäftigt. So untersuchten Psycholinguisten der 60er Jahre typischerweise, ob die Anzahl und Komplexität der mentalen Operationen während der Satzverarbeitung eine Funktion der Anzahl und Komplexität der formalen Transformationen in der grammatischen Ableitung eines Satzes war. Durch die Dominanz der Syntax spielte das mentale Lexikon zumeist eine relativ untergeordnete Rolle und wurde oftmals lediglich als begrenzte Liste von Irregularitäten und Idiosynkrasien definiert. Im wesentlichen wurde Bloomfields prägenerative Einschätzung „the lexicon is really an appendix of the grammar, a list of basic irregularities" (Bloomfield 1933:274) lange Zeit nicht wesentlich verändert, wie aus der Bemerkung von Chomsky und Halle hervorgeht: „Regular variations are not matters for the lexicon, which should contain only idiosyncratic items" (Chomsky & Halle 1968:12). Zu Beginn der 70er Jahre wurde allerdings die Syntax als zentralstes Element des Sprachsystems in Frage gestellt. Beispielsweise argumentierten Forscher wie Bever (1970) und Slobin (1973), daß die kognitive Fähigkeit, die in grammatischen Analysen der Sprachkompetenz beschrieben wird, nur eine unter mehreren Manifestationen der menschlichen Sprachfähigkeit ist (vgl. Kess 1992). In der Folge bekam die psychologische Erforschung sprachlicher Strukturen, wie sie in der tatsächlichen Sprachperformanz beobachtet werden können, ein immer größeres Gewicht und mit ihr das Konzept von der psychologischen Realität sprachlicher Phänomene. Heute hat sich die Psycholinguistik zu einem interdisziplinären Forschungsgebiet entwickelt, das im Idealfall die in der theoretischen Linguistik entwickelten Hypothesen im Hinblick auf ihren psychologischen Realitätsgehalt überprüft: „Certainly psychological reality is a desideratum for any linguistic theory which truly wishes explanatory power about the nature of language beyond the linguistic system itself." (Kess 1992:23)

Mit der zunehmenden Eigenständigkeit der Psycholinguistik als Forschungsfeld gewann auch die Rolle, die dem mentalen Lexikon zugeschrieben wird, immer mehr an Bedeutung. Sowohl die Erforschung von Versprechern als auch zahllose Experimente zur Worterkennung und -produktion haben gezeigt, daß das Lexikon aus weit mehr als nur einer minimalen Liste von Unregelmäßigkeiten und Idiosynkrasien besteht. Allgemein wird heute nicht mehr bezweifelt, daß im Lexikon in strukturierter Weise zahlreiche komplexe Informationen über semantische, syntaktische und morphologische Eigenschaften von Wörtern repräsentiert sind. Damit bildet das Lexikon für das menschliche Sprachsystem eine (mindestens) ebenso zentrale Komponente wie die Grammatik. Die verschiedenen Lexikonmodelle, die in den letzten Jahrzehnten entwickelt worden sind, unterscheiden sich allerdings nach wie vor in dem angenommenen Verhältnis von deklarativem, lexikalisch gespeichertem Wissen und grammatischen Prozeduren. Auf der einen Seite stehen hier Modelle, in denen mit der Hypothese, daß im Lexikon vornehmlich Wortkonstituenten wie monomorphemische Stämme und Affixe gespeichert sind, der lexikalische Speicher relativ klein gehalten ist. Das impliziert jedoch einen relativ hohen Aufwand an benötigten Prozeduren bei der Bildung oder Verarbeitung komplexer Wortformen. Auf der anderen Seite sind seit einigen Jahren konnektionistische Modelle sehr populär, in denen davon ausgegangen wird, daß jede komplexe Wortform als volle Form im Lexikon repräsentiert ist. Der benötigte prozedurale Aufwand ist in diesen Modellen verhältnismäßig gering, da auf jede Wortform direkt in nur einem Verarbeitungsschritt zugegriffen werden kann. Der erforderliche Speicher im Langzeitgedächtnis ist für diese Klasse der Lexikonmodelle jedoch immens groß. Zur Klärung der strittigen Frage, welche Informationen im Lexikon repräsentiert sind und wann regelbasierte grammatische Operationen anzunehmen sind, soll diese Arbeit einen Beitrag leisten. Besonders aufschlußreich für diese Fragestellungen ist das psycholinguistische Studium der verschiedenen Mechanismen, die bei der Verarbeitung morphologisch komplexer Wörter involviert sind. Empirische Untersuchungen, die sich zum Ziel gesetzt haben, die Erkennung komplexer Wörter zu erforschen, stehen deshalb in dieser Arbeit im Vordergrund. Vor allem bietet die empirische Erforschung unterschiedlicher Realisierungen derselben morphosyntaktischen Merkmale die Möglichkeit, lexikalische Strukturen des Sprachverarbeitungssystems unverzerrt von semantischen Prozessen, die bei derivierten Wörtern mitzuberücksichtigen sind, zu untersuchen. Ein Hauptaugenmerk dieser Arbeit wird daher auf der Erkennung flektierter Wörter liegen. Wie zahlreiche empirische Studien zeigen, scheinen dem menschlichen Sprachsystem sowohl analytische Prozeduren als auch direkte Zugriffsmöglichkeiten auf volle Wortformen zur Verfügung stehen. Das DUALE MODELL (Dual Mechanism Model), das u.a. von Pinker und Prince (1994), Marcus, Brinkmann, Clahsen, Wiese und Pinker (1995) und Clahsen (1999) für das deutsche und das englische Flexionssystem entwickelt worden ist, wird dieser Vorstellung durch die Annahme einer linguistisch begründeten, qualitativen Unterscheidung zwischen regelbasierten Defaultformen einerseits und irregulären, gespeicherten Wortformen andererseits sowohl in linguistischer als auch in psychologischer Hinsicht gerecht. Während allerdings für die überwiegende Anzahl der Flexionsformen ohne weiteres eine Einteilung in reguläre und irreguläre Formen vorgenommen werden kann, folgt das System

der deutschen nominalen Pluralformen in großen Teilen keinen offensichtlichen Regelmäßigkeiten. Eine Beschreibung dieses Systems stellt daher von jeher einen besonderen Anreiz für morphologische Analysen dar und ist nach wie vor umstritten. Bereits über die Anzahl der deutschen Pluralallomorphe herrscht Uneinigkeit. So nehmen zum Beispiel Ramge (1973) und Werner (1968) neun verschiedene Pluralsuffixe an (-n, -en, -e, -e mit Umlaut, -er, -er mit Umlaut, -5, 0, 0 mit Umlaut), Wiese (1996) und Wunderlich (1999a) dagegen nur drei (-s, -(e)n, -er). Der Gebrauch der Pluralsuffixe mit bestimmten Nomina ist weitgehend arbiträr. Die einzige sicher vorhersagbare Regularität gilt für feminine Nomina mit Schwa als Stammauslaut (z.B. Tasche- , Blwne-ri), die in jedem Fall ihren Plural mit -n bilden. Für die übrigen Formen lassen sich bestenfalls, abhängig von Genus und phonologischer Form des Singulars, bevorzugte Tendenzen der Pluralbildung beobachten. Deshalb sind verschiedene Autoren der Auffassung, daß sich die deutschen Pluralformen am besten in assoziativen Schemata erfassen lassen, in denen Regeln als bloße Epiphänomene betrachtet werden, (Kopeke 1988, Bybee 1991, MacWhinney & Leinbach 1991). Versuche, die Pluralbildung aufgrund assoziativer Muster am Computer zu simulieren, waren allerdings nicht sehr erfolgreich (Goebel & Indefrey 1994, Nakisa & Hahn 1996). Auf der anderen Seite sind Beschreibungen des Pluralsystems, die sich um eine regelhafte Erfassung der verschiedenen Formen bemühen, ebenfalls wenig befriedigend. So gelangt zum Beispiel Mugdan (1977) in seiner deskriptiven Analyse des Pluralsystems zu zehn spezifischen Regeln und 17 Listen von Ausnahmen. Trotz seiner Irregularitäten wird von den Vertretern des Dualen Modells jedoch angenommen, daß es im deutschen Pluralsystem eine reguläre Form gibt, die im Gegensatz zu den übrigen Formen durch eine mentale kombinatorische Operation per Defaultregel erzeugt wird. Wie Marcus et al. (1995) argumentieren, ist dies der -5 Plural (z.B. Park-s, Streik-s). Obwohl er mit einer Auftretenshäufigkeit von 1,9 % die am niedrigsten frequente Form im deutschen Pluralsystem ist, spricht für diese Annahme eine Reihe von Gründen, wie im Verlauf dieser Arbeit ausführlich erörtert werden wird. Unter anderem unterstützt die Beobachtung, daß der -s Plural nicht auf eine bestimmte Klasse von Nomina beschränkt ist, seine Klassifizierung als Defaultform. Er tritt auf bei Maskulina, Feminina und Neutra, bei monosilbischen und polysilbischen Wörtern, bei vokalfinalen und konsonantfinalen Stämmen und ist unabhängig von der Akzentuierung des Stamms. Diese Verwendungsmöglichkeit des -s Plurals steht im Gegensatz zu der Verwendung aller anderen Pluralformen, die stets an bestimmte morphophonologische und/oder semantische Umgebungen gebunden sind. Durch die extrem niedrige Frequenz seiner Defaultform unterscheidet sich die deutsche Pluralflexion von anderen Flexionssystemen wie zum Beispiel dem englischen Plural- und Verbsystem oder dem deutschen Verbsystem, für die klare Verarbeitungsunterschiede zwischen allgemeinen Defaultformen und irregulären Formen beobachtet werden konnten (z.B. Stanners et al. 1979, Marslen-Wilson et al. 1993, Sonnenstuhl et al. 1999). Gerade diese Eigenschaft macht allerdings das deutsche Pluralsystem aus psycholinguistischer Sicht besonders interessant. Wenn nämlich die Unterschiede zwischen regulären Defaultformen und irregulären Formen nicht auf statistischen Eigenschaften, sondern, wie von Vertretern des Dualen Modells angenommen, auf qualitativen Unterschieden beruhen,

sollten sich auch in diesem System korrespondierende Verarbeitungsunterschiede zwischen Defaultformen und irregulären Formen beobachten lassen. Eine besondere Herausforderung für das Duale Modell stellt außerdem die Tatsache dar, daß die irregulären Pluralformen deskriptiv keine homogene Menge bilden, sondern daß sich vielmehr zahlreiche Subregularitäten beobachten lassen, die statistisch zum Teil wesentlich dominanter sind als die Pluralbildung mit -s. Zum Beispiel ist die Pluralbildung mit -(e)n mit einer Gebrauchsfrequenz von 43,8 % die weitaus häufigste und wird dementsprechend von zahlreichen Autoren als die reguläre klassifiziert (z.B. Mugdan 1977, MacWhinney 1978, Äugst 1979, Wegener 1992). Innerhalb der Gruppe der -n Plurale gibt es darüber hinaus für die Klasse der Feminina, die im Singular auf Schwa enden, die einzige sicher vorhersagbare Pluralmarkierung. Aus der Perspektive des Dualen Modells stellt sich daher die Frage, ob sich für die Verarbeitung der Pluralformen tatsächlich eine Zweiteilung, die einen allgemeinen Default allen übrigen Formen gegenübergestellt, aufrechterhalten läßt, oder ob nicht vielmehr eine differenziertere Einteilung der Flexionsformen angenommen werden muß, wie dies von zahlreichen Morphologen vorgeschlagen wird (z.B. Carstairs-McCarthy 1999, Dressler 1999, Indefrey 1999, Wiese 1999, Wunderlich 1999b). In dieser Arbeit soll die Gültigkeit des Dualen Modells für das deutsche Pluralsystem experimentell überprüft werden. Dazu sind als Methode lexikalische Entscheidungsaufgaben gewählt worden, in denen als abhängige Variablen Reaktionszeiten und Fehlerraten erhoben werden können. Als Online-Aufgaben haben sie den Vorteil, direkt während des zu beobachtenden Vorgangs anzusetzen und sind deshalb besonders geeignet, während der Worterkennung ablaufende Prozesse zu untersuchen. Es werden zwei visuelle lexikalische Entscheidungsaufgaben vorgestellt, bei denen verschiedene Pluralformen in Isolation präsentiert und im Hinblick auf Stamm- und Wortformfrequenzeffekte untersucht wurden. Um Aufschluß über die lexikalischen Beziehungen der Pluralformen zu ihren Stämmen zu erlangen, wurde in drei weiteren lexikalischen Entscheidungaufgaben untersucht, welche Auswirkungen die vorherige Präsentation einer Pluralform auf die Erkennung des entsprechenden Nominalstamms hat. Dabei wurden die Stimuli in verschiedenen Sinnesmodalitäten (auditiv und visuell) präsentiert, so daß formale Ähnlichkeitseffekte weitestgehend ausgeschlossen werden konnten.

Überblick über das Buch Einleitend stellt Kapitel l einige empirische Grundlagen vor, die sozusagen das Handwerkszeug des mit Worterkennung befaßten Psycholinguisten bilden. Insbesondere werden verschiedene experimentelle Methoden zur Untersuchung der Worterkennung im allgemeinen, ihre Sensitivität für die verschiedenen Eigenschaften eines Wortes und Erklärungsmodelle für die experimentellen Ergebnisse beschrieben. Besonderer Wert wird dabei auf die Beschreibung von Reaktionszeitexperimenten gelegt. Aufbauend auf diesen Grundlagen werden in den Kapiteln 2 und 3 aktuelle empirische Forschungsergebnisse und die aufgrund dieser Ergebnisse entwickelten Modelle des mentalen Lexikons vorgestellt und diskutiert. Kapitel 2 gibt zunächst eine Übersicht über verschiedene theoretische Vorstellungen zur Rolle der Morphologie in der psycholinguist!-

sehen Forschung; Kapitel 3 beschäftigt sich mit den entsprechenden empirischen Untersuchungen. Im Verlauf der Diskussion wird sich zeigen, daß weder die Betrachtung des Lexikons als Liste von minimalen Einheiten noch die Annahme, daß jede Wortform als morphologisch unstrukturierte Informationseinheit gespeichert ist, zu einem sowohl psychologisch als auch linguistisch befriedigenden Modell des Lexikons führt. Zusammengenommen weisen die Ergebnisse vielmehr darauf hin, daß dem menschlichen Sprachsystem sowohl analytische Prozeduren als auch die direkte Zugriffsmöglichkeit auf volle Wortformen zur Verfügung stehen. Deshalb soll im Anschluß an einen kurzen Überblick über bestehende Analysen des deutschen Pluralsystems (Kapitel 4) in fünf Reaktionszeitexperimenten die Gültigkeit des Dualen Modells für das deutsche Pluralsystem überprüft werden. Diese eigenen empirischen Untersuchungen, die im Rahmen des Projekts C7 „Der Erwerb und die Verarbeitung von Flexions- und Derivationselementen des Deutschen" im SFB 282 „Theorie des Lexikons" durchgeführt worden sind, werden in den Kapiteln 5 und 6 ausführlich beschrieben. Aufgrund der Ergebnisse, die sich in diesen Experimenten zeigen, wird in Kapitel 7 eine Erweiterung des Dualen Modells entwickelt, das die Vorzüge des klassischen Modells beibehält, darüber hinaus aber explizitere und detailliertere Annahmen über Repräsentationen und Prozesse im mentalen Lexikon macht.

Kapitel l Die experimentelle Erforschung der Worterkennung: Grundlagen

Anders als in der Physik oder Biologie gibt es in der kognitiven Linguistik keine standardisierten Versuchsanordnungen mit festgeschriebenen Normalbedingungen, nach denen Untersuchungen zur Worterkennung durchgeführt werden können. Vielmehr ist ein breites Spektrum verschiedener Methoden entwickelt worden, die unterschiedliche kognitive Ebenen der Verarbeitung ansprechen und dabei unterschiedlich sensitiv fiir die verschiedensten Eigenschaften eines lexikalischen Eintrags sind. Beispielsweise hat sich gezeigt, daß Frequenz, Länge, Orthographie, Phonologie, Semantik und morphologische Beschaffenheit eines Wortes seine Erkennung beeinflussen können. Wie sich im Verlauf dieser Arbeit herausstellen wird, trägt insbesondere die Untersuchung von Wörtern mit komplexer morphologischer Struktur grundlegend zum Verständnis der Repräsentationen und Prozesse im mentalen Lexikon bei. Bevor jedoch eine Auswahl aktueller empirischer Forschungsergebnisse zur Verarbeitung morphologisch komplexer Wörter und auf ihnen basierende Modelle des Lexikons diskutiert werden können, sollen in diesem Kapitel zunächst einige grundlegende Erkenntnisse vorgestellt werden, die aus dem Studium monomorphemischer Wörter gewonnen worden sind. Zugleich soll dieser Teil einen Überblick über die diversen Methoden, die zur Untersuchung der Worterkennung zur Verfügung stehen, und ihre charakteristischen Eigenschaften geben. Um eine klare Interpretation der Ergebnisse zu ermöglichen, wird in den meisten psycholinguistischen Experimenten, die zur Worterkennung durchgeführt werden, die Erkennung einzeln präsentierter Wörter außerhalb eines Textkontextes untersucht, oder der Kontext wird auf ein einziges Wort reduziert. Obwohl diese Verfahrensweise nicht den Gegebenheiten in natürlicher Sprache entspricht, wird doch davon ausgegangen, daß bei der Erkennung einzeln oder in einem reduzierten Kontext präsentierter Wörter dieselben zugrundeliegenden Prozesse wirksam sind wie bei der Erkennung von Wörtern in einem größeren Zusammenhang.

l. l

Identifizierungsaufgaben

1.1.1 Perzeptuelle Identifizierung Die früheste und einfachste Methode, die zur Erforschung der Worterkennung herangezogen wird, ist die PERZEPTUELLE IDENTIFIZIERUNG (z.B. Luce 1986). Sie wird sowohl zur visuellen als auch zur auditorischen Worterkennung eingesetzt. Den Versuchspersonen werden dabei einzelne Wörter, die so exakt wie möglich identifiziert werden sollen, degradiert präsentiert. Diese Degradierung wird zumeist durch sehr kurze Präsentationszeiten der Stimuli (in visuellen Aufgaben) oder durch die gleichzeitige Präsentation von Störgeräuschen (in auditorischen Aufgaben) erreicht.

Ein Vorzug dieser Methode ist ihre Natürlichkeit, denn auch in der normalen Sprache müssen Wörter oft trotz sehr kurzer Präsentationszeit oder vor einem Hintergrund von Störgeräuschen identifiziert werden. Als abhängige Variable wird in diesen Studien die Korrektheit der Identifizierung gemessen. Es hat sich herausgestellt, daß der Korrektheitsgrad stark mit der Frequenz des präsentierten Wortes (Rosenzweig & Postman 1957, Owens 1961, Savin 1963, Broadbent 1967) und seiner lexikalischen Ähnlichkeit mit anderen Wörtern korreliert (Treisman 1978, Luce et al. 1990). Die Methode der perzeptuellen Identifizierung wird deshalb sowohl zur Untersuchung der Worterkennung als auch zur Untersuchung struktureller Beziehungen im Lexikon herangezogen. Daneben ist diese Methode auch für die psychologische Wahrnehmungsforschung von Interesse, da die Schwellenwerte ermittelt werden können, bis zu denen die Identifizierung eines Wortes möglich ist.

l. l .2 Lukenexperimente Die von Grosjean (1980) erstmalig eingesetzte Methode der LUKENEXPERIMENTE (Gating, von engl. gate 'Tor') ist eine Weiterentwicklung der auditorischen perzeptuellen Identifizierung. In diesen Experimenten wird in jedem Trial eine 'Wahrnehmungsluke', in der nur ein Bruchstück des Stimulus erkennbar ist, jeweils ein kleines Stück weiter aufgemacht. Zum Beispiel sind in einem ersten Durchlauf nur die ersten 30 msek eines Wortes zu hören, im zweiten Durchlauf 60 msek usw., bis das ganze Wort erkannt worden ist. In einer Abwandlung dieser Version wird das gesamte Wort mit anderen Geräuschen maskiert, und nur ein Bruchstück des Wortes ist in jedem Durchlauf unmaskiert. Die Aufgabe der Versuchsperson ist es, den Stimulus nach jedem Durchlauf zu identifizieren und selbst die Korrektheit der Antwort zu schätzen. Wie die perzeptuelle Identifizierung sind auch die Lukenexperimente sensitiv für die Frequenz des präsentierten Wortes (Grosjean 1980, Tyler 1984, Lively et al. 1994, Walley et al. 1995), seine Ähnlichkeit zu anderen Wörtern (Wayland et al. 1989, Marslen-Wilson 1990, Walley et al. 1995) und seine Länge (Grosjean 1980, Craig & Kim 1990). Darüber hinaus hat sich herausgestellt, daß Wörter eher erkannt werden können, wenn die präsentierten Bruchstücke seiner morphologischen Struktur entsprechen (Tyler & Marslen-Wilson 1986, Tyler et al. 1988, Schriefers et al. 1991). Ein weiterer Vorteil dieser Aufgabe ist, daß sie die Untersuchung einer Reihe abhängiger Variablen ermöglicht, z.B. den ISOLATIONSPUNKT (d.h. den Punkt, an dem genügend akustisch-phonetische Information verfügbar ist, um alle anderen möglichen Kandidaten für die Erkennung des Wortes auszuschließen) und den ERKENNUNGSPUNKT (recognition point), der von der Informationsmenge abhängt, die zur Erkennung eines Wortes benötigt wird. Dabei sind Isolationspunkt und Erkennungspunkt nicht notwendigerweise identisch (Tyler & Wessels 1983). Zum Beispiel kann der Erkennungspunkt vor dem Isolationspunkt liegen, wenn ein Wort in einem passenden semantischen Kontext erscheint.1 Unterschiede zwischen Erkennungs- und Isolationspunkten lassen daher Rückschlüsse auf die Interaktionen zwischen dem Worterkennungssystem und der syntaktisch-semantischen Verarbeitungskomponente zu. 1

Dieses Phänomen kann man auch an sich selbst beobachten, wenn man z.B. für seinen Gesprächspartner einen Satz vervollständigt.

Da in Identifizierungsaufgaben üblicherweise keine Reaktionszeiten gemessen werden, sondern der Anteil der korrekt identifizierten Wörter, ist gegen die Methoden der perzeptuellen Identifizierung und des Gating eingewendet worden, daß sie OFFLlNE-Aufgaben sind, die nur das Endprodukt der Worterkennung messen, während der eigentliche Worterkennungsprozeß im Dunkeln bleibt. Es kann zum Beispiel nicht beurteilt werden, ob die Versuchspersonen besondere Rate- oder Entscheidungsstrategien bei der Identifizierung der Stimuli angewendet haben, und die Daten nicht eher das Funktionieren dieser Ratestrategien als die echte Worterkennung reflektieren (vgl. Lively et al. 1994).

l .2

Neurolinguistische Methoden

Während Identifizierungsaufgaben die frühesten und von den technischen Anforderungen her die einfachsten Verfahren zur Untersuchung der Worterkennung darstellen, bilden neuro- und physiologische Untersuchungen zur Sprachverarbeitung sozusagen das andere Ende des methodischen Spektrums. Sowohl die Untersuchung von Gehirnaktivitäten als auch die Aufzeichnung von Augenbewegungen sind relativ komplexe Verfahren, die nur in speziell dafür ausgerüsteten Labors oder Kliniken durchgeführt werden können. Erst seit einigen Jahren stehen die Geräte zur Verfügung, mit denen es möglich ist festzustellen, welche Gehirnareale an der Durchführung bestimmter sprachlicher Aktivitäten beteiligt sind. Auch die Apparate, die zur Aufzeichnung von Bewegungen des Augapfels während der Perzeption sprachlicher Stimuli benötigt werden, sind erst seit wenigen Jahren verfügbar. Allgemein liegt der Anwendung neurolinguistischer Methoden die Annahme zugrunde, daß neurologische Aktivität und mentale Prozesse miteinander korreliert werden können. Die direktesten Aufschlüsse über die neuronalen Prozesse, die während der Spracherkennung ablaufen, liefern bildgebende Verfahren wie die COMPUTER-AXIAL-TOMOGRAPHIE (CAT), die FUNKTIONELLE MAGNET-RESONANZ-ABBILDUNG (fMRI) und die POSITRONENEMISSIONS-TOMOGRAPHIE (PET). Diese Verfahren werden zur Zeit allerdings noch recht selten benutzt, da die benötigte technische Ausrüstung extrem teuer ist. Zudem sind diese Verfahren relativ invasiv, z.B. muß in PET-Untersuchungen den Versuchspersonen radioaktive Glukose injiziert werden, um die erhöhte Aktivität bestimmter Hirnregionen sichtbar machen zu können. Zur Untersuchung von Gehirnaktivitäten werden deshalb häufiger EREIGNISKORRELIERTE POTENTIALE (EKPs) aufgezeichnet. Bei dieser Methode wird die elektrische Aktivität des Gehirns mittels an der Schädeldecke angebrachter Elektroden gemessen. Obwohl die Daten aus den Untersuchungen von Gehirnaktivitäten sehr direkte Einsichten in die während der Sprachverarbeitung ablaufenden Prozesse liefern können, sind sie sehr komplex und oftmals schwer zu interpretieren, da außer der sprachlichen Verarbeitung immer noch zahlreiche andere Prozesse im Gehirn ablaufen. Zudem sind die diversen Prozesse während der sprachlichen Verarbeitung selbst nicht strikt zeitlich getrennt. Beispielsweise könnte eine beobachtete semantische Aktivität ebenso an der semantischen Verarbeitung eines aktuellen Items als auch an der semantischen Integration von früher präsentiertem Material liegen. Zu den sprachspezifischen Beobachtungen aus EKP-Studien, die

10 sich als relativ robust und verläßlich replizierbar erwiesen haben, gehört das Phänomen, daß ein semantisch auffälliger Stimulus (z.B. in 'Er trinkt seinen Kaffee mit Milch und Socken1} etwa 400 msek nach seinem Erscheinen ein negatives Potential erzeugt (Kutas & Hillyard 1980, Kounios & Holcomb 1992, Nigram et al. 1992). Diese charakteristische Amplitude wird daher in der Literatur als N400 bezeichnet (filr einen Überblick zur N400 s. Kutas & van Petten 1994, Weyerts 1997). Zum anderen scheint die Negativierung in einem vorderen linken Bereich des Gehirns (left anterior negativity), der etwa 300 msek später eine Positivierung folgt, charakteristisch für syntaktische und morphologische Aktivität zu sein. Diese Aktivierung wird in der Literatur auch als LAN bezeichnet (Kutas & Hillyard 1980, Münte & Heinze 1994, Weyerts et al. 1997). Aufschlüsse über Prozesse während der Sprachverarbeitung kann auch die Aufzeichnung von AUGENBEWEGUNGEN geben. Hierzu wird eine speziell konstruierte Brille benutzt, die einen Infrarotstrahl, der vom Augapfel reflektiert wird, zur Auswertung an einen Computer weiterleitet. Diese Technik beruht auf der Beobachtung, daß der Augapfel sich beim Lesen eines Textes nicht gleichmäßig bewegt, sondern in Sakkaden von ungefähr 25 msek, mit Intervallen von ca. 200 bis 250 msek, in denen der Augapfel stillsteht. Innerhalb einer solchen Fixation können (in Texten, die von links nach rechts geschrieben sind) ca. 15 Buchstaben auf der rechten Seite und 3 - 4 Buchstaben auf der linken Seite gleichzeitig wahrgenommen werden (Rayner et al. 1980). Bei der Verarbeitung gesprochener Sprache werden die Augenbewegungen verfolgt, mit denen Versuchspersonen reale oder auf einem Bildschirm präsentierte Objekte fixieren, die im Text vorkommen (Cooper 1974, Tanenhaus et al. 1995). Aus dem Studium von Augenbewegungen erhofft man sich vor allem Rückschlüsse auf die Einflüsse des Kontextes. So konnten Ehrlich und Rayner (1981) zeigen, daß das Lesen eines Wortes, das in einem Satzkontext hochgradig vorhersagbar war, weniger Zeit benötigte als das Lesen eines Wortes, das weniger vorhersagbar war. Untersuchungen von Inhoff und Rayner (1986) und Rayner und Duffy (1986) haben aber auch gezeigt, daß Augenbewegungsstudien sensitiv für die Frequenz der präsentierten Wörter sind. Wegen der hohen technischen Anforderungen, die sowohl für die Aufzeichnungen von Gehirnaktivitäten als auch für die Messungen von Augenbewegungen erforderlich sind, ist ihr prozentualer Anteil an den Untersuchungen, die zur Worterkennung durchgeführt wurden, (noch) relativ gering. Wesentlich häufiger sind Untersuchungsverfahren, die weniger technischen Aufwand erfordern.

l .3

Reaktionszeitexperimente zur Erkennung isolierter Wörter

Die bei weitem meistbenutzten Methoden, die zur Untersuchung der Worterkennung herangezogen werden, sind Experimente, in denen die Reaktionszeiten der Versuchspersonen gemessen werden. Wie neurolinguistische Verfahren zählen auch die Reaktionszeitexperimente zu den ONLlNE-Methoden, die gegenüber OFFLiNE-Methoden den Vorteil haben, direkt während des zu beobachtenden Vorgangs anzusetzen. Sie werden daher bevorzugt für die Erforschung prozessualer Aspekte der sprachlichen Verarbeitung benutzt.

11 Die am häufigsten eingesetzten Reaktionszeitexperimente zur Worterkennung sind entweder BENENNUNGSAUFGABEN (Naming), in denen die Versuchsperson ein präsentiertes Wort ausspricht, oder LEXIKALISCHE ENTSCHEIDUNGSAUFGABEN (Lexical Decision Tasks), in denen die Versuchsperson eine Entscheidung darüber trifft, ob eine präsentierte Buchstaben- oder Phonemkette ein existierendes Wort ist oder nicht. Bei beiden Methoden ist es möglich, das zu erkennende Wort in Isolation zu präsentieren oder seine Erkennung durch einen Kontext anzubahnen (primeri).2 Im Hinblick auf diese Unterscheidungen können die Reaktionszeitexperimente zur Worterkennung in vier methodische Paradigmen eingeteilt werden (Tabelle 1). Aufgabe der Versuchsperson Benennung

lexikalische Entscheidung

ohne Kontext

Benennungsaufgabe (Naming)

lexikalische Entscheidungsaufgabe

mit Kontext

Priming mit Benennung

Priming mit lexikalischer Entscheidung

Tabelle l: Reaktionszeitexperimente zur Worterkennung

Während in Abschnitt l .4 die Erkennung von Wörtern im Kontext besprochen wird, soll es im vorliegenden Abschnitt zunächst um die methodischen Varianten bei der Erkennung von isolierten Wörtern gehen.

(i)

Benennungsaufgaben

In Benennungsaufgaben hat die Versuchsperson die Aufgabe, visuell oder auditiv präsentierte Wörter so schnell wie möglich auszusprechen. Als auswertbare abhängige Variablen liefert diese Aufgabe Reaktionszeiten und Fehlerraten. Da beobachtet worden ist, daß bei gleicher Stimuluslänge auch die Dauer der Antworten variieren kann (Balota et al. 1989), wird oft sowohl die Reaktionszeit bis zum Beginn der Antwort (onset) als auch die Sprechdauer der Antwort gemessen. Wie Identifizierungsaufgaben haben auch Benennungsaufgaben den Vorteil, relativ natürlich zu sein, da es keine künstlichen Antwortkategorien wie 'existierendes Wort' und 'nicht-existierendes Wort' (Pseudowort) gibt. Außerdem braucht die Versuchsperson zur Mitteilung ihrer Antwort keine Tasten zu betätigen (das tut sie beim normalen Sprechen auch nicht). Darüber hinaus braucht der Stimulus nicht, wie in den Identifizierungsexperimenten, künstlich degradiert zu werden. Ein Nachteil der Benennungsaufgaben besteht darin, daß nicht sichergestellt werden kann, in welchem Ausmaß die lexikalische Erkennung eines Wortes tatsächlich untersucht wird. So ist bei visuellen Benennungsaufgaben zu berücksichtigen, daß Grapheme auch ohne die Aktivierung des Lexikons direkt in Phoneme übersetzt werden können. Einen Beweis für diesen Prozeß liefert die Fähigkeit, unbekannte Wörter vorlesen zu können. Im

2

Für diese Variante der Reaktionszeitexperimente werde ich im folgenden die präziseren, aus dem Englischen übernommenen Begriffe PRIMEN und PRIMING übernehmen, die sich mittlerweile auch in der deutschen Literatur durchgesetzt haben.

12 Experiment ist daher (vor allem bei regulär geschriebenen Wörtern) nicht sichergestellt, daß die Erkennung des betreffenden Wortes überhaupt stattgefunden hat. Ein ähnliches Problem tritt bei der auditorischen Präsentation des Stimulus auf, dessen Phonemfolge im Kurzzeitgedächtnis gespeichert sein und bei der Antwort ohne die Aktivierung lexikalischer Informationen einfach repliziert werden könnte. Falls diese Möglichkeiten zutreffen, mißt die Benennungsaufgabe keine Worterkennung, sondern die Effektivität des Graphem-Phonem-Übersetzungsprozesses bzw. die Leistung des Kurzzeitgedächtnisses.

(ii) Lexikalische Entscheidungsaufgaben In lexikalischen Entscheidungsaufgaben besteht die Aufgabe der Versuchsperson darin, so schnell und so korrekt wie möglich zu entscheiden, ob eine visuell präsentierte Buchstabenkette bzw. eine akustisch präsentierte Phonemsequenz ein existierendes Wort ist (la) oder nicht (Ib). (1)

a.

Aschenbecher

b.

Anterscheuder

Bei der (häufiger angewendeten) visuellen lexikalischen Entscheidungsaufgabe werden die Stimuli einzeln auf einem Computerbildschirm präsentiert, in der auditorischen Variante über Kopfhörer oder Lautsprecher. Die Reaktion der Versuchsperson besteht nicht, wie in den zuvor beschriebenen Experimenten, aus der Produktion einer sprachlichen Antwort, sondern ist eine Ja-Nein-Entscheidung, die im allgemeinen durch das Betätigen einer entsprechenden Antworttaste erfolgt. Als auswertbare abhängige Variablen werden in dieser Methode die Reaktionszeit und die Korrektheit der Antwort gemessen. Gegen die lexikalische Entscheidungsaufgabe kann eingewendet werden, daß sie im Grunde genommen eine metalinguistische Aufgabe ist, da die Antwort der Versuchsperson nicht darin besteht, eine sprachliche Äußerung zu produzieren bzw. zu verarbeiten, sondern darin, einen dargebotenen sprachlichen Stimulus zu beurteilen. Da dies eine Situation ist, die in der normalen Sprache nicht vorkommt, ist die Aufgabe relativ künstlich. Darüber hinaus können auch die Prozesse zwischen der eigentlichen Wortfindung und dem Betätigen der Antworttaste zu unerwünschten Verzerrungen des Ergebnisses führen. Zum Beispiel berichten Versuchspersonen häufig, daß sie ein Wort richtig beurteilt, aber aus Versehen die falsche Antworttaste betätigt haben. Andererseits werden aber die Probleme bei der Interpretation der Reaktionszeiten, wie sie in Benennungsaufgaben berücksichtigt werden müssen, in lexikalischen Entscheidungsaufgaben vermieden. Innerhalb der Gruppe der Reaktionszeitexperimente bilden die lexikalischen Entscheidungsaufgaben daher die am weitaus häufigsten benutzte Methode.

1.3.1 Theoretische Erklärungen von Frequenzeffekten In allen Untersuchungen, die sich mit der Verarbeitung isoliert präsentierter Wörter befaßt haben, hat sich herausgestellt, daß die Gebrauchsfrequenz eines Wortes einen entscheidenden Einfluß auf seine Erkennung hat. Dieser Frequenzeffekt wurde zum ersten Mal von Howes und Solomon (1951) nachgewiesen und ist seitdem nicht nur in perzeptuellen

13

Identifizierungsaufgaben beobachtet worden (z.B. Broadbent 1967), sondern hat sich auch in Benennungsaufgaben (z.B. Balota & Chumbley 1984) und in lexikalischen Entscheidungsaufgaben (z.B. Forster & Chambers 1973) bestätigt. In Reaktionszeitstudien stellt sich dabei regelmäßig heraus, daß sich die Erkennungszeit umgekehrt proportional zu der Frequenz des untersuchten Wortes verhält, d.h. je höher die Frequenz des untersuchten Wortes ist, desto kürzer ist im allgemeinen seine Erkennungszeit. Dem robusten Einfluß der Wortfrequenz werden zwei grundsätzlich unterschiedliche Klassen von Worterkennungsmodellen gerecht. In der einen Klasse der Modelle wird von der Annahme ausgegangen, daß Wörter durch einen seriellen Suchprozeß aus dem deklarativen Gedächtnis abgerufen werden. Die Einträge im mentalen Lexikon sind in diesen Modellen so angeordnet, daß hochfrequente Wörter schneller gefunden werden können als niedrigfrequente. In der zweiten Klasse der Erklärungsmodelle wird davon ausgegangen, daß die Auswahl eines Wortes von seinem Aktiviemngsgrad abhängt. Da hochfrequente Wörter auch im Ruhezustand höhere Aktivierungsgrade haben als niedrigfrequente, können sie mit weniger Aufwand aktiviert werden.

(i)

Suchmodelle

In dem von Forster (1976, 1979) entwickelten LEXIKALISCHEN SUCHMODELL (autonomous lexical search model, s.a. Rubenstein et al. 1970) besteht das Worterkennungssystem aus verschiedenen Untersystemen, wie Abbildung l illustriert. input features

orthographic access files

phonetic access files entries organized by frequency

Abbildung 1: Das Worterkennungssystem in Forsters Suchmodell (nach Forster 1979)

Eine grundsätzliche Unterteilung besteht zwischen peripheren Zugriffskomponenten (access files) und einem Hauptlexikon (master lexicon). Die modalitätsspezifischen Zugriffsspeicher sind ihrerseits in verschiedene Kästen (bins) unterteilt. Das ankommende Inputsignal wird zu Beginn der Verarbeitung je nach seiner Modalität in den entsprechenden Zugriffsspeicher geschickt und mit den dort gespeicherten Informationen verglichen. Innerhalb der Kästen sind die Repräsentationen für Wörter nach ihrer Frequenz in absteigender Reihenfolge angeordnet, so daß die Zugriffsrepräsentation für ein eintreffendes

14 hochfrequentes Signal eher gefunden werden wird als für ein niedrigfrequentes. Die verschiedenen Zugriffsrepräsentationen aktivieren ihrerseits lexikalische Zeiger (pointer), die auf den entsprechenden Eintrag im Hauptlexikon verweisen, in dem die syntaktischen und semantischen Eigenschaften des Wortes gespeichert sind. Um der hohen Geschwindigkeit bei der Worterkennung gerecht zu werden, hat Forster einige Eigenschaften des ursprünglichen Modells im Laufe der Zeit revidiert (Forster 1987, 1989). Während das klassische Modelle beispielsweise nur von einem Vergleichsprozeß für jeden der beiden Zugriffsspeicher ausging, wird in den revidierten Versionen angenommen, daß für jeden Kasten unabhängige und parallel arbeitende Vergleichsprozesse aktiv sind, was die Geschwindigkeit des Worterkennungsprozesses erheblich erhöht. Da die Anzahl der Kästen allerdings prinzipiell nicht beschränkt ist, geht die Annahme vieler, parallel arbeitender Vergleichsprozesse zu Lasten der attraktiven Eigenschaft des ursprünglichen, überwiegend seriell arbeitenden Modells, Wortfrequenzeffekte gut erklären zu können (vgl. Lively et al. 1994).

(ii)

Aktivierungsmodelle

Im Gegensatz zu der schrittweisen Wortverarbeitung in Suchmodellen wird in Aktivierungsmodellen von einer massiv parallelen Aktivierung der möglichen Kandidaten ausgegangen. Die Aktivierungsmodelle, zu denen auch die aktuellen konnektionistischen Wortverarbeitungsmodelle zählen, basieren zu großen Teilen auf dem von Morton (1969, 1970, 1982) entwickelten LOGOGEN-MODELL, dessen Worterkennungskomponenten in Abbildung 2 illustriert sind. auditory input

visual input

Abbildung 2: Die Worterkennungskomponenten in Mortons Logogenmodell (nach Morton 1970)

Jedes Wort ist in diesem Modell durch einen unabhängigen Eintrag, das sogenannte LOGOGEN, repräsentiert. In den Logogenen sind die orthographischen, phonologischen, syntaktischen und semantischen Informationen eines Wortes enthalten. Logogene prüfen das eintreffende (auditorische oder visuelle) Signal im Hinblick auf relevante Informationen und sammeln sie an. Dadurch steigt der Aktivierungsgrad des Logogens. Überschreiten die gesammelten Informationen schließlich einen bestimmten Grenzwert, wird das Logogen für das kognitive System verfügbar. Der spezifische Grenzwert, den ein Logogen annimmt, kann dabei unterschiedlich hoch sein. Da für die Logogene von relativ hochfrequenten

15 Wörtern angenommen wird, daß ihr Grenzwert relativ niedrig ist, werden für die endgültige Aktivierung eines hochfrequenten Logogens weniger Informationen benötigt als für die Aktivierung eines niedrigfrequenten. Somit werden auch diese Modelle den in zahlreichen empirischen Studien beobachteten Wortfrequenzeffekten gerecht.

1.3.2 Korpusfrequenz und weitere Variablen bei der Erkennung isolierter Wörter Nahezu alle Forscher, die sich mit der Erkennung von Wörtern befassen, betrachten die Frequenz eines Wortes als eine entscheidende Variable für seine Verarbeitung. Die Frequenzangaben basieren in der Regel auf einem Sprachkorpus, in dem eine große Anzahl von Wörtern aus verschiedenen Medien gesammelt worden ist. Bei der Nutzung eines solchen Korpus sind jedoch einige besondere Umstände zu berücksichtigen. So sollen korpusbasierte Frequenzangaben ein Maß für die durchschnittliche Erscheinenshäufigkeit eines Wortes innerhalb einer Sprachgemeinschaft liefern, sind aber stets abhängig von dem zugrundeliegenden Datenmaterial. Beispielweise basiert das vielen englischen Studien zugrundeliegende Korpus von Kucera und Francis (1967) ausschließlich auf geschriebener Sprache. Das CELEX-Korpus (Baayen et al. 1993), das den deutschen Studien, von denen in dieser Arbeit berichtet wird, zugrunde liegt, berücksichtigt zwar auch gesprochene Sprache, allerdings enthält die Datenquelle für gesprochene Sprache (das sog. Freiburger Korpus) nur 600.000 Einträge und ist damit auch im CELEX-Korpus gegenüber 5,4 Millionen Einträgen für geschriebene Sprache deutlich unterrepräsentiert. Zudem wird in den verschiedenen Korpora, die für Reaktionszeitstudien benutzt werden, nicht berücksichtigt, wie häufig die verschiedenen als Datenquelle ausgewerteten Medien konsumiert werden (zum Beispiel hat "Die Zeit", eine im CELEX-Korpus ausgewertete Datenquelle, eine wesentlich geringere Auflage und wird von weniger deutschen Sprechern gelesen als "Bild"). Bis heute gibt es kein Korpus, das solche unterschiedlichen Nutzungsfrequenzen in statistisch abgesicherter Weise einbezieht. Damit ist das ausgewertete Datenmaterial oft nicht repräsentativ. Aufgrund dieser Erwägungen ist neben der korpusbasierten Wortfrequenz eine Anzahl weiterer Variablen vorgeschlagen worden, über deren zusätzliche Rolle bei der Worterkennung diskutiert wird. Eine solche Variable ist zum Beispiel das Ausmaß, in dem eine Versuchsperson mit dem zu erkennenden Wort vertraut ist. Unter VERTRAUTHEIT (familiarity) kann die persönliche Gebrauchsfrequenz eines Wortes für ein Individuum verstanden werden. Bei hochfrequenten Wörtern korreliert diese individuelle Vertrautheit im allgemeinen stark mit der objektiveren Korpusfrequenz, bei niedrigfrequenten Wörtern sind hier allerdings erhebliche Unterschiede zu beobachten. So sind viele niedrigfrequente Wörter (z.B. Raupe, Feile, Kajüte, Robbe, Strähne, Tastatur, CELEX-Frequenz 5) einem durchschnittlichen deutschen Sprecher vertrauter als andere mit denselben CELEX-Frequenzangaben (z.B. Ahle, Tirade, Animosität, Enklave, Nymphe). Darüber hinaus gibt es große individuelle Unterschiede in der Gebrauchsfrequenz einzelner Wörter, die z.B. von der Schulbildung oder dem im Beruf benutzten Fachvokabular abhängen. Dementsprechend ist argumentiert worden, daß die zugrundeliegende Variable, die die Verarbeitungsgeschwindigkeit eines Wortes beeinflußt, nicht die in einem Sprachkorpus dokumentierte Frequenz, sondern seine individuelle Vertrautheit ist (z.B. Gernsbacher 1984, Nusbaum et al. 1984). Diese Ansicht wird durch eine Studie von Nusbaum und

16 Dedina (1985) unterstützt, die in lexikalischen Entscheidungsaufgaben und Benennungsaufgaben Vertrautheitseffekte unabhängig von korpusbasierten Wortfrequenzen beobachten konnten. Einige Forscher berücksichtigen deshalb zusätzlich zu oder anstelle von korpusbasierten Frequenzangaben die subjektiven Beurteilungsraten der einzelnen Versuchspersonen hinsichtlich ihrer Vertrautheit mit den experimentell zu untersuchenden Wörtern (z.B. Boles 1983, Gemsbacher 1984, Nusbaum et al. 1984, Schreuder & Baayen 1997). Andere Forscher (Brown & Watson 1987, Morrison et al. 1992) gehen von der Annahme aus, daß ein Wort umso vertrauter ist, je früher es erworben wird. Sie sehen deshalb im ERWERBSALTER (age of acquisition) die entscheidende Variable für die Verarbeitungsgeschwindigkeit eines Wortes. Zwar korreliert auch diese Variable stark mit der Korpusfrequenz, da hochfrequente Wörter im allgemeinen früher erworben werden als niedrigfrequente, aber auch hier gibt es Abweichungen. Harley (1995) nennt als Beispiel das Wort giant 'Riese', das verhältnismäßig früh gelernt wird, obwohl es im Wortschatz eines englischsprechenden Erwachsenen relativ niedrigfrequent ist. Eine weitere Variable, die für die Erkennung eines Wortes in Betracht gezogen worden ist, ist die KONKRETHEIT seiner Bedeutung. Vor allen Dingen im niedrigen Frequenzbereich sind Verarbeitungsvorteile für konkrete Wörter im Gegensatz zu abstrakten Wörtern mit der gleichen Frequenz beobachtet worden (James 1975, Kroll & Merves 1986, Bleasdale 1987, de Groot 1989). Wie Balota (1994) betont, waren die beobachteten Effekte allerdings eng mit der Vertrautheit eines Wortes konrundiert. Auch formale Faktoren wie beispielsweise die LÄNGE eines Wortes beeinflussen möglicherweise seine Erkennungszeit. Es herrscht allerdings Uneinigkeit darüber, ob die Länge eines Wortes nach der Anzahl der Buchstaben, der Anzahl der Silben oder der Länge der Aussprechdauer gemessen werden soll (Henderson 1982, Harley 1995). Gough (1972) argumentiert, daß jeder Buchstabe die Erkennungszeit eines visuell präsentierten Wortes um 15 msek verlängert. Ähnlich beobachteten Alegre und Gordon (1999) in einer Serie lexikalischer Entscheidungsaufgaben einen durchschnittlichen Anstieg der Reaktionszeiten von 9 msek pro Buchstabe. In anderen lexikalischen Entscheidungsaufgaben konnte solch ein Längeneffekt, sofern er nicht mit der Wortfrequenz konfundiert war, allerdings nicht nachgewiesen werden (Henderson 1982). In Benennungsaufgaben erwiesen sich Längeneffekte dagegen als stabiler. Verschiedene Untersuchungen (z.B. Eriksen et al. 1970, Forster & Chambers 1973) haben gezeigt, daß die Benennungszeit eines Wortes mit der Anzahl der Silben ansteigt. Dies scheint jedoch keine Reflektion eines erschwerten Wortzugriffs zu sein, sondern deutet vielmehr darauf hin, daß die Aktivierung der Sprechsilben zur Vorbereitung der lautlichen Antwort eine gewisse Zeit beansprucht. Ähnliche silbenabhängige Längeneffekte konnten nämlich auch dann beobachtet werden, wenn die Aufgabe der Versuchspersonen darin bestand, Bilder (z.B. die Abbildung eines Hauses vs. die Abbildung eines Aschenbechers) oder Zahlen (z.B. '77' vs. '16') zu benennen, was eine unterschiedliche Silbenzahl in der Antwort verlangte. Weitere Faktoren, die als beeinflussend für die Worterkennung in Betracht gezogen werden, sind beispielsweise seine syntaktische Kategorie (West & Stanovich 1986) oder die Frequenz der einzelnen Buchstaben (Appelman & Mayzner 1981). Schließlich ist auch dafür argumentiert worden, daß die Erkennungszeit eines Wortes von der Anzahl seiner Bedeutungen abhängt. Diese Annahme beruht auf Studien, in denen englische homographische Wörter (z.B. organ Orgel', Organ') kürzere Erkennungszeiten als nicht-homographische Wörter produzierten (Kellas et al. 1988, Balota & Ferraro 1993).

17

Die Liste der Faktoren, durch welche die Erkennung eines Wortes möglicherweise beeinflußt wird, ist mit den hier angeführten Beispielen allerdings nicht erschöpft. So nennt Rubin (1980) in einer Überblicksarbeit insgesamt 51 (!) verschiedene Eigenschaften, durch die sich Wörter systematisch voneinander unterscheiden können. Insgesamt liegen bisher allerdings keine verläßlichen Erkenntnisse vor, inwieweit all diese Variablen zusätzlich zu der korpusbasierten Frequenz die Erkennungszeiten eines Wortes modulieren. Bei der Konstruktion und praktischen Durchführung bzw. der Interpretation von Reaktionszeitexperimenten sollten sie jedoch nicht außer acht gelassen werden. So ist es vor allem ratsam, als Testitems nur solche Wörter zu wählen, deren Frequenzangabe der subjektiven Einschätzung nicht zuwiderläuft. Sowohl bei der Auswahl der Items als auch bei der Auswahl der Versuchspersonen sollte außerdem auf eine genügend homogene bzw. ausreichend große Stichprobengröße geachtet werden.

Nachbarschaftseffekte Einige Studien weisen darauf hin, daß neben den Eigenschaften eines Wortes selbst möglicherweise auch die phonologische bzw. orthographische Beziehung des betreffenden Wortes mit anderen Wörtern die Erkennung entscheidend mitbeeinflußt. Auf diesen Effekt wird in der Literatur auch als LEXIKALISCHER ÄHNLICHKEITSEFFEKT (lexical similarity) oder NACHBARSCHAFTSEFFEKT (neighbourhood effect) Bezug genommen. Um diesen Effekt quantitativ zu bestimmen, haben Coltheart et al. (1976, 1977) das Maß N (für neighbourhood) eingeführt. N bezieht sich dabei auf die Anzahl (7y/?e-Frequenz) von Wörtern, die durch die Vertauschung eines Segments erzeugt werden können. Orthographische Nachbarn für das Wort Mitte sind z.B. Miete, Motte, Matte, Sitte oder Bitte, ein zusätzlicher phonologischer Nachbar ist Minne. In verschiedenen Studien konnte ein Einfluß des Nachbarschaftseffekts auf die Worterkennung nachgewiesen werden. Allerdings ist dieser Effekt methodenspezifisch unterschiedlich. Während ein hoher N-Wert, also eine dichte Nachbarschaft, in Identifizierungsaufgaben einen hemmenden Einfluß auf die Worterkennung hatte (Pisoni et al. 1985, Luce et al. 1990), berichtet Andrews (1989, 1992) von kürzeren Reaktionszeiten auf niedrigfrequente Wörter mit dichten Nachbarschaften in Benennungsaufgaben und lexikalischen Entscheidungsaufgaben. Für hochfrequente Wörter gab es diesen Erkennungsvorteil nicht. Andere Forscher nehmen an, daß nicht die Type-Frequenz der Nachbarschaft die Erkennung eines Wortes beeinflußt, sondern die Gebrauchsfrequenz (7b£e/7-Frequenz) ähnlicher Wörter. So berichten Grainger et al. (1989), Grainger (1990) und Grainger und Segui (1990) über längere Erkennungszeiten in lexikalischen Entscheidungsaufgaben, wenn das zu beurteilende Stimuluswort einen LEXIKALISCHEN KONKURRENTEN (lexical competitor) hatte, d.h. einem Wort ähnelte, das eine höhere Frequenz aufwies. Von dritter Seite wird schließlich angenommen, daß beide Nachbarschaftsfaktoren, sowohl die Type- als auch die Token-Frequenz, die Worterkennung beeinflussen. So konnte Luce (1986) in Identifizierungsaufgaben und in lexikalischen Entscheidungsaufgaben zeigen, daß zusätzlich zu der Dichte der Nachbarschaft auch die Token-Frequenzen ihrer Mitglieder die Ergebnisse signifikant mitbestimmten. Nachbarschaftseffekte werden von Vertretern KONNEKTIONISTISCHER MODELLE (z.B. Seidenberg & McClelland 1989, s. dazu Abschnitt 3.1) oft als Evidenz gegen die seriellen

18

Suchmodelle (Forster 1976, 1989, Taft & Forster 1976) angeführt, da diese voraussagen würden, daß die Suche nach niedrigfrequenten Items in dichten Nachbarschaften besonders lange dauert. Dies ist aber genau das gegenteilige Muster der Ergebnisse von Andrews (1989, 1992), die von kürzeren Reaktionszeiten auf niedrigfrequente Wörter aus dichten Nachbarschaften berichtet. Obwohl konnektionistische Modelle (z.B. McClelland & Rumelhart 1986, Seidenberg & McClelland 1989) damit besser als serielle Modelle in der Lage sind, einige Nachbarschaftseffekte zu erklären, stoßen sie allerdings bei der Interpretation anderer Ergebnisse auf Schwierigkeiten. Zum Beispiel kann nicht erklärt werden, warum der von Andrews berichtete Erkennungsvorteil nur auf niedrigfrequente Wörter zutrifft, aber nicht auf hochfrequente. Andrews (1992) und Besner et al. (1990) machen außerdem darauf aufmerksam, daß sich ein Nachbarschaftseffekt auf phonologischer bzw. orthographischer Basis, wie er in konnektionistischen Modellen angenommen wird, auch bei den Reaktionszeiten auf Pseudowörter zeigen sollte, da dichte Nachbarschaften existierender Wörter auch die Beurteilung dieser Items beeinflussen sollten. Solch ein Effekt konnte jedoch in keiner Studie beobachtet werden. Aber auch für die Erkennung existierender Wörter gilt der Einfluß der Nachbarschaft keineswegs als gesichert. So konnten Alegre und Gordon (1999) in einer neueren Serie lexikalischer Entscheidungsaufgaben keinerlei Einfluß eines Nachbarschaftseffekts auf die Erkennungszeiten regulär flektierter Wörter beobachten.

l .3.3 Auditorische und visuelle Worterkennung Zwischen gesprochener Sprache und geschriebener Sprache bestehen grundlegende Unterschiede. Zu den wichtigsten gehört erstens, daß gesprochene Sprache in der Regel nur einmal präsentiert wird und kurzlebig ist, wogegen geschriebene Sprache, z.B. zur Reanalyse bei auftauchenden Ambiguitäten, mehrmals gelesen werden kann. Zweitens sind die Segmente eines geschriebenen Sprachsignals wesentlich konstanter als die eines gesprochenen, das mit verschiedenen Sprechern, Sprechgeschwindigkeiten oder phonologischen Umgebungen variieren kann. Drittens sind lexikalische Einheiten in der geschriebenen Sprache deutlich voneinander getrennt, wogegen das gesprochene Sprachsignal kontinuierlich ist. Schließlich wird das akustische Signal einer gesprochenen sprachlichen Einheit fortlaufend vom Anfang bis zum Ende aufgenommen, besitzt also eine zeitliche Dimension, wogegen das visuelle Signal einer geschriebenen sprachlichen Einheit eine räumliche Dimension hat (vgl. Lively et al. 1994). Die ersten drei genannten Unterschiede kommen vor allem dann zum Tragen, wenn die zu verarbeitenden sprachlichen Einheiten über die Wortgrenze hinausgehen. Für die Erkennung einzelner, in Isolation und unter experimentellen Bedingungen präsentierter Wörter ist dagegen vor allem der letzte Punkt von unmittelbarer Relevanz. Wenn beispielsweise der Einfluß von Strukturen unterhalb der Wortgrenze bei der auditorischen Worterkennung beurteilt werden soll, sollte daher nicht außer acht gelassen werden, daß das akustische Signal kontinuierlich vom Wortanfang bis zum Wortende wahrgenommen wird. Damit wird eine serielle Verarbeitung direkter vorgegeben als bei einem visuellen Sprachsignal, das - insbesondere, wenn es kurz ist - holistisch wahrgenommen werden kann. Die physikalische Beschaffenheit des Sprachsignals fördert damit möglicherweise für ein gesprochenes Wort eine fortlaufende konstituentenweise Verarbeitung.

19 Während allerdings eine große Anzahl von Studien die visuelle Worterkennung untersucht, ist die Anzahl der Studien, die sich mit der Erkennung gesprochener Wörter befaßt, relativ klein. Die meisten Modelle zur Erkennung gesprochener Wörter beruhen auf Modellen für visuelle Worterkennung, zum Beispiel auf dem AUTONOMOUS LEXICAL SEARCH Modell von Forster (1976, 1979, 1987, 1989) oder parallel arbeitenden, interaktiven Modellen wie dem LOGOGEN-Modell (Morton 1969, 1970, 1982) oder dem TRACE-Modell (Elman & McClelland 1986, McClelland & Elman 1986, McClelland 1991) und sind so abgewandelt worden, daß sie der akustisch-phonetischen Struktur des Inputs Rechnung tragen können. Eines der wenigen Modelle, die explizit für die Verarbeitung gesprochener Sprache entwickelt worden sind, ist das KOHORTENMODELL von Marslen-Wilson und seinen Kollegen (Marslen-Wilson & Welsh 1978, Marslen-Wilson & Tyler 1980, Marslen-Wilson 1987, 1990). Im Kohortenmodell wird von der Annahme ausgegangen, daß die Erkennung gesprochener Wörter ein kontinuierlicher Prozeß ist, während dem lexikalisch gespeicherte Repräsentationen schrittweise abgerufen werden. In einem ersten Schritt werden durch die anfänglichen akustischen Informationen des Input-Signals die lexikalischen Kandidaten aktiviert, die mit diesem Signal übereinstimmen. Sie bilden die wortinitiale Kohorte. In einem zweiten Schritt werden diese Kandidaten.zu einem Selektionsmechanismus geschickt, der sensitiv für verschiedene Informationsquellen ist, z.B. den weiteren akustisch-phonetischen Input, die Wortfrequenz und den syntaktisch-semantischen Kontext. Items, die mit diesen Informationen übereinstimmen, bleiben aktiviert, während die Aktivierungsgrade der unpassenden Items nach und nach abnehmen. Obwohl das Kohortenmodell parallel arbeitet, kann es so dem zeitlichen Ablauf eines gesprochenen Sprachsignals gerecht werden.

l .4

Reaktionszeitexperimente zur Erkennung von Wörtern im Kontext

Während in einfachen Benennungs- und Entscheidungsaufgaben das zu untersuchende Wort isoliert erscheint, wird in Primingexperimenten das ZIELWORT (im folgenden TARGET), auf das die Versuchsperson reagieren soll, im Kontext eines BAHNUNGSWORTES (im folgenden PRIME) präsentiert. Gegenüber der isolierten Präsentation einzelner Wörter entspricht dies mehr den Gegebenheiten in natürlicher Sprache, in denen Wörter typischerweise ebenfalls im Kontext anderen sprachlichen Materials erscheinen. Daß der Kontext die Erkennung eines Wortes beeinflussen kann, hat sich seit Meyer und Schvaneveldt (1971) in zahllosen Primingstudien gezeigt. Durch die systematische Manipulation des Kontextes, also der Beziehung zwischen Prime und Target, können dabei Rückschlüsse über die Architektur des Worterkennungssystems gewonnen werden. Generell sind die Ergebnisse eines Primingexperiments weniger direkt von lexikalischen Variablen wie Frequenz, Konkretheit oder Nachbarschaft beeinflußt als die Ergebnisse aus lexikalischen Entscheidungsaufgaben, da in einem Primingexperiment nicht zwei verschiedene Formen direkt miteinander verglichen werden. Vielmehr werden Primingeffekte innerhalb von Target-Sets gemessen, d.h. durch den Vergleich der Reaktionszeiten auf dasselbe Target nach der Präsentation verschiedener Primes. Anhand der beobachteten Da-

20

ten kann dann beurteilt werden, ob die vorherige Präsentation des Primes auf die Erkennung des Targets eine erleichternde (facilitation) oder eine erschwerende Wirkung (inhibition) gehabt hat. Aus diesen Primingeffekten kann dann auf den Grad der Verbundenheit des Primes mit seinem Target geschlossen werden. Auf dem Forschungsgebiet der Worterkennung, insbesondere wenn Aufschluß über mental repräsentierte Strukturen gewonnen werden soll, haben sich Primingexperimente daher als die etablierteste Methode erwiesen. In methodischer Hinsicht ist ein breites Spektrum verschiedener Varianten der Primingaufgabe entwickelt worden.

1.4.1 Methodische Variationen in Primingexperimenten Die Aufgabe der Versuchsperson in Primingexperimenten kann, wie oben beschrieben, entweder die Benennung des präsentierten Wortes oder eine lexikalische Entscheidung sein. Darüber hinaus variieren Primingexperimente im Hinblick auf die Präsentationsmodalität der Stimuli. Die am häufigsten benutzte Methode sind unimodal-visuelle Primingexperimente, in denen sowohl Prime als auch Target visuell präsentiert werden (für einen Überblick s. Neely 1991). Daneben wird aber auch von der Möglichkeit Gebrauch gemacht, beide Stimuli akustisch zu präsentieren (z.B. Kempley & Morton 1982, Slowiaczek & Pisoni 1986). Prime und Target können darüber hinaus der Versuchsperson auch in verschiedenen Modalitäten (cross-modal) dargeboten werden. Diese Methode wird vor allem dann herangezogen, wenn formale Ähnlichkeitseffekte zwischen Prime und Target auf ein Mindestmaß reduziert werden sollen (Marslen-Wilson & Zwitserlood 1989, MarslenWilson et al. 1994, Orsolini & Marslen-Wilson 1997, Sonnenstuhl et al. 1999, Clahsen et al. 200la, Sonnenstuhl & Huth 2002). Eine weitere methodische Variable in Primingstudien ist die Zeit, die zwischen dem Ende der Präsentation des Primes und dem Beginn der Präsentation des Targets (interstimulus-interval, ISI) liegt. Dieses ISI variiert in den verschiedenen Primingstudien von 48 Items zwischen Prime und Target (Fowler et al. 1985) bis zu null (immediate repetition). Eine in den letzten Jahren häufig benutzte Variante in visuellen Primingstudien ist das SUBLIMINALE Priming (auch maskiertes oder masked Priming), in denen der Prime innerhalb einer Maske aus anderen Zeichen so kurz präsentiert wird, daß er von der Versuchsperson nur unbewußt wahrgenommen werden kann. Da in diesen Studien die Präsentationsdauer des Primes selbst eine ausschlaggebende Rolle spielt, wird anstelle des ISI die Zeit ab dem Beginn der Primepräsentation bis zum Beginn der Targetpräsentation variiert (stimulus-onset-asynchrony, SOA).3 Als abhängige Variablen werden in Primingexperimenten die Reaktionszeiten und (bei lexikalischen Entscheidungen) die Fehlerraten gemessen. Zusätzlich können auch Gehirnstrommessungen durchgeführt werden (Holcomb & Neville 1990, Münte et al. 1999). In Primingexperimenten läßt sich der Einfluß der unterschiedlichsten lexikalischen Variablen untersuchen. Stellt sich beispielsweise heraus, daß die orthographische Form eines

Häufig wird auch bei längeren Intervallen zwischen Prime und Target die SOA angegeben, obwohl die Zeit zwischen dem Ende der Prime- und dem Beginn der Targetpräsentation gemeint ist. Bei relativ langen Intervallen ist der Unterschied zwischen ISI und SOA jedoch zu vernachlässigen.

21

Primes (z.B. Märchen) die Erkennung eines orthographisch ähnlichen Wortes (z.B. Mädchen) erleichtert hat, könnte auf eine Verbundenheit der untersuchten Wörter auf orthographischer Ebene geschlossen werden. Aus einem Erleichterungseffekt für Targets, die ihrem Prime phonologisch ähnlich sind (z.B. mi:t9 - mita) könnte auf die Existenz einer phonologischen Verarbeitungsebene geschlossen werden. Ebenso läßt die Untersuchung von morphologisch verwandten Formen (z.B. Prüfung - prüfen) Rückschlüsse darauf zu, ob und inwieweit morphologische Strukturen im Lexikon repräsentiert sind. Auch morphologische Unterschiede zwischen verschiedenen Flexionsformen können unabhängig von ihren individuellen lexikalischen Eigenschaften untersucht werden. Über den Einfluß von phonologischen, orthographischen und semantischen Eigenschaften auf die Erkennung morphologisch verwandter Wörter in Primingstudien wird im weiteren Verlauf dieser Arbeit noch ausführlich eingegangen werden. Im folgenden soll daher nur über die Effekte berichtet werden, die für semantisch oder assoziativ verbundene Wortpaare beobachtet worden sind, die morphologisch nicht miteinander verwandt sind.

1.4.2 Semantisches und assoziatives Priming Semantische Primingeffekte gehören seit Meyer und Schvaneveldt (1971) zu den robustesten und wichtigsten Beobachtungen innerhalb der Worterkennungsforschung. In ihrer Studie konnten Meyer und Schvaneveldt beobachten, daß die vorherige Präsentation eines semantisch verwandten Primes die Erkennung eines Targets im Vergleich zu einer Kontrollbedingung, in der ein nicht-verwandtes Wort als Prime präsentiert wurde, erleichterte (2). (2)

Prime

Target

Effekt

Semantische Beziehung:

cat

dog

Erleichterung

Kontrolle:

pen

dog

Während es über die Beobachtung, daß Wörter besser erkannt werden, wenn sie in semantisch passenden Kontexten erscheinen, relativ wenig Kontroversen gibt, besteht Uneinigkeit über die Interpretation der semantischen Primingeffekte. Einige Forscher nehmen an, daß sie auf lexikalisch repräsentierte Beziehungen auf der Basis von gemeinsamen semantischen Merkmalen (Smith et al. 1974) oder hierarchischen semantischen Strukturen (Collins & Quillian 1969) hinweisen. In solchen Beziehungen stehen beispielsweise die Wörter Maus und Nagetier, da sie zahlreiche Semantische Merkmale gemeinsam haben und durch eine hierarchische Beziehung (Maus ist ein Hyponym von Nagetier) miteinander verbunden sind. Semantische Primingeffekte können aber auch rein assoziativ erklärt werden, d.h. auf der Basis des gemeinsamen Erscheinens. Ein Beispiel für eine solche assoziative Verknüpfung bilden die Wörter Maus und Käse, die zwar häufig zusammen erscheinen, aber nicht derselben semantischen Kategorie angehören (vgl. Balota 1994). In verschiedenen Studien hat man versucht, Semantische und assoziative Beziehungen getrennt zu untersuchen, indem man Wortpaare ausgewählt hat, die zwar von derselben semantischen Kategorie sind, aber relativ selten zusammen erscheinen, z.B. Socke und Jacke. Die Ergebnisse zeigten, daß auch für solche Paare Primingeffekte im Vergleich zu einer Kontrollbedingung (Pflanze - Jacke) beobachtbar sind (Palermo & Jenkins 1964, Lupker

22 1984, Schleuder et al. 1984, Seidenberg et al. 1984). Im Vergleich zu Paaren, die auch assoziativ miteinander verbunden waren (Hemd - Jacke) waren die Ergebnisse jedoch aufgabenspezifisch unterschiedlich. Während der Primingeffekt für Paare wie Socke - Jacke in Primingexperimenten mit lexikalischen Entscheidungsaufgaben ebenso groß war wie für Paare vom Typ Hemd - Jacke (Lorch et al. 1986, Neely et al. 1989), war er in Benennungsaufgaben deutlich reduziert. Die methodenspezifisch unterschiedlichen Ergebnisse werden von verschiedenen Forschern (z.B. Forster 1999) damit erklärt, daß semantische Primingeffekte in lexikalischen Entscheidungsaufgaben, zumindest teilweise, strategisch bedingten Effekten zuzuschreiben sind: Hiernach nutzen Versuchspersonen die Tatsache aus, daß semantisch verwandte Paare stets eine positive Wortentscheidung verlangen (während dies für Wort-Pseudowort-Paare nie der Fall ist). Die Versuchspersonen achten daher in lexikalischen Entscheidungsaufgaben möglicherweise stärker auf die semantischen Beziehungen zwischen Prime und Target. Um solche strategisch bedingten Effekte zu vermeiden, schlägt Neely (1989) vor, den Anteil an verwandten Paaren in Primingstudien mit lexikalischen Entscheidungsaufgaben gering zu halten. Insgesamt konnte über die Frage, ob es unabhängig von rein assoziativem Priming auch rein semantisches Priming gibt, das seinen Ursprung in lexikalisch repräsentierten semantischen Merkmalen hat, bis heute keine Einigkeit erzielt werden. Befürworter des rein semantischen Primings argumentieren, daß die abgestuften Effekte aus den einschlägigen Primingstudien auf einen additiven Effekt hindeuten, der sowohl durch rein semantisches als auch assoziatives Priming zustande kommt. In der Literatur ist daher häufig der Terminus SEMANTISCH-ASSOZIATIVES PRIMING zu finden. Befürworter des rein assoziativen Primings führen den (reduzierten) Primingeffekt für Wortpaare wie Socke - Jacke dagegen auf restliche Assoziationen zurück, da ein Wortpaar wie Socke - Jacke immer noch häufiger zusammen erscheint als ein Wortpaar wie Pflanze -Jacke (vgl. Balota 1994).

1.4.3

Indirekte Primingeffekte

Methodenspezifische Unterschiede, wie sie in den oben beschrieben Primingstudien zu semantischem und assoziativem Priming beobachtet worden sind, haben sich auch in Studien, in denen INDIREKTE PRIMINGEFFEKTE untersucht wurden, bestätigt. Unter indirektem (mediated) Priming wird das Phänomen verstanden, daß ein Wort (z.B. Löwe) die Erkennung eines anderen (Streifen) erleichtert, obwohl die beiden Wörter in keiner direkten Beziehung miteinander stehen, sondern nur über ein drittes, nicht präsentiertes Wort (Tiger) miteinander verbunden sind. In lexikalischen Entscheidungsaufgaben, in denen die Versuchsperson entweder (i) sowohl auf den Prime als auch auf das Target reagierte oder (ii) nur eine Antwort auf die Wort-Targets, nicht aber auf die Pseudowort-Targets gab, wurden deutlich ausgeprägte indirekte Primingeffekte beobachtet (McNamara & Altarriba 1988). Ebenso deutliche indirekte Primingeffekte gab es in Benennungsaufgaben (Balota & Lorch 1986). Dagegen wurde in lexikalischen Entscheidungsaufgaben, in denen die Versuchsperson (iii) nie auf den Prime, aber stets auf das Target reagieren sollte, kaum Evidenz für indirektes Priming festgestellt (de Groot 1983, Balota & Lorch 1986).

23 Auch diese unterschiedlichen Ergebnisse scheinen auf das Wirken strategiebedingter Effekte zurückzuführen zu sein: In der Variante (iii) der lexikalischen Entscheidungsaufgabe ist die Paarstruktur deutlicher vorgegeben als in den anderen Varianten oder in Benennungsaufgaben. Verschiedene Forscher (Balota & Lorch 1986, McNamara & Altaniba 1988, Neely 1991) argumentieren, daß die Versuchsperson aufgrund dieser Struktur veranlaßt wird, die präsentierten Wortpaare im Hinblick auf gemeinsame semantische Merkmale zu überprüfen. Bei indirekt verwandten Paaren wie Löwe - Streifen gibt es keine gemeinsamen Merkmale, und daher auch keinen Primingeffekt. Ist diese Paarstruktur allerdings, wie in den Aufgabenvarianten (i) und (ii) oder in Benennungsaufgaben, aufgehoben, sind keine Paare mehr identifizierbar, die geprüft werden können, und der indirekte Primingeffekt wird sichtbar.

l .4.4 Primingeffekte und weitere beeinflussende Faktoren Durch das intensive Studium von Primingeffekten ist neben den oben geschilderten Faktoren noch eine Anzahl weiterer Variablen entdeckt worden, die den Zugriff auf ein Wort beeinflussen und auch in anderen Primingstudien Berücksichtigung finden sollten. Hierzu zählen beispielsweise die Beobachtungen, daß Primingeffekte für niedrigfrequente Wörter größer sind als für hochfrequente (Becker 1979, Forster & Davis 1984), Primingeffekte für degradierte Primes größer sind als für deutlich präsentierte (Becker & Killion 1977, Borowsky & Besner 1991), und Primingeffekte größer sind, wenn die Stimulusliste einen großen Anteil verwandter Wortpaare enthält (Neely et al. 1989, Keefe & Neely 1990). Dieser Effekt steigt mit zunehmender SOA an (den Heyer et al. 1983). Darüber hinaus sind RÜCKWÄRTS GERICHTETE PRIMINGEFFEKTE (backward priming) beobachtet worden. So gibt es Evidenz dafür, daß der Prime die Erkennung eines semantisch-assoziativ verbundenen Targets erleichtert, obwohl er kurz nach dem Target präsentiert wird (Kiger & Glass 1983, Balota et al. 1989). Dieser Befund deutet darauf hin, daß die Wortverarbeitung schrittweise geschieht, da die Versuchsperson in einem frühen Stadium der Targeterkennung noch offen für weitere Informationen zu sein scheint, welche die Verarbeitung erleichtern. Außerdem sind für Wortpaare, die eine gerichtete semantisch-assoziative Beziehung enthalten (Fenster - Bank), aber in der umgekehrten Richtung präsentiert wurden (Bank Fenster) Primingeffekte beobachtet worden (Koriat 1981, Seidenberg et al. 1984). Allerdings trat dieser Effekt nur in lexikalischen Entscheidungsaufgaben auf, nicht jedoch in Benennungsaufgaben (Seidenberg et al. 1984). Auch dieser methodenspezifische Unterschied deutet nach Neely (1991) möglicherweise daraufhin, daß in lexikalischen Entscheidungsaufgaben intensiver nach einer Beziehung des Primes mit seinem Target gesucht wird als in Benennungsaufgaben.

24

1.4.5 Bewußtes und automatisches Printing Die oben beschriebenen Beispiele für Primingeffekte zeigen, daß zahlreiche Faktoren in der Lage sind, die Ergebnisse von Primingaufgaben zu beeinflussen. Da einige dieser Faktoren strategiebedingt zu sein scheinen, taucht die grundlegende Frage auf, ob der Mechanismus des Primings ein automatischer oder ein bewußter Prozeß ist. Nach Charakterisierungen von Posner und Snyder (1975) und Schneider und Shriffin (1977) laufen automatische Prozesse schnell und parallel ab und beanspruchen keinen Platz im Arbeitsgedächtnis. Da sie sich der bewußten Kontrolle und Aufmerksamkeit entziehen, können sie bewußt weder verhindert noch forciert werden. Im Gegensatz dazu sind bewußte Prozesse relativ langsam, laufen schrittweise ab und involvieren das Gedächtnis. Durch Aufmerksamkeit können sie gefördert, durch Ablenkung verhindert werden. Auch sind die Ergebnisse aufmerksarnkeitsgesteuerter Prozesse in der Regel (aber nicht notwendigerweise) dem Bewußtsein zugänglich (vgl. Harley 1995). (i)

Bewußtes Priming

Befürworter der Annahme, daß Priming ein bewußter Prozeß ist, interpretieren die erleichterte Erkennung eines mit dem Prime semantisch verwandten Targets vor allem als ERWARTUNGSEFFEKT (expectancy effect), den die Versuchspersonen aufgrund des Primes auf das zu erwartende, semantisch verwandte Target generiert (Becker 1980, Balota 1983). Gemäß dieser Vorstellung reflektieren Primingeffekte die Wahrscheinlichkeit, mit dem ein Zielwort korrekt vorhergesagt werden kann: Danach sind kürzere Antwortzeiten auf semantisch verwandte Targets im Vergleich zu einer Kontrollbedingung darauf zurückzuführen, daß das erwartete Wort tatsächlich erscheint. Da Erwartungseffekte allerdings von bewußter Aufmerksamkeit abhängen, sollten sie vor allem bei relativ langen SOAs auftreten. Dieser Vorhersage ging Neely (1977) in einer klassischen Primingstudie nach, in der er die Erwartungshaltung der Versuchspersonen durch unterschiedliche experimentelle Instruktionen manipulierte. Zum Beispiel wurde den Versuchsteilnehmern mitgeteilt, daß nach dem Wort body 'Körper' stets die Bezeichnung eines Hausteils folgen würde (z.B. door 'Tür'). Tatsächlich zeigte sich bei relativ langen SOAs (2000 msek) für das Target door ein Erleichterungseffekt gegenüber einer neutralen Bedingung (body - sparrow 'Spatz'), den Neely darauf zurückführte, daß die Erwartungen der Versuchspersonen erfüllt wurden. Folgte nach dem Prime body jedoch ein semantisch verwandtes, aber nicht erwartetes Target (z.B. heart 'Herz'), beobachtete Neely einen Inhibitionseffekt, den er als Reflektion der Diskrepanz zwischen erwartetem und tatsächlich präsentiertem Target interpretierte. Einen weiteren Erklärungsansatz für bewußte Prozesse während einer Primingaufgabe liefert die Annahme von EPISODISCHEN GEDÄCHTNISEFFEKTEN (episodic memory effects). Tenpenny (1995) hat gezeigt, daß episodische Gedächtniseffekte auf der Erinnerung der Versuchsperson an ein früheres ähnliches Ereignis basieren. Ebenso wie Erwartungseffekte entstehen auch diese Effekte vor allem bei einem relativ langen Intervall zwischen Prime und Target oder wenn die Versuchsperson, wie in den meisten unimodalen Primingexperimenten, auf beide Wörter eines Stimuluspaares in derselben Weise reagieren soll.

25 Nach diesen Erklärungsansätzen sagen bewußte semantische Primingeffekte allerdings nur wenig über Prozesse der Worterkennung aus, sondern reflektieren in erster Linie die Kapazität des Kurzzeitgedächtnisses oder die Wahrscheinlichkeit, mit dem ein Zielwort korrekt vorhergesagt werden kann.

(ii)

Automatisches Priming

Wesentlich interessanter für Theorien der Worterkennung ist die Frage, ob alle Primingeffekte mit bewußten Prozessen erklärt werden können, oder ob es darüber hinaus nicht auch Mechanismen gibt, die unabhängig von bewußter Aufmerksamkeit ablaufen und damit Einsicht in die unbewußten Strukturen des Worterkennungssystems geben können. Auch zur Klärung dieser Frage trug die oben erwähnte Primingstudie von Neely (1977) bei. Neely ging von der Annahme aus, daß die Effekte bewußter Prozesse vor allem bei relativ langen Intervallen zwischen Prime und Target auftreten, da sie immer eine gewisse Zeit beanspruchen. Das warf die Frage auf, ob es auch dann noch Primingeffekte geben würde, wenn die Versuchsperson keine Zeit hätte, bewußte Prozesse durchzuführen. Neely verkürzte daher in einem weiteren Experiment, das ansonsten völlig parallel zu dem ersten war, das Intervall zwischen Prime und Target drastisch auf 250 msek (gegenüber 2000 msek im ersten Durchlauf). Tatsächlich traten auch bei diesen extrem kurzen SOAs deutliche Primingeffekte auf, allerdings zeigten sie ein dem ersten Experiment entgegengesetztes Muster: Während sich für die Targets, die nach der Instruktion von den Versuchspersonen erwartet wurden (door nach body), kein Erleichterungseffekt gegenüber der neutralen Bedingung zeigte, konnte für die semantisch verwandten Wortpaare (body - heart) ein deutlicher Primingeffekt beobachtet werden. Zur Übersicht sind die beobachteten Effekte aus Neely (1977) in Tabelle 2 zusammengestellt. Prime - Target

semantische Beziehung

erwartetes Target

lange SOA (2000 msek)

kurze SOA (250 msek)

ja nein

Erleichterung

keine Erleichterung

Inhibition

Erleichterung

body

-

door

nein

body

-

heart

body

- sparrow

ja nein

nein

neutral

Tabelle 2: Primingeffekte bei unterschiedlichen SOAs in Neely (1977)

Diese Ergebnisse wurden als Evidenz dafür gewertet, daß in Primingexperimenten zwei unterschiedliche Arten von Prozessen wirksam sind. Zum einen gibt es bewußte Prozesse, die durch die Erwartung und die Aufmerksamkeit der Versuchsperson beeinflußt werden können (attentional priming). Erwartet die Versuchsperson zum Beispiel, daß dem Wort body die Bezeichnung eines Hausteils folgt, wird die Erkennung eines entsprechenden Targets erleichtert. Da bewußte Prozesse allerdings langsamer als automatische ablaufen, beeinflußt das Ergebnis bewußter Primingprozesse die Reaktionszeiten erst nach relativ langen SOAs. Daneben gibt es schnelle, automatische Prozesse, die unabhängig von der bewußten Kontrolle und damit unabhängig von bewußten Erwartungshaltungen sind. Die Ergebnisse dieser automatisch ablaufenden Prozesse (automatic priming) treten zum Beispiel

26

bei semantischer Verwandtschaft zwischen Prime und Target auf und werden bei kurzen SOAs sichtbar. Die Ergebnisse von Neely (1977), die Evidenz für das Wirken von einer automatischen und einer bewußten Primingroute in verschiedenen Zeitfenstern geliefert haben, wurden durch eine Reihe nachfolgender Untersuchungen (Antos 1979, de Groot 1984, Fischler & Bloom 1979, Hoffman & MacMillan 1985) unterstützt. Die üblichste Erklärung für automatische semantisch-assoziative Primingeffekte besteht in der Annahme, daß die kognitiven Repräsentationen der Primes und der Targets so miteinander verbunden sind, daß die Aktivierung des Primes automatisch die Aktivierung des Targets auslöst. Dieser Vorstellung entspricht die Theorie der AUTOMATISCHEN AKTIVIERUNGSAUSBREITUNG (automatic spreading activation), die auf das in Abschnitt 1.3.1, Punkt (ii) beschriebene LOGOGEN-Modell von Morton (1969, 1970) zurückgeht. Sie ist von Posner und Snyder (1975) weiter ausgearbeitet worden. In automatischen Aktivierungsmodellen ist das Lexikon in Knoten organisiert, die sich auf verschiedene semantische Konzepte beziehen. Diese konzeptuellen Knoten sind miteinander durch assoziative Pfade verbunden. Wird solch ein konzeptueller Knoten durch einen Prime aktiviert, breitet sich die Aktivierung von diesem Knoten über die assoziativen Pfade auf die benachbarten Knoten aus. Die kürzere Erkennungszeit des Wortes heart nach der Präsentation des Wortes body beruht danach auf der Aktivierung des Knotens BODY und der automatischen Aktivierungsausbreitung entlang eines starken assoziativen Pfades. Somit ist der Knoten HEART zum Zeitpunkt der Präsentation des Wortes heart bereits voraktiviert, und für seine endgültige Aktivierung ist weniger Information erforderlich als für einen Knoten, der nicht voraktiviert worden ist. Da der Aktivierungsmechanismus in diesen Modellen automatisch und somit unabhängig von bewußter Kontrolle ausgelöst wird, können mit ihm Primingeffekte bei sehr kurzen Intervallen zwischen Prime und Target oder bei subliminaler Präsentation des Primes gut erklärt werden. Indirekte Primingeffekte, die auch bei sehr kurzen SOAs beobachtet wurden, sprechen ebenfalls für eine schnelle und unbewußte Aktivierungsausbreitung.

l .4.6 Die Unterdrückung aufmerksamkeitsbedingter Primingeffekte Aus psycholinguistischer Perspektive ergibt sich aus der Erkenntnis, daß Effekte in Primingstudien auf bewußte Prozesse zurückgeführt werden können und daher möglicherweise mehr über strategische und gedächtnisbedingte Fähigkeiten als über Eigenschaften des Worterkennungssystems aussagen, die naheliegende Konsequenz, diese Prozesse weitgehend auszuschließen. Hierzu gibt es eine Reihe methodischer Möglichkeiten. Um das Auftreten von Erwartungseffekten in Primingstudien zu unterdrücken, kann der Prime beispielsweise subliminal präsentiert werden, wodurch er der bewußten Kontrolle der Versuchsperson entzogen ist. Ein andere Möglichkeit besteht darin, das Target so nahe wie möglich am Offset des Primes zu präsentieren, wodurch keine Zeit für die Entwicklung einer Erwartung besteht. Außerdem können mögliche Erwartungseffekte drastisch verringert werden, indem der Anteil der verwandten Wörter innerhalb der Experimentliste durch die Hinzufügung einer großen Anzahl nichtverwandter Wortpaare niedrig gehalten wird (den Heyer et al. 1983, Neely et al. 1989, Keefe & Neely 1990).

27

Ebenso können episodische Gedächtniseffekte durch die Auswahl einer geeigneten Experimentmethode erheblich reduziert oder ausgeschlossen werden. Zum Beispiel besteht bei subliminaler Präsentation des Primes oder modalitätsübergreifender Präsentation von Prime und Target durch die damit vorgegebene Paarstruktur die Möglichkeit, die Versuchspersonen nur auf das Target reagieren zu lassen. Damit ist ausgeschlossen, daß sie sich erinnern, auf den Prime in der derselben Weise reagiert zu haben. Ebenfalls ist ein sehr kurzes Intervall zwischen Prime und Target, z.B. die Präsentation des Targets unmittelbar am Offset des Primes, dazu geeignet, die Entstehung von episodischen Gedächtniseffekten weitgehend zu reduzieren.

Modalitätsübergreifendes unmittelbares Priming Diese Beispiele zeigen, daß durch geeignete methodische Verfahren bewußte Prozesse in Primingexperimenten unterdrückt und automatische Effekte sichergestellt werden können. Damit ist allerdings immer noch nicht gewährleistet, daß auftretende Effekte tatsächlich zentralen Eigenschaften des Worterkennungssystems zugeschrieben werden können, denn es besteht immer noch die Möglichkeit, daß Primingeffekte an oberflächlichen, formalen Ähnlichkeiten zwischen Prime und Target liegen können. So könnte ein Effekt für das Target singen nach der Präsentation des Primes klingen ebenso von der semantischen Verwandtschaft wie von der formalen Ähnlichkeit der beiden Wörter beeinflußt werden. Wie zahlreiche Studien gezeigt haben, treten solche formal bedingten Effekte auch bei sehr kurzen SOAs auf (z.B. Evett & Humphreys 1981, Forster & Davis 1984, Forster 1987, Feldman 1998). Der formale Faktor kann zwar in semantischen Primingstudien durch eine geeignete Auswahl der Testitems weitgehend vermieden bzw. kontrolliert werden, jedoch kann nicht ausgeschlossen werden, daß er in morphologischen Primingstudien, in denen sich Prime und Target stets formal ähnlich sind, das Ergebnismuster möglicherweise konfundiert. Zur Vermeidung bewußter und formal bedingter Effekte haben Marslen-Wilson und seine Kollegen (Marslen-Wilson & Zwitserlood 1989, Marslen-Wilson et al. 1994, Orsolüii & Marslen-Wilson 1997) die Methode des MODALITÄTSÜBERGREIFENDEN UNMITTELBAREN PRIMINGS (cross-modal immediate repetition priming) entwickelt. Diese Experimentmethode ist zur Untersuchung der morphologischen Beziehungen zwischen Einträgen im mentalen Lexikon aus den folgenden Gründen besonders gut geeignet: l.

In modalitätsübergreifenden Primingexperimenten wird der Prime auditorisch und das Target visuell präsentiert. Diese modalitätsübergreifende Präsentation der Stimuli hat den Vorteil, daß innerhalb eines Trials zwei Sinnesmodalitäten, nämlich der auditorische und der visuelle Kanal, angesprochen werden. Auftretende Primingeffekte können daher nicht an modalitätsspezifischen Ähnlichkeiten zwischen Prime und Target, die rein phonologische oder orthographische Mustervergleiche auf der Zugriffsebene ermöglichen könnten, liegen. Vielmehr ist davon auszugehen, daß ein modalitätsübergreifender Primingeffekt auf einem zuvor erfolgten Zugriff auf das Lexikon beruht, denn um Informationen von der einen in die andere Modalität zu transferieren, muß notwendigerweise auf die beiden Sinnesmodalitäten gemeinsame abstrakte Repräsentation im zentralen Lexikon zugegriffen worden sein.

28

2.

Die visuellen Targets erscheinen unmittelbar am Offset des auditorischen Primes. Durch diese extrem kurze SOA und durch die Aufgabe der Versuchsperson, die dem Prime zwar zuhört, aber nur auf das Target reagiert, können unerwünschte episodische Gedächtniseffekte und strategiebedingte Erwartungseffekte drastisch reduziert werden.

3.

Darüber hinaus gewährleistet die unmittelbare Präsentation des Targets am Offset des Primes, daß die Effekte von Verarbeitungsprozessen so nahe wie möglich am Zeitpunkt ihres Entstehens beobachtet werden können.

4.

In die Experimentliste wird eine relativ große Anzahl nichtverwandter Wortpaare aufgenommen. Dadurch wird der Anteil der verwandten Prime-Target-Paare sehr gering gehalten (in der Regel unter 15 %). Durch diesen relativ geringen Prozentsatz können strategiebedingte Erwartungseffekte weiter reduziert werden.

Die morphologischen Primingstudien, in denen die lexikalische Repräsentation deutscher Pluralformen untersucht wurde und die einen Teil des eigenen empirischen Anteils dieser Arbeit ausmachen, sind nach dem Vorbild dieses methodischen Paradigmas durchgeführt worden. Bevor jedoch diese spezifischen Untersuchungen weiter unten ausführlich beschrieben und diskutiert werden, möchte ich zunächst einen allgemeinen Überblick über die psycholinguistischen Vorstellungen zur Erkennung morphologisch komplexer Wörter geben und eine Auswahl entsprechender empirischer Befunde vorstellen.

Kapitel 2 Die Erkennung morphologisch komplexer Wörter: Theoretische Annahmen

2. l

Morphologie in der psycholinguistischen Forschung

Die Erkennung eines Wortes beginnt mit den frühen Verarbeitungsschritten der perzeptuellen Wahrnehmung, in denen Muster für Buchstaben oder Laute durch eine Zerlegung in primitive Merkmale (z.B. Linien, Winkel und Bögen bei Buchstaben; Stimmhaftigkeit, Sonorität und Nasalisierung bei Phonen) erkannt werden. In diesen ersten Stadien der Wortverarbeitung spielt die morphologische Struktur eines Wortes allerdings noch keine Rolle. Andererseits geht es in späten Stadien der Wortveraibeitung, sobald mit der Aktivierung des lexikalischen Eintrags die syntaktischen und semantischen Eigenschaften eines Wortes erkannt worden sind, vor allem um seine Integration in größere sprachliche Einheiten wie Phrasen und Sätze. Hier spielt seine interne Struktur keine wesentliche Rolle mehr. Die Worterkennungsprozesse, die ich hier diskutieren möchte, setzen daher nach den ersten perzeptuellen Wahrnehmungsprozessen ein und reichen bis zu der Aktivierung eines Eintrags im mentalen Lexikon. In diesen Stadien der Wortverarbeitung ist die Rolle der Morphologie von besonderer Relevanz. In aktuellen psycholinguistischen Theorien zur Worterkennung, sowohl in seriell organisierten Lexikonmodellen (z.B. Forster 1979) als auch in interaktiv-parallel arbeitenden Modellen (z.B. Morton 1970, 1979), wird zwischen MODALITÄTSSPEZIFISCHEN ZUGRIFFSREPRÄSENTATIONEN (access representations^ und gemeinsamen abstrakten, MODALITÄTSUNABHÄNGIGEN REPRÄSENTATIONEN im mentalen Lexikon unterschieden. Das mentale Lexikon hat für die Sprachfahigkeit eine zentrale Position, da auf seinen Inhalt sowohl während der Sprachproduktion als auch während der Sprachverarbeitung zugegriffen wird (vgl. Levelt et al. 1999). Lexikalische Repräsentationen werden daher auch als ZENTRALE REPRÄSENTATIONEN (central representations) bezeichnet. Modalitätsspezifische Zugriffsrepräsentationen vermitteln die Abbildung des konkreten (gesprochenen oder orthographischen) Inputs auf eine lexikalische Repräsentation im zentralen Lexikon. Unter LEXIKALISCHEM ZUGRIFF wird allgemein die Selektion eines spezifischen lexikalischen Eintrags im Lexikon verstanden (vgl. McQueen & Cutler 1998, Schriefers 1999). Zur Frage, inwieweit Zugriffsrepräsentationen morphologische Strukturen reflektieren, gibt es drei mögliche Auffassungen: (i)

1

Alle Wörter, sowohl monomorphemische als auch morphologisch komplexe, haben jeweils ihre eigene Vollformrepräsentation auf der Zugriffsebene. Morphologische Dekomposition auf der Zugriffsebene ist nicht erforderlich (z.B. Lukatela et al. 1980, Butterworth 1983, Fowler et al. 1985, Rumelhart & McClelland 1986, Andrews 1986, Der Begriff Zugriffsrepräsentation, den ich als Übersetzung des englischen Begriffs access representation verwenden werde, ist m.E. mißverständlich, denn hiermit ist nicht etwa der abstrakte lexikalische Eintrag gemeint, der das Ziel eines Zugriffsprozesses ist, sondern vielmehr die Repräsentation, mit deren Hilfe der eigentliche lexikalische Zugriff ermöglicht wird.

30 Feldman & Fowler 1987, Schreuder et al. 1990, MacWhinney & Leinbach 1991, Schriefers et al. 1991, Schriefers et al. 1992, Plunkett & Marchman 1993). (ii)

Nur Morpheme, d.h. Stämme und Affixe, aber keine Vollformen, haben eine spezifische Zugriffsrepräsentation. Diese Annahme impliziert, daß alle morphologisch komplexen Wörter in ihre morphologischen Konstituenten dekomponiert werden müssen, bevor ein lexikalischer Zugriff ermöglicht wird. Prälexikalisches morphologisches Parsing ist in Modellen, die diese Annahme vertreten, ein obligatorischer Bestandteil des Worterkennungsprozesses (z.B. Taft & Forster 1975, Taft 1979a, Taftetal. 1986).

(iii) Zugriffsrepräsentationen existieren sowohl für volle Formen als auch für Stämme und Affixe. Morphologische Dekomposition ist (in bestimmten Fällen) möglich, geschieht aber nicht zwangsläufig (z.B. Burani & Caramazza 1987, Caramazza et al. 1988, Pinker 1991, Clahsen et al. 1992, Frauenfelder & Schreuder 1992, Prasada & Pinker 1993, Pinker & Prince 1994, Marcus et al. 1995, Schreuder & Baayen 1995, Clahsen et al. 1997, Pinker 1997, Clahsen 1999, Sonnenstuhl et al. 1999). In bezug auf die Repräsentation morphologischer Strukturen im zentralen Lexikon gibt es vor allem zwei grundsätzlich unterschiedliche Auffassungen: (i)

Für die Repräsentation von Wörtern spielt ihre morphologische Struktur keine entscheidende Rolle. Die Beziehungen zwischen Einträgen im zentralen Lexikon sind rein assoziativ und beruhen auf formalen, statistischen oder semantischen Eigenschaften. Morphologische Beziehungen zwischen Einträgen sind nach dieser Auffassung reine Epiphänomene (z.B. Butterworth 1983, Rumelhart & McClelland 1986, MacWhinney & Leinbach 1991, Plunkett & Marchman 1993, Rueckl et al. 1997).

(ii)

Morphologische Strukturen sind eine wichtige Organisationsform im zentralen Lexikon. Die Repräsentationen komplexer Wörter spiegeln ihre morphologischen Eigenschaften wider. Modelle, die solche morphologischen Repräsentationen annehmen, unterscheiden sich darin, ob sie gemeinsame komplexe Einträge für Wortfamilien mit demselben Stamm annehmen (shared entry models) (z.B. Taft & Forster 1975, Taft 1979a, Taft et al. 1986, Marslen-Wilson et al. 1994), oder ob sie einzelne Einträge für jede Wortform annehmen (separate entry models) (z.B. Lukatela et al. 1980, Fowler et al. 1985, Andrews 1986, Feldman & Fowler 1987, Günther 1988, Schreuder et al. 1990, Grainger et al. 1991, Schriefers et al. 1991, Schriefersetal. 1992).

Diese verschiedenen theoretischen Annahmen zur Rolle der Morphologie bei der Wortverarbeitung liegen auch den verschiedenen psycholinguistischen Modellen zugrunde.

31

2.2

Worterkennungsmodelle

Ein zentraler Aspekt der psycholinguistischen Modelle zur Worterkennung ist die Relation zwischen gespeichertem Wissen und prozeduralem Aufwand. So wird in einer Klasse der Worterkennungsmodelle massive Speicherung von Vollformen aller morphologisch komplexen Wörter angenommen. Das für die Worterkennung benötigte prozedurale Wissen ist in diesen Modellen daher minimal. Einen entgegengesetzten Standpunkt nehmen Vertreter der Modelle ein, in denen lediglich die Speicherung von Morphemen angenommen wird. Damit wird die Menge des erforderlichen deklarativen Wissens minimal gehalten, was allerdings zu einem Anstieg an benötigtem prozeduralem Aufwand führt. So braucht zum Beispiel in Modellen, die gemeinsame Einträge für eine Familie komplexer Wörter annehmen, der Basisstamm nur einmal gespeichert zu werden. Diese ökonomische Speicherung hat allerdings den zusätzlichen prozeduralen Aufwand morphologischer Dekomposition zum Preis. Wesentliche Eigenschaften prominenter Wortverarbeitungsmodelle sollen im folgenden vorgestellt werden (zur Übersicht s. Tabelle 3, Seite 50). Im Anschluß daran wird untersucht, inwieweit die verschiedenen Modelle durch vorliegende empirische Befunde unterstützt werden.

2.2.1 Assoziative Lexikonmodelle Vertreter der ASSOZIATIVEN LEXIKONMODELLE nehmen an, daß jeder morphologischen Variante eines gegebenen Stamms eine eigene lexikalische Repräsentation zugeordnet ist. Sie werden deshalb auch häufig als FULL-LISTING Modelle bezeichnet. Charakteristisch für diese Modelle ist, daß Beziehungen zwischen morphologisch verwandten Formen auf rein assoziativen Relationen beruhen, die ihre Basis entweder in gemeinsamen semantischen (z.B. Butterworth 1983), formalen und statistischen (z.B. Rumelhart & McClelland 1986, Plunkett & Marchman 1993, Rueckl et al. 1997) oder formalen, statistischen und semantischen Eigenschaften (z.B. MacWhinney & Leinbach 1991) haben. In den konnektionistischen assoziativen Modellen werden morphologische Effekte bei der Worterkennung durch den Mechanismus der AKTIVIERUNGSAUSBREITUNG (activation spreading) erklärt, der von einem aktivierten Wort ausgeht und sich auf andere, mit ihm assoziativ verknüpfte, ausbreitet. Lexikalisch repräsentierte morphologische Strukturen spielen weder in den semantisch basierten noch in den formal und statistisch basierten konnektionistischen FULL-LISTING Modellen eine ernstzunehmende Rolle. Da ein separater Eintrag für jedes morphologisch komplexe Wort angenommen wird, gibt es auch kein prälexikalisches morphologisches Parsing. Ganz ohne morphologische Analyse kommen allerdings auch assoziative Worterkennungsmodelle nicht aus. Für die Fälle, in denen nicht auf einen Vollformeintrag zugegriffen werden kann, räumt zum Beispiel Butterworth (1983) ein:

32 „It is conceivable that LRs (= 'Lexical Representations') are routinely accessed from a full listing, but in certain circumstances - for new items, for items not accessible from the list for some other reason - the rules may serve as fall-back procedure." (Butterworth 1983:263) und

„The FLH (= 'Full Listing Hypothesis') is not incompatible with having 'fall-back procedures' when confronted by a new word, or the need to make-up a word when access to the full lists fails." (Butterworth 1983:290)

Zu den assoziativen Lexikonmodellen gehören auch die schemabasierten Ansätze von Bybee (1991, 1995) und - mit Einschränkungen - Kopeke (1993), die mit den konnektionistischen Ansätzen darin übereinstimmen, daß Beziehungen zwischen Wörtern auf rein assoziativen Mustern, sogenannten SCHEMATA, beruhen (s. Abbildung 3). Während für Kopeke (1993) die Ähnlichkeit zwischen Wörtern (z.B. Genus und Silbenstruktur) die Grundlage für solche Muster bildet, spielen für Bybee (1995) die Frequenz und die phonologischen Eigenschaften der Wörter die entscheidende Rolle. Anders als in rein konnektionistischen Modellen schließt Bybee allerdings nicht aus, daß gemeinsame Muster zwischen morphologisch verwandten Formen zu einer lexikalischen Repräsentation morphologischer Strukturen führen können. „The basic proposal is that morphological properties of words, paradigms and morphological patterns once described as rules emerge from associations made among related words in lexical representation." (Bybee 1995:428)

Abbildung 3: Lexikalische Beziehungen in einem Schema-Modell (nach Bybee 1995)

In schemabasierten Modellen dieser Art gibt es keinen Unterschied zwischen derivierten, irregulären und regulär flektierten Formen. Insbesondere wird nicht angenommen, daß regulär flektierte Formen durch Regeln gebildet werden, vielmehr wird das regelähnliche

33

Verhalten dieser Formen darauf zurückgeführt, daß sie ein hochfrequentes Schema bilden. Abbildung 3 illustriert eine schemabasierte Repräsentation für das Verb werfen und seine verschiedenen Stammformen, die sowohl untereinander als auch mit orthographisch bzw. phonologisch ähnlichen Wortformen verbunden sind. Kopeke schlägt darüber hinaus vor, daß zusätzlich zu den Schemata auch zugrundeliegende Formen, auf denen Regeln operieren, im Lexikon repräsentiert sind: „Im Unterschied zu Bybee (1991) [...] gehe ich davon aus, daß man dem mentalen Lexikon am ehesten gerecht wird, wenn man sowohl Verarbeitungsprozeduren, die auf linguistischer Beschreibungsebene auf IP (= 'Item and Process') basieren, wie auch Schemata und Suppletion zuläßt." (Kopeke 1993:214)

Assoziative Worterkennungsmodelle werden vor allem der hohen Geschwindigkeit beim Zugriff auf lexikalische Items gerecht: Ein normaler Sprecher ist leicht in der Lage, zwei bis fünf Wörter pro Sekunde zu produzieren, bei einem geschätzten aktiven Wortschatz zwischen 8.000 - 16.000 (vgl. Zimmer 1986) und 30.000 Wörtern (vgl. Levelt 1989). Die Geschwindigkeit der Worterkennung ist noch wesentlich höher und wird eher durch physikalische Gegebenheiten als durch kognitive Möglichkeiten beschränkt - und das, obwohl der passive Wortschatz eines gebildeten Hörers auf ca. 75.000 Wörter (Oldfield 1963 für das Englische) bzw. 94.000 Wörter (Äugst et al. 1977 für das Deutsche) geschätzt wurde. In konnektionistischen Netzwerken kann auf jedes dieser Wörter in einem Verarbeitungsschritt direkt zugegriffen werden, ohne daß der Prozeß der morphologischen Analyse durchlaufen werden muß. Dadurch werden diese Modelle der hohen Geschwindigkeit, in der die Wortverarbeitung abläuft, gerecht (vgl. Levelt 1989:212). Gleichzeitig muß dabei jedoch ein extrem großer deklarativer Speicher für das mentale Lexikon angenommen werden.

2.2.2 (i)

Morphologisch basierte, unitäre Lexikonmodelle Unitäre Modelle mit gemeinsamen Einträgen

Für eine der angenommenen Vollformspeicherung aller Wortformen entgegengesetzte Sichtweise plädieren Vertreter der sogenannten SHARED ENTRY Modelle (Modelle mit gemeinsamen Einträgen). In diesen Modellen teilen sich alle Mitglieder einer morphologischen Familie (d.h. alle Wörter mit demselben Wortstamm) einen einzigen lexikalischen Eintrag. Die interne Struktur eines Eintrags besteht dabei entweder aus einer Liste, in der alle morphologisch verwandten Formen eines Stamms, in der Regel in morphologisch dekomponierter Form, aufgelistet sind, oder (eintragsintemen) Netzwerken, in denen der Stamm positiv mit möglichen und negativ mit unerlaubten Affixen verbunden ist. Typische Vertreter der SHARED ENTRY Modelle sind die FULL-PARSING Modelle. Das bekannteste Beispiel hierfür ist das von Taft und Forster (1975, s.a. Taft 1979a, Taft 1981, Taft et al. 1986) entwickelte PREFIX-STRIPPING Modell. In diesem Modell werden Affixe durch einen obligatorischen prälexikalischen Parsingprozess vom Stamm „abgestreift".2 Der übrigbleibende Stamm des komplexen Wortes fungiert nun als Zugriffscode für die

In ihrem Originalmodell konzentrierten sich Taft und Forster auf Präfixe.

34 Suche nach dem entsprechenden Eintrag im zentralen Lexikon. Ist der Eintrag gefunden worden, werden auch alle morphologischen Varianten, die in demselben Eintrag aufgelistet sind, verfügbar. Mögliche Effekte morphologischer Struktur bei der Wortverarbeitung werden in diesem Modell dem prälexikalischen Parsingprozess auf der Zugriffsebene zugeschrieben. Zu der Gruppe der SHARED ENTRY Modelle gehört auch ein von Marslen-Wilson et al. (1994) entwickeltes Lexikonmodell, in dem die Items einer morphologischen Familie innerhalb eines netzwerkartigen Eintrags in dekomponierter Form repräsentiert sind. Die Affixe innerhalb des Eintrags sind sowohl mit dem Stamm als auch gegenseitig miteinander verbunden. Zwischen den einzelnen Knoten gibt es sowohl positive Verbindungen (zwischen Präfixen und Stämmen) als auch hemmende (zwischen Suffixen). Gemeinsame Einträge werden in diesem Modell allerdings nur für semantisch transparente Wortformen angenommen. Ein computerlinguistisches Modell von Fischbach und Kilbury (1999) nimmt dagegen gemeinsame netzwerkartige Einträge für alle möglichen Wortformen mit einem gemeinsamen Stamm an, auch für solche, die semantisch nicht transparent sind. Die eintragsintemen Netze sind hierarchisch strukturiert und erben im Defaultfall die Informationen der übergeordneten Knoten. Idiosynkrasien werden in diesen Netzen durch nicht-monotone Vererbungsmechanismen gelöst. Obwohl dieses Modell in der Lage ist, die Einträge des CELEXKorpus (Baayen et al. 1993) korrekt zu analysieren, erheben seine Entwickler allerdings keinen Anspruch auf eine psycholinguistische Realität des Modells. Worterkennungsmodelle, die gemeinsame, geteilte Einträge annehmen, tragen vor allem den generativen Eigenschaften der Sprache Rechnung. Das prozedurale Wissen, das uns befähigt, Sätze zu parsen, wird (in gleicher oder modifizierter Form) auch für die Verarbeitung komplexer Wörter benutzt. Der benötigte Speicherbedarf ist in diesen Modellen sehr gering, da jedes Morphem nur einmal repräsentiert ist. Allerdings erfordert die Wortverarbeitung einen hohen prozeduralen Aufwand, da jedes komplexe Wort in seine Konstituenten dekomponiert wird.

(ii)

Unitäre Modelle mit getrennten Einträgen

Wie in den assoziativen Lexikonmodellen ist auch in den Modellen, die SEPARATE EINTRÄGE annehmen (Separate Entry Models), jedes morphologisch komplexe Wort als Vollform in einem eigenen lexikalischen Eintrag abgebildet. Anders als in den assoziativen Modellen sind morphologische Beziehungen zwischen Wörtern hier allerdings durch explizite Verbindungen zwischen den Einträgen für die einzelnen Mitglieder einer morphologischen Familie repräsentiert. So schreibt zum Beispiel die Klasse der SATELLITENMODELLE morphologische Effekte bei der Worterkennung der Struktur des zentralen Lexikons zu. Gemäß den Satellitenmodellen (Lukatela et al. 1980, Feldman & Fowler 1987, Günther 1988, s.a. Kostic 1995 für kritische Diskussion) hat jedes morphologisch komplexe Wort einen eigenen Eintrag im Lexikon.

35

Abbildung 4: Lexikalische Beziehungen in einem Satellitenmodell

Für jede Familie morphologisch komplexer Wörter formt ein Wort den Nukleus. Der Nukleus wird als diejenige morphologische Form definiert, die (z.B. in lexikalischen Entscheidungsaufgaben) die schnellste Erkennungszeit aufweist (s. Lukatela et al. 1978, 1980). Alle morphologisch verwandten Formen sind satellitenartig mit diesem Nukleus verbunden, aber nicht direkt gegenseitig (Abbildung 4). Auch die NETZWERKMODELLE (z.B. Fowler et al. 1985, Andrews 1986, Schreuder et al. 1990, Grainger et al. 1991, Schriefers et al. 1991, Schriefers et al. 1992) nehmen die Existenz von separaten lexikalischen Einträgen für jedes morphologisch komplexe Wort an. Diese Einträge sind netzwerkartig miteinander verbunden. Zusätzlich gibt es ein Netzwerk, das Morpheme enthält. Morphologische Beziehungen zwischen Wortformen sind durch Verbindungen mit dem gemeinsamen Stamm-Morphem repräsentiert.

Abbildung 5: Lexikalische Beziehungen in einem Netzwerkmodell

Fowler et al. (1985) schlagen z.B. vor, daß das Lexikon aus einem Netzwerk von miteinander verbundenen Knoten für Wörter, Morpheme, Silben und Phoneme besteht. Darüber hinaus nehmen sie Wortknoten für jede morphologische Variante eines gegebenen Stamms an. Da jedes Wort mit dem Morphemknoten verbunden ist, der den Stamm repräsentiert, sind die morphologischen Varianten eines Stamms durch diesen gemeinsamen Stammknoten eng miteinander verbunden, ohne sich deshalb denselben Eintrag teilen zu müssen. In Abbildung 5 ist ein Ausschnitt aus einem solchen Modell, nämlich die Beziehungen des Nomens Kind zu seinen flektierten Formen und den Flexionsaffixen, dargestellt.

36 Satellitenmodelle und Netzwerkmodelle stimmen mit den konnektionistisch orientierten FULL-LISTING Modellen in der Annahme überein, daß jede morphologische Variante eines Wortes einen eigenen lexikalischen Eintrag hat. Allerdings nehmen sie im Gegensatz zu den konnektionistischen Modellen an, daß das mentale Lexikon auch explizit repräsentierte Informationen über die morphologischen Beziehungen zwischen Wörtern enthält. In SEPARATE ENTRY Modellen dieses Typs hat die Zugriffsebene nur die Funktion, das ankommende visuelle oder auditorische Signal auf einen entsprechenden lexikalischen Eintrag abzubilden. Modelle mit separaten Einträgen nehmen demzufolge kein prälexikalisches Parsing an. Mögliche Effekte morphologischer Struktur bei der Worterkennung werden durch die Annahme morphologischer Beziehungen im Lexikon erklärt.

2.2.3 Morphologisch basierte Modelle mit zwei Verarbeitungswegen In den bisher vorgestellten Modellen wird die Annahme vertreten, daß alle morphologisch komplexen Formen einheitlich repräsentiert sind. Das bedeutet für die Verarbeitung, daß entweder - im Fall der SHARED ENTRY Modelle - alle komplexen Wertformen in ihre Konstituenten dekomponiert werden, oder - in den Fällen der assoziativen FULL-LISTING Modelle und der SEPARATE ENTRY Modelle - jede Wertform als Vollform im Lexikon gesucht wird. Diese Annahmen einer einheitlichen Verarbeitungsstrategie für alle Wortformen stehen allerdings mit zahlreichen Ergebnissen aus psycholinguistischen Untersuchungen in Widerspruch, die einerseits Evidenz für die Dekomposition bestimmter Wortformen, andererseits aber auch Hinweise auf die Vollformverarbeitung anderer Wortformen liefern (s. Kapitel 3). Das deutet darauf hin, daß für die Verarbeitung morphologisch komplexer Wortformen mehr als nur ein einziger Wortverarbeitungsmechanismus zur Verfügung steht. Modelle, die zwei Verarbeitungswege annehmen, stellen für die Verarbeitung morphologisch komplexer Formen eine Alternative dar. Gemeinsam ist diesen Modellen, daß für die Wortverarbeitung sowohl die Dekompositionsmöglichkeit in Konstituenten als auch die direkte Zugriffsmöglichkeit auf die Vollform zur Verfügung steht. Die verschiedenen Modelle, in denen zwei Verarbeitungswege angenommen werden, unterscheiden sich jedoch erheblich in der Annahme der Faktoren, die bestimmen, welche Verarbeitungsmöglichkeit zum Zuge kommt. Vorgestellt werden sollen im folgenden zwei psychologisch orientierte Modelle, in denen eine Anzahl von Performanzfaktoren die Wahl der Route beeinflußt, und das linguistisch orientiertes Duale Modell, in dem vor allem linguistische Faktoren die Verarbeitungsroute determinieren.

(i)

Psychologisch orientierte Modelle mit zwei Verarbeitungswegen

In psychologisch orientierten Wortverarbeitungsmodellen mit zwei Verarbeitungswegen hängt die Wahl der Route von einer Reihe von Verarbeitungsfaktoren ab. Beispiele dieser Modelle sind das AUGMENTED ADDRESSED MORPHOLOGY Modell (Burani & Caramazza 1987, Caramazza et al. 1988) und das MORPHOLOGICAL RACE Modell (Frauenfelder & Schreuder 1992, Schreuder & Baayen 1995). Burani und Caramazza (1987) und Caramazza et al. (1988) nehmen an, daß jedes bekannte Wort seine eigene volle Zugriffsrepräsentation hat (auch für stark flektierende

37

Sprachen wie z.B. das Italienische, für das dieses Modell ursprünglich entwickelt wurde). Diese Zugriffsrepräsentationen werden durch Adressierungsprozeduren mit zentralen Repräsentationen verbunden, die aus einem Netzwerk mit Stämmen und Affixen als lexikalischen Einträgen bestehen. Die Stammeinträge sind positiv mit den erlaubten Affixeinträgen verbunden. Eine blockierende Verbindung besteht zu den Einträgen für Affixe, die nicht appliziert werden können (z.B. im Fall irregulär flektierter Formen für reguläre Flexionsaffixe). Neben dem Zugriff auf das zentrale Lexikon über die Vollform-Zugriffsrepräsentationen erlaubt das AUGMENTED ADDRESSED MORPHOLOGY Modell auch den Zugriff mittels eines morphologischen Parsingprozesses, der die Input-Kette in seine morphologischen Konstituenten dekomponiert. In der ursprünglichen Version des Modells wird diese Parsingroute nur für morphologisch regulär gebildete neue Wörter benutzt (Burani & Caramazza 1987, Caramazza et al. 1988).3 In aktuelleren Versionen des Modells (z.B. Chialant & Caramazza 1995) wird die Anwendung der Parsingroute auf alle Wörter mit niedriger Vollformfrequenz bei gleichzeitiger hoher Frequenz der morphologischen Komponenten erweitert. Es wird jedoch weiterhin angenommen, daß die Erkennung morphologisch komplexer Formen durch die direkte volle Zugriffsrepräsentation im allgemeinen schneller ist als die Parsingroute. Daher wird die Parsingroute nur in Notfällen benutzt, in denen die direkte Route besonders langsam oder nicht verfügbar ist, wie z.B. im Fall neuer Wörter. Die Parsingroute bleibt damit der direkten Route nachgeordnet. Im Gegensatz dazu gehen Vertreter des MORPHOLOGICAL RACE Modells (Frauenfelder & Schreuder 1992, Schreuder & Baayen 1995, Baayen et al. 1997) davon aus, daß die direkte Route und die Parsingroute parallel arbeiten. In ihrem Modell besteht das mentale Lexikon aus einem dreischichtigen Netzwerk, in dem die Kommunikation per Aktivierungsausbreitung geschieht (spreading activation network). Die erste Schicht besteht aus Zugriffscodes sowohl für volle Formen als auch für Stämme und Affixe. Die zweite Schicht besteht aus zentralen Repräsentationen und sogenannten Integrationsknoten (integration nodes), in denen die möglichen Kombinationen von Stämmen und Affixen kodiert sind. Die dritte Schicht umfaßt die semantischen und syntaktischen Repräsentationen eines Wortes. Zu Beginn der Verarbeitung eines morphologisch komplexen Wortes werden gleichzeitig sowohl die Zugriffsrepräsentationen für den Stamm und die Affixe als auch die Zugriffsrepräsentation für die volle Form aktiviert. Die direkte Route bildet die Zugriffsrepräsentation für die Vollform direkt auf die entsprechende zentrale Repräsentation ab. Auf der Parsingroute aktivieren die Zugriffsrepräsentationen der Konstituenten ihre korrespondierenden zentralen Repräsentationen. Im Anschluß hieran prüft eine Lizensierungsprozedur die Kompatibilität der aktivierten morphemischen Konstituenten. Ein wesentiicher Bestandteil des Modells ist eine dynamische Komponente, die es erlaubt, daß die Stärke der Zugriffsrepräsentationen, d.h. die Stärke der Aktivierung eines bestimmten Knotens im Ruhezustand, als eine Funktion der Gebrauchsfrequenz des betreffenden Knotens variieren kann. Dies ist ein sich selbst verstärkender Mechanismus: Falls z.B. für ein morphologisch komplexes Wort die direkte Route vor der Parsingroute zu einem Ergebnis kommt, wird die entsprechende Vollform-Zugriffsrepräsentation gestärkt.

3

In dieser Hinsicht unterscheidet sich das Modell nicht wesentlich von der FULL-LISTING Hypothese von Butterworth (l 983).

38 Der Aktivierungsgrad im Ruhezustand wird angehoben, was wiederum dazu führt, daß das betreffende Wort auch in Zukunft eher über die direkte Route erkannt werden wird. Wenn dagegen die morphologische Parsingroute als erste zu einem Ergebnis kommt, werden die Zugriffsrepräsentationen für die entsprechenden morphologischen Konstituenten verstärkt werden. Aus diesem Mechanismus ergeben sich mögliche Effekte morphologischer Struktur bei der Worterkennung aus dem prälexikalischen Parsingprozeß und der Interaktion der verschiedenen Komponenten des Modells. Explizit repräsentierte morphologische Strukturen im zentralen Lexikon werden nicht angenommen. Während im AUGMENTED ADDRESSED MORPHOLOGY Modell prälexikalische morphologische Dekomposition somit erst dann stattfindet, wenn die direkte Route versagt hat, läuft sie im MORPHOLOGICAL RACE Modell für alle morphologisch komplexen Wörter parallel zu der direkten Route ab. Diese beiden Modelle bilden gegenüber den unitären Modellen insofern einen Fortschritt, als daß sie beide Verarbeitungsmechanismen, d.h. Dekomposition und direkten Vollformzugriff, zulassen. Das AUGMENTED ADDRESSED MORPHOLOGY Modell wird allerdings empirischen Befunden nicht gerecht, die auch für die Verarbeitung gebräuchlicher und hochfrequenter Wortformen Dekompositionseffekte zeigen (z.B. Taft 1979b, Taft 1981, Marslen-Wilson et al. 1994, Clahsen et al. 1997, Sonnenstuhl et al. 1999). Sie erklären somit nur einen Teil der empirischen Daten, nämlich Dekompositionseffekte bei der Verarbeitung von morphologisch regulär gebildeten neuen Wörtern und von Wörtern mit extrem niedriger Vollformfrequenz bei gleichzeitiger hoher Frequenz der Konstituenten. Im MORPHOLOGICAL RACE Modell, in dem stets beide Routen aktiv sind, bestimmt eine Anzahl miteinander interagierender Faktoren, z.B. Frequenz der Vollform, Frequenz der Konstituenten, Länge des Inputs, Ähnlichkeit des Inputs oder seiner Konstituenten mit konkurrierenden Repräsentationen (lexical neighbours I competitors), Frequenz der konkurrierenden Repräsentationen, morphologische Familiengröße etc., welche Route gewinnt. Das Zusammenspiel dieser unterschiedlichen Faktoren mit der integrierten dynamischen Komponente macht das Modell außerordentlich flexibel, so daß eine sehr große Menge unterschiedlicher empirischer Daten mit ihm verträglich sind. Umso bemerkenswerter sind daher experimentelle Ergebnisse, die auch dieses Modell nicht (z.B. Taft 1979a, MarslenWilson et al. 1994, Clahsen et al. 1997, Sonnenstuhl et al. 1999) oder nur mit Zusatzannahmen (Baayen et al. 1997, Bertram et al. 2000a, Bertram et al. 2000b) erklären kann. Hinzu kommt, daß das Modell, obwohl es explizite Annahmen für alle Stadien der Wortverarbeitung trifft, empirisch bisher ausschließlich im Hinblick auf die Wortverarbeitung auf der Zugriffsebene untersucht wurde - für die weiter angenommenen Schritte der Wortverarbeitung liegen lediglich mathematische Hochrechnungen vor. Darüber hinaus ist der zur Wortverarbeitung benötigte kognitive Aufwand im MORPHOLOGICAL RACE Modell außerordentlich groß: Da die beiden Wortverarbeitungsmechanismen stets parallel ablaufen, ist sowohl eine massive Speicherung aller Vollformen im deklarativen Speicher des mentalen Lexikons als auch ein hoher prozeduraler Aufwand für die morphologische Dekomposition aller komplexen Wortformen erforderlich.

39 (ii)

Das linguistisch basierte Duale Modell

Auch in dem linguistisch basierten DUALEN MODELL, das hier vorgestellt werden soll, wird neben einer direkten Vollformverarbeitung ein morphologischer Parsingmechansimus angenommen (z.B. Pinker 1991, Prasada & Pinker 1993, Pinker & Prince 1994, Pinker 1997 für das Englische und Clahsen et al. 1992, Clahsen & Rothweiler 1993, Marcus et al. 1995, Clahsen et al. 1997, Clahsen 1999, Sonnenstuhl et al. 1999 für das Deutsche).4 Anders als in den beiden oben besprochenen Modellen mit zwei Verarbeitungswegen hängt die Wahl der Verarbeitungsroute allerdings nicht von einer Anzahl verschiedener Verarbeitungsfaktoren ab, sondern primär bestimmen linguistische Faktoren, welche Verarbeitungsstrategie gewählt wird. Diese linguistisch motivierte duale Konzeption ist grundlegend für das Modell. In ihrer allgemeinen Form ist die Vorstellung, daß die menschliche Kognition auf zwei verschiedenen Komponenten beruht, nicht neu. So wird in der Kognitionsforschung traditionell zwischen im Langzeitgedächtnis gespeichertem deklarativen Wissen, das sich auf Tatsachen oder Gegenstände bezieht, und prozeduralem Wissen, das sich auf die Art bezieht, wie kognitive Prozesse ausgeführt werden, unterschieden (vgl. Anderson 1989:187). Übertragen auf die Sprachfähigkeit besteht das deklarative Wissen aus dem mentalen Lexikon mit einer endlichen Menge (potentiell strukturierter) Einträge. Das prozedurale Wissen umfaßt ein endliches System symbolischer Operationen, um lexikalische Einträge miteinander zu kombinieren bzw. zu analysieren. Die generative Beschaffenheit der Sprache entsteht durch die rekursive Anwendung dieser Operationen, die uns befähigt, mit Hilfe dieser beiden endlichen Wissensquellen eine unendliche Menge von Äußerungen produzieren und verstehen zu können (Chomsky 1995). Die wesentliche Eigenschaft des Dualen Modells, das bisher für den Bereich der Flexionsmorphologie ausgearbeitet worden ist, ist die qualitative Unterscheidung zwischen morphologisch irregulär und regulär flektierten Formen. Für diese Unterscheidung gibt es zahlreiche linguistische Argumente. Bereits Bloomfield (1933) betonte die Notwendigkeit, zwischen regulären und irregulären Wortformen zu unterscheiden. Sein Augenmerk richtete sich dabei auf die Vorhersagbarkeit regulärer Formen: „Any form that a speaker can utter without having heard it is regular in its immediate constitution and embodies regular functions of its constituents, and any form which a speaker can utter only after he has heard it from other speakers is irregular." (Bloomfield 1933:274)

Diese Sichtweise liegt auch den späteren generativen Ansätzen zugrunde. Zum Beispiel schreiben Chomsky und Halle (1968) zu regulären Wortformen: „Regular variations are not matters for the lexicon, which should contain only idiosyncratic items [. ..] not predictable by a general rule." (Chomsky & Halle 1968:12)

Zu irregulären Formen dagegen schlägt Chomsky (1965) vor: „In general, all properties of a formative that are essentially idiosyncratic will be specified in the lexicon." (Chomsky 1965:87)

Dieses Modell, das unter dem Namen Dual Mechanism Model in der Literatur eingeführt ist, wird im folgenden als Duales Modell bezeichnet.

40 Diese linguistische Sichtweise liegt auch dem Dualen Modell zugrunde, allerdings wird angenommen, daß im Lexikon nicht nur Idiosynkrasien, sondern alle irregulär flektierten Formen repräsentiert sind. Bei regulär flektierten Formen existiert dagegen kein Vollformeintrag, sondern nur ein Eintrag für den Stamm und für das Affix. Für die Verarbeitung komplexer Wortformen folgt aus diesen Annahmen, daß zwei unterschiedliche Verarbeitungsmechanismen existieren: Für irregulär flektierte Formen liegt ein Vollformeintrag im mentalen Lexikon vor, auf den direkt zugegriffen werden kann, während regulär flektierte Formen in Stamm und Affix dekomponiert werden: „Regulars are computed by an implementation of a classic symbolic rule of grammar, which concatenates an affix with a variable that stands for a stem. Irregulars are memorized pairs of words, but the linkages between the pair members are stored in an associative memory structure with certain connectionist-like properties." (Pinker & Prince 1994:326)5

Somit vereint das Duale Modell die Vorteile der unterschiedlichen unitären Ansätze, hohe Geschwindigkeit der Worterkennung bei ökonomischer Speicherung, und erlaubt dabei gleichzeitig, daß mehr als ein Wortverarbeitungsmechanismus für die Verarbeitung morphologisch komplexer Wortformen zur Verfügung steht. Dabei spielen linguistische Faktoren die entscheidende Rolle für die Wahl der Verarbeitungroute. Damit wird das Duale Modell grundsätzlichen theoretischen Annahmen gerecht, die zahlreichen Arbeiten über das Studium der Sprache, linguistischen Theorien und psycholinguistischen Forschungen zugrunde liegen (vgl. Clahsen 1999 für einen Überblick). Zahlreiche empirische Befunde, die im folgenden diskutiert werden, unterstützen diese Aussagen des Dualen Modells. Daß das Modell auch für den Bereich der deutschen Nominalflexion gültig ist, werde ich in den Kapiteln 5 und 6 am Beispiel der deutschen Pluralmorphologie zeigen. Die empirischen Ergebnisse zu deutschen -n Pluralen werden im weiteren Verlauf dieser Arbeit zu einer Erweiterung des Dualen Modells führen, das gegenüber dem klassischen Modell zwei Vorzüge hat: Erstens ist es explizit genug, um zwischen Repräsentationen und Prozessen auf der Zugriffsebene und im zentralen Lexikon unterscheiden zu können. Zweitens ist es detailliert genug, um neben regulären, per Default flektierten Formen und idiosynkratischen, irregulären Formen auch systematische, klassenspezifische Regularitäten erfassen zu können. Bisher sind die verschiedenen Wortverarbeitungsmodelle aus der Perspektive ihrer theoretischen Vor- und Nachteile diskutiert worden. Bevor nun im folgenden Kapitel diskutiert wird, inwieweit Computersimulationen und experimentelle Studien den vorgestellten Lexikonmodellen gerecht werden, gibt Tabelle 3 einen Überblick über aktuelle Wortverarbeitungsmodelle und ihre charakteristischen Annahmen.

Neuere Forschungsergebnisse weisen darauf hin, daß die separaten Einträge für eine morphologische Familie, z.B. die Stammformen irregulärer Verben, in hierarchisch strukturierten Netzwerken (Vererbungsbäumen) miteinander verbunden sind (Clahsen et al. 2001 a). Die separat vom Stamm gespeicherten regulären Flexionsmorpheme können, zum Beispiel im Fall der Person/Numerus-Flexion, paradigmatisch organisiert sein (Clahsen et al. 2001 b).

41 Assoziative Wortverarbeitungsmodelle Konnektionistische Modelle (Rumelhart & McClelland 1986; Plunkett & Marchman 1993; Rueckl et al. 1997)

Konnektionistische Modelle (MacWhinney & Leinbach 1991)

keine morphologischen Strukturen im Lexikon Vollformverarbeitung getrennte Einträge, nur Vollformen formale und statistische Organisation der Einträge keine morphologischen Strukturen im Lexikon Vollformverarbeitung getrennte Einträge, nur Vollformen formale, statistische und semantische Organisation der Einträge



Semantisch-assoziative Modelle (Butterworth 1983)

keine morphologischen Strukturen im Lexikon Vollformverarbeitung (Dekomposition in Ausnahmefällen möglich) getrennte Einträge, nur Vollformen semantisch-assoziative Organisation der Einträge



Schema-Modell (Bybee1991, 1995)

morphologische Strukturen im zentralen Lexikon Vollformverarbeitung getrennte Einträge, nur Vollformen (dekomponiert) Organisation der Einträge in Schemata



Schema-Modell (Kopeke 1993)

morphologische Strukturen im zentralen Lexikon Vollformverarbeitung und Regeln getrennte Einträge, Vollformen und Basisformen Organisation der Einträge in Schemata

Morphologisch basierte Wortverarbeitungsmodelle a) Morphologisch basierte Wortverarbeitungsmodelle mit gemeinsamen Einträgen Full-Parsing Modell (Taft & Forster 1975; Taft 1979a; Taft 1981; Taftetal. 1986)

morphologische Strukturen auf Zugriffsebene und im zentralen Lexikon Dekomposition auf Zugriffsebene obligatorisch gemeinsame Einträge für Stamm und Affixe Organisation in eintragsinternen Listen

Interactive Activation Modell (Taft 1994)

morphologische Strukturen auf Zugriffsebene und im zentralen Lexikon Dekomposition auf Zugriffsebene möglich, aber nicht obligatorisch gemeinsame Einträge für Stamm und Affixe alle Verarbeitungsebenen arbeiten interaktiv

Netzwerkmodelle (Marslen-Wilson et al. 1994)

morphologische Strukturen im zentralen Lexikon Dekomposition (für semantisch transparente Wortformen) gemeinsame Einträge für Stamm und Affixe Organisation in eintragsinternen Netzwerken

Tabelle 3: Charakteristische Annahmen aktueller Wortverarbeitungsmodelle

42 Tabelle 3: Charakteristische Annahmen aktueller Wortverarbeitungsmodelle (Fortsetzung) b) Morphologisch basierte Wortverarbeitungsmodelle mit getrennten Einträgen Satellitenmodelle (Lukatela et al. 1978; Lukatela et al. 1980; Feldman & Fowler 1987; Günther 1988)

morphologische Strukturen im zentralen Lexikon Vollformverarbeitung getrennte Einträge, nur Vollformen satellitenartige Organisation der Einträge

Netzwerkmodelle (Andrews 1986; Fowler et al. 1985; Grainger et al. 1991; Schreuder et al. 1990; Schriefersetal. 1991; Schriefers et al. 1992)

morphologische Strukturen im zentralen Lexikon Vollformverarbeitung getrennte Einträge, Vollformen und Morpheme Organisation der Einträge in Netzwerken

c) Morphologisch basierte Wortverarbeitungsmodelle mit zwei Verarbeitungswegen



Augmented Addressed Morphology Modelle (Burani & Caramazza 1987; Caramazza et al. 1988)

morphologische Strukturen auf Zugriffsebene und im zentralen Lexikon Dekomposition möglich, aber Vollformverarbeitung hat Vorrang getrennte Einträge für Stämme und Affixe

Dual Route Modelle (Frauenfelder & Schreuder 1992; Schreuder & Baayen 1995; Baayen 1998)

Zugriffsebene und Lexikon arbeiten interaktiv Dekomposition und Vollformverarbeitung parallel getrennte Einträge für Vollformen und Morpheme Organisation der Einträge in Netzwerken

Duales Modell (Pinker 1991; Clahsen et al. 1992; Clahsen & Rothweiler 1993; Prasada & Pinker 1993; Pinker & Prince 1994; Marcus et al. 1995; Pinker 1997; Clahsen et al. 1997; Clahsen 1999; Sonnenstuhl et al. 1999)

morphologische Strukturen auf Zugriffsebene und im zentralen Lexikon Dekomposition für reguläre Wortformen, Vollformverarbeitung für irreguläre Wortformen getrennte Einträge, Vollformen (für irreguläre Wortformen) und Morpheme (für reguläre Wortformen) Organisation der Einträge in morphologischen hierarchischen Strukturen

Kapitel 3 Die Erkennung morphologisch komplexer Wörter: Empirische Befunde

3.1

Konnektionistische Lexikonmodelle: Computersimulationen

Um die Gültigkeit assoziativer konnektionistischer Lexikonmodelle zu überprüfen, untersucht man das Verhalten künstlicher, durch Software simulierter, neuronaler Netze. Diese Netze bestehen aus einfachen, gleich aufgebauten Knoten (units), die durch gewichtete Verbindungen miteinander verknüpft sind. Die Knoten selbst fuhren keine komplexen Verarbeitungsprozesse aus, sondern sammeln Input und können bestimmte Aktivierungszustände annehmen. Der Aktivierungsgrad der einzelnen Knoten hängt dabei vom Aktivierungsgrad zugeschalteter Knoten und dem Gewicht der Verbindungen zu diesen Knoten ab. Die Einheiten künstlicher neuronaler Netze verhalten sich somit ähnlich wie echte Neuronen, denn diese erhalten Input von anderen Nervenzellen und verändern ihren Erregungszustand in Abhängigkeit vom Zustand der vorgeschalteten Neuronen und der Stärke der entsprechenden synaptischen Verbindungen.

3.1.1 Computersimulationen zum englischen Past-Tense-System In verschiedenen Studien wurde versucht, den Erwerb und die Repräsentation des englischen Past-Tense-Systems zu simulieren (s. Clahsen 1999 für einen Überblick). Die erste dieser Studien war die von Rumelhart und McClelland (1986), deren Netz aus den quasiphonologischen Repräsentationen (Wickelmerkmale) eines Verbstamms als Input nach einer Trainingsphase die phonologischen Repräsentationen der entsprechenden Präteritumform als Output erzeugen sollte. Das aufgrund dieser Simulation entwickelte Modell nahm für sich in Anspruch, das englische Past-Tense-System einschließlich seines Erwerbs mit einem einzigen Abbildungsmechanismus und ohne Flexionsregem nachahmen zu können. Insbesondere zeigte das Modell einen für den Spracherwerb typischen U-förmigen Entwicklungsverlauf: Nach einer anfänglichen Phase mit einem hohen Anteil an zielsprachlichen Präteritumformen konnten Übergeneralisierungen des regulären Präteritumaffixes -ed auf irreguläre Verben beobachtet werden (go-ed). Erst danach näherte sich die Bildung der Präteritumformen wieder der Zielsprache an. Marcus et al. (1992) und Pinker und Prince (1994) haben allerdings auf einige Schwachpunkte dieses Modells aufmerksam gemacht. Zum Beispiel wurde der Lernmechanismus in dem Netz von Rumelhart und McClelland (1986) überwacht, d.h. Informationen über Abweichungen des tatsächlichen Outputs von dem gewünschten wurden dem Netz wieder eingegeben. Die sprachlichen Daten, mit denen ein Kind konfrontiert wird, enthalten jedoch keine negative Evidenz, d.h. keine eindeutigen Hinweise darauf, welche Formen nicht zielsprachlich sind (Chomsky 1965). Außerdem bestand in dem Modell von Rumelhart und McClelland (1986) auch keine Möglichkeit, die syntaktischen und semantischen Eigenschaften von lexikalischen Einträgen zu erfassen, da die phonologischen Repräsentationen der Präsensstämme direkt auf die

44

phonologischen Repräsentationen der entsprechenden Präteritumformen abgebildet wurden. Daher konnte dieses Modell z.B. nicht zwischen der unterschiedlichen Semantik von homophonen Präsensformen unterscheiden (ring - rang vs. -wring - wrung). Mit Bezug auf die Kritikpunkte von Marcus et al. (1992) und Pinker und Prince (1994) wurden in neueren konnektionistischen Modellen zahlreiche Modifikationen des Lernmechanismus und der Netzarchitektur vorgeschlagen. So wurden z.B. Lernrnechanismen entwickelt, die keine Informationen über die Korrektheit des Outputs benötigten (u.a. Elman et al. 1996, MacWhinney & Leinbach 1991). Auch konnten durch die Erweiterung der ursprünglichen Netzarchitektur um eine oder mehrere Schichten verborgener Knoten (hidden units) über rein phonologische Beziehungen hinaus auch abstraktere Merkmale erfaßt werden. So war das Netzwerk von MacWhinney und Leinbach (1991) beispielsweise durch die zusätzliche Eingabe semantischer Informationen in der Lage, zwischen homophonen PastTense-Formen (ring - wring) unterscheiden zu können. Wie Marcus und seine Kollegen herausstellen (Marcus 1995, Marcus et al. 1995, Marcus 2001), gelang dies allerdings nur für eine kleine Anzahl zufällig homonymer Verbpaare, deren spezielle Eigenschaften direkt in das Netzwerk eingebaut wurden. Dies erzeugte zwar für diese speziellen Verben die korrekten Formen, wurde aber nicht der Tatsache gerecht, daß derivierte Verben, auch wenn sie homophon zu existierenden irregulären Verben sind, stets regulär flektiert werden (vgl. Marcus et al. 1995 für das Deutsche). Dagegen produzierte eine Simulation von Daughterly und Hare (1994) korrekte -ed Formen denominaler Verben, auch wenn sie sich mit existierenden irregulären Verben reimten. Daugherty und Hare (1994) lösten die Flexion denominaler Verben allerdings durch die Eingabe zusätzlicher Input-Information, die aus einem speziellen Training für entsprechende Verbformpaare (ring - ringed) bestand. Dies erzeugte zwar korrekte Formen für denominale Verben, spiegelte aber nicht die Gegebenheiten in der realen englischen Sprache wider, wo dieser Verbbildungsprozeß sehr produktiv ist und auch zur Bildung neuer Verben benutzt wird (Kim et al. 1994, Marcus et al. 1995). Hare et al. (1995) versuchten zu zeigen, daß ein neuronales Netz, im Gegensatz zu den bisher erwähnten Simulationen, auch dann in der Lage ist, Defaultformen zu produzieren, wenn sie eine niedrigere Frequenz als irreguläre Formen aufweisen. Das Problem der Defaultaffigierung konnte allerdings nicht allgemein gelöst werden, sondern nur spezifisch für das Englische, indem im Netz ein expliziter -ed Knoten spezifiziert wurde. Marcus (2001) weist außerdem darauf hin, daß semi-reguläre Verben und Suppletivformen für das Netzwerk von Hare et al. problematisch sind, da seine Architektur so beschaffen ist, daß massive Stammveränderungen (go - went) und Vermischungen (sleep - slept) systematisch verhindert werden. Auch gegen ein Modell von Plunkett und Marchman (1993), das die U-förmige Erwerbskurve der -ed Formen für reguläre Verben nachahmt, wendet Marcus (1995:278) ein, daß die simulierte Entwicklungskurve sich von der U-Kurve im aktuellen Spracherwerb in relevanten Punkten unterscheidet. Zum Beispiel produzierte das Modell die U-Kurven nur nach sprunghaften Veränderungen der Inputstruktur (d.h. des Verhältnisses von regulären zu irregulären Verben) in der Trainingsphase, die es im Spracherwerb aber nicht gibt. Darüber hinaus sind Irregularisierungsfehler (flow -flew) im kindlichen Spracherwerb extrem selten, aber das Modell von Plunkett und Marchman (1993) produzierte sie häufiger als die -ed Übergeneralisierungen.

45

3.1.2 Computersimulationen zu deutschen Flexionsformen Während in zahlreichen Studien versucht wurde, den Erwerb des englischen Past-TenseSystems zu simulieren, liegen zum deutschen Flexionssystem relativ wenige Untersuchungen vor. Einige dieser Untersuchungen stammen von Nakisa und Hahn (1996), Nakisa et al. (2000) und Hahn und Nakisa (2000), die sich in ihrem konnektionistischen Modell explizit gegen die im Dualen Modell vertretene Annahme wenden, daß für die Verarbeitung von Flexionsformen neben assoziativen Speicherungsmöglichkeiten (für irreguläre Formen) auch symbolverarbeitende Prozesse (für reguläre Formen) zur Verfügung stehen. Während konnektionistische Ansätze mit dem Dualen Modell grundsätzlich in der Annahme übereinstimmen, daß irreguläre Formen in assoziativen Netzwerken gespeichert sind, unterscheiden sie sich in der Behandlung regulärer Formen: Im Dualen Modell sollten die Flexionsformen unbekannter Wörter, sofern sie keine Analogiebildungen zu gespeicherten irregulären Formen aufweisen, per Default gebildet werden, gemäß einem konnektionistischen Ansatz sollten sie dagegen, ebenso wie irreguläre Formen, auf der Basis von bekannten Wörtern produziert werden. Zur Überprüfung ihres Ansatzes haben Nakisa und seine Kollegen in Computersimulationen Netzwerkmodelle, die auf ausschließlicher Vollformverarbeitung basieren, Modellen gegenübergestellt, die neben der Vollformverarbeitungsroute über einen Defaultmechanismus verfügen. Gemessen wurde dabei die Fähigkeit von drei verschiedenen Simulationsmodellen, korrekte Pluralformen für unbekannte Wörter zu produzieren. Die Datenbasis bildeten ca. 8.600 Nomina aus dem CELEX-Korpus, die je nach Pluralmarkierung 15 Pluralklassen zugeordnet wurden. Sehr kleine Pluralklassen, die lateinische oder altgriechische Endungen oder Stammveränderungen aufwiesen, wurden dabei ausgeschlossen. Der Input bestand in allen Simulationen aus einer rein phonologischen Repräsentation des Stamms. In der Trainingsphase lernten die Modelle iterativ für 90 % der Datenbasis die zugehörige Pluralklasse, in der Testphase mußten die jeweils restlichen 10 % der Nomina einer der 15 Pluralklassen zugeordnet werden. Die Netzwerke verfügten über unterschiedliche Komplexität. Im einfachsten Modell, das ausschließlich auf der Basis phonologischer Ähnlichkeit mit einem bekannten Item operierte, wurden 70,8 % der Formen korrekt vorhergesagt. Ein komplexeres Netzwerk verfügte zusätzlich über die Möglichkeit zu Wahrscheinlichkeitsberechnungen, für seine Entscheidung konnte daher die Type-Frequenz ähnlicher Items mit einbezogen werden. Auf der Basis phonologischer Ähnlichkeit mit einer Gruppe bekannter Items lieferte dieses Netzwerk als Output die Angabe der Wahrscheinlichkeit, mit der ein Item zu einer Pluralklasse gehörte. Auf dieser Basis konnten 74,3 % der unbekannten Items den verschiedenen Pluralklassen korrekt zugeordnet werden. Das beste Ergebnis erzielte schließlich ein dreischichtiges konnektionistisches Netzwerk, das neben den beiden Ebenen für Input und Output über eine dritte, „verborgene" Ebene (hidden layer) verfugte. Durch diese Architektur war das Netzwerk nicht auf die oberflächliche Ähnlichkeit eines unbekannten Items zu bekannten beschränkt, sondern konnte darüber hinausgehende Korrelationen erkennen und nutzen. Der Output war auch hier wieder die Angabe der Wahrscheinlichkeit, mit der ein Item zu einer Pluralklasse gehört. Dieses Netzwerk sagte 82,7 % der zu produzierenden Formen korrekt voraus. Auch wenn dieser Prozentsatz von Nakisa et al. (2000) als „beachtlich hoch" eingeschätzt wird, bleibt der Anteil der falsch produzierten Pluralformen mit ca. 20 % jedoch relativ groß.

46

In einer zweiten Simulationsreihe wurde eine Defaultregel simuliert, indem den drei oben beschriebenen Netzwerken ein Grenzwert eingegeben wurde, der die Wahl der Route determinierte: Überstieg die Wahrscheinlichkeit für eine bestimmte Output-Form einen bestimmten Grenzwert /, d.h. wurde ein ausreichend hoher Grad an Ähnlichkeit zu gespeicherten Formen erreicht, wurde die Defaultroute blockiert. Die Ergebnisse dieser Simulationsreihe mit zwei möglichen Routen ähnelten denen mit einer Route (70 %, 73,8 % und 81,2 %), überstiegen sie aber nie. Nakisa et al. (2000) werten dies als Beweis, daß die Verfügbarkeit von Defaultregeln nichts zur Erkennung flektierter Pluralformen beitragen kann. Entgegen der Einschätzung von Nakisa et al. (2000) ist ihr Ergebnis allerdings weder überraschend noch widerlegt es das Duale Modell, wenn man die folgenden Punkte in Betracht zieht: Erstens waren alle Simulationen so angelegt, daß sie auf den Frequenzen der vorkommenden Pluralformen basierten. Es war daher zu erwarten, daß die beiden frequentesten Pluralsuffixe -n und -e (48 % bzw. 27 % aller Pluralformen, s. Tabelle 13, Abschnitt 4.1) auch am häufigsten übergeneralisiert wurden. Zweitens bestand der Input in allen Simulationen aus einer reinen Abfolge der Stammphoneme. Darüber hinausgehende Informationen, z.B. Prosodie, kategoriale oder semantische Eigenschaften wurden nicht berücksichtigt. Damit konnte zur Identifizierung einer Defaultform auch nur ein Indiz genutzt werden, nämlich ihre Unabhängigkeit von der phonologischen Umgebung. Zweitens wurde nicht die Anwendbarkeit der Defaultregel auf Neologismen und sonstwie ungewöhnliche Wörter, also die klassische Umgebung für ihre Anwendung, simuliert, sondern auf Wörter, die im Realwortschatz bereits existieren. Drittens machen die Defaultplurale nur einen kleinen Prozentsatz (4 %) innerhalb aller deutschen Pluralformen aus. Gemessen wurde aber der Prozentsatz korrekter Pluralformen für alle Plurale. Es war daher nicht zu erwarteten, daß der geringe Anteil an Defaultformen die Gesamtergebnisse merklich beeinflussen würde. Viertens wurden aus dem Trainigsset der zweiten Simulationsreihe alle Defaultplurale entfernt. Damit entsprach das Trainingsset nicht mehr dem Realwortschatz. Erfolgreicher war eine Simulation des deutschen Partizipsystems, die Westermann und Goebel (1995) präsentierten. Im Gegensatz zu den bisherigen Modellen bestand ihr Netzwerk allerdings aus zwei getrennten Systemen, von denen eine dem üblichen phonologischen Musterassoziierer entsprach, die andere aber die Möglichkeit zur selbständigen Erzeugung von regelähnlichen Symbolmanipulationen auf der Basis von abstrakten Merkmalen vorsah. Die Konzeption dieses Netzwerks erlaubte damit die Simulation der beiden im Dualen Modell angenommenen regelbasierten und ähnlichkeitsbasierten Komponenten. Es zeigte sich, daß die Übergeneralisierungen für irreguläre und reguläre Partizipien denen entsprachen, die auch bei deutschen Sprechern beobachtet wurden (s. Abschnitt 3.2.4): Während reguläre Partizipformen immer dann produziert wurden, wenn es keine ähnlichen Formen im Trainingsset gab, hing die Erzeugung der irregulären Formen stark von der Häufigkeit bereits bekannter ähnlicher Formen ab. Eine Simulation zur Produktion von deutschen Pluralformen, die Goebel und Indefrey (2000) mit demselben Netzwerkmodell wie Westermann und Goebel (1995) durchführten, war allerdings weniger erfolgreich: Zwar entsprachen die ähnlichkeitsabhängigen Ergebnisse für irreguläre Pluralfomien weitgehend denen, die Marcus et al. (1995, s. Abschnitt 4.3) für deutsche Sprecher beobachteten, allerdings war das System nicht in der Lage, die Eigenschaft der Defaultregel zu reflektieren, immer dann angewendet zu werden, wenn keine ähnlichen Einträge verfügbar sind.

47

Zusammengefaßt kann festgestellt werden, daß zwar viele Schwachstellen, die das ursprüngliche Modell von Rumelhart und McClelland (1986) zeigte, in neueren Modellen behoben worden sind, was allerdings zu anderen Schwierigkeiten führte. Wie Clahsen (1999) herausstellt, können konnektionistische Modelle die Daten aus der Trainingsphase zwar gut handhaben - ein grundlegendes Problem aller Modelle besteht jedoch in ihren begrenzten Möglichkeiten, Generalisierungen zu entwickeln, die auf neue Wörter übertragen werden können. Diese sind, im Gegensatz zu der menschlichen Sprachfähigkeit, sehr eingeschränkt und hängen wesentlich von den statistischen Eigenschaften des Inputs ab.

3.2

Morphologisch basierte Lexikonmodelle: Reaktionszeitstudien

Anders als konnektionistisch orientierte Forscher stimmen die weitaus meisten Autoren, die experimentelle Studien zur Worterkennung durchführen, darin überein, daß die Struktur morphologisch komplexer Wörter bei ihrer Erkennung eine Rolle spielt. Die Zahl der unterschiedlichen Faktoren, die bei der Worterkennung in Betracht gezogen werden, ist jedoch erheblich. Relevante Fragestellungen sind unter anderem: •

Spielt die morphologische Struktur bereits auf der Zugriffsebene eine Rolle, d.h. gibt es prälexikalische Dekomposition? Falls ja - ist dies ein optionaler oder ein obligatorischer Prozeß?



Gibt es einen Verarbeitungsunterschied zwischen präfigierten und suffigierten Wortformen?



Sind morphologische Strukturen im Lexikon repräsentiert? Falls ja - existieren diese Strukturen zusätzlich zu morphologischen Strukturen auf der Zugriffsebene, oder gibt es nur Vollformen als Zugriffscodes, d.h. findet Dekomposition erst im Lexikon statt?



Wie sind die zentralen lexikalischen Repräsentationen beschaffen? Bestehen lexikalische Repräsentationen aus komplexen Einträgen für morphologische Familien? Falls ja - welche Mitglieder gehören zur Familie? Wie sind die komplexen Einträge intern organisiert?



Bestehen lexikalische Repräsentationen aus separaten Einträgen für einzelne Wortformen? Falls ja - nach welchem Organisationsprinzip sind sie miteinander verbunden? Sind sie satellitenartig, netzwerkartig oder hierarchisch angeordnet?



Sind alle Wortformen separat gespeichert, oder alle Morpheme, oder alle Wortformen in dekomponierter Form?



Erfolgt morphologische Dekomposition in gleichem Ausmaß für unterschiedliche Klassen komplexer Wörter? Falls nicht - welche Faktoren sind ausschlaggebend?



Gibt es unterschiedliche Effekte für derivierte und flektierte Wortformen? Für präfigierte und suffigierte Formen? Für semantisch transparente und opake Formen? Für formal ähnliche und unähnliche Formen? Für hoch- und niedrigfrequente Formen? Für regulär und irregulär flektierte Formen?

48 Eine Auswahl empirischer Studien, die zur Untersuchung dieser Fragen durchgeführt wurden, soll im folgenden vorgestellt werden.

3.2.1 Morphologische Dekomposition auf der Zugriffsebene Zur Untersuchung der Frage, ob es prälexikalische Dekomposition gibt, wird vor allem die Methode der lexikalischen Entscheidungsaufgabe herangezogen. Wie in Kapitel l dargestellt, ist sie hierfür besonders geeignet, weil mit ihr die Erkennungszeit eines einzelnen Wortes in Isolation gemessen werden kann, ohne andere Verarbeitungsstadien zu involvieren. Zahlreiche Untersuchungen in diesem methodischen Paradigma beruhen auf der Annahme, daß der Worterkennungsprozeß in einzelne Schritte, z.B. morphologische Dekomposition und lexikalische Suche, segmentierbar ist, die jeweils Verarbeitungszeit erfordern. (a) Dekomposition hat Vorrang -> Schritt (1)

Dekomposition des Items in Stamm und Affix

->· Schritt (2)

Suche nach Stamm und Affix

-> Schritt (3)

Prüfung, ob Kombination von Stamm und Affix erlaubt ist

-» Schritt (4)

Suche nach Vollform

positive Antwort Schritt (4) positive Antwort negative Antwort

(b) Vollformverarbeitung hat Vorrang ->· Schritt (1)

Suche nach Vollform

-> Schritt (2)

Dekomposition des Items in Stamm und Affix

->· Schritt (3)

Suche nach Stamm und Affix

->. Schritt (4)

Prüfung, ob Kombination von Stamm und Affix erlaubt ist

positive Antwort Schritt (2) bis (4)

positive Antwort negative Antwort

(c) nur Vollformverarbeitung -» Schritt (1)

Suche nach Vollform

positive Antwort negative Antwort

Tabelle 4: Verarbeitungsabläufe bei der Erkennung morphologisch komplexer Formen (nach Butterworth 1983:276)

Daraus ergibt sich die Vorhersage, daß die Erkennung morphologisch komplexer Wortformen mehr Verarbeitungszeit in Anspruch nimmt als die Erkennung monomorphemischer

49

Wörter. Von besonderem Interesse ist in diesem Paradigma die Verarbeitung pseudoaffigierter Wortformen, d.h. monomorphemischer Wörter, die eine affixähnliche Sequenz enthalten (z.B. Gart-eri). Falls prälexikalische Dekomposition ein obligatorischer Verarbeitungsschritt ist, sollten sich pseudoaffigierte Wörter wie morphologisch komplexe Wörter verhalten, da zunächst ein konstituentenweiser Zugriff versucht wird. Falls dagegen die Suche nach der Vollform den ersten Verarbeitungsschritt darstellt, sollten sich pseudoaffigierte Wörter wie monomorphemische Wörter verhalten. Demgemäß hatten zahlreiche Studien zum Ziel, aus dem Vergleich der Erkennungszeiten affigierter Wortformen (z.B. dust+y) mit den Erkennungszeiten pseudoaffigierter Wörter (z.B. fancy) Aufschluß über die sequentielle Abfolge der einzelnen Verarbeitungsschritte zu gewinnen. Theoretisch sind die in Tabelle 4 dargestellten Verarbeitungsabläufe denkbar. Annahme (a) entspricht den FULL-PARSING Modellen, die prälexikalische Dekomposition voraussagen. Danach sollten affigierte Wortformen kürzere Erkennungszeiten aufweisen (positive Antwort nach Schritt 3) als pseudoaffigierte Wörter (positive Antwort nach Schritt 4), für die nach ihrer Dekomposition und einem - erfolglosen - Kombinationsversuch von Stamm und Affix noch eine lexikalische Vollformsuche durchgeführt wird. Annahme (b) entspricht einem Modell mit zwei Verarbeitungswegen (z.B. dem AUGMENTED ADDRESSED MORPHOLOGY Modell), in dem Vollformverarbeitung Vorrang vor Dekomposition hat. Hier sollten pseudoaffigierte Wörter kürzere Erkennungszeiten aufweisen (positive Antwort nach Schritt 1) als affigierte Wortformen (positive Antwort nach Schritt 4), da bereits im ersten Verarbeitungsschritt, bevor noch ein Dekompositionsversuch unternommen wird, nach der vollen Wortform gesucht wird. Annahme (c) schließlich, die von einer einheitlichen Vollformverarbeitung für alle Wortformen ausgeht und damit den verschiedenen SEPARATE ENTRY Modellen entspricht, sagt keinen Unterschied in den Erkennungszeiten von echt affigierten Wortformen und pseudoaffigierten Wörtern voraus. Im Rahmen des Dualen Modells ist die Erkennung pseudoaffigierter Wortformen bisher nicht untersucht worden. In seiner bisherigen Form ist das Modell sowohl mit den Annahmen unter (a) als auch mit den Annahmen unter (b) kompatibel, während (c) ausgeschlossen wird. Im erweiterten Dualen Modell wird ein Verabeitungsablauf angenommen, welcher der Suche nach einer mit dem sprachlichen Input identischen vollen Form Vorrang vor der Dekomposition gibt. Nach diesem Modell entspricht die Reihenfolge der Verarbeitungsabläufe, ebenso wie im AUGMENTED ADDRESSED MORPHOLOGY Modell, dem Vorschlag (b), wobei existierende irreguläre Formen eine positive Antwort in Schritt l erhalten und per Default flektierte Wortformen eine positive Antwort in Schritt 4. Im folgenden werden Studien vorgestellt, in denen die Annahmen aus Tabelle 4 explizit untersucht worden sind. Insgesamt ist die Evidenz im Hinblick auf eines der Verarbeitungsmodelle allerdings uneinheitlich.

(i)

Präfigierung

In ihrem PREFIX STRIPPING Modell gehen Taft und Forster (1975, Taft 1981, Taft et al. 1986) von einem obligatorischen prälexikalischen Dekompositionsprozeß für alle morphologisch komplexen Wörter aus. Gemäß diesem Modell, das ursprünglich zur Erkennung derivierter präfigierter Wörter entwickelt worden war, werden bei der Erkennung eines (visuell präsentierten) Wortes zunächst mögliche Präfixe abgestreift, bevor versucht wird, für

50

den restlichen Teil einen korrespondierenden Stammeintrag im zentralen Lexikon zu finden. Wird solch ein Stammeintrag gefunden, wird die Liste aller unter ihm gefundenen komplexen Formen durchsucht, um eine mit der ursprünglichen Input-Form identische zu finden. Erst wenn dieser Versuch scheitert, wird die gesamte Input-Form als Code zur Suche nach einem Eintrag im zentralen Lexikon benutzt (vgl. Tabelle 4a). Hauptsächlich stützt sich dieses Modell auf zwei Quellen empirischer Evidenz, nämlich auf (a) INTERFERENZEFFEKTE bei Pseudowörtern (nonword interference effect) und auf (b) PSEUDOPRÄFIGIERUNGSEFFEKTE.

(a)

Interferenzeffekte bei Pseudowörtern

In einer lexikalischen Entscheidungsaufgabe wurden PseudoWörter, die aus einem gebundenen Stamm bestanden (z.B. vive von revive, ein entsprechendes deutsches Beispiel wäre gnügen von vergnügen und begnügen) langsamer als Nichtwörter beurteilt als Pseudowörter, die aus einem Pseudostamm bestanden, der kein mögliches Morphem war (z.B. lish von relish, vgl. deutsch Burt von Geburt) (Taft & Forster 1975). Darüber hinaus brauchten PseudoWörter, die aus einem existierenden Präfix und einem existierenden Stamm in einer unzulässigen Kombination bestanden (dejoice, vgl. deutsch entkocheri) längere Reaktionszeiten als Pseudowörter, die ein existierendes Präfix mit einem Pseudostamm enthielten (z.B. dejouse, vgl. deutsch entmocken) (Taft et al. 1986). Diese Ergebnisse wurden als Evidenz dafür gewertet, daß auch Stämme, die nur gebunden vorkommen, auf der Zugriffsebene repräsentiert sind, und daß über diesen Zugriffscode auf das zentrale Lexikon zugegriffen wird, während Pseudostämme über keine Zugriffsrepräsentation verfügen und daher sofort zurückgewiesen werden können (Taft 1985, Taft etal. 1986). Ein methodisches Problem bei diesen Untersuchungen ist allerdings die Benutzung von Pseudowörtern als Testitems (vgl. Henderson 1985). Für Pseudowörter könnte man sich nämlich auch vorstellen, daß zunächst ein Zugriff auf die volle Form versucht wird. Erst, wenn diese fehlgeschlagen ist (was für Pseudowörter per Definitionen! der Fall ist), wird eine morphologische Dekomposition versucht. Somit sprächen die Ergebnisse zwar dafür, daß die Möglichkeit zu prälexikalischer morphologischer Dekomposition besteht, aber nicht dafür, daß sie obligatorisch ist. Zwischen den Verarbeitungsabläufen (a) und (b) in Tabelle 4 kann somit nicht unterschieden werden. (b)

Pseudopräfigierungseffekte

Ein Pseudopräfigierungseffekt konnte von Rubin et al. (1979) in lexikalischen Entscheidungsaufgaben beobachtet werden, in denen die Reaktionszeiten auf Stimuli länger waren, wenn diese aus pseudopräfigierten Wörtern bestanden (z.B. mis-ery, vgl. deutsch be-ginnen) als wenn sie aus Wörtern bestanden, die echt präfigiert wurden (z.B. mis-place, vgl. deutsch be-sprecheri). Dieses Ergebnis wurde als Evidenz für das PREFIX STRIPPING Modell gewertet, da hier pseudopräfigierte Wörter zunächst in Pseudopräfix und Pseudostamm dekomponiert werden, und erst nachdem der Zugriff auf das zentrale Lexikon durch den Pseudostamm fehlgeschlagen ist, in einem zweiten Versuch die volle Form als Zugriffscode benutzt wird. Ähnliche Ergebnisse erzielte Beauvillain (1994) in einer Studie zum Französischen: Hier hatten Versuchspersonen in einer Wortpaarvergleichsaufgabe zu entscheiden, ob zwei kurz

51 nacheinander präsentierte Wörter identisch waren oder nicht. Teile des ersten Wortes wurden optisch hervorgehoben und waren manchmal der Stamm (re-flux. vgl. deutsch Ge-tier) und manchmal ein Pseudostamm (re-flet, vgl. deutsch Ge-spenst). Die Antwortzeiten waren kürzer, wenn der optisch hervorgehobene Teil dem Stamm entsprach. Auch dieses Ergebnis zeigt, daß morphologische Informationen während der Worterkennung wahrgenommen und genutzt werden können. Im Gegensatz zu diesen Ergebnissen konnten allerdings Henderson et al. (1984) keinen Pseudopräfigierungseffekt beobachten, wenn der Anteil der potentiell präfigierten Wörter und Pseudowörter in der Stimulusliste niedrig war. In ähnlicher Weise erhielten auch Rubin et al. (1979) nur dann einen Pseudopräfigierungseffekt, wenn die Stimulusliste auch echt präfigierte Pseudowörter enthielt. Damit kann nicht ausgeschlossen werden, daß der Pseudopräfigierungseffekt strategiebedingt ist, d.h. daß durch einen hohen Anteil an präfigierten Wörtern und PseudoWörtern in der Stimulusliste eine Parsingstrategie gefördert wird. Insgesamt lassen daher auch diese Ergebnisse vermuten, daß der Prozeß der morphologischen Dekomposition optional, aber nicht obligatorisch ist. Diesen Beobachtungen trägt auch Taft (1994) in seinem alternativen INTERACTIVE ACTIVATION Modell Rechnung, in dem er für den lexikalischen Zugriff verschiedene Ebenen annimmt (Grapheme, Wortkörper, Morpheme, Wörter und Konzepte), die konnektionistisch miteinander interagieren. Die Dekomposition des Präfixes ist hier nicht mehr eine eigenständige Prozedur, die vor dem eigentlichen lexikalischen Zugriff geschieht, sondern ist in die Zugriffsprozedur selbst integriert. Je nach dem Informationsgehalt des Präfixes in Relation zum Wortstamm (d.h. hochfrequente Präfixe tragen weniger Information zur Erkennung eines Wortes bei als niedrigfrequente) spielt seine Isolation während des Zugriffs eine geringere oder wichtigere Rolle. Im INTERACTIVE ACTIVATION Modell sind präfigierte Wörter zwar nach wie vor in dekomponierter Form repräsentiert, aber die prälexikalische Dekomposition eines Präfixes geschieht nicht mehr zwangsläufig.

(ii)

Suffigierung

Auch die Untersuchung suffigierter Wörter zeigt uneinheitliche Ergebnisse. So beobachteten Caramazza et al. (1988) im Italienischen abgestufte Interferenzeffekte für suffigierte Pseudo-Verbformen, die mit dem Grad der verfügbaren morphologischen Struktur korrelierten. In einer lexikalischen Entscheidungsaufgabe präsentierten sie ihren Versuchspersonen Pseudowörter in den vier Bedingungen: 1l) (2) (3) (4)

existierender Stamm + existierendes Suffix in unzulässiger Kombination (cant-evi 'sing [2.Ps. Sg. Präteritum]') existierender Stamm + Pseudosuffix (cant- ) Pseudostamm + existierendes Suffix (canz-evi) Pseudostamm + Pseudosuffix (canzovi)

Die Reaktionszeiten für Bedingung l waren länger als für Bedingung 2 und 3. Am kürzesten waren die Antwortzeiten für Bedingung 4. Dieser Effekt ist mit dem von Taft und Forster (1975) berichteten Interferenzeffekt bei präfigierten PseudoWörtern vergleichbar. Caramazza et al. (1988) interpretierten ihre Ergebnisse dementsprechend als Evidenz für

52

morphologisches Parsing auf der Zugriffsebene: Pseudowörter, die aus zwei existierenden Morphemen bestehen (Bedingung 1), aktivieren Zugriffsrepräsentationen für jedes dieser Morpheme; ihre unzulässige Kombination wird erst in einem späteren Verarbeitungsstadium erkannt. Pseudowörter der Bedingungen 2 und 3, die ein nicht-existierendes Morphem enthalten, können dagegen schneller zurückgewiesen werden, da für das nicht-existierende Morphem keine Zugriffsrepräsentation gefunden wird. Für Wörter, die kein existierendes Morphem enthalten (Bedingung 4), wird kein Dekompositionsversuch unternommen, und sie können daher als ganze Form sofort zurückgewiesen werden. Allerdings lassen auch diese Studien, da sie mit PseudoWörtern durchgeführt wurden, keinen zuverlässigen Rückschluß auf die Verarbeitung echter Wörter zu. Wie im Fall präfigierter Pseudowörter kann auch für suffigierte Pseudowörter nicht ausgeschlossen werden, daß morphologische Dekomposition erst dann stattfindet, wenn der Zugriff auf die Vollform fehlgeschlagen ist (vgl. Henderson 1985). Auch sie belegen damit zwar die Möglichkeit prälexikalischer Dekomposition, aber nicht ihre zwangsläufige Anwendung. Dieses Problem wird in Studien mit echten Wörtern vermieden. So erzielte in einer lexikalischen Entscheidungsaufgabe, in der Manelis und Tharp (1977) zwei Wörter simultan präsentierten, die Erkennung pseudosuffigierter Wortpaare (z.B. fancy - nasty, vgl. deutsch Kuchen - Knochen) keine längeren Reaktionszeiten als die Erkennung echt suffigierter Wortpaare (z.B. bulky - dusty, vgl. deutsch Schiffchen - Kindchen). Es zeigte sich somit kein Pseudosuffigierungseffekt. Für Paare, die aus einem pseudosuffigierten und einem echt suffigierten Wort bestanden (z.B. fancy - dusty, vgl. deutsch Kuchen - Kindchen), zeigten sich dagegen längere Reaktionszeiten. Das spricht zumindest dafür, daß echt suffigierte und pseudosuffigierte Wörter unterschiedlich verarbeitet werden können. McQueen und Cutler (1998) schlagen zu diesem Ergebnis vor, daß möglicherweise bei dem gleichzeitigen Erscheinen eines echt suffigierten Wortes, das dekomponierbar ist, auch ein strategiebedingter Parsingversuch für das pseudosuffigierte Wort gefördert wird, was zu Verarbeitungsschwierigkeiten und damit zu längeren Reaktionszeiten führt. Feldman et al. (1995) gaben englischsprachigen Versuchspersonen in einer sogenannten Segment-Shifting Task die Aufgabe, das zweite Wort eines Paares mit dem unterstrichenen Teil des ersten zu kombinieren (z.B. harden - bright, vgl. deutsch laufen - lieb oder garden - bright, vgl. deutsch Garten - lieb). Die Lösung der Aufgabe erwies sich als leichter, wenn der unterstrichene Teil aus einem Morphem bestand (harden). Ähnliche Ergebnisse erzielten Feldman und ihre Kollegen auch im Hebräischen (Feldman et al. 1995). In einer entsprechenden Studie zum Serbischen, in der derivierte und flektierte Wortformen in unterschiedlichen Bedingungen präsentiert wurden, konnte Feldman (1994) den morphembasierten Verarbeitungsvorteil nur bei flektierten Formen beobachten. Diese Ergebnisse weisen nach Feldman (1994) nicht nur daraufhin, daß die morphologische Struktur eines Wortes zu seiner Erkennung beitragen kann, sondern die unterschiedlichen Resultate für Flexions- und Derivationsmorphologie werden auch als Evidenz dafür gewertet, daß die morphologische Struktur für Flexionsformen transparenter ist als für Derivationsformen. Obwohl von der Autorin nicht diskutiert, ist dieses Ergebnis besonders interessant, da es sich bei den flektierten Formen ausschließlich um regulär flektierte Formen handelt. Das spricht für morphologische Dekomposition im Fall regulär flektierter Wörter - ein Ergebnismuster, das auch das linguistisch orientierte Duale Modell vorhersagen würde. Mit den Beobachtungen von Feldman (1994) zu Derivationsformen stimmen auch empirische Befunde von Bergman et al. (1988) zum Niederländischen überein, die berichten, in

53 lexikalischen Entscheidungsaufgaben mit pseudosuffigierten (schouder 'Schulter') und echt suffigierten Derivationsformen (bakker 'Bäcker') keinen Reaktionszeitunterschied im Vergleich zu gleichlangen monomorphemischen Kontrollwörtem (tafel 'Tisch') gefunden zu haben. Da in diesen Studien die semantische Transparenz der untersuchten Derivationsformen allerdings nicht berücksichtigt wurde, könnten die beobachteten Ergebnisse ausschließlich auf semantisch intransparente Formen unter den Testitems zurückzuführen sein. Die Ergebnisse sprechen jedoch zumindest gegen allgemein obligatorische Dekomposition bei der Verarbeitung derivierter Wortformen.

Zwischenergebnisse Insgesamt betrachtet weisen die beschriebenen Ergebnisse darauf hin, daß für die Erkennung eines komplexen Wortes sowohl die direkte Zugriffsmöglichkeit auf die Vollform als auch ein morphologischer Parsingprozeß zur Verfügung steht Damit unterstützen die Ergebnisse eher ein duales Modell als ein imitates, das entweder obligatorische Dekomposition oder ausschließlichen Vollformzugriff annimmt. Die Untersuchungen von Bergman et al. (1988), Feldman (1994) und Feldman et al. (1995) zeigen zusammengenommen, daß Dekompositionseffekte für derivierte Wortformen im allgemeinen weniger robust sind als für (regulär) flektierte Wortformen. Von den Modellen mit zwei Verarbeitungswegen ist damit das Duale Modell, in dem reguläre, per Default flektierte Wortformen in Stamm und Affix dekomponiert werden, am ehesten in der Lage, die Ergebnisse zu erklären.

3.2.2 Frequenzeffekte Häufig wird die lexikalische Entscheidungsaufgabe auch zur Untersuchung von Frequenzeffekten herangezogen. Die Beobachtung, daß hochfrequente Wörter schneller verarbeitet werden als niedrigfrequente, gehört zu den robustesten Ergebnissen im Rahmen von Untersuchungen zur visuellen Worterkennung (z.B. Rubenstein & Pollack 1963, Forster & Chambers 1973, Scarborough et al. 1977, Gernsbacher 1984). Wie bereits in Abschnitt 1.3.1 erläutert, werden zwei unterschiedliche lexikalische Ansätze zur Erklärung von Frequenzeffekten herangezogen. Der erste Ansatz basiert zu großen Teilen auf dem klassischen LOGOGEN-Modell (Morton 1969, 1970), von dem die aktuellen interaktiven und konnektionistischen Modelle Weiterentwicklungen sind. In diesen Modellen ist der Aktivierungsgrad (resting level activation) häufig benutzter Repräsentationen im Ruhezustand höher als der Aktivierungsgrad selten benutzter Repräsentationen. Ein hochfrequentes Wort braucht für seine Aktivierung daher weniger Stimulus-Information als ein niedrigfrequentes und ist daher schneller verfügbar. Im zweiten Ansatz, in dem das Lexikon seriell organisiert ist, sind lexikalische Repräsentationen nach ihrer Erscheinenshäufigkeit geordnet, beginnend mit den am höchsten frequenten Repräsentationen. Da das Lexikon während der Worterkennung nach passenden Repräsentationen durchsucht wird, werden hochfrequente Einträge schneller gefunden als niedrigfrequente (Rubenstein et al. 1970, Forster 1976, Forster 1979). Frequenzeffekte werden häufig als diagnostisches Instrument zur Untersuchung von Worterkennungsprozessen, insbesondere zu der Gewinnung von Evidenz für oder gegen

54

morphologische Dekomposition, herangezogen. Dem liegt die Überlegung zugrunde, daß, falls die morphologische Struktur bei der Worterkennung keine Rolle spielt, nur die Frequenz der vollen Wortform, nicht aber die Frequenz der Konstituenten, die Worterkennungszeit beeinflussen sollte. Wenn dagegen eine komplexe Wertform dekomponiert wird, sollte die Frequenz des Stamms ausschlaggebend sein. Beim Studium von Frequenzeffekten müssen allerdings neben den in Abschnitt 1.3.2 beschriebenen alternativen Erklärungen für unterschiedliche Reaktionszeiten in lexikalischen Entscheidungsaufgaben zahlreiche Variablen berücksichtigt werden. So können für morphologisch komplexe Wörter verschiedene Frequenzen unterschieden werden, welche die Geschwindigkeit der Worterkennung möglicherweise beeinflussen. In der folgenden Liste sind die in lexikalischen Entscheidungsaufgaben untersuchten Frequenzen zusammengestellt. •

WORTFORMFREQUENZ (surface frequency) - die Token-Frequenz der vollen Wortform, d.h. einer bestimmten flektierten Form



STAMMFREQUENZ (combined stem frequency) - die Token-Frequenz des Stamms in allen flektierten Formen eines bestimmten Wortes



SUMMIERTE STAMMFREQUENZ (combined stem frequency oder cluster frequency1) - die Token-Frequenz des Stamms in allen flektierten Formen eines bestimmten Wortes und seinen derivierten Formen und Komposita.



WORTFREQUENZ (word frequency) - die Token-Frequenz des Wortes einschließlich aller flektierten Formen (die bei irregulären Wortformen mit Stammveränderung größer als die Stammfrequenz ist).



AFFIXFREQUENZ (affix frequency) - die Token-Frequenz eines bestimmten Affixes.



RELATIVE FREQUENZ - das Verhältnis der Wortformfrequenz zur Stammfrequenz.

Eine sichere Interpretation einzelner Frequenzeffekte wird durch eine Reihe von Faktoren erschwert. Erstens korrelieren die oben erwähnten verschiedenen Frequenzen sehr oft stark miteinander.2 Methodisch ergibt sich daraus das Problem, daß die Variation einer einzelnen Frequenz bei Konstanthaltung aller anderen oft nicht möglich ist. Wird allerdings bei der Auswahl der Testitems solch eine Kovariation nicht vermieden, sind Mißinterpretationen nicht auszuschließen. Darüber hinaus sollte auch, wie Hay (2001) argumentiert, das Verhältnis von Wortformfrequenz und Stammfrequenz beachtet werden. Hays Untersuchungen

In der englischsprachigen Literatur wird der Terminus combined stem frequency sowohl zur Bezeichnung der Stammfrequenz eines bestimmten Wortes (hier Stammfrequenz) als auch zur Bezeichung der Stammfrequenz des Grundwortes plus der Vorkommenshäufigkeit des Stamms in allen derivierten Formen und Komposita (hier: summierte Stammfrequenz) verwendet. Zur Vermeidung dieser Ambiguität haben Alegre und Gordon (1999) für die summierte Stammfrequenz den Begriff cluster frequency eingeführt. Eine Frequenzanalyse der Präteritumformen von deutschen irregulären ABB-Verben (d.h. Verben mit derselben Stammveränderung im Präteritum- und im Partizipstamm) zeigt zum Beispiel, daß die Frequenzen für Wort, B-Stamm, Präteritumstamm und Wortform hochsignifikant (p< .001) miteinander korrelieren.

55

liefern Evidenz für die Annahme, daß komplexe Wortformen, die eine relativ hohe Frequenz im Verhältnis zu ihrem Stamm aufweisen (z.B. insane - sane), eher als Vollform gespeichert sind als Wortformen, die eine niedrigere Frequenz als ihr Stamm haben (infirm firm). Zweitens ist die Größe des Korpus, der den Frequenzberechnungen zugrunde liegt, möglicherweise von Belang. Insbesondere bei der Benutzung von relativ kleinen Korpora (z.B. Kucera & Francis 1967) tendieren die Frequenzen im niedrigen Frequenzbereich dazu, unterschätzt zu werden (vgl. Gernsbacher 1984). Drittens konnte in einer Reihe von Untersuchungen beobachtet werden, daß Frequenzeffekte, die auf die Dekomposition bestimmter Wortformen schließen lassen, zwar unterhalb einer bestimmten Frequenzschwelle auftreten, aber nicht oberhalb. Im Englischen beobachteten Gordon und Alegre (1999) und Alegre und Gordon (1999) Wortformfrequenzeffekte für regulär flektierte Wortformen, die häufiger als sechs mal pro Million benutzt wurden, aber Stammfrequenzeffekte für Wortformen, die weniger häufig benutzt wurden. Das deutet darauf hin, daß das Wortverarbeitungssystem möglicherweise über die Fähigkeit verfügt, für Wortformen, die ursprünglich dekomponiert wurden, ab einer bestimmten Gebrauchsfrequenz eine eigene Vollformrepräsentation zu etablieren. Auch diese mögliche Frequenzschwelle muß bei der Interpretation von Frequenzeffekten in Betracht gezogen werden. Viertens konnten Schreuder und Baayen (1997) und de Jong et al. (2000) beobachten, daß die Erkennungszeit monomorphemischer Nomina in lexikalischen Entscheidungsaufgaben - bei konstanter Stamm- und Wortformfrequenz - auch durch die Type-Größe der morphologischen Familie (morphological family size) mitbestimmt wird, d.h. für Nomina, die in vielen Derivationsformen und Komposita vorkommen, wurden kürzere Erkennungszeiten beobachtet als für Nomina, die nur in wenigen anderen Wörtern als Morphem enthalten sind. Die summierte Stammfrequenz (Token-Frequenz) der einzelnen Mitglieder einer Familie hatte dagegen keinen Einfluß auf die Erkennungszeiten. Fünftens argumentieren einige Autoren dafür, daß die Homonymität von Affixen, d.h. das Phänomen, daß Affixe in zwei oder mehr semantischen oder syntaktischen Funktionen identisch sind, zu Konflikten bei der lexikalischen Verarbeitung führt. Zur Vermeidung dieser Konflikte werde daher eine Vollformverarbeitung für Wortformen mit einer homonymen Affixform begünstigt. Diese Vollformverarbeitung wird manchmal für alle Wortformen angenommen, die eine homonyme Affixform enthalten (Bertram et al. 2000a, Bertram et al. 2000b), woanders nur für diejenigen Wortformen, die die weniger frequente Affixform enthalten (Baayen et al. 1997, s.u. für eine kritische Diskussion). Sollen Frequenzeffekte im Rahmen eines Wortverarbeitungsmodells interpretiert werden, ist schließlich die Beurteilung, ob sie eher Aufschluß über Repräsentationen und Prozesse auf der Zugriffsebene geben oder aber Eigenschaften des zentralen Lexikons reflektieren, von besonderer Bedeutung (vgl. Balota 1994). Über ihren Entstehungsort herrscht allerdings Uneinigkeit: Forscher, die prälexikalische Dekomposition annehmen, schreiben Stammfrequenzeffekte in lexikalischen Entscheidungsaufgaben zum Beispiel Prozessen auf der Zugriffsebene zu (z.B. Taft 1979a). Der gleichen Auffassung sind auch Gordon und Alegre (1999). Eine gegenteilige Ansicht vertreten Burani et al. (1984), die für Dekomposition im Lexikon plädieren und den Entstehungsort von Stammfrequenzeffekten dementsprechend im zentralen Lexikon sehen (s. Abschnitt 2.2.3). Baayen et al. (1997) weisen außerdem darauf

56

hin, daß in einer Version des AUGMENTED ADDRESSED MORPHOLOGY Modells Stammfrequenzeffekte ausschließlich auf der Ebene der zentralen Repräsentationen lokalisiert werden (Laudanna et al. 1992), in einer anderen Version dagegen sowohl Zugriffsrepräsentationen als auch zentrale Repräsentationen als Verursacher für die Effekte in Frage kommen (Caramazza et al. 1988). McQueen und Cutler (1998) führen sowohl Wortformals auch Stammfrequenzeffekte auf Eigenschaften der Repräsentationen im zentralen Lexikon zurück. Die Vielzahl der Faktoren, die beim Studium von Frequenzeffekten relevant sind, tragen möglicherweise dazu bei, daß die aus diesem methodischen Paradigma gewonnenen Ergebnisse nicht sehr einheitlich sind.

(i)

Stamm- und Wortformfrequenzeffekte

In lexikalischen Entscheidungsaufgaben beobachtete Taft (1979a), daß bei konstanter Wortformfrequenz die Reaktionszeiten auf monomorphemische, nichtflektierte Nomina (parent) und regulär flektierte Nomina (oceans) und Verben (priced, cares, guessing) durch die variierte Stammfrequenz mitbeeinflußt wurden. Taft wertete dieses Ergebnis als Evidenz dafür, daß nicht die Vollform, sondern der im Zuge prälexikalischer Dekomposition isolierte Stamm als Zugriffsrepräsentation für alle flektierten Varianten fungiert. Bei konstanter Stammfrequenz dagegen wurden die Reaktionszeiten auf nichtflektierte und regulär flektierte Wortformen durch die variierte Wortformfrequenz beeinflußt. Dies ist nach Taft allerdings keine Gegenevidenz zu prälexikalischer Dekomposition, sondern reflektiert die Frequenz der vollen Wortform im Lexikon. „In other words, the claim is being made that words are stored in their base forms in the peripheral file, but in their surface forms in the master file. In order to explain the present results, then, one must assume that frequency plays a role in two places: the peripheral file and the master file." (TafU979a:270)

Vergleichbare Ergebnisse erzielten Burani et al. (1984) für italienische Verben. Anders als Taft (1979a) schlössen sie - im Rahmen des AUGMENTED ADDRESSED MORPHOLOGY Modells - aus den beobachteten Stamm- und Wortformfrequenzeffekten allerdings auf das Gegenteil, nämlich Repräsentationen für volle Wortformen auf der Zugriffsebene und morphologisch dekomponierte Repräsentationen im zentralen Lexikon: „[...] it is assumed that the access system is based on whole-word units which address morphologically decomposed lexical representations." (Burani et al. 1984:350)

Auch McQueen und Cutler (1998) sehen in Stammfrequenzeffekten deutliche Evidenz dafür, daß morphologische Informationen für die Worterkennung zwar eine Rolle spielen, aber nicht notwendigerweise der Zugriffsebene zugeschrieben werden müssen. Unter der Annahme, daß sowohl Stämme als auch Vollformen lexikalisch gespeichert sind, schlagen die Autoren vor, daß „[...] these results are also consistent with any model in which morphological information is represented in the central lexicon in which lexical entries are frequency sensitive. If representations of stems are linked to those of whole word forms in a cluster, either within a shared entry or

57 in a network, then recognition of any word in that cluster should be sensitive both to combined stem frequency and its own surface frequency." (McQueen & Cutler 1998:422)

Stammfrequenzeffekte treten allerdings nicht in allen Untersuchungen einheitlich für alle Wortformtypen auf. So fanden Sereno und Jongman (1997) für nichtflektierte Verben zwar Wortform-, aber keine Stammfrequenzeffekte. Auch für flektierte Verben zeigten sich Wortformfrequenzeffekte (Stammfrequenzeffekte für flektierte Verben wurden nicht untersucht). Ähnlich beobachteten Katz et al. (1991) für nichtflektierte englische Verben nur Wortform-, aber keine Stammfrequenzeffekte. Für regulär flektierte Verben waren die Ergebnisse ambig: Bei Past-Tense-Verbformen (walked) konnten nur Wortformfrequenzeffekte beobachtet werden, bei den niedriger frequenten Present-Perfect-Verbformen (walking) dagegen sowohl Wertform- als auch Stammfrequenzeffekte. In psychologisch orientierten Modellen sind diese zum Teil widersprüchlichen Ergebnisse schwer zu erklären, wie auch McQueen und Cutler (1998) anmerken: „Although effects of combined stem frequency are fairly reliable for inflected verbs, the evidence is somewhat contradictory for uninflected verb forms. [...]. The results for both nouns and verbs are therefore somewhat inconclusive." (McQueen & Cutler 1998:421)

In dem linguistisch orientierten Ansatz des Dualen Modells ergibt sich allerdings ein konsistenteres Bild, wenn man berücksichtigt, daß die untersuchten flektierten Wortformen regulär flektierte waren: Der von McQueen und Cuüer (1998) als „ziemlich verläßlich" bezeichnete Stammfrequenzeffekt für regulär flektierte Wortformen ist schlüssig mit der Annahme zu erklären, daß diese Formen dekomponiert als Stamm und Affix repräsentiert sind.

(ii)

Frequenzeffekte bei niederländischen Pluralen

Da in dieser Arbeit die mentale Repräsentation deutscher Pluralformen untersucht werden soll, sind empirische Befunde zu Frequenzeffekten von Pluralformen aus einer so eng benachbarten Sprache wie dem Niederländischen besonderes interessant. Deshalb soll hier auf eine Studie von Baayen et al. (1997) etwas näher eingegangen werden. Baayen et al. (1997) testeten die Verarbeitung von niederländischen Nomina, die ihren Plural mit dem Affix -en bilden, in mehreren lexikalischen Entscheidungsaufgaben. Wurden diese Nomina im Singular (d.h. nichtflektiert) präsentiert, beeinflußte nur die Stammfrequenz die Erkennungszeit, wurden sie allerdings im Plural präsentiert, zeigte sich stets ein hochsignifikanter Wortformfrequenzeffekt. Dieses Ergebnis werteten die Autoren als Evidenz dafür, daß für die Verarbeitung von Singularformen niederländischer Nomina die Stammfrequenz ausschlaggebend ist, während bei der Verarbeitung der Pluralformen die Wortformfrequenz die entscheidende Rolle spielt. In einem parallelen Experiment, in dem die zuvor untersuchten Nomina (Plural auf -en) zusammen mit irregulären Verbformen im Singular (d.h. ohne Person/Numerus-Flexion, z.B. liep 'lief) und im Plural (d.h. mit Person/Numerus-Flexion, z.B. Hepen 'liefen') getestet wurden, zeigten sich allerdings für die Verbformen keinerlei Wortformfrequenzeffekte: Einzig die Frequenz des irregulären Verbstamms (liep) bestimmte hier die Erkennungszeit (s. Tabelle 5).

58

Kategorie

Beispiel

Stammfrequenz

Singularfrequenz

Plural-

RT

frequenz

für Singular

RT für Plural

N

dorp/dorpen

34

27

7

545

611

V

liep/liepen

34

27

7

603

612

Tabelle 5: Durchschnittliche Frequenzen (p. 42 Mio.) und Reaktionszeiten (RT, in msek) fllr Nomina und Verben im Singular und Plural (Baayen et al. 1997, Exp. 3) Baayen et al. (1997) erklären diese Ergebnisse, in denen sich im Vergleich zu ihren Singularen zwar für nominale -en Plurale längere Verarbeitungszeiten zeigen, nicht aber für verbale, durch die Annahme eines Subkategorisierungskonflikts, der beim Zugriff auf nominale, nicht aber auf verbale Plurale entsteht: Sie gehen dabei von der Annahme einer einzigen, homonymen Zugriffsrepräsentation für das Affix -en aus. Diese ist mit zwei getrennten Lemma-Repräsentationen für das verbale -en (hier der Einfachheit halber: ENverb) und das nominale -en (ENnom) verbunden. Da ENverb frequenter ist als ENnom, wird die Verbindung von der Zugriffsrepräsentation lenl zu ENverb früher aktiviert als die Verbindung von /en/ zu ENnom und muß erst wieder deaktiviert werden, bevor ENnom aktiviert werden kann. So entstehen die im Vergleich zu Singularen längeren Erkennungszeiten für nominale -en Plurale. Diese Deutung der Ergebnisse beruht auf der Voraussetzung, daß es für verbales und nominales Suffix -en nur eine einzige, gemeinsame Zugriffsrepräsentation gibt. Berücksichtigt man die hohe Frequenz der Affixe (1,3 Mio. für nominales -en und 2,4 Mio. für verbales -en lt. CELEX), ist eine gemeinsame Zugriffsrepräsentation allerdings unwahrscheinlich. Außerdem stellt das verbale -en in seinen weitaus meisten Verwendungsweisen das Infinitivsuffix und nicht ein Pluralsuffix dar, was einen direkten Vergleich des verbalen -en mit dem nominalen Pluralsuffix -en noch problematischer macht. Darüber hinaus hat die Interpretation der Autoren zur Voraussetzung, daß der Zugriff auf das Suffix vor dem Zugriff auf den Stamm erfolgt („the suffix will be identified before the stem", Baayen et al. 1997:110). Die Annahme einer solchen Verarbeitungsrichtung wird in der Literatur zu diesem Thema allerdings durch kein weiteres Experiment belegt. Eher könnte, insbesondere im Rahmen eines interaktiven Aktivierungsmodells, zu dessen Vertretern sich auch Baayen et al. zählen, im Gegenteil erwartet werden, daß ein so hochfrequentes Affix wie -en extrem wenig zur Worterkennung beiträgt und daher später als der Stamm aktiviert wird (s. Taft 1994). Schließlich kann die Interpretation von Baayen et al. nicht befriedigend erklären, warum die Erkennungszeit für die verbalen Plurale ebenso lang ist wie die Erkennungszeit für die nominalen (612 bzw. 611 msek). Aufgrund des angenommen Kategorisierungskonflikts sollten für nominale Plurale längere Erkennungszeiten als für verbale zu erwarten sein. Die Autoren, die diesen Befund selbst als problematisch diskutieren, kommen letztlich zu dem Schluß, daß dies ein Zufall ist („We conclude that the similar response latencies in Experiment 3 for noun and verb plurals are a coincidence", Baayen et al. 1997:110). Insgesamt sind die Ergebnisse zum niederländischen Plural im Rahmen des MORPHOLOGICAL RACE Modells nur relativ schwer und mit einigen Zusatzannahmen zu interpretieren. Der Ansatz des Dualen Modells bietet dagegen eine alternative, direkte Erklärung: Unter der Annahme, daß im Niederländischen, wie im Deutschen und Englischen, die Pluralbildung mit -en nicht den Defaultfall darstellt, ergibt sich gemäß dem Dualen

59 Modell die Vorhersage, daß die Plurale auf -en als Vollformen gespeichert sind. Damit entspricht der beobachtete Wortformfrequenzeffekt für diesen Pluraltyp klar der Vorhersage des Modells. Im Fall der mit -en affigierten Verben handelt es sich dagegen um eindeutig reguläre Person/Numerus-Flexion, für die das Duale Modell ebenso eindeutig Dekomposition und damit Stammfrequenzeffekte vorhersagt (s. Abschnitt 2.2.3, Punkt (ii)). Auch diese Vorhersage stimmt mit den Ergebnissen der Untersuchungen von Baayen et al. (1997) überein. Eine solche Interpretation hängt, wie soeben erwähnt, wesentlich von der Annahme ab, daß die Pluralbildung mit -en im Niederländischen nicht der Defaultfall ist. Diese Annahme könnte in lexikalischen Entscheidungsaufgaben mit der zweiten möglichen niederländischen Pluralform, nämlich dem -s Plural, überprüft werden. Sollte dabei beobachtet werden, daß Plurale dieser Klasse anders als -en Plurale verarbeitet werden, d.h. träten bei -s Pluralen (im Gegensatz zu -en Pluralen) nur Stammfrequenzeffekte auf, könnte dies als Evidenz für den Defaultstatus der -5 Plurale im Sinne des Dualen Modells interpretiert werden. Wenn auch von solchen Untersuchungen in Baayen et al. (1997) nicht berichtet wird, sprechen jedoch andere Indizien für eine Kategorisierung der Pluralbildung mit -s als Default. Hierzu zählt zum Beispiel die Tatsache, daß für manche niedrigfrequente Nomina sowohl die Affigierung mit -5 als auch die Affigierung mit -en zur Pluralbildung möglich ist. Dabei wird von Muttersprachlern der -en Plural, im Gegensatz zum -5 Plural, zumeist als veraltet beurteilt (Janet Grijzenhout, mündliche Mitteilung). Unter der Annahme, daß wenig frequente Formen während des Sprachwandels dazu neigen, regularisiert zu werden, spricht die Bevorzugung des -5 Plurals dafür, daß dies die reguläre Form ist. Darüber hinaus zeigt eine Studie von Krott (2001), in der die Bildung niederländischer Komposita untersucht wurde, daß die Pluralform mit -s im Gegensatz zur Pluralform mit -n nie in Komposita auftritt. Das niederländische Pluralffix -s verhält sich damit wie das deutsche Pluralaffix -s, das ebenfalls nicht in Komposita auftritt. Vertreter des Dualen Modells werten diese Beobachtung als Indiz dafür, daß -s im Gegensatz zu allen anderen Pluralsuffixen das Defaultaffix ist (s. Abschnitt 4.3).

(iii) Frequenzeffekte bei deutschen Partizipien Die unterschiedlichen Ergebnisse der oben vorgestellten lexikalischen Entscheidungsaufgaben weisen, trotz ihrer teilweisen Inkonsistenz, zusammengenommen darauf hin, daß für die lexikalische Verarbeitung komplexer Wortformen beide Mechanismen, sowohl der Vollformzugriff als auch die Dekomposition in Konstituenten, zur Verfügung stehen. Es wurde dafür argumentiert, daß von den Lexikonmodellen, die zwei Verarbeitungswege annehmen, das Duale Modell am ehesten in der Lage ist, die unterschiedlichen Ergebnisse zu erklären. Eine Studie, in der zur expliziten Überprüfung des Dualen Modells lexikalische Entscheidungsaufgaben zu deutschen Partizipien durchgeführt wurden (Clahsen et al. 1997), ist für diese Argumentation von besonderem Interesse und soll deshalb ausführlich dargestellt werden. Deutsche Verbformen bieten sich für eine Überprüfung des Dualen Modells deshalb an, weil hier eine klare Unterscheidung zwischen regulärer und irregulärer Flexion getroffen werden kann. Die letztere ist an einer Veränderung des Stammvokals in Formen des Präteritums und/oder Partizips erkennbar. Gegenüber dem Englischen hat das Deutsche

60 darüber hinaus die Vorteile, daß sowohl reguläre als auch irreguläre Partizipien ein Affix (-/ bzw. -eri) aurweisen, und daß die Unterscheidung zwischen regulärer und irregulärer Flexion weniger durch Frequenzunterschiede verzerrt wird (Marcus et al. 1995). Nach den Vorhersagen des Dualen Modells sollten irreguläre Partizipformen (z.B. gelaufen) eine Vollformrepräsentation haben, was Effekte für die Frequenz der Partizipform erwarten läßt. Für die Erkennungszeiten regulärer Partizipien (z.B. geöffnet) sollte dagegen die Wortformfrequenz keine Rolle spielen. Um auszuschließen, daß etwaige Verarbeitungsunterschiede auf besondere Eigenschaften des irregulären Stamms zurückzuführen sind, wurden als Vertreter für die irregulären Partizipien in einem ersten Experiment nur sogenannte ABA-Verben gewählt, deren Partizipstamm keine Vokalveränderung gegenüber dem Präsensstamm zeigt (z.B. laufen - gelaufen). Formal unterschieden sich reguläre und irreguläre Partizipien damit nur in ihrem unterschiedlichen Suffix. Die sich daraus ergebenden vier Experimentbedingungen (reguläre vs. irreguläre Partizipien, hochvs. niedrigfrequente Partizipien) sind in Tabelle 6 zusammen mit den durchschnittlichen Frequenzen3 der untersuchten Partizipien und den erzielten durchschnittlichen Reaktionszeiten dargestellt (Clahsen et al. 1997, Experiment 2). niedrige Wortformfrequenz

hohe Wortformfrequenz

Frequenz

Beispiel

RT

Frequenz

Beispiel

RT

regulär

78

gepflanzt

61 3 msek

379

geöffnet

61 7 msek

irregulär

81

gegraben

652 msek

364

gelaufen

593 msek

Tabelle 6: Durchschnittliche Frequenzen, Beispiele und Reaktionszeiten (RT) für reguläre und irreguläre Partizipien der Klasse ABA (Clahsen et al. 1997, Experiment 2)

Die Daten zeigen, daß es für die Partizipien irregulärer Verben einen starken Frequenzeffekt gab; die Differenz von 55 msek zwischen den Erkennungszeiten für niedrig- und hochfrequente irreguläre Partizipien war hochsignifikant (p < .001). Dagegen zeigte sich für die Partizipien regulärer Verbformen kein Frequenzeffekt (Differenz -4 msek; p = .780). In einem weiteren Experiment (Clahsen et al. 1997, Experiment 3) wurde untersucht, ob sich das Ergebnismuster für die Partizipien von ABA-Verben auch für andere Klassen von irregulären Verben zeigte. Dazu wurden reguläre Verben mit ABB-Verben konstrastiert, deren Partizipstamm dieselbe Vokalveränderung aufweist wie der Präteritumstamm (z.B. liehen - geliehen). Um die linguistische Basis von Frequenzeffekten genauer zu bestimmen, wurden in diesem Experiment neben der Wortformfrequenz auch die Stammfrequenz (die bei Partizipien der Klasse ABB aus der Token-Frequenz der Präteritumformen plus der Token-Frequenz der Partizipformen besteht) und die Wortfrequenz insgesamt (die bei regulär flektierten Wertformen mit der Stammfrequenz identisch, bei irregulären Wortformen dagegen größer als die Frequenz des B-Stamms ist) systematisch variiert bzw. kontrolliert. Die Testitems wurden so ausgewählt, daß die durchschnittlichen Stammfrequenzen in allen 3

Die Frequenzberechnungen erfolgten auf der Grundlage des CFJJiX-Korpus für das Deutsche (Baayen et al. 1993). In die Berechnungen wurden jeweils die Frequenzen des Grundverbs und die Frequenzen seiner lexikalischen Varianten mit abtrennbaren Präfixen mit einbezogen.

61

Bedingungen konstant und die Wortfrequenzen der irregulären Partizipien gegenläufig zu den Wortformfrequenzen waren. Ein möglicher Wortformfrequenzeffekt war somit eindeutig auf die Partizipfrequenz zurückführbar und konnte weder an der Stamm- noch an der Gesamtfrequenz des Wortes liegen. In Tabelle 7 sind die verschiedenen durchschnittlichen Frequenzen, Beispiele und Reaktionszeiten für die einzelnen Bedingungen zusammengestellt. hohe Wortformfrequenz

niedrige Wortformfrequenz Wortform

Stamm

Wort

RT

Wortform

Stamm

Wort

RT

regulär

23 (gefischt)

144

144

712msek

52 (gefälscht)

144

144

720 msek

irregulär

22 (gekniffen)

146

501

786 msek

50 (geliehen)

137

255

728 msek

Tabelle 7: Durchschnittliche Frequenzen, Beispiele und Reaktionszeiten (RT) für reguläre und irreguläre Partizipien der Klasse ABB (Clahsen et al. 1997, Experiment 3)

Trotz gleich gehaltener Stammfrequenz und gegenläufiger Wortfrequenz zeigten die Ergebnisse das gleiche Muster wie im Experiment zuvor. Wieder war für die Partizipien irregulärer Verben ein starker Wortformfrequenzeffekt beobachtbar, der mit einer Differenz von 74 msek zwischen den Erkennungszeiten für niedrigfrequente und hochfrequente Partizipien mit p < .001 hochsignifikant war. Dagegen zeigte sich auch diesmal für die Partizipien regulärer Verbformen kein Wortformfrequenzeffekt (-8 msek; p = 0.568). Die ähnlich langen Erkennungszeiten für reguläre Partizipien wiesen vielmehr auf einen Effekt für die (gleich hohe) Stammfrequenz hin. In beiden lexikalischen Entscheidungsaufgaben hat sich somit ein hochsignifikanter Wortformfrequenzeffekt für die Partizipien irregulärer Verben gezeigt, was auf eine Vollformverarbeitung dieser Formen hinweist. Dieser Effekt war in keinem der beiden Experimente für die Partizipien regulärer Verben beobachtbar. Vielmehr zeigte das zweite Experiment, daß die Reaktionszeiten für reguläre Formen durch die Frequenz des Stamms zu erklären sind, was für eine Dekomposition dieser Formen spricht. Damit bestätigen beide Experimente die Annahmen des Dualen Modells, nach denen irregulär flektierte Wortformen als Vollform verarbeitet werden, wogegen regulär flektierte Wortformen in Stamm und Affix dekomponiert werden.

(iv)

Frequenzeffekte bei deutschen finiten Verbformen

In den beiden lexikalischen Entscheidungsaufgaben mit deutschen Verbformen (Clahsen et al. 1997) wurden nur Partizipien, die zu den nichtfiniten Formen zählen, untersucht. Diese Experimente lassen daher die Frage ungeklärt, wie Verbformen mit irregulären Stämmen, die finite, reguläre Person/Numerus-Flexion aufweisen, lexikalisch repräsentiert sind. Zur Beantwortung dieser Fragen führten Clahsen et al. (2001 a) eine lexikalische Entscheidungs-

62 aufgäbe durch, in der sie Verbformen mit irregulären Stämmen, aber regulärer Person/Numerus-Flexion untersuchten. Nach den Annahmen des Dualen Modells sollte erwartet werden, daß auch diese Formen in Stamm und Affix dekomponiert werden, da sie - ungeachtet ihres irregulären Stamms ein reguläres Affix aufweisen. Es sollten deshalb keine Wortformfrequenzeffekte auftreten, sondern die Reaktionszeiten sollten vielmehr eine Funktion der Stammfrequenz sein. Für dieses Experiment wurden 52 irreguläre Verben ausgewählt, die jeweils in der Flexionsform für die 1./S.Person Plural (z.B. tranken) präsentiert wurden. Um den Effekt der Stammfrequenz zu bestimmen, wurden die Items paarweise so auf zwei Bedingungen verteilt, daß die Wortfrequenz und die Wortformfrequenz konstant waren, während sich die Stammfrequenzen unterschieden.4 Die durchschnittlichen Frequenzen für die beiden Bedingungen sind zusammen mit den durchschnittlichen Reaktionszeiten in Tabelle 8 zusammengestellt. Die Ergebnisse zeigten, daß die Erkennungszeiten für Verbformen mit hoher Stammfrequenz um 44 msek kürzer waren als die Erkennungszeiten für Verbformen mit niedriger Stammfrequenz. Dieser Unterschied war mit/? < .001 hochsignifikant. Stammfrequenz

Wortformfrequenz

Wortfrequenz

RT

niedrige Stammfrequenz

79

16

411

641 msek

hohe Stammfrequenz

135

19

414

597 msek

Tabelle 8: Durchschnittliche Frequenzen und Reaktionszeiten (RT) für irreguläre Verbformen mit regulärer Person/Numerus-Flexion (Clahsen et al. 2001 a, Experiment 3)

Da sowohl Wortform- als auch Wortfrequenz in beiden Bedingungen konstant gehalten waren, konnte der starke Reaktionszeitunterschied auf einen Effekt der Frequenz des irregulären Präteritumstamms zurückgeführt werden. Dieses Ergebnis zeigt somit, daß auch Wortformen mit irregulären Stämmen, die ein reguläres Affix enthalten, dekomponiert werden und konstituentenweise gespeichert sind. Dieser klare Dekompositionseffekt zeigt außerdem, daß die Annahme einer gemeinsamen Zugriffsrepräsentation für die homonyme Affixform -en, die nach Baayen et al. (1997) zu einer konfliktbedingten Vollformverarbeitung führt, zumindest für das Deutsche zurückzuweisen ist. Für eine weitere Unterstützung der Annahme, daß finite Verbformen mit irregulären Stämmen dekomponiert werden, und als ergänzende Überprüfung für die Annahme, daß irreguläre Partizipien separat gespeichert sind, eignen sich die finiten Formen deutscher ABB-Verben, die im Präteritum und im Partizip die gleiche Stammveränderung aufweisen. Dem liegt die folgende Überlegung zugrunde: Wenn die Speicherung irregulärer Stämme auf rein formaler Ähnlichkeit beruht, sollte die Gesamtfrequenz des B-Stamms (d.h. die

Wie in den Untersuchungen zu deutschen Partizipien (Clahsen et al. 1997) wurden in die Frequenzberechnungen zu deutschen finiten Verbformen die Frequenzen des Grundverbs und seiner lexikalischen Varianten mit abtrennbaren Präfixen mit einbezogen. Alle Frequenzberechnungen beruhten auf den Daten des CELEX-Korpus (Baayen et al. 1993).

63 Token-Frequenz der Präteritum- plus der Partizipformen) die lexikalischen Entscheidungszeiten beeinflussen. Wenn dagegen die Organisation irregulärer Stämme nach morphologischen Kriterien erfolgt, d.h. das Partizip separat gespeichert ist, sollte auch der Präteritumstamm, trotz seiner formalen Ähnlichkeit zum Partizip, separat gespeichert sein. Daher sollten die Erkennungszeiten nur die Frequenz des Präteritumstamms abbilden. Für diese Untersuchung wählten Clahsen et al. (2001 a) 30 ABB-Verben aus, die, wie in der Untersuchung zuvor, in der Flexionsform für die L/3.Person Plural (z.B. schrieben) präsentiert wurden. Die Items wurden paarweise so auf zwei Bedingungen verteilt, daß - bei gegenläufiger Wortfrequenz - die Gesamtfrequenz des B-Stamms konstant war, während sich die Frequenzen des Präteritumstamms unterschieden. Tabelle 9 zeigt die durchschnittlichen Frequenzen für die beiden Bedingungen, die der Übersichtlichkeit halber wieder zusammen mit den durchschnittlichen Reaktionszeiten angegeben sind. Wie diese Daten zeigen, waren die Erkennungszeiten für ABB-Verben mit hoher Präteritumstamm-Frequenz signifikant kürzer (45 msek) als die für ABB-Verben mit niedriger Präteritumstamm-Frequenz (F = 26.90, p < .001). Da die Wortfrequenz gegenläufig variiert wurde und die Frequenz des B-Stamm in beiden Bedingungen konstant war, konnte der beobachtete Unterschied in den Erkennungszeiten nur auf die unterschiedliche Frequenz des Präteritumstamms zurückgeführt werden. Präteritumstamm

B-Stamm

Wort

RT

niedrige Präteritumstamm-Frequenz

101

253

572

642 msek

hohe Präteritumstamm-Frequenz

165

251

444

594 msek

Tabelle 9: Durchschnittliche Frequenzen und Reaktionszeiten (RT) für irreguläre ABB-Verben mit regulärer Person/Numerus-Flexion (Clahsen et al. 2001 a, Experiment 4)

Dieses Ergebnis spricht dafür, daß der Präteritumstamm von ABB-Verben, obwohl er formal mit dem Partizipstamm identisch ist, separat gespeichert ist. Der Befund ergänzt und unterstützt daher das Ergebnis aus der lexikalischen Entscheidungsaufgabe von Clahsen et al. (1997, Experiment 3), in der sich Wortformfrequenzeffekte und damit Evidenz für die separate Repräsentation der Partizipien von ABB-Verben gezeigt haben.

(v)

Affixfrequenzeffekte

Die bisher berichteten Ergebnisse lieferten Vollformfrequenzeffekte für irreguläre Verbformen und Hinweise auf stammbasierte Speicherung für reguläre. Nach den Vorhersagen des Dualen Modells sollte aber nicht nur Evidenz für die Speicherung der Stämme regulärer Formen zu finden sein, sondern darüber hinaus auch Evidenz für die separate Speicherung der Affixe. Der Überprüfung dieser Vorhersage widmet sich eine Studie in Clahsen et al. (2001 a, Experiment 1). In dieser Studie sollte zum einen überprüft werden, ob sich der Dekompositionseffekt für regulär flektierte Verben, der in Clahsen et al. (1997) und Clahsen et al. (2001 a) nachgewiesen wurde und auf eine Dekomposition dieser Formen hinweist, auch für flektierte Adjektive zeigt, deren Flexion stets regulär ist. Zum anderen sollte untersucht

64 werden, ob nicht nur die Frequenz des Stamms, sondern auch die Frequenz des Affixes Einfluß auf die Erkennungszeiten regulär flektierter Formen hat. Dazu wurden Adjektive mit den Flexionsaffixen -s (z.B. reines) und -m (z.B. reinem) gewählt, die nicht nur unterschiedliche grammatische Eigenschaften haben, sondern sich auch in Type- und Token-Frequenz stark voneinander unterscheiden (Tabelle 10). Type-Frequenz

Token-Frequenz

Adjektive, flektiert mit -s

2286

12828

Adjektive, flektiert mit -m

1264

5965

Tabelle 10: CELEX-Frequenzen für Adjektive mit den Flexionsaffixen -s und -m

Trotz dieser insgesamt niedrigeren Frequenzen für mit -m flektierte Adjektive gibt es im Deutschen einige Adjektive, die - bei gleicher Stammfrequenz - häufiger mit -m als mit -5 auftreten, was bei der Auswahl der Materialien im vorliegenden Experiment ausgenutzt wurde. Es wurden 18 Adjektive ausgewählt, die häufiger mit -s erscheinen (-s dominante Adjektive), sowie 18 Adjektive, die häufiger mit -m affigiert werden (-m dominante Adjektive). Jedes dieser Adjektive wurde sowohl mit -m als auch mit -s präsentiert. Während die durchschnittliche Stammfrequenz für beide Adjektivgruppen konstant gehalten wurde (397 bzw. 402 lt. CELEX), wurde die Wortformfrequenz variiert. In vier experimentellen Bedingungen konnte somit niedrige und hohe Affixfrequenz unabhängig von niedriger und hoher Wortformfrequenz kontrastiert werden. Mit diesem Experimentplan war es möglich, die folgenden Vorhersagen zu überprüfen: (i)

Falls flektierte Adjektive (im Gegensatz zu regulär flektierten Verbformen) als Vollform verarbeitet werden, sollte sich in allen Bedingungen ein Wortformfrequenzeffekt zeigen, d.h. die Reaktionszeiten für Formen mit hoher Wortformfrequenz (z.B. ruhigem und reines) sollten kürzer sein als für diejenigen mit niedriger Wortformfrequenz.

(ii)

Falls dagegen flektierte Adjektive dekomponiert werden, aber nur die Frequenz des Stamms eine Rolle für die lexikalische Verarbeitung spielt, wäre ein Stammfrequenzeffekt zu erwarten, d.h. die Reaktionszeiten sollten (aufgrund der konstanten Stammfrequenz) in allen Bedingungen gleich sein.

(iii) Falls schließlich nicht nur die Frequenz des Stamms, sondern auch die Frequenz des Flexionsaffixes relevant für die Verarbeitung flektierter Adjektive ist, sollte dies zu kürzeren Reaktionszeiten für Adjektive führen, die mit dem hochfrequenten Affix -s flektiert sind. Tabelle 11 zeigt Beispiele für die untersuchten Adjektivformen zusammen mit den entsprechenden durchschnittlichen Frequenzen und Reaktionszeiten in den vier experimentellen Bedingungen dieser lexikalischen Entscheidungsaufgabe. Aus den angegebenen Werten ist ersichtlich, daß sich die Vorhersage (iii) bestätigt hat. Es zeigte sich kein Effekt für die Frequenz der vollen Wortform (in diesem Fall hätten die Reaktionszeiten für Wortformen mit niedriger Frequenz signifikant kürzer sein müssen als

65 für Wortformen mit hoher Frequenz), darüber hinaus konnte auch die Stammfrequenz allein nicht ausschlaggebend für die Reaktionszeiten gewesen sein (in diesem Fall hätten sie in allen Bedingungen gleich sein müssen). Dagegen war zu beobachten, daß Adjektivformen mit dem hochfrequenten Affix -s signifikant kürzere Reaktionszeiten erzielten als Adjektivformen mit dem niedrigfrequenten Affix -m(p = .005 für -m dominante und/? = .001 für -s dominante Adjektive). hohe Wortformfrequenz

niedrige Wortformfrequenz Frequenz

Beispiel

RT

Frequenz

Beispiel

RT

niedrige Affixfrequenz

7

reinem

609 msek

16

ruhigem

61 4 msek

hohe Affixfrequenz

8

ruhiges

568 msek

17

reines

564 msek

Tabelle 11: Beispiele, durchschnittliche Wortformfrequenzen und Reaktionszeiten (RT) für flektierte Adjektive in Clahsen et al. (2001a, Experiment l)

Diese Daten zeigen nicht nur, daß flektierte Adjektive, wie regulär flektierte Verben, in Stamm und Affix dekomponiert werden, sondern hefern darüber hinaus Evidenz für die Annahme, daß Affixe separat vom Stamm gespeichert sind und somit eigene mentale Repräsentationen haben.

Zwischenergebnisse Aus den verschiedenen Studien zu Frequenzeffekten kann in methodischer Hinsicht geschlossen werden, daß sowohl die Wortfrequenz, die Wortformfrequenz, die Stammfrequenz, die Affixfrequenz (bei regulären Affixen) als auch die Type-Frequenz der morphologischen Familie verarbeitungsrelevant sind. Das Gesamtbild der unterschiedlichen oben vorgestellten lexikalischen Entscheidungsaufgaben zeigt, daß unitäre Lexikonmodelle für eine Erklärung der Ergebnisse nicht ausreichen, da morphologisch komplexe Wortformen sowohl als Vollform verarbeitet als auch in ihre Konstituenten dekomponiert werden können: Für regulär flektierte Wortformen konnte beobachtet werden, daß die Erkennungszeiten von der Frequenz des Stamms und nicht von der Frequenz der vollen Wortform beeinflußt wurden, während für andere untersuchte Wortformen (Derivationsformen, nichtflektierte und irregulär flektierte Wörter) überwiegend Wortformfrequenzeffekte auftraten. Verläßliche Dekompositionseffekte für regulär flektierte Verben zeigten sich in verschiedenen Sprachen, z.B. in Untersuchungen zum Englischen (Taft 1979a), zum Italienischen (Burani et al. 1984), zum Niederländischen (Baayen et al. 1997) und zum Deutschen (Clahsen et al. 1997, Clahsen et al. 2001a). Vollformfrequenzeffekte konnten dagegen für niederländische -en Plurale und deutsche irreguläre Partizipien beobachtet werden. Dieses unterschiedliche Ergebnismuster kann am besten im Dualen Modell erklärt werden, in dem beide Verarbeitungsmechanismen, d.h. Dekomposition und Vollformzugriff, mit der linguistischen Unterscheidung zwischen regulärer und irregulärer Flexion in Beziehung gesetzt werden.

66

Einige Ergebnisse, z.B. die Beobachtungen von Taft (1979a), Katz et al. (1991) und Sereno und Jongman (1997), die auch für regulär flektierte englische Wortformen (oceans, walked) Vollformfrequenzeffekte beobachteten, scheinen dem Dualen Modell zu widersprechen. Sie erklären sich allerdings möglicherweise mit der hohen Frequenz der untersuchten Wörter: Wie oben erwähnt, zeigten die Ergebnisse von Alegre und Gordon (1999) und Gordon und Alegre (1999) zwar Dekompositionseffekte für niedrigfrequente regulär flektierte Wortformen, aber Vollformeffekte für hochfrequente. Die Autoren schließen daraus, daß hochfrequente Wortformen, obwohl sie regulär flektiert sind, ebenso wie irreguläre auf der Zugriffsebene als Vollform gespeichert sind. Der beobachtete Vollformfrequenzeffekt für hochfrequente reguläre Wortformen kann m.E. allerdings ebensogut mit der Annahme erklärt werden, daß durch eine häufige gleichzeitige Aktivierung von Stamm und Affix, wie dies bei hochfrequenten regulären Flexionsformen der Fall ist, eine sehr starke Gedächtnisverbindung etabliert wird. In lexikalischen Entscheidungsaufgaben wäre es demnach die Frequenz dieser Verbindung, die im Fall der hochfrequenten regulären Formen ausschlaggebend für die Erkennungszeiten wäre, und nicht die zugrundeliegenden, dekomponierten Repräsentationen für Stämme und Affixe. Die Annahme, daß durch das häufige gleichzeitige Erscheinen mehrerer Ereignisse (im vorliegenden Fall die gleichzeitige Aktivierung von Stamm und Affix) Schemata etabliert werden, die als Ganzes aus dem Gedächtnis abgerufen werden, beruht auf Erkenntnissen aus der Stereotypenforschung (vgl. Stephan 1989) und betrifft damit allerdings Mechanismen der Informationsspeicherung und -Verarbeitung, die nicht auf sprachliche Prozesse (wahrscheinlich noch nicht einmal auf Menschen) beschränkt sind, sondern in allen kognitiven Bereichen, in denen es um die Speicherung und den Abruf von Information geht, eine Rolle spielen. Es ist nicht anzunehmen, daß solche kognitiven Strategien im Bereich der Worterkennung außer Kraft gesetzt sind, sondern vielmehr eine zusätzliche Rolle spielen. Die im Dualen Modell getroffene grundsätzliche linguistische Unterscheidung zwischen regelbasierter Dekomposition und assoziativ basierter Speicherung bleibt davon unberührt.

3.2.3 Morphologische Beziehungen im mentalen Lexikon Für Worterkennungsmodelle spielt neben der Frage nach den Repräsentationen und Prozessen auf der Zugriffsebene, für deren Untersuchung die lexikalische Entscheidungsaufgabe die meistverwendete Methode ist, die Frage nach der Abbildung morphologischer Strukturen im zentralen Lexikon eine entscheidende Rolle. Zur Beantwortung dieser Frage wird vor allem untersucht, ob und wie morphologische Beziehungen im zentralen Lexikon repräsentiert sind. Die etablierteste und meistbenutzte Methode zur Untersuchung dieser Frage sind Experimente im Rahmen des morphologischen Primingparadigmas (s. Abschnitt 1.4). Der Grundgedanke bei der Anwendung dieser Methode ist die Annahme, daß ein TargetWort schneller erkannt werden kann, wenn ein morphologisch verwandtes Prime-Wort kurz vorher aktiviert worden ist. Das Ausmaß der Erleichterung, das der Prime dabei auf die Erkennung des Targets ausübt, läßt Rückschlüsse auf die morphologische Struktur der beiden Stimuluswörter zu. Dieser Gedanke beruht jedoch auf der Voraussetzung, daß morphologische Primingeffekte (z.B. in Wortpaaren wie gelaufen - laufe) auch echte morphologische Beziehungen reflektieren und nicht auf bloße formale Ähnlichkeit (die Kette laufe ist phonologisch und orthographisch in gelaufen enthalten) und/oder semantische Verwandtschaft

67 (gelaufen enthält als das Partizip von laufen alle semantischen Merkmale, die auch im Stamm des Basisverbs kodiert sind) zurückgeführt werden können. Da allerdings sowohl flektierte als auch derivierte Wortformen mit gemeinsamer Basisform immer auch semantisch, phonologisch und/oder orthographisch verwandt sind, kann nicht ausgeschlossen werden, daß Beziehungen dieser Art für die beobachteten Primingeffekte verantwortlich sind. Zunächst sollen deshalb einige Studien vorgestellt werden, in denen diesen Möglichkeiten nachgegangen wird.

(i)

Semantische Effekte bei morphologischem Priming

Henderson et al. (1984) gehörten zu den ersten Forschem, die die Einflüsse von assoziativem semantischem Priming auf morphologisch verwandte Targets untersuchten. In einer Studie zum Englischen konnten sie zeigen, daß morphologisches Priming (Apfelsinen Apfelsine)5 in visuellen Primingaufgaben sowohl bei einem ISI von einer Sekunde als auch bei einem ISI von vier Sekunden beobachtet werden konnte, während assoziatives semantisches Priming zwischen synomymen Wortpaaren ohne formale oder morphologische Beziehungen (Orange - Apfelsine) nur bei dem kürzeren ISI auftrat. Unterschiedliche zeitliche Abläufe zwischen morphologischem und semantischem Priming konnten auch von Bentin und Feldman (1990) und Bentin und Frost (1995) in Studien zum Hebräischen beobachtet werden. Das Hebräische ist für eine Trennung morphologischer und semantischer Faktoren deshalb besonders gut geeignet, weil die morphologische Verwandtschaft einer Wortgruppe, die durch eine gemeinsame abstrakte Wurzel definiert ist, nicht immer gleichzeitige semantische Verwandtschaft impliziert. Zum Beispiel liegt die Wurzel K-T-V den Wörtern miktav 'Brief, ktovet 'Adresse' und katava 'ZeitschriftenartikeP zugrunde. Für das Wortpaar miktav und ktovet bestehen semantische Beziehungen, für das Wortpaar ktovet und katava dagegen nicht. So konnten in Primingstudien Wortpaare, die nur rein morphologisch verwandt waren (z.B. ktovet - katava), mit Wortpaaren, die sowohl morphologisch als auch semantisch verwandt waren (z.B. miktav ktovet), und Wortpaaren, die nur semantisch verwandt waren (verschiedene Wurzeln) verglichen werden. Es stellte sich heraus, daß rein morphologisches Priming sowohl für Targets beobachtet werden konnte, die dem Prime unmittelbar folgten, als auch nach einem Intervall von 15 Wörtern. Für semantisch und morphologisch verwandte Formen zeigten sich ebenfalls nach beiden Intervallen Primingeffekte, allerdings waren sie nach einem ISI von 15 Wörtern schwächer als bei einer Target-Präsentation unmittelbar nach dem Prime. Rein assoziatives semantisches Priming trat schließlich nur bei Targets auf, die dem Prime unmittelbar folgten (Bentin & Feldman 1990). Für Primingeffekte auf morphologischer Basis spricht auch eine auditorische Primingstudie von Emmorey (1989), die bei der Erkennung gesprochener Wörter Primingeffekte zwischen Paaren beobachtete, die zwar morphologisch, aber nicht semantisch verwandt waren (submit - permit). Diese Ergebnisse konnten von Forster und Azuma (2000) in visuellen Primingexperimenten, in denen der Prime so maskiert wurde, daß ihn die Versuchspersonen nicht bewußt wahrnehmen konnten, repliziert werden. In dieser Studie wurden seman5

Die Autoren geben keine konkreten Testitems an; der Text enthält deshalb entsprechende deutsche Beispiele.

68

tisch transparente Wortpaare, die ein freies Morphem als Stamm enthielten (z.B. happy unhappy) Wortpaaren gegenübergestellt, die ein gebundenes Morphem als Stamm enthielten und semantisch weniger transparent waren (z.B. survive - revive). Es zeigte sich, daß die beobachteten Primingeffekte im Vergleich zu einer ungeprimten Kontrollbedingung in beiden Bedingungen gleich groß waren (34 bzw. 32 msek). Die Autoren werten ihr Ergebnis als Evidenz dafür, daß unbewußte Primingeffekte für morphologisch verwandte Paare unabhängig von dem Ausmaß ihrer semantischen Transparenz auftreten können. Ähnlich wie Forster und Azuma (2000) stellten auch Rastle et al. (2000) morphologisch verwandte Paare, die semantisch hochtransparent waren (departure - depart} solchen gegenüber, die semantisch weniger transparent waren (apartment - apart). Zusätzlich zu diesen Bedingungen wurden auch semantisch verwandte Paare untersucht, die in keiner morphologischen Beziehung standen (cello - violin). Die SOAs wurden in dieser Experimentreihe systematisch manipuliert, d.h. die Primes wurden maskiert (SOA 43 msek), gerade wahrnehmbar (72 msek) und deutlich wahrnehmbar (230 msek) präsentiert. Die Ergebnisdaten zeigten, daß die morphologisch verwandten, semantisch transparenten Paare (departure - depart) gleich große, robuste Primingeffekte in allen drei SOAs erzeugten. Demgegenüber zeigte sich für die semantisch, aber nicht morphologisch verwandten Paare (cello - violin) in der maskierten Version überhaupt kein Primingeffekt; bei den beiden längeren SOAs war er signifikant geringer als bei den morphologisch verwandten Paaren. Ebenso zeigte ein Vergleich der Primingeffekte für die beiden morphologisch verwandten Bedingungen (departure - depart vs. apartment - apart) ein differenziertes Muster: Während die Ergebnisse für die kurzen SOAs mit denen von Forster und Azuma (2000) übereinstimmten, also kein signifikanter Unterschied in den beiden Bedingungen beobachtet werden konnte, waren die Primingeffekte für die morphologisch verwandten, semantisch transparenten Paare bei den längeren SOAs (72 bzw. 230 msek) signifikant größer als in der semantisch nichttransparenten Bedingung. Zusammengenommen deuten diese Ergebnisse darauf hin, daß assoziatives semantisches Priming zwar nicht ausgeschlossen werden kann, aber einen anderen zeitlichen Verlauf als morphologisches Priming hat. Wie die Beobachtungen von Henderson et al. (1984), Bentin und Feldman (1990) und Bentin und Frost (1995) zeigen, ist semantisches Priming relativ kurzlebig, während morphologisches Priming robuster ist und über eine längere Zeit anhält. Primingeffekte zwischen morphologisch verwandten Wörtern, zumindest bei relativ großen Distanzen zwischen Prime und Target, wie sie z.B. von Stanners et al. (1979) (jumped jump; ISI 9 Wörter), Fowler et al. (1985) (enlarge - enlarged; ISI 48 Wörter) oder Kempley und Morton (1982) (reflected- reflecting; ISI 10 bis 40 Minuten) gewählt wurden, sind danach nicht durch assoziativ-semantische Primingeffekte beeinflußt. Ebenso zeigen die Ergebnisse von Forster und Azuma (2000) und Rastle et al. (2000), daß in Experimentbedingungen, in denen der Prime so kurz präsentiert wird, daß er nicht bewußt wahrgenommen werden kann, semantische Verwandschaft alleine keinen ausschlaggebenden oder nur einen geringen Einfluß auf die Größe des Primingeffekts hat. Insgesamt kann aus den Ergebnissen der verschiedenen Studien geschlossen werden, daß, wie auch McQueen und Cutler (1998) betonen, ein Lexikonmodell, in dem alle morphologischen Beziehungen rein semantisch basiert sind (z.B. Butterworth 1983), nicht haltbar ist.

69 (ii)

Formale Effekte bei morphologischem Priming

Eine weitere alternative Erklärung für das Auftreten von Primingeffekten bei morphologisch verwandten Wortpaaren könnte auf den Umstand zurückzuführen sein, daß sich morphologisch verwandte Wörter immer auch formal ähnlich sind.6 Auch diese Erklärungsmöglichkeit ist ausführlich untersucht worden. Im ganzen sprechen die Ergebnisse zahlreicher Studien dafür, daß Effekte formaler Ähnlichkeit zwischen Prime und Target von morphologischen Primingeffekten getrennt werden können. So konnten Drews und Zwitserlood (1995) und Grainger et al. (1991) in Primingstudien mit maskierten Primes regelmäßig beobachten, daß eine orthographische Überlappung zwischen Prime und Target zu Inhibitionseffekten führte, während die morphologische Verwandtschaft eines Wortpaares erleichternde Effekte bewirkte. In ähnlicher Weise zeigte auch eine orthographische Kontrollbedingung in der oben vorgestellten Studie von Forster und Azuma (2000), daß die formale Ähnlichkeit eines Primes zu seinem Target (shallow follow) keine Erleichterung bei der Erkennung des Targets bewirkte. Feldman (1998) untersuchte systematisch die Effekte orthographischer (bowl - bow), semantischer (ribbon - bow) und morphologischer Verwandtschaft (bows - bow) bei verschieden langen Präsentationszeiten des Primes (32 msek - maskiert, 66 msek - fast maskiert und 300 msek - klar erkennbar). Es stellte sich heraus, daß der morphologische Primingeffekt stets größer war als der semantische und nicht mit den verschiedenen Präsentationszeiten variierte. Orthographische Ähnlichkeit führte dagegen bei den beiden kürzeren Präsentationszeiten zu erleichterter Worterkennung, bei der längeren Präsentationszeit aber zu Inhibition. Dieses Ergebnis konnte von Rastle et al. (2000) bei leicht veränderten SOAs (43, 72 und 230 msek) repliziert werden: Auch hier führte orthographische Ähnlichkeit des Primes mit seinem Target (electrode - elect) in der maskierten und fast maskierten Version zu (relativ geringen) Primingeffekten, bei der längeren Präsentationszeit des Primes dagegen zu Inhibition. Morphologische Verwandtschaft des Primes führte dagegen stets zu verkürzten Erkennungszeiten des Targets. Die Studien von Feldman (1998) und Rastle et al. (2000) weisen somit übereinstimmend darauf hin, daß morphologische Effekte in Primingexperimenten nicht auf orthographische und semantische Effekte zurückgeführt werden können. Entsprechende Ergebnisse konnten auch bei unmaskiertem Priming beobachtet werden (Drews & Zwitserlood 1995, Henderson et al. 1984): Auch in diesen Untersuchungen führte orthographische Ähnlichkeit des Primes zu verzögerter Worterkennung, wogegen morphologische Verwandtschaft die Worterkennung stets erleichterte. Dazu paßt auch die Beobachtung von Emmorey (1989), die zwar für morphologisch verwandte Wortpaare (submit - permit) Priming beobachtete, aber nicht für phonologisch ähnliche Paare (balloon - saloon). Auf der Basis dieser Resultate schlagen Drews und Zwitserlood (1995) ein Lexikonmodell vor,

Eine Ausnahme bilden Flexionsparadigmen mit verschiedenen Stämmen, den sogenannten Suppletivformen (vgl. deutsch sein, bin, sind, war, gewesen oder \at.ferre 'tragen', tuli 'ich habe getragen', latum 'getragen').

70 „[...] in which information about word form is represented separately from morphological structure and in which processing at the form level is characterized in terms of activation of, and competition between, form-related events." (Drews & Zwitserlood 1995:1098)

Die Einschätzung, daß morphologische Strukturen unabhängig von formalen Informationen repräsentiert sind, wird durch zahlreiche weitere Studien unterstützt. Zum Beispiel machten sich Feldman und Moskovljevic (1987) in einer weiteren Untersuchung zum Einfluß formaler Faktoren in Primingstudien die Tatsache zunutze, daß im Serbokroatischen zwei verschiedene Alphabete (Kyrillisch und Lateinisch) benutzt werden. Sie konnten zeigen, daß morphologische Primingeffekte bei der Präsentation von Prime und Target in derselben Schrift nicht größer waren, als wenn sie in verschiedenen Alphabeten präsentiert wurden. Auch Schreuder et al. (1990) berichten, daß bei Partikelverben die Präsentation eines Wortteils als Prime zu Erleichterungen beim lauten Aussprechen des Targets (naming) führte, wenn der präsentierte Teil eine Konstituente, d.h. die Partikel oder der Stamm des Target-Wortes war. Dagegen führte die Präsentation eines Wortteils bei monomorphemischen Wörtern zu keinem Primingeffekt, d.h. auch in dieser Studie konnte bloße orthographische Verwandtschaft keine Primingeffekte erzeugen. Ähnlich zeigten Stanners et al. (1979), daß der Grad der formalen Ähnlichkeit zwischen Prime und Target für irreguläre und derivierte Formen keinen Effekt auf die Erkennungszeiten des Targets hatte, d.h. Targets mit großer Ähnlichkeit zum Prime (hung - hang, selective - select) erzielten keine kürzeren Reaktionszeiten als Targets mit geringerer Ähnlichkeit zum Prime (shook - shake, descriptive - describe). Ebenso beobachteten MarslenWilson et al. (1994) in modalitätsübergreifenden Primingexperimenten, daß phonologische Transparenz (principal - prince) keine ausreichende Bedingung für Primingeffekte war. Eine gegenteilige Ansicht wird allerdings in der konnektionistisch orientierten Studie von Rueckl et al. (1997) vertreten, in der Evidenz daftir berichtet wird, daß morphologisches Priming in Abhängigkeit der orthographischen Ähnlichkeit zwischen Prime und Target variiert: Bei konstanter morphologischer und semantischer Beziehung zwischen Prime und Target (Present Tense - Past Tense) wurden größere Primingeffekte für orthographisch ähnliche Itempaare (make - made) als für orthographisch unähnliche Paare (take - took) beobachtet. Bei dieser Studie handelte es sich jedoch um eine klare Offline-Aufgabe, mit der möglicherweise die Persistenz von Gedächtnisspuren untersucht wurde, aber keine Online-Worterkennung. Die Ergebnisse dieser Studie können daher nicht zur Erklärung von Effekten in Online-Primingaufgaben herangezogen werden. Insgesamt betrachtet spricht daher die vorliegende Evidenz eindeutig für die Auffassung, daß nichtformale Ansätze, in denen morphologische Primingeffekte echten morphologischen Beziehungen zuzuschreiben sind, zu favorisieren sind.

(iii) Morphologisches Priming Eine der ersten morphologischen Primingstudien wurde von Stanners et al. (1979) als visuelles Primingexperiment mit einem ISI von neun Wörtern zwischen Prime und Target durchgeführt. In diesem Experiment wurden regulär flektierte, irregulär flektierte und derivierte Verbformen untersucht. Den Versuchspersonen wurden als Prime in den Testbedingungen (i) regulär flektierte Verbformen (jumped), (ii) irregulär flektierte Verbformen (hung, shook) oder (iii) adjektivische Derivationsformen (selective, descriptive) präsentiert.

71 Das Target war in jedem Fall die entsprechende Stammform (Jump, hang, shake, select, describe). Die Reaktionszeiten der Testbedingungen wurden mit denen einer Identitätsbedingung verglichen, in welcher der Stamm selbst als Prime präsentiert wurde. Es zeigte sich, daß die Reaktionszeiten auf das Target nach der Präsentation einer regulär flektierten Verbform nicht länger waren als nach der Präsentation des Stamms selbst, d.h. eine regulär flektierte Verbform war als Prime für den Stamm ebenso effektiv wie der Stamm selbst. Im Gegensatz dazu zeigte sich ein verminderter Primingeffekt, wenn eine irregulär flektierte Verbform oder eine Derivationsform als Prime benutzt wurde, d.h. die Reaktionszeiten auf das Target nach der Präsentation einer irregulär flektierten Verbform oder einer Derivationsform waren signifikant länger als nach der Präsentation des Stamms selbst. Der Grad der formalen Ähnlichkeit zwischen Prime und Target hatte dagegen für irreguläre und derivierte Formen keinen Einfluß auf die Erkennungszeiten des Targets, d.h. Targets mit großer Ähnlichkeit zum Prime (hung - hang, selective - select) erzielten keine kürzeren Reaktionszeiten als Targets mit geringerer Ähnlichkeit zum Prime (shook - shake, descriptive - describe). Ist eine Wortform als Prime für die Erkennung eines Target-Wortes ebenso effektiv wie die Präsentation des Target-Wortes selbst als Prime, wird dies allgemein als VOLLER PRIMINGEFFEKT bezeichnet. Stanners et al. (1979) interpretieren einen vollen Primingeffekt als Indiz dafür, daß auf denselben lexikalischen Eintrag, der von morphologisch verwandten Formen der Basisform geteilt wird, wiederholt zugegriffen wurde. „There was a reliable and substantial repetition priming effect. The priming effect of the inflections, however, was just as large and indicates that the base verbs were fully activated in the process of reading the inflections." (Stanners et al. 1979:403)

Sind dagegen die Reaktionszeiten auf das Target nach der Präsentation einer Wortform länger als in der Identitätsbedingung, spricht man von PARTIELLEM (REDUZIERTEM) PRIMING. Stanners et al. (1979) werten partielles Priming als Evidenz für zwar verwandte, aber separate lexikalische Einträge. „The greater effectiveness of repetition priming [für regulär flektierte Formen, A.d.V.] indicates that the irregular past tense items may have their own memory representations which are separate from those for the base verbs." (Stanners et al. 1979:405)

Somit besteht für Stanners et al. im Hinblick auf lexikalische Repräsentationen ein qualitativer Unterschied zwischen regulärer Flexion einerseits und irregulärer Flexion und Derivation andererseits: Während im Fall der regulären Flexion gemeinsame Einträge angenommen werden (shared entries), sind irregulär flektierte und derivierte Wortformen in zwar verwandten, aber getrennten Einträgen (separate entries) repräsentiert. Durch diesen Nachweis eines qualitativen Verarbeitungsunterschiedes zwischen regulären und irregulären Wortformen gehören die Befunde von Stanners et al. zu den frühesten Belegen für das linguistisch basierte Duale Modell. Im Gegensatz zu Stanners et al. (1979) konnten allerdings Fowler et al. (1985) in visuellen und auditorischen Primingexperimenten nicht nur für regulär flektierte Wortformen (mit den Suffixen -s und -ed), sondern auch für derivierte Wortformen mit unterschiedlich starker Ähnlichkeit zum Target (heal - healer - health) volle Primingeffekte beobachten. In diesen Experimenten wählten die Autoren jedoch einen relativ großen Abstand von durchschnittlich 48 Wörtern zwischen Prime und Target, um mögliche episodische Effekte, die

72 sie bei kürzeren Intervallen vermuteten, auszuschließen. (Bei einem ISI von 9 Wörtern wurden die Ergebnisse von Stanners et al. (1979) repliziert.) Der Kontrast zwischen regulär und irregulär flektierten Präteritumfornien, der einen direkten Vergleich mit Stanners et al. (1979) ermöglicht hätte, wurde nicht untersucht Fowler et al. (1985) unterschieden in ihrer Studie zwar zwischen „regulär" und „irregulär" gebildeten Wortformen, unter „regulär" gebildeten Wortformen verstanden sie dabei aber sowohl regulär flektierte Wortformen (enlarge - enlarged) als auch einige Derivationsformen, bei denen der Stamm unverändert bleibt (heal - healer). Mit „irregulär" gebildeten Wortformen bezeichneten sie Wertformen, die gegenüber ihrer Basisform in orthographischer und phonologischer Hinsicht unterschiedlich stark verändert sind (heal - health, clear - clarify)? Den in allen Bedingungen beobachteten vollen Primingeffekt, insbesondere bei phonologisch und orthographisch veränderten derivierten Wortformen, interpretierten Fowler et al. (1985) als Evidenz für eine morphologische Strukturierung, die nicht auf der Zugriffsebene, sondern ausschließlich im zentralen Lexikon etabliert sein müsse, da irregulär gebildete Wortformen keiner prälexikalischen Dekomposition auf der Zugriffsebene unterliegen könnten. Weiter wiesen Fowler et al. aufgrund ihrer Ergebnisse die Interpretation eines vollen Primingeffekts als Indiz für gemeinsame lexikalische Einträge (Stanners et al. 1979) zurück, da nicht davon ausgegangen werden könnte, daß sich irregulär gebildete Wortformen trotz ihrer Unähnlichkeit denselben Eintrag teilten. Sie schlugen statt dessen separate, aber dekomponierte lexikalische Einträge vor. Die vollen Primingeffekte, die Fowler et al. (1985) in allen Bedingungen, auch bei so wenig verwandten Paaren wie clear - clarify oder health - healer, noch dazu bei einem ISI von durchschnittlich 48 Wörtern, beobachten konnten, sind außergewöhnlich und meines Wissens nie repliziert worden. Sie sind numerisch allerdings auch nicht so einheitlich, wie die gemeinsame Etikettierung „voller Primingeffekt" suggeriert. Hierzu merken Fowler et al. selbst an: „We should acknowledge, however, that although the difference does not approach significance, irregular forms prime base forms numerically less than do regular forms. [...]. This is the case in most comparisons in Experiment 1-4." (Fowler et al. 1985:253) Dementsprechend ergaben sich in einigen statistischen Vergleichen, für die der relativ strenge Scheffe-Test herangezogen wurde, zwar in der Versuchspersonenanalyse keine signifikanten Unterschiede zur Identitätsbedingung, wohl aber in der Itemanalyse. Schließlich fällt auf, daß zwar die Länge der Items, aber nicht ihre Frequenz kontrolliert wurde, was wesentlich zu dem beobachteten Ergebnismuster beigetragen haben könnte. Insgesamt sind damit einige Vorbehalte gegen den von Fowler et al. (1985) berichteten vollen Primingeffekt für alle morphologisch verwandten Prime-Target-Paare berechtigt. Das Ergebnismuster einer auditorischen Primingstudie von Kempley und Morton (1982), in der die Erkennung gesprochener Wörter, wie in den auditorischen Experimenten von Fowler et al. (1985), durch Störgeräusche erschwert wurde, unterstützte - trotz ISIs zwischen 10 und 40 Minuten - die Beobachtungen von Stanners et al. (1979) und Fowler et al. (1985) bezüglich flektierter Formen: Die Präsentation regulär flektierter Formen (reflected) 7

Diese Terminologie hat in der psycholinguistischen Literatur bisweilen zu Mißverständnissen geführt, z.B. wenn berichtet wird, Fowler et al. hätten regulär flektierte, irregulär flektierte und derivierte Wortformen gegenübergestellt (z.B. Schriefers 1999).

73

erleichterte die Erkennung anderer regulärer Flexionsformen desselben Stamms (reflecting) fast ebenso sehr wie die vorherige Präsentation des Target-Wortes selbst. Für irreguläre verwandte Wortpaare (held - holding, lost - loses, man - men) zeigte sich dagegen im Gegensatz zu Stanners et al. (1979) und Fowler et al. (1985) kein Primingeffekt. Die Ergebnisse dieser drei Studien stimmen somit in bezug auf die Verarbeitung regulär flektierter Formen überein: Alle Studien berichten volle Primingeffekte für regulär flektierte Wortformen, wie dies auch von Vertretern des Dualen Modells angenommen wird. Uneinheitlich sind die Ergebnisse allerdings im Hinblick auf irreguläre Formen: Während Fowler et al. (1985) volles Priming für irreguläre Wertformen beobachteten, fanden Stanners et al. (1979) lediglich partielles Priming. Kempley und Morton (1982) schließlich beobachteten gar kein Priming für irreguläre Formen. Allerdings lassen sich diese drei Studien nicht ohne weiteres miteinander vergleichen, da sie sich in mehrfacher Hinsicht unterschieden: Während Stanners et al. (1979) in der Gruppe der irregulären Formen nur irreguläre Verbformen (Past Tense) untersuchten, war die Gruppe der irregulären Formen für die beiden anderen Autorengruppen weiter gefaßt. Zudem unterschieden sich die ISIs in den drei Studien erheblich (9 Wörter bei Stanners et al., 48 Wörter bei Fowler et al. und 10 - 40 Minuten bei Kempley und Morton). Schließlich war die abhängige Variable in den beiden ersten Untersuchungen die Antwortzeit, in der Studie von Kempley und Morton jedoch die Korrektheit der Antwort. Die starken Primingeffekte, die in diesen frühen Studien für reguläre Verbformen beobachtet wurden, haben sich auch in neueren Primingstudien bestätigt. Dabei hat sich die ursprüngliche Interpretation von Stanners et al. (1979) durchgesetzt, daß solche Primingeffekte als Indiz für einen stammbasierten lexikalischen Zugriff zu werten sind. Im Hinblick auf irregulär flektierte und derivierte Formen ergibt sich allerdings nach wie vor kein einheitliches Bild. So plädieren Burani und Laudanna (1992) für morphologische Beziehungen im Lexikon, die durch gemeinsame Einträge realisiert sind, in denen flektierte Formen in dekomponierter Form (Wurzel + Flexionsaffixe) repräsentiert sind. Für derivierte Wortformen werden sowohl vollständig dekomponierte Repräsentationen (Wurzel + Derivationsaffixe + Flexionsaffixe) als auch gemäßigt dekomponierte Repräsentationen (Stamm8 + Flexionsaffixe) in Betracht gezogen: „We have argued that, while there is clear evidence that the shared unit of representation for inflected words is the root, existing evidence for derived words seems to be compatible with both the hypothesis of root and of stem representation." (Burani & Laudanna 1992:374)

Sie stützen sich dabei auf Studien zum Italienischen, in denen Derivationsformen (osservazione 'Beobachtung') eine flektierte Verbform (osserviamo 'wir beobachten') ebenso stark primten wie flektierte Verbformen (osservatate 'ihr beobachtet'). Dieses Ergebnismuster zeigte sich sowohl bei einem relativ langen ISI ( 8 - 1 2 Wörter) als auch bei einem relativ kurzen (200 msek) (Laudanna et al. 1992). Andererseits beobachteten Burani und Laudanna (1992) Verarbeitungsunterschiede zwischen flektierten und derivierten Formen bei Paaren, die eine homographische Wurzel (mut-) enthielten: Während flektierte Formen (muiarano 'sie veränderten') die Erkennung des Targets (mute 'stumm') aufgrund gleicher orthographischer, aber unterschiedlicher grammatischer und semantischer Eigenschaften der Wurzel inhibierten, was auf eine vollständige Dekomposition der flektierten Als Stamm wird hier die Einheit verstanden, die aus der Wurzel + DerivationsafFix(en) besteht.

74

Verbform hindeutet, zeigte sich für derivierte Formen (mutevole 'veränderbar') mit derselben Wurzel, aber einem derivierten Stamm (mutevol-) kein Inhibitionseffekt. Das legt für derivierte Formen die Vermutung nahe, daß zwar das Flexionsaffix (-e) abgetrennt wird, der Stamm aber nicht weiter in Wurzel und Derivationsaffix zerlegt wird. Eindeutige Ergebnisse zu regulären Verben erzielten auch Münte et al. (1999) in visuellen Primingexperimenten mit englischen Präteritumformen, bei denen Hirnstrommessungen (EKP-Messungen) vorgenommen wurden. Münte und seine Kollegen konnten beobachten, daß geprimte reguläre Verbstämme eine N400-Modulation erzeugten, d.h. eine negative Amplitude in einem Zeitfenster von 250 - 450 msek. Geprimte irreguläre Verbstämme erzeugten dagegen ebensowenig einen EKP-Effekt wie formal ähnliche, aber weder morphologisch noch semantisch geprimte Wörter aus einer Kontrollbedingung. Auch diese Ergebnisse bestätigten, daß ein verarbeitungsrelevanter Unterschied zwischen regulären und irregulären Verbformen besteht. Der fehlende EKP-Effekt für nur formal geprimte Verben zeigte darüber hinaus, daß der beobachtete EKP-Effekt für reguläre Verben nicht auf rein formale Ähnlichkeiten zwischen Prime und Target zurückgeführt werden konnte. Dieser Verarbeitungsunterschied zwischen regulären und irregulären Präteritumformen wird auch durch eine Studie von Marslen-Wilson et al. (1993) belegt, die in einer modalitätsübergreifenden Primingstudie die phonologische Ähnlichkeit und morphologische Regularität englischer Verben variierten. Daraus ergaben sich die drei Bedingungen (i) regulär (jumped -jump), (ii) semi-regulär (burnt - burn) und (iii) irregulär (sang - sing). Sie beobachteten, daß reguläre Past Tense Verbformen (i) ihren Stamm signifikant primten, wogegen semi-reguläre Verbformen (ii) kein Priming erzeugten und irreguläre Verbformen (iii) zu Inhibitionseffekten führten. Eine modalitätsübergreifende Primingstudie mit derivierten Wortformen, die von Marslen-Wilson et al. (1994) durchgeführt wurde, zeigte dagegen wiederum kein einheitliches Muster. Im Vergleich zu einer Kontrollbedingung wurde sowohl nach der auditorischen Präsentation semantisch transparenter suffigierter Derivationsformen (elusive) als auch nach der Präsentation transparenter präfigierter Formen (disobey) eine signifikant kürzere Erkennungszeit des Stamms (elude bzw. obey) beobachtet. Paare suffigierter Derivationsformen, obwohl semantisch transparent (government - governor), primten sich dagegen ebensowenig wie semantisch opake Formen. Nach Marslen-Wilson et al. (1994), die, ähnlich wie Burani und Laudanna (1992), gemeinsame Einträge für alle semantisch transparenten Mitglieder einer morphologischen Familie annehmen, sind Primingeffekte mit einem wiederholten Zugriff auf den Stamm zu erklären. Da alle Mitglieder eines Eintrags netzwerkartig miteinander verbunden sind, primen sie sich gegenseitig. Bei zwei suffigierten Formen bleibt der Primingeffekt aus, weil zusätzliche hemmende Verbindungen zwischen den Suffixen innerhalb eines Eintrags den Verarbeitungsvorteil, der durch den wiederholten Zugriff auf den Stamm entsteht, aufwiegen. Die Rechtfertigung dieser hemmenden Verbindungen basiert auf Annahmen des von Marslen-Wilson entwickelten Kohortenmodells zur auditorischen Worterkennung (z.B. Marslen-Wilson 1984, 1987), nach dem zu Beginn der auditorischen Präsentation eines Wortes alle Kandidaten aktiviert werden, die eine mögliche Vervollständigung des Wortes darstellen. Für die auditorische Präsentation eines suffigierten Wortes bedeutet dies, daß während der Worterkennung, solange der Hörer nur den Stamm gehört hat, verschiedene Suffixe für den Stamm möglich sind und daher alle aktiviert werden. Sobald eindeutige Evidenz für ein bestimmtes Suffix auftritt, wird die Aktivierung der konkurrierenden

75 Suffixe durch hemmende Verbindungen unterdrückt. Zwischen Präfixen sind solche hemmenden Verbindungen nicht nötig, da ein gegebenes Präfix keine anderen möglichen Präfixe desselben Stamms aktivieren wird.

Zwischenergebnisse Wenn auch die Interpretationen der verschiedenen Autoren in einigen Punkten unterschiedlich sind, so sprechen die Ergebnisse der bisher vorgestellten Primingstudien doch dafür, daß in jedem Fall die Repräsentation morphologischer Strukturen im zentralen Lexikon angenommen werden muß. Daß die beobachteten Primingeffekte morphologischer Natur sind und weder auf semantische noch formale Eigenschaften zurückgeführt werden können, belegt ebenfalls eine große Anzahl von Studien. Dies kommt auch bei Frost und Grainger (2000) zum Ausdruck, die ihre Einleitung zu einem Sonderband der Zeitschrift Language and Cognitive Processes mit der Einschätzung beginnen: „The appreciation that morphological factors are essential building blocks in any model of lexical organisation is now widely accepted. Morphological structure is a necessary component in natural languages." (Frost & Grainger 2000:321)

Die robusten starken Primingeffekte für regulär flektierte Wortformen, die in allen Studien beobachtet werden konnten, liefern dabei deutliche Evidenz für eine Dekomposition dieser Formen. Dies stimmt genau mit den Vorhersagen des Dualen Modells überein, nach dem reguläre Formen lexikalisch als Stamm und Affix repräsentiert sind und im Zuge ihrer Verarbeitung dekomponiert werden. In den bisher vorgestellten Studien sind die Ergebnisse zu irregulär flektierten und derivierten Wertformen dagegen uneinheitlich. Hier finden sich sowohl Hinweise auf Vollformverarbeitung als auch Hinweise auf morphologische Dekomposition, vor allem für semantisch transparente derivierte Formen. Diese unterschiedlichen Ergebnisse erklären sich zum einen durch Variationen in der Methode, z.B. unterschiedlich lange Intervalle zwischen Prime und Target, unterschiedlich lange Präsentationszeiten des Primes oder unterschiedliche Modalitäten in der Präsentation der Stimuli. Damit sind die Ergebnisse nicht direkt miteinander vergleichbar. Darüber hinaus standen unterschiedliche Faktoren im Fokus der Untersuchungen. Oft wurden Schwerpunkte auf verschiedene Verarbeitungsfaktoren (formale und semantische Faktoren, episodische und strategische Effekte) gelegt; eine saubere Trennung linguistischer Faktoren wurde dagegen bei manchen Studien außer acht gelassen. Zum Beispiel umfaßt die Unterscheidung zwischen „regulärer" und „irregulärer" Wortbildung in Fowler et al. (1985) kategorienübergreifend die Orthographie, die Phonologic und die Semantik. Eine explizite Gegenüberstellung regulärer und irregulärer Flexion findet sich dagegen nur selten (Stanners et al. 1979, Marslen-Wilson et al. 1993). Hinzu kommt, daß die weitaus meisten Untersuchungen zum Englischen durchgeführt worden sind. Will man die unterschiedliche Repräsentation regulärer und irregulärer Wortformen untersuchen, ergeben sich hier allerdings, wie bereits im Zusammenhang mit lexikalischen Entscheidungsaufgaben erwähnt, einige konfundierende Faktoren, die Auswirkungen auf die unterschiedliche Verarbeitung der Wortformen aus den beiden Klassen haben könnten, z.B. kommen reguläre Flexionsformen häufiger vor als irreguläre, sind reguläre Flexionsformen ihrem Stamm stets ähnlicher als irreguläre, haben reguläre

76

Flexionsformen ein Affix und irreguläre nicht. Dementsprechend wird von Befürwortern konnektionistisch orientierter Lexikonmodelle die Auffassung vertreten, daß die im Englischen beobachteten Primingeffekte keine morphologischen Strukturen reflektieren, sondern insgesamt mit diesen konfundierenden Faktoren erklärt werden können. Gibt man jedoch die Annahme morphologischer Strukturen im Lexikon (die sich ja nicht nur im Englischen, sondern auch in zahlreichen anderen Sprachen zeigt) nicht auf, unterstützen die bisher diskutierten empirischen Befunde der Primingstudien zusammengenommen ein duales Lexikonmodell, in dem beide Möglichkeiten, sowohl morphologische Dekomposition als auch Vollformverarbeitung, dem menschlichen Worterkennungssystem zur Verfügung stehen. Wie schon zur Erklärung der Ergebnisse aus lexikalischen Entscheidungsaufgaben, ist auch hier das linguistisch orientierte Duale Modell, das unterschiedliche Repräsentationen und Verarbeitungsstrategien für reguläre und irreguläre Flexionsformen vorhersagt und damit die in den verschiedenen Studien einheitlich beobachteten Hinweise auf eine Dekomposition regulärer Formen am besten erklären kann, den anderen Modellen mit zwei Verarbeitungswegen überlegen. Weitere Evidenz für das Duale Modell liefert eine Primingstudie zu deutschen Partizipien, deren Ziel die explizite Überprüfung von Repräsentationsunterschieden zwischen regulären und irregulären Flexionsformen war (Sonnenstuhl et al. 1999).

(iv) Morphologisches Priming bei deutschen Partizipien Für eine Überprüfung der Unterschiede zwischen regulärer und irregulärer Flexion eignen sich deutsche Partizipien besonders gut, weil konfundierende Faktoren, die möglicherweise in Untersuchungen zum Englischen eine Rolle spielen, vermieden werden können. Bereits in Abschnitt 3.2.2, Punkt (iii) wurde erwähnt, daß sowohl reguläre als auch irreguläre Partizipien segmentierbare Affixe haben, und daß die Unterscheidung dieser beiden Gruppen durch unterschiedliche statistische Eigenschaften weniger verzerrt wird als im Englischen. In Primingexperimenten kommt als weiterer Vorteil hinzu, daß es irreguläre Partizipien gibt, die gegenüber ihrer Basisform die gleiche formale Ähnlichkeit aufweisen wie reguläre. Falls, gemäß den Annahmen des linguistisch basierten Dualen Modells, regulär flektierte Wörter in Stamm und Affix dekomponiert werden und als solche im Lexikon repräsentiert sind, wogegen irregulär flektierte Wortformen lexikalisch als Vollformen repräsentiert sind, sollten sich verschiedene Primingmuster für diese beiden morphologischen Klassen zeigen. Konkret sagen Sonnenstuhl et al. (1999) voraus, daß die Dekomposition regulär flektierter Wortformen zu einem Zugriff auf den Stamm führt. Die vorherige Präsentation eines regulären Partizips sollte deshalb einen starken Primingeffekt auf andere regulär flektierte Formen mit demselben Stamm bewirken, auf den wiederholt zugegriffen wird. Im Gegensatz dazu sollte ein irreguläres Partizip, trotz gleich großer formaler Ähnlichkeit mit seiner Basis, nur reduzierte Primingeffekte auf andere flektierte Formen mit demselben Stamm bewirken, da irregulär flektierte Formen eigene Einträge haben, die separat von ihrem Stamm gespeichert sind. Um diese Vorhersagen zu überprüfen, wurden reguläre und irreguläre Verben in einer modalitätsübergreifenden Primingaufgabe untersucht. Die irregulären Verben gehörten zu der -Klasse, deren Partizipstamm keine Stammvokalveränderung gegenüber der Basis

77

aufweist (schlafen - schlief - geschlafen). In den Testbedingungen für reguläre und irreguläre Verbformen wurden jeweils als Prime das Partizip eines Verbs und als Target die entsprechende Form der I.Person Singular präsentiert. Um die relative Größe des Primingeffekts zu bestimmen, wurden diese Testbedingungen durch Identitätsbedingungen, in denen der Prime mit dem Target identisch war, und Kontrollbedingungen, in denen der Prime semantisch nicht mit dem Target verwandt war, ergänzt. In Tabelle 12 sind die sich daraus ergebenden sechs Experimentbedingungen zusammen mit Beispielen und den durchschnittlich erzielten Reaktionszeiten der Versuchspersonen für die einzelnen Bedingungen dargestellt. Bedingung

reguläre Verben

irreguläre Verben

Beispiel

RT

Prime

Target

1 (Identität)

Offne

Offne

581 msek

II (Test)

geöffnet

Offne

581 msek

IM (Kontrolle)

wünsche

offne

61 1 msek

VI (Identität)

schlafe

schlafe

563 msek

V (Test)

geschlafen

schlafe

595 msek

VI (Kontrolle)

beuge

schlafe

620 msek

Tabelle 12: Beispiele und Reaktionszeiten (RT) für sechs experimentelle Bedingungen im Primingexperiment zu deutschen Partizipien (Sonnenstuhl et al. 1999, Experiment I)

Statistische Vergleiche zeigten, daß sowohl für Partizipien regulärer als auch für Partizipien irregulärer ABA-Verben ein starker Primingeffekt im Vergleich zur Kontrollbedingung beobachtet werden konnte: Die Reaktionszeit für visuelle Targets nach der auditiven Präsentation der Partizipien war sowohl für reguläre wie auch für irreguläre Verben mit 30 bzw. 25 msek signifikant kürzer als in der Kontrollbedingung. Um zu beurteilen, ob reguläre Partizipien einen stärkeren Primingeffekt auf die entsprechenden I.Person-Singular-Formen des Basisverbs bewirkten als irreguläre Partizipien, wurden die Testbedingungen mit den entsprechenden Identitätsbedingungen verglichen. Hier zeigte sich, daß reguläre Partizipien einen vollen Primingeffekt bewirkten, d.h. die Reaktionszeiten in der Testbedingung unterschieden sich nicht von denen in der Identitätsbedingung, wogegen irreguläre Partizipien nur einen reduzierten Primingeffekt ausübten, d.h. die Reaktionszeiten in der Testbedingung waren um hochsignifikante 32 msek länger als in der Identitätsbedingung. Die Beobachtung, daß reguläre Partizipien einen vollen Primingeffekt auf andere flektierte Formen mit demselben Stamm bewirken, deckt sich mit den Ergebnissen aus anderen Primingstudien, in denen ebenfalls robuste, starke Primingeffekte für regulär flektierte Wortformen festgestellt wurden. Zusammen mit der Beobachtung, daß irreguläre Partizipien dagegen nur einen reduzierten Primingeffekt auf ihr entsprechendes Target ausüben, werden die Annahmen des Dualen Modells, insbesondere die in diesem Modell getroffene Unterscheidung zwischen lexikalisch basierter (irregulärer) und regelbasierter (regulärer) Flexion, auch in dieser Studie bestätigt.

78 3.2.4 Ergänzende Evidenz für das Duale Modell Die unterschiedliche Verarbeitung von regulärer und irregulärer Flexion hat sich nicht nur in Untersuchungen von Frequenz- und Primingeffekten gezeigt, sondern wird auch durch eine Reihe anderer Untersuchungen belegt. So konnte in zahlreichen Experimenten mit Kunstwörtern nachgewiesen werden, daß reguläre Affixe auf neu gebildete Wörter generalisiert werden. Die Bildung neuer irregulärer Formen ist dagegen auf Wörter beschränkt, die starke Ähnlichkeiten mit existierenden irregulär flektierenden Wörtern aufweisen (Olawsky 1993, Marcus et al. 1995, Clahsen 1997, Groß 2001, Hong 2001). Beispielsweise stellte sich in einem Produktionsexperiment, in dem deutsche Partizipformen zu Kunstverben gebildet werden sollten, heraus, daß das Affix -/ in 97 % der Fälle benutzt wurde, wenn ein Kunstverb als reguläres Verb eingeführt wurde. Selbst wenn ein Kunstverb als irreguläres Verb eingeführt wurde, bildeten die Versuchspersonen in 69 % der Fälle die Partizipform mit -t. Demgegenüber wurde nur in 31 % der Fälle eine Partizipform mit -n gebildet. Eine nachträgliche Analyse zeigte, daß dies überwiegend dann der Fall war, wenn ein Kunstverb als irregulär eingeführt wurde und zusätzlich starke Ähnlichkeit mit einem existierenden irregulären Verb aufwies (Olawsky 1993). Ein paralleles Ergebnismuster zeigte auch eine Studie mit koreanischen Deutschlernern (Hong 2001). Wie in der deutschen Studie hatten die Versuchsteilnehmer auch hier die Aufgabe, deutsche Partizipformen von Kunstverben zu bilden, die sich (i) mit einem hochfrequenten deutschen irregulären Verb reimten, (ii) mit einem hochfrequenten deutschen regulären Verb reimten oder (iii) keine Ähnlichkeit mit einem existierenden deutschen Verb aufwiesen. Es stellte sich heraus, daß Partizipformen für die beiden Bedingungen (ii) und (iii) in 90 % der Fälle mit -t gebildet wurden, aber nur 60 % der Partizipformen aus Bedingung (i). Die übrigen Partizipformen aus Bedingung (i) wurden in Analogie zu den existierenden irregulären Verben mit -n gebildet. Auch Untersuchungen zum deutschen Spracherwerb zeigten, daß das reguläre Partizipaffix -t in allen Altersgruppen übergeneralisiert wird (z.B. *gekommt statt gekommen; insgesamt 93 % der Fälle), das irreguläre -n (z.B. *geschneien statt geschneit) dagegen kaum (Clahsen & Rothweiler 1993, Weyerts & Clahsen 1994, Weyerts 1997). Ähnlich beobachteten Marcus et al. (1992) in Untersuchungen zum Erwerb des englischen Past-Tense-Systems häufige Übergeneralisierungen des regulären Affixes (*goed). Wie im Deutschen zeigten sich aber auch hier kaum Übergeneralisierungen der irregulären Muster (*brang, *\vope). Darüber hinaus haben neurolinguistische Untersuchungen gezeigt, daß sowohl die reguläre als auch die irreguläre Flexion unabhängig voneinander beeinträchtigt sein können (Ullman et al. 1995, Marslen-Wilson & Tyler 1997, Penke 1998). Marslen-Wilson und Tyler (1997) beobachteten zum Beispiel bei einer Gruppe von englischsprechenden Aphasikern, daß reduziertes Priming für irreguläre Past Tense Formen auftrat (was mit den Ergebnissen für ungestörte Sprecher übereinstimmt), aber kein volles Priming für reguläre (was von den Ergebnismustern ungestörter Sprecher abweicht). Ein anderer Patient zeigte allerdings genau das entgegengesetzte Muster. Diese doppelte Dissoziation deutet darauf hin, daß die Verarbeitung regulärer und irregulärer Flexionsformen selektiv gestört sein kann. Auch diese Beobachtung liefert einen deutlichen Hinweis dafür, daß es sich bei der Verarbeitung regulärer und irregulärer Flexion um verschiedene Prozesse handelt.

79

Für ungestörte Sprecher zeigte sich in EKP-Experimenten, daß verschiedene Typen von Grammatikalitätsverletzungen jeweils unterschiedliche Muster neuronaler Aktivität produzierten (Penke et al. 1997, Weyerts et al. 1997): Grammatisch falsche Regularisierungen existierender irregulärer Flexionsformen (*geladet) bewirkten ein Aktivitätsmuster, das ansonsten bei Verletzungen morphosyntaktischer Regularitäten (z.B. Subjekt-Verb-Kongruenz) auftritt. Unzulässige Irreguiarisierungen existierender regulärer Flexionsformen (*getanzeri) führten dagegen zu Aktivitätsmustern, die auch beim Auftreten kontextuell unerwarteter Wörter zu beobachten sind. Evidenz für das Wirken regelbasierter und vollformbasierter Wortverarbeitungsmechanismen wurde schließlich nicht nur in flektierenden Sprachen wie Englisch, Italienisch oder Deutsch beobachtet, sondern auch im Japanischen, einer hochgradig agglutinierenden Sprache.9 Hagiwara et al. (2000) verglichen in einer Studie zum Japanischen die Verarbeitung der beiden Suffixe -sä und -mi. Beide Suffixe werden an adjektivische Stämme affigiert, um deadjektivische Nomina abzuleiten (taka 'hoch' -> taka-sa / taka-mi 'Hoch-heit' oder 'Höhe'). Obwohl beide Suffixe in Funktion und Bedeutung gleich sind, unterscheiden sie sich in ihrer Produktivität: Während -sä unbeschränkt produktiv ist, kann -mi nur in gespeicherten Formen verwendet werden. Dementsprechend war bei sprachunauffälligen Sprechern die Akzeptanz von Kunstwörten, die mit -sä affigiert wurden, signifikant höher als die Akzeptanz von Kunstwörtern, die mit -mi gebildet wurden. Diese war auf Kunstwörter beschränkt, die starke Ähnlichkeit mit existierenden -mi Formen aufwiesen. Experimentelle Daten für aphasische Patienten zeigten darüber hinaus, daß die beiden nominalen Suffixe -sä und -mi selektiv gestört sein konnten. Ihre Ergebnisse interpretieren Hagiwara et al. (2000) als Evidenz dafür, daß die im Dualen Modell angenommene Unterscheidung zwischen regulären und irregulären Formen nicht nur für den Bereich der Flexion gilt, sondern auch auf den Bereich der Derivation ausgedehnt werden kann.

Vorläufige Zusammenfassung In diesem Kapitel wurden verschiedene Ansätze zur lexikalischen Verarbeitung und Repräsentation komplexer Wortformen vorgestellt. Anhand pyscholinguistischer Reaktionszeitstudien mit lexikalischen Entscheidungsaufgaben, in denen isolierte oder im Kontext eines Primes präsentierte Wörter beurteilt wurden, ist insbesondere der Einfluß morphologischer Strukturen auf die Wortverarbeitung diskutiert worden. Dabei hat sich gezeigt, daß unitäre Wortverarbeitungsmodelle, die einen einheitlichen Verarbeitungsmechanismus für alle komplexen Wortformen annehmen, der vorliegenden empirischen Evidenz nicht gerecht werden. Während Wortverarbeitungsmodelle, die einen einheitlichen Parsingmechanismus für alle komplexen Wortformen annehmen, die Befunde nicht erklären können, die auf eine Vollformverarbeitung hinweisen, können Modelle, die Vollformrepräsentationen für alle komplexen Wortformen annehmen, die Ergebnisse nicht erklären, die auf separate lexikalische Repräsentationen für Stämme und Affixe hindeuten. Aufgrund dieser Ergebnisse sind daher duale Ansätze als Modelle für die lexikalische Wortverarbeitung vorzuziehen. Theoretische Erwägungen und empirische Daten haben darüber hinaus gezeigt, daß von den verschiedenen Modellen mit zwei Verarbeitungswegen das linguistisch basierte Duale Zu Ergebnissen aus einer weiteren agglutinierenden Sprache, dem Ungarischen, s. Abschnitt 7.4.1.

80 Modell für den Bereich der Flexion zu favorisieren ist. Deutliche Unterstützung für dieses Modell wurde u.a. durch Reaktionszeitstudien mit deutschen Partizipien gewonnen, für die eine klare Einteilung in reguläre und irreguläre Flexionsklassen getroffen werden kann. Im folgenden Teil soll nun die Gültigkeit des Dualen Modells für das Flexionssystem des deutschen Plurals untersucht werden, dessen Analyse komplexer ist und das daher in mancher Hinsicht eine Herausforderung für das Modell darstellt.

Kapitel 4 Strukturelle Eigenschaften des deutschen Plurals

Das System des deutschen nominalen Plurals folgt in großen Teilen keinen offensichtlichen Regelmäßigkeiten. Darüber hinaus ist der reguläre Fall der Pluralbildung wesentlich weniger evident als beispielsweise im deutschen Verbsystem, in dem eine klare Einteilung in reguläre (keine Stammveränderung, Partizip -/), irreguläre (Stammveränderung, Partizip -n) und gemischte Flexionsklassen (Stammveränderung, Partizip -/) getroffen werden kann. Eine Analyse des Pluralsystems stellt daher von jeher eine besondere Herausforderung an alle morphologischen Flexionstheorien dar, insbesondere an jene, die von einer Unterscheidung zwischen regulären und irregulären Flexionsformen ausgehen. Es ist deshalb nicht überraschend, daß bis heute keine Einigkeit über eine solche Analyse erzielt werden konnte. Aus der heutigen Perspektive erscheint daher Augsts (1979) Einschätzung zum Untersuchungsstand der Nominalflexion leider zu optimistisch: „Abschließend und zusammenfassend darf man feststellen, daß die Untersuchung der Substantivflexion z. Z. zu einem gewissen Abschluß gekommen ist. Die Fakten sind durch vier Arbeiten [Rettig 1972, Äugst 1975, Bettelhäuser 1976, Mugdan 1977, A.d.V.] unabhängig von der historischen Grammatik neu gesichtet, das gefundene Regelwerk kann so in die Grammatiken übernommen werden." (Äugst 1979:223)

4. l

Die Pluralallomorphe

Beschreibungen des deutschen Pluralsystems differieren bereits in der Anzahl der angenommenen gebräuchlichen Pluralallomorphe.1 So gehen beispielsweise Ramge (1973) und Werner (1968) von neun verschiedenen gebräuchlichen Pluralallomorphen aus, Kopeke (1993), Wegener (1992) und Gawlitzek-Maiwald (1994) von acht, MacWhinney (1978) von sieben, Wiese (1988), Marcus et al. (1995), Clahsen et al. (1997), Bartke (1998) und Wegener (1995) dagegen nur von fünf, Wiese (1996) und Wunderlich (1999a) von drei. Diese Diskrepanz ergibt sich vor allem durch die Behandlung der Pluralformen mit gleichzeitiger Umlautung des Stamms als separate Allomorphe oder als phonologisch bedingte Varianten der Endungen -0, -e und -er. Aber auch andere Unterscheidungen spielen eine Rolle: So berücksichtigt beispielsweise MacWhinney (1978) den -er Plural in seiner Analyse nicht, Pluralformen auf -(e)n werden dagegen dreimal gezählt (als -n, -en und -en mit -e Tilgung). Rettig (1972), Mugdan (1977) und Wegener (1992) betrachten das Nullmorphem nicht als eigenständiges Allomorph, sondern als phonologische Variante des -e Plurals. Dieser wiederum wird jedoch bei Wegener (1992) doppelt gezählt (in den beiden

1

Neben diesen im Deutschen gebräuchlichen Pluralendungen gibt es einzelne Pluralformen, die unverändert aus anderen Sprachen entlehnt sind, z.B. Schema - Schemata (altgriechisch), Genus Genera (lateinisch), Modus - Modi (lateinisch), Cherub - Cherubim (hebräisch).

82 Varianten mit und ohne Umlaut). Wiese (1996) und Wunderlich (1999a) dagegen analysieren weder den -0 Plural noch den -e Plural als echte Pluralmarkierung, sondern als Ergebnis prosodischer Prozesse. Unter rein deskriptiven Gesichtspunkten kann man die Pluralallomorphe in (3) unterscheiden. (3)

Pluralmarkierungen im Deutschen Pluralmarkierung

Singular

Plural

la

-0

Adler

Adler

Ib

-0 mit Umlaut

Vater

Väter

2a

-e

Arm

Arme

2b

-e mit Umlaut

Ball

Bälle

3

-er (mit Umlaut)

Kleid, Haus

Kleider, Häuser

4

-(e)n

Tasche

Taschen

5

-s

Auto

Autos

Die Suffixe -n und -en werden hier als dieselbe Pluralendung betrachtet, da das Auftreten von -en anstelle von -n aufgrund phonologischer Regeln exakt vorhersagbar ist: Endet der Stamm auf Schwa oder auf Schwa + Liquid, wird -n affigiert, ansonsten -en (SchwaEpenthese). Eine pluralmarkierende Umlautung des Stammvokals tritt bei -n, ebenso wie bei -s, nicht auf. Dagegen können die Endungen -e, -er und -0 sowohl mit als auch ohne Stammvokalveränderung auftreten. In den meisten Analysen werden die Umlautformen einheitlich, entweder als eine Variante der entsprechenden Pluralformen ohne Umlaut oder als eigenständige Formen, beschrieben. Hier kann jedoch eine Unterscheidung getroffen werden, denn das Erscheinen des Umlauts kann für die beiden Allomorphe -e und -0 nicht sicher vorhergesagt werden. Daher können die Pluralmarkierungen mit und ohne Umlaut in diesen Fällen als getrennte Varianten gezählt werden. Im Gegensatz dazu bewirkt das Pluralsuffix -er immer eine Frontienmg des Stammvokals, was dazu führt, daß alle hinteren Vokale (a, o, u und au) nach vorne verschoben, d.h. umgelautet werden. Hier ist also für die beiden Pluralvarianten mit und ohne Umlaut von einem einzigen Suffix auszugehen. Mehr Einigkeit herrscht bei Angaben über die Distribution der Pluralaffixe. In allen Auszählungen ist das Pluralsuffix -(e)n das häufigste, -s das niedrigste. Je nachdem, welcher Korpus (z.B. Janda 1990, Wagner 1991: CfflLDES, Baayen et al. 1993: CELEX) zugrundegelegt wird, unterscheiden sich die Angaben allerdings zum Teil erheblich in Details. Daher habe ich eine neue Auszählung aller in der CELEX-Datenbank (Baayen et al. 1993) attestierten Pluralformen vorgenommen. In diesem Korpus sind insgesamt 6 Millionen Einträge aus zu 90 % schriftlichen und zu 10 % mündlichen Quellen berücksichtigt. Die Auszählung der analysierbaren Pluralformen liefert das in Tabelle 13 zusammengefaßte Ergebnis. Auch in dieser Auszählung ist das Pluralsuffix -(e)n das weitaus häufigste, gefolgt von den Pluralformen auf -e und -0. Berücksichtigt man alle komplexen Formen als einzelne Types, haben die Pluralformen auf -er eine fast ebenso niedrige Type-Frequenz wie -5 Plurale. Allerdings haben -er Plurale eine wesentlich höhere Token-Frequenz, die zudem auf wesentlich weniger Grundwörter verteilt ist.

83

Anzahl Tokens

Relativer Anteil

durchschn. Familiengröße4

15,2%

87.088

29,7%

2,46

6.554

56,7%

128.513

43,8%

1,88

26,7%

2.295

19,9%

62.239

21,2%

2,98

1.067

4,2%

94

0,8%

10.158

3,5%

11,35

1.061

4,1 %

855

7,4%

5.468

1,9%

1,24

25.649

100%

11.551

100%

293.466

100%

Pluralsuffix

Anzahl Types2

Relativer Anteil

-0

4.320

16,8%

1.753

-(e)n

12.312

48,0%

-e

6.836

-er -s

Anzahl Types Relativer (Grundwörter)3 Anteil

Tabelle 13: Distribution der deutschen Pluralsuffixe (lt. CELEX)

4.2

Analysen des Pluralsystems

In bezug auf die Regularität bestimmter Formen unterscheiden sich die Analysen des deutschen Pluralsystems5 wiederum erheblich. Zum Beispiel nimmt Ramge (1973) im Hinblick auf den Erstspracherwerb an, daß die Pluralaffigierung völlig arbiträr ist und daß es keine Regel gibt, „aufgrund derer sich voraussagen ließe, ob der Plural von 'Buch' 'Buche', 'Buch', 'Buche', 'Buch', 'Buchen', 'Bücher', 'Bucher' oder 'Buchs' lautet. Das gilt für die meisten einsilbigen Lexeme." (Ramge 1973:62)

Ebenso bemerkt Kufner (1962) zum Zweitspracherwerb: „There is no way in which the plural formation of German nouns can be made easy. The best way we can tell our students is that, after they have learned the commonest one thousand nouns or so, they will find that most other masculines and neuters add -e and most other feminines -(e)n. This is small comfort to a student who is just staring to learn the commonest one thousand." (Kufher 1962:56)

2

3 4 5

Alle komplexen Formen als einzelne Types gezählt (z.B. Häuser, Wohnhäuser, Ferienhäuser,..., n = n Types). Nur Grundwörter als ein Type gezählt (z.B. Häuser, Wohnhäuser, Ferienhäuser,..., n = l Type). Familiengröße bezeichnet die Anzahl aller vom Grundwort abgeleiteten komplexen Formen. Tatsächlich beschränken sich viele der im folgenden vorgestellten Arbeiten nicht auf Pluralformen, sondern beziehen auch die unterschiedlichen Kasusformen in ihre Analyse mit ein. Ich werde mich im folgenden jedoch auf die (Nominativ-)Pluralformen konzentrieren, da hauptsächlich sie für die vorliegende Arbeit von Interesse sind.

84

Andere Pluralanalysen bemühen sich, Regelmäßigkeiten in der Pluralaffigierung zu erfassen, wobei sowohl statistische Tendenzen als auch grammatische und phonetische Eigenschaften der Nomina eine Rolle spielen. 4.2.1 Regelbasierte Pluralanalysen So werden in Werner (1968) neun Pluralallomorphe angenommen, deren Selektion mittels einer Anzahl „automatischer" Regeln geschieht. Diese Regeln weisen Pluralformen nicht positiv zu, sondern beschreiben, auf der Basis des Stammauslauts eines Nomens, Einschränkungen in der Kombinierbarkeit eines Stamms mit einer Pluralform, wie das folgende Beispiel illustriert: „So kann z.B. ein Substantiv, das im Singular auf eine staiktonige Silbe oder auf eine schwachtonige Silbe mit a, i, o,u + Konsonanz endet (wie z.B. Tag, Kenntnis), niemals die Pluralzeichen 0, UL (= Umlaut), -n erhalten." (Werner 1968:95)

Wie Werner selbst feststellt, selektieren diese Regeln aber nur in wenigen Fällen ein einziges Allomorph. Rettig (1972) konzentriert sich in einer ausführlichen Beschreibung des Pluralsystems auf „zentrale" Klassen, zu denen er die Plurale auf -en, -n, -e, -er und -s zählt. Den -0 Plural betrachtet er als ein „Oberflächenphänomen aufgrund einer phonematischen Tilgung des -e Plurals". Daneben unterscheidet Rettig eine Anzahl „peripherer" Klassen, in denen Plurale lateinischer oder altgriechischer Herkunft repräsentiert sind und die deshalb als „gruppenspezifische Norm der Gebildeten" (Rettig 1972:99) bezeichnet werden. Die zentralen Klassen werden in diverse Untergruppen unterteilt, die teils durch semantische Merkmale, teils durch grammatische (Genus), prosodische (Akzent) oder phonetische (Stammauslaut) charakterisiert sind. Abgesehen von dieser Einteilung in verschiedene Klassen beschränkt sich Rettigs Beschreibung des Pluralsystems allerdings in großen Teilen auf eine reine Aufzählung der entsprechenden Formen und ist daher nicht sehr analytisch. Auch Mugdan (1977) unterscheidet zwischen einem zentralen und einem peripheren Teil des Pluralsystems. Zum peripheren Teil gehören nach Mugdan die Pluralformen mit nichtnativen Affixen (Genus - Genera, Numerus - Numeri), mit Stammveränderung (Atlas Atlanten, Basis - Basen) und Akzentveränderung (Professor - Professoren). Als zentral betrachtet Mugdan die Pluralformen auf -0, -e, -e mit Umlaut, -n, -en, -er, -er mit Umlaut und -s, sofern sie keine Stamm- oder Akzentveränderung aufweisen. Ähnlich wie Rettig (1972) nimmt Mugdan dabei an, daß die Pluralform auf -0 durch eine phonologisch bedingte Schwa-Tilgung zustande kommt. Für die Pluralformen auf -0 und -e wird daher die gemeinsame Markierung '3' vorgeschlagen. Für den zentralen Teil des Pluralsystems versucht Mugdan, die Anzahl der Regeln so gering wie möglich zu halten. Hauptsächlich aufgrund grammatischer (Genus) und morphophonemischer (Stammauslaut), aber auch semantischer Eigenschaften der Nomina gelangt er so zu zehn Affigierungsregeln. Mugdans Versuch, sich auf möglichst wenige Regeln zu beschränken, hat allerdings zur Folge, daß mit ihnen nur ca. 85 % der Pluralformen abgeleitet werden können. Die übrigen Formen werden in 17 Listen von Ausnahmen aufgeführt. Dabei ist die Beschreibung der Ausnahmen oft erheblich komplexer als die Regel selbst, wie das Beispiel in (4) illustriert (für eine kritische Diskussion der Analyse von Mugdan vgl. Bartke 1998).

85 (4)

Beispiel für eine Pluralregel nach Mugdan (1977:88f.) P-6 Konsonantisch auslautende Maskulina haben II3II im Plural (z.B. /adlsr/, /ve:rt/, /noilirj/). Ausnahmen: Eine beträchtliche Anzahl von Maskulina bildet den Plural mit {//3n//} (meist /an/}). Einige (etwa zwanzig) verlangen {//ar//}. Der Plural mit {//3n//} findet sich bei an die hundert nativen Kernzeichen, die mehrheitlich belebt sind (z.B. /jpats/, /bauar/). Hinzu kommen zahlreiche nicht-native Stämme (wiederum zumeist belebte) mit bestimmten Endungen, wie z.B. die auf /a:t/ (/pre'la:t/, /zol'da:t/, /kandi'da:t/ u.a.) - ob es sich dabei um Derivationsmorphe oder Auslaute handelt, will ich nicht entscheiden. Beim /arAPlural überwiegen native Kemzeichen mit umlautbarem Kurzvokal (wie /valt/, /got/; aber /gaist/, /irtu:m/).

Ähnlich wie Rettig (1972) und Mugdan (1977) unterscheidet auch Äugst (1979) zwischen einem zentralen Pluralsystem, zu dem hier allerdings nur die Endungen -(e)n, -e und -0 gehören. Als peripher und daher als nicht relevant für Regelbildungen werden die Endungen -er und -s ausgeklammert. Äugst kommt so zu den drei Regeln unter (5), aufgrund derer das zentrale System beschrieben werden kann. (5)

Regeln des zentralen Pluralsvstems nach Äugst (1979:224ff.) 1. Maskulina und Neutra bilden den Plural auf -e, Feminina auf -en. 2. Das -e wird getilgt bei Wörtern, die auf -3 (l, r) und -ein enden, ebenso -en bei Wörtern, die auf -en enden. 3. Substantive auf -e bilden den Plural auch im Maskulinum mit -en.

Obwohl Äugst sich mit seinen Regeln auf drei Suffixe beschränkt, sind sie allerdings wiederum zu generell und beschreiben nur ca. 85 % der deutschen Pluralformen. Sie machen daher ebenfalls z.T. lange Listen von Ausnahmen erforderlich. Aus psycholinguistischer Sicht ist außerdem die Annahme eines zentralen Systems, wie es von Äugst angenommen wird, problematisch, denn die Pluralallomorphe des peripheren Systems sind ebenso gebräuchlich wie die des zentralen. So gehören einige Pluralformen auf -er zu den höchstfrequenten in der deutschen Sprache (z.B. Kinder, Kleider, Männer, Häuser). Diese hohe Gebrauchsfrequenz ignoriert auch MacWhinney (1978), der in einer rein phonologisch basierten Analyse die Pluralformen mit -er überhaupt nicht berücksichtigt. Die übrigen Pluralsuffixe werden durch sieben Produktionsregem (productions) zugewiesen, die vor allem von der phonologischen Endung des Singulars abhängen. Für Pluralbildungen auf -(e)n werden dabei drei verschiedene Allomorphe angenommen (6). Die übrigen vier Regeln beschreiben die Pluralformen auf -s, -e, -0 und Umlaut. MacWhinney (1978) betont, daß die von ihm vorgeschlagenen Produktionsregeln nur wenige Ausnahmen haben. (6)

Produktionsregeln für Pluralformen auf -(e)n nach MacWhinnev (1978) 1. -n

Stammendungen auf Id oder /ai/ bekommen den -n Plural (Tanten)

2. -en

Endungen auf -heit, -keit, -in, -schaß, -ung erhalten den -en Plural (Regierungen)

3. -en mit -e Tilgung

nach Vokalen und Liquiden wird Schwa getilgt (Muskel-en -> Muskeln)

86 Diese hohe Vorhersagbarkeit, die aus seinen Regeln resultiert, kommt jedoch vor allem, wie auch Bartke (1998:37) herausstellt, aufgrund der ausnahmslos vorhersagbaren Pluralbildung für derivierte Formen zustande, die in MacWhinneys Analyse nicht von monomorphemischen Singularen unterschieden werden. Da in derivierten Formen das Derivationssuffix als morphologischer Kopf das Pluralsuffix ausnahmslos bestimmt, erklärt sich die durchschnittlich hohe Treffsicherheit von MacWhinneys Produktionsregem. Bei der Pluralformation monomorphemischer Nomina sind dagegen zahlreiche Ausnahmen zu beobachten (z.B. für Regel l Gebäude, Gebirge, Geschmeide usw.). Wegener (1992, 1995) entwirft zur systematischen Erfassung des Pluralsystems ein Modell aus den drei Hauptregem unter (7) sowie diversen Nebenregeln, die auf den Kriterien Genus und Markiertheit basieren. (7)

Die drei Hauptregeln zur Pluralbüdung nach Wegener (l 995:25) 1. Unmarkierte Feminina selegieren als Pluralmarker -(e)n. 2. Unmarkierte Maskulina und Neutra selegieren als Pluralmaiker -e. 3. Markierte Substantive wählen genusunabhängig den Pluralmarker -s.

Eine entscheidende Rechtfertigung dieser Regeln sieht Wegener in ihrer statistischen Relevanz. So sind nach Wegener (1992) 84 % aller Pluralformen aufgrund der drei Hauptregem vorhersagbar; eine spätere Auszählung (Wegener 1995) kommt jedoch zu dem revidierten Ergebnis von 71,5 %. Unter dem Gesichtspunkt der Vorhersagbarkeit leistet daher auch diese Analyse nicht mehr als die älteren vorgestellten Arbeiten, da der Anteil der Pluralformen, die nicht durch diese Regeln erfaßt werden, mit 16 % bzw. 28,5 % nach wie vor hoch ist. Ein Hauptziel von Wegeners Analyse ist, die Erlernbarkeit der Pluralformen zu erklären. Darüber hinaus schlägt sie den Einsatz ihrer Regeln im Unterricht für Deutsch als Fremdsprache vor. Aber auch aus dieser Perspektive sind ihre Regeln wenig hilfreich, da der zentrale Begriff Markiertheit weitgehend unklar bleibt. Beispielsweise wird der Begriff markiertes Nomen einmal als verkürzte Bezeichnung für eine Sammlung ungeordneter phonologischer, dialektaler und lexikalischer Merkmale definiert: „Das Merkmal [N, m] (markiertes Nomen) ist also eine verkürzte Notationsweise für folgende lexikalische und phonologische Merkmale: [EN] Eigenname [KW] Kurzwort [FW] Fremd- bzw. Sachwort aus der Seemannssprache [ZW] Zitierwort, metalinguistisch gebrauchte Substantivierung [On] Onomatopoetikon [_W#] auf unbetonten Vollvokal auslautend." (Wegener 1995:24)

An anderer Stelle scheint sich das Merkmal Markiertheit auf das Genus bzw. „genuswidriges Verhalten" eines Nomens zu beziehen: „Die größte Zahl der markiert-regulären Fälle entsteht dadurch, daß die Substantive sich genuswidrig verhalten." (Wegener 1995:26).

Auch Bartke (1998) bemängelt, daß in Wegeners Analyse nicht deutlich wird, ob sich der Begriff auf diachronische, phonologische, semantische oder statistische Aspekte bezieht.

87

Damit hat es hat den Anschein, als ob bei Wegener zum Erwerb der Pluralformen das Merkmal [± markiert] zusätzlich zu den Regeln gelernt werden müsse. Auch Regeln, die ohne den Begriff Markiertheit auskommen (z.B. „Nebenregel PR 2c: Bestimmte Maskulina und Neutra bilden den Plural mit -er", Wegener 1995:29) tragen nicht viel zur Erlernbarkeit des Pluralsystems bei.

4.2.2 Eine schemabasierte Pluralanalyse Eine grundsätzlich andere Herangehensweise an das Pluralsystem verfolgt Kopeke (1988, 1993), für den die Frage nach der mentalen Repräsentation der Pluralformen im Vordergrund steht. Nach Kopeke werden Pluralformen nicht durch Regeln abgeleitet, sondern sind mental als volle Formen in assoziativen Schemata gespeichert (s. Abschnitt 2.2.1). Diese Schemata, die als „im nominalen Lexikon existierende Muster" (Kopeke 1993:203) verstanden werden, entstehen aufgrund gemeinsamer „semantischer und/oder morphophonematischer Eigenschaften" der lexikalischen Einträge. Auch die Pluralbildung für unbekannte Nomina wird durch Schemata erklärt. Der Plural für ein unbekanntes Nomen wird danach in Analogie zu anderen bereits bekannten und einem Schema angehörigen Pluralformen gebildet. Kopeke (1993) untermauert seine These mit einer empirischen Untersuchung, in der Sprechern des Deutschen die Aufgabe gestellt wurde, geeignete Pluralformen zu Kunstwörtern zu bilden. Die Pluralformen wiesen eine Reihe konsistenter Tendenzen auf, die nicht immer mit den Pluralregeln, die in regelbasierten Pluralanalysen herausgearbeitet worden sind, übereinstimmten. Beispielsweise wurde der Plural der Maskulina und Neutra auf Schwa in nur 77 % der Antworten mit dem Suffix -n gebildet, obwohl diese Beziehung in allen deskriptiven Beschreibungen des Pluralsystems als Regel genannt wird. Ebenso fallt auf, daß das Suffix -s wesentlich häufiger benutzt wurde, als dies im Realwortschatz der Fall ist (z.B. wurden Feminina auf -el, deren Plural nach regelbasierten Analysen mit dem Suffix -n gebildet wird, zu 13 % mit dem Suffix -s gebildet). Nach Kopeke ist dieses Ergebnis „[...] unvereinbar mit einem Modell, in dem darauf beharrt wird, daß Plurale von einer Basisform abgeleitet werden." (Kopeke 1993:196)

Die relativ häufige Übergeneralisierung des -s Plurals ist für Kopeke zwar kein Indiz für eine möglicherweise zugrundeliegende Regel, andererseits veranlaßt ihn die Pluralbildung für feminine Pseudonomina auf Schwa, die eine auffallend hohe Übereinstimmung mit der durch Regeln vorhergesagten zeigt (für 94 % der femininen Kunstwörter auf -e wurde der Plural mit -n gebildet), zu der Einschränkung, daß „[...] man dem mentalen Lexikon am ehesten gerecht wird, wenn man sowohl Verarbeitungsprozeduren, die auf linguistischer Beschreibungsebene auf IP6 basieren, wie auch Schemata [...]

6

3

= „Item-and-Process". Dieser von Hockett (1954) eingeführte Begriff charakterisiert prozedurale Grammatiken, die von einer zugrundeliegenden Repräsentation lexikalischer Basisformen und grammatischer Morpheme ausgehen, wobei die grammatischen Morpheme den Basisformen durch Affigierungsprozesse zugewiesen werden.

88 zuläßt. Z.B. erscheint es mir vor dem Hintergrund der empirischen Fakten durchaus legitim zu sein, die Pluralbildung mit -« bei Feminina auf Schwa mit Prozessen, die auf IP-Regeln basieren, erklären zu wollen." (Kopeke 1993:214)

4.2.3 Defaultbasierte Pluralanalysen Im Gegensatz zu Kopeke (1993) und zu konnektionistischen Lexikonmodellen (Hahn & Nakisa 2000, s. Abschnitt 3.1.2) geht Neef (1998) nur im Ausnahmefall von einer mentalen Vollformrepräsentation der Plurale aus. Allerdings nimmt er im Rahmen seines deklarativen WORD-DESIGN Modells auch keine regelbasierte Zuweisung von Affixen an, sondern betrachtet Affigierung vielmehr als Rekonstruktionsprozeß auf der Basis von Wohlgeformtheitsbedingungen. Neben der Klasse der irregulären Plurale unterscheidet Neef in seiner Pluralanalyse zwei prinzipiell unterschiedliche reguläre Pluralklassen, nämlich (i) Plurale mit einer reduzierten Silbe, deren Silbengipfel aus einem Schwa oder einem silbischen Sonoranten besteht und (ii) -s Plurale. Die Plurale der Klasse (i) wiederum werden drei regulären Unterklassen (Plurale mit -0 oder -e, Plurale mit -n und Plurale mit -r) zugeordnet. Ähnlich wie Rettig (1972), Mugdan (1977) und Äugst (1979) benutzt Neef die Unterscheidung zwischen einem Kernlexikon und einem peripheren Lexikon, um zwischen den Pluralklassen weiter zu differenzieren: Die Stämme der regulären Plurale aus (i) sind danach in einem Kernlexikon gespeichert, die Stämme der regulären -s Plurale aus Klasse (ii) in einem peripheren Lexikon repräsentiert. Zum Erwerb des Pluralsystems entwirft Neef ein komplexes System von sogenannten WORD-DESIGN-BEDINGUNGEN, die als Defaults bezeichnet werden, und die (abhängig vom Lexikonbereich und vom Genus des betreffenden Nomens) die Zuordnung eines Nomens in eine der angenommenen Pluralklassen regeln sollen. Bis auf eine Defaultregel, die besagt, daß zum peripheren Lexikon gehörige Nomina den Plural auf -s bilden, bleibt allerdings auch hier keine Regel ohne eine zum Teil erhebliche Anzahl von Ausnahmen. Anders als bei Neef (1998) sind die Pluralallomorphe bei Wurzel (1987, 1990, 1998) lexikalisch repräsentiert und werden mit den phonologischen, syntaktischen, semantischen und morphologischen Eigenschaften des Stamms in Beziehung gesetzt. Zur Beschreibung des Pluralsystems stellt Wurzel (1998) acht Paradigmenstnikturbedingungen auf, fünf für Pluralsuffixe und drei für Pluralumlaute. Die Paradigmenstnikturbedingungen fungieren als Defaults, die nur dann gelten, wenn „[...] für die entsprechende Kategorie (wie Plural) [...] noch kein anderer Marker spezifiziert ist." (Wurzel 1998:230)

Allerdings sind die tatsächlichen Pluralformen aufgrund dieser Paradigmenstnikturbedingungen ebenfalls nicht sicher vorhersagbar. Vielmehr müssen sie als Generalisierungen betrachtet werden, die beliebig viele Ausnahmen zulassen. Mit dem Ziel, Strukturen in einem gegebenen System vollständig und korrekt darstellen zu können, wurde die Computersprache DATR (z.B. Evans & Gazdar 1996) entwickelt, eine relativ allgemeine und sehr flexible Sprache zur Wissensrepräsentation. Zu diesem Zweck arbeitet sie mit nicht-monotonen Vererbungsbäumen, in denen das Defaultprinzip konsequent ausgenutzt wird. DATR wird vor allem zur Repräsentation lexikalischen Wissens

89

eingesetzt. Da die Sprache selbst theorieunabhängig ist, können in ihr verschiedene spezifische Analysen realisiert werden. So werden in der DATR-basierten Analyse der deutschen Nominalflexion von Cahill und Gazdar (1999) insgesamt 14 Flexionsklassen unterschieden, von denen sieben Klassen gebräuchliche Flexionsformen repräsentieren. Die restlichen Klassen beinhalten eine kleine Anzahl irregulärer Pluralformen von Nomina lateinischer oder altgriechischer Herkunft, deren Singular noch die ursprüngliche Endung aufweist, wie in z.B. in Dogma, Thesis, Bazillus, Modus. Interessant ist, daß die Klasse der Nomina, die ihren Plural mit -s bilden, in der Analyse von Cahill und Gazdar (1999) als oberster Knoten füngiert, also als allgemeine Defaultform. Dies steht in Widerspruch zu den meisten der bisher vorgestellten Analysen. Eine Hierarchieebene tiefer erscheinen die drei Nominalklassen mit Plural auf -e (mit der Unterklasse -e + Umlaut), -er und -(e)n (mit diversen Unterklassen). Im Gegensatz zu vielen anderen Beschreibungen des Pluralsystems ist die DATR-basierte Analyse von Cahill und Gazdar (1999) deskriptiv vollständig und erfaßt ausnahmslos alle Pluralformen. Dies stellt einen bedeutenden Fortschritt gegenüber allen anderen regelbasierten Pluralanalysen dar, die bisher beschrieben wurden. Eine andere Beschreibung der deutschen Nominalflexion im Rahmen von DATR stellt Kilbury (2001) vor. Seine Analyse basiert auf der von Wunderlich und seinen Mitarbeitern entwickelten Theorie der MINIMALISTISCHEN MORPHOLOGIE (Minimalist Morphology, Wunderlich & Fabri 1995) und Wunderlichs Analyse der deutschen Nominalflexion (Wunderlich 1999a, s.u.). Obwohl die Minimalistische Morphologie als eine Theorie zur Erzeugung von Flexionsformen verstanden werden muß und sich insofern von DATR-Analysen, deren Ziel die Repräsentation von Flexionssystemen ist, unterscheidet, arbeitet sie ebenfalls mit Defaults und Vererbungsbäumen. Analysen im Rahmen der Minimalistischen Morphologie sind daher für eine Umsetzung in die DATR-Sprache besonders geeignet. Kilbury (2001) gelangt so zu den in (8) aufgeführten Flexionsklassen. (8)

Flexionsklassen in Kilburv (200n

Pluralendung

(i)

reguläre Nomina

-s

(ii)

starke Nomina mit Schwa-Silbe

-e oder -0

(iii) starke Nomina mit Plural-Umlaut

-e + Umlaut oder -0 -t- Umlaut

(iv)

starke Nomina mit-r

-r

(v)

gemischte Nomina mit -n

-n

(vi)

schwache Nomina ohne -s im Genitiv



(vii)

schwache Nomina mit -5 im Genitiv

-n

Obwohl Kilbury zur Beschreibung des deutschen Nominalsystems nur sieben Klassen annimmt, wovon zwei durch Unterschiede in der Kasusflexion (schwache Nomina mit bzw. ohne -s im Genitiv Singular) und nur fünf durch die Pluralform begründet sind, gelingt es ihm, das gesamte System deskriptiv ebenso vollständig zu erfassen wie Cahill und Gazdar (1999). Darüber hinaus werden die Klassen den Flexionsformen nicht arbiträr zugeordnet, sondern beziehen sich auf elf distinktive Merkmale (basierend auf Genus, Stammauslaut, Belebtheit, Pluralendung und Genitivmarkierung), von denen maximal vier für die Charakterisierung einer spezifischen Klasse benötigt werden (die übrigen Merkmale sind für diese Klasse dann entweder redundant oder irrelevant). Dieser Verzicht auf arbiträre Klassen-

90 einteilungen bildet gegenüber vielen anderen Analysen, auch der von Cahill und Gazdar (1999), einen weiteren maßgeblichen Fortschritt. Aufschlußreich ist, daß auch in Kilburys Analyse, ebenso wie in der Analyse von Cahill und Gazdar (1999), die Nomina, die ihren Plural mit -s bilden, den obersten Knoten in der Flexionshierarchie bilden. Während Nomina der übrigen Klassen durch ein bis vier distinktive Merkmale spezifiziert sind, zeichnen sich -s Plurale dadurch aus, daß sie kein relevantes distinktives Merkmal besitzen. Sie fungieren daher auch in Kilbury (2001) als Defaultform. Konsequenterweise kategorisiert Kilbury daher nur diese Klasse als regulär.

4.2.4 Eine constraint-basierte Pluralanalyse Eine detaillierte Pluralanalyse von Wunderlich (1999a), die als Grundlage für Kilburys oben erwähnte Analyse dient, nutzt Techniken der constraint-basierten Optimalitatstheorie (OT), berücksichtigt aber auch Ergebnisse und Techniken der computerlinguistisch motivierten DATR-Theorie (Evans & Gazdar 1996, Cahill & Gazdar 1999) und Prinzipien der Minimalistischen Morphologie (Wunderlich & Fabri 1995), insbesondere die Prinzipien der Vererbung und der Unterspezifikation. Nach diesen Prinzipien sind lexikalische Einträge minimal spezifiziert, d.h. binäre Merkmale haben per Default den Wert negativ. Nur positive Merkmale werden spezifiziert. Lexikalische Information ist in hierarchischen Vererbungsbäumen repräsentiert. Hierarchisch untergeordnete Knoten erben dabei automatisch die Merkmale der übergeordneten Knoten, sofern diese nicht durch ein neu hinzukommendes positives Merkmal überschrieben werden. Wunderlichs Pluralanalyse bildet aus den Erkenntnissen dieser neueren morphologischen Ansätze eine Synthese und soll deshalb im folgenden etwas ausführlicher dargestellt werden. Basierend auf prosodischen Eigenschaften und Genus der Nomina unterscheidet Wunderlich (1999a) neun Pluralklassen (und zwei Unterklassen), die in hierarchischer Beziehung zueinander stehen. Die Pluralrealisierung (mit -s, -n, -e und -0) wird für fünf dieser Klassen als regulär analysiert, wobei -e und -0 nicht als echte Suffixe, sondern als das Ergebnis prosodischer Prozesse angesehen werden. Vier Klassen (mit den Suffixen -n und -r) werden als irregulär und lexikalisch fixiert betrachtet. Der von Wunderlich vorgeschlagene Vererbungsbaum, der die hierarchischen Beziehungen der Pluralklassen repräsentiert, ist in Abbildung 6 in vereinfachter Form wiedergegeben. Die doppelt umrahmten Zellen repräsentieren irreguläre, lexikalisch fixierte Pluralformen. Die jeweiligen Pluralsuffixe sind in geschweiften Klammern angegeben. Die Pluralbildung mit -s (Klasse A) unterliegt dabei keinerlei Bedingungen. Plurale dieser Klasse brauchen lexikalisch weder für [+N(ominal)] spezifiziert zu sein, noch den für deutsche Plurale angenommenen Wohlgeformtheitsbedingungen zu unterliegen. Sie können daher auch in dieser Klassifizierung, wie in den verschiedenen DATR-Analysen, als allgemeiner Default betrachtet werden. Wunderlich bezeichnet diese Klasse als „untypische" Plurale. Klasse B umfaßt dagegen „typische" Plurale. Typische Plurale erfüllen nach Wunderlich die prosodische Wohlgeforaitheitsbedingung in (9) (vgl. auch Neef 1998), die in etwas weniger restriktiver Form auch von Wiese (1996) und Golston und Wiese (1996) formuliert worden ist:

91 (9)

„AH plural forms of typical nouns have a final syllable whose rhyme is reduced to either schwa or a syllabic sonorant (r, 1, or n), hence, they end in a .reduced syllable' which cannot be stressed (Neef 1998). In other words, the final syllable of plurals is associated with a mora that lacks any vocalic features but is restricted to [+son]." (Wunderlich 1999a;3)"

Aus dieser Bedingung folgt, daß Nomina, deren Stamm bereits auf eine reduzierte Silbe endet, nicht weiter markiert werden (z.B. Kissen, Kabel, Lager). Nomina, deren Stamm der Wohlgeformtheitsbedingung für Plurale nicht genügt, erhalten als minimale Anpassung an die Wohlgeformtheitsbedingung ein Schwa als Pluralmarkierung (z.B. Schafe, Abende, Arme).

B2

E

[+N] mit reduzierter Silbe als Stammauslaut {-0}

[+N] auf Konsonant {-e}

[+N, -t-fem] {-n}

C1

C2 [+N, +frontiert] auf Konsonant {-e + Umlaut}

+frontiert] mit reduzierter Silbe als Stammauslaut {-0 + Umlaut}

H

[+N, -fern] {-n}

D

+frontiert] K}

[+N] mit vom Sg. abweichenden Pluralstämmen {-n}

l, +mask] regulär schwach auf-e {-n}

l [+N. -fern] irregulär schwach {-n}

Abbildung 6: Pluralanalyse nach Wunderlich (1999)

Nomina der Klasse C erben die Merkmale der Klasse B und unterscheiden sich von diesen nur dadurch, daß ihr Stammvokal das lexikalisch spezifizierte variable Merkmal (floating feature) [+ frontiert] aufweist (z.B. Cl: Gärten, Vögel; C2: Hüte, Bälle). Die irregulären Pluralformen der Klasse D mit -er als Suffix (z.B. Häuser, Bücher, Kinder) werden als Untergruppe der Klasse C eingeordnet, ihr Stammvokal ist also ebenfalls für das variable Merkmal [+ frontiert] spezifiziert. Hierbei wird allerdings nicht der Umstand ausgenutzt, daß -er die Eigenschaft hat, immer Umlaut auszulösen, sofern der Stammvokal umlautfähig ist. Diese Regularität braucht m.E. nicht lexikalisch am Nomen gespeichert zu sein, sondern kann eher als vom Suffix -er selbst ausgehend betrachtet werden. Daß Suffixe umlautauslösende Wirkung haben können, zeigen die DiminutivSuffixe -chen und -lein, die ebenfalls regulär Umlaut auslösen, obwohl ihre Stämme nach

92 Wunderlich nicht für dieses Merkmal spezifiziert sind (vgl. Schafe vs. Schäfchen/Schäflein, Arme vs. Ärmchen, Taschen vs. Täschleiri). Die Nomina aus Klasse E (z.B. Taschen, Bienen, Türen, Frauen) haben das Merkmal [+ Femininum]. Damit ist Klasse E spezifischer als Klasse B, die kein positives Genusmerkmal aufweist. Aus diesem Spezifizitätsgefälle folgt nach dem Prinzip der Unterspezifizierung, daß Nomina der Klasse B nicht-feminin sind.7 Während die Pluralzuweisung für Klasse E regulär erfolgt, ist sie für die Pluralformen der nicht-femininen Nomina in Klasse F lexikalisch spezifiziert (z.B. Augen, Enden, Motoren, Muskeln). Als Untergruppe von F kategorisiert Wunderlich irreguläre Pluralformen mit vom Singular abweichenden Stamm (z.B. Alben, Atlanten, Daten). Eine Unterscheidung der nicht-femininen Nomina mit -n als Pluralmarkierung in die Klassen F, H und I schließlich ist motiviert durch ihre unterschiedliche Flexionsklassenzugehörigkeit: Während Nomina der Klasse F stark flektiert werden, ist die schwache Flexion (die nur -n als mögliches Affix, sowohl für Plural- als auch für Kasusmarkierungen, erlaubt) für die auf Schwa auslautenden Nomina der Klasse H (z.B. Hasen, Falken) vorhersagbar, für Nomina der Klasse I lexikalisch spezifiziert. Zusammengefaßt ergeben sich aus dieser Pluralanalyse die in (10) aufgeführten Regularitäten. (10) Regularitäten im Pluralsvstem nach Wunderlich (l 999a) (i)

Maskulina auf Schwa werden schwach flektiert. (Dies impliziert die Affigierung mit -n.)

(ii)

Der Plural nichtumlautender Feminina wird mit -n gebildet.

(iii) Nicht-Feminina mit Konsonant als Stammauslaut bilden den Plural mit -e. (iv)

Für Nicht-Feminina mit einer reduzierten Silbe als Stammauslaut bleibt der Plural unmarkiert.

(v)

Alle untypischen Nomina haben einen -s Plural,

(vi)

Plurale werden umgelautet (MAX(COR)).

Wunderlich betrachtet diese Regularitäten als „harte Fakten", die allerdings, wie er selbst feststellt, durch lexikalisch fixierte Ausnahmen überschrieben werden können. Zum Beispiel bleibt der Plural für das maskuline Nomen Käse unmarkiert, obwohl es auf Schwa endet (Ausnahme zu Regel (i)). Auch bildet eine Reihe nicht-femininer Nomina mit Konsonant als Stammauslaut, z.B. Dorn, Graf, Mast, den Plural mit -n anstelle von -e (Ausnahme zu Regel (iii)), und einige Feminina wie Finsternis, Bedrängnis, Labsal weisen im Plural weder Umlaut noch -n Affigierung auf (Ausnahme zu Regel (ii) bzw. (vi)). Weiterhin stellt der Autor fest, daß die Unterscheidung zwischen „typischen" und „untypischen" Nomina problematisch ist, da sie nicht präzise definiert werden kann. Einerseits nehmen auch typische Nomina im Plural ein -s. Dies trifft übrigens nicht nur, wie von Wunderlich angenommen, auf Nomina mit Vollvokal als Stammauslaut zu (z.B. Atitos, Staus), sondern auch auf Nomina mit Konsonant als Stammauslaut (z.B. Streiks, Akkorde-

Anders als die Klasse B beinhaltet die Klasse C zwar Feminina, ist aber gleichzeitig für das variable Merkmal [+frontiert] spezifiziert. Zu den Pluralformen auf -n sind die umgelauteten Pluralformen dieser Feminina komplementär verteilt. Der Konflikt zwischen diesen beiden konkurrierenden Pluralmarkierungen für Feminina wird durch ein Constraint (MAX(COR)) gelöst, das umgelauteten Pluralformen Vorzug gegenüber nichtumgelauteten gibt.

93 o/75, Koteletts, Schals). Andererseits wird der Plural untypischer Nomina, sofern sie ein /s/ als Stammauslaut haben, mit -e (anstelle von -s) gebildet (z.B. Faxe, DAXe, Felixe). Eine naheliegende phonologische Erklärung für dieses Phänomen ist die Strategie eines Sprechers, adjazente Elemente zu vermeiden; da die Genitivformen dieser Nomina allerdings immer auf -s enden (des Fax(es), des DAX(es), des Felix(es)), wird diese Erklärung von Wunderlich bezweifelt. Auf eine Reihe weiterer Probleme der oben vorgestellten Analyse, die eine Anzahl von Zusatzannahmen (zum Beispiel die Annahme zusätzlicher Klassen für „problematische" Nomina) erforderlich machen, macht Wunderlich (1999a) selbst aufmerksam. Er vertritt die Auffassung, daß weder die mit Vererbungsbäumen arbeitende DATR-Theorie noch die mit Affigierungsprinzipien und lexikalischen Spezifizierungen arbeitende Theorie der Minimalistischen Morphologie in der Lage ist, alle Probleme befriedigend zu lösen. Zum Beispiel argumentiert er, daß in DATR-Analysen zwar die hierarchischen Beziehungen zwischen Knoten und Unterknoten gut erfaßt werden können, nicht aber unterschiedliche Gewichtungen zwischen verschiedenen Zweigen. Solch eine Gewichtung ist aber für die Annahme, daß für Feminina der Pluralbildung mit Umlaut Vorzug gegenüber der Pluralbildung mit -n gegeben wird, erforderlich. Daneben verstoßen nach Wunderlich einige Pluralformen, die zwischen den Endungen -s und -e oszillieren können (Mittwochs Mittwoche, Kompotts - Kompotte), gegen das Einzigartigkeitsprinzip, das in der Minimalistischen Morphologie angenommen wird und nach dem jedem Nomen nur eine einzige Pluralform zugewiesen werden kann. Wunderlich schlägt deshalb zur Beschreibung des Pluralsystems auf der Basis von acht Constraints eine komplexe OT-Analyse vor, die in mancher Hinsicht mehr Spielraum erlaubt als die zuvor genannten strengen morphologischen Theorien. Zum Beispiel kann durch eine geeignete Anordnung von Constraints erklärt werden, warum für Feminina der Pluralmarkierung mit Umlaut Vorzug vor der Pluralmarkierung mit -n gegeben wird. Insgesamt stellt die Pluralanalyse von Wunderlich (1999a) trotz einiger theoretischer Probleme eine umfassende linguistische Beschreibung des deutschen Pluralsystems dar. Wie die DATR-Analysen bildet sie rein deskriptiv einen großen Fortschritt gegenüber älteren Analysen (z.B. Mugdan 1977), indem sie mit fünf regulären Flexionsklassen und vier lexikalisch gespeicherten auskommt. Zur Beschreibung der verschiedenen Pluralformen müssen neben der allgemeinen Wohlgeformtheitsbedingung in (9) im Grunde nur zwei Pluralsuffixe (-s und -n) angenommen werden. Indem Wunderlich Erkenntnisse und Techniken unterschiedlicher neuerer Ansätze berücksichtigt, werden etliche Probleme, die in den älteren Analysen nur durch die Annahme langer Ausnahmelisten beschrieben werden konnten, systematisch gelöst. Wunderlich hebt auch hervor, daß seine Analyse psycholinguistischen Anforderungen gerecht wird, indem sie das folgende Ziel der Minimalistischen Morphologie erfüllt: „The membership in an inflectional subclass should not be arbitrarily assigned, but rather follow from features that can be memorized." (Wunderlich 1999a:7)

Aus psycholinguistischer Sicht wirft Wunderlichs Analyse dennoch einige schwer zu fassende Probleme auf. Zunächst wird nicht explizit geklärt, welchen mentalen Status die in (10) aufgeführten Regularitäten haben. Wenn sie als mental operierende Regeln verstanden werden, stehen für die Produktion einer Pluralform (sofern sie nicht lexikalisch gespeichert

94 ist) die unveränderte Input-Form selbst, eine Form mit Schwa-Epenthese, eine Form mit dem Suffix -n und eine Form mit dem Suffix -s zur Verfügung. Außerdem besteht die Möglichkeit, den Stammvokal umzulauten oder nicht. Welche Form schließlich gewählt wird, ergibt sich erst aus den lexikalischen Eigenschaften der Nomina (Genus, Umlautmerkmal und Prosodie) zusammen mit einer Abwägung der acht verschiedenen Constraints nach ihrer Wichtigkeit. Für die Produktion einer nicht gespeicherten Pluralform müssen demnach bis zu acht komplexe Evaluationsstufen durchlaufen werden. Bedenkt man die Schnelligkeit der Sprachproduktion und das geringe Auftreten von Pluralflexionsfehlern, erscheint dies nicht plausibel. Auch die Erkennung von Pluralformen ist nach Wunderlichs Analyse schwer nachzuvollziehen, da die Dekomposition dieser Formen die Aktivierung komplexer lexikalischer Eigenschaften des Singulars voraussetzt Zum Beispiel muß vor einer erfolgreichen Dekomposition der Pluralform zunächst das Genus des entsprechenden Singulars aktiviert werden (ansonsten kann z.B. analog zu Fäden - Faden von Türen auf *Turen geschlossen werden). Ist der Stammvokal im Plural umgelautet, muß weiter beurteilt werden, ob dies auch im Singular der Fall oder pluralbedingt ist (ansonsten kann analog zu Hüte - Hut von Stücke auf *Stuck geschlossen werden). Ein logisches Problem bereiten schließlich auch -0 Plurale mit -n als Stammauslaut, da ohne Informationen über die phonologische Form des zugehörigen Singulars diese aus der Pluralform nicht abgeleitet werden kann. Zum Beispiel wäre für die Pluralform Kuchen die Singularform *Kuche, für Schatten ^Schatte oder für Fäden *Fäde möglich. Insgesamt hat die oben vorgestellte Auswahl an Pluralanalysen gezeigt, daß im deutschen Pluralsystem die unterschiedlichsten Regularitäten oder Generalisierungen angenommen werden. Es wird nahezu das gesamte Spektrum von „völlig arbiträr" bis zu „völlig regelbasiert" abgedeckt. Auch die angenommenen Generalisierungen unterscheiden sich in großen Teilen erheblich voneinander. Fast keine Regel kommt ohne eine Auflistung von Ausnahmen aus. Die einzige Regularitat, die aufgrund grammatischer und phonologischer Merkmale das Pluralaffix ausnahmslos vorhersagt, gilt für Feminina mit Schwa als Stammauslaut: Diese erhalten als Pluralsuffix immer ein -n.

4.3

Der -s Plural

Schon in frühen Arbeiten zur deutschen Nominalflexion fällt auf, daß dem -s Plural ein besonderer Status zukommt. So lehnt beispielsweise Steche (1927) den Gebrauch des -s Plurals, der im 18. und 19. Jahrhundert in die deutsche Sprache übernommen wurde, gänzlich ab. Er führt das folgende Argument an: „Der Grund dafür ist weniger der fremde Ursprung dieser Endung, als die Tatsache, daß sie bei weiterem Vordringen das ganze Gebäude der deutschen Hauptwortbeugung in Verwirrung bringen würde." (Steche 1927, in Rettig 1972:101)

Auch Briegelb (1911) beklagt den -s Plural als Mißbrauch, führt dessen Verwendung allerdings auf einen anderen Grund zurück:

95 „Formen wie die Blocks, die Schnitts, die Bräus, die Billets, die Tees haben etwas weibisches an sich, und wir gehen wohl kaum fehl, wenn wir an dem Vordringen [...] dieses s hauptsächlich den Frauen Schuld geben." (Briegelb 1911, in Rettig 1972:103)

In den älteren der hier vorgestellten Analysen wird der -5 Plural immerhin bereits akzeptiert, aber doch als eine Flexionsform betrachtet, die mal aus dem Französischen, mal aus dem Englischen oder aus dem Niederdeutschen entlehnt ist. So erwähnt Äugst (1975:13) die -s Plurale „als letzte Möglichkeit", die „aus dem Englischen und Niederdeutschen in die Hochsprache eindringt". Auch Werner (1968:96) nimmt das Plural -5 „nur nach langem Zögern" in seine Analyse auf, und für Rettig (1972:99) gibt der -s Plural „gewissermaßen das Kontrastbeispiel ab zur gelehrten Norm der peripheren Klassen". Auch in den neueren Pluralanalysen bildet der -s Plural eine besondere Kategorie. Wie oben berichtet, fällt in Köpckes Kunstwortexperiment (1993) auf, daß der -s Plural, trotz seiner geringen Auftretenshäufigkeit im realen Wortschatz, überproportional häufig übergeneralisiert wurde. Diese empirische Beobachtung stimmt mit den computerlinguistisch orientierten DATR-Analysen von Cahill und Gazdar (1999) und Kilbury (2001) überein, in denen der -s Plural als Defaultfall kategorisiert wird, der immer dann eintritt, wenn ein Nomen keine weiteren lexikalischen Spezifizierungen aufweist. Wunderlich (1999a) bezeichnet den -s Plural zwar als einen „untypischen" Plural, allerdings repräsentiert der -s Plural den obersten Knoten in dem von ihm vorgeschlagenen Vererbungsbaum und kann somit ebenfalls als Default für das gesamte System betrachtet werden. Auch Neef (1998) betrachtet den -s Plural als Default (wenn auch nur für das periphere Pluralsystem). Ein anderes Verständnis von Defaults scheint dagegen Wegener (1992) zu haben, was aus der Bemerkung hervorgeht: „Den -s Plural als Defaultwert anzusehen, verbietet sich schon aufgrund seiner niedrigen Frequenz: Defaultwerte haben i.a. die höchste Frequenz unter konkurrierenden Morphemen." (Wegener 1992:238)

Wie Wegener richtig bemerkt, haben Defaultwerte „im allgemeinen die höchste Frequenz unter konkurrierenden Morphemen". Beispiele hierfür sind das Plural -s und die Bildung der Präteritumformen mit -ed im Englischen, deren Regelhaftigkeit in morphologischen Analysen unumstritten ist. Empirische Untersuchungen haben gezeigt, daß diese Suffixe immer dann verwendet werden, wenn der Zugriff auf eine lexikalisch gespeicherte Form gestört oder nicht möglich ist. Marcus et al. (1995) nennen konkret 21 solcher Umstände, z.B. die Fälle, in denen kein identischer oder ähnlicher lexikalischer Eintrag existiert (Kunstwörter oder ungewöhnlich klingende Wörter). Im Dualen Modell (s. Abschnitt 2.2.3, Punkt (ii)) wird davon ausgegangen, daß der Grund für die Affigierung regulärer Suffixe in diesen Fällen in der Anwendung einer Defaultregel liegt, die immer dann zum Zuge kommt, wenn auf keinen gespeicherten Eintrag zugegriffen werden kann. Für das Englische könnte allerdings auch alternativ angenommen werden, daß die Verwendung regulärer Suffixe für ungewöhnliche Formen nicht auf einer Defaultregel beruht, sondern allein in der hohen Frequenz der Suffixe begründet ist. Diese Auffassung wird in konnektionistisch orientierten Lexikonmodellen vertreten. Die oben vorgestellte Auswahl an Pluralanalysen, die um eine regelhafte Erfassung der häufigsten Pluralformen bemüht sind (Werner 1968, Rettig 1972, Mugdan 1977, Äugst 1979, Wegener 1995), hat gezeigt, daß im deutschen Pluralsystem zwar eine Anzahl von

96

Regularitäten identifiziert werden kann, jedoch keine von ihnen den Kriterien eines allgemeinen Defaults entspricht. Selbst die einzige ausnahmslose Regel (Feminina auf -e bilden den Plural mit -n) kann nur als klassenspezifische Regel, aber nicht als allgemeiner Default kategorisiert werden, da ihre Anwendung auf feminine Nomina mit Stammauslaut Schwa beschränkt ist. Ein Default sollte dagegen immer dann anwendbar sein, wenn der Zugriff auf eine gespeicherte Form nicht möglich ist. Das impliziert, daß er an keine bestimmten kategorialen oder phonologischen Merkmale gebunden sein kann. Nach diesen Kriterien ist die einzige deutsche Pluralform, die sich wie ein nicht-klassenspezifischer, allgemeiner Default verhält, die Pluralform mit -s. Dies erkannte bereits van Dam (1940), der das Pluralsuffix -s als „Notpluralendung" bezeichnet. Eine Anzahl von Beobachtungen belegt, daß der -s Plural tatsächlich als Default anwendbar ist. Die wichtigsten sind im folgenden zusammengestellt (vgl. Marcus et al. 1995): • Der -s Plural ist an keine kategorialen Eigenschaften der Basis gebunden. Er tritt auf bei unassimilierten Lehnwörtern (Ketchups, Details, Kiosks) nichtreimenden Kunstwörtern (Fnöhks, Pnefs) Nachnamen (Meiers, Müllers), selbst wenn andere Pluralformen verfügbar wären (Zimmermanns vs. *Zimmermänner, Sonnenstuhls vs. *Sonnenstühle) Produktnamen (Kadetts, Golfs) lexikalisierten Phrasen (Tunichguts, Dreikäsehochs) nominalisierten Konjunktionen (Wenns, Aber s) Abkürzungen (Unis, GmbHs,AGs, SFBs) Eponymen (Fausts, Hamlets). • Der -s Plural ist an keine spezifsche phonologische Umgebung gebunden. Er tritt auf nach Vollvokal (Autos, Taxis, Pizzas) Konsonant (Chefs, Streiks, Tips, Festivals) betonten Silben (Karussells, Kartons, Resümees, Koteletts) unbetonten Silben (Koteletts, Apartments), Die Heterogenität der phonologischen und kategorialen Umgebungen, in denen der -s Plural verwendet wird, liefert jedoch nicht die einzige Evidenz, ihn als Default zu kategorisieren, sondern darüber hinaus sprechen hierfür auch die folgenden Gründe: • Der -s Plural wird im Spracherwerb überproportional häufig übergeneralisiert (Clahsen et al. 1992, Bartke 1998). Diese Übergeneralisierung ist nach der Annahme zu erwarten, daß der -s Plural immer dann verwendet wird, wenn eine gespeicherte Form (noch) nicht verfügbar ist.

97 • Der -5 Plural kann bei Aphasikern selektiv gestört sein (Penke 1998). Dieser Befund unterstützt die Annahme, daß der -s Plural mental anders repräsentiert und verarbeitet wird als die übrigen Pluralfornien. • Das Plural -s kann im Gegensatz zu allen anderen Pluralallomorphen nicht in Komposita erscheinen (Gordon 1985, Clahsen et al. 1992, Bartke 1998). Diese Beobachtung unterstützt die Hypothese, daß die Pluralbildung mit -s im Gegensatz zu allen anderen Pluralfornien regelbasiert ist: In zahlreichen lexikalischen Modellen, die morphologische Prozesse verschiedenen Ebenen des Lexikons zuordnen (z.B. Kiparsky 1982, Wiese 1996), findet reguläre Flexion erst dann statt, wenn alle anderen morphologischen Prozesse abgeschlossen sind. So erklärt sich, daß zwar gespeicherte Pluralformen in Komposita erscheinen können (Blumenladen, Schweinestall, Bücherregal), nicht aber reguläre (*Autosberg, * Kartonsfabrik, *Moskitosplage). Aus diesen Gründen ist es gerechtfertigt, den -s Plural als Default für das deutsche Pluralsystem anzunehmen. Sowohl die oben vorgestellten DATR-Analysen von Cahill und Gazdar (1999) und Kilbury (2001) als auch die Analyse von Wunderlich (1999a) tragen diesem Sachverhalt Rechnung.

4.4

Das deutsche Pluralsystem aus psycholinguistischer Perspektive

Wie im vorhergehenden Abschnitt gezeigt wurde, hat das deutsche Pluralsystem von jeher das Interesse der Morphologen gefunden. Die komplexe Interaktion von angenommenen phonologischen Prozessen und Affigierungsregeln führte dabei zu einer Vielzahl unterschiedlicher Analysen. In den meisten Analysen konnte jedoch stets nur ein Teil des Systems regelbasiert beschrieben werden, während eine erhebliche Anzahl von Pluralformen nur in Ausnahmelisten erfaßt werden konnte (Rettig 1972, Mugdan 1977, Äugst 1979, MacWhinney 1978, Wurzel 1990, Wurzel 1998, Wegener 1992, Wegener 1995, Neef 1998). Demgegenüber stellen die vorgestellten DATR-Analysen (Cahill & Gazdar 1999, Kilbury 2001) und die constraint-basierte Analyse von Wunderlich (1999a), die dem besonderen Status des -s Plurals als uneingeschränkter Defaultform gerecht werden, einen großen Fortschritt dar. Da die Kategorisierung des -s Plurals als Default auf qualitativen Kriterien basiert, wird sie entgegen Wegener (1992) durch seine niedrige Frequenz auch nicht entkräftet. Vielmehr ist gerade dies eine besonders interessante Eigenschaft des deutschen Pluralsystems, wie aus der Bemerkung von Wunderlich (1999a) hervorgeht: „What is interesting about the German noun plural system is the fact that it shows how an affixbased system may interplay with prosodic constraints. Particularly interesting is that an affix for untypical nouns [= -s, A.d.V.] is able to bleed a large class of typical nouns." (Wunderlich 1999a:16)

Das Ziel einer theoretischen morphologischen Analyse des deutschen Pluralsystems ist eine möglichst vollständige Erfassung aller Pluralformen in möglichst wenigen Klassen. Im Idealfall sollten dabei weder ungelöste Fälle übrigbleiben, die nur in Ausnahmelisten erfaßt werden können, noch sollten die verschiedenen Klassen arbiträr angenommen werden, son-

98

dem sich aus lexikalischen Merkmalen der Nomina ergeben. Diese Ansprüche sind (mit einzelnen Ausnahmen, s.o.) in der Analyse von Wunderlich (1999a) und (ausnahmslos) in der Analyse von Kilbury (2001) erfüllt. Aus der Perspektive der Psycholinguistik steht bei der Untersuchung eines Flexionssystems jedoch eine zusätzliche Fragestellung im Vordergrund. Hier geht es neben der Frage nach der genauen Beschaffenheit des Systems an sich vor allem um die Erforschung der mentalen Repräsentation und kognitiven Prozesse, die das Sprachsystem befähigen, die verschiedenen Flexionsformen zu produzieren und zu verarbeiten. Das Flexionssystem selbst dient dabei genaugenommen nur als Gegenstand, an dem die zugrundehegenden Vorstellungen eines psycholinguistischen Modells überprüft werden können. Psycholinguistische Untersuchungen eines Flexionssystems haben daher nicht nur das Ziel, eine alternative linguistische Analyse anzubieten, sondern erforschen auch die psycholinguistische Realität der in der Theorie angenommenen Vorstellungen. Auch aus psycholinguisticher Sicht macht daher die oben beschriebene Diskrepanz, nämlich das Verhalten des -s Plurals als Default trotz seiner sehr niedrigen Frequenz, das deutsche Pluralsystem besonders interessant, wie beispielsweise Clahsen et al. (1992) betonen: „[...] the noun plural system in German is particularly interesting, because most nouns have irregular plurals in German and the regular (default) plural is less frequent than several of the irregular plurals. "(Clahsen et al. 1992:225)

Im Rahmen des Dualen Modells, dessen psycholinguistische Annahmen bereits in Abschnitt 2.2.3, Punkt (ii) näher erläutert worden sind, werden somit zwei grundsätzlich unterschiedliche Arten deutscher Pluralformen unterschieden, nämlich -5 Plurale, die trotz ihrer niedrigen Frequenz als reguläre Defaults klassifiziert werden, und irreguläre Plurale (z.B. Clahsen et al. 1992, Clahsen & Rothweiler 1993, Marcus et al. 1995, Clahsen 1999, Pinker 1999, Sonnenstuhl et al. 1999). Diese Annahme wird durch zahlreiche empirische Befunde unterstützt. In einem Kunstwortexperiment gaben Marcus et al. (1995) erwachsenen Versuchspersonen die Aufgabe, die Akzeptabilität der Pluralformen von nicht existierenden Wörtern zu beurteilen. Die Kunstwörter wurden zunächst in einem Singularkontext eingeführt und anschließend mit jedem möglichen Pluralsuffix in einem Satzkontext präsentiert, aus dem die Plural-Lesart deutlich hervorging, wie das Beispiel einer Itemgruppe in (l 1) zeigt. (11) Itemgruppe aus Marcus et al. ( 995) Ich habe einen grünen KACH gegen meine Erkältung genommen. (Einführung) Aber die weißen KACH sind oft billiger und helfen auch besser. Aber die weißen KACH sind oft billiger und helfen auch besser. Aber die weißen KACHE sind oft billiger und helfen auch besser. Aber die weißen KÄCHE sind oft billiger und helfen auch besser. Aber die weißen KACHEN sind oft billiger und helfen auch besser. Aber die weißen KACHER sind oft billiger und helfen auch besser. Aber die weißen KÄCHER sind oft billiger und helfen auch besser. Aber die weißen KACHS sind oft billiger und helfen auch besser.

99

Anders als bei Kopeke (1993) wurden die Kunstwörter danach unterschieden, ob sie sich auf existierende Wörter mit irregulären Pluralformen reimten (z.B. Pund in Analogie zu Hund) oder nicht (z.B. PfiiöhJ). Die Ergebnisse zeigten, daß irreguläre Pluralfornien für Kunstwörter, die sich mit existierenden Kunstwörtern reimten, signifikant besser beurteilt wurden als für Kunstwörter, die sich nicht reimten. Die Pluralbildung mit -s wurde dagegen für reimende Kunstwörter als signifikant schlechter, für nichtreimende als signifikant besser beurteilt. Die Dissoziation zwischen regulären -s Pluralen und irregulären Pluralen hat sich nicht nur in Studien mit Erwachsenen, sondern auch in Untersuchungen mit Kindern bestätigt (Clahsen et al. 1992, Clahsen & Rothweiler 1993, Weyerts & Clahsen 1994, Clahsen 1997). Ähnlich wie in Marcus et al. (1995) sollten in einer Studie von Bartke et al. (1995) die Pluralformen von reimenden und nichtreimenden Kunstwörtern beurteilt werden. Die Ergebnisse dieser Studie sind mit denen aus dem Experiment mit Erwachsenen vergleichbar. Es zeigte sich, daß Kinder für nichtreimende Kunstwörter die Pluralformen auf -s als signifikant besser beurteilten als für reimende. Neben der Unterstützung für die Annahme, daß der -s Plural bei Kindern und bei Erwachsenen als Default verwendet wird, zeigen die Ergebnisse dieser beiden Beurteilungsstudien, daß die Pluralbildung für reimende Kunstwörter sensitiv für die Ähnlichkeit zu existierenden Pluralrnustern ist. Dies stimmt mit der These überein, daß irreguläre Pluralformen in assoziativen Netzwerken gespeichert sind. In einer weiteren Untersuchung mit Kindern wurden Pluralformen für existierende, niedrigfrequente irreguläre Nomina elizitiert (Clahsen et al. 1996). Dabei stellte sich heraus, daß von insgesamt 141 Fehlern in 58,5 % der Fälle das Affix -s benutzt wurde, was gegenüber der Erscheinenshäufigkeit dieses Affixes im zielsprachlichen System eine extreme Übergeneralisierung darstellt. Dieses Ergebnis unterstützt die These, daß in Fällen, in denen kein oder kein ähnlicher gespeicherter lexikalischer Eintrag verfügbar ist, bevorzugt -s Plurale angewendet werden (ebenso wie reguläre Verbformen, s. Abschnitt 3.2.4). Ebenso wie die Beurteilungsexperimente und die Untersuchungen zum Spracherwerb lieferten neurolinguistische Untersuchungen deutliche Evidenz für die Existenz von zwei unterschiedlichen Verarbeitungsmechanismen im deutschen Pluralsystem. So konnte Penke (1998) in einer Studie mit deutschen Aphasikern nachweisen, daß die beiden Flexionstypen unabhängig voneinander gestört sein können. In einer anderen Studie untersuchte Bartke (1998) die Plural- und Kompositabildung von sprachunauffälligen und dysgrammatischen Kindern. Es stellte sich heraus, daß die dysgrammatischen Kinder, ebenso wie sprachunaufiällige Kinder, zwischen irregulären und regulären Pluralformen differenzierten. Die Pluralbildung in Komposita unterlag dabei denselben Reihenfolgebeschränkungen, wie sie im unauffälligen Spracherwerb beobachtet werden konnten. Weitere neurolinguistische Evidenz kommt aus einer EKP-Studie von Weyerts et al. (1997), in der die Versuchspersonen Sätze mit korrekten und inkorrekten Pluralformen lasen. Die inkorrekten Pluralformen enthielten entweder eine inkorrekte Affigierung mit -s (*Muskels) für korrekte -n Plurale (Muskeln) oder eine inkorrekte Affigierung mit -(e)n (*Karussellen) für korrekte -s Plurale (Karussells) (12).

100

(12) Testsätze aus Weverts et al. (1997) korrekt:

Im Sporthemd zeigten sich seine stählernen Muskeln. Nicht ganz ungefährlich sind die modernen Karussells.

inkorrekt:

Im Sporthemd zeigten sich seine stählernen Muskels. Nicht ganz ungefährlich sind die modernen Karussellen.

Ein Vergleich der EKPs beim Lesen der inkorrekten Formen und der entsprechenden korrekten Formen ergab für die Flexionsverletzungen mit -s ein Aktivitätsmuster, das auch bei morphosyntaktischen Verletzungen beobachtet wird und daher für eine regelbasierte Verarbeitung des -s Plurals spricht (LAN, s. Abschnitt 1.2). Flexionsverletzungen durch die unzulässige Affigierung mit -(e)n bewirkten dagegen ein Aktivitätsmuster, daß ansonsten bei der Verarbeitung semantisch unplausibler Wörter beobachtet werden kann (N400). Diese N400 war für voll die vorhersagbaren -n Plurale femininer Nomina auf Schwa ebenso ausgeprägt wie für die anderen -n Plurale. Diese Verarbeitungsunterschiede zwischen -s Pluralen und -n Pluralen konnten von Niedeggen-Bartke et al. (1999) repliziert werden. Ähnlich wie Weyerts et al. (1997) präsentierten sie den Versuchspersonen in einer EKP-Studie Sätze, die als letztes Wort einen -s Plural oder eine andere Pluralform (mit -n oder -0) in der korrekten Form bzw. in der inkorrekten Form enthielten („Im Glas leuchteten bunte Bonbons. " vs. „Im Glas leuchteten bunte *Bonbon."). Auch in diesem Experiment konnte eine LAN für Flexionsverletzungen mit -s beobachtet werden, während inkorrekte Formen mit -n oder -0 eine N400 erzeugten. Die oben vorgestellte Auswahl an theoretischen Beschreibungen des Pluralsystems hat gezeigt, daß innerhalb der Pluralformen, die nicht per Default gebildet werden, zwischen mehr oder weniger irregulären Klassen unterschieden werden kann. Beispielsweise ist für maskuline Nomina die Pluralbildung auf -e als Regel vorgeschlagen worden (z.B. Mugdan 1977, Äugst 1979, Wegener 1995, Wunderlich 1999a). Tatsächlich konnten Niedeggen-Bartke et al. (1999) in einem EKP-Experiment beobachten, daß inkorrekte Pluralformen (irregulärer) Feminina, die ihren korrekten Plural mit -e bilden (*Bräuten), im N400-Bereich eine stärker ausgeprägte Negativierung erzeugten als inkorrekte Pluralformen (subregulärer) Maskulina auf -e (*Deichen). Niedeggen-Bartke et al. (1999) schließen aus diesem Ergebnis, daß zusätzlich zu der Annahme einer Defaultkomponente und dem assoziativen Netzwerk für irreguläre Formen eine dritte Komponente in Betracht gezogen werden muß, in der subreguläre Formen verarbeitet werden: „Therefore, the network component of the dual mechanism model has to be expanded in a way that subregularities may be represented by rules, while the remaining irregular forms are listed as full forms. Our results also suggest that a default rule is differently processed from rules displaying subregular character. These observations lead to a rediscussion of the dual mechanism model. Next to the default component and the phonologically structured network system, a third processing component must be considered." (Niedeggen-Bartke et al. 1999:34)

Eine weitere mögliche Subregularität bildet die -n Affigierung für feminine Nomina auf Schwa, die innerhalb des deutschen Pluralsystems, wie weiter oben beschrieben wurde, die einzige ausnahmslose Regel bilden. In Weyerts et al. (1997) verhielten sich diese Plurale zwar wie die anderen untersuchten -n Plurale, andererseits war die Aufgabe der Versuchspersonen in dieser Studie eine unimodal-visuelle, in der möglicherweise nur die orthographischen Zugriffsrepräsentationen der präsentierten Wortformen getestet wurden und nicht

101

die zentralen lexikalischen Einträge an sich. Falls allerdings subreguläre Formen im mentalen Lexikon anders als Defaultformen und irreguläre Formen repräsentiert sind, sollten sich in Experimenten, in denen der Zugriff auf das Lexikon sichergestellt ist, auch für diese Gruppe der -n Plurale Verarbeitungseffekte zeigen. Die Untersuchungen mit Reaktionszeitexperimenten, die im folgenden Kapitel vorgestellt werden, verfolgen daher zwei Ziele: Erstens sollen deutsche Pluralformen auch in lexikalischen Entscheidungsaufgaben und Primingexperimenten untersucht werden. Wie in Kapitel l beschrieben, stellen diese Experimente etablierte, intensiv erforschte und vielbenutzte Methoden auf dem Forschungsgebiet der Worterkennung dar. Eine Interpretation der Ergebnisse aus diesen Experimenten wird daher durch die Erfahrungen, die in anderen Studien mit denselben Methoden gewonnen wurden, erleichtert. Darüber hinaus ist das deutsche Pluralsystem für eine Überprüfung des Dualen Modells wegen der extrem niedrigen Frequenz des Defaultplurals besonders geeignet. Zeigen sich daher Verarbeitungsunterschiede zwischen dem Defaultplural und den übrigen Pluralformen, können sie nicht, wie z.B. im Englischen, mit seiner größeren Auftretenshäufigkeit erklärt werden, sondern werden vielmehr darauf hinweisen, daß qualitative Gründe ausschlaggebend für eine unterschiedliche Verarbeitung und Repräsentation sind. Zweitens soll am Beispiel des -n Plurals untersucht werden, welchen Einfluß die im Pluralsystem beobachtbaren Subregularitäten auf die Verarbeitung und Repräsentation dieser Formen haben.

Kapitel 5 Reaktionszeitexperimente zu deutschen Pluralen: Lexikalische Entscheidungsaufgaben

Die Analyse des deutschen Pluralsystems ist umstritten. Das liegt, wie das vorhergehende Kapitel gezeigt hat, vor allem daran, daß für das deutsche Pluralsystem wegen seiner zahlreichen Allomorphe und Subregularitäten, anders als für deutsche Verbformen, keine von vornherein eindeutige Unterscheidung zwischen regulären und irregulären Bildungen getroffen werden kann. Insbesondere wird die Annahme einer Defaultform, die sich in Repräsentation und Verarbeitung von den anderen Pluralformen unterscheidet, kontrovers diskutiert, hi vielen Analysen wird zwar zwischen „regulären" und „irregulären" Formen unterschieden, doch bleiben die meisten der vorgeschlagenen Regeln nicht ohne Ausnahmen. Sie sind daher eher als deskriptive Generalisierungen zu verstehen, die auf der Häufigkeit und Vorhersagbarkeit der Pluralbildungen basieren. Als Kandidat für eine solche reguläre Pluralbildung ist neben dem -e Plural vor allem der -n Plural vorgeschlagen worden. Um die Gültigkeit des Dualen Modells für das deutsche Pluralsystem zu überprüfen, sollte also zwischen Formen, die durch die mentale kombinatorische Operation der Defaultregel erzeugt werden, und traditionell als regulär bezeichneten Formen unterschieden werden. Daraus ergeben sich die folgenden Fragen, die hier in Reaktionszeitexperimenten untersucht werden sollen: (i)

Gibt es im deutschen Pluralsystem eine Form, die sich wie ein Default verhält?

(ii)

Ist der -s Plural die Defaultform, wie von Vertretern des Dualen Modells angenommen (s. Abschnitt 4.3)?

(iii) Werden Defaultformen und irreguläre Formen unterschiedlich verarbeitet? (iv) Unterscheiden sich Defaultformen und irreguläre Formen im Hinblick auf ihre lexikalische Repräsentation? (v)

Wie verhalten sich frequente, hochgradig vorhersagbare Pluralformen, die ein hohes Maß an Regularität aufweisen, aber nicht die Eigenschaft eines Defaults haben? Gibt es im Hinblick auf Verarbeitung und Repräsentation Unterschiede zu Defaultformen und/oder zu irregulären Formen?

Die Experimentserie zu deutschen Pluralen, die hier vorgestellt werden soll, beginnt mit der Untersuchung von Wortformfrequenzeffekten in lexikalischen Entscheidungsaufgaben (s. dazu auch Clahsen, Eisenbeiß & Sonnenstuhl 1997, Sonnenstuhl & Huth 2002). Mit diesen Untersuchungen kann zwei Fragestellungen nachgegangen werden: Erstens läßt sich überprüfen, ob zwei qualitativ unterschiedliche Repräsentationsformen, dh. die dekomponierte Repräsentation einer Defaultform im Gegensatz zu der vollformbasierten Repräsentation anderer Formen, auch für den Bereich der nominalen Pluralflexion anzunehmen sind - obwohl die Existenz einer Defaultform weniger offensichtlich ist als im deutschen Verbsystem. Zweitens kann getestet werden, ob der -s Plural tatsächlich den Defaultfall darstellt -

104 obwohl seine Type- und seine Token-Frequenz im Vergleich zu den anderen Pluralformen extrem niedrig ist. Pluralanalyse

Lexikonmodell

-s Plurale als Defaultform

andere Plurale

getrennte Einträge (nur Vollformen)

Wortformfrequenzeffekte

Wortformfrequenzeffekte

gemeinsame Einträge (Dekomposition)

Stammfrequenzeffekte

Stammfrequenzeffekte

Duales Modell

Stammfrequenzeffekte

Wortformfrequenzeffekte

Tabelle 14: Erwartete Frequenzeffekte in Abhängigkeit verschiedener Lexikonmodelle und Pluralanalysen

Tabelle 14 verdeutlicht, daß eine Untersuchung der Wortformfrequenzeffekte für verschiedene Pluraltypen Rückschlüsse auf diese Fragen erlaubt. Es sind genau dann unterschiedliche Frequenzeffekte in lexikalischen Entscheidungsaufgaben zu erwarten, wenn beide der oben gestellten Fragen positiv beantwortet werden können.

5. l

Experiment l: Wortformfrequenzeffekte für -er und -s Plurale

Mit dem ersten hier vorgestellten Experiment soll untersucht werden, ob die qualitativ unterschiedliche Verarbeitung, die sich in lexikalischen Entscheidungsaufgaben für die verschiedenen Flexionstypen deutscher Partizipien gezeigt hat (s. Abschnitt 3.2.2), auch für den Bereich der deutschen Plurale Gültigkeit hat. Es wurden dazu -er Plurale, die allgemein als irregulär betrachtet werden, den -s Pluralen, die nach dem Dualen Modell die Kriterien eines Defaults aufweisen, gegenübergestellt. (Eine kurze Darstellung dieses Experiments ist in Clahsen, Eisenbeiß & Sonnenstuhl (1997) erschienen.)

5.1.1 Vorhersagen Im Hinblick auf die verschiedenen Lexikonmodelle ergeben sich die folgenden Vorhersagen: Unitäre Lexikonmodelle nehmen - unabhängig davon, welche morphologisch komplexen Formen als regulär, irregulär oder als Defaultfall analysiert werden - eine einheitliche Verarbeitung für die verschiedenen Flexionstypen an. Nach diesen Modellen sollten daher für die verschiedenen deutschen Pluralformen keine unterschiedlichen Frequenzeffekte in lexikalischen Entscheidungsaufgaben zu erwarten sein. Insbesondere wären im Rahmen der Modelle, die separate Vollformrepräsentationen für alle flektierten Formen

105 annehmen, Wortformfrequenzeffekte für alle Pluraltypen zu erwarten (z.B. Lukatela et al. 1978, Butterworth 1983, Andrews 1986, Feldman & Fowler 1987, Schreuder et al. 1990, Bybee 1991, Grainger et al. 1991, Schriefers et al. 1992, Kopeke 1993). Modelle, die prälexikalische Dekomposition für alle Wertformen mit separierbarem Affix annehmen, würden dagegen Stammfrequenzeffekte für alle Pluraltypen voraussagen (z.B. Taft & Forster 1975, Taft 1979a, Taft et al. 1986). Nach den Annahmen des Dualen Modells werden Defaultformen in Stamm und Affix dekomponiert. In einer lexikalischen Entscheidungsaufgabe sollte somit die Frequenz der vollen Wortform keinen Einfluß auf die Erkennungszeiten der Pluralform haben. Da nach den Kriterien des Dualen Modells nur der -s Plural die Defaultform ist, sollten auch nur hier Effekte beobachtbar sein, die gegen eine gespeicherte Vollform sprechen. Für irreguläre -er Plurale wird dagegen erwartet, daß sie als Vollform repräsentiert sind und dementsprechend Wortformfrequenzeffekte zeigen.

5.1.2 Materialien und Versuchsplan (i)

Testitems

Für das Experiment wurden jeweils 20 nominale Pluralformen auf -er und auf -s ausgewählt. Jede Gruppe enthielt 10 Pluralformen mit hoher und 10 mit niedriger Wortformfrequenz (WF). In Tabelle 15 sind für die sich daraus ergebenden vier experimentellen Bedingungen die durchschnittlichen Wortformfrequenzen zusammen mit einem Beispiel angegeben.1 Eine vollständige Liste der Testitems und ihrer Pluralfrequenzen findet sich in AnhangC. -er Plurale

-s Plurale

niedrig

10,9 (Wurmet)

7,8 (Lassos)

hoch

64,6 (Krauter)

40,5 (Kinos)

Wortformfrequenz

Tabelle 15: Experimentbedingungen und durchschnittliche WF in Experiment l

(ii)

Distraktoren

Der Experimentliste wurden als Distraktor-Items 20 nominale Plurale mit anderen Pluralendungen, 60 flektierte Verben und 60 flektierte Adjektive hinzugefügt. Damit waren Flexionsformen von Nomina, Verben und Adjektiven gleich häufig vertreten. So wurde sichergestellt, daß keine Strategien aus der Art der Wortkategorie oder dem Flexionstyp ab1

Alle Frequenzangaben in diesem und den folgenden Reaktionszeitexperimenten zum deutschen Plural sind der CELEX-Datenbank für gesprochenes und geschriebenes Deutsch (Baayen et al. 1993) entnommen.

106

geleitet werden konnten. Zusätzlich zu den insgesamt 180 existierenden Wörtern wurden 180 phonotaktisch mögliche Pseudowörter konstruiert, die sich in zwei oder drei Buchstaben von existierenden Wörtern unterschieden. Um unerwünschte Primingeffekte innerhalb der Liste auszuschließen und um zu verhindern, daß mehr als vier Wörter oder PseudoWörter in Folge erschienen, wurden die Items in pseudorandomisierter Reihenfolge präsentiert.

5.1.3 Teilnehmer und Methode An dem Experiment nahmen 14 weibliche und 12 männliche Studenten der HeinrichHeine-Universität Düsseldorf mit einem durchschnittlichen Alter von 26 Jahren teil. Alle Versuchspersonen waren deutsche Muttersprachler. Ihre Teilnahme an dem Experiment wurde mit 8 DM vergütet. Die Aufgabe der Versuchsteilnehmer bestand darin, so schnell und so korrekt wie möglich zu entscheiden, ob die auf einem Bildschirm präsentierte Buchstabenkette ein Wort war oder nicht. Ihre Entscheidung teilten die Teilnehmer durch das Drücken einer grünen bzw. roten Taste auf einer Antwortbox mit. Die Antwortbox wurde so angeordnet, daß sich die grüne Taste, mit der die positiven Antworten gegeben wurden, stets auf der Seite der bevorzugten Händigkeit der Versuchsperson befand. In diesem und allen folgenden Experimenten wurden die Versuchspersonen einzeln getestet. Sie saßen ungestört in einem separaten, schwach beleuchteten Raum. Der Computer-monitor wurde so aufgestellt, daß keine störenden Reflektionen durch Lichteinfall auftreten konnten. Jedes Trial begann mit der Präsentation eines Fixationspunktes in der Mitte des Bildschirms, dem nach 600 msek an derselben Position der Stimulus folgte. Die Stimuli wurden auf einem 15"-Monitor in weißen Buchstaben (Arial 26 pt) vor einem dunklen Hintergrund präsentiert. Sie blieben auf dem Monitor bis zur Betätigung einer Antworttaste sichtbar, längstens aber 2000 msek. Die Zeit zwischen den einzelnen Trials betrug 1200 msek. Vor Beginn des Experiments erhielten die Teilnehmer eine detaillierte schriftliche Anleitung (s. Anhang A). Das Experiment selbst begann mit einer Übungsphase, die aus 20 Trials bestand. Danach wurde der Experimentablauf unterbrochen, um der Versuchsperson Gelegenheit zu geben, eventuell verbleibende Fragen zur Experimentaufgabe zu klären. Im weiteren Verlauf des Experiments gab es zwei weitere Pausen. Insgesamt dauerte ein Experimentdurchlauf ca. 30 Minuten. Die Präsentation der Stimuli und die Messung der Reaktionszeiten wurden durch das NESU (New Experimental Setup) - Softwarepaket kontrolliert, das speziell für die Präsentation auditiver und visueller Stimuli entwickelt wurde.2 Zusammen mit der dazugehörigen Antwortbox garantiert diese Software eine Meßgenauigkeit von +/-1 msek. Dies ist ein besonderer Vorteil gegenüber anderen Programmen mit Reaktionszeitmessung per Computertastatur, bei denen eine Fehlertoleranz von bis zu 60 msek berücksichtigt werden muß. Vor einer statistischen Analyse der Reaktionszeiten wurden inkorrekte Antworten, d.h. die Betätigungen der roten Taste als Reaktion auf ein präsentiertes Wort bzw. die Betäti2

Die NESU-Software (Baumann et al. 1993) wurde am Max-Planck-Institut für Psycholinguistik in Nijmegen entwickelt und kostenlos zur Verfügung gestellt. Dem MPI, insbesondere den Entwicklern der Software, gilt hierfür besonderer Dank.

107 gungen der grünen Taste als Reaktion auf ein Pseudowort, aus dem Datensatz ausgeschlossen. Erfolgte keine Reaktion innerhalb von 2000 msek, wurde dies ebenfalls als inkorrekte Antwort gezählt. Ebenfalls wurden außergewöhnlich kurze oder lange Reaktionszeiten, die pro Bedingung plus bzw. minus 2.00 Standardabweichungen überhalb oder unterhalb des Mittelwertes lagen, nicht berücksichtigt.3 Der Anteil der nicht berücksichtigten Daten für die Testitems unterschied sich nicht signifikant für die einzelnen Bedingungen und betrug insgesamt ca. 7,5 %.

5.1.4 Ergebnisse In diesem Experiment sollten Wortformfrequenzeffekte für zwei Pluraltypen, nämlich -er Plurale, die allgemein als irregulär betrachtet werden, und -s Plurale, die nach dem Dualen Modell den Defaultfall darstellen, überprüft werden. Es wurde erwartet, daß -er Plurale mit hoher Wortformfrequenz (WF) kürzere Erkennungszeiten aufweisen als -er Plurale mit niedriger Wortformfrequenz. Im Gegensatz dazu sollte für -s Plurale kein wortformfrequenzbasierter Effekt auf die Reaktionszeiten zu beobachten sein.

650

DWF hoch • WF niedrig

er-Plurale

s-Plurale

Abbildung 7: Durchschnittliche Erkennungszeiten für die vier Experimentbedingungen in Exp. l (VP-Analyse)

Abbildung 7 zeigt die durchschnittlichen Reaktionszeiten der Versuchspersonen (VPs) pro Bedingung. Es ist ersichtlich, daß für -er Plurale tatsächlich einen starker Wortformfrequenzeffekt beobachtet werden konnte: Die Erkennungszeiten für hochfrequente -er Plurale waren deutlich kürzer als die für niedrigfrequente. Ein statistischer Vergleich mit gepaarten /-Tests zeigte, daß dieser Unterschied mit 84 msek (in der VP-Analyse, d.h. 3

Diese und alle folgenden statistischen Berechnungen wurden mit Hilfe des Computerprogramms SPSS durchgeführt.

108 bei dem Vergleich der durchschnittlichen Reaktionszeiten der Versuchspersonen pro Bedingung) bzw. 89 msek (in der Item-Analyse, d.h. bei dem Vergleich der durchschnittlichen Erkennungszeiten der Items pro Bedingung) hochsignifikant ist.4

Die Erkennungszeiten für hoch- und niediigfrequente -s Plurale wiesen dagegen keine signifikanten Unterschiede auf (4 msek für VPs und 7 msek fur Items). Die einzelnen i-Werte sind, jeweils zusammen mit der Angabe über ihre statistische Wahrscheinlichkeit (p-Wert), in Tabelle 16 aufgeführt. Pluraltyp

RT (WF hoch)

RT (WFniedrig)

Differenz

-er Plural

587

671

84*; f(26) = 6.62, p < .001

-s Plural

650

654

4n.s.;