Grammatische Regeln und konversationelle Strategien: Fallstudien aus Syntax und Phonologie [Reprint 2015 ed.] 9783110914719, 9783484303751

The aim of this study is to establish whether conversational competence competes with grammatical competence (as suggest

213 43 16MB

German Pages 288 [292] Year 1997

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Strategien der Internationalisierung: Fallstudien und Fallbeispiele [3., überarb. und erw. Aufl.] 9783486721478, 9783486719468

Dieses im deutschsprachigen Raum einzigartige Buch stellt anhand von 23 Fallbeispielen und Fallstudien die International

553 99 27MB Read more

Ethnomarketing und Integration: Eine kulturwirtschaftliche Perspektive. Fallstudien aus Deutschland, den USA und Großbritannien [1. Aufl.] 9783839424285

Die Ausrichtung unternehmerischer Aktivitäten an ethnischen Minderheiten erlebt in westlichen Einwanderungsgesellschafte

260 27 2MB Read more

Wackernagels Gesetz im Deutschen: Zur Interaktion von Syntax, Phonologie und Informationsstruktur 9783110418484, 9783110419603

Wackernagel’s law explains the global similarity of natural languages. Wackernagel elements generally tend to be in seco

175 14 4MB Read more

Das Holontalo. Glossar und grammatische Skizze

407 45 30MB Read more

Fokus im Spannungsfeld von Phonologie und Syntax: Eine Studie zum Spanischen 9783964561954

Auf empirischer Basis werden snytaktische und prosodische Verfahren der Fokusmarkierung im Spanischen analysiert. Basis

168 52 35MB Read more

Intonatorische Verfahren im Deutschen und Italienischen: Gesprächsanalyse und autosegmentale Phonologie [Reprint 2011 ed.] 9783110918342, 9783484304390

The study examines the intonation resources used in German and Italian conversation to constitute and/or contextualize s

205 32 9MB Read more

Deutsche Phonologie und Morphologie: Merkmale und Markiertheit 3484301171, 9783484301177

Die Buchreihe Linguistische Arbeiten hat mit über 500 Bänden zur linguistischen Theoriebildung der letzten Jahrzehnte in

217 72 8MB Read more

Gewinnen: Strategien für mathematische Spiele. 3, Fallstudien 9783528085339, 9783322831729, 3528085339

351 57 25MB Read more

Organisation und Projektmanagement: Fallstudien, Klausuren, Übungen und Lösungen 9783110481839, 9783110480825

This book contains a collection of case studies and exam tasks with the accompanying solutions as well as further tasks

270 62 3MB Read more

Grammatische Variation: Empirische Zugänge und theoretische Modellierung 9783110518214, 9783110501155

Grammatical variation in standard language is surprisingly complex and multifaceted, involving an interplay of internal

189 62 4MB Read more

Grammatische Regeln und konversationelle Strategien: Fallstudien aus Syntax und Phonologie [Reprint 2015 ed.]
9783110914719, 9783484303751

Author / Uploaded
Susanne Uhmann

Table of contents :
Vorwort
1. Einleitung
1.1 Grammatikforschung und Konversationsanalyse
1.2 Zwei Möglichkeiten der Grenzziehung zwischen Grammatikforschung und Konversationsanalyse
1.3 Die Fallstudien
2. Satzgliedvariation und Gesprächsorganisation: Mittelfeldbesetzung und Mittelfeldentleerung
2.1 Wortstellungsregularitäten im Mittelfeld
2.1.1 Das Wettbewerbsmodell von Jacobs
2.1.2 Das Komplexitätsmodell von Hawkins
2.2 Das Mittelfeld in natürlichen Konversationen
2.2.1 Komplexität oder Wettbewerb?
2.2.2 Das Mittelfeld als Hauptfeld?
2.3 Mittelfeldentleerung in natürlichen Konversationen
2.3.1 Prosodische Eigenschaften: Intonationsphrasenbildung
2.3.2 Syntaktische Eigenschaften
2.3.3 Formtypen der Mittelfeldentleerung
2.4 Funktionale Aspekte der konversationeilen Mittelfeldentleerung
2.4.1 Effizienteres Parsen
2.4.2 Organisation des Sprecherwechsels
2.4.3 Durchführung von Selbstreparaturen
2.4.4 Markierung der Informationsstruktur
2.5 Zusammenfassung
3. Rhythmus und Akzent: Akzentzusammenstöße in Bewertungssequenzen
3.1 Zur konversationellen Organisation von Bewertungen
3.1.1 Bewertungen und Gegenbewertungen
3.1.2 Nachrichten und Kommentare
3.2 Prominenz und Rhythmus
3.2.1 Akzentzusammenstöße in der metrischen Phonologie
3.2.2 Akzentzusammenstöße in natürlichen Konversationen
3.3 Konversationelle Restriktionen für Akzentzusammenstöße
3.3.1 Akzentzusammenstöße in Kommentaren
3.3.2 Akzentzusammenstöße in Nachrichten
3.3.3 Risiken bei der Verwendung von Akzentzusammenstößen
3.3.4 Rhythmus in Bewertungspaarsequenzen
3.4 Grammatische Restriktionen für konversationeil induzierte Akzentzusammenstöße
3.5 Zusammenfassung
4. Sprechgeschwindigkeitsveränderungen: Formen und Funktionen in Alltagsgesprächen
4.1 Zur Perzeption von Sprechgeschwindigkeitsveränderungen
4.1.1 Anzahl der Laute, Wörter oder Silben pro Zeiteinheit
4.1.2 Anzahl der Schläge oder akzentuierten Silben pro Zeiteinheit
4.1.3 Anzahl, Dauer und Plazierung von Pausen pro Zeiteinheit
4.1.4 Intonationsphrasen als Meßeinheiten
4.1.5 Grundfrequenz
4.1.6 Resümee
4.2 Kontextualisierungsfunktionen von Sprechgeschwindigkeitsveränderungen
4.2.1 Ikonische Funktion
4.2.2 Selbstreparaturen
4.2.3 Thematisch relevante vs. weniger relevante Information
4.2.4 Zusammenfassungen und Wiederholungen
4.2.5 Parenthesen, Appositionen, Einschübe und Seitensequenzen
4.3 Zusammenfassung
5. Rück- und Ausblick
Transkriptionsnotation
Literaturverzeichnis

Citation preview

Linguistische Arbeiten

375

Herausgegeben von Hans Altmann, Peter Blumenthal, Herbert E. Brekle, Gerhard Heibig, Hans Jürgen Heringer, Heinz Vater und Richard Wiese

Susanne Uhmann

Grammatische Regeln und konversationeile Strategien Fallstudien aus Syntax und Phonologie

Max Niemeyer Verlag Tübingen 1997

Die Deutsche Bibliothek - CIP-Einheitsaufnahme Uhmann, Susanne: Grammatische Regeln und konversationelle Strategien : Fallstudien aus Syntax und Phonologie / Susanne Uhmann. - Tübingen : Niemeyer, 1997 (Linguistische Arbeiten ; 375) ISBN 3-484-30375-1

ISSN 0344-6727

© Max Niemeyer Verlag GmbH & Co. KG, Tübingen 1997 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Druck: Weihert-Druck GmbH, Darmstadt Buchbinder: Industriebuchbinderei Hugo Nadele, Nehren

Inhaltsverzeichnis

Vorwort

vii

1.

Einleitung

1

1.1 1.2

Grammatikforschung und Konversationsanalyse Zwei Möglichkeiten der Grenzziehung zwischen Grammatikforschung und Konversationsanalyse Die Fallstudien

6 15 17

Satzgliedvariation und Gesprächsorganisation: Mittelfeldbesetzung und Mittelfeldentleerung

21

2.1 2.1.1 2.1.2 2.2 2.2.1 2.2.2 2.3 2.3.1 2.3.2 2.3.3 2.4 2.4.1 2.4.2 2.4.3 2.4.4 2.5

Wortstellungsregularitäten im Mittelfeld Das Wettbewerbsmodell von Jacobs Das Komplexitätsmodell von Hawkins Das Mittelfeld in natürlichen Konversationen Komplexität oder Wettbewerb? Das Mittelfeld als Hauptfeld? Mittelfeldentleerung in natürlichen Konversationen Prosodische Eigenschaften: Intonationsphrasenbildung Syntaktische Eigenschaften Formtypen der Mittelfeldentleerung Funktionale Aspekte der konversationellen Mittelfeldentleerung Effizienteres Parsen Organisation des Sprecherwechsels Durchführung von Selbstreparaturen Markierung der Informationsstruktur Zusammenfassung

23 24 26 30 30 37 39 40 54 60 67 67 72 76 85 93

3.

Rhythmus und Akzent: Akzentzusammenstöße in Bewertungssequenzen

97

Zur konversationeilen Organisation von Bewertungen Bewertungen und Gegenbewertungen Nachrichten und Kommentare Prominenz und Rhythmus Akzentzusammenstöße in der metrischen Phonologie Akzentzusammenstöße in natürlichen Konversationen

98 99 113 116 123 135

1.3

2.

3.1 3.1.1 3.1.2 3.2 3.2.1 3.2.2

vi 3.3 3.3.1 3.3.2 3.3.3 3.3.4 3.4 3.5

Konversationelle Restriktionen für Akzentzusammenstöße Akzentzusammenstöße in Kommentaren Akzentzusammenstöße in Nachrichten Risiken bei der Verwendung von Akzentzusammenstößen Rhythmus in Bewertungspaarsequenzen Grammatische Restriktionen für konversationeil induzierte Akzentzusammenstöße Zusammenfassung

141 141 148 156 161 . 166 182

4.

Sprechgeschwindigkeitsveränderungen: Formen und Funktionen in Alltagsgesprächen

185

Zur Perzeption von Sprechgeschwindigkeitsveränderungen Anzahl der Laute, Wörter oder Silben pro Zeiteinheit Anzahl der Schläge oder akzentuierten Silben pro Zeiteinheit Anzahl, Dauer und Plazierung von Pausen pro Zeiteinheit Intonationsphrasen als Meßeinheiten Grundfrequenz Resümee Kontextualisierungsfunktionen von Sprechgeschwindigkeitsveränderungen Ikonische Funktion Selbstreparaturen Thematisch relevante vs. weniger relevante Information Zusammenfassungen und Wiederholungen Parenthesen, Appositionen, Einschübe und Seitensequenzen Zusammenfassung

186 189 192 194 196 201 202 205 207 209 223 237 245 259

4.1 4.1.1 4.1.2 4.1.3 4.1.4 4.1.5 4.1.6 4.2 4.2.1 4.2.2 4.2.3 4.2.4 4.2.5 4.3

5.

Rück- und Ausblick

261

Transkriptionsnotation

265

Literaturverzeichnis

267

Vorwort

Die vorliegende Arbeit verbindet die nach ihrem Selbstverständnis sehr unterschiedlichen linguistischen Teildisziplinen Grammatikforschung und Konversationsanalyse. Ich konnte davon profitieren, daß ich immer wieder auf Kolloquien und in Arbeitsgruppen Diskussionspartner aus beiden 'Lagern' hatte. Besonders erwähnen möchte ich an dieser Stelle die deutschschwedische Forschungsgruppe "Sprache und Pragmatik". Mein Dank gilt Daniele Clement, John Gumperz, Marga Reis und Peter Scherfer, die eine Vorversion gelesen und kommentiert haben, für wertvolle Hinweise und konstruktive Überarbeitungsvorschläge. Zu danken habe ich auch den Herausgebern der Reihe "Linguistische Arbeiten", insbesondere Heinz Vater, sowie den Betreuern der Reihe beim Niemeyer Verlag. Der fachlichen und persönlichen Unterstützung, die ich von Joachim Jacobs erhalten habe, kann ich mit den an dieser Stelle üblichen Formulierungen kaum gerecht werden. Trotzdem: Danke! Wuppertal, im April 1997

Susanne Uhmann

Der Analysegegenstand des Sprachwissenschaftlers beschränkt sich nicht -

auf den Laut und die Lautsequenz im Verhältnis zu anderen Lauten und Lautsequenzen einer Sprache, - auf das Wort im Verhältnis zu anderen Wörtern derselben oder einer anderen Sprache, - auf den Satz oder die Aussage oder den Sprechakt im Verhältnis zu anderen Sätzen, Aussagen und Sprechakten. Der Sprachwissenschaftler analysiert auch Texte und Gespräche [...]. Ich unterstelle dies einfach als gegeben. (Wunderlich 1978: 41)

1. Einleitung

Die vorliegende Arbeit verfolgt das Ziel, exemplarisch aufzuzeigen, daß und wie zwei Forschungsstränge, Grammatikforschung und Konversationsanalyse,

auf eine sprachwissen-

schaftlich fruchtbare Weise miteinander verbunden werden können. Obwohl beide Disziplinen 'Sprache' als Untersuchungsgegenstand teilen, stehen sie sich doch bisher weitgehend antagonistisch, mit Desinteresse oder Unverständnis gegenüber.1 Eine Ursache für diesen Zustand zeigt sich, sobald das Erkenntnisobjekt Sprache präziser bestimmt wird. Während in der Grammatikforschung vor allem das schriftsprachlichen Sätzen zugrundeliegende Regelsystem den Untersuchungsgegenstand bildet, beschäftigt sich der Konversationsanalytiker mit sprachlicher Interaktion, was in der Regel die Analyse gesprochener Sprache bedeutet. Diese sehr unterschiedlichen Bestimmungen des Forschungsgegenstands führen dann u.a. auch dazu, daß die Forschungsinteressen und -ergebnisse der jeweils anderen Disziplin in einer Weise beurteilt werden, die dieser nicht gerecht wird. So können Grammatiker oftmals in der Erforschung gesprochener Sprache nur sehen, daß der faktische Sprachgebrauch die strukturellen Gesetzmäßigkeiten einer Sprache nur in sehr unzureichendem Maße widerspiegelt, sei es, daß strukturell signifikante Daten nur selten vorkommen, sei es, daß Performanzphänome die intentionalen Produkte natürlicher Sprecher in einer Weise deformieren, die die tatsächlichen strukturellen Regeln nur in einer sehr defekten Weise.zum Ausdruck bringen. (Giewendorf 1993: 120)

Eine solche Formulierung ist zumindest insofern irreführend, als sie nahelegt, im "faktischen Sprachgebrauch" ließe sich nur die Interaktion von Performanzphänomenen und tatsächlichen

Diese Ginstellungen manifestieren sich u.a. in den Etikettierungen, mit denen sich Vertreter der jeweiligen Disziplinen belegen. Da ist von "harter" versus "weicher Linguistik", von "galileischer" versus "analytischer Methode" oder von "Chomsky-Paradigma" vs. "Mead-Theorie" die Rede; die einen Forscher werden pauschal als "Strukturalisten" oder "Formalisten", die anderen als "Funktionalisten" oder "Jäger und Sammler" bezeichnet (vgl. u.a. die Auseinandersetzung in ZS 1993).

2 strukturellen Regeln (=Grammatik) analysieren.2 Eine sprachliche Ordnung außerhalb der Grammatik wird aus dieser Perspektive offensichtlich nicht vermutet. Konversationsanalytiker hingegen, vor allem, wenn sie sich als Sprachsoziologen von solchen Linguisten abgrenzen wollen, die sich auch für das Sprachsystem (im engeren Sinne) interessieren, warnen: [...] für einen Linguisten mit konversationsanalytischen Interessen [wird] es zweifellos schwierig werden, immer im Kopf zu behalten, daß sich seine Analyse nicht in erster Linie mit Sprache, sondern mit Interaktion zu beschäftigen hat. Er muß sich in seiner Arbeit immer daran orientieren, daß die einzelne sprachliche Äußerung nur der 'Gast' (Sacks) in einem Redezug ist [...], daß ihm sein Wissen über Sprache nichts oder nur wenig bei der konversationsanalytischen Arbeit nützen wird, und [...] daß ihm seine linguistischen Denkmuster manchmal geradezu hinderlich sein werden, um einen Blick zu entwickeln für die Prozesse der lokalen, reflexiven Produktion von sozialer Ordnung in der (sprachlichen) Interaktion. (Bergmann 1981: 33)

Zusammen mit der Einschätzung, daß mit der Betrachtung gesprochener Sprache nur deformierende Performanzphänomene in die linguistische Forschung eingeschleppt werden bzw. daß grammatisches Wissen die konversationsanalytische Arbeit nur unnötig behindert, wird zumeist auch ein Streit darüber ausgefochten, auf welcher Datengrundlage linguistische Analysen durchzuführen sind: natürliche, im Feld erhobene Daten oder selbstkonstruierte Beispielsätze. Dabei wird auf beiden Seiten regelmäßig übersehen, daß die Entscheidung ausschließlich davon abhängt, welche Hypothesen überprüft werden sollen - in jedem Fall wird man das für die jeweilige Hypothese einschlägige und relevante Datenmaterial betrachten müssen.3 Wenn in der gesprochenen Sprache nur eine mögliche und noch dazu im Grunde uninteressante Störquelle gesehen wird, dann ist es nur konsequent, sie ganz außer Betracht zu lassen und sich einschlägige und relevante Daten selbst zu konstruieren. Ein solches Vorgehen ist sicher dann sinnvoll, wenn man sprachliche Daten zur Überprüfung grammatischer Hypothesen heranziehen möchte. Hier würde nur ein "falsch verstandener Empirismus" (Grewendorf 1993: 120) fordern, keine konstruierten Daten zu verwenden. O b diese Daten im tatsächlichen Sprachgebrauch häufig oder gar nicht verwendet werden, spielt für die zu überprüfende grammatische Hypothese insofern keine Rolle, als ja die der Regelbeherrschung zugrundeliegende grammatische Kompetenz zur Debatte steht. (Grewendorf 1993: 120)

Diese Deutung wird dadurch unterstützt, daß Grewendorf (1993:120) an dieser Stelle und unter dem Stichwort "konversationsanalytische Arbeiten" nur auf "Satzbrüche, Ellipsen, 'Kongruenzschwächen', Kontaminationen etc." hinweist. Dieser Vorwurf trifft allerdings auf Grewendorf (1993: 115ff) nicht zu. Außerdem ist die Dichotomie 'Grammatiker = selbstkonstruierte Bespielsätze' vs. 'Konversationsanalytiker = natürliche Daten' insofern eine Vereinfachung, als auch Grammatiker gelegentlich mit belegtem und in diesem Sinne natürlichem Datenmaterial arbeiten. Die "syntax der deutschen Standardsprache" von Clement & Thümmel (1975) basiert ausschließlich auf belegtem, allerdings schriftsprachlichen Datenmaterial. Vgl. aber auch Hawkins' (1990, 1992) in Kap. 2 diskutierte Theorie zur Satzgliedfolge im Mittelfeld, die er durch literarische Texte belegt. (Die Orientierung an belegten, oft literarischen Daten ist im übrigen ein wesentliches Merkmal großer Teile der prä-generativen Grammatikforschung.)

3

Wenn jedoch dialogische Phänomene erforscht werden sollen, Komplimente, das Erzählen von Witzen, die Organisation des Sprecherwechsels, die Eröffnung und Beendigung von Telefongesprächen oder die Reparatur von Sprech-, Hör- oder Verstehensfehlschlägen in bereits abgeschlossenen oder noch im Vollzug befindlichen Redezügen, werden auch selbstkonstruierte Minimaldialoge die oben genannten Anforderungen an die Datenadäquatheit kaum erfüllen, denn über die in diesem Bereich zu entdeckenden strukturellen Gesetzmäßigkeiten lassen sich nur dann Hypothesen bilden, wenn man sehr genau beobachtet, was Konversationsteilnehmer tatsächlich tun. Die Strukturprinzipien der Reparaturorganisation, des Witzeerzählens usw. entziehen sich weitgehend der Introspektion.4 [In der Konversationsanalyse werden] nicht Erinnerungen, imaginierte Beispiele oder experimentell induziertes Verhalten, sondern Aufzeichnungen von real abgelaufenen 'natürlichen'Interaktionen zum Gegenstand der Analyse [gemacht]. Dahinter steckt das Bemühen, die Analyse darauf zu verpflichten, sich auf den dokumentierten Ablauf dieser Vorgänge selbst zu stützen, anstatt idealisierte Versionen von sozialen Vorgängen als Daten zu benutzen. Denn die Prinzipien der Organisation von sprachlicher und nichtsprachlicher Interaktion können sich in Phänomenen und Details manifestieren, in denen die mit dem Commonsense arbeitende Intuition sie nicht vermuten würde. (Bergmann 1994: 10)

Mit diesem Forschungsinteresse und auf der Basis theoretischer Grundannahmen über die Konstitution sinnhafter Ordnung in und durch die Alltagsinteraktion, auf die ich im nächsten Abschnitt noch ausführlicher eingehe, ist es für den Konversationsanalytiker also unerläßlich, natürliche Konversationen aufzunehmen, diese (mühsam) zu transkribieren und bei der Transkription auch kleinste Pausen, simultanes Sprechen und fehlerhaft oder unvollständig produzierte Äußerungsteile zu beachten. Die obigen Zitate von anerkannten Vertretern der beiden Disziplinen mögen ausreichen, um zu belegen, wie verhärtet die Fronten sind. Die Leistungen und Forschungsbeiträge der jeweils anderen Seite werden tendenziell als im Grunde irrelevant abqualifiziert oder einem anderen Fach zugewiesen: Grammatikforschung wird als die primäre Aufgabe des Linguisten betrachtet, während der Konversationsanalytiker im Grunde Soziologie betreibt. Mit dieser Trennung entsteht auch kein Problem bei der Entscheidung, welche Daten zur Analyse herangezogen werden müssen: Selbstkonstruierte Beispieldialoge sind für den Konversationsanalytiker also ebenso wenig relevant wie von Performanzfaktoren verunreinigte natürliche Daten für den Grammatiker. Mit einem solchen Schachzug machen es sich jedoch - meiner Meinung nach beide Seiten zu einfach. Ebenso wie Verletzungen von konversationeilen Regeln experimentell Wenn man jedoch durch die Analyse natürlicher Interaktionen bereits Hypothesen über die Gesetzmäßigkeiten z.B. des Witzeerzählens gebildet hat, könnte man die hypothetischen Regeln testen, indem man sie in alltäglichen Interaktionssituationen systematisch 'verletzt' und die Reaktionen der Teilnehmer beobachtet. Tests dieser Art werden als Brechungs-, Demonstrations- oder Krisenexperimente in Garfinkel (1963) und (1967: 35ff) beschrieben. Bei Garfinkel dienten diese Experimente jedoch nur dazu, Studenten auf die unaufhebbare Indexikalität sprachlicher Interaktion hinzuweisen. Auf ihre Ausnutzung zur Überprüfung von Hypothesen wurde im Rahmen der Konversationsanalyse bisher weitgehend verzichtet.

4 getestet werden können (vgl. auch FN 4), ist es zumindest nicht von vornherein klar, daß alle syntaktisch, morphologisch oder phonologisch relevanten Gesetzmäßigkeiten durch Introspektion zugänglich sind (vgl. auch FN 3). Doch auch über die Möglichkeit hinaus, daß beide Disziplinen sowohl konstruierte als auch natürliche Daten als relevant einstufen, gibt es weitere Punkte, auf die eine Verbindung zwischen Grammatikforschung und Konversationsanalyse aufbauen kann. Der Grammatiker vertritt die Meinung, daß es die intuitiven grammatischen Beurteilungen des (linguistisch geschulten) Muttersprachlers sind, in denen sich grammatische Kompetenz ausdrückt und die daher als Grundlage für die Überprüfung grammatischer Hypothesen ausreichend sind. (Grewendorf 1993: 120)

Ensprechendes vertritt aber auch der Konversationsanalytiker: Dem Gesprächsanalytiker bleibt [...] gar keine andere Wahl, als zumindest anfanglich von seiner Intuition und Kompetenz als Mitglied einer Sprachgemeinschaft Gebrauch zu machen. (Bergmann 1994:12)

Dabei ist es darüber hinaus wichtig, daß sich der Konversationsanalytiker nicht auf das Paraphrasieren des intuitiven Verständnisses beschränkt: Doch kommt für ihn im folgenden alles darauf an, sein intuitives Verständnis zu methodisieren, d.h., sein implizites Wissen explizit zu machen und die formalen Mechanismen zu bestimmen, die ihm - wie den Interagierenden - die Interpretation bzw. die Ausführung des dokumentierten Handlungsgeschehen ermöglichen. (Bergmann 1994:12)

Mit diesem Anspruch ergeben sich aber erneut Parallelen zu der Arbeit des Grammatikers. Auch für diesen erschöpft sich die Analyse nicht in der Auflistung von grammatischen bzw. ungrammatischen Sätzen, sondern die grammatische Theoriebildung verlangt die Entdeckung und Explizierung der Gesetzmäßigkeiten, auf die die grammatischen bzw. ungrammatischen Satzgliedfolgen zurückzuführen sind. Und es gibt weitere Übereinstimmungen: Die Konversationsanalyse will die "formalen Mechanismen" der Organisation von sprachlicher und nichtsprachlicher Interaktion entdecken, und sie knüpft an diese Mechanismen besondere Forderungen. So verlangt sie, daß: [...] diese Mechanismen ein generatives Prinzip beinhalten, das in der Lage ist, sowohl die Ausgangsdaten in ihrer jeweiligen Spezifität zu reproduzieren, als auch neue Fälle zu erzeugen, die als in der Realität mögliche Ereignisse erkennbar sind. (Bergmann 1994:11)

Das ist natürlich ein direkt aus der generativen Grammatik entlehnter Gedanke, die ja die Erzeugbarkeit intuitiv möglicher Sätze (genauer: Satzstrukturen) durch die jeweilige Theorie als

5 Bedingung für die Adäquatheit dieser Theorie betrachtet. - Sowohl im Hinblick auf die Rolle des impliziten sprachlichen Wissens als auch bezüglich der Überprüfung der am Datenmaterial gewonnenen "Mechanismen" scheinen die Unterschiede zwischen Konversationsanalyse und Grammatikforschung also gar nicht so dramatisch zu sein, wie sie von Vertretern der jeweiligen Disziplinen gelegentlich (vgl. die obigen Zitate) dargestellt werden. Auch wenn neben den eben angedeuteten Gemeinsamkeiten die offensichtlichen Unterschiede nicht übersehen werden können, zeichnet sich doch ab, daß eine sprachwissenschaftlich fruchtbare Verbindung von Grammatikforschung und Konversationsanalyse möglich ist. Ein wichtiger Schritt hierzu wäre schon dann getan, wenn man akzeptierte, daß man nur dann, wenn man beide Kompetenzbereiche - die des native speakers, der weiß, welche Wortfolgen seiner Sprache grammatische Sätze sind, und die des native

members, der in

Interaktionen den Regeln seiner Gemeinschaft ensprechend handeln kann - analysieren muß, wenn man zu einem Gesamtbild dessen kommen will, was es heißt, Mitglied einer Sprachgemeinschaft5 zu sein. Der vorliegenden Arbeit liegt der Versuch einer solchen Verbindung der beiden Bereiche und damit die Auffassung zugrunde, daß das Verhältnis von Grammatikforschung und Konversationsanalyse nicht das eines polemischen und von Berührungsängsten geprägten Entweder-Oder sein sollte, sondern das einer sinnvollen Arbeitsteilung und Interaktion. Dabei soll vor allem ausgelotet werden, wie die beiden Disziplinen bei der Analyse sprachlicher Phänomene ineinandergreifen und wo dabei die Grenze zwischen ihren Zuständigkeitsbereichen verläuft. Dies soll nicht im Wege einer abstrakten metalinguistischen Diskussion, sondern anhand mehrerer Fallstudien untersucht werden, die ganz verschiedenartige empirische Bereiche abdecken. Wie oben gefordert, wird die Beschränkung auf einen eingegrenzten Datenbereich aufgehoben: Als Datengrundlage dienen konstruierte Beispielsätze, in Tonstudioqualität aufgenommene, systematisch variierte Testbatterien und Vorlesepassagen sowie transkribierte Alltagskonversationen. Bevor ich einen ersten Überblick über die hier untersuchten Fallstudien gebe, möchte ich noch etwas deutlicher machen, wie die Begriffe Grammatikforschung

und Konversations-

analyse in dieser Arbeit verstanden werden sollen. Da die in dieser Arbeit vorzunehmende Ergründung des Verhältnisses von Grammatik und Konversation im wesentlichen anhand empirischer Fallanalysen erfolgen wird, kann ihre Bestimmung eine 'for all practical purposes' sein. 6

Zur Diskussion des Begriffs der Sprachgemeinschaft (speech community) vgl. Gumperz (1968). Wesentlich detailliertere Überlegungen zum Gegenstandsbereich der Grammatik finden sich u.a. in Grewendorf et al. (1987: Kap. 1), Radford (1988: Kap. 1), von Stechow & Sternefeld (1988: Kap. 1) und Vennemann & Jacobs (1982). Zur Konversationsanalyse vgl. FN 10 und zur Kontextualisierung FN 24.

6

1.1 Grammatikforschung und Konversationsanalyse Die Grammatik

umfaßt die Bereiche des sprachlichen Wissens, die der Fähigkeit von

Sprechern einer Sprache L zugrundeliegen, die Wohlgeformtheit von Wörtern, Satzteilen und Sätzen von L zu beurteilen und ihnen eine Bedeutung zuzuordnen. Dabei gehe ich wie üblich davon aus, daß dieses Wissen in mehrere Teilsysteme untergliedert ist, nämlich (im wesentlichen) in Syntax, Phonologie, Morphologie und Semantik, wobei diese Teilsysteme wiederum intern gegliedert sind, z.B. danach, ob sie die Satz-/Satzteilebene oder die Wortebene betreffen. Aufgrund dieser Untergliederung kann man z.B. zwischen Wort- und Satzphonologie unterscheiden. (Den problematischen Begriff Lexikon möchte ich hier so verstehen, daß er sowohl das auf die Wortebene bezogene syntaktische, semantische und phonologische Regelwissen umfaßt als auch die nicht durch Regeln voraussagbaren syntaktischen, semantischen und phonologischen Eigenschaften einzelner Wörter und Phrasen.) Traditionell wird die Grammatik in diesem Sinne von der Pragmatik abgegrenzt. Dieser Begriff taucht in den verschiedensten Schattierungen auf. Z.B. wird er manchmal in einem engen Sinn verstanden, nach dem er diejenigen Teile des sprachlichen Wissens der Sprecher von L umfaßt, die deren Fähigkeit zugrundeliegen, mit Äußerungen von Sätzen in bestimmten Kontexten inhaltliche Effekte zu erzielen oder interpretativ zuzuordnen, die nicht bereits vollständig durch die Semantik von L festgelegt sind. (Dabei ist davon auszugehen, daß in der Semantik nur eine kontextübergreifende, abstrakte Bedeutung von Ausdrücken festgelegt wird.) Zu diesen Effekten gehören z.B. konversationelle Implikaturen und deiktische Referenz. 7 - Im weiteren Sinn umfaßt Pragmatik die Gesamtheit des sprachlichen Wissen, das sich auf die Interpretation von Äußerungen in bestimmten Situationen bezieht. So verstanden gehören zur Pragmatik u.a. die gesamte Sprechakttheorie und - für uns besonders wichtig auch die Konversationsanalyse und die Kontextualisierungstheorie.8 Gelegentlich werde ich im folgenden Pragmatik bzw. pragmatisch in diesem weiten Sinn verwenden. In der Regel werden jedoch die konkreten Termini Konversationsanalyse und Kontextualisierung verwendet. Was im folgenden unter Konversationsanalyse zu verstehen ist, muß genauer bestimmt werden. Der Begriff wird hier als Abkürzung für eine linguistisch orientierte ethnomethodologische Konversationsanalyse verstanden. Da sich der ethnomethodologische Ansatz deutlich von interpretativen, handlungstheoretischen, texdinguistischen, diskursanalytischen, kognitiven und sprechakttheoretischen Modellen 9 unterscheidet und weil diese Unterschiede für die Vgl. Vennemann & Jacobs (1982, Kap. II, 7). Diese weite Deutung von Pragmatik liegt auch dem Standardwerk von Levinson (1983) zugrunde. Zur Stellung von Konversationsanalyse und Kontextualisierungstheorie innerhalb der (weiten) Pragmatik vgl. ebd., Kap. 1. Eine Übersicht über die zur Zeit gängigsten Modelle findet sich in Fritz & Hundsnurscher (1994). Einzelne Modelle werden auch in Taylor & Cameron (1987) vorgestellt. Zur Abgrenzung von Konversationsanalyse

7 Argumentation in dieser Arbeit wesentlich sind, möchte ich an dieser Stelle einige Grundgedanken der ethnomethodologischen Konversationsanalyse etwas ausführlicher darstellen10, bevor ich einige, für diese Arbeit ebenfalls wichtige Kritikpunkte und notwendige Erweiterungen im Hinblick auf die linguistische Orientierung formuliere. Die erste Konzeption und Formulierung dieses Forschungsansatzes geht auf eine Gruppe von Soziologen, Harold Garfinkel, Harvey Sacks und Emanuel Schegloff, zurück. Der Begriff Ethnomethodologie wurde von Harold Garfinkel11 geprägt. Er entstand in Anlehnung an das in der amerikanischen Kulturanthropologie entwickelte Konzept der Ethnoscience. Ethnoscience oder kognitive Anthropologie beschäftigt sich "mit der Ordnung der Dinge in den Köpfen der Leute" (vgl. Goodenough 1964). So erforscht etwa die Ethnomedizin 12 das Wissens- und Vorstellungssystem, das eine bestimmte Sprachgemeinschaft über Krankheiten, Krankheitsursachen und Heilverfahren hat. Auch Garfinkeis Interesse galt dem, was die Mitglieder in einer Gesellschaft bei der Abwicklung alltäglicher Angelegenheiten wissen, denken und tun. In seinem Begriff Ethnomethodologie Rechnung getragen.

13

wird diesem Aspekt durch den Bestandteil Ethno-

Anders als die kognitiven Anthropologen war Garfinkel aber nicht an der

Struktur domänenspezifischer Orientierungs- und Erfahrungsmuster (wie Ethnosoziologie oder Ethnobotanik) interessiert. Die Problematik, der sich Garfinkel widmete, war von viel grundsätzlicherer Natur. In Übereinstimmung mit Schütz beschäftigte sich Garfinkel mit den Methoden, Verfahren und Techniken, die die Mitglieder einer Gesellschaft ganz selbstverständlich bei der Abwicklung ihrer alltäglichen Angelegenheiten verwenden und die sie in die Lage versetzen, in und durch ihr Handeln die sie umgebende Alltags- und Lebenswelt sinnhaft zu strukturieren und sie damit überhaupt erst zur sozialen Wirklichkeit zu machen. Das hieß für Garfinkel: Das, was wir im alltäglichen Handeln als vorgegebene soziale Tatsachen, objektive Sachverhalte, als von unserem Zutun unabhängig existierende Sachverhalte wahrnehmen und und Diskursgrammatik bzw. Diskursanalyse vgl. u.a. auch Kohrt (1986) und Levinson (1983:284ff). 10

Trotz der Zurückhaltung der Konversationsanalytiker bei der Abfassung und Formulierung allgemeiner methodischer Regeln gibt es inzwischen eine Reihe von Arbeiten, die als ein- und weiterführende Lektüre herangezogen werden können: Bergmann (1981), (1994), Heritage (1985), (1989), Kallmeyer& Schütze (1976), Psathas (1990), Streek (1983), Taylor & Cameron (1987: Kap. 6), Nofsinger (1991) und Wotton (1989) sowie Sacks (1992).

11

Vgl. Garfinkel (1964), (1967), (1972b), (1974) und Garfinkel & Sacks (1970). Zu Garfinkeis Beitrag zur Ethnomethodologie vgl. auch Bergmann (1974MS) und Heritage (1984). Eine nicht unwesentliche Rolle spielte für Garfinkel auch die der deutschen Soziologie und Philosophie entstammende Theorietradition der Phänomenologie, vgl. u.a. Husserl (1913/1952) und besonders Schütz (1932) sowie Schütz & Luckmann (1979, 1984). Einflußreich waren auch die Arbeiten von Goffman (u.a. Goffman (1959), (1976), (1981) vgl. dazu Bergmann (1991a) und Schegloff (1988)) und die Ethnographie des Sprechens, vgl. Hymes (1962), Gumperz & Hymes (1964), (1972) und Gumperz (1982: Kap. 7).

12

Vgl. z.B. Frake (1961) oder Sturtevant (1964).

13

Zur Ethnomethodologie vgl. u.a. Bergmann (1991b), Benson & Hughes (1983), Mehan & Wood (1975), Patzelt (1987), Turner (1974) und Weingarten et al. (1976) sowie zu Parallelen mit und Abgrenzungen gegenüber anderen Theorien der Konstitution und Strukturierung sozialer Wirklichkeit in der Alltagspraxis u.a. Berger & Luckmann (1966/1980), Cicourel (1973), Corsaro (1985) und Douglas (1970). Zur Übersicht vgl. Arbeitsgruppe Bielefelder Soziologen (1973).

8 behandeln, muß erst in und durch unsere Handlungen und Wahrnehmungen produziert werden. Dieser Vorgang der Wirklichkeitserzeugung kann aber nur dann erfolgreich sein, wenn er methodisch abläuft. Er muß also formale und formal beschreibbare Strukturen aufweisen, die wahrscheinlich sogar in gewissem Maße universale Züge tragen, also in allen Kulturen der Welt gleiche oder ähnliche Eigenschaften aufweisen. Denn weil alle Gesellschaftsmitglieder mitwirken müssen, um ihre soziale Wirklichkeit zu produzieren, ist es undenkbar, daß dieser Prozeß in subjektiv beliebiger Manier und immer wieder anders und immer wieder neu ausgeführt wird. Nach Garfinkel gibt es also für die Mitglieder einer Gesellschaft rekonstruierbare Methoden, mit deren Hilfe sie die sozialen Gegebenheiten, ihre soziale Wirklichkeit, auf die sie sich im Alltag beziehen und auf die sie sich verlassen, in und durch ihr Handeln erzeugen. 14 Diese formal beschreibbaren Methoden sind der eigentliche Gegenstand der Ethnomethodologie. Dieses von Garfinkel entwickelte ethnomethodologische Programm wurde in der Mitte der sechziger Jahre von einer Gruppe von Wissenschaftlern, die sich um Harvey Sacks und Emanuel Schegloff bildete, auf sprachliche Daten übertragen. 15 Das Ziel der Konversationsanalyse läßt sich unter den Prämissen des ethnomethodologischen Forschungsprogramms folgendermaßen formulieren: Konversationsanalytiker wollen die formalen Mechanismen und Verfahren rekonstruieren, mit denen Gesprächsteilnehmer nicht nur die charakteristischen Strukturmerkmale und die Geordnetheit ihrer sprachlichen Interaktion in und durch ihre Äußerungen produzieren, sondern die sie auch bei der Analyse der Äußerungen ihrer Gesprächspartner anwenden, um die Ergebnisse dieser Analysen und Interpretationen wiederum in ihren Folgeäußerangen zu berücksichtigen. Der Konversationsanalytiker begnügt sich also nicht damit, aufgrund seiner Kompetenz als native speaker und native member festzustellen, daß z.B. an einer bestimmten Stelle innerhalb einer Konversation ein Kompliment gemacht oder ein Witz erzählt wird. Er spekuliert auch

Gefordert ist hier das Alltagswissen, das selbstverständliche und sichere Wissen zur Bewältigung der alltäglichen Lebenspraxis, das ein Individuum im Laufe seiner Sozialisation erwerben muß, um als vollwertiges Mitglied seiner Gemeinschaft zu gelten. Eine für die Phänomenologie und Ethnomethodolgie einflußreiche Theorie der Sozialisation in und durch die Interaktion hat Mead (1968) vorgelegt. (Das Etikett "Sozialbehaviorismus" im Untertitel ist jedoch zumindest aus heutiger Sicht irreführend, da Mead als Begründer des Symbolischen Interaktionsmus verstanden wird, vgl. Berger & Luckmann (1980: 18f) und Blumer (1973). Von den Soziologen unter den Konversationsanalytikern (vgl. Bergmann 1981: 14f) wird oft unter Bezug auf Sacks (1984: 26) betont, daß das Interesse an Sprache keineswegs im Vordergrund steht: "It was not from any large interest in language [...] that I studied with tape-recorded conversations, but simply because I could get my hands on it and study it again and again, and also, consequentially, because others could look at what I had studied and make of it what they could, if, for example, they wanted to be able to disagree with me." Das Zitat stammt jedoch aus einer frühen Vorlesungsmitschrift (fall 1967), vgl. auch Sacks 1992, Vol. 1: 622 und Sacks (1972; Manuskriptabschluß Juni 1965), und hat bei der Entwicklung des neuen Forschungsgebiets sicher auch eine wichtige Rolle gespielt (vgl. dazu auch Schegloff (1989: 190). Seine weiterreichende Relevanz scheint mir jedoch fraglich zu sein, da doch recht bald eine Gewichtsverschiebung vorgenommen wurde: "For a variety of reasons [...], our attention has focused on conversational materials; suffice it to say that this is not because of a special interest in language, or any theoretical primacy in conversation. Nonetheless, the character of our materials as conversational has attracted our attention to the study of conversation as an activity in its own right, [...]" (Schegloff & Sacks 1973: 2890·

9 nicht darüber, warum die jeweiligen Konversationsteilnehmer solche Aktivitäten ausgeführt haben. Der Konversationsanalytiker versucht vielmehr, die formalen Mechanismen zu bestimmen, mit denen die Teilnehmer das konversationelle Objekt 'Witz' oder 'Kompliment' auf geordnete Weise und füreinander erkennbar produzieren.16 Da die methodische Produktion von den Teilnehmern erkannt und das Erkennen Grundlage für die nachfolgenden Aktivitäten (Lachen, Dank/Gegenkompliment) ist, kann der Konversationsanalytiker versuchen, diesen wechselseitigen Prozeß der Sinnkonstitution und Sinnkontrolle zu rekonstruieren. We have proceeded under the assumption [...] that insofar as the materials we worked with exhibited orderliness, they did so not only for us, indeed not in the first place for us, but for the coparticipants who had produced them. If the materials (records of natural conversations) were orderly, they were so because they had been methodically produced by members of the society for one another, [...]. Accordingly, our analysis has sought to explicate the ways in which the materials are produced by members in orderly ways that exhibit their orderliness, have their orderliness appreciated and used, and have that appreciation displayed and treated as a basis for subsequent action. (Schegloff & Sacks 1973: 290)

Konversationsanalytiker versuchen also durch die Frage nach dem Wie aller praktischen Handlungen, nach dem "Wie-ist-es-gemacht?" oder "Wie-ist-es-zu-tun?", die methodische Struktur von Alltagskonversationen offenzulegen. Als analytische Maxime hat Sacks seinen Studenten immer wieder empfohlen, nach Struktur, Ordnung und Regelhaftigkeit zu suchen und Explikationen für diese Regelhaftigkeit zu formulieren (vgl. Sacks 1992 Vol 2: 267). Diese "Ordnungsprämisse" (Bergmann 1994: 10) ist der Grund für die akribischen Transkriptionen, denn wenn man von einer "order at all points"-Maxime (Sacks 1984:22) ausgeht, kann α priori keine Kleinigkeit, und sei sie auf den ersten Bück noch so unbedeutend, als potentiell strukturbildende Ressource ausgeschlossen werden. Für die Konversationsanalyse eröffnet sich damit ein weites Untersuchungsfeld, denn sie beschäftigt sich nicht nur mit Small-Talk, gepflegten Unterhaltungen bei Tisch oder kulturbeflissenen Beiträgen aus Anlaß von Theaterbesuchen, für die ein gewisses gesellschaftlich-konventionelles Einverständnis herrscht, welche Themen wie besprochen werden dürfen.17 Konversationsanalytiker untersuchen Kaffeepläusche ebenso wie Dienstleistungsinteraktionen, Interaktionen in Institutionen18 (Gerichtsverhandlungen, Therapiesitzungen oder Interviews) ebenso wie den Austausch von verliebten Banalitäten. D.h., alle Formen der verbalen Interaktion sind möglicher Gegenstand der Konversationsanalyse.

Die Verwendung der einfachen Anführungszeichen orientiert sich an Garfinkel & Sacks (1970) und ihrem Versuch, durch Einklammerung (im Sinne der phänomenologischen Epochi) darauf zu verweisen, daß es sich bei den so gekennzeichneten Begriffen nicht um theoretisch definierte, sondern erst zu rekonstruierende handelt. Diese Markierung findet sich aber sowohl bei Garfinkel & Sacks als auch in der vorliegenden Arbeit nur dort, wo sie besonders relevant erscheint. 17

Bis in die Mitte der sechziger Jahre gab es vor allem für Frauen noch sehr subtile Anweisungen und Regeln, wie sie gepflegte Konversationen zu führen hätten. Man konnte diese Kunst der Konversation auch an eigens zu diesem Zweck eingerichteten Instituten lernen, z.B. an der Kölner "Schule der Dame".

18

Zu institutionenspezifischen Interaktionsformen vgl. z.B. Drew & Heritage (1992).

10

Einschränkungen ergeben sich also nicht durch den Untersuchungsgegenstand, sondern Uber Forderungen, denen die Analysen genügen müssen, um als für das ethnomethodologische Programm einschlägig zu gelten. 19 Einige dieser Restriktionen seien hier kurz genannt (vgl. auch Bergmann 1981, 1994). Erstens: Der Untersuchungsgegenstand muß in seiner ursprünglichen Form konserviert werden. Das heißt, das Gespräch, das Interview oder was auch immer untersucht werden soll, muß auf einem Tonträger aufgezeichnet worden sein. 20 Diese Einschränkung verbietet die Auswertung von Konversationen, die man nur gehört hat oder deren Verlauf man nur mitprotokolliert hat. Das Konservieren der Konversationen macht es möglich, die in der Zeit ablaufenden Interaktionen zum Zwecke ihrer Analyse zu petrifizieren. Das dokumentierte Interaktionsgeschehen wird "orthographisch kontrolliert" (Bergmann 1981: 20) transkribiert.21 Zweitens: Im allgemeinen untersucht die Konversationsanalyse nicht nur ein einziges Gespräch, sondern ihre Analysen basieren auf Korpora mit möglichst vielen verschiedenen Sprechern in möglichst vielen unterschiedlichen Gesprächskontexten. In diesem Punkt unterscheidet sich die Konversationsanalyse von anderen Ansätzen zur Beschreibung gesprochener Sprache (vgl. auch FN 9). Wie oben bereits ausgeführt, will die Konversationsanalyse allgemeine und vielleicht sogar universale Methoden der Strukturierung sprachlicher Interaktionen entdecken. Wenn diese Methoden allgemein sind, dann sind sie zwar auch im einzelnen Gesprächsausschnitt zu finden, aber wenn man nur diesen untersucht, hat man keine Chance, die allgemeinen Methoden von situationsspezifischen Aspekten zu unterscheiden. Drittens: Untersuchungsgegenstand der Konversationsanalyse sind Dialoge. Dies resultiert aus den theoretischen Grundannahmen der ethnomethodologischen Konversationsanalyse, die ja wie bereits ausgeführt - die in der Interaktion von den Teilnehmer verwendeteten formalen Methoden zur Hervorbringung des jeweiligen Untersuchungsobjekts erforschen will. Aus der Sicht der Konversationsanalyse erhalten sprachliche Handlungen ihre vollständige Bedeutung nicht allein durch ihren Produzenten. Aus dieser Sicht reicht es nicht aus, daß ein Sprecher in Worte faßt, was er sagen möchte, denn das Äußern allein läßt ihn im Ungewissen darüber, ob und gegebenenfalls wie er verstanden worden ist. Erst die auf seine Handlung folgende Reaktion des Rezipienten (sprachlich und/oder nicht-sprachlich) ermöglicht ihm eine

Hier ist die ethnomethodologische Konversationsanalyse allerdings manchmal nicht ganz frei von scholastischen Disputen. Vgl. dazu z.B. Button (1990a) und Auer (1992). Auch diesem Disput liegt die einleitend vorgestellte problematische These zugrunde, daß linguistische Kategorien nicht in die konversationsanalytische Arbeit eingehen dürfen, da sie nicht als Konzepte der Teilnehmer nachgewiesen werden können. In der Regel wird das ein Tonband sein. Videoaufzeichnungen werden natürlich dann erforderlich, wenn auch nonverbale (mimische und gestische) Kommunikation analysiert werden soll. Ein praktischer Leitfaden zur Aufzeichnung und Auswertung von konversationsanalytischem Material findet sich in Goodwin (1993); zu theoretischen Grundlagen vgl. u.a. Bergmann (1985) und Erickson (1982). Hier darf allerdings nicht vergessen werden, daß die Analyse von natürlichsprachlichem Datenmaterial für die Soziologie theoretisch und methodisch viel folgenreicher als für die Linguistik ist. Zur Übersicht über in der Konversationsanalyse übliche Transkriptionskonventionen vgl. Atkinson & Heritage (1984: ixff) oder Psathas (1990: 297ff) sowie die Transkriptionsnotation in dieser Arbeit.

11 Verstehenskontrolle. Umgekehrt ist natürlich auch ein Rezipient darin interessiert, eine Brücke herzustellen zwischen der Äußerung des anderen und der Art, wie er ihn verstanden hat. Wie der Sprecher produziert auch der Rezipient in seiner Reaktion eine Verständniskontrolle. Äußerungsbedeutung in einem weiteren Sinn (also nicht beschränkt auf das Resultat der kontextuellen Instantiierung der in der grammatischen Bedeutung offen gelassenen Variablen) ist also nach Ansicht der Konversationsanalyse ein dialogisches Produkt. Die Konversationsanalyse hat herausgefunden, daß den Gesprächsteilnehmern mit der Paarsequenz (adjacency pair) 22 ein ganz besonderes konversationelles Mittel für diese wechselseitige Sinnproduktion und -kontrolle (siehe oben) zur Verfügung steht. Wie bereits angedeutet (vgl. Bergmann 1981: 33, S.2 und FN 19), ist jedoch die ethnomethodologische Konversationsanalyse in ihrer 'orthodoxen', stark soziologisch orientierten Ausrichtung bestrebt, sequentielle Organisation in den Vordergrund zu stellen und systemlinguistische Kategorien oder an der sprachlichen Form orientierte Fragestellungen auszuklammern bzw. ihre interaktive Relevanz anzuzweifeln.23 Dieser Aspekt kann in einer Arbeit, die die linguistisch fruchtbare Verbindung von Grammatikforschung und Konversationsanalyse anstrebt, natürlich nicht übernommen werden. Eine zentrale Argumentationslinie wird daher darin bestehen, die interaktive Relevanz sprachlicher Struktur aufzuzeigen und nachzuweisen, daß nur mit der systematischen Einbeziehung der Sprachstruktur die konstitutiven Merkmale der konversationellen Aktivitäten der Teilnehmer erfaßt werden können. Eine für diese Arbeit sehr wichtige Funktion, die sprachliche Strukturen bei der Konstitution konversationeller Aktivität systematisch übernehmen, wird unter dem Stichwort Kontextualisierung (contextualization)24 diskutiert. Mit diesem Begriff haben Jenny CookGumperz und John Gumperz (1976) ein Konzept eingeführt, das seither in einem weiten, interdisziplinären Forschungsbereich zwischen (kognitiver) Anthropologie und Linguistik, Metapragmatik, Soziologie und Konversationsanalyse zunehmend an Bedeutung gewonnen hat: I use the term 'contextualization' to refer to speakers' and listeners' use of verbal and nonverbal signs to relate what is said at any one time and in any one place to knowledge acquired through past experience, in order to retrieve the presuppositions they must rely on to maintain conversational involvement and assess what is intended. (Gumperz 1992b: 230) 22

Die Paarsequenzorganisation wird für die empirischen Analysen eine wichtige Rolle spielen. Zur Definition vgl. Kapitel 2.4.2 und Kapitel 3.

23

Es gibt jedoch auch eine Reihe von konversationsanalytisch orientierten Interaktionsanalysen, auf die diese Einschränkung nicht zutrifft. Vgl. u.a. Auer (1979, 1981, 1983, 1984, 1990a, 1991a), Couper-Kuhlen (1992, 1993), Fox (1987), Fox & Thompson (1990), Ford (1993), Goodwin, Ch. (1981, 1986), Goodwin, Μ. (1990), Gumperz (1982), Günthner (1993a), Jefferson (1974), Sacks & Schegloff (1979), Selting (1993, 1994), Tannen (1984, 1986), Watson (1987). Diese Arbeiten unterscheiden sich von der hier vorgelegten jedoch zum Teil wesentlich in der Einstufung des Verhältnisses von Grammatik und Gesprächsorganisation (vgl. dazu Kap. 1.2).

24

Vgl. dazu u.a. auch Gumperz (1977, 1982, 1984MS, 1989MS, 1992a, 1992b, 1994), Auer (1986, 1992, 1995), Goodwin & Duranti (1992) sowie Auer & Di Luzio (1992), Duranti & Goodwin (1992).

12 Kontext 25 und Kontextwissen sind in diesem Ansatz (im Gegensatz zu anderen pragmatischen oder soziolinguistischen Theorien) keine von der Interaktion unabhängigen, quasi material gegebenen Entitäten, die unidirektional auf die Teilnehmer und ihr Handeln Einfluß nehmen. Kontext und Kontextwissen werden vielmehr von Interaktanten aufgebaut, indem sie zusammen mit dem Ausführen ihrer Handlungen zugleich den Kontext ihrer Handlungen konstruieren, um so die Interpretierbarkeit ihres Handelns sicherzustellen. Kontext als fragiles, ständiger Konstitution und Rekonstitution unterworfenes (Ethno)-Konstrukt ist damit nicht mehr nur Ausgangspunkt und Voraussetzung, sondern wird selbst zum Gegenstand der Analyse. 2 6 Weil die Teilnehmer in und durch die Interaktion den Kontext erst herstellen, werden ihre (sprachlichen) Handlungen nur dann interpretierbar, wenn es ihnen gelingt, sich den jeweiligen Kontext anzuzeigen und ihn von möglichen anderen Kontexten abzugrenzen. Diese für die Kontextualisierung notwendigen Interpretationsleistungen und konversationelle Inferenzen (conversational inferences) 27 sind die Grundlage für das Handeln der Akteure und die Voraussetzung für die Beteiligung an Konversationen (conversational involvement)28: Communication is a social activity requiring the coordinated efforts of two or more individuals. Mere talk to produce sentences, no matter how well formed or elegant the outcome, does not by itself constitute communication. Only when a move has elicited a response can we say communication is taking place. To participate in such verbal exchanges, that is, to create and sustain conversational involvement, we require knowledge and abilities which go considerably beyond the grammatical competence we need to decode short isolated messages. [...] Conversationalists [...] rely on indirect inferences which build on background assumptions about context, interactive goals and interpersonal relations to derive frames in terms of which they can interpret what is going on. (Gumperz 1982: If)

Welcher Art ist nun dieses Wissen, über das Konversationsteilnehmer zusätzlich zu ihrem grammatischen Wissen verfügen müssen? Zum einen müssen Teilnehmer über die Art von Wissen verfügen, die im Rahmen der ethnomethodologischen Konversationsanalyse beschrieben worden ist. Die Regeln der Paarsequenzorganisation, der Vollzug des Sprecherwechsels oder die Reparaturorganisation sind Beispiele für diese Art von Kompetenz. Nach Gumperz

Zu diesem sowohl für die Pragmatik als auch für die interpretative Soziolinguistk zentralen Konzept vgl. u.a. Brown & Yule (1983: Kap. 2), Auer (1995), Levinson (1983: Kap. 1) und Goodwin & Durand (1992). Daß alle sozialen Handlungen und ihre Interpretierbarkeit in einem unauflösbaren Abhängigkeitsverhältnis zum Kontext stehen, den sie zugleich mitkonstruieren, war auch der zentrale Gedanke in Garfinkeis (1967:1) Prinzip der Reflexivität (making account-able): "[...] the activities whereby members produce and manage settings of organized everyday affairs are identical with members' procedures for making those settings account-able", vgl. auch Garfinkel (1972: 323). Bei Garfinkel stehen jedoch außersprachliche Prozeduren im Mittelpunkt des Interesses. Vgl. aber auch Goffmans Konzepte "frame" (1974) und "footing" (1979) sowie Batesons (1956) "metacommunication". Als Überblick zur Tradition der "context analysis" vgl. Kendon (1990: Kap. 2). "Conversational inference, [...], is the situated or context-bound process of interpretation, by means of which participants in an exchange assess others' intentions, and on which they base their responses" (Gumperz 1982: 153) vgl. auch Gumperz 1992b: 230ff). Zu dem für Gumperz zentralen Konzept "conversational involvement" vgl. auch Tannen (1989: Kap. 2).

13 sind grammatisches und sequentielles Wissen aber nicht ausreichend, um umfassend zu rekonstruieren, welche Leistungen Konversationsteilnehmer zu erbringen haben: [...] while the sociosequential organisation of speakers's moves is as basic to conversational analysis as clause boundaries are to syntax, conversational analysts have gone only part way to giving us an understanding of conversational processes. What they have done is to give us some of the basic constraints that affect the working of conversational processes in societies of all kinds. But these constraints, like the linguist's grammatical rules, are in large part universal and thus abstracted from actual situations of usage. To see how communication works on the ground we cannot look at organizational features of communication alone, be we must look in detail at the actual processes of conversational inference; that is, the situated interpretations that participants make of each other's move at any one point in time. (Gumperz 1984 MS: 4)

Wenn man also hinsieht bzw. zuhört, kann man kommunikativ signifikante und für die Interpretation relevante sprachliche Strukturen entdecken, die als Kontextualisierungshinweise (contextualization cues) fungieren: I argue that conversational interpretation is cued by empirically detectable signs, contextualization cues, and that the recognition of what these signs are, how they relate to grammatical signs, how they draw on sociocultural knowledge and how they affect understanding, is essential for creating and sustaining conversational involvement and therefore to communication as such. (Gumperz 1992a: 42)

Wenn also unter Kontextualisierung alle jene Verfahren verstanden werden, mittels derer die Interaktionsteilnehmer den Interpretationskontext ihrer Äußerungen konstituieren, dann stellen diese Verfahren eine Verbindung zwischen einer empirisch beobachtbaren Eigenschaft des sprachlichen Materials, dem Kontextualisierungshinweis, und dem Kontextwissen als einer in Form von Schemata (schema, frame) 29 organisierten Komponente des Hintergrundwissens der Teilnehmer her. Kontextualisierungshinweise tragen damit also zur Bedeutungskonstitution von Äußerungen bei, ohne jedoch den jeweils übermittelten Sachverhalt, die Denotation der Äußerung, zu beeinflussen. Als konstitutive Merkmale 30 von Kontextualisierungshinweisen und den von ihnen übermittelten Bedeutungen gelten die folgenden Eigenschaften. Erstens: Als Kontextualisierungshinweise fungieren in der Regel solche sprachlichen Mittel, die nicht zur Konstitution des jeweils ausgedrückten Sachverhalts verwendet werden. Oft (aber nicht ausschließlich, vgl. Gumperz 1992b: 23 lf) handelt es sich um sprachliche Mittel wie Intonation, Lautstärke, Sprechgeschwindigkeit etc., die skalare oder graduelle Eigenschaften aufweisen. Zweitens: Es gibt keine Eins-zu-Eins-Beziehung zwischen Kontextualisierungshinweis und Bedeutung, und die Bedeutung eines als Kontextualisierungshinweis analysierten sprachlichen Mittels kann nicht kontextunabhängig angegeben werden. Drittens: Obwohl es auch quasinatürliche, ikonische Beziehungen zwischen Kontextualisierungsmitteln und ihrer Bedeutung 29

Vgl. dazu auch Gumperz (1982: 154ff) sowie Gumperz (1992a: 42ff) zur Einbindung von Levinsons (1978/1992) Konzept "activity type".

30

Vgl. dazu auch Gumperz (1982: 13 Iff) sowie Auer (1992).

14 gibt, ist die Verbindung von Kontextualisierungshinweis und Bedeutung in der Regel konventionalisiert.

Damit sind die als Kontextualisierungskonventionert

(contextualization

Convention) erlernten Verbindungen von Kontextualisierungsmittel und Bedeutung wie die grammatische Kompetenz und im Gegensatz zu den sequentiell orientierten Wissensbeständen, die den (engeren) Untersuchungsgegenstand der ethnomethodologischen Konversationsanalyse bilden, in hohem Maße sprach- und kulturspezifisch. Fehler bei der Verwendung oder Interpretation von Kontextualisierungshinweisen werden als "social faux pas" (Gumperz 1982: 132) aufgefaßt und dem Teilnehmer als zumeist negative Eigenschaft seiner persönlichen Identität (unfreundlich, unkooperativ, unhöflich, etc.) zugeschrieben.31 Ich hoffe, daß durch diese kurze Darstellungen von ethnomethodologischer Konversationsanalyse und Kontextualisierungstheorie deutlich geworden ist, daß eine linguistisch orientierte Konversationsanalyse, so wie sie in der vorliegenden Arbeit vertreten wird, nicht etwa nur Performanzphänomene untersucht, sondern Aspekte der (weit gefaßten) sprachlichen Kompetenz. 32 Damit kommt es aber zu einer möglichen Konkurrenz zwischen Konversationsanalytikern und Grammatikern, die ja ebenfalls Aspekte der sprachlichen Kompetenz untersuchen, und es erhebt sich die Frage, wo genau die Grenze zwischen den beiden Disziplinen verläuft. Diese Frage soll, wie oben schon gesagt, in der vorliegenden Arbeit anhand empirischer Fallstudien untersucht werden. Um den Stellenwert dieser Fallstudien richtig beurteilen zu können, ist es nützlich, sich zuvor zwei theoretische Möglichkeiten der Verteilung der Zuständigkeitsbereiche von Grammatikforschung und Konversationanalyse vor Augen zu führen, zwischen denen aufgrund der bisherigen Erörterungen noch keine Entscheidung möglich ist

Die sozio-kulturelle Variation bei der Verbindung von Kontextualiserungshinweis und Bedeutung wird in einem besonders fruchtbaren Forschungsgebiet, der interkulturellen Kommunikation, zum Ausgangspunkt der Analyse von MiBverständnissen. Die Forschungen von Gumperz (vgl. FN 24) haben gezeigt, daß sowohl Unterschiede in den Kontextualisierungskonventionen innerhalb von Nationalsprachen (vgl. Gumperz 1994) als auch sprachübergreifende Gemeinsamkeiten (vgl. Gumperz 1992a: 51) zu beobachten sind. Ein relativ neues Forschungsfeld ist die Analyse von systematischen kommunikativen MiBverständnissen zwischen Männern und Frauen als Instantiierungen von unterschiedlichen Kontextualisierungskonventionen, d.h. als ein Fall von 'interkultureller' Kommunikation, vgl. dazu Maitz & Broker (1982) und Tannen (1990a, 1990b) sowie kritisch Günthner (1992). Auf Verwendung des naheliegenden Konzepts der "communicative competence" im Sinne von Gumperz (1981, 1984 MS) wird verzichtet, weil im Deutschen "kommunikative Kompetenz" die hier nicht erwünschte Assoziation mit der Theorie von Habermas (1971) hervorruft.

15

1.2 Zwei Möglichkeiten der Grenzziehung zwischen Grammatikforschung und Konversationsanalyse Für die Abgrenzung des grammatischen und des konversationeilen Kompetenzbereichs und damit für die Festlegung der Zuständigkeitsbereiche von Grammatikforschung und Konversationsanalyse gibt es im wesentlichen die folgenden beiden Möglichkeiten.33 THESE 1

Der der Grammatik zugeordnete Kompetenzbereich läßt Spielräume, die von der konversationellen Interaktion systematisch genutzt werden. In diesen Nischen - und nur in ihnen - entfalten sich konversationelle Regularitäten bzw. das ihnen entsprechende sprachliche Wissen. THESE 2

Regeln der Gesprächsorganisation können grammatische Regeln außer Kraft setzen. In Konversationen situierte sprachliche Ausdrücke folgen also zumindest partiell anderen Form- und Inhaltsgesetzen als Ausdrücke in Isolation. So entsteht z.B. eine mit der grammatischen Syntax, die Strukturen von Sätzen unabhängig von ihrer Situierung in Diskursen analysiert, konkurrierende "syntax-for-conversation"34. Für die empirische Angemessenheit der These 2 argumentiert Schegloff (1979: 283): In continually writing of a 'syntax-for-conversation', I mean to treat explicitly as hypothetical what seems to me to be prematurely treated as presupposed fact, and that is the existence of A syntax. That there is a trans-discourse-type syntax may end up to be the case; it should be found not presupposed. With that, I also mean to make explicitly hypothetical the current sense of 'a language', or 'language'. The notion 'a language' seems to be the product of an immense range of human behavior from talking to the family to reciting Shakespeare to cadging alms to writing memoranda to lecturing etc. - each of which is embedded in its own combination of organizational structures, constraints, and resources. [...]. In any enviroment of socalled 'language use', there is a locally organized world in which it is embedded. Some of these are 'speech exchange systems', some do not involve talking. Until the characteristics of these locally organized settings are investigated and explicated in appropriate detail, the extraction of 'language' from them is a procedure with unknown properties and consequences. A syntax-for-conversation is an attractive candidate for early treatment because conversation is the most common and, it would appear, the most fundamental condition of 'language use' or 'discourse'.

Im Vorgriff ist zu sagen, daß die hier zu diskutierenden empirischen Phänomene ausnahmslos THESE 1 stützen werden. Die zahlreichen für bestimmte konversationeile Strukturen spezifischen Form- und Inhaltsstrategien, die in den Fallstudien diskutiert werden und zunächst für THESE 2 zu sprechen scheinen, werden sich bei genauerer Betrachtung in keinem Fall als fähig erweisen, einschlägige grammatische Regeln außer Kraft zu setzen. Dies hat allerdings, wie wir

33

Vermutlich gibt es auch noch Mischformen. Für die theoretische Konzeption eines Gesamtbildes der Kompetenz, auf die kommunizierende Mitglieder einer Sprachgemeinschaft rekurrieren, ist jedoch primär die Abklärung der beiden konkurrierenden Positionen relevant.

34

Sowie analog eine "phonology for conversation" (Selting 1992: 110) bzw. eine "Grammatik der Konversation" (Selting 1993: 292).

16 sehen werden, viel damit zu tun, daß grammatische Regeln, wenn sie adäquat formuliert werden, oft recht 'liberal' sind und damit von vornherein pragmatischen - z.B. eben konversationeilen oder kontextualisierenden - Strategien mehr oder weniger große Spielräume offenhalten. Die Ausdehnung dieser Spielräume variiert allerdings von Phänomen zu Phänomen, und entsprechend variieren die Entfaltungsmöglichkeiten für konversationelle Regeln. Mit diesen Bemerkungen dürfte bereits deutlich geworden sein, daß die Frage nach dem Verhältnis von Grammatikforschung und Konversationsanalyse hier nicht unter dem Gesichtspunkt der relativen Autonomie

der beiden Bereiche diskutiert werden soll. Unter diesem

Gesichtspunkt (der auch mit dem Stichwort Modularität verbunden wird) hätte man sich dafür zu interessieren, ob sich die konstitutiven Prinzipien, Einheiten und Regeln eines der sprachlichen Kenntnissysteme auf die des jeweils anderen begrifflich reduzieren oder durch diese empirisch erklären lassen 35 , ob sich also z.B., wie es 'funktionalistische' Grammatiker annehmen, Details syntaktischer Regeln einer Sprache durch Rekurs auf die kommunikative Verwendung der entsprechenden sprachlichen Strukturen begründen lassen. 36 Diese Autonomiefrage wird durch das im Folgenden zentrale Problem der Grenzziehung zwischen dem grammatischen und dem konversationeilen Kenntnissystem nicht direkt berührt. Tatsächlich wäre jede der beiden oben genannten Möglichkeiten dieser Grenzziehung sowohl mit einer autonomen als auch mit einer nicht-autonomen (etwa 'funktionalistischen') Interpretation verträglich. Die in den folgenden empirischen Fallstudien zu diskutierenden grammatischen und konversationellen Regularitäten werden allerdings durchweg auf eine autonome (oder modulare) Organisation der Kenntnissysteme hinweisen (diese z.T. auch implizit voraussetzen).37 Damit wird aber, wie gesagt, die Entscheidung zwischen den beiden oben genannten Möglichkeiten der Grenzziehung nicht präjudiziert. Es folgt nun abschließend ein kurzer Überblick über die Fallstudien, die das eben angedeutete Verhältnis von Grammatik und Konversationsalyse exemplifizieren und konkretisieren sollen.

35 36 37

Vgl. Mötsch & Reis & Rosengren (1990: 98ff). Vgl. z.B. Bolkestein (1993). Unabhängige Belege für die Richtigkeit dieser Auffassung finden sich z.B. in vielen Arbeiten, die in den letzten Jahren in den Arbeitspapieren des Programms "Sprache und Pragmatik" erschienen sind.

17

1.3 Die Fallstudien Alle drei emprischen Kapitel haben gemeinsam, daß in ihnen bestimmte sprachliche Formen, seien es syntaktische (Satzgliedstellung im Mittelfeld und Mittelfeldentleerungen), akzentphonologische (Akzentzusammenstöße) oder realisationsphonologische (Sprechgeschwindigkeit), den Untersuchungsgegenstand bilden. Für alle drei Fälle soll entsprechend der oben genannten konkurrierenden Thesen und anhand von geeignetem Datenmaterial (s.o.) bestimmt werden, ob und in welchen Umfang die Grammatik Spielräume für Variation läßt, die dann konversationell genutzt werden, oder ob grammatische Regeln zumindest teilweise von Regeln der Gesprächsorganisation oder von Kontextualisierungskonventionen außer Kraft gesetzt werden, so daß sich in natürlichen Konversationen sprachliche Formen zeigen, die über die grammatisch zulässige Variation hinausgehen. Darüber hinaus gilt es, die interaktive Relevanz der untersuchten sprachlichen Stukturen aufzuzeigen und damit die These zu untermauern, daß nur eine linguistisch orientierte Konversationsanalyse, die sowohl die Gesprächsorganisation als auch Kontextualisierungskonventionen untersucht, in der Lage ist, ein umfassendes Bild darüber zu liefern, was es heißt, in allen beteiligten Bereichen kompetentes Mitglied einer Sprachgemeinschaft zu sein. Um diesen Anspruch einlösen zu können, wird die Datengrundlage (s.o.) sowohl gegenüber grammatisch orientierten als auch gegenüber konversationsanalytisch orientierten Arbeiten erheblich erweitert: Als Datenmaterial dienen sowohl konstruierte Beispielsätze, in Tonstudioqualität aufgenommene, systematisch variierte Testbatterien oder Vorlesepassagen als auch transkribierte Alltagskonversationen. In Kapitel 2 werden zunächst die Stellungsglieder im Mittelfeld betrachtet. Die zwei Modelle zur Analyse von Wortstellungsregularitäten, die hier diskutiert werden, stützen sich auf selbstkonstruierte Beispielsätze (Jacobs) bzw. natürliche, allerdings literarische Texte (Hawkins). Eine Überprüfung anhand von Daten aus natürlichen Konversationen und eine genaue Analyse der dabei vorliegenden Produktions- und Perzeptionsbedingungen zeigt, daß beiden Modellen wichtige Einsichten über Wortstellungsregularitäten und typische Besetzungen der topologischen Felder entgehen. Die Grammatik des Deutschen erlaubt zwar in erheblichem Umfang Variation bei der Abfolge der Stellungsglieder im Mittelfeld, diese Spielräume werden aber konversationeil kaum genutzt, da die Besetzung mit mehr als einem nicht-pronominalisierten Stellungsglied in natürlichen Konversationen äußerst selten ist. Konversationsteilnehmer machen dagegen systematisch und in erheblichem Umfang von einem anderen Variationsangebot der Grammatik Gebrauch, indem sie potentielle Satzglieder des Mittelfeldes erst im Anschluß an die rechte Satzklammer produzieren. Mit der Syntax der Mittelfeldentleerung interagieren intonatorische Alternativen, da potentiell mittelfeldfahige Satzglieder sowohl prosodisch selbständig, d.h. als eigene Intonationsphrasen, als auch prosodisch unselbständig, d.h. als Teil der Intonationsphrase des Mittelfeldes, realisiert werden können. Bei

18

der Analyse des konversationellen Datenmaterials zeigt sich, daß keine ungrammatischen Mittelfeldentleerungen produziert werden. Auch der Beitrag der Intonation bleibt auf die Ausnutzung der Möglichkeiten beschränkt, die die Intonationsphonologie offenläßt. Die Intonationsphrasenbildung und die Plazierung eines Akzenttons auf der letzten metrisch stärksten Silbe der Intonationsphrase sind grammatischen Beschränkungen bezüglich der Fokus-HintergrundStruktur unterworfen. Diese Beschränkungen lassen jedoch eine gewisse Variation zu, die, so wird die Analyse zeigen, bei der Realisierung von Mittelfeldentleerungen systematisch genutzt wird. Damit bietet die Analyse der Mittelfeldentleerungen ein empirisch fundiertes Argument gegen die THESE 2, daß sich Konversationsteilnehmer für die Realisierung konversationeller Intentionen eine "super-syntax", eine "syntax-for-conversation" oder eine "phonology for conversation" schaffen, indem sie Regeln der Satzsyntax oder -phonologie teilweise suspendieren. In den von den grammatischen Regeln offengelassenen Spielräumen entfalten sich allerdings genuin konversationelle Regularitäten, die im Rahmen der oben genannten Wortstellungs-Modelle nicht analysiert werden können. Obwohl gerade Hawkins' Theorie bei den rein 'stilistischen' Mittelfeldentleerungen ihre Stärke zeigen sollte, werden wir sehen, daß dieses eindimensionale Modell - es identifiziert die Optimierung der Sprachverarbeitung als entscheidenden Faktor - bei der Analyse der im konversationellen Datenmaterial zu beobachtenden linearen Abfolgen zu kurz greift. Es wird sich zeigen, daß gesprächsorganisatorische Aspekte wie Sprecherwechsel, Selbstreparaturen und Informationsgliederung für die Auslagerung mittelfeldfähiger Satzglieder hinter die rechte Satzklammer eine entscheidende Rolle spielen, Aspekte also, die von Hawkins' Modell nicht erfaßt werden. - Was die Ausschöpfung der von der Grammatik offengelassenen intonatorischen Realisierung betrifft, so werden wir sehen, daß eine skalare Eigenschaft der Intonation, die Ausdehnung des Tonumfangs, eine besonders wichtige Rolle bei der Signalisierung von mit ausgeklammertem Material verbundenen konversationellen Strategien spielt. Über die Ausschöpfung des Tonumfangs macht die Grammatik des Deutschen keinerlei Aussagen. Dies wird in der Weise konversationell ausgenützt, daß bei der prosodisch selbständigen Realisierung von nach rechts herausgestellten Konstituenten deren konversationeile Relevanz mit Hilfe der Ausdehnung des Tonumfangs kontextualisiert wird. In Kapitel 3 werden Akzentzusammenstöße untersucht, also ein lautliches Phänomen, das von manchen Modellen der Satzphonologie als ungrammatisch eingestuft wird. Tatsächlich scheinen Akzentzusammenstöße einer zutreffenden phonologischen Generalisierung zu widersprechen, dem Prinzip der rhythmischen Alternation, das z.B. von Selkirk (1984: 52) präzisiert wurde. Dabei geht es um die (auch in der älteren Phonologie schon häufig gemachte) Beobachtung, daß natürliche Sprachen dazu neigen, eine Alternanz zwischen prominenten und nicht-prominenten Silben herzustellen und sowohl Folgen von prominenten als auch Folgen von nicht-prominenten Silben zu vermeiden. Weil Akzentzusammenstöße im Konflikt mit

19

diesem Prinzip zu stehen scheinen, werden sie in Teilen der metrischen Phonologie als nicht wohlgeformt eingestuft und über Wohlklangsregeln aufgelöst. - Bei der Analyse konversationeller Daten zeigt sich jedoch, daß Sprecher in natürlichen Dialogen systematisch Akzentzusammenstöße produzieren, indem sie die metrische Prominenz lexikalisch unakzentuierter Silben erhöhen. Solche konversationeilen Akzentzusammenstöße sollten also ein Paradebeleg für die als THESE 2 formulierte Annahme sein, daß grammatische Regeln zumindest teilweise von Regeln der Gesprächsorganisation oder von Kontextualisierungskonventionen außer Kraft gesetzt werden können, so daß sich in natürlichen Konversationen Formen zeigen, die über die grammatisch zulässige Variation hinausgehen. Da Akzentzusammenstöße auch interaktiv relevant sind (sie kontextualisieren Emphase und Intensivierung), könnten sie darüber hinaus als ein Beleg für die von Bolinger vertretene These betrachtet werden, daß es sich bei der Intonation um ein autonomes Signalisierungssystem handelt, das unabhängig von sprachspezifischen grammatischen Beschränkungen ikonisch und universal emotionale Zustände von Spechern widerspiegelt. 38 - Die Analyse wird jedoch zeigen, daß Akzentzusammenstöße, obwohl sie konversationeil sehr spezifische Funktionen übernehmen (s.u.), sich nicht aus dem durch einschlägigen satzphonologischen Regeln abgesteckten Variationsraum herausbewegen. Dies ergibt sich aufgrund einer innergrammatisch - nämlich u.a. durch lexikalische Daten - gut motivierten Präzisierung des Prinzips der rhythmischen Alternanz, nach der Akzentzusammenstöße zwar rhythmisch markierte, aber unter bestimmten Bedingungen durchaus zulässige Strukturen sind. (So müssen die einschlägigen satzphonologischen Regeln z.B. bei Elativkomposita Akzentzusammenstöße zulassen, die nicht durch Wohlklangsregeln aufgelöst werden können.) Wenn Sprecher Akzentzusammenstöße produzieren, um, wie die Analyse konversationeller Daten zeigt, Emphase zu kontextualisieren, bleiben die einschlägigen grammatischen Prominenzregeln und die Prinzipien des Aufbaus grammatisch wohlgeformter Intonationsphrasen wirksam. - Bezüglich der konversationeilen Organisation läßt sich zeigen, daß Akzentzusammenstöße vor allem in solchen Redezügen vorkommen, in denen Bewertungen vorgenommen werden. Diese generelle Aussage muß jedoch präzisiert werden: Akzentzusammenstöße finden sich in elaborierten ersten Bewertungen wie Geschichten, Neuigkeiten oder Informationen und in den zweiten Bewertungen, die die Rezipienten dieser konversationellen Objekte liefern. Akzentzusammenstöße finden sich dagegen nicht in Bewertungssequenzen, die im Paarsequenzformat als Bewertung und Gegenbewertung produziert werden. Durch eine detaillierte konversationsanalytische Beschreibung kann gezeigt werden, daß diese Verteilung nicht zufällig sondern systematisch ist und unter Rekurs auf die Präferenzorganisation in Bewertungssequenzen und die Kontextualisierungsfunktion von Akzentzusammenstößen erklärbar ist.

"The unifiying idea of B(olinger)'s work is [...] the general claim that intonational features, including accent placement, are beyond grammar and are directly linked to emotion" (Ladd 1990b: 806). Vgl. dazu z.B. Bolinger (1986:viii) und FN 58 in Kapitel 3 und Selting (1992), die sich dieser Ansicht anschließt, sowie kritisch Ladd (1990b).

20 Thema von Kapitel 4 sind funktional und interaktiv relevante Veränderungen der Sprechgeschwindigkeit. Die Analysen dieses Kapitels führen im Rahmen der Erforschung der Interaktion von grammatischen und konversationeilen Regeln in einen Bereich, in dem die Satzgrammatik einen maximal großen Spielraum für die Entwicklung konversationeller Regelsysteme läßt, da sie (wahrscheinlich universell) keinerlei Restriktionen für die Geschwindigkeit formuliert, mit der Sprecher ihre Beiträge zu produzieren haben. Dieser Spielraum wird nun weitgehend von einer Art Textgrammatik genutzt, die u.a. die Sprechgeschwindigkeit dazu verwendet, Informationsstrukturierungen zu kontextualisieren. - Die Analyse erfolgt in zwei Schritten. Zunächst wird gezeigt, welche phonologisch-phonetischen Faktoren mit der Perzeption von Sprechgeschwindigkeitsveränderungen korrelieren. Die wichtigsten Faktoren sind die Dichte der Silben pro Zeiteinheit (Dichte I) sowie die Dichte der akzentuierten Silben pro Zeiteinheit (Dichte II), die bezüglich der Intonationsphrase als maximale Meßeinheit berechnet werden. Mit Bezug auf diese Parameter können kurzfristige funktional relevante Veränderungen der Sprechgeschwindigkeit analysiert werden. In einem zweiten Schritt wird untersucht, wie Konversationsteilnehmer Veränderungen der Sprechgeschwindigkeit einsetzen können, um ihre Äußerungen zu kontextualisieren und interpretierbar zu machen. Als Datengrundlage für diesen Teil der Analyse werden nicht, wie im ersten Teil, monologische Vorlesetexte, sondern Alltagskonversationen herangezogen. Anhand dieses Datenmaterials läßt sich zeigen, daß Konversationsteilnehmer Sprechgeschwindigkeitsveränderungen auf vielfältige Weise einsetzen und neben bestimmten ikonischen Funktionen ('hohe Geschwindigkeit') vor allem die thematische Relevanz ihrer Beiträge kontextualisieren. Diese Funktionen sind so elaboriert und konventionalisert, daß man vielleicht von einer Art Textgrammatik sprechen kann. Durch die Reduzierung der Sprechgeschwindigkeit (niedrige Dichte I/hohe Dichte II) weisen Konversationsteilnehmer ihre Rezipienten auf besonders relevante Abschnitte ihrer Redebeiträge hin, während sie durch die Erhöhung ihrer Sprechgeschwindigkeit und komplementäre Verpackung (hohe Dichte 1/ niedrige Dichte II) das Gegenteil kontextualisieren und so ihre Rezipienten auf thematisch neben- oder untergeordnete Abschnitte ihres Redebeitrags (Wiederholungen, Zummenfassungen, Parenthesen und Seitensequenzen) aufmerksam machen können. Sprechgeschwindigkeitserhöhungen begleiten aber auch Selbstreparaturen. Dies darf jedoch nicht zu der Annahme verleiten, daß auch hier niedrige Relevanz kontextualisiert wird. Es wird sich vielmehr zeigen, daß auch diese Kontextualisierungsfunktion ikonische Aspekte aufweist, daß aber vor allem der Rezipient bei der Informationsverarbeitung unterstützt wird. Zusammen mit syntaktischen Hinweisen wird eine Schleife bei der Verarbeitung der Information auch prosodisch markiert.

2. Satzgliedvariation und Gesprächsorganisation: Mittelfeldbesetzung und Mittelfeldentleerung

Das Thema dieses Kapitels, die Satzgliedstellung, gehört nach Ansicht vieler Syntaktiker zu den wichtigsten Gebieten der Grammatik. Für die Überprüfung der in der Einleitung formulierten THESE 1, daß die Grammatik Spielräume läßt, die durch konversationelle Strategien genutzt werden, möchte ich zeigen, daß und wie die Einsichten über die Interaktion von Syntax und Pragmatik durch die Betrachtung natürlich-sprachlicher Daten und die konversationsanalytische Beschreibung erweitert und ergänzt werden können. Damit wird in diesem Kapitel auch ein ganz anderer Typus von Beispielen diskutiert als im größten Teil der Literatur zur Satzgliedstellung. Doch nur eine Analyse konversationeller Daten erlaubt es, die Grenze zwischen Syntax und Konversationsorganisation so zu ziehen, daß beiden Regelsystemen Rechnung getragen wird. Die Vielzahl der mit der Satzgliedstellung verbundenen Probleme macht Beschränkungen bei der Untersuchung jedoch unbedingt erforderlich. Daher werde ich mich auf zwei miteinander verbundene Phänomenbereiche konzentrieren. Ich werde zunächst die Abfolgeregularitäten im Mittelfeld betrachten, denn das in diesem Bereich strukturell relativ freie Stellungsverhalten der nicht-verbalen Stellungsglieder gilt "als Paradebeispiel für die Notwendigkeit, 'Pragmatik in der Grammatik' zu berücksichtigen" (Reis 1987: 139).1 Das Kapitel beginnt nach der Vorstellung der Feldergliederung (2.1) mit der Diskussion von zwei Modellen zur Analyse von Wortstellungsregularitäten im Mittelfeld. Ich stelle in Abschnitt 2.1.1 zunächst das Modell von Jacobs (1988a) und in Abschnitt 2.2.1 dann das Modell von Hawkins (1992, 1994) vor. Jacobs vertritt die Ansicht, daß sich die Abfolgeregeln am besten durch ein System unterschiedlich gewichteter und miteinander interagierender Präzedenzprinzipien erklären lassen. Diese Präzedenzprinzipien enthalten sowohl syntaktische als auch pragmatische Regeln. Hawkins hingegen plädiert für ein eindimensionales, psycholinguistisch motiviertes Modell, bei dem die Wortstellung durch die syntaktische Komplexität der Konstituenten sowie ein hörerorientiertes Produktionsprinzip determiniert wird, mit dem der Sprecher versucht, so viel für den Aufbau der syntaktischen Struktur relevante Information wie möglich so früh wie möglich zu produzieren, um dem Hörer ein möglichst rasches und effizientes Parsen von links nach rechts zu ermöglichen. Die Aussagekraft beider Modelle wird dann in Abschnitt 2.2 anhand konversationeller Mittelfelddaten überprüft. Es wird sich zeigen, 1

Die verbalen Konstituenten (Finitum, Infinitum und Verbzusatz) werden also im folgenden nicht betrachtet. Die Probleme, die sich zum Beispiel bei der Beschreibung des Stellungsverhaltens des Finitums ergeben, sind grundsätzlich von denen verschieden, auf die man bei der Analyse der Positionsvariationen der nichtverbalen Stellungsglieder trifft, die als Argumente oder Modifikatoren zum Verb treten. Während die Stellung des Finitums in Erst-, Zweit oder Endposition entscheidende Funktion im deutschen Modussystem findet, erfüllen die Positionsveränderungen der nicht-verbalen Stellungsglieder vor allem Funktionen im Bereich der Informationsgliederung.

22 daß die Berücksichtigung von Daten aus natürlichen Konversationen und ihrer Produktionsund Perzeptionsbedingungen im Diskurs wichtige Einsichten für die Analyse von Wortstellungsregularitäten und für die "typische" Besetzung der topologischen Felder erbringt. Die entsprechenden Zusammenhänge sind in den bisherigen Theorien zur Satzgliedstellung im Mittelfeld unbeachtet geblieben. Sogar Hawkins, der seine Theorie als ein produktionsund perzeptionsorientiertes Modell vorstellt und durchgängig auf Sprecher und Hörer Bezug nimmt, betrachtet nur Daten, die von Schreibern produziert und von Lesern perzipiert werden (in Hawkins (1992) für das Deutsche nämlich Handkes "Linkshändige Frau"). Die Gegenüberstellung der Modelle von Jacobs und Hawkins fördert nicht nur einen leichten Vorsprung zugunsten von Jacobs' Theorie zu Tage, es wird sich auch zeigen, daß Konversationsteilnehmer von der satzgrammatisch zulässigen Möglichkeit, mehrere Stellungsglieder im Mittelfeld zu piazieren, nur in eingeschränktem Umfang Gebrauch machen und statt dessen systematisch und regelmäßig nicht-satzwertige, mittelfeldfähige Satzglieder erst im Anschluß an das Mittelfeld nach der rechten Klammer produzieren. Dieses Phänomen, das ich als Mittelfeldentleerung

bezeichne, wird im Anschluß an die Diskussion der

Mittelfeldbesetzung in Abschnitt 2.3 behandelt. Entsprechende Konstruktionen wurden als Herausstellungen am rechten Satzrand, z.B. als Nachträge, Ausklammerungen oder Rechtsversetzungen klassifiziert und beschrieben.2 Ich werde zunächst in den Abschnitten 2.3.1 und 2.3.2 die syntaktischen und intonatorischen Eigenschaften von Mittelfeldentleerungen analysieren, um in 2.3.3 eine (zunächst vorläufige) Klassifikation der Formtypen erstellen zu können, die im Anschluß an die funktionale Analyse in Abschnitt 2.4 jedoch präzisiert und ergänzt werden muß. Während Jacobs' Modell eine auf das Mittelfeld beschränkte Theorie darstellt, müßte Hawkins' Theorie gerade in diesem Anwendungsbereich seine Stärke zeigen. Es läßt sich jedoch durch die Analyse konversationeller Daten nachweisen, daß sein eindimensionales Modell zu kurz greift, weil neben dem effizienten Parsen (2.4.1) gesprächsorganisatorische Aspekte wie Sprecherwechsel (2.4.2), Selbstreparaturen (2.4.3) und Informationsgliederung (2.4.4) bei der Produktion von mittelfeldfähigen Satzgliedern im Anschluß an die rechte Satzklammer eine entscheidende Rolle spielen.

Zur Terminologie vgl. Altmann (1981). Hier findet sich auch eine ausfuhrliche Diskussion der Literatur und eine detaillierte, auf syntaktisch-morphologischen, prosodischen und semantisch-funktionalen Kriterien basierende Systematik von Herausstellungsstrukturen. Vgl. dazu u.a. auch Auer (1991a), Lambert (1976) und Zahn (1991). Zu Heraustellungsstrukturen am linken Satzrand, die ich hier nicht berücksichtige, vgl. u.a. auch Selting (1993, 1994a).

23

2.1

Wortstellungsregularitäten im Mittelfeld

Die Idee, daß Sätze systematisch in bestimmte Abschnitte untergliedert werden können, die als topologische Felder bezeichnet werden, geht auf Drach (1937) zurück. In der weiteren Rezeption wurde Drachs Terminologie und Einteilung stark modifiziert.3 Insgesamt steht aber die deskriptive und theoretische Relevanz der Untergliederung in Stellungsfelder heute außer Frage, denn zentrale Regularitäten des Deutschen (insbesondere auch die modusrelevanten Positionierungen des finiten Verbs) sind ohne Bezug auf die Feldergliederung nicht adäquat zu formulieren. Man geht heute im allgemeinen davon aus, daß (mindestens) sechs Felder unterschieden werden müssen:

(1)

(a) (b) (c) (d) (e)

κ Vorfeld — Karl — Karl — — Und — — —

LSK hat sucht daß hat Sucht

Mittelfeld für Maria ein Geschenk für Maria ein Geschenk Karl für Maria ein Geschenk Karl für Maria ein Geschenk er für Maria ein Geschenk

RS Κ gesucht

Nachfeld

gesucht hat gesucht

Das für die folgenden Analysen zentrale Mittelfeld wird bei einer oberflächennahen Betrachtungsweise als der Bereich zwischen der linken und der rechten Satzklammer definiert. Die linke Satzklammer (LSK), die auch als C(omplementizer)-Position bezeichnet wird, wird in Verberst- und Verbzweit-Sätzen durch das finite Verb und in Verbletzt-Sätzen durch eine subordinierende Konjunktion besetzt. Die rechte Satzklammer (RSK) wird durch den Verbalkomplex gefüllt, der jedoch für Verberst- und Verbzweit-Sätze fakultativ ist. Bei transformationeller Sichtweise hingegen ist der rechte Rand des Mittelfeldes immer durch die Grundstrukturposition des Finitums bzw. durch das erste Element des Verbalkomplexes festgelegt, womit das Mittelfeld auch dann durch eine rechte Klammer begrenzt wird, wenn diese Position an der Oberfläche leer ist. (2)

Κ

Vorfeld Karl

LSK suchtj

Mittelfeld für Maria ein Geschenk

RSK e;

Nachfeld

Das Mittelfeld (im Gegensatz zum Vorfeld, das ich nicht näher betrachten werde, und zum Nachfeld, das ich im zweiten Teil dieses Kapitel analysieren werde) ist für die Analysen dieses Abschnitts von besonderem Interesse, es enthält - so Eisenberg (1989: 417) - nicht nur Terminologie und Grenzziehung sind in der Literatur recht uneinheitlich (zur Übersicht vgl. Höhle (1986: 336f) und Zahn (1991: Kap. 3.2.1). So werden in den Grundzügen (im Gegensatz zu Eisenbergs Einteilung) auch die nicht-finiten Elemente des Verbalkomplexes zum Hauptfeld gezählt. Bei Höhle (1986) entspricht dem Hauptfeld das sogenannte "S-Feld". Vgl. auch Patocka (1991) mit Vorschlägen zu einem "korpustauglichen" Feldermodell.

24 "typischerweise eine Satzgliedfolge", sondern "vielfach sämtliche Ergänzungen und Adverbiale des Satzes, es ist das eigentliche 'Hauptfeld'". Doch nicht nur die Eigenschaft des Mittelfelds, mehr als ein Satzglied aufnehmen zu können, ist für die folgenden Analysen relevant, sondern auch die Eigenschaft des Deutschen, in bezug auf die Abfolge der Stellungsglieder neben einer gewissen Positionierungsfreiheit auch bestimmte Anordnungsrestriktionen aufzuweisen. So ist zwar (lf) völlig äquivalent zu (lc); (lg) hingegen ist ausgeschlossen, da bei dieser Abfolge der Stellungsglieder die agentive Interpretation von Karl ins Wanken gerät, sodaß mit der Umordnung der Nominalphrasen auch eine Veränderung ihrer grammatischen Funktionen einhergeht (wobei uns unser Weltwissen natürlich gewisse Interpretationsbeschränkungen auferlegt): (1) (f) daß Karl ein Geschenk für Maria gesucht hat (g) *daß ein Geschenk für Maria Karl gesucht hat Die hier nur angedeuteten Probleme der Anordnungsfreiheit und -beschränkung wurden unter dem Stichwort freie Wortstellung in der Literatur diskutiert. Freie Wortstellung liegt nach übereinstimmender Auffassung dann vor, wenn erstens trotz Veränderung der Abfolge die grammatischen Funktionen der umgeordneten Stellungsglieder konstant bleiben und wenn zweitens unakzeptable Abfolgen nicht mit strukturellen Beschränkungen des Deutschen erklärt werden können, sondern aus nicht-strukturellen, funktionalen Faktoren (wie eben Agentivität) folgen. Die erste Bedingung schließt solche Abfolgen wie (lg) aus, die zweite Bedingung hingegen Fälle wie (lh), denn das Genitivattribut des Nomens darf aus strukturellen Gründen nicht nach vorne bewegt werden: (1) (h) *weil des Kindes jemand das Fahrrad gestohlen hat. Da die Analyse der Wortstellungsregularitäten im Deutschen mindestens seit Behaghel (1932) ein zentrales Forschungsgebiet ist, ist auch die Anzahl der in diesem Bereich publizierten Arbeiten entsprechend umfangreich (vgl. dazu Hofmann 1994: Kap. 3). Ich möchte mich hier aber auf die Vorstellung der beiden schon oben erwähnten Modelle beschränken.

2.1.1 Das Wettbewerbsmodell von Jacobs Das erste Modell, das ich hier kurz vorstellen möchte, arbeitet mit einem mehrdimensionalen Gefüge von Präzedenzprinzipien. Präzedenzprinzipien sind "Anordnungsregeln, die nicht auf die strukturelle Position, sondern auf die kategoriale oder inhaltliche Charakteristik der jeweils involvierten Satzteile (oder auf inhaltliche Beziehungen zwischen diesen Teilen) Bezug

25 nehmen" (Jacobs 1988a: 18) und die in der Art eines 'Wettbewerbsmodells' dergestalt miteinander interagieren, daß mehrere Prinzipien zugleich wirksam sein können und daß es zu Konflikten zwischen ihnen kommen kann. Solche Modelle wurden auch von Uszkoreit (1986), Reis (1987) und Dietrich (1994) vorgeschlagen. Jacobs (1988a: 19f) führt u.a. die folgenden unterschiedlich stark gewichteten Abfolgeprinzipien an: (3) Präzedenzprinzipien und ihre Gewichtungen (PI) AGENS > X (3) (X: eine von Agens verschiedene Argumentrolle) (P2) DATIV > PATIENS (2) (DATIV: Semantische Rolle: Rezipient, Adressat, Benefaktiv oder belebtes Ziel) (P3) PPRO > VOLL-NP (3) (P4) DEHNIT > INDEFINIT (2) (P5) HINTERGRUND > FOKUS (1) Die Gewichtungen sind so zu verstehen, daß ζ. B. eine Verletzung von (PI) dreimal so gravierend wie eine von (P5) ist. Das Wirken der Prinzipien demonstriert Jacobs anhand der Beispiele (4) bis (8). Der Fokusbereich wird durch F-indizierte eckige Klammern und die mit dem FMerkmal korrelierende Akzentuierung (vgl. dazu ausführlich Abschnitt 2.3.1) durch Großbuchstaben notiert: (4) (a) (b) (5) (a) (b) (6) (a) (b) (7) (a) (b) (8) (a) (b)

weil Boris dem Fan [p seinen SCHLÄger ] geliehen hat ?weil dem Fan Boris [p seinen SCHLÄger ] geliehen hat weil [ F BOris] einem Fan einen Schläger geliehen hat ?weil [p BOris] einen Schläger einem Fan geliehen hat weil [p BOris] ihn dem Fan geliehen hat ?weil [p BOris] dem Fan ihn geliehen hat weil [p BOris] seinen Schläger einem Fan geliehen hat ?weil [p BOris] einen Schläger seinem Fan geliehen hat weil Boris einen Schläger [p einem FAN ] geliehen hat ?weil Boris [p einen SCHLÄger ] einem Fan geliehen hat

In den Beispielen (4) bis (8) wird jeweils ein Prinzip verletzt. So ist die geringere Akzeptabilität von (4b) auf die Verletzung von (PI) zurückzuführen, da hier das agentivische Subjekt auf ein Objekt folgt. (5b) ist weniger akzeptabel als (5a), weil die NP mit der semantischen Rolle DATIV nicht wie von (P2) gefordert vor der PATIENS-NP steht. Durch Verletzung von (P3) steht in (6b) das PPRO hinter einer Voll-NP. Das Prinzip (P4), das die Reihenfolge DEFINIT vor INDEFINIT verlangt, wird in (7b) verletzt. In (8b) liegt eine Verletzung von (P5) vor. Modelle dieser Art haben den Vorteil, daß sie differenzierte Akzeptabilitätsaussagen über eine Vielzahl von Abfolgen machen können. Erreicht wird dies durch die unterschiedliche Gewichtung der Prinzipien und die Möglichkeit ihrer Interaktion, wie sich anhand der Beispiele (9) (a) bis (d) demonstrieren läßt:

26 (9) (a) (b) (c) (d)

weil Boris dem Fan [ρ einen SCHLÄger] geliehen hat *weil [p einen SCHLÄger] Boris dem Fan geliehen hat ?weil Boris einen Schläger [p dem FAN] geliehen hat weil Boris seinen Schläger [p einem FAN] geliehen hat

Wenn nämlich in einem bestimmten Satz mehrere Präzedenzprinzipien einschlägig sind und auch verletzt werden, lassen sich aus Anzahl und Gewicht der verletzten Prinzipien verschiedene Grade der Akzeptabilität oder Inakzeptabilität ableiten. So ist (9b) deutlich inakzeptabler als (9c), denn in (9b) sind die Prinzipien (PI), (P2), (P4) und (P5) verletzt, während in (9c) nur (P2) und (P4) nicht beachtet wurden. Ein kaum merklicher Akzeptabilitätsverlust ist bei (9d) im Gegensatz zu (9a) zu beobachten - hier ist nur (P2) verletzt, aber gleichzeitig wird (P5) erfüllt. Jacobs (1988a: 23ff) diskutiert jedoch auch die Frage, ob die Heterogenität der Prinzipien nicht darauf hindeutet, daß hier eine Generalisierung übersehen wurde und die genannten Prinzipien nicht vielleicht aus einem übergeordneten Prinzip folgen, das u.U. auf die Nähe des Arguments zum Prädikat Bezug nimmt.4

2.1.2 Das Komplexitätsmodell von Hawkins Wenden wir uns nun dem Modell von Hawkins (1990, 1992, 1994)5 zu, das durch Eindimensionalität gekennzeichnet ist und auf das das Problem der Heterogenität damit nicht zutrifft. Hawkins' zentrale These ist, daß Faktoren wie semantische Rollen und Informationsstruktur, die in der Literatur zur freien Wortstellung als verantwortlich für bestimmte Abfolgestrukturen diskutiert wurden, von sekundärer oder zu vernachlässigender Bedeutung sind und daß der entscheidende Faktor bei der linearen Anordnung die syntaktische Komplexität der betroffenen Konstituenten ist. Hawkins geht davon aus, daß ein Sprecher seinem Hörer die sprachliche Information so präsentiert, daß dieser deren syntaktische Struktur so schnell wie möglich verarbeiten kann. Die Abfolge der unmittelbaren Konstituenten (ICs) eines Satzes oder einer komplexen Phrase basiert seiner Meinung nach auf einem hörerorientierten Produktionsprinzip, mit dem der Sprecher versucht, so viel relevante Information wie möglich so früh wie möglich zu produzieren, um dem Hörer ein möglichst rasches und effizientes Parsen von links nach rechts zu ermöglichen. Zunächst ein Beispiel aus dem Englischen (Hawkins 1992: 197):

Probleme gibt es bei der psycholinguistischen Plausibilität und bei Folgen von mehr als einem Personalpronomen, da hier wieder die grammatischen Kategorien und nicht die semantischen Rollen wirksam werden. Vgl. dazu auch Lenerz (1977) und Hofmann (1994). Da ich mich hier auf das Deutsche beschränken will, lasse ich typologische Aspekte unberücksichtigt; auch die 1994 erschienene Monographie wird im folgenden nicht systematisch berücksichtigt.

27 (10) (a) I yp[ introduced pp[ to Mary ] jsjp[ some friends that John had brought to the party ]]. I I 1 2 3 4 (b) I yp[ introduced j*jp[ some friends that John had brought to the party ] pp[ to Mary ]]. I I 1 2 3 4 5 6 7 8 9 10 11 In diesem Beispiel besteht die VP nach Hawkins aus drei ICs. Je nach Positionierung ist jedoch der Abstand zwischen der ersten IC, dem Verb, und der Präposition to bzw. dem determinierenden some unterschiedlich groß. Hawkins' zentrales Konzept zur Beschreibung der Abfolgeregularitäten ist die Erkennungsdomäne (Constituent Recognition Domain): (11) Constituent Recognition Domain (CRD) The constituent recognition domain for a phrasal mother node Μ is the ordered set of words in a parse string that must be parsed in order to recognize all ICs of M, proceeding from the word that constructs the first IC on the left, to the word that constructs the last IC on the right, and including all intervening words. (Hawkins 1992: 198) Diese Erkennungsdomäne ist in den Beispielen (10a) und (10b) angegeben. Für die Bestimmung der Domänengrenzen ist ein weiteres Prinzip nötig, das Hawkins unter dem Stichwort Mutterknoten (Mother Node Construction) einführt: (12) Mother Node Construction In the left-to-right parsing of a sentence, if any syntactic category uniquely determines a phrasal mother node M, in accordance with the PS-rules of the language, then Μ is constructed over this category, immediately and obligatorily. (Hawkins 1992: 198) In den oben angeführten Beispielen wären die syntaktischen Kategorien, die die Konstruktion ihrer Mutterknoten erlauben, das Verb für die VP, die Determinatoren für die NPs und die Präpositionen für die Präpositionalphrasen zugleich die Köpfe der betreffenden CRD. Je größer also die Constituent Recognition Domain ist, umso länger braucht der menschliche Parser, bis er alle ICs der betreffenden Domäne identifiziert hat und umso stärker wird das Prinzip der Early Immediate Constituents verletzt: (13a) Early Immediate Constiutens (EIC) The human parser prefers to maximize the left-to-right IC-to-word ratios of the phrasal nodes that it constructs. (Hawkins 1992: 198)

28 Hawkins hat für die empirische Überprüfung seiner Hypothese einen Algorithmus entwickelt, der das Verhältnis zwischen der Zahl der identifizierten unmittelbaren Konstituenten einer Phrase und der Zahl der bis zur Konstruktion aller Mutterknoten zu parsenden Wörter in Prozent ausdrückt und einen Mittelwert zu berechnen erlaubt. Der menschliche Parser präferiert nun solche Satzgliedfolgen, bei denen möglichst hohe Mittelwerte erreicht werden: (13b) The Left-to-Right IC-to-Woid Ratio The left-to-right IC-to-word ratio for a constituent recognition domain is measured by first counting the ICs in the domain from left to right (starting from 1), and then counting the words in the domain from left to right (starting form 1). For each word and its dominating IC, the IC total is divided by the word total at that point, and the result is expressed as a percentage [...]. The higher the percentage, the more loaded and informative is the constituency information at that point. An aggregate IC-to-word ratio for the whole constituent recognition domain is then calculated by averaging the percentage for all the words in the domain. The higher the aggregate, the more optimal is that order of words for processing. The IC-to-word ratio for a whole sentence can be defined as the average of the aggregate IC-to-word ratios for all constituent recognition domains in the sentence, i.e. for all phrasal categories that the sentence dominates. (Hawkins 1992: 198) Für das Beispiel (10a) und (10b) folgt aus (13b), daß (10a) mit der aus 4 Wörtern6 bestehenden Erkennungsdomäne einen höheren Durchschnittswert erhält (nämlich 86%), während (10b) mit 11 Wörtern einen wesentlich geringeren Wert (47%) erreicht. Die Domäne mit dem höheren Wert sollte präferiert sein, da sie das Prinzip (13a) optimal erfüllt. (Von links nach rechts erscheint im Zähler die laufende Zahl der ICs und im Nenner die laufende Zahl der bis zur Konstruktion des letzten Mutterknoten zu verarbeitenden Wörter.) (10') (a) I yp[ introduced pp[ to Mary ] I 1/1 2/2 2/3 100% 100% 67%

some friends that John had brought to the party ]]. I 3/4 75% = 86%

(b) I yp[ introduced Np[ some friends that John had brought to the party ] PP [ to Mary ]]. I I 1/1 2/2 2/3 2/4 2/5 2/6 2/7 2/8 2/9 2/10 3/11 100% 100% 67% 50% 40% 33% 29% 25% 22% 20% 27% = 47%

Das von Hawkins ausgewertetete schriftliche Datenmaterial bestätigt das Prinzip (13a) auf beeindruckende Weise (vgl. auch Primus 1994). Je ungünstiger die Wortstellung für ein möglichst effizientes Parsen von links nach rechts ist, umso seltener sind die Fälle, in denen solche Ein problematischer Aspekt seines Algorithmus könnte jedoch sein, daß die Berechnung auf dem Zählen von Wörtern auf einer orthographischen Basis beruht. In einer Sprache wie dem Deutschen mit sehr komplexen Komposita könnte das psycholinguistisch inadäquat sein. Vgl. dazu die Beispiele (96) und (103) in Abschnitt 2.3.3.

29 Abfolgen auftreten. Aus Hawkins' Modell folgt also nicht, daß in der Performanz keine Wortfolgen beobachtet werden können, die das Prinzip (13a) verletzen, es verlangt aber, daß nichtoptimale EIC-Folgen nicht häufiger als optimale vorkommen: (14) EIC's general performance prediction For alternative grammatical orders of {ICj, ICj... IC n } within a CRD, [...], EIC-preferred orders will be more (or equally) frequent in performance, more or equally acceptable according to native speaker judgements, [...] in direct proportion to the degree of preference. (Hawkins 1992: 200) Hawkins (1992) unterscheidet jedoch fiir die Analyse von Vorkommenshäufigkeiten in Texten zwischen solchen Varianten von Satzgliedfolgen, die das Resultat einer "grammatical rearrangement rule" sein sollen, und solchen, die er als "grammatically free" bezeichnet. Entsprechend dieser beiden Typen von Variation wird (14) in (14a) und (14b) reformuliert: (14a) EIC prediction for rearrangement transformations For any weight-sensitive rearrangement transformation, R, applying to grammatical categories, Cj, Cj, etc, the greater the EIC preference for transformed versus untransformed orders across all sets of word total assignments to these categories, the more (or equally) frequent will be R's rate of application in performance. Hawkins (1992: 201) (14b) EIC predictions for grammatically free word orders For grammatically free orders of categories, ci, cj etc, the EIC-preferred order(s) within each set of word total assignments will be more (or equally) frequent in performance than any single less preferred order(s) [vertical prediction]; and across all sets of word total assignments, the greater the EIC preference for certain orders, the more (or equally) frequent the rate of occurence for the preferred order(s) within a set [horizontal prediction]. Hawkins (1992: 201) Für diesen zentralen Teil seiner Theorie gibt Hawkins (1992: 200f) jedoch keine unabhängigen Kriterien an, sondern verweist darauf, daß die Zuordnung nicht immer leicht zu treffen sei. Nach Hawkins ist (14a) die einschlägige Vorhersage für Heavy NP Shift, und sie sagt voraus, daß die Häufigkeit von Heavy NP Shift mit steigenden EIC-Werten zunimmt. (14a) trägt damit der Beobachtung Rechnung, daß aufgrund der von Hawkins angenommenen Grammatikalisierung der Abfolge NP > PP im Englischen nicht die Mehrzahl der Strukturen als PP > NP realisiert werden, sobald die NP komplexer als die PP ist. Nach Hawkins wird die Mehrzahl der NPs erst dann nach der PP realisiert, wenn die Differenz zwischen NP und PP vier Wörter beträgt. (14b) beinhaltet die Vorhersage von (14a) (horizontal prediction), sagt aber zusätzlich voraus, daß bei grammatisch freier Anordnung bereits geringe Differenzen zu einer Anordnung führen, die das unterschiedliche Gewicht der Konstituenten reflektiert; ElC-präferierte Abfolgen sollten also häufiger sein als die nicht-präferierten Abfolgen (vertical prediction). Hawkins

30 diskutiert grammatisch freie Wortstellung an der Abfolge von zwei PPs im Englischen und zeigt, daß sowohl die horizontale als auch die vertikale Vorhersage erfüllt werden. Hawkins (1992: 209) kommt zu dem Schluß, daß sein EIC-Prinzip primär verantwortlich für die Satzgliedfolge ist und daß andere, z.B. pragmatische Prinzipien, allenfalls dann eingreifen, wenn aufgrund fehlender oder sehr geringer Komplexitätsunterschiede das EIC-Prinzip an Bedeutung verliert. Auch bei Hawkins zeichnen sich also Ansätze in Richtung auf ein Modell ab, in dem mehrere Prinzipien wirksam sind. Es ist jedoch nicht klar, ob pragmatische Faktoren seiner Meinung nach sowohl bei "grammatical rearrangement transformations" als auch bei "grammatically free word orders" eingreifen.

2.2

Das Mittelfeld in natürlichen Konversationen

Ich möchte nun Transkripte von natürlichen Konversationen betrachten und versuchen, Hawkins' Hypothesen7 und Jacobs' Präzedenzprinzipien einem solchen Korpus gegenüberzustellen. Datengrundlage für die Analysen sind vier natürliche Konversationen - eine Face-toFace-Interaktion und drei Telefongespräche. Die Aufnahmen wurden nicht zum Zweck der hier vorgestellten Analyse gemacht. Die aufgenommenen Personen, vier Frauen und ein Mann, sind zwischen zwanzig und dreißig Jahren alt und sprechen standardnahe Varietäten des Deutschen als Muttersprache. Aus diesem Datenmaterial wurden insgesamt 290 Redezüge oder Teile von Redezügen isoliert, die ein identifizierbares Mittelfeld aufweisen.

2.2.1 Komplexität oder Wettbewerb? Was können die beiden vorgestellten Modelle zu Daten aus natürlichen Konversationen sagen? Ein Abfolgemuster, das bei Jacobs als Prinzip (P3) formuliert wird, ist PPRO > VOLL-NP. Nach Hawkins (1992: 212) ist diese Abfolge im Deutschen grammatikalisiert, wenn es sich um zwei Nicht-Subjekt-NPs handelt. Hawkins argumentiert darüberhinaus dafür, daß Jacobs' Präzedenzprinzip aus dem EIC-Prinzip folgt, weil Pronomina aus einem einzigen Wort bestehen, während nicht-pronominal besetzte NPs diese Eigenschaft in der Regel nicht aufweisen. In dem untersuchten Korpus ist (P3) ein sehr häufiges Abfolgemuster: 7

Dazu muß ich - for all practical purposes - einmal annehmen, daß man auch im Deutschen eindeutig bestimmen kann, welche Konstituenten - seien es Köpfe oder nicht - für die eindeutige Konstruktion von Mutterknoten verantwortlich sind und damit die relevanten Größen für die Bestimmung der Constituent Recognition Domain darstellen. Für die VP im Deutschen liegt hier durch die verschiedenen Stellungsvarianten des finiten Verbs und die Verbklammer ein besonderes Problem vor. Problematisch ist darüber hinaus die Zuordnung der Abfolgen zu (14a) oder (14b).

31 (15) Legag 13 -> Ol X: vielleicht 'kann=man ihm 'Gerion 'auch noch bringen; (16) Legag4 -> Ol S: jja; oke (.) 'gut=also: du bist 'sicher daß er die Nummer hat? (17) China 12 Ol T: Es kann natürlich sein, -> 02 daß 'die auch das Hotel 'nicht bezahlen wird; (18) China 1 Ol T: =un=erst nachdem'wir nochmal'nachgefragt ham, -> 02 ob 'sie denn nicht die Er'öffnungsrede halten will, 03 'kam se nochmal, -> 04 daß se ja ein 'Vortrag halten wollte (19) Hunderfünfzig 21 Ol X: ja der macht jetzt sein Examen n= es kommt drauf an (.) -> 02 wo er ne Referendarstelle beantragt ne, (20) Hunderfünfzig 11 -> Ol H: hasse Richard mitgenommen? (21) Verliebt 14 -> Ol H: und seitdem (.) äh (.) steh ich auch mal wieder vor zwei Uhr auf Das einzige Gegenbeispiel mit der Abfolge Voll-NP > PPRO konnte ich im Transkriptausschnitt (22) finden. Die Abfolge von Subjekt-NP und PPRO ist nach Hawkins ein Beispiel für "grammatically free word order". Trotz geringerer Komplexität wird das Pronomen hier nicht der Voll-NP vorangestellt, was zu einer Verschlechterung der EIC-Werte führt: (22) China 4 Ol T: -> 02

vor=allem=auch=in=dem='Ton.= =°in dem" (0.41) die Vera se'angesprochen hat.

(22') (a) [n>die Vera 1/1 1/2 100% 50%

se angesprochen hat ] 2/3 3/4 66% 75% =72%

(b) [jp se die Vera angesprochen hat ] 1/1 2/2 2/3 3/4 100% 100% 66% 75% = 85% Auf der Suche nach dem Grund für die gewählte Abfolge zeigt sich, daß aufgrund der morphologisch uneindeutigen Kasusmarkierung die Abfolge Voll-NP=Subjekt=AGENS > Personal-

32 pronomen = Objekt = ADRESSAT die einzige Möglichkeit ist, die gewünschte Interpretation sicherzustellen. Diese Reihenfolge erfüllt somit (PI): AGENS > Χ (X = eine von Agens verschiedene Argumentrolle). (PI) ist ein ebenso starkes Prinzip wie das verletzte (P3). Jacobs' Wettbewerbsmodell kann damit erklären, warum (P3) in einem Fall wie (22) ohne Akzeptabilitätseinbußen verletzt werden kann. Nach Hawkins (1992: 213) folgt jedoch auch (PI) aus dem EIC-Prinzip: Da agentivische NPs typischerweise kürzer als nicht-agentivische NPs sind, hat dies - wie bei der Voranstellung der Pronomina - zur Grammatikalisierung dieser Abfolge im Deutschen geführt. Damit ist für die Vorhersage des Stellungsverhaltens von Subjekten 8 wiederum das Prinzip (14a) verantwortlich. Die Grammatikalisierung der Voranstellung des Subjektes führt nach Hawkins zu einer stärkeren Insensitivität für die Forderungen von EIC. Hawkins nimmt deshalb an, daß eben aufgrund der Grammatikalisierung von Subjekt-NP > Objekt-NP das Vorkommen von Abfolgen, in denen Nominativ-NPs trotz größerer Komplexität Nicht-Nominativ-NPs vorangestellt werden, nicht ausgeschlossen wird. Da es sich um das einzige Gegenbeispiel handelt, kann es die einschlägigen statistischen Aussagen von Hawkins' Modell also nicht erschüttern. Hawkins steht bei einem Fall wie (22) dennoch vor dem Problem, daß hier seine beiden Typen der Variation zugleich einschlägig sind. Und eine Erklärung oder eine Vorhersage, wann und unter welchen Umständen das EICPrinzip greift, oder ob bei konkurrierender Einschlägigkeit (14a) oder (14b) den Vorrang hat, bietet sein Modell ebensowenig wie unabhängige Kriterien für die Zuordnung zu den Variationstypen (12a) und (12b). Wie steht es mit anderen Vorkommen von agentivischen bzw. nominativischen NPs? Die einzigen Beispiele des gesamten Korpus, in denen eine nicht pronominal besetzte agentivische Argument-NP und ein anderes, ebenfalls nicht pronominal besetztes Argument im Mittelfeld vorkommen, sind (23) und (24). Betrachtet man wie Hawkins (1992: 212) die nominativische Kasusmarkierung (vgl. FN 8), so können auch (25) und (26) berücksichtigt werden. Diese Beispiele gehorchen sowohl Hawkins' als auch Jacobs' Prinzipien, da die Subjekt-NPs den nicht-agentivischen NPs vorangestellt sind und zugleich die ersteren weniger oder gleich komplex wie die letzteren sind: (23) China 21 Ol I: ahm (0.14) ->02 da hatte en en son amerikanischer Journal 'ist (1.0) -> 03 ähm halt son paar 'schwarze Stu'denten da inter'viewt, (24) Hundertfünfzig 2 -> 01 X: also soll: äh:- Rogers Schwester mal am besten an die Uni schreiben;

Wie andere Autoren geht auch Hawkins (1992: 212) davon aus, daß die hohe Korrelation zwischen Agentivität und nominativischer Kasusmarkierung eine Gleichsetzung erlaubt. Vgl. aber Bsp. (25) und (26).

33 (25) China 18 -> Ol I: da kam ein Afrikaner an die 'Bar,= (26) Verliebt 3 Ol H: ja ich war jetzt (.) fünf Tage hier. (.) ne, -> 02 H: weil meine Eltern nämlich im Urlaub sind Das Prinzip (P2) DATIV > ΡATIENS, das Hawkins ebenfalls darauf zurückführt, daß DativNPs in der Regel syntaktisch weniger komplex als Akkusativ-NPs sind 9 , ist mit dem analysierten Datenmaterial kaum zu überprüfen, weil es nur ein einziges Mittelfeld gibt, das sowohl ein PATIENS- als auch ein DATIV-Argument enthält. Man sollte hier ja nur nichtpronominal besetzte Stellungsglieder zur Analyse heranziehen, denn wenn man, wie Hawkins (1992), auch pronominal besetzte NPs berücksichtigt, besteht die Gefahr, daß die Einflußfaktoren nicht isoliert werden können. Außerdem gilt für 2 Personalpronomina wieder die umgekehrte Reihenfolge nämlich AKK > DAT. (27) folgt Jacobs' Präzendenzprinzip, das DATIV-Argument ist aber syntaktisch etwas komplexer als das PATIENS-Argument. (27) China 24 01 T: aber is doch 'selten, 02 weil sonst ist=s doch grad 'umgekehrt, -> 03 daß 'wir den Ki'nesen Stipendien geben, Hawkins Hypothese, daß Präpositionalargumente - auch diese sind typischerweise komplexer als NP-Argumente - zu einer relativ späten Stellung im Mittelfeld tendieren, bestätigen die Beispiele (28), (29) 10 und (30), nicht aber (31) und (32). Sowohl (31) und (32) als auch (27) folgen jedoch dem Präzedenzprinzip (P4): DEHNIT > INDEFINIT: (28) Legag6 -> 01 S: =ja. also:: (,..)=der hat schon 'drei verschiedene 'Bögen -> 02 bei 'alln möglichen 'Leuten bestellt= (29) China 25 01 I: und und deshalb 'machen die das vielleicht auch um (0.4) -> 02 "'gute Kontakte zu den afrikanischen 'Ländern zu halten." (30) China 28 01 I: ahh. Ich müßte mir des über'legen. ahm -> 02 Vielleicht (0.6) könnt=ich 'eine Strecke mit=em 'Zug machen.

9

Auch hier ersetzt Hawkins die sematischen Rollen durch morphologischen Kasus.

10 Es könnte sich im Beispiel (29) jedoch auch um ein einziges, komplexes Argument handeln.

34 (31) Legag 23 -> Ol S: musste mal früh genuch hier in de Stadtzeitung -> 02 ne 'Anzeige setzen; (32) Legag 23 -> Ol X: ich wollte so an der 'Uni und im 'Frauenzentrum -> 02 ein paar 'Zettel hinhängen; Mit den Beispielen (23) bis (32) habe ich alle Mittelfelder präsentiert, die mehr als ein nichtpronominal realisiertes Argument enthalten. Der Untersuchungsbereich kann jedoch - wie bereits gesagt - um 28 Fälle erweitert werden, wenn man auch die nicht-pronominal realisierten Stellungsglieder berücksichtigt, die als Modifikatoren des Verbs im Mittelfeld realisiert werden. Nach Hawkins (1992: 209) sind im Deutschen die Abfolgen NP > PP und PP > NP im Mittelfeld "grammatically free", daher sollten sich nach seinem Prinzip (14b) schon vergleichsweise geringe Komplexitätsunterschiede (1 Wort) auf die Abfolge auswirken. Diese Abfolgen traten in dem untersuchten Korpus in 3 weiteren Mittelfeldern auf: (33) China 20 -> 01 I: genau in der Zeit gab's en Ar'tikel in'Newsweek (34) China 16 01 I: das die die I'dee kommt mir "grad erst, -> 02 daß ich ja in Peking noch diesen (0.47) U'mari kenne, (35) China 10 01 T: 'hh weil d- 'des: war ja 'so,= 02 =daß die Frau "Mutz:, 03 'mich ge'fragt hat, -> 04 ob=ich nich en paar Tage in 'Peking bleiben wollte, Die Beispiele (33) und (34) enthalten sowohl eine NP als auch eine PP mit je zwei Wörtern. In (33) wurde die Abfolge NP > PP und in (34) die Abfolge PP > NP gewählt. Aufgrund des fehlenden Komplexitätsunterschieds ergeben sich auch bei Veränderung der Abfolge keine abweichenden EIC-Werte. In (35) hingegen gibt es einen geringen Unterschied: (35')

(a)

[ V p en paar Tage 1/1 1/2 1/3 100% 50% 33%

(b)

[yp in 'Peking 1/1 1/2 100% 50%

in'Peking bleiben wollte ] 2/4 2/5 3/6 50% 40% 50% =53%

en paar Tage bleiben wollte ] 2/3 2/4 2/5 3/6 66% 50% 40% 50% = 59%

35 Die NP besteht aus 3, die PP hingegen nur aus 2 Wörtern. Entgegen der Erwartung, daß sich bei grammatisch freier Abfolge bessere EIC-Werte direkt durchsetzen, folgt die PP auf die NP. Nach Hawkins' Prinzip (14) sollte gerade für die grammatisch freie Abfolge gelten, daß sich nicht nur die besseren EIC-Werte durchsetzen, sondern die Abfolgen mit den besseren Werten auch als gleich akzeptabel oder sogar grammatisch akzeptabler eingestuft werden als die mit den schlechteren Werten. Dies ist in Beispiel (35) aber nicht der Fall, da die gewählte Abfolge NP > PP deutlich besser ist. Hier könnte Hawkins natürlich wieder sagen, daß es sich vielleicht doch nicht um grammatisch freie Abfolge, sondern um "rearrangement transformations" handelt. Die Abfolge PP > NP findet sich in Beispiel (34). Es wäre also interessant, ob es bei Jacobs ein Präzedenzprinzip gibt, das für diese Abfolge verantwortlich gemacht werden kann. Dazu muß ich das Beispiel in seinem Kontext betrachten: (34) China 16 (verkürzt) ((Thema: Übernachtung in Peking ohne offizielle Betreuung)) Ol I:

'dann würd ich versuchen:, (0.6)

04

versuchen bei 'irgendwelchen Leuten zu (0.4) zu übernachten,=

10 I:

ich kenn ich hab Tcenn 'auch ein: (0.52) ähm (0.98)

11

den Tcenn ich aber nur sehr 'flüchtich? ((Komplizierte Beschreibung der Person ohne Namensnennung))

->

20 I: 21 22 23 24 T: 25 26 I: 27 28 29 T: 30 311:

'wenn: dann: würd ich den::: (1.25) halt (0.5) irgendwann in den 'nächsten Tagen 'anschreiben^ =weil das'eilt ja dann auch, ne? (1.5) 'Triffst du den (.) wenn du in 'Peking bist? '(Du weißtich 'hab an- ich hab den to'tal ver'gessen; das I die die H'dee kommt mir "grad erst, rhmhin I (0.5) daß ich ja in Peking noch diesen (0.47) U'mari kenne,

Erst in diesem Kontext wird nämlich deutlich, warum die Abfolge PP > NP gewählt wird. Die Nominalphrase ist hier zugleich der Abschluß einer langen, aber endlich erfolgreichen Suche nach dem Namen der Person, über die Τ und I sprechen. Es ist während des ganzen Abschnitts von den "Übernachtungsproblemen in Peking" die Rede. Das letzte Mal wird Peking von Τ in Zeile 25 erwähnt. In Zeile 31 ist die PP in Peking immer noch als Hintergrundinformation verfügbar, während der Name der Person, bei der Τ vielleicht übernachten kann, an dieser Stelle zum ersten Mal genannt wird. Diese Anordnung folgt also dem Präzedenzprinzip (P5): HINTERGRUND > FOKUS. Umstellungen zur Disambiguierung der Fokus-Hintergrund-

36 Struktur kommen in dem untersuchten Korpus auch in anderen Mittelfeldern vor. Besonders deutlich ist das Beispiel (36): (36) Legag 5f 01 X: 02 03 S: 04 X: 05 S: 06 X: 07 08 09 S: 10

'hh 'Was gibt es denn sonst Neues bei Euch; (0.5) (och) eigentlich nnix 'Neues ne=E'xam machn we alle (so). 'Ihr "auch; jeja; 'hh (.) 'h (s)ja ne ziemliche 'Aufregung; (.) 'h habt er euch schon des angetan (da=diese:) (.) ?'Bögen auszufüllen oder; ach nei:: (n) das- das lass ich das äh: (.) die 'Angst davor macht im Augenblick sich [p 'Werner];

Die in diesem Abschnitt vorgestellten Beispiele erlauben keine eindeutige Bewertung der diskutierten Modelle. Wenn überhaupt zeichnet sich ein leichter Vorsprung für Jacobs' Modell ab. Doch wenn die Beispiele Hawkins' Prinzipien auch nicht eindeutig stützen, so widerlegen sie sie andererseits auch nicht. Das liegt vor allem daran, daß Hawkins' Prinzipien statistische Vorhersagen machen und daß das hier vorliegenden Datenmaterial aufgrund des geringen Vorkommens von mehreren nicht-pronominal realisierten Stellungsgliedern im Mittelfeld keine statistisch signifikanten Aussagen erlaubt (vgl. dazu auch Primus 1994: 64f). Ein besonderes Problem bei Hawkins ist aber - unabhängig von diesem Problem - die Zuordnung der Abfolgen zu den Variationstypen (14a) und (14b). Betrachtet Hawkins nämlich eine bestimmte Abfolge als "grammatikalisiert", so folgt aus der einschlägigen Vorhersage für "rearrangement transformations" (12a), daß Grammatikalisierung, die zunächst auf syntaktischer Komplexität basiert, diese dann wieder neutralisieren kann. Grammatikalisierung führt so zu einer Insensitivität für geringe Komplexitätsunterschiede, und ElC-präferierte Abfolgen setzen sich in diesem Fall erst bei sehr deutlichen Komplexitätsunterschieden durch (z.B. bei Heavy NP Shift im Englischen erst ab vier Wörtern). Da sich in dem untersuchten Korpus nur wenige Beispiele und niemals solche mit einem Komplexitätsunterschied von vier und mehr Wörtern in den einschlägigen Konstituenten finden ließen, lassen sich Hawkins' Vorhersagen in diesem Bereich nur eingeschränkt überprüfen. Aussagekräftiger müßten also solche Abfolgen sein, die nach Hawkins' Prinzip (12b) als "grammatisch frei" klassifiziert werden können. Doch auch die Diskussion der Abfolge NP > PP und PP > NP zeigte, daß neben der geringen Vorkommenshäufigkeit vor allem die fehlenden unabhängigen Kriterien für die Zuordnung die Überprüfung von Hawkins' Modell erschweren. Jacobs' Modell kann vor allem mit Beispielen wie (22) und (34) einen Vorsprung gegenüber Hawkins erzielen. Seine interagierenden Präzedenzprinzipien erklären fehlende Akzeptabilitätseinbußen, während in Hawkins' Modell nicht eindeutig festgestellt werden kann, welcher Variationstyp für die Abfolge einschlägig ist.

37 2.2.2 Das Mittelfeld als "Hauptfeld"? Wie eingangs erwähnt, wird das Mittelfeld aufgrund seiner grammatischen Eigenschaft, "typischerweise" sämtliche nichtverbalen Stellungsglieder aufnehmen zu können, auch als "Hauptfeld" bezeichnet. Diese Eigenschaft weisen Mittelfelder in natürlichen Konversationen jedoch nicht unbedingt auf. Die Gegenüberstellung der Modelle von Jacobs und Hawkins vorangegangenen Abschnitt hat nämlich auch deutlich gemacht, daß Konversationsteilnehmer von der Möglichkeit, mehrere Stellungsglieder im Mittelfeld zu piazieren, nur in eingeschränktem Umfang Gebrauch machen. Wenn Sprecher Satzglieder im Mittelfeld realisieren, dann sind diese häufig pronominal besetzt: Von den untersuchten 290 Mittelfeldern enthalten fast zwei Drittel (186) mindestens eine ProForm. 11 Das sind immerhin 64%! Und sucht man gar nach Mittelfeldern, die mehr als ein nicht-pronominal realisiertes Argument enthalten, so ist die Ausbeute wahrhaft kläglich, denn wie bereits gesagt - die Beispiele (23) bis (32) stellen das komplette Inventar an Mittelfeldbesetzungen mit mehr als einem nicht-pronominal realisierten Argument (hervorgehoben durch Kursivsetzung) dar: (23) China 21 01 I: ähm (0.14) -> 02 da hatte en en son ameri'kanischer Journal 'ist (1.0) -> 03 ähm halt son paar 'schwarze Stu'denten da inter'viewt, (24) Hundertfünfzig 2 -> 01 X: also soll: äh:- Rogers Schwester mal am besten an die Uni schreiben; (25) China 18 -> 01 I: da kam ein Afri'kaner an die'Bar,= (26) Verhebt 3 01 H: ja ich war jetzt (.) fünf Tage hier. (.) ne, -> 02 H: weil meine Eltern nämlich im Urlaub sind (27) China 24 01 T: aber is doch 'selten, 02 weil sonst ist=s doch grad 'umgekehrt, -> 03 daß 'wir den Ki'nesen Stipendien geben, (28) Legag 6 -> 01 S: =ja. also:: (...)=der hat schon 'drei verschiedene 'Bögen -> 02 bei 'alln möglichen 'Leuten bestellt= Die Referenz auf Sprecher und Hörer ist in natürlichen Dialogen sicher eine Ursache für die hohe Anzahl von Pronomina.

38 (29) China 25 Ol I: und und deshalb 'machen die das vielleicht auch um (0.4) -> 02 "gute Kontakte zu den afri Icanischen 'Ländern zu halten.0 (30) China 28 Ol I: ahh. Ich müßte mir des tiber'legen. ähm -> 02 Vielleicht (0.6) könnt=ich 'eine Strecke mit=em 'Zug machen. (31) Legag 23 -> Ol S: musste mal früh genuch hier in de Stadtzeitung ne 'Anzeige setzen; (32) Legag 23 -> Ol X: ich wollte so an der 'Uni und im 'Frauenzentrum -> 02 ein paar 'Zettel hinhängen; Nur 10 von 290 Mittelfeldern weisen also diese Eigenschaft auf - das sind lediglich 3,4 %! Auch die obere Grenze ist rasch erreicht: Mehr als ein nicht-pronominal realisiertes Argument bedeutet in meinem Korpus maximal zwei, denn drei oder mehr nicht-pronominal realisierte Argumente sind nicht zu finden. Doch auch, wenn man die nicht-pronominal realisierten Stellungsglieder mitberücksichtigt, die nicht als Argumente, sondern als Modifikatoren des Verbs im Mittelfeld realisiert werden, ist das Ergebnis sehr überraschend. Auch mit dieser Erweiterung des Phänomenbereichs erhöht sich die Anzahl von Mittelfeldern, die mindestens zwei Stellungsglieder12 mit diesen Eigenschaften aufweisen, nur auf insgesamt 38 Fälle (13%) - wie Beispiel (35) (die Modifikatoren werden durch gepunktete Unterstreichung hervorgehoben): (35) China 10 01 T: 'hh weil d- 'des: war ja 'so,= 02 =daß die Frau "Mutz:, 03 'mich ge'fragt hat, -> 04 ob=ich nich m. paar..Tage. in 'Peking bleiben wollte, Und mehr als zwei nicht-pronominale Stellungsglieder im Mittelfeld (seien es nun Argumente oder Modifikatoren) wie in Beispiel (37) sind in dem gesamten Korpus nur in 4 Redezügen (1,3%) zu finden: (37) Verliebt 5 -> 01 H: dann wollt ich Anfang.April hier ma ng.W.QGhe. äh (0.5) -> 02 mich ruhich: := vom Zahnarzt behandeln lassen

Nicht berücksichtigt werden bei dieser Zählung die nicht extraponierbaren Konstituenten wie Negationspartikeln, Satzadverbien, Modalpartikeln und ähnliches.

39 Diesen Befund darf eine Theorie, die sowohl Produktions- als auch Perzeptionsbedingungen berücksichtigt, nicht vernachlässigen. Es stellt sich jedoch die Frage, ob Sprecher vielleicht andere grammatisch zulässige Möglichkeiten nutzen können, um trotz der beschriebenen Tendenz zu einem wenig komplexen Mittelfeld weitere Satzglieder innerhalb von satzwertigen Äußerungen zu piazieren. Damit komme ich zu dem zweiten Phänomenbereich, der im Rahmen dieses Kapitels untersucht werden soll, der Realisierung von mittelfeldfähigen Satzgliedern im Anschluß an die rechte Satzklammer.

2.3 Mittelfeldentleerung in natürlichen Konversationen Nicht nur häufige Pronominalisierungen kennzeichen die Mittelfelder in natürlichen Konversationen. Das Mittelfeld wird auch häufig entleert. Eine Mittelfeldentleerung liegt dann vor, wenn nicht-satzwertige, mittelfeldfähige Satzglieder erst im Anschluß an das Mittelfeld nach der rechten Klammer produziert werden: (38) China 15 -> Ol T: mal 'sehn was das er'gibt das Ge'spräch. (39) China 11 Ol T: un=da hab ich das ge'bucht, (0.4) -> 02 mit 'vier Tage 'Aufenthalt in 'Peking, Der Begriff der Mittelfeldentleerung wird deshalb neu eingeführt, weil die vorhandenen Benennungen, z.B. bei Altmann (1981), Auer (1991a) oder Zahn (1991) wie Nachträge, Nachfeldbesetzungen,

Ausklammerungen,

Rechtsversetzung, Rechtsherausstellungen

oder Rechts-

expansionen, weder die Gemeinsamkeiten der auffälligen Satzgliedvariation erfassen noch einen Hinweis auf die Funktionen dieser Strategie liefern. Zur Mittelfeldentleerung greifen die Konversationsteilnehmer des untersuchten Korpus insgesamt 72 mal (25%). In etwas weniger als der Hälfte dieser Beispiele (35 mal) enthält das Mittelfeld keine Pro-Form. Damit wird das Mittelfeld in meinem Korpus in 224 von 290 Fällen (77%) durch Pronominalisierung oder durch Mittelfeldentleerung reduziert. Dieser Befund läßt es unbedingt notwendig erscheinen, Formen und Funktionen von Mittelfeldentleerungen im Rahmen der Analyse von Satzgliedstellungsvariation in natürlichen Konversationen zu untersuchen. Bevor ich diese jedoch vorstellen und analysieren kann, müssen einige Formaspekte abgeklärt werden.

40 In Übereinstimmung mit der einschlägigen Literatur nimmt auch die hier vorgeschlagene Klassifizierung der Formtypen Bezug auf zwei Ebenen der Grammatik: Es werden sowohl syntaktische als auch prosodische Eigenschaften zur Klassifizierung herangezogen. Auf beiden Ebenen geht es darum, ob und wie die potentielle Mittelfeldkonstituente mit dem Matrixsatz verknüpft ist. Auf der syntaktischen Ebene kann dies u.a. durch Bezugselemente, Pro-Formen oder Kongruenz geschehen. Die verschiedenen Arten der Verknüpfung und die syntaktischen Eigenschaften von Konstruktionstypen, die in der Literatur unter den oben genannten Termini diskutiert werden und die mit den hier als Mittelfeldendeerungen bezeichneten Formen teilweise übereinstimmen, werden in Abschnitt 2.3.2 anhand einer exemplarischen Literaturübersicht (Altmann 1981 und Auer 1991a) vorgestellt. Auf der prosodischen Ebene ist das wichtigste formale Differenzierungsmittel die Intonationsphrasenbildung. Sprecher haben die Möglichkeit, die dem Mittelfeld entzogenen Satzglieder als eigenständige Intonationsphrasen (IP) zu produzieren (39), oder aber sie als Teil der vorausgehenden Intonationsphrase zu realisieren (38): (38) [χρ mal 'sehn was das er'gibt das Ge'spräch] (39) [n>i un=da hab ich das ge'bucht] [jp2 mit 'vier Tage 'Aufenthalt in 'Peking] Was bedeutet es, daß eine nicht-satzwertige Konstituente eine eigene Intonationsphrase bildet? Da weder die Terminologie in der Literatur noch die intuitiven Urteile in diesem Bereich klar und eindeutig sind, ist es notwendig, an zur Explizierung des Konzepts der Intonationsphrase die wichtigsten phonologischen Regeln für ihre Bildung wohlgeformter zu erläutern.

2.3.2 Prosodische Eigenschaften: Intonationsphrasenbildung Mit Begriffen wie Intonationsphrase, Tongruppe oder Phrasierungseinheit versucht man zu erfassen, daß bestimmte Abschnitte von Äußerungen aufgrund besonderer interner und flankierender prosodischer Eigenschaften auditiv identifizierbare und phonologisch relevante Einheiten bilden. Das wichtigste akustische Korrelat bei der Intonationsphrasenbildung ist der Grundfrequenzverlauf, die Fo-Kontur. Für die Analyse der Binnenstruktur und der Grenzen von Intonationsphrasen gibt es in der Literatur mindestens drei konkurrierende Modelle 13 , die 13

Erstens: Der Ansatz der Britischen Schule (zur Übersicht vgl. Couper-Kuhlen (1986: Kap. IV) und Cruttenden (1986: Kap.3)), der für die Beschreibung des Deutschen von v.Essen (1964) eingeführt und u.a. von Kohler (1977) und Pheby (1980) übernommen wurde. Zweitens: Tonsequenzanalysen im Rahmen der autosegmentalen Phonologie mit Pierrehumbert (1980) als prominenteste Vertreterin (zur Entwicklung eines autosegmentalen Modells für die Analyse deutscher Intonationskonturen auf der Basis der FokusHintergrund-Gliederung vgl. Uhmann 1988, 1991). Drittens: Superpositionsmodelle, die mit additiven Überlagerungen voneinander unabhängiger Komponenten operieren (vgl. Thorsen (1988), Gr0nnum (1992), Fujisaki (1988) sowie für das Deutsche Möbius (1993) dort findet sich auch ein guter Überblick. Die Modelle von Ladd (1988, 1990a), Zacharski et al. (1992) und Pierrehumbert & Hirschberg (1990) vereinen

41 jedoch die in diesem Zusammenhang wichtige Einsicht teilen, daß Intonationsphrasen mindestens eine prosodisch besonders prominente Position enthalten müssen und daß sie idealiter durch eine Pause voneinander getrennt sind. Diese Einsicht ist als Definitionsgrundlage allerdings empirisch unbefriedigend. Was die Anzahl der prosodisch besonders hervorgehobenen Silben pro Intonationsphrase betrifft, so gibt es eine beträchtliche Variation. Sehr komplexe Intonationsphrasen enthalten fünf und mehr akzentuierte Silben. Da bei der akustischen Realisierung des Akzents im Deutschen der FoVerlauf (neben Dauer und Intensität) die zentrale Rolle spielt, läßt sich also nur festhalten, daß das Vorhandensein mindestens eines Akzenttons (AT) für eine wohlgeformte Intonationsphrase obligatorisch ist. Akzenttöne modifizieren die Fo-Kontur auf metrisch prominenten, akzentuierten Silben und gestalten den internen Aufbau der Intonationsphrase.14 Doch auch die Pausenplazierung ist ein problematisches Kriterium für die Bestimmung der Intonationsphrasengrenzen. Zumindest im Deutschen können Pausen nämlich auch innerhalb von Intonationsphrasen vorkommen. Ebenso ist es möglich, daß zwei Intonationsphrasen aufeinanderfolgen, die nicht durch eine Pause getrennt sind. Gerade bei höherer Sprechgeschwindigkeit (vgl. dazu Kap. 4) ist zu erwarten, daß keine intonationsphrasenflankierenden Pausen auftreten, sondern daß die Phrasierungsgrenzen durch andere prosodische Mittel, vor allem FoVeränderungen, markiert werden. Im Gegensatz zu den Fo-Veränderungen, die für die Wahrnehmung von Akzenten erforderlich sind, finden sich die für die Phrasierung relevanten Intonationskonturen der Grenztöne (GT) auch auf unakzentuierten Silben. Ebenso wichtig wie das Vorhandensein von Pausen, die in den Transkripten durch Sekundenangaben in Klammern notiert werden, ist also auch bei der Festlegung der Intonationsphrasengrenzen der Fo-Verlauf. Das Beispiel (40) und seine Fo-Kontur15 (Figur I) zeigen eine solche Intonationsphrasengrenze, die auch ohne intervenierende Pause perzipiert wird: (40) [n> Ja ] [n>Veronika hat ihrer Mutter einen Fernseher mitgebracht] l\ ATGT

I AT

I AT

I AT

I GT

Die erste Intonationsphrase enthält eine besonders hervorgehobene und durch Akzenttonzuweisung markierte Silbe, die zweite Intonationsphrase enthält drei Akzenttöne.

14

Aspekte des Tonsequenzansatzes mit Superpositionsanteilen. Basierend auf der Distinktion zwischen Hochtönen und Tieftönen wurden in Uhmann (1987, 1991: Kap. 3) für das Deutsche vier verschiedene und funktional distinktive Akzenttöne angenommen: Zwei bitonale, kinetische Töne ('fallend': H*+T, steigend: T*+H) und zwei monotonale, statische Töne Choch': H*, 'tief: T*). Der mit dem Stern versehene Ton wird mit der metrisch prominentesten Silbe der Konstituente assoziiert. Bei der Übersicht und der Stilisierung der Fo-Konturen der Akzenttöne in Uhmann (1991: 159f) wurden leider die Akzenttöne H* und H*+T vertauscht. Zur Akzenttonidentifizierung vgl. Pierrehumbert (1980) und zur Akzenttonzuweisung Selkirks (1984:265ff) "Pitch Accent Prominence Rule". Die Fo-Messungen wurden mit einem Kay/Visi-Pitch 6087 und einem Tektronix/Storage Oszilloscope vorgenommen. Die Oszillomink-Konturen wurden über einen Scanner in ein Zeichenprogramm übertragen.

(Figur I) GL 62 Hz

300 250 200 150

ja:.a

Veronika hat ihrerMuttereinenFernsehermitgebracht

S£k

Neben und unabhängig von der Pausenplazierung werden Intonationsphrasengrenzen also vor allem dann peizipiert, wenn starke Fo-Bewegungen auf unakzentuierten Silben realisiert werden und wenn das am Ende einer Intonationsphrase erreichte Fo-Niveau (Offsetniveau) wie in Beispiel (40) (vgl. Figur I) nicht mit dem Fo-Niveau am Beginn der nächsten Intonationsphrase (Onsetniveau) übereinstimmt. In dem in Uhmann (1987,1988,1991) entwickelten Intonationsmodell ist der das Offsetniveau steuernde intonationsphrasenfxnale Grenzton sowohl bei redezugexterner als auch bei redezuginterner Intonationsphrasenbildung obligatorisch, während der für das Onsetniveau verantwortliche initiale Grenzton fakultativ ist. 16 Zusammen mit dem letzten Akzentton, der immer bitonal sein muß (vgl. FN 14 und Uhmann 1991: 174), modellieren die finalen Grenztöne (vgl. FN 15) die Fo-Kontur am Ende der Intonationsphrase.17 Es konnte gezeigt werden (vgl. u.a. Uhmann 1991), daß die Fokus-HintergrundGliederung eines Satzes für die Akzenttonzuweisung und damit für die distinktiven Eigenschaften seiner Intonationskontur verantwortlich ist. Dabei spielt die Zuweisung von FokusMerkmalen (F-Merkmalen) an syntaktische Konstituenten oder kleinere morphologische oder phonologische Einheiten eine zentrale Rolle. 18 Die Zuweisung mindestens eines F-Merkmals 16

Der unterschiedliche Status der Grenztöne beruht darauf, daß der finale Grenzton in der Modusmarkierung eine zentrale grammatische Funktion übernimmt. Die für die Modusmarkierung relevante Distinktion spiegelt sich in zwei distinktiven Offsetniveaus wider. Der initiale Grenzton hat keine vergleichbare grammatische Funktion. Häufig wird für das Onsetniveau der Intonationsphrase ein konstanter, sprecherindividueller mittlerer Wert gewählt. Zur auditiven und akustischen Identifizierung von Intonationsphrasengrenzen in natürlichen Konversationen vgl. auch Schuetze-Coburn et al. (1991) sowie Kap. 4.1.4.

17

Der letzte AT bildet zusammen mit dem finalen GT auch die vier minimalen, distinktiven Intonationsmuster des Deutschen, die unter bestimmten Umständen auch auf einer einzigen Silbe realisiert werden können: insgesamt fallend (H*+T T%), insgesamt steigend (T*+H H%), fallend-steigend (H*+T H%) und steigendfallend (T*+H T%). Bei der Übersicht und der stilisierten Darstellung der Kombinationsmöglichkeiten in Uhmann (1991: 172) haben sich leider zwei gravierende Fehler eingeschlichen. Der insgesamt fallende Intonationsverlauf muß durch H*+T T% (s.o.) repräsentiert und auch die stilisierte Kontur entsprechend geändert werden. Die Ausbuchstabierung der Regeln zur F-Merkmalszuweisung ist Aufgabe von Fokussemantik (vgl. u.a. Jacobs ed. 1992, Rooth 1992, v. Stechow 1991, Kratzer 1991) und Fokussyntax (vgl. u.a. Primus 1993).

43 pro Satz ist obligatorisch. Es ist also auch möglich, daß Sätze vollständig fokussiert sind (das F-Merkmal wird dem obersten S-Knoten zugewiesen). Als phonologisches Korrelat des abstrakten F-Merkmals wird mindestens ein Akzentton angenommen. Als Intonationssprache beschränkt sich die tonale Information im Deutschen auf post-lexikalische Modalitäts- und Fokusmarkierungen, die nur auf ganz bestimmten Silben innerhalb der Intonationsphrase realisiert werden. Da das F-Merkmal Einheiten von höchst unterschiedlicher Komplexität zugewiesen werden kann, erhebt sich natürlich die Frage nach der genauen Plazierung des Akzenttons. Diese Frage ist jedoch bei komplexen syntaktischen Konstituenten nicht einfach zu beantworten. Unter dem Stichwort Fokusprojektion19

ist in der Literatur der Fall beschrieben worden,

daß ein einziger Akzent (bzw. ein einziger Akzentton) die Fokussierung einer komplexen Konstituente signalisiert und daß die Plazierung dieses Akzenttons systematische Ambiguitäten in bezug auf die Position des F-Merkmals zuläßt. Ambiguitäten entstehen dann, wenn der Akzentton auf dem sogenannten Fokusexponenten realisiert wird. Was im allgemeinen unter Fokusprojektion verstanden wird, geht - 'avant la lettre' - auf Hermann Paul (1880), vor allem aber auf Chomskys (1971:201) Beobachtung zurück, daß ausgehend von einer Akzentuierung (notiert durch Kapitälchen) wie in (41) jede der Konstituenten in Klammern als Fokus betrachtet werden kann: (41) was he (warned (to look out for (an exconvict (with a red (SHIRT))))) In Uhmann (1991: 207f) wurden zwei Regeln zur Identifizierung des Fokusexponenten formuliert. Diese orientierten sich an dem empirisch beobachtbaren Faktum, daß sich Modifikator/Kopf-Strukturen anders verhalten als Prädikat/Argument-Strukturen. 20 Diese beiden Regeln sowie verschiedene 'Ausnahmen' und Besonderheiten (vgl. Uhmann 1991: Kap.5) lassen sich jedoch unter dem Konzept der Integration zusammenfassen, das Schwesterkonstituenten (SK) unter bestimmten Bedingungen "zu semantisch kompakten Einheiten verschweißt" (Jacobs 1993: 64). Eine für unsere Zwecke etwas vereinfachte Version 21 der Integrationsbedingungen aus Jacobs (1993:71ff) lautet wie folgt:

19

2

®

Zur ausführlichen Diskussion vgl. Uhmann (1991) sowie u.a. Fuchs (1976, 1980), Halliday (1967a, 1967b), Höhle (1982), Klein & v. Stechow (1982), v. Stechow & Uhmann (1984), Jacobs (1982) und Ladd (1980). Diese Theorie hat zahlreiche Vorgänger. Zur Übersicht vgl. Uhmann (1991: 199ff) sowie die Neuauflage dieser Idee bei Gussenhoven (1992). Die Bedingungen (3a) und (3b) sind für die hier analysierten Beispiele irrelevant. Sie dienen dazu, bei bestimmten Argumenten die Integration zu blockieren. Die Integration wird dann blockiert, wenn die Argumente keine 'Proto-Patiens-Eigenschaften' im Sinne von Dowty (1991) aufweisen. Vgl. dazu Jacobs (1993: 73ff).

44 (Bedl) Konstituente Χι ist nur dann in Konstituente X2 integriert, wenn 1.-4. gelten: 1. Xi und X2 sind Tochterkonstituenten derselben Konstituente Y und X2 ist Kopf von Y; 2. a) Xi ist ein Argument von X2, oder b) Y ist ein Wort und Xi ist eine nähere Bestimmung zu X2; [...] 4. X2 enthält nicht mehr Teilkonstituenten als die folgenden: a) eine nicht-komplexe Kemkonstituente L b) eventuelle funktionale Elemente, die L erweitern. (Im folgenden wird die Konstituente Xi auch als die integrierte Konstituente und X2 als die Zielkonstituente bezeichnet.) Die Integrationsbedingungen werden u.a. dann relevant, wenn mit F-Merkmalen versehene syntaktische Strukturen zunächst auf Prominenzrelationen (metrische Bäume) und schließlich auf rhythmische Strukturen (metrische Gitter) abgebildet werden. Nehmen wir zur Demonstration das Beipiel (42), bei dem das F-Merkmal dem ganzen Satz zugewiesen wird: (42) Gab's was Besonderes? Ja. [F Veronika hat ihrer Mutter einen Fernseher mitgebracht.] Eine (vereinfachte) syntaktische Struktur dieses Satzes ist (43): (43) Syntaktische Struktur S [F]

Für die Abbildung von syntaktischen Strukturen auf Prominenzrelationen sind bei Jacobs (1993: 84f) drei Prominenzregeln (P-Regeln) verantwortlich: (P-Regel 1) Alle X e SK, die das Merkmal [F] enthalten, erhalten "+". (P-Regel 2) Wenn kein Χ ε SK das Merkmal [F] enthält, erhalten alle neutral betonbaren Χ ε SK "+".

45 (P-Regel 3) Wenn kein Χ ε SK das Merkmal [F] enthält und die Elemente von SK im Verhältnis der Integration stehen, dann geht "+" an die integrierte Konstituente, wenn diese neutral betonbar ist, andernfalls an die Zielkonstituente. Diese P-Regeln unterliegen dem Proper Inclusion Principle. Damit erhält in Fällen, die die Anwendung mehrerer Regeln erlauben, die Regel mit der eingeschränkteren Anwendungsdomäne die 'Vorfahrt'. Das für die P-Regeln zentrale Konzept der neutralen Betonbarkeit läßt sich am besten 'ex negativo' bestimmen: Nicht neutal betonbar sind "Elemente, die höchstens dann prominent sein können, wenn sie das Fokusmerkmal tragen" (Jacobs 1993: 85).22 Die PRegeln überfuhren die syntaktische Struktur (43) in die Prominenzstruktur (44): (44) Prominenzstruktur

Ve ro ni ka hat

ih rer Mut ter ei nen Fern seh er

mitgebracht

Die Prominenzstruktur bildet die relativen Prominenzverhältnisse bei gegebener FokusHintergrund-Gliederung ab. Im Gegensatz zu der strong/weak-Notation der metrischen Phonologie (vgl. auch Kap. 3.2.1) ist es in dem von Jacobs entwickelten Modell auch möglich, daß sich Schwesterkonstituenten in ihrer relativen Prominenz nicht unterscheiden. Die binären Verzweigungen werden mit "+"- und "-" etikettiert. Ein "+" bedeutet: "prominenter als alle Minus-Schwesterkonstituenten und gleich prominent wie alle Plus-Schwesterkonstituenten"

Die Unterscheidung deckt sich weder ganz mit der üblichen Trennung zwischen lexikalischen Kategorien (satzgliedfähige Wortklassen wie Nomina, Verben, Adjektive, Adverbien) und Funktionswörtern (nichtsatzgliedfähige Wortklassen wie Artikel, Konjunktionen, Hilfsverben etc.), da manche Pronomina (nichtdemonstrative und indefinite Pronomina) zu den nicht neutral betonbaren Elementen zählen, noch mit der von Lötscher (1983: 47) eingeführten Unterscheidung zwischen "akzentuierbaren und nicht-akzentuierbaren Wörtern", da dieser Adverbien nicht aufführt. Zur Relevanz der Unterscheidung vgl. auch Uhmann (1991: 222)

46 (Jacobs 1993: 83). Innerhalb von V' von (43) wird also P-Regel 3 angewandt, weil hier Integration vorliegt. In allen anderen Phrasen liegt nach (Bed I) keine Integration vor, also wird P-Regel 2 angewandt. (Konstituenten, denen die jeweils angewandte Regel kein "+" zuweisen, werden per default"-".) Nach Anwendung der P-Regeln werden die terminalen Knoten um die Angabe ihrer wortinternen, im Lexikon verzeichneten Prominenzstruktur erweitert. Die Prominenzstruktur erlaubt dann über die Anwendung des folgenden R-Prinzips die Umwandlung des metrischen Baums in ein der rhythmischen Struktur des Satzes entsprechendes metrisches Gitter: (R-Prinzip) 1. Die designierten Silben jedes "+"-Elements von SK sind stärker als alle anderen Silben von SK. 2. Die designierten Silben aller "+"-Elemente von SK haben dieselbe Stärke. Das R-Prinzip liefert aber noch nicht das Endprodukt der rhythmischen Struktur. Euphonieregeln wie Schlagtilgung und Schlaghinzufügung können das metrische Gitter im Hinblick auf ein 'ideales' Gitter umformen. 23 Außerdem führt im Deutschen noch eine fakultative Regel der Endakzentstärkung (vgl. Uhmann 1991: 179) dazu, daß bei einer Folge von gleichstarken Silben, die die maximale metrische Prominenz erreicht haben, die letzte Silbe einen zusätzlichen Schlag erhalten kann und damit zur prominentesten Silbe der Intonationsphrase wird: (Endakzentstärkung) Von mehreren rhythmisch stärksten Silben innerhalb einer Intonationsphrase erhält die letzte ein zusätzliches "x". Diese Regel erinnert zunächst an die "Nuclear Stress Rule". Im Gegensatz zu dieser ist sie jedoch fakultativ und operiert darüberhinaus auch nicht zyklisch, sondern hat die Intonationsphrase als Anwendungsdomäne. Damit ergibt sich für Beispiel (42) folgendes Betonungsmuster (Das Resultat der Endakzentstärkung wird in Klammern angegeben.): (45)

Rhythmische Struktur Ve ro ni ka XX XX

X X

χ

χ X

hat X X

ihrer Mutter χ X X

χ X X X

X

einen χ

X

X

Fern seh er X X X X

X

X

X

mit gebracht X X χ

X

X

X

(x)

Im Gegensatz zu Uhmann (1991: 176) nehme ich nur diese beiden Euphonieregeln an. Die Schlagbewegung bzw. Schlagverschiebung (iambic reversal etc.) entfällt. Zur Begründung vgl. Kap. 3.2.1.

47 Was leistet dieses Modell, und was leistet es nicht? Auf der Basis des Konzeptes der Integration können die grammatisch relevanten Prominenzverhältnisse ermittelt werden. Die Prominenzstrukturen geben zusammen mit der Übersetzung in die rhythmische Struktur das für einen Satz und seine Fokus-Hintergrund-Struktur ermittelte abstrakte Prominenzpotential an, indem bestimmte Iktuspositionen (zur Definition vgl. Kap. 3.2) lokalisiert werden. Darüberhinaus erfaßt das Modell auch die eingangs angesprochene Fokusprojektion und identifiziert die Fokusexponenten, indem es bei unterschiedlicher Plazierung des F-Merkmals identische Rhythmusstrukturen erzeugen kann (vgl. dazu ausführlich Jacobs 1993: 87ff). Weder die Prominenzstruktur (44) noch die rhythmischen Strukturen wie (45) sagen jedoch etwas darüber aus, wie diese abstrakten Iktuspositionen phonologisch interpretiert und phonetisch realisiert werden. Hier spielen, wie noch gezeigt wird, die schon erwähnten Akzenttöne eine entscheidende Rolle. Prominenzstrukturen sind außerdem sehr syntaxnahe Strukturen. Arbeiten im Rahmen der prosodischen Phonologie (Beckman & Pierrehumbert (1986), Selkirk (1980, 1984, 1986), Nespor & Vogel (1986), Pierrehumbert & Beckman (1988) und Ladd (1992)) haben jedoch gezeigt, daß syntaktische Strukturen und prosodische Strukturen nicht kongruieren. Die Inkongruenz zeigt sich vor allem in dem wesentlich 'flacheren' Aufbau der prosodischen Strukturen. Nach welchen Regeln die syntaktische Strukturen 'abgeflacht' werden, wird immer noch kontrovers diskutiert (vgl. auch Kap. 3.2.1). Ein wesentlicher Streitpunkt hat sich um die Frage entwickelt, ob prosodische Hierarchien von der Strict Layer Hypothesis (vgl. Selkirk 1984 und Nespor & Vogel 1986: 5ff) gesteuert werden, oder ob, wie in der Syntax, rekursive Strukturen möglich sind (vgl. Ladd 1986, 1992). Im ersten Fall legt die angenommene Anzahl der prosodisch-phonologischen Domänen, das sind in der Regel Silben (σ), Füße (φ), prosodische Wörter (ω), Akzentdomänen (AD) und Intonationsphrasen (EP), auch die maximale Tiefe möglicher Strukturen fest, während Rekursion diese Bindung aufhebt. Da das Thema der Arbeit das Zusammenspiel von grammatischen Regeln und konversationellen Strategien und nicht der Aufbau deutscher Intonationsphrasen ist, werde ich mich im folgenden auf die konzeptuell einfacheren flachen prosodischen Strukturen konzentrieren. Wie sehen also prosodische Strukturen aus? Wenn man davon ausgeht, daß der Satz (42) Veronika hat ihrer Mutter einen Fernseher geschenkt eine Intonationsphrase bildet, so ergeben sich Abweichungen von der Struktur (44) erst auf der nächst unteren prosodischen Ebene, der Ebene der Akzentdomänenbildung. Hier liegt auch der wesentliche Unterschied zu der Struktur (44). Die Bildung von Akzentdomänen erfolgt nämlich nicht mehr über binäre Verzweigungen, sondern es können auch mehr als zwei Akzentdomänen gebildet werden. In der prosodischen Struktur ist die Akzentdomänenbildung mit der Zuteilung von Akzenttönen verbunden. Jeder Akzentton führt zur Bildung einer eigenen Akzentdomäne. Die Zuweisung von Akzenttönen erfolgt über drei Intonationsregeln (I-Regeln):

48 (I-Regel 1) Die in der linearen Reihenfolge letzte stärkste Silbe muß einen AT erhalten. (I-Regel 2) Keine Silbe, die auf die in der linearen Reihenfolge letzte stärkste Silbe folgt, kann einen AT erhalten. (I-Regel 3) Alle anderen Silben können einen AT erhalten, wenn ihre rhythmische Stärke größer als zwei "x" ist. Vermutlich lassen sich die Regeln auf allgemeinere Prinzipien zurückführen. Vor allem die IRegel 2 könnte aus einem Prominenzerhaltungsprinzip folgen, denn perzeptiv scheint die letzte Konstituente in einer Intonationsphrase, der ein Aktzentton zugeweisen wird, unabhängig von der Prominenz ihrer stärksten Silbe im metrischen Gitter als die prominenteste Konstituente der Intonationsphrase wahrgenommen zu werden. Wenn also metrisch schwächeren Silben, die auf die von der Prominenzstruktur ermittelte, letzte stärkste Silbe folgen, weitere Akzenttöne zugewiesen werden, wird die von den P-Regeln als Konstituente mit der metrisch stärksten Silbe nicht mehr als prominenteste Konstituente der Intonationsphrase wahrgenommen. Die Akzenttonzuweisung kann damit zur Umstrukturierung der grammatisch relevanten Prominenzrelationen führen. Daß dieser Effekt nicht eintritt, wird durch die I-Regel 2 sichergestellt, aber nicht erklärt. Ich möchte mich hier jedoch darauf beschränken zu zeigen, daß diese drei Regeln deskriptiv adäquat sind. Wie eingangs gesagt, ist eine Intonationsphrase des Deutschen dann wohlgeformt, wenn sie mindestens einen Akzentton enthält. Enthält der Satz auch nur ein F-Merkmal, dem als phonologisches Korrelat ein Akzentton zugeordnet wird, dann ist, wie in (46), die prosodische Struktur dann wohlgeformt, wenn dieser einzige Akzentton nach der I-Regel 1 der stärksten Silbe zugeteilt wird (akzenttontragende Silben werden im folgenden durch Kapitälchen notiert, die letzte stärkste Silbe wird unterstrichen): (46) Prosodische Struktur [F [iP [AD Veronika hat ihrer Mutter einen FERNseher mitgebracht]]]. Die prosodische Struktur (46) ist zwar wohlgeformt, aber sie ist, wie in Uhmann (1991: 22Iff) gezeigt wurde, nicht die 'natürlichste' Realisierungsvariante des Satzes (42). Die Unterteilung in Akzentdomänen ist - wie gesagt - mehrfach verzweigend, so daß die Intonationsphrase auch in mehrere Akzentdomänen mit entsprechend vielen Akzenttönen unterteilt werden kann. Im Beispiel (42) stehen aufgrund der rhythmischen Struktur insgesamt zwei weitere Silben zur Verfügung, die nach I-Regel 3 und ohne Verletzung von I-Regel 2 einen Akzentton erhalten können:

49 (47) Alternative prosodische Struktur [F tlP [AD VeROnika] [AD hat ihrer Mutter] [AD einen FERNseher mitgebracht]]]. Über die Anzahl der Akzentdomänen, in die eine Intonationsphrase auf der nächst tieferen prosodischen Ebene unterteilt werden kann, entscheiden die Fokus-Hintergrund-Gliederung, die Integrationsbedingungen sowie die P-Regeln.24 Ich möchte abschließend noch einige Beispiele vorstellen, die das Zusammenspiel der IRegeln mit der Fokus-Hintergrund-Gliederung illustrieren. Ich beginne mit der Verletzung der I-Regel 2. Im Gegensatz zu den prosodischen Strukturen in (46) und (47) ist (48) nicht wohlgeformt: (48) *[p [n> [AD VeROnika] [AD hat ihrer Mutter] [AD einen FERNseher] [ ^ MITgebracht]]]. Unzulässig ist, daß die Konstituentenmenge {einen Fernseher, mitgebracht] in zwei Akzentdomänen mit zwei Akzenttönen aufgeteilt wird. Nach der Regel P3 muß die Schwesterkonstituente einen Fernseher prominenter als mitgebracht sein, denn diese Konstituente ist in mitgebracht integriert. Als neutral akzentuierbare Konstituente wird sie die Plus-Schwesterkonstituente und mitgebracht die Minus-Schwesterkonstituente. (Hätte der Satz gelautet Veronika hat ihrer Mutter etwas mitgebracht, wäre die "+/-"-Etikettierung genau umgekehrt.) Erhält nun die Minus-Konstituente auch einen Akzentton, so wird die I-Regel 2 verletzt. Das Resultat der Verletzung ist, daß die vorgegebene Fokus-Hintergrund-Gliederung nicht mehr adäquat wiedergegeben wird, obwohl die relativen Prominenzverhältnisse erhalten bleiben. Bei dieser Akzenttonzuweisung scheint es so zu sein, als ob, wie in (49), ausschließlich das Verb fokussiert sei: (49) QP [AD VeROnika][AD hat ihrer M u t t e r ] e i n e n FERNseher] [F[AD Mitgebracht]]]. Das schon im Zusammenhang mit der Markierung von Intonationsphrasengrenzen vorgestellte Beispiel (40) (Figur I) zeigt, daß die Akzentdomänenbildung und Akzenttonzuweisung nur bis zur Konstituente Fernseher erfolgt, die die letzte stärkste Silbe der rhythmischen Struktur enthält. Man könnte nun vermuten, daß die I-Regeln, besonders die I-Regel 3, nicht adäquat formuliert wurden und daß Akzenttöne nur an die prominentesten Silben der Intonationsphrase zugewiesen werden dürfen:

Aufgrund ihrer Eigenschaft, bei Akzentuierung VERUM-Fokus-Effekte hervorzurufen (vgl. dazu Höhle 1988, 1992), scheinen die finiten Verben bei der Bildung von Akzentdomänen eine besondere Rolle zu spielen. Bei weitem Fokus bilden sie dann keine eigene Akzentdomäne, wenn noch andere Satzglieder zur Verfügung stehen, mit denen sie eine gemeinsame Domäne bilden könnnen.

50 (Figur I) GL 62

(Gab's was Besonderes?)

Hz

300 - 250 " " 200

- -

150 - sek. [hat ihrer Mutter] [ einen Fernseher mitgebracht ]] AT

AT

AT

Daß die Bildung wohlgeformter prosodischer Strukturen aber nicht auf dieser Restriktion basiert, zeigen die nächsten Beispiele, bei denen Akzenttöne auf Hintergrundkonstituenten realisiert werden, obwohl diese durch die P-Regeln eine schwächere Prominenz als die fokussierten Konstituenten erhalten. Bei der Fokussierung des direkten Objekts sind sowohl die prosodische Struktur (50) als auch die prosodische Struktur (51) wohlgeformt: (50) [IP [AD Xenja schenkt ihrer Mutter [ F einen EEEÜseher]]]. (51) [ip [AD XEnja] [AD schenkt ihrer Mutter ]] [ ^ [p einen FERNseherl]]. Die prosodische Struktur (50) ist wohlgeformt, weil der einzige Akzentton nach der I-Regel 1 der letzten stärksten Silbe der Intonationsphrase zugewiesen wird. Die Zuweisung von zusätzlichen Akzenttönen an die prosodisch schwächeren Hintergrundkonstituenten Xenja und Mutter in (51) erlauben die I-Regeln ebenfalls. Denn ohne die ersten beiden I-Regeln zu verletzten, können die Akzenttöne deshalb zugewiesen werden, weil diese Konstituenten eine metrische Prominenz von mehr als zwei "x" haben. Wie die Fo-Kontur (Figur II) des Beispiels (51) zeigt, sind Akzenttöne auf Hintergrundkonstituenten ein systematisches Muster deutscher Intonationsphrasen:

(Figur Π)

GL 35 (Was schenkt Xenja ihrer Mutter?)

Hz

300 250 200 150

Xenja schenktihrerMutterein Fernseher

Bei der Fokussierung des Subjekts ist hingegen nur eine prosodische Struktur wohlgeformt hier darf nur eine Akzentdomäne mit dem Akzentton auf der Silbe Xen- gebildet werden: (52)

[n> [ad [p XENja ] schenkt ihrer Mutter einen Fernseher ]].

Wie die Fo-Kontur (Figur III) von (52) zeigt, sind nach der Fokuskonstituente keine weiteren Akzenttöne zugeteilt worden, denn der Fo-Verlauf ist bis zum intonationsphrasenfinalen Grenzton absolut flach: (Figur ΙΠ) GL 33

(Wer schenkt seiner Mutter einen Fernseher?)

Hz

»Iift

•

1

300 a

250 200

«

ι · ι , ν

150

Xenia schenktihrerMuttereinenFernseher Weitere Akzenttonzuweisungen sind nicht zulässig, weil die erste Silbe der Intonationsphrase zugleich die letzte stärkste Silbe der Intonationsphrase ist. Die Akzenttonzuweisung in (53) verletzt die I-Regel 2:

(53) *[N> [AD [F XENja ]] [AD schenkt ihrer Mutter] [AD einen FERNseher]]. Die mehrfache Akzentdomänenbildung in (53) ist unzulässig, obwohl die Hintergrundkonstituenten Mutter und Fernseher die gleiche metrische Prominenz wie die Hintergrundkonstituenten Xertja und Mutter in Beispiel (52) haben, denn die prosodische Struktur ist wie in (48) wieder inkompatibel mit der vorgegebenen Fokus-Hintergrand-Gliederung. Wird hingegen das indirekte Objekt fokussiert, können wieder wahlweise ein oder zwei Akzenttöne zugeteilt werden: (54) [n> [AD Xenja schenkt [p ihrer MUTterl einen Femseher]]. (55) [IP [AD XENja ] [AD schenkt [F ihrer MUTter ] einen Fernseher ]]. Die Unterteilung in drei Akzentdomänen, bei der auch das direkte Objekt einen Akzentton erhält, ist jedoch auch hier wieder aufgrund der Verletzung von I-Regel 2 unzulässig: (56) *[IP [AD XENja ] [AD schenkt [F ihrer MUTter ] [AD einen FERNseher ]]]. Wieder zeigt die Fo-Kontur (Figur IV), daß die Akzentdomänenunterteilung in (55) gewählt wurde und daß vor allem nach der letzten stärksten Silbe der Intonationsphrase kein Akzentton mehr zugeteilt wird, so daß die Kontur bis zum Ende der Intonationsphrase völlig flach bleibt: (Figur IV) GL 34 (Wem hat Xenja einen Fernseher geschenkt?) Hz

300

--

250 200

150

Xenia

schenktihrer

Mutter einen Fernseher

sek.

Im Rahmen des hier vorgestellten Modells zur internen Strukturierung von Intonationsphrasen ist die Akzenttonzuweisung zwar bestimmten Restriktionen unterworfen, dennoch ist häufig auch eine gewisse Variation zulässig. Diese Variation betrifft nicht die in der Fokus-Hinter-

53 grund-Markierung begründete grammatische Akzenttonplazierung auf der letzten stärksten Silbe der Intonationsphrase, sondern die zusätzliche, von stilistischen Faktoren wie Emphase (vgl. Kap. 3) und Sprechgeschwindgkeit (vgl. Kap. 4) abhängige Akzenttonzuweisung auf ebenfalls metrisch prominenten Silben. Dies ist ein willkommener Begleiteffekt der I-Regeln: Bestimmte Akzentmuster erscheinen bezüglich der Fokusmarkierung als Varianten. Die Akzenttöne, die nicht als phonologische Materialisierung des F-Merkmals fungieren, können andere, ebenfalls grammatische Funktionen25 übernehmen, aber sie können auch für konversationelle Strategien und stilistische Variation eingesetzt werden. Für die intonatorische Realisierung der Mittelfeldentleerungen ist jedoch, wie sich zeigen wird, vor allem die Fokus-Hintergrund-Gliederung von entscheidender Bedeutung. Denn immer wenn Mittelfeldentleerungen eine eigene Intonationsphrase bilden, müssen sie auch mindestens einen Akzentton erhalten. Diese Akzenttonzuweisung darf jedoch nicht inkompatibel mit den für den Aufbau der Prominzrelation verantwortlichen P-Regeln und den für den Aufbau wohlgeformter Intonationsphrasen verantwortlichen I-Regeln sein. Die wichtigen prosodischen Eigenschaften von Mittelfeldentleerungen, die Akzentuierung durch Plazierung von Akzenttönen und die Intonationsphrasengrenzbildung durch Grenztöne, werden aus Gründen der besseren Lesbarkeit jedoch nicht autosegmental, sondern auf rein auditiver Basis konversationsanalytisch transkribiert. Innerhalb der Domäne der Intonationsphrase wird eine dreistufige, relationale Akzentnotation vorgenommen: Primärakzent ('), Sekundärakzent (') und extra starker Akzent ("). Damit eine Silbe mit einem Primärakzent notiert wird, muß sie die prominenteste Silbe innerhalb der Intonationsphrase sein. Diese auditive Prominenz wird im Deutschen - wie oben gezeigt - durch bitonale Akzenttöne (d.h., Fo-Bewegung sowie Dauer und Intensität) realisiert. Wie ebenfalls in diesem Abschnitt gezeigt wurde, weisen Intonationsphrasen regelmäßig mehr als eine prominente Silbe auf. Bei als gleichstark perzipierter Prominenz können also auch mehrere Primärakzente notiert werden. Damit eine Silbe als Sekundärakzent notiert wird, muß sie perzeptiv schwächer als eine primär akzentuierte Silbe, aber stärker als die im Lexikon verzeichnete, wortinterne Prominenz sein. Diese auditive Prominenz wird ebenfalls durch bitonale oder monotonale Akzenttöne (d.h., FoBewegung oder Dauer und Intensität) realisiert, wobei das Zusammenspiel der verschiedenen akustischen Parameter sowie die Abhängigkeit der auditiver Wahrnehmung von der akustischen Realisierung noch nicht völlig geklärt sind (vgl. dazu auch FN 22 Kap. 4). Wieder ist es natürlich möglich, daß eine Intonationsphrase mehr als einen Sekundärakzent erhält. Die dritte Stufe der Akzentuierung, der extra stärkte Akzent, wird dann notiert, wenn eine Silbe mit einer über die Primärakzentuierung hinausgehenden Prominenz realisiert wird. Diese besondere auditive

Zu den grammatischen Funktionen der Akzenttonzuteilung gehört sicher die Topik-Kommentar-Gliederung, vgl. dazu u.a. Molnär (1991) und Vallduvi (1993) und speziell die I-Topikalisierung, vgl. dazu u.a. Büring (1995 MS), Jacobs (1984, 1996b, i.E.) und Krifka (1995).

54 Prominenz wird durch die Ausdehnung des durchschnittlichen Tonumfangs des Sprechers (pitch range) sowie durch Erhöhung von Intensität und Dauer der betroffenen Silbe erzielt (vgl. dazu auch Uhmann 1991: 258ff). Statt der binären Notierung der finalen Grenze (H%, T%) wird die in der Konversationsanalyse übliche, ebenfalls auditive vierstufige Notation26 verwendet, die nur die insgesamt fallenden bzw. die insgesamt steigenden intonationsphrasenfinalen Tonhöhenverläufe (vgl. FN 17) in je zwei Ausprägungen wiedergibt: tief fallend (.), fallend (;), steigend (,) und hoch steigend (?).

2.3.2 Syntaktische Eigenschaften In diesem Abschnitt werden zwar die syntaktischen Merkmale von Mittelfeldentleerungen im Vordergrund stehen, einige Bemerkungen zur prosodischen Realisierung können dennoch nicht unterbleiben. Betrachtet man nämlich die Literatur zu dem hier als Mittelfeldentleerung beschriebenen Phänomen - ich werde im folgenden ausführlicher auf Altmann (1981) und Auer (1991a) eingehen - so spielt bei beiden das Zusammenspiel von intonatorischer Phrasierung und syntaktischer Struktur eine entscheidende Rolle. Altmanns Intonationsphonologie (1981: 183ff) ist allerdings stark syntaxorientiert und terminologisch nicht immer klar, so daß ich zunächst eine 'Übersetzung' im Sinne des gerade in Abschnitt 2.3.1 entwickelten Intonationsmodells vorausschicken möchte. Altmann (1981: 184) betrachtet "Intonation als gleichberechtigtes syntaktisches Mittel", das in die drei grammatisch relevanten Parameter Tonmuster, Pause und Akzent unterteilt werden kann. Nach Altmann (1981: 185) besteht eine Eins-zu-Eins-Beziehung zwischen Satzwertigkeit und Tonmusterselektion, da jeder pragmatisch selbständige, satzwertige Ausdruck eines von drei Tonmustern wählt: fallend, steigend oder progredient. Dabei ist jedoch das progrediente Tonmuster kein Tonmuster im engeren Sinne, da es typischerweise "einen syntaktisch und pragmatischen unselbständigen Ausdruck" (Altmann 1981: 185) kennzeichnet. Auch die Pausenplazierung korreliert auf das Engste mit der Syntax. Nach Altmann (1981: 187) "ergibt sich auf jeder Ebene der syntaktischen Struktur, v.a. aber auf der Satzglied- und Teilsatzebene, eine signifikante Verteilung von Pausen". Solche Pausen werden als "Hauptpausen", "Pausen ersten Ordnung" oder auch "Satzpausen" bezeichnet und trotz der von Altmann auch erwähnten Realisierungsproblematik (vgl. 2.3.1) als definitorisches Kriterium angeführt. Bei der Akzentstruktur unterscheidet Altmann zwischen Stauakzent sowie Wort-, Phrasen- und Satzakzent.

Es ist jedoch noch ungeklärt, ob sich die beiden Notationskonventionen systematisch aufeinander abbilden lassen. Unproblematisch scheint mir nur die Äquivalenz von T% und (.). Bei den beiden unterschiedlich hoch steigenden Verläufen entspricht (?) vermutlich H% und (,) könnte der in dem Grenztoninventar u.U. noch fehlende sog. "progrediente" Tonhöhenverlauf sein. Besonders problematisch ist der mit Semikolon notierte Tonhöhenverlauf.

55 Der für die folgenden Ausführungen zentrale Satzakzent "markiert strukturell einen selbständigen Satz; seine wichtigste Bedeutungsfunktion erfüllt er im Rahmen der Festlegung [...] der Thema-Rhema-Gliederung" (Altmann 1981: 188). Neben dem Satzakzent kann es noch andere "Primärakzente mit völlig anderen Funktionen" geben, so daß innerhalb eines "satzwertigen Ausdrucks mehrere Starkakzente" auftreten können. Die Übersetzung: Die von Altmann angenommene Eins-zu-Eins-Beziehung zwischen Satzwertigkeit und Tonmusterzuweisung entfällt, und die Intonationsphrase tritt als relevante Bezugsgröße an ihre Stelle. Die als Tonmuster bezeichneten Tonhöhenverläufe werden entsprechend der in Abschnitt 2.3.1 eingeführten konversationsanalytischen Notationskonvention in intonationsphrasenfinale Verläufe (vgl. dazu auch FN 26) übersetzt: fallend (.), steigend (?) und progredient (,). Auf der Ebene der Akzentuierung entfallen der sogenannte Stauakzent sowie der Phrasenakzent. Der für Altmann zentrale, mit der Thema-Rhema- bzw. FokusHintergrund-Gliederung 27 korrelierende Satzakzent entspricht einer Akzentposition in der Prominenzstruktur, der durch die P-Regeln ein "+" zugewiesen wurde. Im Rahmen des oben entwickelten Intonationsmodells erhält die lexikalisch prominenteste Silbe dieser Konstituente einen Akzentton bzw. einen Primärakzent ('). Im Abschnitt 2.3.1 wurde jedoch gezeigt, daß wohlgeformte Intonationsphrasen zwar mindestens einen Akzentton aufweisen müssen, daß sie aber durch die P-Regeln oft mehr als eine solche prosodische Hervorhebung enthalten28, diese werden je nach auditiver Prominenz ebenfalls als Primärakzent bzw. Sekundärakzente (') notiert. Der Plazierung der Satzpausen (Hauptpause und Pause erster Ordung scheinen mir Synomyme zu sein) entsprechen solchen Pausen, die zwischen zwei Intonationsphrasen auftreten können, und diese (in Kombination mit dem finalen Grenzton) voneinander abgrenzen. Diese Pausen werden im Anschluß an einen intonationsphrasenfinalen Tonhöhenverlauf entweder durch einen Punkt in runden Klammern (.) oder durch Angabe der Pausenlänge (0.5) notiert. Die von Altmann (1981) entwickelte Strukturtypik von Herausstellungen

nimmt auf

syntaktisch-morphologische, prosodische und semantisch-funktionale Definitionskriterien Bezug. Als Gruppe weisen die Herausstellungsstrukturen folgende Merkmale (vgl. Altmann 1981: 46) auf: Sie sind in der Regel formal-syntaktisch keine vollständigen Sätze, dennoch stellen sie teilweise satzwertige, allerdings stark elliptische Strukturen dar, die nur mit Bezug auf den zugeordneten Satz ergänzt werden können. Sie sind im Fall der Rechtsherausstellungen nie 27

2

Es ist nicht möglich, an dieser Stelle ausführlich auf die auch terminologisch unterschiedlichen Ansätze zur Informationsgliederung einzugehen (vgl. auch FN 54 und SS). Ich gehe davon aus, daB mit Thema-RhemaGliederung bei Altmann, das gemeint ist, was in dieser Arbeit unter Fokus-Hintergrund-Gliederung (vgl. 2.3.1) subsumiert wird. Es gibt jedoch auch Ansätze, die hier unterschiedliche Ebenen der Informationsgliederung annehmen, vgl. dazu u.a. Molnär (1991: 60ff). " Auch Altmanns (1981: 188) Konzeption erlaubt mehrere "Starkakzente", nur der Satzakzent korreliert jedoch mit der Fokus-Hintergrund-Gliederung. Der Ursprung dieser Sichtweise liegt in der problematischen Annahme, daB der einzig grammatisch relevante Akzent der ist, der auf dem Fokusexponenten realsiert wird und damit Fokusprojektion (vgl. FN 19) ermöglicht. Zur Kritik an dieser Konzeption vgl. Uhmann (1991).

56 völlig in den vorausgehenden Bezugssatz integriert, dennoch können sie unterschiedlich stark durch Kongruenz, Intonationsphrasenbildung (vgl. 2.3.1) bzw. durch eine korreferente ProForm mit dem Bezugssatz verbunden sein. Die herausgestellten Konstituenten selbst erfüllen im zugeordneten Satz keine syntaktische Funktion, sie sind kein obligatorischer Bestandteil dieses Satzes, und sie füllen auch nicht allein Stellungsfelder. Am rechten Satzrand unterscheidet Altmann (1981) fünf'herausstellungsverdächtige' Konstruktionstypen, die ich kurz vorstellen und mit einigen Beispielen von Altmann (in adaptierter Notation, s.o.) belegen möchte. Rechtsversetzungen

sind bei Altmann (1981: 54) der zentrale Konstruktionstyp. Sie

zeichnen sich dadurch aus, daß ein satzgliedwertiger Ausdruck (eine NP oder PP) nach Abschluß des Satzes angefügt wird, der bereits eine korreferente Pro-Form im Bezugssatz hat. Der rechtsversetzte Ausdruck und sein korreferentes Bezugselement kongruieren (in Kasus, Numerus, Genus und ggf. auch durch gleiche Präposition). Auf der Ebene der prosodischen Gliederung bilden Bezugssatz und rechtsversetzte Konstituente je eine eigene, durch eine Pause getrennte Intonationsphrase, der Akzent auf dem rechtsversetzten Ausdruck ist schwächer als der vorausgehende Satzakzent, von den drei möglichen intonationsphrasenfinalen Tonhöhenverläufen können alle drei gewählt werden, wobei sich der gewählte Verlauf auf dem Rechtsversetzungsausdruck wiederholt. (57) Und haben sie die be'standen? (.) die Tehre? (58) Wir werden es schon 'schaffen. (.) du und 'ich. Rechtsversetzungen sind trotz eigener Tonmuster keine selbständigen satzwertigen Ausdrücke. Als Funktion nennt Altmann (1981: 55): "Auflösung einer Pronominalisierung, die den Hörer nach Einschätzung des Sprechers überfordert", typisch ist nach Altmann bei Rechtsversetzungen auch der einleitende Zusatz ich meine. Appositionen

können Formen aufweisen, die anderen Herausstellungsstrukturen, wie

Rechtsversetzungen und Nachträgen (s.u.), sehr ähnlich sind. Altmann (1981: 57ff) nennt u.a. appositive Adjektiva und Nominalphrasen sowie Genitivattribute: (59) Die Rede soll sein von Erna und 'Luise, (.) beide (übrigens) 'spitznasig ... (60) Er kaufte sich diesen grünen 'R4, (.) (übrigens) ein französisches Fabrikat. (61) Ich habe ein 'Haus für ganz wenig 'Geld gekauft, (.) (übrigens) das Haus des 'Bürgermeisters. Die appositiven Ausdrücke gelten als selbständige satzwertige Ausdrücke. Auf der morphologisch-syntaktischen Ebene ist die Beziehung der Apposition zum Bezugselement, der Basis, gering (meist keine Kongruenz), und die Basis in Form eines satzgliedwertigen Ausdrucks muß im gleichen Satz enthalten sein. Die Apposition ist durch deutlich ausgeprägte und auch bei schnellem Sprechen nicht verwischte Pausen von der Basis abgetrennt; diese satzinternen

57 Pausen sind aber keine Satzpausen. Das appositive Element erhält einen schwächeren Akzent als die Basis. Die für Appositionen typische Einleitungsfloskel ist übrigens. Bei Extraposition werden satzwertige Konstituenten (Glied- oder Gliedteilsätze) nach rechts ausgelagert, die prosodisch (durch progrediente Intonation und ohne Pause) und bei Gliedteilsätzen auch syntaktisch-morphologisch (durch eine NP, PP oder Pro-Form) eng mit dem Matrixsatz verbunden sind: (62) Sie waren sich ('dessen/der Tatsache) immer bewußt, daß sie ihre 'wirklichen Eltern nicht hatten. (63) Martin hatte ganz fest da'mit gerechnet, daß Becker die Sache vor 'Gericht bringen würde. Der extraponierten Teilsatz, der auch den rhematischen Akzent erhält, kann ein fallendes oder steigendes Tonmuster tragen; das Bezugselement erhält einen Nebenakzent. Extraponierte Konstituenten erlauben keine Einleitungsfloskeln. Ausklammerungen zählt Altmann nicht zu den Herausstellungen im engeren Sinn, sondern sie sind ein Fall von Nachfeldbesetzung. Ausklammert werden nicht-satzwertige Satzglieder, die aber keine Pro-Formen oder andere Bezugselemente im Satz haben. Ausklammerte Konstituenten können weder eine eigene Intonationsphrase bilden noch durch eine Pause vom Rest des Satzes abgetrennt werden. (64) Morgen soll ich meinen 'Dienst antreten in diesem Haus. (65) Die Klärung der Frage ist zu verbinden mit der Erläuterung des 'Charakters der Epoche. Altmann (1981: 67) weist darauf hin, daß die Nachfeldbesetzung sehr variablen und auch regional unterschiedlichen Regeln unterliegt. Im Standarddeutschen können thematische fakultative Satzglieder (freie adverbiale Angaben) oder rhematische obligatorische Satzglieder (hier allerdings nur Präpositionalobjekte) ausgeklammert werden. Nur letztere erhalten einen Satzakzent. Ausklammerungen werden nicht durch die für Herausstellungen typischen Floskeln eingeleitet. Nachträge sind durch Tilgung enstandene, elliptische satzwertige Ausdrücke, die innerhalb des vorausgehenden Satzes keine syntaktische Funktion erfüllen und daher zu den Herausstellungsstrukturen gerechnet werden können. Nachgetragen werden in der Regel fakultative Satzglieder wie das attributive Adjektiv in (66) oder das Adjektivadverbial in (67): (66) Ich habe mir ein Rennrad gekauft. (.) (und zwar) ein superleichtes. (67) Er fuhr die Straße hinunter. (.) viel zu schnell. "Mit einem merkwürdigen Bruch der Konstruktion (durch Wahl einer anderen Verblesart) sind auch obligatorische syntaktische Funktionen in dieser Konstruktion möglich" (Altmann 1981: 70f) wie in (68) und (69):

58 (68) Der ist schon wieder befördert worden. (.) zum kommandierenden General. (69) Und Christi ist fertig. (.) mit den Nerven. Nur wenn Attribute im Nachtrag stehen, kann man von einer Spezifizierungsrelation zwischen einem Bezugselement und Nachtrag sprechen. Sowohl Nachtrag als auch vorausgehender Satz erhalten einen rhematischen Akzent. Nachträge sind außerdem durch eine Pause vom vorausgehenden Satz getrennt, dieser kann eine steigende oder fallende Intonationsphrasengrenze haben, die in der Regel im Nachtrag wiederholt wird; die Kombination steigend-fallend ist auch möglich - vor allem in Kombination mit der für Nachträge typischen Floskel und zwar. Ich fasse zusammen: Altmanns Klassifikation enthält eine syntaktisch satzwertige Herausstellungsstruktur, die Extraposition, aber sowohl Nachträge als auch Appositionen gelten hauptsächlich aufgrund syntaxabhängiger prosodischer Eigenschaften ebenfalls als satzwertig. Nicht-satzwertig sind also nur Rechtsversetzungen und Ausklammerungen, wobei letztere aber keine Herausstellungsstruktur im engeren Sinne, sondern ein Fall von Nachfeldbesetzung sind. Rechtsversetzungen und extraponierte Gliedteilsätze haben korreferente ProFormen im Bezugssatz, aber auch Appositionen und attributive Nachträge stehen in einer Spezifizierungsrelation zu einem Bezugselement. Prosodisch unselbständig sind nur die Ausklammerungen. Alle anderen nach rechts versetzten Konstituenten bilden eine eigene durch eine deutliche Pause eingeleitete Intonationsphrase mit einem mehr oder weniger unabhängig von dem Vorgängersatz gewählten Tonmuster. In kritischer Abgrenzung zu Altmann hat Auer (1991a: 144f) eine Typologie der Rechtsexpansionen

(RE) entwickelt, die von einer weitgehenden, aber nicht vollständigen

Unabhängigkeit der beiden Klassifikationsebenen Syntax und Intonation ausgeht. Im Unterschied zu Altmann - aber auch zu der im folgenden vorzustellenden Analyse - ist die Intonationsphrasenbildung bei Auer (1991a: 146) ein skalares Konzept: Eine prosodisch eindeutig integrierte RE bildet mit der Vorgängerstruktur zusammen eine Intonationsphrase, sie trägt keinen Akzent(ton), und sie nicht durch eine Phrasierungsgrenze (intonationsphrasenfinaler Grenzton mit fakultativer Pause) von der Vorgängeräußerung abgetrennt. Eine prosodisch eindeutig nicht-integrierte RE bildet hingegen eine eigene Intonationsphrase, sie trägt (mindestens) einen Akzent(ton) und ist darüberhinaus durch eine deutlich perzipierbare Phrasierungsgrenze (intonationsphrasenfinaler Grenzton mit fakultativer Pause) von der Vorgängeräußerung abgetrennt. Auf der syntaktischen Ebene unterscheidet Auer regressive und progessive Rechtsexpansionen. Eine regressive RE modifiziert die Vorgängerstruktur, eine progessive führt sie weiter. Eine syntagmatische Beziehung liegt dann vor, wenn die RE in die Vorgängerstruktur eingesetzt werden kann, während bei einer paradigmatischen Beziehung die RE ein Element in

59 der Vorgängerstruktur ersetzt. Die regressiven REs 29 sind morphologisch-syntaktisch eng mit dem Vorgängersyntagma verbunden: Paradigmatische regressive REs kongruieren mit dem Element, das sie ersetzen; syntagmatische regressive REs bleiben in dem von dem jeweiligen Verb eröffneten Valenzrahmen. Auers Systematik ist auf syntaktisch nicht-satzwertige Expansionstypen beschränkt: (70) Nicht-satzwertige Rechtsexpansionen (Auer 1991a: 144f) RE

S Y Ν Τ A Χ Proform

Ρ R Ο S ο D I Ε

integriert

*

nicht integriert

Ausklammerung

Rechtsversetzung

Nachtrag

Rechtsversetzung

sonst

parenthetisch

konjunktional

sonstige

Konjunkt

Reparatur

Apposition

Konjunkt

FortSetzung

Wie die Übersicht zeigt, unterscheidet Auer (1991a) in der Gruppe der hier besonders interessierenden regressiven REs fünf verschiedene Typen. Seine Ausklammerungen und Nachträge unterscheiden sich von Altmann Typologie jedoch dadurch, daß bei ihrer Klassifikation nur auf die prosodische Realisierung Bezug genommen wird. Ebenfalls unter Rekurs auf die Intonationsphrasenbildung nimmt Auer zwei Typen von Rechtsversetzungen an: prosodisch selbstständige wie Altmann (19981), aber auch prosodisch integrierte, bei denen die Pro-Form und der rechtsversetzte Ausdruck eine gemeinsame Intonationsphrase bilden. Für diese vier Typen gibt es jedoch auch Realisierungsvarianten, bei denen nicht ganz klar ist, ob die REs prosodisch selbständig oder aber integriert sind. Das kommt nach Auer deshalb vor, weil Intonationsphrasengrenzen unterschiedlich stark und - wie in Kap. 2.3.1 ausgeführt - mit mehreren prosodischen Mitteln (z.B. Pausen, verschiedene On- und Offsetwerte) markiert werden können. Nur der fünfte Typ, die Reparatur, ist lediglich als prosodisch selbständiger Typ vorhanden.

Die progressiven REs spielen für die Analyse dieses Kapitels keine Rolle.

60 2.3.3

Fonntypen der Mittelfeldentleerung

Worin unterscheidet sich nun die von mir intendierte Klassifizierung von den vorgestellten Arbeiten von Altmann (1981) und Auer (1991a)? Der Terminus Mittelfeldentleerung30 soll alle Realisierungen von an der Oberfläche nicht-satzwertigen, mittelfeldfähigen Satzgliedern erfassen, die erst im Anschluß an die rechte Satzklammer produziert werden. Im Gegensatz zu Altmann (1981), aber auch zu Auer (1991a), gehe ich von vollständigen Unabhängigkeit der Intonation von der Syntax in diesem Datenbereich aus. Dies darf jedoch auf keinen Fall so verstanden werden, daß hier für eine Autonomie der Prosodie im Sinne eines von der Grammatik unabhängen Signalisierungssystems (im Sinne von Bolinger, vgl. Kap. 1, FN 40) plädiert werden soll, das unabhängig von sprachspezifischen grammatischen Beschränkungen ikonisch und universal primär emotionale Zustände und Einstellungen von Sprechern widerspiegelt. Intonation und insbesondere Intonationsphrasenbildung und die Akzentplazierung sind vielmehr essentieller Teil der Grammatik (vgl. die in 2.3.1 entwickelten P- und I-Regeln), ohne daß syntaktische und prosodische Strukturen in Eins-zu-Eins-Relation kongruieren. Diese Unabhängigkeit von Syntax und Intonation in der Grammatik - so die hier vertretene These spiegelt sich auch in vollem Umfang bei den Formen der Mittelfeldentleerung wider. Außerdem gehe ich davon aus, daß es auch im Bereich der Wahrnehmung von Intonationsphrasengrenzen kategoriale Kontraste gibt und daß daher die binäre Einteilung in prosodisch selbständige (2 Intonationsphrasen) und prosodisch integrierte (1 Intonationsphrase) Mittelfeldentleerungen der skalaren Auffassung von Auer (1991a) vorzuziehen ist. Auf der syntaktischen Ebene ist also die potentielle Einklammerbarkeit einer nicht satzwertigen Konstiuente das wichtigste Kriterium sowie für eine weitere Differenzierung, ob das nach der rechten Satzklammer realisierte Satzglied im Mittelfeld ein Bezugselement in gleicher syntaktischer und semantischer Funktion hat. Ist ein solches Bezugselement vorhanden, bezeichne ich das Verhältnis zwischen diesem und dem nach der rechten Satzklammer realisierten Satzglied je nach syntaktischer und semantischer Beziehung als potentielle syntaktische Substitution bzw. Spezifizierung oder Modifikation. Auf der prosodischen Ebene ist das wichtigste Kriterium, ob die Mittelfeldentleerung eine eigene Intonationsphrase bildet oder nicht. Welche Formen der Entleerung des Mittelfeldes durch Realisierung von nicht-satzwertigen, mittelfeldfähigen Satzgliedern im Anschluß an die rechte Satzklammer wurden von den Konversationsteilnehmern in dem untersuchten Korpus verwendet? Bei der oben erläuterten Annahme Die naheliegende Bezeichnung "Ausklammerung" wird nicht gewählt, weil sie einen ganz bestimmten Typ von Mittelfeldentleerung in Altmanns Klassifikation darstellt. Auch die Verweise auf die Positionierung am "rechten" Satzrand (Rechtsherausstellung, Rechtsversetzung etc.) sind nicht unproblematisch, da die im Anschluß an die Satzklammer produzierten Konstituenten nicht rechts von ihrem Bezugssyntagma, sondern unter Berücksichtigung der Zeitlichkeit von (gesprochener) Sprache nach diesem produziert werden. Ähnlich kritisch äußert sich auch Auer (1991a: 139f), der dann inkonsistenteweise aber doch die Bezeichnung "Rechtsexpansion" einfuhrt. Zur Terminologieproblematik vgl. auch Zahn (1991: 96ff).

61 einer vollständigen Unabhängigkeit von Syntax und Intonation ergeben sich (vorläufig) acht Formtypen (Eine endgültigen Formtypik kann erst nach der Analyse der Funktionen erstellt werden vgl. dazu Abschnitt 2.5.): (71) Formen der Mittelfeldentleerung (vorläufig) INTONATION

SYNTAX / . .. / r _. [+ Bezugselement] < potentielle Substitution \ [+Bezugselement] Modifikation

^ ^ >· andere Konstituenten \

1 Intonationsphrase 2 Intonationsphrasen 1 Intonationsphrase 2 Intonationsphrasen

ΠΙ IV

1 Intonationsphrase , 2 Intonationsphrasen

ν VI

,, 1 Intonationsphrase \ 2 Intonationsphrasen

νπ

Pronomina / Pro-Formen

Nominalphrasen r

f- Bezugselement]

TYP I π

vm

Diese acht Formtypen möchte ich nun anhand von Beispielen aus dem ausgewerteten Korpus, das insgesamt 72 Fälle von Mittelfeldentleerungenthält, vorstellen. Ich nehme in den folgenden Beschreibungen auf die Terminologie von Altmann und Auer nur am Rande Bezug, da nicht alle Typen eingeführte Bezeichnungen haben. Typ I: Satzglieder mit einem pronominalen Bezugselement im Mittelfeld können prosodisch unselbständig sein und als Teil der Intonationsphrase des Mittelfeldes realisiert werden. In den Beispielen (72) und (73) wird das im Anschluß an die rechte Satzklammer realisierte Satzglied zwar schwach akzentuiert, aber es gibt keinen intervenierenden Grenzton und auch keine Pause, die das Ende der ersten Intonationsphrase prosodisch festlegen: (72) China 15 -> Ol T: mal'sehn was das er'gibt das Ge'spräch. (73) China 40 -> Ol T: "und die Tiasti kennt die 'auch°= "die 'Rodi°°. Typ II: Satzglieder mit einem pronominalen Bezugselement im Mittelfeld werden aber auch als eigenständige Intonationsphrasen mit eigenem Akzent und einem intervenierenden Grenzton realisiert werden31:

Nach Altmanns Terminologie handelt es sich um Rechtsversetzungen.

62 (74) China 5 Ol Τ: und 'da hat se das 'auch noch mal er'wähnt,= -> 02 =so die Diskrepanz zwischen 'Gre:ts Vortrag und 'Moelimanns. (75) China 29 Ol T: ich hab 'hier gewohnt; -> 02 in Tort 'Dixon. Wie die Beispiele (76) bis (79) zeigen, können auch andere Bezugselemente als Pro-Formen zu der Konstituente außerhalb der Satzklammer im Verhältnis potentieller syntaktischer Substitution stehen. Und auch hier zeigt sich die prinzipielle Unabhängigkeit von Prosodie und Syntax. Typ III: Das Bezugselement und die Konstituente mit gleicher syntaktischer und semantischer Funktion werden in einer Intonationsphrase realisiert: (76) China 39 -> Ol T: Ich 'schreib da vorher: (0.9) der 'Frau: der- der 'Rodi (0.5) Typ IV: Das Bezugselement und die Konstituente mit gleicher syntaktischer und semantischer Funktion werden in zwei Intonationsphrasen realisiert32 (dieser Konstruktionstyp ist häufiger als der Typ ΠΙ): (77) China 26 01 T: ich hab son 'ganz 'tolles 'dickes 'Buch über 'Malaysias -> 02 =son 'Bilderbuch. (78) China 29 01 T: ähm da=s gibts "wahnsinning 'tolle 'Strände; (1.5) -> 02 also=richtige 'Bilderbuch'Strände. (79) China 38 01 T: und die 'liegen dann meistens 'toll; -> 02 'mitten in der 'Stadt. Mittelfeldentleerungen mit einem Bezugselement im Mittelfeld und damit potentielle syntaktische Substitutionen in einem weiten Sinne finden sich in dem untersuchten Korpus in 15 Fällen. 33

51

33

Dem Vorschlag von Auer (1991a: 150), diese regressiven paradigmatischen REs als "Reparaturen" zu bezeichnen, möchte ich nicht folgen, da mit dieser Bezeichnung nichtkongruierende Form- und Funktionstypen fusioniert werden. Vgl. dazu Abscnitt 2.4.3. Hier wurden auch 7 Fälle mitberechnet, in denen das koreferente Bezugselement durch einen Infinitivsatz realisiert wurde. (Vielleicht sollt ich das (.) Richards Schwester ja dann doch auch mal empfehlen; nach Petersburg zu gehen).

63 Typ V: Ein Bezugselement, zumindest in einem gewissen Sinn, findet sich auch in dem Beispiel (80), in dem ein attributives Adjektiv als eigene NP außerhalb der Satzklammer realisiert wird. Die semantische Beziehung zwischen dem Bezugselement und seinem Attribut ist jedoch nicht durch potentielle Substitution, sondern durch Spezifizierung bzw. Modifikation gekennzeichnet: (80) China 51 01 T: es wurde in den letzten Jahren schlimmer; -> 02 also durch die Islami'sierung die 'starke; Das Beispiel (80) 34 ist jedoch das einzige in dem untersuchen Korpus. Typ VI: Ein Beispiel, in dem eine solche Konstruktion in zwei Intonationsphrasen realisiert wird, findet sich in dem untersuchten Korpus nicht, kann aber in Anlehung an Beispiel (80) konstruiert werden: (80') ->

Es wurde in den letzten Jahren schlimmer; also durch die Islami'sierung; (.) die 'starke.

Meiner Meinung nach ist auch in diesem Fall eine Realisierung in einer eigenen Intonationsphrase ohne Akzeptabilitätsverlust möglich. Die meisten Fälle von Mittelfeldentleerungen im untersuchten Korpus sind jedoch solche Konstruktionen, in denen potentielle Satzglieder des Mittelfeldes außerhalb der Satzklammer realisiert werden, ohne daß im Mittelfeld ein Bezugselement im beschriebenen Sinne zu finden ist. Konstruktionen dieser Art wurden in 56 Redezügen gewählt. Auch hier haben Sprecher wieder die Möglichkeit, diese Satzglieder in die Intonationsphrase des Mittelfeldes aufzunehmen oder die Satzglieder außerhalb der Satzklammer als eigene Intonationsphrase zu realisieren. Typ VII: Keine eigene Intonationsphrase für die Satzglieder außerhalb des Mittelfeldes35 wählen die Konversationsteilnehmer in 29 Redezügen. Einige Beispiele: (81) Hundertfünfzig 1 -> 01 X: Hast du'angerufen da?

34

Eine Komplikation ergibt sich im Beispiel (80) dadurch, daß wahrscheinlich schon die Bezugskonstituente durch die Islamisierung außerhalb der Satzklammer realisiert wird. Nach Altmanns Klassifizierung handelt es sich um Ausklammerungen. Obwohl die nur für Nachträge (vgl. FN 36) typische Floskel und zwar ausgeschlossen sein sollte, scheint sie mir zumindest in den Beispielen (82), (83) und (89) möglich zu sein. Die Beispiele (86) bis (88) weisen zwar an der Oberfläche keine rechte Satzklammer auf, sondern nur die Spur des finiten Verbs (vgl. Bsp. 2 in Abschnitt 2.1 und FN 37). Auch diese Konstiuten lassen sich aber einklammern (der is jetzt mim Examen fertig geworden; bis Cota Baro werdens mim Bus so sechs acht Stunden sein; ich bin mit den Nerven vollkommen fertig).

64 (82) China 46 -> Ol Τ: und dann ist sie ge'schieden ohne 'Anspruch; (83) Legag 21 -> Ol U: der 'zieht jetz aus im Oktober (84) China 6 -> Ol I: Und=es war zuwenig'festgemacht an TextT>ei'spielen. (85) China 31 Ol T: als die 'aus (0.6) äh 'fuhren nach Malaysia; (86) Hundertfünfzig 12 -> Ol X : der is jetz'fertig mim'Examen; (87) China 34 Ol T: ehe=ansonsten von Kualla'lumpur bis (.) Cota 'Baro sinds=so (0.1) -> 02 's:echs acht 'Stunden °mim Uus°; (88) Hundertfilnfzig 4 -> Ol X : aber (0.8) ich bin 'vollkommen 'fertig mit den 'Nerven; (89) Legag 21 -> Ol X : du weißt 'auch 'niemanden der mit mir 'wohnen möchte=noch vier Monate; (90) Legag 2 Ol X : -> 02

'weißt du:=hat er vielleicht er'zählt daß er den Trelitz gesehn hat in der Zwischenzeit?

(91) Hundertfiinfzig 21 -> Ol X : nein nein ich meine ob er (.) 'griffbereit für dich is im 'weitesten 'Sinne; (92) Legag 3 ->

Ol X :

wenn er mit dem Trelitz gesprochen hat über meine Priifunkh,

(93) China 22 Ol T: in 'Malaysia is des so, -> 02 daß die 'Inder rüberkamen als "Gastarbeiter praktisch, (94) China 3 -> Ol T:

als 'die sie auf den 'Vortrag 'angesprochen hat "während der Tagung 0 .

65 (95) China 51 01 Τ: man schickt dann die zweite Frau äh=die=erste=Frau meistens weg, 02 in irgendnen (0.3) en 'Haus in der Um'gebung= -> 03 T: =das man da 'kauft für die 'Frau und für die 'Kinder (96) China 9 -> Ol T: -> 02

Ich 'muß übrigens heut noch zum 'Köhlersen "um 'drei\= =weils 'Schwierigkeiten gibt mit dem 'PeTcing'auf 'ent Tialt.

Typ VIII: Fast ebenso häufig (27 mal) werden zwei Intonationsphrasen36 produziert. Es gibt einen intervenierenden Grenzton und mindestens einen Akzent für die Konstituente außerhalb des Mittelfeldes: (97) China 33 -> 01 T: während die Ostküste noch relativ 'unberührt is; (0.2) 02 'da'von. (98) China 21 01 I: "weil 'er (.) sich er'dreistet hatte, 02 eine 'Chi'ne'sin 'zum "Tee einzuladen; -> 03 'nachmittags (99) China 31 01 I: Wie 'weit is des ent'fernt? (.) -> 02 von Port 'Dixon? (100) China 20 01 I: da 'wurden 'Weiße nach 'vorne geschoben, -> 02 und- und zwar 'vor 'ein 'Schwarzen; (101) China 21 01 I: Der 'eine (0.5) war ma ver'droschen worden, -> 02 vonner 'ganzen (0.3) 'Horde chinesischer Kommili'ton; (102) China 50 01 T: man schickt dann die 'zweite Frau äh=die='erste=Frau meistens 'weg, -> 02 in 'irgendnen (0.3) en 'Haus in der Um'gebung (103) China 11 01 T: un=da hab ich das ge'bucht, (0.4) -> 02 mit 'vier Tage 'Aufenthalt in 'Peking,

36

In Altmanns Terminologie handelt es sich um Nachträge, Beispiel (100) ist das einzige, das die für seine Nachträge typische Floskel und zwar aufweist. Diese Floskel kann jedoch nicht alle Nachträge (vgl. z.B. 97) einleiten.

66 (104) China 13 01 I: 'dann würd ich versuchen:, (0.6) -> 02 ähm über die A'dresse von der 'He:dwig zum Beispiel 03 versuchen bei irgendwelchen Leuten zu (0.4) zu übernachten, Dieses Muster kann auch wiederholt angewendet werden: (105) China 7 01 T: die muß:te (.) ja nach 'Freiburg; 02 (0.7) -> 03 'hh zum 'Kultusministeriums -> 04 =°wegen der Sla'vistik.' Kombinationen von prosodischem Anschluß und prosodischer Selbständigkeit zeigen die folgenden Beispiele: (106) Hunderfünfzig 7 -> 01 X: ihr habt (.) äh: en 'Seminar gehabt zu 'van de Velde,= -> 02 ='nur zu 'van de Velde? In Beispiel (106) haben die beiden nach der Satzklammer produzierten Satzglieder die gleiche syntaktische und semantische Funktion und fast dieselbe Bedeutung. Die Beispiele (107) und (108) zeigen, daß prosodisch selbständige Intonationsphrasen auch von einem anderen Sprecher produziert werden können. (107) Legag 22 01 X: -> 02 03 -> 04 S:

da werd ich nämlich im Oktober dann noch jemanden 'suchen müssen=ganz schnell, (1.0) 'uu (.) für 'vier Monate;

(108) China 12 -> 01 I: das Tcannse dir=auch 'selber 'anle I sen vorher. I -> Τ: I mit nem I 'Stadtführer oder so.

Bei diesem Formenreichtum stellt sich natürlich die Frage nach den Funktionen von Mittelfeldentleerungen und nach der Interaktion von Syntax und Konversationsorganisation. So wie die Daten aus natürlichen Konversationen bisher (abgesehen von 107 und 108) vorgestellt und analysiert wurden, hätten es sich auch um konstruierte Beispiele aus schriftlichen Texten mit rekonstruierter Intonation handeln können, denn ihre aus den Besonderheiten der sprachlichen Interaktion resultierenden Eigenschaften, ihre sequentielle Einbettung in den Dialog, die Zeitlichkeit ihrer Produktion und ihr prozessualer Charakter blieben bisher weit-

67 gehend unberücksichtigt. Im Zentrum standen vielmehr die Formaspekte von Mittelfeldentleerungen in natürlichen Konversationen. Es muß aber an dieser Stelle betont werden, daß in den von mir analysierten natürlichen Konversationen keine 'ungrammatischen' Mittelfeldentleerungen produziert wurden - jedenfalls nicht wenn man wie z.B. Engel (1988: 316) sowohl die Ausklammerung obligatorischer Präpositionalargumente wie in (84) als auch die von unbetonten Lokalangaben wie in (81) für grammatisch zulässig hält.37 Damit lassen sich aus diesem Datenbereich keine Argumente für die in Kapitel 1 zur Diskussion gestellte THESE 2 ableiten. Eine "syntax-for-conversation" scheint nicht notwendig zu sein, da auch die in der Konversation situierten Ausdrücke innerhalb der grammatischen Norm bleiben und somit THESE 1 bestätigen. Wenn dies tatsächlich der Fall ist, so erhebt sich natürlich die Frage, warum Linguisten konversationeile Daten überhaupt in die Analyse miteinbeziehen sollten. Ich glaube, daß sich auch bei der Analyse dieses Datenmaterials wieder gezeigt hat, daß sich intonatorische Eigenschaften von Äußerungen wesentlich schlechter als z.B. syntaktische introspektiv erfassen lassen. Der Formenreichtum in diesem Bereich bliebe ohne die Analyse von natürlich-sprachlichen Daten unentdeckt. Doch auch hier bleiben die beobachteten Formen innerhalb der grammatischen Norm - also auch hier keine Evidenz für eine "phonology-forconversation". Darüberhinaus muß jedoch festgehalten werden, daß zwar eine weitgehende Parallelität zwischen konstruierten Beispielsätzen und im Dialogen situierten Äußerungen in bezug auf ihre Form bestehen mag, daß diese jeoch nich auch in bezug auf die Funktion von Mittelfeldentleerungen vorliegen muß. Funktionale Aspekte wurden zwar schon angedeutet, aber noch nicht systematisch untersucht.

2.4 Funktionale Aspekte der konversationeilen Mittelfeldentleerung

2.4.1 Effizienteres Parsen Eine verbreitete Auffassungen ist, daß bei der Funktion der Mittelfeldentleerungen das Gewicht von entscheidender Bedeutung ist: "Bestimmte Teile des Satzes können ausgeklammert, d.h. ins nachfeld gestellt werden. Grammatisch notwendig ist das nie, doch können stilistische Gründe eine Ausklammerung nahelegen. Dabei spielt die Länge des Elements eine Rolle - so Auer (1991a: 147, FN 6) spricht in diesem Zusammenhang von schriftsprachlicher Unakzeptabilitat. Doch auch hiergegen ließen sich leicht Belege anführen. Den größten Formenreichtum stellt Zahn (1991: 88ff) in seiner auf umfangreichem Material (insgesamt 1384 Ausklammerungsfälle) aus dem Freiburger Korpus basierenden Untersuchung vor. Leider ist diese Arbeit vor allem eine quantitative Analyse, so daß sie zwar auf interessante Verteilungen hinweist, aber nur wenige, aus dem sequentiellen Kontext losgelöste Beispile präsentiert.

68 werden umfangreiche Satzglieder [...] häufig ausgeklammert. [...] Wenn ein Satzglied besonders umfangreich ist, kann es ins Nachfeld gestellt werden. Dadurch wird verhindert, daß der zweite Klammerteil 'nachklappt"' (Duden 1995: 790). Diese stilistisch-funktionale Erklärung für die Mittelfeldentleerung erinnert nun nicht nur an Behaghels (1932: 3f) Gesetz der "wachsenden Glieder", sondern auch an das in Abschnitt 2.1.2 ausführlich vorgestellte Modell von Hawkins, dessen EIC-Prinzip auch für die funktionale Analyse von Mittelfeldentleerungen einschlägig ist, denn in diesem Datenbereich sollte ja (s.o.) das syntaktische Gewicht der Konstituente, die erst im Anschluß an die rechte Satzklammer produziert wird, von entscheidender Bedeutung sein. Die Beispiele aus natürlichen Konversationen legen jedoch bei einer ersten Betrachtung die Vermutung nahe, daß Hawkins' (1990, 1992) Hypothese, die syntaktische Komplexität sei der entscheidende Faktor für die lineare Anordnung der Stellungsglieder, für diese Daten nicht einschlägig ist. Es werden nämlich Konstituenten von höchst unterschiedlicher Komplexität aus dem Mittelfeld entfernt. Dem Mittelfeld entzogen werden Konstituenten, die nur aus einem einzigen Wort bestehen (vgl. 81, 97 und 98), aber auch Konstituenten mit 6 (vgl. 102) und 8 Wörtern (vgl. 104). Allerdings - und das ist der entscheidende erste Einwand - bilden relativ wenig umfangreiche 2- und 3-gliedrige Konstituenten den Hauptanteil bei den außerhalb des Mittelfelds realisierten Konstituenten. Wenn man Hawkins' Algorithmus38 nun auf einige dieser Fälle anwendet, so zeigt sich, daß die Entfernung syntaktisch wenig komplexer Konstituenten aus dem Mittelfeld zu einer Verschlechterung der ElC-Werte führen kann: (98) China 21 01 I: "weil 'er (.) sich er'dreistet hatte, 02 eine 'Chi'ne'sin 'zum "Tee einzuladen; -> 03 'nachmittags (98') (a) [ § eine Chinesin 1/1 1/2 100% 50% (b) [ s eine Chinesin 1/1 1/2 100% 50%

zum Tee einzuladen nachmittags] 2/3 2/4 3/5 4/6 66% 50% 60% 66% = 65% nachmittags zum Tee einzuladen] 2/3 3/4 3/5 4/6 66% 75% 60% 66% =69%

Um die Beispiele überhaupt im Sinne von Hawkins analysieren zu können, muß ich die folgenden beiden Annahmen machen: Der Mother Node für die VP im Deutschen wird über die Grundstrukturposition des Finitums bzw. das erste Element des Verbalkomplexes konstruiert. Für den Algorithmus wird die Spur des finiten Verbs nur dann mitgezählt, wenn sie der Mother Node für die Konstruktion der VP ist. Darüberhinaus wird eine flache VP-Struktur angenommen. Besonders diese zweite Annahme ist problematisch. Für die bessere Lesbarkeit wird auch ein konversationsanalytisches Sakrileg begangen, indem durch den Verzicht auf Pausen, Akzente, Abbrüche etc. leichte 'Bereinigungen' der Daten vorgenommen werden.

69 (87) China 34 ->

Ol Τ: 02

ehe=ansonsten von Kualla'lumpur bis (.) Cota 'Baro sinds=so (0.1) 's:echs acht 'Stunden °mim Uus°;

(87') (a) ehe=ansonsten von Kualalumpur bis Cota Baro sind es [yp so sechs acht Stunden e mim Bus ] 1/1 1/2 1/3 1/4 2/5 3/6 100% 50% 33% 25% 40% 50% = 49% (b) ehe=ansonsten von Kualalumpur bis Cota Baro sind es [yp mim Bus so sechs acht Stunden e ] 1/1 1/2 2/3 2/4 100% 50% 66% 50% = 66%

Wenn jedoch Konstituenten entfernt werden, die aus mehr als einem Wort bestehen und deren erstes Wort die Konstruktion des Mutterknotens erlaubt, werden bessere EIC-Werte erzielt: (92) Legag 3 ->

01 X:

wenn er mit dem Trelitz gesprochen hat über meine Priifunkh,

(92') (a) wenn er [yp mit dem Trelitz 1/1 1/2 1/3 100% 50% 33% (b) wenn er [yp mit dem Trelitz 1/1 1/2 1/3 100% 50% 33%

gesprochen hat über meine Prüfung ] 2/4 2/5 3/6 50% 40% 50% = 53% über meine Prüfung gesprochen hat ] 2/4 2/5 2/6 3/7 50% 40% 33% 42% = 49%

Eine wesentliche Optimierung wird dann erzielt, wenn durch die Entleerung des Mittelfeldes dort nur Konstituenten mit geringer syntaktischer Komplexität realisiert werden: (84) China 6 ->

01 I:

Und=es war zuwenig 'festgemacht an 'TextT)ei'spielen.

(84') (a) Und es war [yp zuwenig festgemacht e an Textbeispielen ] 1/1 2/2 3/3 100% 100% 100% = 100% (b) Und es war [yp zuwenig an Textbeispielen festgemacht e ] 1/1 2/2 2/3 3/4 100% 100% 66% 75% = 85% (103) China 11 ->

01 T: 02

un=da hab ich das gebucht, (0.4) mit 'vier Tage 'Aufenthalt in 'Peking,

70 (103') (a) un=da hab ich [ V p das gebucht emit vier Tage Aufenthalt in Peking] 1/1 2/2 3/3 100% 100% 100% = 100% (b) un=da hab ich [yp das mit vier Tage Aufenthalt in Peking gebucht e ] 1/1 2/2 2/3 2/4 2/5 2/6 2/7 3/8 100% 100% 66% 50% 40% 33% 28% 37% = 56% Das untersuchte Korpus enthält jedoch immerhin 39 Redezüge, bei denen die Sprecher auf die Mittelfeldentleerung verzichtet haben, obwohl auch hier teilweise dramatisch bessere EIC-Werte hätten erzielt werden können. Von den 38 Fällen mit mehr als zwei nicht pronominalen Stellungsgliedern im Mittelfeld wird immerhin in 22 Redezügen auf eine mögliche Mittelfeldentleerung verzichtet: (28) ->

Legag 6 Ol S: 02

=ja. also:: (...)=der hat schon 'drei verschiedene 'Bögen bei 'alln möglichen 'Leuten bestellt=

(28') (a) der hat [yp schon drei verschiedene Bögen bei allen möglichen Leuten bestellt] 1/1 2/2 2/3 2/4 3/5 3/6 3/7 3/8 4/9 100% 100% 66% 50% 60% 50% 42% 37% 44% = 61% (b) der hat [yp schon drei verschiedene Bögen bestellt bei allen möglichen Leuten] 1/1 2/2 2/3 2/4 3/5 4/6 100% 100% 66% 50% 60% 66% =74% (109) China 14 Ol I: also der wollte bis zum: E'xamen (0.57) in 'China T)leiben, (109') (a)

der wollte [yp bis zum Examen in China bleiben ] 1/1 1/2 1/3 2/4 2/5 3/6 100% 50% 33% 50% 40% 50%= 53%

(b) der wollte [yp in China bleiben bis zum Examen ] 1/1 1/2 2/3 3/4 100% 50% 66% 75% = 72% Verzicht auf Mittelfeldentleerung findet sich auch in 17 weiteren Fällen, obwohl gerade hier mit der Besetzung des Mittelfeldes durch Pronomina optimale EIC-Werte hätten erzielt werden können: (110) China 51 Ol T: erstensmal=wird=keiner= -> 02 mehr=mit ner geschiedenen oder (0.4) Frau von jemand anders was anfangen

71 (110') (a) [yp mehr mit ner geschiedenen oder Frau von jemand anders was anfangen e ] 1/1 2/2 2/3 2/4 2/5 2/6 2/7 2/8 2/9 3/10 4/11 100% 100% 66% 50% 40% 33% 28% 37% 22% 30% 36% = 49% (b) [γρ mehr was anfangen e mit ner geschiedenen oder Frau von jemand anders ] 1/1 2/2 3/3 4/4 100% 100% 100% 100% = 100% (111) China 16 -> 01 I: 'wenn: dann: würd ich den::: (1.2) halt (0.5) 02 irgendwann in den nächsten Tagen anschreiben, (111') (a) dann würd ich [γρ den halt irgendwann in den nächsten Tagen anschreiben e ] 1/1 2/2 3/3 3/4 3/5 3/6 3/7 4/8 100% 100% 100% 75% 60% 50% 42% 50% = 72 % (b) dann würd ich [γρ den halt anschreiben e irgendwann in den nächsten Tagen ] 1/1 2/2 3/3 4/4 100% 100% 100% 100% =100% (112) Hundertfünfzig 20 01 X: jedenfalls ist er der Meinung -> 02 daß ich immer wie ein Waldschrat herumlaufe (112') (a) jedenfalls ist er der Meinung daß ich [γρ immer wie ein Waldschrat herumlaufe ] 1/1 2/2 2/3 2/4 3/5 100% 100% 66% 50% 60% = 75% (b) jedenfalls ist er der Meinung daß ich [γρ immer herumlaufe wie ein Waldschrat ] 1/1 2/2 3/3 100% 100% 100% = 100% Es kann festgehalten werden, daß bei insgesamt 56 Fällen von Mittelfeldentleerung 2 Beispiele (98, 87) gefunden werden konnten, in denen Sprecher diese trotz Verschlechterung der EICWerte vorgenommen haben. In 2 weiteren Fällen (81,97) wird ein Satzglied entfernt, ohne daß eine Veränderung der EIC-Werte erzielt wird. Den verbleibenden 52 Fällen der EIC-WertVerbesserung durch Mittelfeldentleerung stehen immerhin 39 Fälle gegenüber, bei denen auf Mittelfeldentleerung und damit auf die Möglichkeit zur Verbesserung der ElC-Werte verzichtet wurde. Diese Verteilung geht zu Lasten der statistischen Signifikanz von Mittelfeldentleerungen im Dienste der Optimierung der EIC-Werte. Hawkins' Hypothese, die Verbesserung der EICWerte sei die treibende Kraft bei der Veränderung der linearen Abfolge von Stellungsgliedem, kann nicht bestätigt werden. Die Vermutung liegt also nahe, daß es neben dem möglichst effizienten Parsen von Wortfolgen andere Gründe gibt, Mittelfeldentleerungen vorzunehmen oder auf sie zu verzichten.

72 2.4.2

Organisation des Sprecherwechsels

Auf der Suche nach Gründen für Konversationsteilnehmer, auf Mittelfeldentleerungen zu verzichten, möchte ich zunächst die Organisation des Sprecherwechsels daraufhin überprüfen, ob sich hier konversationelle Nachteile ergeben. In ihrer "simplest systematics for the organization of turn-taking" haben Sacks, Schegloff & Jefferson (1974) ein interaktives System der Gesprächsorganisation vorgestellt. "Turn-taking" bedeutet "einander abwechseln" und das Sich-Abwechseln stellt immer dann ein organisatorisches Problem dar, wenn in eine Interaktion mehrere Teilnehmer involviert sind, die ihre aktiven Beiträge in eine zeitlich lineare Abfolge bringen müssen. Für die Analyse von Konversationen bedeutet "Turn-taking", daß das Problem der Verteilung sowie der Wechsel der Rollen von Sprecher und Hörer von den Beteiligten auf eine systematische Weise gelöst werden muß. Indem das System die Stellen in einem Redezug (turn) festlegt, an denen ein anderer Sprecher seinen Beitrag beginnen kann oder muß, sorgt es für einen geregelten Sprecherwechsel. Das von Sacks, Schegloff & Jefferson (1974) entwickelte System für die Zug-um-Zug-Abfolge von Redezügen in Konversationen besteht aus zwei Komponenten und einem Inventar von rekursiven Regeln, deren Anwendung durch Regelordnung festgelegt ist. Die erste Komponente ist für die Konstruktion der Redezüge

(turn-constructional

component) verantwortlich. Sie stellt dem Sprecher vielfaltige syntaktische Konstruktionstypen (Lexeme, Phrasen, Sätze) zur Verfügung. Diesen ist gemeinsam, daß sie den Hörern erlauben, ab einer bestimmten Stelle den weiteren Verlauf und das Ende der Konstruktionseinheit zu antizipieren: There are various unit-types with which a speaker may set out to construct a turn. [...] Instances of unittypes so usable allow a projection of the unit type under way, and what, roughly, it will take for an instance of that unit-type to be completed. Unit-types lacking that feature of projectability may not be usable in the same way. (Sacks, Schegloff & Jefferson 1974: 702)

Bei Abschluß der gewählten Konstruktionseinheit endet das Rederecht des Sprechers zunächst. Damit bildet der erste mögliche Abschlußpunkt (first possible tum completion point) auch die übergaberelevante Stelle (transition-relevance place)39, an der ein möglicher Sprecherwechsel als strukturelles Problem relevant wird. Die zweite Komponente regelt die Zuweisung der Redezüge (turn-allocation component). Es gibt zwei Möglichkeiten: Entweder wählt der gegenwärtige Sprecher einen anderen Teil39

Sacks, Schegloff & Jefferson (1974: FN15) weisen darauf hin, daß diese übergaberevelante Stelle je nach konversationellem Kontext von unterschiedlicher Ausdehnung sein kann: Ein sich ausdehnender Raum (space) oder ganz bestimmter Punkt (point). Syntaktische und semantische Erkennbarkeit einer nahen übergaberelevanten Stelle erlaubt es dem Rezipienten nach Jefferson (1973), seinen Redezug bereits am "recognition point" einzusetzen (vgl. Bsp. 114, Zeile 04). Weitere positionell definierte Typen von Redezugübernahmen werden in Jefferson (1983a, 1986) analysiert.

73 nehmer als nächsten Sprecher aus (current speaker selects next speaker), oder ein nächster Redezug erfolgt über Selbstwahl (self-selection) eines Teilnehmers. Eine an einen bestimmten Teilnehmer gerichtete Frage gehört zu den Möglichkeiten, mit der ein Sprecher während seines noch im Vollzug befindlichen Redezugs steuern kann, wer als nächster Sprecher an die Reihe kommen soll. Nach Sacks, Schegloff und Jefferson (1974: 703ff) legen zwei rekursive Regeln fest, wie Gesprächsteilnehmer an Stellen zu verfahren haben, die von der Redezugkonstruktionskomponente als übergaberelevante Stelle identifiziert wurde. Diese Regeln organisieren den Sprecherwechsel, und sie stellen die Redezugzuteilung unter Berücksichtigung des für Alltagskonversationen geltenden Prinzips der Minimierung von (overlap) und Gesprächslücken (gap) sicher.

40

Redezugüberlappungen

Die Regelordnung entspricht der angegebenen

Reihenfolge. Die Regel (1) mit den Teilregeln (la) bis (lc) gilt für jeden Redezug; ihr Anwendungsbereich ist die erste übergaberelevante Stelle der ersten Redezugkonstruktionseinheit. Die Regel (2) gilt für jeden Turn, an dessen erster übergaberelevanter Stelle Regel (lc) in Kraft getreten ist, weil weder (la) noch (lb) erfolgt sind: (Regel la) Wenn in dem bis zur ersten übergaberelevanten Stelle realisierten Redezug der gegenwärtige Sprecher bereits einen nächsten Sprecher ausgewählt hat, so hat nur dieser das Recht und die Pflicht, den nächsten Redezug zu übernehmen. Der Sprecherwechsel erfolgt in diesem Fall an der ersten übergaberelevanten Stelle. (Regel lb) Wenn in dem bis zu diesem Punkt realisierten Redezug keine Fremdwahl erfolgt ist, dann ist Selbstwahl möglich, aber nicht zwingend erforderlich. Das Rederecht erhält bei Selbstwahl der Sprecher, der zuerst mit seinem nächsten Tum beginnt. (Regel lc) Wenn der bis zu diesem Punkt realisierte Tum keine Fremdwahl enthält, kann der gegenwärtige Sprecher seinen Redezug fortsetzen, vorausgesetzt es erfolgt keine Selbstwahl. (Regel 2) Die Regel (1) kommt an der nächsten übergaberelevanten Stelle erneut zur Anwendung. Regel (2) wird rekursiv so lange angewendet, bis ein Sprecherwechsel zustandekommt. Syntaktische Abgeschlossenheit und Überschaubarkeit des Konstruktionstyps sind also entscheidende Faktoren bei der Steuerung der Redezüge. Die Übernahme eines Redezugs ist an solchen Stellen unproblematisch, an denen ein für den Rezipienten erkennbarer und im Verlauf eines Redezugs auch antizipierbarer syntaktischer Abschlußpunkt und damit eine übergaberelevante Stelle erreicht ist. Die Entleerung des Mittelfeldes und die Realisierung von SatzDie Regeln stellen auch sicher, daß die Teilnehmer nicht fortwährend gleichzeitig und durcheinander reden: "Overwhelmingly, one party talks at a time", 706. In welchem Ausmaß Überlappungen und Schweigephasen toleriert werden, ist jedoch sicher nicht in allen Sprachgemeinschaften auf gleiche Weise geregelt. Zur interaktiv relevanten Positionierung von Schweigephasen vgl. auch FN 8 in Kap. 3.

74 gliedern außerhalb der Satzklammer schaffen damit systematische Probleme bei der Redezugabfolge, da die Konversationspartner die rechte Satzklammer - zusammen mit prosodischen und semantischen Indikatoren - als übergaberelevante Stelle interpretieren. Im Beispiel (113) Zeile 07 beginnt Τ ihren Redezug im direkten Anschluß (latching) an die Produktion des finiten Verbs in Zeile 79. (113) China 4f 01 I: Auf ne 'interdisziplin lären I Tagung isses einfach ne 'Unverschämtheit, (0.5) 02 T: l"hm"l 03 I: so (0.6) ähm 'hochtrabend mit 'solchen 'Ausdrück I en da'her I zukommen, 04 T: l"hmhm" I 05 I: Γ wie=die I 'Moelimann das gemacht hat °.= 06 Τ: I " h m " I -> 07 Τ =Mich "wundert=des, Im Beispiel (114) beginnt Τ in Zeile 03 ohne wahrnehmbare Pause, und in Zeile 04 startet I mit einer geringen Überlappung: (114) China 16 01 I: Ja ka-kannse mir ja hinter I her I erzählen. 02 Τ I hmhml -> 03 T: °kann=ich dir dann sag I en I -> 04 I: I Und: l'wenn: dann: würd ich den:::: (1.2) 05 halt (0.5) irgendwann in den 'nächsten Tagen 'anschreiben, Produziert der Sprecher jedoch im Anschluß an die rechte Satzklammer ein weiteres Satzglied, so kann dies dazu fuhren, daß ein anderer Sprecher an der übergaberelevanten Stelle mit seinem Redezug beginnt, so daß die Konstituente außerhalb der Satzklammer in Überlappung mit dem Redezug des nächsten Sprechers oder seinen Rezipientensignalen (continuers, vgl. Schegloff 1982) realisiert wird. (94) China 3 01 T: als 'die sie auf den 'Vortrag 'angesprochen hat l°wäh I rend der Tagung". -> 02 I: I "hm" I (81) Hundertfünfzig 1 01 X: Hast du 'angerufen I da? -> 02 Η: I 'ja ich dachte du wärst vielleicht doch hier. (108) China 12 01 I: das Tcannse dir=auch 'selber anle I sen vorher. I -> 02 Τ: I mit nem I 'Stadtführer oder so. 03 I: "Ja:

75 Während die Überlappungen in den Beispielen (94), (81) und (108) nur kurz sind und keine erkennbaren interaktiven Probleme nach sich ziehen, gilt dies nicht für die Redezugübernahme von Η in der Zeile 02 des Gesprächsausschnitts (106): (106) Hundertfünfzig 7 Ol X: ihr habt (.) äh en 'Seminar gehabt I zu'van deVelde;= -> 02 Η: I ja ja 03 X ='nur zu 'van de Velde 04 H: Ja nich nur über ihn aber er kam da ziemlich häufig drin vor. 05 X: ah ja ha. (1.0) Durch Hs Bestätigung (ja ja) im direkten Anschluß an das Ende der Satzklammer bleibt unklar, ob Η den gesamten Beitrag von X bestätigt (ihr habt ein Seminar zu van de Velde gehabt), oder ob sich seine Zustimmung nur auf die Aussage bis zum Zeitpunkt der Überlappung bezieht (ihr habt ein Seminar gehabt). Diese Ambiguität bleibt nicht bestehen, sondern wird in den Zeilen 03 bis 05 aufgelöst. Auch das Beispiel (98) zeigt bei der zweiten Mittelfeldentleerung (Zeile 07) das beschriebene Problem. In Zeile 06 ist mit dem Verbalkomplex das Ende einer Konstruktionseinheit erreicht, und aufgrund von syntaktischen, prosodischen und semantischen Indizien kann Τ das Ende von Is Redezug antizipieren. Τ beginnt ihren Redebeitrag an der übergaberelevanten Stelle, dadurch wird jedoch der Höhepunkt von Is reportierter Horrorgeschichte, daß die Einladung zum Tee am nachmittag stattgefunden hat, in Überlappung produziert: (98) China 21 01 I: Die ham also richtige 'Hor'ror, 02 so 'Horrormeldungen (0.6) von sich gegeben; (0.3) 03 Der eine (0.5) war ma ver'droschen worden, 04 vonner 'ganzen (0.3) 'Horde chinesischer Kommili'ton; 05 "weil 'er sich erdreistet hatte, 06 eine 'Chi'ne'sin 'zum "Tee einzuladen;= 07 = l'nachmit I tags -> 08 T: I Nein::! 1= 09 I: =Doch! 10 T: "Nein; das s- 'ab'surd.0 Werden für die Interpretation des Redezugs wichtige Informationen erst im Anschluß an einen möglichen Übergabepunkt geliefert, so sind interaktiv problematische Überlappungen nicht abzuschließen. Betrachtet man nun aber die prosodische Realisierung der vorgestellten Redezüge etwas genauer, so zeigt sich, daß sich die Unterschiede in den interaktiven Konsequenzen durch Unterschiede in der prosodischen Realisierung manifestieren. In den ersten vier Beispielen bildet die Konstituente außerhalb der Satzklammer keine eigene Intonationsphrase. Im Beispiel (98) hingegen ist die in Überlappung produzierte Konstituente prosodisch selbständig.

76 Doch auch die Gruppe der prosodisch integrierten Konstituenten ist nicht homogen. In den Beispielen (81) und (108) tragen die Konstituenten da und vorher keinen eigenen Akzent, im Beispiel (94) gibt es nur einen sekundären Akzent, in Bsp. (106) hingegen wird ein Primärakzent realisiert. Ich komme auf diese Unterschiede in Abschnitt 2.4.4 noch einmal zurück. Es kann also festgehalten werden, daß Mittelfeldentleerungen für die Konversationsteilnehmer Probleme bei der 'störungsfreien' Redezugabfolge mit sich bringen können, da die rechte Satzklammer das Ende einer Redezugkonstruktionseinheit ist und damit auch als Ende eines Redezugs interpretiert werden kann. Die für die Rezipienten einfachere Projizierbarkeit des Endes eines Redezugs - oder zumindest des Endes einer Konstruktionseinheit mit dem Recht des Partners zur Redezugübernahme - könnte also ein Grund dafür sein, warum Sprecher auf Mittelfeldentleerungen auch dann verzichten, wenn ihnen diese Vorteile bei der Optimierung der EIC-Werte im Sinne von Hawkins verschaffen würden. Es bleibt jedoch zu klären, warum Konversationsteilnehmer trotz dieses Nachteils nicht auf Mittelfeldentleerung verzichten.

2.4.3

Durchführung von Selbstreparaturen

Im letzten Abschnitt konnte schon gezeigt werden, daß es nicht allein in der Macht des jeweiligen Sprechers liegt, zu entscheiden, wann sein Redezug abgeschlossen ist und wann nicht. Mit der rechten Satzklammer wird häufig eine übergaberelevante Stelle erreicht, und andere Gesprächsteilnehmer nutzen diese Stelle, um über Selbstwahl mit einem nächsten Redezug zu beginnen. Die Regeln für die Organisation des Sprecherwechsels stellen den Konversationsteilnehmem aber noch eine zweite Möglichkeit zur Verfügung, von der sie ebenfalls systematisch und regelmäßig Gebrauch machen. Hat der Sprecher zum Beispiel mit der rechten Satzklammer einen möglichen Abschlußpunkt erreicht und kann sein Redezug sowohl syntaktisch als auch semantisch und prosodisch als abgeschlossen gelten, so kann der Rezipient seinen an dieser Stelle eigentlich erwartbaren Beitrag zurückhalten. Werden an dieser Stelle auch keine Rezipientensignale produziert, mit denen sowohl der Verzicht auf die Übernahme eines eigenen Redezugs als auch der Verzicht auf die Initiierung einer Reparatursequenz angekündigt werden 41 , genügen schon relativ geringe Verzögerungen, die dann entstehen, wenn der nächste Beitrag nicht innerhalb des übergaberelevanten Raums (transition space) 42 produziert wird, um zu signalisieren, daß der Rezipient mit der Äußerung des Sprechers nicht übereinstimmt oder Probleme irgendwelcher Art hat. Auf eine erwartbare und an dieser Stelle ausbleibende 41

Zu dieser Funktion der Rezipientensignale vgl. Schegloff (1982).

42

D.h., in direktem Anschluß (vgl. Bsp. 113 und 114, Zeile 03) oder mit geringer Überlappung (Bsp. 114 Zeile 04). Vgl. dazu auch Jefferson (1983a) sowie FN 39.

77 Reaktion hin kann der Sprecher dann seinen Beitrag über die Satzklammer hinaus fortsetzen und versuchen, die Schwierigkeiten des Rezipienten zu beheben. Auf diese Weise gibt der Rezipient dem Sprecher die Möglichkeit, eine Selbstreparatur (self-repair) vorzunehmen. Als Reparaturen

und Reparatursequenzen

haben Schegloff, Jefferson & Sacks (1977)

solche Aktivitäten beschrieben, in denen Konversationsteilnehmer Probleme des Sprechens, Hörens oder Verstehens in vorausgegangenen oder im Vollzug befindlichen Redezügen bearbeiten. Schegloff, Jefferson & Sacks (1977) sprechen von Selbstreparaturen

(self-repair),

wenn der Konversationsteilnehmer, von dem die zu reparierende Äußerung, das Reparandum, stammt, auch die Reparatur 43 durchführt und sie konnten auch zeigen, daß Selbstreparaturen gegenüber Fremdreparaturen

(other-repair), bei denen ein anderer Gesprächsteilnehmer die

Reparatur durchführt, konversationeil präferiert 44 sind. Für die Durchführung einer Fremdreparatur steht den Konversationsteilnehmern mit dem auf das Reparandum folgenden Redezug nur eine Position zur Verfügung, während Selbstreparaturen an drei verschiedenen Positionen (vgl. Schegloff, Jefferson & Sacks 1977: 366 sowie Schegloff 1979: 267f) durchgeführt werden können: Selbstreparaturen werden - orientiert an der Position des Reparandums entweder redezugintern, im unmittelbaren Anschluß an einen möglichen Abschlußpunkt oder im übernächsten Redezug durchgeführt. Damit hat die Organisation von Reparaturen einen begrenzten Anwendungsbereich (vgl. auch Schegloff 1992), der sich über zwei Sprecherwechsel hinweg von dem Redezug des Sprechers Α mit dem Reparandum über den nächsten Redezug des Sprechers Β bis zu einem dritten Redezug wiederum von Sprecher Α erstreckt. Daß es sich bei den Mittelfeldentleerungen tatsächlich um Selbstreparaturen handeln kann, die in der für Selbstreparaturen vorgesehenen Position im direkten Anschluß an eine übergaberelevanten Stelle durchgeführt werden, läßt sich besonders deutlich anhand von 45

sequenzen

Paar-

(adjacency pairs) - wie Frage/Antwort oder Bewertung/Gegenbewertung (vgl.

dazu Kap. 3) - demonstrieren. Bei der Paarsequenzorganisation handelt es sich um zwei zu einem Äußerungsformat fest verbundene, von zwei verschiedenen Sprechern produzierte Äußerungen, wobei ein erstes Paarglied einem ganz bestimmten zweiten vorangeht und dieses

43

Zur Unterscheidung von Reparaturen (repair) und Korrekturen (correction) vgl. ebenfalls Schegloff, Jefferson und Sacks (1977: 363).

44

Zur Erläuterung des Begriffs der konversationellen Präferenz vgl. Pomerantz (1975, 1984), Schegloff, Jefferson & Sacks (1977: 362 FN 4) sowie Kapitel 3. Die konversationelle Dispräferenz für Fremdreparaturen gilt jedoch nur für Alltagsgespräche unter 'kompetenten' Interaktionsteilnehmern. In Gesprächen mit Kindern oder Nicht-Muttersprachlern finden sich häufiger Fremdkorrekturen. Die Analyse von Reparatursequenzen hat sich - wie in zahlreichen Publikationen dokumentiert - zu einem umfangreichen Arbeitsgebiet entwickelt. Zum Deutschen vgl. z.B. Bergmann (1980) und Selting (1987a, 1987b), zum Englischen z.B. Couper-Kuhlen (1992), Jefferson (1983b) und Schegloff (1979, 1992). Die von Schegloff, Jefferson und Sacks (1977) beschriebenen Funktionsprinzipien der Reparaturorganisation sind als zentrale Mechanismen der Verständnissicherung wohl nicht sprachspezifisch (vgl. dazu Moerman 1988 und Schegloff 1987a sowie FN 38). Zur Syntax und Phonologie von Reparaturen vgl. auch Kap. 4.2.2.

45

Vgl. Schegloff & Sacks (1973: 295ff), Sacks, Schegloff & Jefferson (1974: 716ff) aber auch Goffman (1974: "Der bestätigende Austausch" und "Der korrektive Austausch").

78 konditionell relevant (conditionally relevant) macht, d.h., für den Rezipienten obligatorisch und für den Produzenten erwartbar. Sobald also ein erstes Paarglied für den Rezipienten erkennbar produziert wurde, sollte der Sprecher an der ersten übergaberelevanten Stelle seinen Redezug beenden, um dem Rezipienten in dem vordeterminierten Raum Gelegenheit zur unmittelbaren Produktion des zweiten Paarglieds zu bieten: [...] adjacency pairs consist of sequences which properly have the following features: (1) two utterances length, (2) adjacent positioning of component utterances, (3) different speakers producing each utterance. [...]. [...] (4) relative ordering of parts (i.e. first pair parts precede second pair parts) and (S) discriminative relations (i.e. the pair type of which a first pair part is a member is relevant to the selection among second pair parts). [...] A basic rule of adjacency pair operation is: given the recognizable production of a first pair part, on its first possible completion its speaker should stop and a next speaker should start and produce a second pair part from the pair type of which the first is recognizably a member. (Schegloff & Sacks 1973: 295f)

Das schon in Abschnitt 2.3.3 vorgestellte Bsp. (81) zeigt eine prototypische sequentielle Abfolge von Frage und Antwort; die Frage ist sequentiell implikativ (sequentially implicative), d.h., sie fordert als erstes Paarglied eine ganz bestimmte nächste Aktivität, die von dem Rezipienten produziert wird, sobald bei der Produktion des ersten Paarglieds ein möglicher Abschlußpunkt erreicht wird: (81) Hundertfünfzig 1 Ol X: Hast du 'angerufen I da? -> 02 Η: I 'ja ich dachte du wärst vielleicht doch hier. Daß ein erwartbarer und an dieser Stelle ausgebliebener Beitrag des Rezipienten eine Selbstreparatur ausgelösen kann, läßt sich nun anhand des Beispiels (99) demonstrieren. Auch in (99) erfordert Is Frage in Zeile 02 eine Antwort von T. Diese sollte erfolgen, sobald die Frage für Τ erkennbar einen syntaktischen Abschlußpunkt erreicht hat. (99) China 31 01 T: Also Melakka is 'schon ganz intressant als 'Stadt.= 02 I: =Wie 'weit is des ent'fernt? 03 T: ANTWORT In Beispiel (99) bleibt die Antwort jedoch zunächst aus und es entsteht eine minimale Pause: (99) China 31 01 T: Also Melakka is'schon ganz intressant als'Stadt.= 02 I: =Wie 'weit is des ent'fernt? (.) Diese Verzögerung kann, wie eingangs gesagt, als Hinweis darauf interpretiert werden, daß der Rezipient mit der Äußerung des Sprechers nicht Ubereinstimmt oder Probleme irgendwelcher

79 Art hat. Indem I den durch die zurückgehaltene Antwort nun freien Raum für die Angabe des zweiten Referenzpunkts nutzt und damit ihren Redezug um eine syntaktisch zulässige und semantisch u.U. erforderliche Konstituente erweitert, nutzt sie zugleich auch den grammatisch zulässigen Spielraum für Mittelfeldentleerungen aus und produziert einen Redezug, der zwar retrospektiv Spuren der Reparatur aufweist, aber keine ungrammatische Struktur darstellt: (99) China 31 01 T: Also Melakka is'schon ganz intressant als'Stadt.= 02 I: =Wie 'weit is des ent'fernt? (.) -> 03 von Port 'Dixon? Darüberhinaus heben potentielle Mittelfeldkonstituenten, die erst im Anschluß an die rechte Satzklammer produziert werden, die sequentielle Implikativität des reparierten Redezugs nicht auf. Daß in Beispiel (99) die Ursache für die Schwierigkeiten des Rezipienten lokalisiert und erfolgreich behoben wurde, zeigt sich darin, daß Τ nun in Zeile 04 das konditioneil relevante zweite Glied der Paarsequenz produziert: (99) China 31 01 T: Also Melakka is 'schon ganz intressant als 'Stadt. = 03 I: =Wie 'weit is des ent'fernt? (.) -> 03 von Port 'Dixon? 04 T: ähm zwei Stunden mim Au I to 0 ο I der einhalb so 05 I: I °ah° I Auch im Beispiel (115) gelingt es X mit ihrer Äußerung in Zeile 10 zunächst nicht, S zu dem konditioneil relevanten zweiten Glied der eröffneten Paarsequenz, der gleichlaufenden und damit zustimmenden Gegenbewertung, zu veranlassen. Statt dessen signalisiert S durch die Verzögerung seiner Reaktion und ein moduliertes ja (j:oa) als Vorlaufelement, daß X nicht mit 'Problemen' wie in Beispiel (99), sondern mit der zweiten möglichen Interpretation einer zurückgehaltenen Reaktion (s.o.), nämlich mit der Produktion einer Nichtübereinstimmung, rechnen muß. 46 Erst durch die Einschränkung in Zeile 09 - eine potentielle Mittelfeldkonstituente von 04 - macht X ihre Einschätzung für S zustimmungsfähig. (115) Legag 7f 01 X: mhh (0.2)'hh und wie geht Karin? (.) 02 S: 'j:oa 'gut. 03 (0.5) 04 X: mhh 'h s- der einzig 'ruhende 'Pol noch bei euch in der Wohngerofiinseh.aft= 05 =oder?'h (0.5)

Zu Verzögerungen in Sequenzen wie diesen, die als Bewertungssequenzen interpretiert werden können, und zur Funktion von Vorlaufelementen vgl. Auer & Uhmann (1982) sowie ausführlich Kap. 3.1.

80

->

06 07 08 09 10

S: j:oa:: I :: hh he .he. J. , h X: I'hh he..I ljo=jo la S: I in bezug auf E'xa I mina; I X: Ibezuch I (.) auf Examen sicherlich; S:

Die beiden Beispiele (99) und (115) zeigten, daß - im Gegensatz zu der in der Literatur vertretenen Ansicht - Mittelfeldentleerungen ohne ein Bezugselement in der Vorgängeräußerung (Typ VII und Typ VIII) die Funktion von Reparaturen haben können, wenn sie prosodisch selbständig sind. Doch auch die Typen von Mittelfeldentleerungen, in denen prosodisch selbständige Konstituenten nach der rechten Satzklammer ein Bezugselement im Mittelfeld haben (Typ I bis IV), können in der Funktion von Reparaturen analysiert werden (vgl. dazu auch Altmann 1981 und Auer 1991a). Dies gilt sowohl für Beispiele wie (75), die eine Pro-Form im Mittelfeld (nach Altmann "Rechtsversetzungen") aufweisen, vor allem aber für die Fälle wie (78), in denen andere Konstituenten zu der Konstituente nach der Satzklammer im Verhältnis potentieller syntaktischer Substitution stehen (nach Auer "Reparaturen"): (75) China 29 01 T: =ich hab hier gewohnt; -> 02 in 'Port 'Dixon. (0.2) 03 I: hmhm (0.5) (78) China 29 01 I: ich 'schreib mir das ma I (2.0) I "auf 02 Τ: I e'he das is 'toll I 03 ahm °da=s° gibts "wahnsinning 'tolle 'Strände; (1.5) -> 04 also=richtige 'Bilderbuch'Strände. Die Analyse von Mittelfeldentleerungen als Reparaturen, genauer Selbstreparaturen, greift allerdings vielleicht zu kurz, denn die konversationsanalytische Betrachtung von Reparaturen hat zu einer weiteren Differenzierung in diesem Bereich geführt. Schegloff, Jefferson & Sacks (1977) unterscheiden nicht nur zwischen Selbst- und Fremdreparaturen, sondern auch zwischen selbst- χιηά fremdinitiierten Reparaturen.47 Eine Selbstreparatur liegt wie in den bisher vorgestellten Beispielen dann vor, wenn ein Gesprächsteilnehmer sowohl das Reparandum produziert als auch die Reparatur durchführt. Als fremdinitiierte Selbstreparatur bezeichnen Schegloff, Jefferson & Sacks (1977: 364) eine Reparatur dann, wenn ein Gesprächsteilnehmer einen anderen nur auf die Reparaturbedüftigkeit seines Redezugs hinweist, die eigentliche Durchführung der Reparatur aber dem Produzenten des Reparandums überläßt. Schegloff, Die Autoren kamen zu dem Ergebnis, daß auch diese Strukturtypen nicht äquivalent sind: Selbstreparaturen und Selbstinitiierung sind präferierter als Fremdreparaturen und Fremdinitiierung (vgl. auch FN 44).

81 Jefferson & Sacks (1977) identifizieren verschiedene Techniken der Fremdinitiierung, die sich darin unterscheiden, wie weit sie spezifizieren, worin genau das Problem für den reparaturinitiierenden Gesprächsteilnehmer besteht. Es gibt eine Klasse von Ausdrücken (hm?, bitte?, was? u.a.), die den Produzenten des Reparandum weitgehend im Unklaren darüber lassen, welcher Aspekt seines Redezugs die Probleme verursacht hat. Die bisher vorgestellten Selbstreparaturen können jedoch meiner Meinung nach ebenfalls als sehr subtile fremdinitiierte Selbstreparaturen analysiert werden48, wobei das Schweigen des Rezipienten unter dem Aspekt der Lokalisierung eines Problems das am wenigsten hilfreiche Mittel darstellt. Es ist daher nicht verwunderlich, daß sich in dem untersuchten Korpus auch Fälle finden, in denen Sprecher bei der Lokalisierung möglicher Probleme ihrer Rezipienten scheitern. Ein solches Scheitern ist in dem Transkriptausschnitt (105) zu beobachten: (105) China 7f 01 Τ Mensch hoffendich kommt se rechtzeitig, 02 Τ: die mußte ja nach 'Freiburg; 03 (0.7) -> 04 'hh zum 'Kul 1 tusmi 1 nisterium.= 1 hmhm 1 05 I: -> 06 Τ: = Γ wegen 1 der Sla'vistik/ 1 warum? 1 07 I: 08 (1.3) 09 I: Aha, was10 sind da wieder ir 1 gendwelche neuen 1 'Pläne im Gang?= 11 Τ: 1 ähm die wollen ähn 1 12 Τ: =die wollten doch die Sla'vistik hier abbauen; (0.3) 'Staatsexamen. 'hh= -> 13 14 I: = "Ja, "das 'weiß ich", So können Konversationsteilnehmer das Richtige zu spät sagen (vgl. 105, Zeile 06); etwas sagen, was der Rezipient bereits weiß (vgl. 105, Zeile 13), oder sie können wie in Bsp. (79) etwas korrigieren, was der Rezipient, zumindest zum Zeitpunkt der Reparatur, nicht als problematisch eingestuft hat. (79) China 38 01 T: und die 'liegen dann meistens 'toll; -> 02 I 'mitten in der 'Stadt; I 03 I: I und ist nicht I total überlaufen Ein Sprecher kann aber auch schon während der Produktion seines Redezugs zur Ansicht gelangen, daß dieser reparaturbedürftig ist. Er kann auch - in der Terminologie von Schegloff, Jefferson & Sacks - selbst eine Reparatur initiieren und durchführen. Selbstinitiierte SelbstDiese Möglichkeit der Fremdinitiierung von Reparaturen wird von Schegloff, Jefferson & Sacks (1977) nicht gesehen.

82 reparaturen werden oft durch Abbräche (Glottal Stop, der-),

Pausen oder Dehnungen

(vorher:), Reparaturpartikel wie äh und äftm 49 sowie durch Ausdrücke wie oder, also oder beziehungsweise (vgl. auch Bsp. 78 sowie Kap. 4.2.5) angekündigt. Selbstinitiierte Selbstreparaturen, die im Anschluß an eine übergaberelevante Stelle produziert werden, werden im Gegensatz zu fremdinitiierten Selbstreparaturen in einer Intonationsphrase durchgeführt: (76) China 39 -> Ol T: Ich 'schreib da vorher: (0.9) der 'Frau: der- der 'Rodi (0.5) (85) China 31 01 T: als die 'aus (0.6) äh 'fuhren nach Ma'laysia;

Auch das schon vorgestellte Beispiel (106) kann noch einmal unter dem gesprächsorganisatorischen Einfluß der Reparaturinitiierung und Reparaturdurchführung analysiert werden. Dieser Einfluß wird aber erst bei Betrachtung eines größeren Gesprächsausschnitts sichtbar: (106) Hundertfünfzig 6f (verkürzt) 01 X Ich schreibe über (.) 'das Ornament im Jugendstil, äh liesonders bei van de Velde 02 03 Η ( 3.0 ) ((Störung der Verbindung durch Verkehrslärm)) -> 04 X bitte? 05 Η ( 2.0 ) ((Störung der Verbindung durch Verkehrslärm)) -> 06 Χ ich versteh dich nich, du mußt en bißchen, 07 Η letztes Se'mester gemacht van der 'Velde 08 Χ ja?= 09 Η =ja; 10 Χ wenn ich das gewußt hätte hätteste mir mal deine Aufzeichnungen geben können d- ich mir viel I 'leicht 11 12 Η I (...) (die ersten die Mal) dagewesen 13 (1.5) 14 Η (is) nich viel aufgezeichnet, - > 15 Χ bitte? 16 Η hab ich nich viel aufgezeichnet. -> 17 Χ ach so ihr habt (.) äh en 'Seminar gehabt I zu 'van de Velde,= -> 18 Η I ja ja -> 19 Χ =nur zu van de Velde? 20 Η Ja nich nur über ihn aber er kam da ziemlich häufig drin vor. 21 Χ ah ja ha. (1.0)

Levelt (1989: 483f) weist darauf hin, daß äh und ähm universale Reparaturpartikeln mit nur geringen sprachspezifischen phonetischen Variationen sind. Damit gehören sie nicht zu den sprachlichen Zeichen. Auch der glottale Verschlußlaut wird nur dann als Selbstreparaturindikator verwendet, wenn er nicht (wie z.B. im Quichi) Phonemstatus hat. Zu sprach- und kulturübergreifenden Aspekten der Reparaturorganisation vgl. Schegloff (1987a: 210ff).

83 Betrachtet man den sequentiellen Kontext, so zeigt sich, daß X in den Zeilen 04, 06 und 15 dreimal eine Reparatur initiiert, weil sie Η aufgrund von störendem Verkehrslärm nicht verstehen kann. Η führt die Reparaturen durch, und aus der Tatsache, daß sie diese das Gespräch aufhaltende Aktivität für X ausführt, ergibt sich für X die konversationelle Verpflichtung, den Erfolg von Hs Bemühungen und damit den Abschluß der Reparatursequenz in dem Augenblick zu signalisieren, indem das Verständigungsproblem gelöst ist. In Zeile 17 signalisiert sie ihr Verstehen (ach so) und damit den Erfolg von Hs Reparaturbemühungen. Weil ach so Verstehen aber nur behauptet und sowohl X als auch Η nicht sicher sein können, ob wechselseitiges Verstehen tatsächlich vorliegt, stellt X ihr Verstehen auch unter Beweis, indem sie ihre Version von Hs Beitrag formuliert und Η zur Bestätigung vorlegt. Bei dieser Aktivität, die wie die Reparatur die Fortsetzung des Gesprächs immer noch aufhält, ist nun Η gehalten, so früh wie möglich, den Erfolg von X Bemühungen anzuzeigen. Η tut dies in Zeile 18, nachdem X mit der rechten Satzklammer das Ende einer Konstruktionseinheit und damit eine übergaberelevante Stelle erreicht hat. Wie in Abschnitt 2.4.2 gezeigt wurde, kommt diese Erfolgsmeldung zu früh, und es ergeben sich die beschriebenen Ambiguitäten, die durch die Wiederholung in Zeile 19 aufgelöst werden. Im Lichte der lokalen Produktion von Xs Redezug im Rahmen einer Reparatursequenz beantwortet sich nun auch die Frage, warum X einer prosodisch unselbständigen Konstituente nach der Satzklammer ein zweites Satzglied in gleicher syntaktischer und semantischer Funktion, aber mit spezifizierter Bedeutung in einer selbständigen Intonationsphrase folgen läßt. Es handelt sich bei dieser Wiederholung nämlich um die fremdinitiierte Reparatur einer Reparaturerfolgsformulierung. Mithilfe von Mittelfeldentleerungen können Konversationsteilnehmer also sowohl fremdinitiierte als auch selbstinitiierte Selbstreparaturen durchführen, wobei erstere in zwei und letztere in einer Intonationsphrase realisiert werden.50 Als subtile Technik der Fremdinitiierung von Reparaturen wurden verzögerte Reaktionen der Rezipienten identifiziert. Schweigen ist zwar für den Produzenten des Reparandums das für die Lokalisierung des Problems am wenigsten hilfreiche Ausdrucksmittel, es kann jedoch zugleich die unauffälligste Möglichkeit zur (dispräferierten) Fremdinitiierung einer Reparatur sein, wenn nämlich zwischen dem Ende der syntaktischen Konstruktionseinheit und der angeschlossenen Reparatur nur einige Bruchteile von Sekunden verstreichen, und es dem Sprecher gelingt, sowohl eine syntaktische (z.B. durch Mittelfeldentleerung) als auch eine prosodische Verbindung herzustellen. Welche Mittel stehen Konversationsteilnehmern zur Verfügung, um eine prosodische Anbindung (vgl. 2.3.1) vorzunehmen? Wie die Fo-Kontur des Beispiels (77) zeigt, kann auf der prosodischen Ebene die Verbindung dadurch hergestellt werden, daß das Offset-Niveau der ersten Intonationsphrase mit dem Onset-Niveau der zweiten Intonationsphrase übereinstimmt.51 5

"

51

Diese Differenzierung wurde von Auer (1991) nicht gesehen. Gleiches Offset- und gleiches Onset-Niveau beim Übergang zwischen zwei Intonationsphrasen könnte das

84 (77) China 26

Offset

ich hab son g a:: η:: ζ

t o: ll:e s dickes

Bu ch über Malaysia

Onset

son Bil der bu ch

Auf syntaktischer Ebene sind potentielle Satzglieder des Mittelfeldes, die erst im Anschluß an die rechte Satzklammer produziert werden, ein idealer Konstruktionstyp, um die Reparaturen syntaktisch anzubinden, denn sie bieten damit ein ideales Mittel, um die selbst- oder fremdinitiierte Reparatur sowohl in dem reparaturbedürftigen Redezug (same-turn repair) als auch innerhalb Redezugkonstruktionseinheit 'Satz' zu plazieren (same-sentence repair), ohne die Integrität dieser Konstruktionseinheit zu zerstören. Zwar ist mit der rechten Satzklammer ein möglicher Abschlußpunkt erreicht und die Konstituente wird in dem übergaberelevanten

Raum

(transition space, vgl. FN 39), d.h. unmittelbar nach dem möglichen Übergabepunkt produziert 5 2 , aber aufgrund der Tatsache, daß eine potentielle Mittelfeldkonstituente angeschlossen wird, gehört diese syntaktisch sowohl zu dem reparaturbedürfigen Redezug als auch zu der Konstruktionseinheit 'Satz'. Mittelfeldentleerungen stellen damit ein ideales Mittel dar, sowohl selbstinitiierte als auch durch Verzögerung subtil fremdinitiierte Selbstreparaturen durchzuführen, ohne daß die sequentiell implikative Kraft des reparaturbedürftigen Redezugs zugunsten einer Reparatursequenz aufgeschoben und damit u.U. aufgehoben wird: When next turn is used to initiate repair on something in current turn the sequential implicativeness of current turn is displaced from its primary home and is lost for at least that turn. Because other initiated repair in next turn itself engenders a sequence and is itself sequentially implicative, the sequential implicativeness of current turn is yet further displaced and potentially loses its organized locus of realization. (Schegloff: 1979: 267)

Die sequentielle Organisation bietet damit eine strukturelle Explikation dafür, daß selbstinitiierte und durch Verzögerung subtil fremdinitiierte Selbstreparaturen, die redezug- und satzintern durchgeführt werden, sowohl gegenüber redezugextemen selbstinitiierten Selbstreparaturen als auch gegenüber redezugextemen fremdinitiierten Selbstreparaturen präferiert sind. Es ist jedoch nicht so, daß sich die Konversation für die Durchführung dieser konversationellen Präferenzen eine "super-syntax" oder eine "syntax-for-conversation" schafft (vgl. das Zitat von Schegloff 1979: 283 in Kap. 1.2), indem sie die Regeln der Satzsyntax suspendiert. Es zeigt sich akustische Korrelat des latching-Symbols (=) in der konversationsanalytischen Transkriptionsnotation sein. 52

Zur Interaktion von Reparatur- und Sprecherwechselorganisation vgl. Schegloff, Jefferson & Sacks (1977: 372ff und FN 20).

85 vielmehr, daß - entsprechend der THESE 1 - in systematischer Weise genau die Spielräume genutzt werden, die die Satzsyntax des Deutschen läßt, indem sie Realisierung von bestimmten nicht-satzwertigen, mittelfeldfähigen Satzgliedern im Anschluß an die rechte Satzklammer zuläßt. Diese Spielräume werden dann für die Reparaturorganisation nutzbar gemacht.

2.4.4 Markierung der Informationsstruktur Die bisherige Analyse hat ergeben, daß Mittelfeldentleerungen in zwei potentiell konfligierende Systeme der Gesprächsorganisation eingebunden sind. Für die Organisation des Sprecherwechsels sind Mittelfeldentleerungen problematisch, aber bei der Reparaturorganisation sind sie ein idealer Konstruktionstyp, da sie gleichermaßen für fremd- und selbstinitiierte Selbstreparaturen eingesetzt werden können und die sequentielle Implikativität des reparierten Redzugs nicht aufschieben. Sowohl für die Organisation des Sprecherwechsels als auch für die Reparaturorganisation sind lokal regulative Systeme verantwortlich. So regelt das System der Redezugübernahme immer nur den Übergang von einem Redezug zum nächsten. Auch die Organisation von Reparaturen hat einen begrenzten Anwendungsbereich, der sich über zwei Sprecherwechsel hinweg von dem Redezug des Sprechers Α mit dem Reparandum über den nächsten Redezug des Sprechers Β bis zu einem dritten Redezug wiederum von Sprecher Α erstreckt (vgl. Schegloff 1992). Gesprächsteilnehmer in Konversationen sind aber nicht nur damit beschäftigt, ihre Redezüge in eine geordnete lineare Abfolge zu bringen und Verständigungsprobleme aus dem Weg zu räumen. Im Zentrum ihrer Interaktion stehen vielmehr die verschiedenartigsten verbalen Aktivitäten. Gesprächsteilnehmer berichten, erzählen, streiten; sie klatschen, flirten, erzählen Witze oder halten eine Konferenz ab. Und sie tun unendlich viel mehr als das. Ihre Gespräche dienen - so kann man auf der Suche nach einer Generalisierung vielleicht festhalten - der Übermittlung und dem Austausch von Informationen in einem weitest denkbaren Sinne. Diese Informationen müssen auf den verschiedensten Ebenen strukturiert werden, wobei die Produktion eines versprachlichten und dialogisch produzierten Textes der letzte Schritt einer hoch-komplexen kognitiven Leistung ist. 53 Damit diese Aktivitäten erfolgreich durchgeführt werden können, müssen die lokal regulativen Organisationsprinzipien durch allgemeine sowie durch parallel wirkende, Ubergreifende Systeme ergänzt werden. Ein zentrales allgemeines System ist das des rezipientenspezifischen Zuschnitts (recipient design): By 'recipient design' we refer to a multitude of respects in which the talk by a party in a conversation is constructed or designed in ways which display an orientation and sensitivity to the particular other(s) who are the co-participants. [...] we have found recipient design to operate with regard to word selection, topic 53

Vgl. dazu z.B. Klein & von Stutterheim (1991) und Mötsch, Reis & Rosengren (1990).

86 selection, admissability and ordering of sequences, options and obligations for starting and termination conversations, etc. [..^.Recipient design is a major basis for that variability of actual conversations glossed by the notion 'context-sensitive'. (Sacks, Schegloff & Jefferson 1974: 727)

Der rezipientenspezifische Zuschnitt regelt also u.a., daß Sprecher ihre Äußerungen an den speziellen Wissens- und Kenntnisstand des Rezipienten anpassen und ihm so die Dekodierungsarbeit erleichtern. Übergreifende Systeme müssen dagegen u.a. regeln, wie die verschiedensten Aktivitäten eröffnet und beendet werden. Sie sind jedoch nicht nur für die 'Ränder' sondern auch für die Binnenstruktur der Aktivitätstypen verantwortlich. Ein solches, übergreifendes System ist das der thematischen Organisation von Gesprächen, es regelt Aufbau und Strukturierung der zu übermittelnden Information. In der Sprachwissenschaft wird mit dem Begriff der Informationsstruktur54 die Dimension der funktionalen Gliederung von Sätzen erfaßt, die mit dichotomischen Unterscheidungen wie "Thema - Rhema", "Hintergrund - Fokus", "Topik - Fokus", "psychologisches Subjekt - psychologisches Prädikat", "Präsupposition - Fokus", "alte Information - neue Information" sowie "Topik - Kommentar" oder unter dem Stichwort "communicative dynamism" als skalare Eigenschaft beschrieben worden ist. Durch zahlreiche Arbeiten konnte gezeigt werden, daß die Fokus-Hintergrund-Gliederung einer der wichtigsten und ein vergleichsweise gut beschriebener Parameter der Informationsgliederung ist. 55 Ich will in diesem Abschnitt die Mittelfeldentleerungen im Lichte der Fokus-Hintergrund-Gliederung, der thematischen Organisation und des rezipientenspezifischen Zuschnitts näher betrachten, wobei die intonatorische Realisierung eine zentrale Rolle spielen wird. Ich beginne mit der Analyse der prosodisch unselbständigen Mittelfeldentleerungen. Schon bei der Auflistung der in der Literatur diskutierten Ebenen der Informationsgliederung kommt eine Idee zum Ausdruck, die die lineare Abfolge der Strukturierungselemente betrifft. Viele Autoren gehen nämlich davon aus, daß in der Regel, d.h. im unmarkierten Fall, der Hintergrund vor dem Fokus realisiert wird. Diese Ansicht vertritt auch Jacobs (1988a) in dem Präzedenzprinzip (P5). 56 Betrachtet man Informationsstrukturierung - und hier besonders die Mittelfeldentleeerungen - aber im Lichte der Organisation des Sprecherwechsels, so zeigt sich, daß die Befolgung dieses Präzedenzprinzips dem Sprecher systematisch Nachteile verschaffen kann. Fokussierte Satzglieder kommen in dieser Position in einen Bereich, der durch das Erreichen des Endes einer Konstruktionseinheit (rechte Satzklammer) vor der Produktion in

54

Vgl. dazu auch den von Jacobs (1992) herausgegebenen Sammelband zum Thema 'Informationsstruktur und Grammatik', der Einblick in den aktuellen Stand der Forschung gibt.

55

Vgl. z.B. Jacobs (1988b) und Uhmann (1991).

5

Als kohärenzstiftendes Prinzip auf der Textebene wird diese Art der Linearisierung unter dem Stichwort "Anschlußfunktion" auch in Mötsch, Reis und Rosengren (1989: 26f) diskutiert. Für die umgekehrte Informationsverteilung argumentiert dagegen Givön (1988).

®

Überlappung nicht mehr sicher ist. Sprecher nutzen daher diese Position regelmäßig aus, um Hintergrundinformation zu übermitteln, deren eventuelle Überlappung interaktiv unproblematischer wäre. Hintergrundinformation in Überlappung mit einem Rezipientensignal wird zum Beispiel in dem Redezug (94) produziert (vgl. Abschnitt 2.4.2). (94')

[n> [ H als die sie auf den Vortrag] [p ANgesprochen hat] [ H während der Tagung ]]

Betrachtet man die prosodische Realisierung solcher Beispiele, so zeigt sich, daß Sprecher bei dieser Abfolge in optimaler Weise von dem internen Aufbau der Intonationsphrase Gebrauch machen können. Wie bei der Beschreibung der Intonationsphrasenbildung in Abschnitt 2.3.1 mit den Fo-Konturen (Figur I) und (Figur IV) gezeigt wurde, können Hintergrundkonstituenten im Gegensatz zu der Position vor der bzw. den fokussierten Konstituenten aufgrund der IRegel 2 dann keinen eigenen Akzentton mehr erhalten, wenn sie nach der Fokuskonstituente realisiert werden (vgl. auch Uhmann 1991: 227f). Die Fo-Kontur einer Intonationsphrase zeigt in einem solchen Fall durch Akzenttöne hervorgerufene Fo-Veränderungen auf den akzentuierten Silben nur bis zur Fokuskonstituente, danach ist die Kontur bis zum Grenzton absolut flach. Der gleiche Intonationsverlauf zeigt sich bei dem Beispiel (94): (94) China 3

Hintergrundinformation enthalten auch die prosodisch unselbständigen Rechtsversetzungen mit einem pronominalen Bezugselement im Mittelfeld: (39) China 11 und China 15 11/01 T: und jetz meinte die Frau Mutz, 02 ich müßt "dringend mit Hern 'Köhlersen reden, ((ausführliche Diskussion warum das Gespräch notwendig geworden ist)) 15/01 T: ich 'frag dich dann nochmal, 02 weil: nachher 'treff ich mich mit dem 'Köhlersen= -> 03 =mal 'sehn was das er'gibt das Ge'spräch. Der interne Aufbau der Intonationsphrase erlaubt es aber auch, daß potentielle Konstituenten des Mittelfeldes zwar prosodisch unselbständig, nicht aber deakzentuiert werden. So können

88 Sprecher die Fokuskonstituente, und damit die prominenteste Konstituente der Intonationsphrase, erst nach der Satzklammer produzieren: (93) China 22 Ol T: in 'Malaysia is des so, -> 02 daß die 'Inder rüberkamen als "Gastarbeiter praktisch, Diese Konstituenten könnten vor möglichen Überlappungen geschützt sein, da in diesen Redezügen mit der Satzklammer zwar das Ende einer Konstruktionseinheit aber nicht das ebenfalls antizipierbare Ende der Intonationsphrase (vgl. dazu Auer 1996) erreicht ist. Darüberhinaus kann dieser Punkt oft auch aus semantischen Gründen nicht für einen möglichen Sprecherwechsel genutzt werden. Werden obligatorische Argumente im Anschluß an die rechte Satzklammer produziert, so kann diese vermutlich nicht einmal als Ende einer Konstruktionseinheit interpretiert werden: (84) China 6 -> 0 1 1 : Und=es war zu wenig 'festgemacht an 'Text l>ei'spielen. Auf der Suche nach Funktionen im Bereich der Informationsstrukturierung fällt auf, daß prosodisch integrierte, akzentuierte Konstituenten nach der Satzklammer, die in dieser Position zum Fokusbereich gehören müssen, als 'Fokusprojektionsverhinderer' fungieren können und die Bildung von zwei Akzentdomänen (AD) auch in den Fällen erzwingen, in denen bei der Position innerhalb des Mittelfeldes Integration (vgl. 2.3.1) zu erwarten wäre (Akzente werden wieder durch Kapitälchen und der letzte stärkste zusätzlich durch Unterstreichung notiert): (84') (a) [ I P [AD ES [ f war zu wenig FESTgemacht]] [AD AN TEXTbeispielen ]]]. (b)

[JP [AD ES [ F war zu wenig an TEXTbeispielen festgemacht]]].

Was könnte der Vorteil von (84'a) gegenüber (84'b) sein? Die prosodische Struktur von (84'b) ist im Gegensatz zu (84'a) bezüglich der Fokus-Hintergrund-Gliederung ambig. Bei dieser Akzentuierung (eine Akzentdomäne mit Akzentuierung des Fokusexponenten) ist auch die enge Fokussierung des Fokusexponenten (84'c) eine mögliche Fokus-Hintergrund-Gliederung: (84') (c) [JP [AD Es w a r

zu

wenig [p an TEXTbeispielen] festgemacht]].

Die prosodische Struktur in (84'd) hingegen ist bei dieser Fokus-Hintergrand-Gliederung nicht zulässig. Sie wäre nur bei enger Fokussierung des Verbs (84'e) wohlgeformt:

89 (84') (d) *[jp [AD ES war zu wenig [Ρ an TEXTbeispielen ]] (e)

FESTgemacht ]].

tip [AD ES war zu wenig an TEXTbeispielen ] [ ^ [p EESIgemacht ]]].

Die gewählte Form (84'a) vermeidet Ambiguitäten bei der Fokus-Hintergrund-Gliederung und wird der Informationsgliederung in Is Beitrag optimal gerecht. Eine weitere Möglichkeit zur Informationsstrukturierung, die ebenfalls von dem internen Aufbau der Intonationsphrase optimalen Gebrauch macht, findet sich in dem gerade diskutierten Beispiel (84) sowie in (96). Es handelt sich um die emphatische Hervorhebung fokussierter Konstituenten. Die über die Fokussierung hinausgehende besondere emphatische Hervorhebung dieser Konstituente und ihre besondere Relevanz für den Rezipienten und die Entwicklung des Themas wird durch ihre prosodische Realisierung kontextualisiert^. In Uhmann (1991: 258f) wurde gezeigt, wie durch eine intonationsphonologische Erhöhung der metrischen Prominenz phonetische Effekte, nämlich die Erhöhung des Tonumfangs des Akzenttons, erzielt werden können. Die Erhöhung der metrischen Prominenz kann nur auf einer Silbe durchgeführt werden, aber sie kann besonders am Ende der Intonationsphrase auch auf allen Silben der fokussierten Konstituenten angewendet werden. Als Resultat erhalten alle diese Silben einen eigenen Tonakzent. Auditiv wird eine so realisierte Konstituente mit silbenzählendem Rhythmus und mit besonders langsamer Sprechgeschwindigkeit wahrgenommen.58 Dies geschieht in Beispiel (96) in Zeile 02: (96) China 9 -> 01 T: Ich 'muß übrigens heut noch zum 'Köhlersen 'um 'drei0; = -> 02 =weils 'Schwierigkeiten gibt mit dem 'PeTdng'auf 'ent Tialt, Doch auch das Gegenteil kann durch prosodische Gestaltung erreicht werden: Sprecher können eine zum Fokusbereich gehörende Konstituente als weniger relevant für den Rezipienten und für die Weiterentwicklung des jeweiligen Themas kontextualisieren. Dies geschieht durch Deakzentuierung und Senkung der Lautstärke. Die Deakzentuierung wird über eine Absenkung der metrischen Prominenz und über den Verzicht auf die Zuteilung eines Akzenttons erreicht. Diese beiden Kontextualisierungsverfahren werden in dem Beispiel (96) nacheinander verwendet - als Teil des rezipientenspezifischen Zuschnitts von Äußerungen und zur Erleichterung der Dekodierungsarbeit des Rezipienten: 57

Mit dem Konzept der Kontextualisierung haben Cook-Gumperz & Gumperz (1976/1978) einen Forschungsansatz entwickelt, in dem Kontext und Kontextwissen keine von der Interaktion unabhängigen Entitäten sind, die unidirektional auf die Handelnden Einfluß nehmen, sondern die Interaktanten bauen den Kontext mithilfe von "Kontextualisierungshinweisen" (Prosodie, Code-switching etc.) zusammen mit ihren Handlungen auf und machen diese interpretierbar. Vgl. dazu auch Gumperz (1992a,b) sowie Kap. 1. Zur Unterscheidung von akzent- und silbenzählendem Rhythmus vgl. Auer & Uhmann (1988) und Kap. 3.2. Zum Konzept der Relevanz vgl. Sperber & Wilson (1986) und zur Kontextualisierung von Relevanzunterschieden durch Veränderung der Sprechgeschwindigkeit vgl. Uhmann (1992) sowie Kap. 4.

90 (96) China 9:01, niedrige Relevanz: [-Emphase]

ich muß heut übrigensnochzum

Köh 1er sen um

drei:

(96) China 9: 02, hohe Relevanz: [+Emphase]

!I

weils Schwierigkeiten gibt mit dem

Pe:: k i n g a u f e n t h a l t

Ich möchte abschließend nun solche Mittelfeldentleerungen betrachten, die in einer eigenen Intonationsphrase realisiert werden. In diesem Fall ist die völlige Deakzentuierung nicht möglich, da der Aufbau einer wohlgeformten Intonationsphrase mindestens eine akzentuierte Silbe mit einen Akzentton erfordert (vgl. I-Regel 1). Sprecher haben aber auch hier die Möglichkeit Stufen von Relevanz zu kontextualisieren. Sie tun dies, wie die Beispiele (82) und (103) zeigen, über die Ausdehnung des Tonumfangs (pitch range) der Intonationsphrase. Dabei stuft eine Verengung des Tonumfangs die Relevanz herab, während eine Erweiterung sie erhöht: (116) China 2, enger Tonumfang: [-Relevanz]

da·war ich zufällig im' Ei:: s c a : : f e : : : :

(0,5)

mitdem Kars ten

(103) China 11, weiter Tonumfang: [+Relevanz]

}• j

unda habich das

1 ! . 1

ge b u :: cht ( 0 . 4 )

r • ι· • >Κ

vr

/1 i λ»; ' h

" mit

vier Tage

t

V•

Η

Aufenthalt in

Ρ e :k i η g

Wie aber in Abschnitt 2.4.2 mit Beispiel (98) und in Abschnitt 2.4.3 mit den Beispielen (105) und (79) gezeigt wurde, sind gerade die in einer eigenen Intonationsphrase produzierten fokussierten Konstituenten durch das Erreichen der rechten Satzklammer überlappungsgefährdet (Die Transkripte werden hier ausschnittsweise noch einmal wiederholt.): (98) China 21 03 I: Der eine (0.5) war ma ver'droschen worden, 04 vonner 'ganzen (0.3) 'Horde chinesischer Kommili'ton; 05 "weil 'er sich erdreistet hatte, 06 eine 'Chi'ne'sin 'zum "Tee einzuladen;= ->

07 = l'nachmit I tags 08 Τ: I Nein::! 1=

(105) China 01 Τ 02 T: 03 04 05 I: -> 06 Τ: 07 I:

7f Mensch hoffentlich kommt se rechtzeitig, die mußteja nach 'Freiburg; (0.7) 'hh zum 'Kul I tusmi I nisterium.= I hmhm I = Γ wegen I der Sla'vistik.' I warum? I

(79) China 38 01 T: und die 'liegen dann meistens 'toll; -> 02 I 'mitten in der 'Stadt; I 03 I: I und ist nicht I total überlaufen Doch auch hier zeigt eine genauere prosodische Analyse, daß mögliche Überlappungen dieser fokussierten Konstituenten mit dem Beginn eines nächsten Redezugs systematisch vermieden werden können. Das ist nämlich dann möglich, wenn die Konstituenten außerhalb der Satzklammer von den Sprechern, wie in den Beispielen (115) und (103) und Beispiel (105) Zeile 04, nicht in direktem Anschluß an die Satzklammer, sondern erst nach einer kurzen Pause produziert werden:

92 (115) China (2) 01 Τ: Die war auch total unsicher 02 als ich sie mal getroffen hab; 03 da war ich 'zufällig mal im 'Eiscafe: (0.5) -> 04 mit dem 'Karsten, 05 'wollt grad gehn, (103) China 11 01 T: un=da hab ich das ge'bucht, (0.4) -> 02 mit 'vier Tage 'Aufenthalt in 'Peking, 03 und jetz meinte die Frau Matz, (105) China 01 T: 02 T: 03 -> 04 05 I: 06 T: 07 I:

7f Mensch hoffentlich kommt se rechtzeitig, die mußteja nach'Freiburg; (0.7) 'hh zum 'Kul I tusmi I nisterium.= I hmhm I = 1° wegen I der Sla'vistik." I warum? I

Nach dieser Pause ist der iibergaberelevante Zeitraum verstrichen, ohne daß ein anderer Geprächsteilnehmer über Selbstwahl einen nächsten Redezug begonnen hat (vgl. Regel (lb) Abschnitt 2.4.2). Nach den Regeln der Redezugverteilung hat der gegenwärtige Sprecher nun die Möglichkeit, seinen Redezug fortzusetzen (vgl. Regel (lc) in Abschnitt 2.4.2). Darüberhinaus ist auch die Wahl des intonationsphrasenfinalen Grenztons wichtig. Betrachtet man nämlich die Beispiele (98), (105 Zeile 06) und (79), so zeigt sich, daß Überlappungen dann vorkommen, wenn die Sprecher potentielle Konstituenten des Mittelfeldes nach einem tiefen Grenzton, in einer eigenen Intonationsphrase und in direktem Anschluß realisierten: Ohne Pause zwischen den Intonationsphrasen werden sie im übergaberelevanten Raum und in Überlappung mit dem Beginn des nächsten Redezugs produziert. Bei den anderen Beispielen (115,103,105) findet sich hingegen kein tiefer finaler Grenzton. Gerade im Bereich der Informationsgliederung, so kann man zusammenfassend festhalten, zeigt sich also besonders deutlich, in welchem Umfang die Gesprächsteilnehmer von den Spielräumen Gebrauch machen können, die ihnen Satzssyntax und Intonationsphonologie offenlassen. Prosodisch integrierte Mittelfeldentleerungen können in dieser Position deakzentuierte Hintergrundinformation, aber auch akzentierte Fokusinformation sein. Letztere fungieren, so konnte gezeigt werden, als Fokusprojektionsverhinderer. Da die Intonationsphonologie keinerlei Beschränkungen für den ausgeschöpften Tonumfang vorgibt, haben Sprecher hier die Gelegenheit, Relevanz und Emphase zu kontextualisieren. Das gleiche gilt natürlich für die prosodisch selbständigen Mittelfeldentleerungen, diese sind Fokuskonstituenten und dienen darüberhinaus auch der Durchführung und syntaktischen Anbindung von Selbstreparaturen.

93

2.5

Zusammenfassung

Ein erstes Ziel dieses Kapitels war im Anschluß an die Vorstellung von zwei konkurrierenden Modellen zur Analyse von Worstellungsregularitäten im Mittelfeld (2.1) die Beantwortung der Frage (2.2), inwieweit die von Jacobs und Hawkins entwickelten Modelle auch für konversationeile Daten aus natürlichen Konversationen einschlägig und aussagekräftig sind. Zu diesem Zweck wurden 290 Mittelfelder quantitativ ausgewertet und in bezug auf ihre Mittelfeldbesetzung analysiert. Es zeigte sich zum einen (2.2.1), daß Mittelfelder in natürlichen Konversationen Eigenschaften aufweisen, denen die anhand von Beispielsätzen oder literarischen Texten entwickelten Modelle nicht gerecht werden: In natürlichen Konversationen ist das Mittelfeld nämlich nicht das "Hauptfeld", in dem "vielfach sämliche Ergänzungen und Adverbiale des Satzes (Eisenberg 1989: 417) enthalten sind. Das Mittelfeld wird vielmehr auf unterschiedliche Weise in seiner potentiellen Komplexität reduziert. So enthalten 64% aller Mittelfelder mindestens eine Pro-Form, während nur 3,4% mehr als ein nicht-pronominal realisiertes Argument enthalten. Auch unter Mitberücksichtigung der Modifikatoren erhöht sich die Anzahl nur auf insgesamt 13%. Mehr als zwei nicht-pronominale Stellungsglieder im Mittelfeld sind in dem gesamten Korpus nur in 4 Redezügen (1,3%) zu finden. Darüberhinaus ergab sich bei der Anwendung der beiden Modelle von Jacobs und Hawkins auf die Mittelfeldaten (2.2.2) ein leichter Vorsprung zugunsten von Jacobs' Theorie. Aufgrund des geringen Datenmaterial wurde Hawkins' statistische Theorie jedoch auch nicht widerlegt. Doch nicht nur häufige Pronominalisierungen kennzeichnen die wenig komplexen Mittelfelder in natürlichen Konversationen - das Mittelfeld wird auch häufig entleert, indem nichtsatzwertige, mittelfeldfähige Satzglieder erst nach der rechten Satzklammer produziert werden. Potentielle Satzglieder des Mittelfeldes wurden statt im Mittelfeld in 25% der untersuchten Redezüge erst im Anschluß an die rechte Satzklammer realisiert. Diese Mittelfeldentleerungen wurden zunächst in den Abschnitten 2.3.1 und 2.3.2 auf ihre prosodischen und syntaktischen Eigenschaften hin analysiert und unter der Annahme einer vollständigen Unabhängigkeit von Syntax und Intonation in diesem Datenbereich wurden in 2.3.3 dann acht, noch vorläufige Formtypen von Mittelfeldentleerungen in natürlichen Konversationen vorgestellt. Es konnte gezeigt werden, daß Mittelfeldentleerungen weder syntaktisch noch prosodisch Formen aufweisen, die über die grammatisch zulässige Variation in diesen beiden Teilsystemen des sprachlichen Wissens hinausgehen. Es ergab sich also keinerlei Hinweis auf die Notwendigkeit einer "syntax-for-conversation" oder einer "phonology-for-conversation". Vielmehr deuten die Formanalysen dieses Kapitels auf die Gültigkeit von THESE 1 hin. Der Abschnit 2.4 Untersuchung sollte über die Analyse der spezifischen interaktiven Bedingungen natürlicher Konversationen eine Antwort auf die Frage geben, warum Konversationsteilnehmer Mittelfeldentleerungen vornehmen oder warum sie darauf verzichten. Während

94 sich Jacobs' Modell auf diesen Datenbereich nicht mehr anwenden läßt, müßte sich Hawkins mit seinem produktionsund perzeptionsorientierten Modell gerade an solchen Extrapositionsdaten aus natürlichen Konversationen messen lassen. Seine These, die syntaktische Komplexität und die Verbesserung der EIC-Werte mit dem Ziel, dem Rezipienten ein möglichst effizientes Parsen zu ermöglichen, sei der entscheidende Faktor bei der Realisierung der linearen Abfolge der Stellungsglieder, müßte auch für Mittelfeldentleerungen einschlägig sein. Die Analyse der Daten in 2.4.1 hat ergeben, daß von 56 Mittelfeldentleerungen in 52 Fällen eine Verbesserung der EIC-Werte erzielt wird, diesen stehen jedoch 39 Fälle gegenüber, bei denen die Sprecher auf eine mögliche Mittelfeldentleerung und damit auf die Möglichkeit zur Verbesserung der EIC-Werte verzichtet haben. Hawkins1 Hypothese, die Verbesserung der EICWerte sei die treibende Kraft bei der Veränderung der linearen Abfolge von Stellungsgliedern, konnte damit für diesen Datenbereich nicht bestätigt werden. Auf der Suche nach Funktionen von Mittelfeldenteerung und nach foördernden bzw. hemmenden Bedingungen wurden in 2.4.2 die Organisation des Sprecherwechsels, in 2.4.3 die Durchführung von Selbstreparaturen und in 2.4.4 die Markierung von Informationsstrukturierungen untersucht. Mit der rechten Satzklammer - so konnte in 2.4.2 gezeigt werden - hat der Redezug eines Sprechers das Ende einer Redezugkonstruktionseinheit und damit einen konversationeilen Ort erreicht, an dem ein Sprecherwechsel aufgrund der Antizipierbarkeit des Endes von Konstruktionseinheiten in "recognitional terminal overlap" (Jefferson 1983a) vollzogen werden kann, wenn nach der Satzklammer weitere potentielle Konstituenten des Mittelfeldes produziert werden. Die Analyse läßt jedoch auch erwarten, daß Mittelfeldentleerungen in Gesprächen mit mehr als zwei Teilnehmern und stärkerer Konkurrenz um die Erlangung des Rederechts häufiger von der Produktion in Überlappung betroffen sind, oder daß Sprecher auf Mittelfeldentleerungen verzichten, um ihren Rezipienten nicht über das Ende einer Redezugkonstruktionseinheit auch eine Stelle für einen möglichen Sprecherwechsel zu liefern. Dieser aufgezeigte Nachteil im Bereich der Organisation des Sprecherwechsels wird aber durch vielfältige Funktionen von Mittelfeldentleerungen bei der Reparaturorganisation und der Informationsstrukturierung ausgeglichen. Die Vielfalt dieser Funktionen zeigt sich allerdings erst bei einer sorgfältigen Analyse der prosodischen Realisierung. Wie die Übersicht (119) zeigt, lassen sich durch eine genaue Intonationsanalyse neun verschiedenen Formtypen ermitteln, die sowohl grammatische (FokusHintergrundgliederung) und als auch konversationelle (Reparaturorgansisation) Funktionen übernehmen:

95 (119) Formen und Funktionen der Mittelfeldentleerung SYNTAX c g y •g / g> \

[- Bezugselement]

8 β

Ν

Pronomina u. Pro-Formen Andere Konstituenten

INTONATION •

FUNKTION

1 IP

Hintergrund

Ν 2 IPs

Hintergrund/Reparatur

•

IIP

selbstinitiierte Selbstrep.

\

2 IPs

fremdinitiierte Selbstrep.

• 1 IP^

deakzentuiert akzentuiert 1

»p.

j

Hintergrund Fokus / Reparatur keine Fokusprojektion [+Emphase]

eng

Fokus [- Relevanz] t weit

^

Fokus / Reparatur Fokus [+ Relevanz]

Die in der Übersicht in Abschnitt 2.3.3 vorgenommene einfache Unterscheidung zwischen prosodisch selbständigen (2 IPs) und prosodisch unselbständigen Mittelfeldentleerungen (1 IP) muß für die Konstruktionstypen, die kein Bezugselement im Mittelfeld aufweisen, weiter differenziert werden, weil prosodisch unselbständige deakzentuierte und prosodisch unselbständige akzentuierte Konstituenten außerhalb des Mittelfeldes funktional nicht äquivalent sind. Außerdem wird bei der prosodischen Selbständigkeit noch der ausgeschöpfte Tonumfang der Intonationsphrase zur weiteren Funktionsdifferenzierung genutzt. Die Mittelfeldentleerungen mit einem pronominalen Bezugselement dienen im wesentlichen der Hintergrundmarkierung. Werden diese Rechtsversetzungen in einer eigenen Intonationsphrase realisiert, können sie auch im Dienste der Reparaturorganisation stehen. Mittelfeldentleerungen mit einem nicht-pronominalen Bezugselement dienen der syntaktischen Anbindung von fremd- und selbstinitiierten Selbstreparaturen, wobei erstere in zwei und letztere in einer Intonationsphrase realisiert werden. Es konnte gezeigt werden, daß die sequentielle Organisation von Reparaturen eine strukturelle Explikation dafür bietet, daß selbstinitiierte und durch Verzögerung subtil fremdinitiierte Selbstreparaturen, die redezug- und satzintern durchgeführt werden, sowohl gegenüber redezugexternen selbstinitiierten Selbstreparaturen als auch gegenüber redezugextemen fremdinitiierten Selbstreparaturen präferiert sind. Es konnte jedoch auch nach der detaillierten Funktionsanalyse nicht gezeigt werden, daß sich die Konversationsteilnehmer - wie von Schegloff (1979) postuliert - für die Realisierung dieser konversationellen Präferenzen eine "super-syntax" oder eine "syntax-for-conversation" schaffen, indem sie für

96 die Reparatursyntax die Regeln der Satzsyntax suspendieren. Es zeigt sich vielmehr, daß sie in systematischer Weise genau die Spielräume nutzen, die die Satzsyntax des Deutschen zur Verfügung stellt, indem sie die Realisierung von bestimmten nicht-satzwertigen, mittelfeldfähigen Satzgliedern im Anschluß an die rechte Satzklammer zuläßt. Die Mittelfeldentleerungen ohne Bezugselement stehen über eine differenzierte prosodische Gestaltung primär im Dienste der Informationsstrukturierung. Die prosodisch unselbständigen, deakzentuierten Konstituenten liefern Hintergrundinformation. Die prosodisch unselbständigen akzentuierten Konstituenten gehören zum Fokus des Redezugs. In dieser Position verhindern sie jedoch die Fokusprojektion, und sie können darüberhinaus durch einen silbenzählenden Rhythmus auch emphatisch hervorgehoben werden. Sowohl prosodisch unselbständige als auch prosodisch selbständige, akzentuierte Konstituenten finden jedoch auch bei der Durchführung und syntaktischen Anbindung von Reparaturen Verwendung. Die Relevanz der fokussierten Konstituenten kann darüberhinaus optimal über die Ausdehnung des Tonumfangs kontextualisiert werden. Erst durch die konversationsanalytische Betrachtung von Daten aus Alltagsgesprächen konnte gezeigt werden, daß eine monofunktionale Analyse von Mittelfeldentleerungen, sei es eine grammatische oder eine interaktive, zu kurz greifen würde. Nur ein grammatischer und konversationelle Analysen verbindender Ansatz kann Mittelfeldentleerungen im Spannungsverhältnis zwischen Grammatik, Organisation des Sprecherwechsels, Reparaturorganisation, Informationsstrukturierung und Kontextualisierung betrachten. Im Rahmen dieses Spannungsverhältnisses kann auch der Grund für die ähnliche Verteilung von vorgenommenen und unterlassenen Mittelfeldentleerungen in natürlichen Konversationen gefunden werden.

3. Rhythmus und Akzent: Akzentzusammenstöße in Bewertungssequenzen

Thema dieses Kapitels ist ein rhythmisches Phänomen, das unter dem Stichwort "beat clash", im folgenden als Akzentzusammenstoß bezeichnet, in der Literatur diskutiert worden ist. Weil Akzentzusammenstöße das phonologische Prinzip der rhythmischen Alternanz verletzen, werden sie in der metrischen Phonologie als nicht wohlgeformt eingestuft und über Wohlklangsregeln aufgelöst. Bei der Analyse konversationeller Daten zeigt sich jedoch, daß Sprecher in natürlichen Konversationen Akzentzusammenstöße systematisch produzieren, indem sie lexikalisch unakzentuierte Silben über eine Erhöhung der metrischen Prominenz in akzentuierte verwandeln. Da gezeigt werden kann, daß Akzentzusammenstöße Emphase und Intensivierung kontextualisieren, sollten sie ein Paradebeispiel eines rein stilistisch-pragmatischen Phänomens sein und die als THESE 2 in Kapitel 1 formulierte Annahme belegen, daß grammatische Regeln zumindest teilweise von Regeln der Gesprächsorganisation oder von Kontextualisierungskonventionen suspendiert werden können, weil in natürlichen Konversationen Formen Verwendung finden, die über die grammatisch zulässige Variation hinausgehen. Ich werde jedoch belegen, daß Akzentzusammenstöße nur unter Berücksichtigung eines komplexen Zusammenspiels konversationeller Strategien und grammatischer Regeln adäquat beschrieben werden können und daß im Gegenteil auch dieses Phänomen die THESE 1 untermauert. Im Zuständigkeitsbereich konversationeller Organisation läßt sich zeigen, daß Akzentzusammenstöße vor allem in solchen Redezügen vorkommen, in denen Bewertungen vorgenommen werden. Diese generelle Aussage muß jedoch weiter präzisiert werden: Akzentzusammenstöße finden sich in elaborierten ersten Bewertungen wie Geschichten, Neuigkeiten oder Informationen und in den zweiten Bewertungen, die die Rezipienten dieser konversationeilen Objekte liefern. Akzentzusammenstöße finden sich dagegen nicht in Bewertungssequenzen, die im Paarsequenzformat als Bewertung und Gegenbewertung produziert werden. Diese Verteilung ist aber nicht zufällig, sondern systematisch und kann unter Rekurs auf die Präferenzorganisation in Bewertungssequenzen und die Kontextualisierungsfunktion von Akzentzusammenstößen erklärt werden. Im Zuständigkeitsbereich der Akzentphonologie muß zunächst das Prinzip der rhythmischen Alternanz präzisiert werden. Akzentzusammenstöße sind zwar rhythmisch markierte Strukturen, aber sie sind zumindest unter bestimmten Bedingungen nicht ungrammatisch. Hier spielen die in Kapitel 2.3.1 vorgestellten P-Regeln eine entscheidende Rolle, denn die P-Regeln können z.B. bei Elativkomposita Akzentzusammenstöße erzeugen, die auch nicht durch Wohlklangsregeln aufgelöst werden dürfen. Das entscheidende Argument ist jedoch, daß die von den P-Regeln erzeugten Prominenzrelationen und die I-Regeln zum Aufbau wohlgeformter

98 Intonationsphrasen auch dann wirksam bleiben, wenn Sprecher Akzentzusammenstöße produzieren, um Emphase zu kontextualisieren. Entsprechend der THESE 1 können wieder nur genau die Spielräume genutzt werden, die bei der Gestaltung wohlgeformter Intonationsphrasen in der Akzentphonologie offen bleiben. Das Kapitel beginnt in Abschnitt 3.1 mit der Analyse der konversationellen Organisation von Bewertungen: Bewertungspaarsequenzen (Bewertungen,Gegenbewertungen) sowie Nachrichten und Kommentare. In Abschnitt 3.2 werden Akzentzusammenstöße in der metrischen Phonologie und die Ableitung der Elativakzentuierung aus den P-Regeln des Kapitels 2.3.1 und in natürlichen Konversationen diskutiert. Es folgen in 3.3 die Analyse der konversationellen Restriktionen von Akzentzusammenstößen in Kommentaren, Nachrichten und Bewertungspaarsequenzen. Die grammatischen Restriktionen werden in Abschnitt 3.4 vorgestellt. In Abschnitt 3.5 werden die Ergebnisse zusammengefaßt.

3.1

Zur konversationellen Organisation von Bewertungen

Was auch immer als Thema eines Gesprächs gewählt wird, Bewertungen sind ein unerläßlicher Bestandteil von Alltagskonversationen. Über eine Person, ein Ereignis oder eine Erfahrung zu sprechen und diese Person, das Ereignis oder die Erfahrung zu bewerten, scheinen zwei eng miteinander verknüpfte und manchmal kaum voneinander trennbare Aktivitäten zu sein. Betrachtet man Bewertungen jedoch im Rahmen konversationeller Strategien, so lassen sich analytisch wichtige Aspekte auch terminologisch trennen. Im folgenden werden unterschieden: (i) der bewertete Sachverhalt oder Referent, das Evaluandum, (ii) die sprachlichen Mittel zur Bewertung, lexikalische Bewertungsausdrücke wie toll, irrsinnig, Bilderbuchstrand etc. und lexematische Interjektionen wie ahhh oder ohh sowie Bewertungsvokalisationen1 wie inhalatorisches haaa oder ingressives ts [I], (iii) die Person, die einen Bewertungsausdruck oder eine Bewertungsvokalisation verwendet, der Bewerter,

und (iv) der Redezug oder die

Äußerung, die einen Bewertungsausdruck oder eine Bewertungsvokalisation enthält, die Bewertung (vgl. auch Goodwin & Goodwin 1992: 154f). Da Konversationen darüber hinaus als sequentiell geordnete Abfolgen sprachlicher Aktivitäten verschiedener Sprecher betrachtet werden können, lassen sich unterschiedliche Lokalisationen von Bewertungen feststellen. So kommen Bewertungsausdrücke systematisch in Redezügen vor, denen direkt ein Redezug eines anderen Sprechers vorangeht, der ebenfalls einen bewertenden Ausdruck enthält.

Zur Nähe von Affektlauten (Scherer 1977) zu lexematischen Interjektionen vgl. Fries (1990, 1992b). Zur Analyse von "response cries" vgl. Goffman (1978) und zur tonalen Realisierung von Interjektionen vgl. Clement & Thümmel (1975: 22f), Ehlich (1986) sowie Goodwin (1986: 214).

99 3.1.1 Bewertungen und Gegenbewertungen Zwei aufeinanderfolgende Redezüge, eine initiale oder erste Bewertung von Sprecher A, der eine zweite Bewertung oder Gegenbewertung von Sprecher B, dem Rezipienten der ersten Bewertung, folgt, werden im folgenden dann als Bewertungs(paar)sequenz2 bezeichnet, wenn das Evaluandum von Bewertung und Gegenbewertung identisch ist (vgl. Pomerantz 1975, 1984 und Auer & Uhmann 1982). Die Paarsequenz wurde schon in Kapitel 2.4.3 kurz thematisiert; da Paarsequenzen aber für die Organisation von Bewertungen eine besonders wichtige Rolle spielen, seien ihre wichtigsten strukturellen Merkmale hier noch einmal wiederholt. Bei der Paarsequenzorganisation handelt es sich um zwei zu einem Äußerungsformat fest verbundene, von zwei verschiedenen Sprechern produzierte Äußerungen, wobei ein erstes Paarglied einem ganz bestimmten zweiten vorangeht und dieses konditionell relevant (conditionally relevant) macht, d.h., für den Rezipienten obligatorisch und für den Produzenten erwartbar. Sobald also ein erstes Paarglied, hier eine erste Bewertung, für den Rezipienten erkennbar produziert wurde, sollte der Sprecher an der ersten übergaberelevanten Stelle (transition-relevance place)3 seinen Redezug beenden, um dem Rezipienten in dem durch das erste Paarglied vordeterminierten Raum Gelegenheit zur unmittelbaren Produktion des typgerechten zweiten Paarglieds, hier der zweiten Bewertung, zu bieten. Da Bewerter für die von ihnen vertretenen Positionen verantwortlich gemacht werden, kommen Bewertungssequenzen zustande, wenn auch dem Rezipienten der ersten Bewertung das Evaluandum bekannt ist. Aber aus der Tatsache, daß das Evaluandum wechselseitig bekannt ist, folgt noch nicht, daß die Konversationsteilnehmer seine Bewertung teilen. Wenn man die Beziehung zwischen erster und zweiter Bewertung betrachtet, so kann man feststellen, daß Rezipienten erster Bewertungen zwei Handlungsalternativen zur Verfügung stehen: Sie können mit der ersten Bewertung übereinstimmen und eine gleichlaufende zweite Bewertung produzieren, oder sie können ihr nicht zustimmen und eine gegenlaufende zweite Bewertung produzieren. Diese beiden Alternativen, Übereinstimmung und Nichtübereinstimmung, sind allerdings keineswegs gleichwertig, sondern durch ein mehrschichtiges, konversationelles Präferenzsystem für zweite Bewertungen beschränkt, das sich an der konversationellen Aktivität orientiert, die mit der ersten Bewertung eröffnet wird: In den meisten Bewertungssequenzen ist die Übereinstimmung präferiert; die Nichtübereinstimmung ist nur dann präferiert, wenn die erste Bewertung eine Selbstkritik oder ein Kompliment ist, da Übereinstimmung in diesen Obwohl Pomerantz den Begriff "adjacency pair" nicht verwendet, weist sie doch auf die normative Erwartbarkeit der zweiten Bewertung hin: "the initial assessment provides the relevance of the recipient's second assessment" (Pomerantz 1984: 61). Zur konditionellen Relevanz und zu strukturellen Eigenschaften von Paarsequenzen vgl. Sacks, Schegloff & Jefferson (1974: 716ff), Schegloff (1978: 84f) und FN 45 Kapitel 2. Zur Organisation des Sprecherwechsels vgl. Kapitel 2.4.2.

100 beiden Fällen die Bestätigung der Kritik bzw. ein dispräferiertes Eigenlob wäre. Im Fall von Komplimenten ist darüberhinaus zugleich die Annahme präferiert (Pomerantz 1978). Für die Mehrzahl der Bewertungssequenzen gilt jedoch, daß Übereinstimmung präferiert und Nichtübereinstimmung dispräferiert ist: [...] across different situations, conversants orient to agreeing with one another as comfortable, supportive, reinforcing, perhaps as being sociable and as showing that they are like-minded. (Pomerantz 1984: 77) 4

Daß eine der beiden Handlungsalternativen präferiert ist, heißt nun nicht nur, daß es den meisten Konversationsteilnehmern schlicht angenehmer ist, wenn sie gleichlaufende und nicht gegenlaufende Bewertungen produzieren, sondern daß es ganz unabhängig von den Einstellungen der Beteiligten ein System konversationeller Organisationsprinzipien gibt, das präferierte Handlungsalternativen von dispräferierten formal abgrenzt, indem dispräferierte Reaktionen u.a. vermieden, verzögert oder zurückgehalten werden. Die folgenden Transkriptausschnitte können einen ersten Hinweis darauf geben, daß sich Konversationsteilnehmer tatsächlich an einem formalen Präferenzsystem für gleichlaufende Bewertungen orientieren, und sie tun dies unabhängig davon, ob sie sich über Männer, Zigaretten, Antiquitätengeschäfte, Segler, das Wetter oder Professoren unterhalten. Die erste Bewertung wird durch einen Stern (*) die zweite durch zwei Sterne (**) markiert: (1)

Hundertfünfzig 4 01 H: Wie alt, 02 X: Ja:: so:: sechsenzwanzig glaub=ich * 03 H: "Schö::nes Alter ** 04 X: Ja ne hehe (0.8) 'best(h)en 'Jah(h)re

(2) *

Florian 1026 Ol X: es is vielleicht ganz "praktisch; 02 mein die könn das dann auch noch so mit der Zunge von 03 'einem Mundwinkel in den 'anderen schieben I ne,l ** 04 T: Ija I is scho(h)n faszinierend,

(3)

Antiquitäten 1 Ol N: also (.) mmh (.) dieser Antiquitätenladen da euch gegenüber, * 02 also der hat ja schon nen mords Verhau in sein Laden= 03 X: = wie, wo? ah=so ** 04 ja da siehts schon oft ganz grauenvoll aus;

Vgl. auch Goodwin & Goodwin (1992: 182): "[...] the activity of performing assessments constitutes one of the key places where participants negotiate and display to each other a congruent view of the events that they encounter in their phenomenal world. It is thus a central locus for the study of the 'shared understandings' that lie at the heart of the anthropological analysis of culture".

101 (4) Seglerinnen 3 * 01A: all die 'Segler sin da 'glücklich draußen, ne, ** 02 B: haja die sin ganz (.) happy. (5) *

Innocenti 1 Ol X: verdammte Hitze 02 da kriegsch ja das Schädelbrummen daß ois aus is; ** 03 Ν: ja heut isch verdammt schwül,

(6) *

Roro410 Ol S: 02 X: 03 S: 04 So: 05 S: ** 06 Χ:

h der isch eine trübe Tasse'meine G(h)üt(h)e warum? hhe wenn der da unten reinkommt (0.5) hehe (.(h)..) (dann) gehts (dann) wenn=er=scho anfängt zu redn aoah! I also i weiß •(net)" I I naja der hat so ne gewisse (Art) I

Betrachtet man die semantischen Relationen, in denen zweite Bewertungen zu den initialen Bewertungen stehen können, so handelt es sich bei den Beispielen (1) und (2) um Übereinstimmungen mit eskalierten zweiten Bewertungen (upgraded assessments), denn schönes Alter wird zu besten Jahren. Im Beispiel (6) findet sich dagegen eine deskalierte zweite Bewertung (downgraded assessment), denn trübe Tasse wird zu so ne gewisse Art. Die Beispiele (3), (4) und (5) enthalten weder eskalierte noch deskalierte zweite Bewertungen, trotzdem können sie im Rahmen der Pomerantzschen Klassifizierung nicht als niveaugleiche Bewertungen (same assessments) eingestuft werden, da sie nur solche Bewertungen als niveaugleich einstuft, bei denen der Bewertungsausdruck entweder mit hinzugefügtem too wiederholt wird (schön - auch schön) oder aber eine Pro-Form enthält (eine kluge Frau - das ist sie). Zumindest für das Deutsche (vgl. Auer & Uhmann 1982) muß das Konzept niveaugleicher zweiter Bewertungen jedoch dergestalt erweitert werden, daß es auch solche Bewertungen erfaßt, die - wie in den Beispielen (3) bis (5) - als semantisch 'gleich' empfunden werden (mords Verhau - ganz grauenvoll, glücklich - happy, verdammte Hitze - verdammt schwül), damit diese nicht willkürlich den Eskalierungen oder Deskalierungen zugeordnet werden müssen. Verläßt man jedoch die semantische Bezugsebene und betrachtet die sequentielle Organisation von ersten und zweiten Bewertungen, so zeigt sich, daß die dreidimensionale Unterscheidung auf eine zweidimensionale reduziert werden muß: Niveaugleiche zweite Bewertungen können wie Eskalierungen und manche Deskalierungen zur Sequenzterminierung führen, oder aber sie kündigen wie andere Deskalierungen Nichtübereinstimmung an und führen zur Sequenzexpandierung bis Übereinstimmung erzielt wird.

102 (7) Organisation von ersten und zweiten Bewertungen

c sequenzterminierend

1. Bewertung

^

präferiert: 2. Bewertung gleichlaufend

eskalierend > / — niveaugleich \ ^

ja dispräferiert: 2. Bewertung gegenlaufend

deskalierend

sequenzexpandierend

Aufgrund dieser Ambiguität von niveaugleichen und deskalierten zweiten Bewertungen können nur eskalierte zweite Bewertungen als klare Übereinstimmungen gelten und sie sollten damit die am meisten präferierte Reaktion des Rezipienten sein.5 Obwohl Übereinstimmung konversationeil präferiert ist, kann sich der Produzent einer ersten Bewertung natürlich der Zustimmung nicht absolut sicher sein. Ein erster Bewerter kann nur vermuten, z.B. auf der Basis geteilter kultureller Normen oder einer gemeinsamen Interaktionsgeschichte, die ihm Resourcen zur Einschätzung seines Gegenübers zur Verfügung stellt, daß der Rezipient seine Beurteilung teilen wird. Daher sind erste Bewerter gegenüber zweiten Bewertern in einer systematisch schlechteren Position. - Ohne die Einschätzung ihres Rezipienten zu kennen, tragen daher immer ein gewisses Risiko, daß sie eine erste Bewertung abgeben, die ihr Rezipient nicht teilt: (8) *

Hundertfünfzig 2 01 H: und äh: (.) 02 X: e(h)r"fahre(h)n (.)'sehr erfahren 03 H: woher weißt du das, 04 (2.0) 05 X: ja wir ham uns mal drüber unterhalten 06 (1.0) 07 X: w(h)oher wei(h)sse d(h)as I hehe 08 Η: I he I he 09 Χ: I hh i(h)s das nich e(h)n biß(h)chen 10 un(h)ver(h)schämt? Ihehe 11 Η: I Nö:(h):(h) find(h) ich ni(h)ch 'hh 12 ken(h)n d(h)ich d(h)och 13 X: ach s lo; 14 Η: I he I hehehehe I 15 Χ: I hehehehe lnunja(.) 16 H: (ja) sowas mag ich ja; Vgl. auch die Unterscheidung zwischen "strong agreement" und "weak agreement" (Pomerantz 1984: 66ff).

103

* **

17 18 19 20 21 22 23 24 25 26 27 28

X: Η X Η Χ Η Χ G Χ Η

cir(h)ca hundert(h)funfzig Frau(h)en w(h)enn er sich r(h)echt ent(h)sinnt (1.0) mehr nich? nein hehehe Heini kam auf über tausend ja ja d(h)u sag(h)test es hehe hehehe h(h)ä ich mein s:- soviel könn natürlich nich alle bieten das is klar hehe Ihe Ihel he I aber ich fand die hundertfünfzig auch schon nich schlecht; och ja is schon ganz gut

In Zeile 02 bewertet X einen Referenten; X behauptet, daß dieser Referent, ein Kommilitone von ihr, nicht nur erfahren, sondern sehr erfahren ist. Nachdem Bewertungen, wie bereits gesagt, auf einem bestimmten Wissen über das Bewertungsobjekt beruhen, ist der Rezipient auch berechtigt, den ersten Bewerter nach der Quelle seines Wissens zu befragen. Von dieser Möglichkeit machen Rezipienten natürlich nicht immer Gebrauch, in der Regel wird vielmehr stillschweigend vorausgesetzt, daß die Bewertung auf der Basis sicherer Kenntnisse abgegeben wurde. In diesem Gespräch stellt Η jedoch in Zeile 03 die Frage: Woher weißt du das? Nach einer Sequenz (Zeile 05 bis 16), in der die Basis von Xs Wissen thematisiert wird, operationalisiert X die Bewertung des Referenten, indem sie in Zeile 17 eine Explikation ihrer ersten Bewertung (*) präsentiert. Zusammen mit dieser Erläuterung sind nun die formalen Voraussetzungen für eine Gegenbewertung gegeben. Zwar kennt Η das Evaluandum nicht, aber einhundertfünfzig Frauen können als kulturell geteilter Maßstab für sexuelle Erfahrung gelten. Aber anstatt der erwartbaren gleichlaufenden Bewertung wie ja das ist wirklich ausgesprochen erfahren oder einer Bewertungsvokalisiation wie ahh oder ohh, die ihre Beeindrucktheit zum Ausdruck bringen und dadurch ein geteiltes Wertesystem dokumentieren würde, produziert Η in Zeile 19 eine Nichtübereinstimmung. Diese Nichtübereinstimmung wird ebenfalls erläutert (vgl. Zeile 21). Η weist darauf hin, daß sie ein anderes Bewertungsobjekt kennt (Heini), dessen Erfahrung sich auf über tausend gründet. Eine zweite Bewertung ist immer noch ausgeblieben. Erst nachdem sich X und Η darauf geeinigt haben, daß Heini eine Ausnahme ist, und somit als Bewertungsmaßstab unzulässig, bietet X erneut in Zeile 27 eine erste Bewertung zur Gegenbewertung an, die in die rhetorische Figur der Meiosis gekleidet (schon nicht schlecht) eine semantisch deskalierte aber gleichlaufende zweite Bewertung in Zeile 28 (schon ganz gut) erzielt, die als Zustimmung interpretiert wird und die Sequenz abschließt. Die oben beschriebene strukturelle Unsicherheit, mit der erste Bewerter systematisch konfrontiert sind, gilt für den zweiten Bewerter nicht. Weil dieser die Einschätzung des ersten Bewerters ja bereits kennt, kann er im Fall von Übereinstimmung eine gleichlaufende Gegenbewertung ohne Verzögerung und ohne die Gefahr des Widerspruchs produzieren. Aufgrund dieses Ungleichgewichts zwischen den Bewertungspositionen sind Eskalierungen und vor

104 allem Überlappungen, d.h. zweite Bewertungen, die vor einer möglichen übergaberelevanten Stelle des Redezugs begonnen werden, aber nicht zu dessen Abbruch führen, erwartbar und unproblematisch: (9)

Diffjpsych 648 01 Ta: ich muß no=mal schnell kuckn was ich da hab 02 ich hab da so viel ((Ta blättert in ihren Mitschriften)) 03 ?: "hh" 04 ?: l'mm;' 05 Ta: lwißt=er 1 das hat überhaupt 1 keinen Zweck 06 B: 1( ι 07 Ta: des hat überhaupt IkeinS1 des is wirklich blöd 08 X: daß=du=des nich vorher mal Idurchgelesn hast 09 10 Q: Ids find=i auch blöd; wirklich; 11 Ides bringts überhaupt 1 nich 12 Ta: Γ ja=des-°° ich mach (a-) 1

(10) Köln 907 (Thema: Schlagbohrmaschine) * 01 S: ich find das Geräusch so brutal *# 02 I: ah::! e Iklich 1( Zahn 1 schmerzen) (*) 03 S: (**) 04 A 1 wie beim Zah- 1 (.) hehe 05 Μ: 1 "ne 07 so ne 'richtige "Schlachbohrmaschine die** 08 die machtn Ge'räusch 1 das=is infer"nalisch 1 1 aber die (kann=ich) nich 1 halten ne 09 Ma: ** 10 1 ° ds unheimlich ...)° 1 11 S: 1 hhh ° ich find die 1 furchtbar", (wirklich) Mit der Gegenbewertung in die erste Bewertung einzubrechen, bietet dem zweiten Bewerter darüberhinaus 'strategische' Vorteile, indem er nämlich durch die frühestmögliche, redezugüberlappende Gegenbewertung den Eindruck erwecken kann, als sei für ihn die Position des ersten Bewerters nur eine 'zufällig' nicht wahrgenommene und seine Einschätzung des Evaluandums so klar und eindeutig, daß er sie auch als erster Bewerter hätte präsentieren können.6 Stehen mehrere potentielle zweite Bewerter zur Verfügung, kann es wie in Beispiel (10) zu einem regelrechten Streit um diese Position kommen. Aufgrund dieses Ungleichgewichts zwischen ersten und zweiten Bewertungen ist es nicht erstaunlich, daß sich Gesprächsteilnehmer Möglichkeiten verschaffen, die riskante Position des

Hier deutet sich eine gewisse strukturelle Ähnlichkeit zu der Situation an, in der sich Rezipienten im AnschluB an die Erzählung eines (schmutzigen) Witzes befinden: Auch hier ist zwar Lachen vorteilhaft, weil es als Beweis für die Fähigkeit gilt, den oft recht verschlüsselten Witz richtig und an der richtigen Stelle zu dechiffrieren. Andererseits setzt sich ein fhih lachender Rezipient auch der Gefahr aus, der einzige Lacher zu sein. Das Einbrechen in das erste Lachen eines Mit-Rezipienten bietet eine optimale Lösung dieses Konflikts, da die riskante Position des ersten Lachers vermieden, der nicht-erste Beginn des Lachens aber durch die redezugüberlappende Plazierung Uberspielt wird. Vgl. Sacks (1974: 347ff).

105 ersten Bewerters zu vermeiden. Eine solche Möglichkeit besteht darin, den Partner nach seiner Einschätzung des Evaluandums zu fragen (F). Durch eine solche Frage kann sich der Sprecher in eine sequentiell sehr günstige Position bringen, denn im Anschluß an die erfragte erste Bewertung ist eine zweite Bewertung immer noch konditionell relevant, aber die Einschätzung des Interaktionspartners ist nun bekannt: (11) Kanaldeckel F 01 Q hast as Zeugnis scho gsehn Franz; (.) 02 F: mmei °(... grad am Josef scho gsagt hab)° * 03 sehr gutes Zeugnis (.) ** 04 O: ZWEITE BEWERTUNG Die bisherigen Ausführungen dürfen jedoch nicht so verstanden werden, als verdamme die formale Präferenz für Übereinstimmung die Rezipienten selbst dann dazu, auf eine nichtübereinstimmende Bewertung zu verzichten, wenn sie die Einschätzung des ersten Bewerters nicht teilen. Dies ist natürlich auch in Alltagsgesprächen nicht der Fall, wie das Beispiel (12) mit der Produktion einer gegenlaufenden Bewertung in Zeile 03 zeigt: (12) Florian 1026 * 01 Ta: ich find sowas so 'eklich (.) (boo)!= 02 X: = wieso, ** 03 es is vielleicht ganz 'praktisch; Damit stellt sich natürlich die Frage nach der empirischen Evidenz für die Gültigkeit einer formalen Präferenz für Übereinstimmung in Alltagsgesprächen. Diese sollte sich, damit das Wirken eines solchen Prinzips nachgewiesen werden kann, durch die Analyse der Art und Weise finden lassen, wie Konversationsteilnehmer Nichtübereinstimmung produzieren. Eine erste wichtige Beobachtung betrifft die quantitative Verteilung präferierter und dispräferierter Handlungsaltemativen: Im Vergleich zu der Produktion der präferierten Reaktion in Gestalt einer gleichlaufenden Bewertung werden die dispräferierten gegenlaufenden Bewertungen viel seltener produziert. Interessanter als dieses quantitative Argument sind jedoch sequentielle Merkmale, die die dispräferierten Handlungen von den präferierten unterscheiden. Zu den sequentiellen Organisationsprinzipien von Paarsequenzen gehört - wie eingangs erwähnt - auch eine temporale Eigenschaft: Eine hörerspezifische Obligation verpflichtet den Rezipienten eines ersten Paarglieds (erste Bewertung) mit der Produktion des normativ erwartbaren zweiten Paarglieds (Gegenbewertung) unmittelbar nach dem erkennbaren Abschluß (upon completion) des ersten Paarglieds zu beginnen, wenn das Evaluandum dem Rezipienten bekannt ist. Im Fall von Übereinstimmung werden gleichlaufende Gegenbewertungen entweder ohne Verzögerung (vgl. Bsp. 1 bis 5) oder sogar in Überlappung (vgl. Bsp. 9 und 10) produziert. Im Gegensatz zu den gleichlaufenden Gegenbewertungen, die ohne Verzögerung

106 nach Abschluß der ersten Bewertung produziert werden, sind Konversationsteilnehmer bestrebt, gegenlaufende Bewertungen zu vermeiden, indem sie diese verzögern oder nur in abgeschwächter bzw. indirekter Form produzieren.7 Für die empirische Analyse folgt aus diesen Beobachtungen, daß sich häufiger als die offene, unverzögerte Produktion von Nichtübereinstimmung, wie in Beispiel (12), solche Fälle finden lassen, in denen zweite Bewerter die dispräferierte gegenlaufende Bewertung auf irgendeine Weise vermeiden. Eine solche Vermeidungsstrategie besteht darin, die konditionell relevante Gegenbewertung nicht im direkten Anschluß oder gar in Überlappung mit der ersten Bewertung zu produzieren, sondern eine Redezugvakanz (gap)8 entstehen zu lassen, der an Stelle der Gegenbewertung dann eine Bitte um Erläuterung (BuE) oder eine reparaturinitiierende Wiederholung des bewertenden Ausdrucks (RiW) 9 folgen kann. In beiden Fällen wird die zweite Bewertung verzögert und der erste Bewerter erhält zunächst die Möglichkeit, seine Einschätzung zu erläutern oder zu modifizieren (M*): (6) * BuE M*

Roro 410 01 S: h der isch eine trübe Tasse'meine G(h)üt(h)e 02 X: warum? 03 S: ERLÄUTERUNG/MODIFIZIERTE ERSTE BEWERTUNG

(11) Kanaldeckel 01 O: hast as Zeugnis scho gsehn Franz; (.) 02 F: mmei °(... grad am Josef scho gsagt hab)° * 03 sehr gutes Zeugnis (.) RiW 04 O: naja sehr gut; M* 05 F: MODIFIZIERTE ERSTE BEWERTUNG Redezugvakanzen oder Aktivitäten wie Bitten um Erläuterung und reparaturinitiierende Wiederholungen heben jedoch die konditionelle Relevanz zweiter Bewertungen nicht auf. Doch in dem für den Produzenten der ersten Bewertung erkennbar nicht genutzten Handlungsraum oder im Anschluß an die Bitte um Erläuterung oder die reparaturinitiierende Wiederholung wird ersten Bewertern eine sequentielle und damit systematisch verfügbare Gelegenheit gegeben, selbst noch einen Beitrag zur formalen Präferenz für Übereinstimmung zu leisten und eine mögliche Nichtübereinstimmung zu vermeiden, indem sie ihre Bewertung in einer Weise modifizieren,

Diese Formmerkmale gelten nicht nur für die Vermeidung von Nichtübereinstimmung in Bewertungssequenzen, sondern ebenso für dispräferierte Handlungsalternativen in anderen Sequenztypen wie Einladungen, Bitten etc. Vgl. dazu auch Sacks (1987). Vgl. Sacks, Schegloff & Jefferson (1974) sowie für das Deutsche und zur Terminologie Bergmann (1982). Aufgrund der sequentiellen Plazierung und auf der Basis der Organisation des Sprecherwechsels (vgl. Kapitel 2.4.2) werden drei Typen von Sprechpausen unterschieden: 1. Redezuginterne Pausen (pause), 2. freie Gesprächspausen (lapse) und 3. Redezugvakanzen (gap) nach erkennbar abegeschlossenen ersten Paargliedem. Im Gegensatz zu den reparaturinitiierenden Wiederholungen wie sie von Jefferson (1972) analysiert wurden, wird der bewertende Ausdruck hier mit fallender Intonationskontur realisiert.

107 die eine gleichlaufende Bewertung des Rezipienten erwartbarer macht. Wie wird dieses Ziel erreicht? Für die Modifikation der ersten Bewertung stehen prinzipiell die gleichen drei semantischen Relationen zur Verfügung, die auch der zweite Bewerter nutzen kann: D. h., auch der erste Bewerter kann bei seiner Modifikation eine eskalierte, eine niveaugleiche oder eine deskalierte Bewertung wählen. In dieser sequentiellen Position wählen erste Bewerter häufig aber weder eskalierte noch niveaugleiche, sondern deskalierte Bewertungen. Nur wenn man annimmt, daß das Ausbleiben einer zweiten Bewertung im direkten Anschluß an eine erste Bewertung für den ersten Bewerter erkennbar auf eine zurückgehaltene Nichtübereinstimmung hinweist und daß sich darüberhinaus die Konversationsteilnehmer an einer formalen Präferenz für Übereinstimmung orientieren, kann diese Verteilung 'erklärt' werden. Denn deskalierte Bewertungen sind geeignet, die Differenz zwischen der Einschätzung des ersten Bewerters und der angenommenen Einschätzung des Rezipienten zu verringern und das Aushandeln von Übereinstimmung vorzubereiten. In Beispiel (11) findet ein solches Aushandeln von Übereinstimmung statt. Nach der reparaturinitiierenden Wiederholung modifiziert F seine erste Bewertung in Zeile 07. Die Modifikation erfolgt jedoch erst nach einem recht langen Schweigen und bricht in die verzögerte Nichtübereinstimmung ein. Dennoch ist sie geeignet, die Zustimmung von Ο in Zeile 09 zu erzielen: (11) Kanaldeckel 01 O: hast as Zeugnis scho gsehn Franz; (.) 02 F: mmei'(... grad am Josef scho gsagt hab)° * 03 sehr gutes Zeugnis (.) RiW 04 α naja sehr gut; 05 (1.0) ** 06 sehr gut 1 kann mas doch a net heißn 1 1 'relativ sehr gutes Zeugnis 1 M* 07 F: "in bezug auf ihre Leistungen" 08 ** 09 α ja:! ja (.) do do hot er recht. Auch in Beispiel (6) wird im Anschluß an die erbetene Erläuterung, die von dem ersten Bewerter und einem der Rezipienten in den Zeilen 03 bis 05 gegeben wird, die verzögerte zweite Bewertung in Zeile 06 produziert: (6)

Roro 410 * 01 S: BuE 02 X: 03 S: 04 So: 05 S: ** 06 Χ:

h der isch eine trübe Tasse 'meine G(h)üt(h)e warum? hhe wenn der da unten reinkommt (0.5) hehe (.(h)..) (dann) gehts (dann) wenn=er=scho anfängt zu redn aoah! I also i weiß °(net)° I I naja der hat so ne gewisse (Art) I

Eine mögliche Nichtübereinstimmung kann aber noch subtiler als in den Transkripten (11) und (6) zum Ausdruck gebracht werden, denn allein die Abwesenheit des Beginns einer zweiten

108 Bewertung bei erkennbarem Abschluß des ersten Paargliedes kann schon dazu führen, daß erste Bewerter ihren Redezug expandieren (E) und ihre Bewertung modifizieren. In dem Beispiel (13) geschieht dies sogar zweimal: (13) *

El M* E2 **

RoRo 550 01 Sol: 02 03 04 05 X:

der Müller der isch a "nur positiv (find=i) der isch so 'nnett der Mensch du (.) 'h findsch net? aja "doch=i=find den a unheimlich nett.

Nachdem die Gegenbewertung auch nach der Expansion in Zeile 02 ausgeblieben ist, modifiziert Sol seine erste Bewertung in Zeile 03 (aus nur positiv wird die deskalierte Modifikation so nett). Durch die zweite Expansion, eine direkte Frage nach der Meinung des Rezipienten in Zeile 04, die ebenfalls als erstes Paarglied eine Antwort als zweites Paarglied konditionell relevant macht, wird die Obligation des Rezipienten verstärkt, im direkten Anschluß eine Antwort und damit die bisher ausgebliebene übereintsimmende zweite Bewertung zu liefern. Nach der sequentiellen Analyse von Bewertung und Gegenbewertung komme ich nun zur Binnenstruktur zweiter Bewertungen, und ich möchte zeigen, daß diese ebenfalls für die Organisation von Bewertungssequenzen eine wichtige Rolle spielt. Betrachtet man nämlich die zweiten Bewertungen der letzten Beispiele, so stellt man fest, daß diese nach einem bestimmten Strukturschema aufgebaut sind. Die zweiten Bewertungen bestehen aus mindestens zwei Komponenten. Sie beginnen mit einem Vorlaufelement (wie ja, naja oder aja), dem dann die eigentliche Bewertung folgt. Diese Abfolge ist kein zufälliges Merkmal gerade dieser Gegenbewertungen, sondern eine konstitutive Eigenschaft 10 von Gegenbewertungen im Deutschen, die neben der sequentiellen Organisation von Bewertungen eine wichtige Rolle bei der Präferenz für Übereinstimmung spielt. 11 Zur besseren Übersicht hier noch einmal die zweiten Bewertungen der bisher vorgestellten Beispiele (die Vorlaufelemente sind kursiv gedruckt): (1) Hundertfünfzig 4 ** 04 X: Ja ne hehe (0.8) 'best(h)en 'Jah(h)re 10

Vorlaufelemente scheinen allerdings dann nicht vorzukommen, wenn die zweiten Bewertungen wie in den Beispielen (9) und (10) in Überlappung mit der ersten Bewertung produziert werden. Auch gegenlaufende zweite Bewertungen müssen separat betrachtet werden. Die Doppelstruktur ist vermutlich nicht nur auf Bewertungssequenzen beschränkt, sondern auch in solchen Sequenztypen anzutreffen, wo zweite Sprecher im Anschluß an den Redezug eines ersten Sprechers einen Übereinstimmung oder Nichtübereinstimmung signalisierenden Redezug produzieren. Vgl. dazu Sacks (1987) und zur dreiteiligen Struktur von Redezügen vgl. Sacks, Schegloff & Jefferson (1974: 722).

11

Im Gegensatz nämlich zu den zweiten Bewertungen im Englischen (vgl. Pomerantz 1975, 1984) weisen zweite Bewertungen im Deutschen Vorlaufelemente nicht nur in Nichtübereinstimmung signalisierenden Redezügen (vgl. die Partikel well), sondern auch in übereinstimmenden auf.

109 (2) Florian 1026 ** 04 Τ: ja is scho(h)n faszinierend, (3) Antiquitäten 1 ** 04 X: ja da siehts schon oft ganz grauenvoll aus; (4) Seglerinnen 3 ** 02 B: haja die sin ganz (.) happy. (5) Innocenti 1 ** 03 N: ja heut isch verdammt schwül, (6) Roro 410 ** 06 X: naja der hat so ne gewisse (Art) (8) Hundertfünfzig 2 ** 31 H: och ja is schon ganz gut (11) Kanaldeckel ** 09 0: ja:! ja (.) do do hot er recht. (13) RoRo 550 ** 05 X: aja "doch=i=find den a unheimlich nett. Zweite Bewertungen in Bewertungssequenzen werden zwar systematisch durch ein Vorlaufelement eingeleitet, innerhalb dieser Gruppe läßt sich jedoch eine interessante Variation und die Bildung von drei Partikelklassen beobachten: Die erste Gruppe bildet die Partikel ja; sie kookkuriert wie in Beispiel (1) Zeile 04 und in Beispiel (2) Zeile 04 sowohl mit eskalierten zweiten Bewertungen als auch mit niveaugleichen zweiten Bewertungen wie in Beispiel (3) Zeile 04, Beispiel (5) Zeile 03 und Beispiel (11) Zeile 09. Die zweite Gruppe setzt sich aus modifizierten Varianten der Partikel ja zusammen; während haja in Beispiel (4) Zeile 02 und aja in Beispiel (13) Zeile 05 mit nivaugleichen zweiten Bewertungen verwendet werden, leitet och ja in Beispiel (8) Zeile 31 eine deskalierte zweite Bewertung ein. Die dritte Variante bildet die Partikel naja, die in Beispiel (6) Zeile 06 zusammen mit einer deskalierten zweiten Bewertung verwendet wird. Ich möchte nun zeigen, daß bereits die Vorlaufelemente Hinweise auf die Funktion der Gegenbewertung enthalten. Mit anderen Worten: Vorlaufelemente, die in klaren Übereinstimmungen (vgl. die Übersicht (7)) verwendet werden, sind nicht identisch mit denen, die in ambigen Gegenbewertungen (Übereinstimmung oder mögliche Nichtübereinstimmungen) Verwendung finden, und diese wiederum unterscheiden sich von den Vorlaufelementen, die auf zurückgehaltene, implizite Nichtübereinstimmung hinweisen.

110 Ich möchte diese These am Beispiel der Partikel naja untermauern und zeigen, daß naja systematisch als eine noch nicht formulierte und nur zurückgehaltene Nichtübereinstimmung verwendet und interpretiert wird. Einen ersten Hinweis auf diese Funktion zeigt das Beispiel (11) Zeile 04; dort leitet naja die reparaturinitiierende Wiederholung ein und geht der expliziten Formulierung von Nichtübereinstimmung voran. Auch in dem schon vorgestellten Beispiel (4) zeigt die Reaktion des ersten Bewerters, daß er die durch naja eingeleitete Gegenbewertung nicht als Übereinstimmung interpretiert: (4) Roro 410 * 01 S: h der isch eine trübe Tasse'meine G(h)üt(h)e BuE 02 X: warum? 03 S: hhe wenn der da unten reinkommt (0.5) hehe (.(h)..) (dann) gehts 04 So: (dann) wenn=er=scho anfängt zu redn 05 S: aoah! I also i weiß "(net)0 I ** 06 Χ: I naja der hat so ne gewisse (Art) I 07: So: °hlm° M* 08: S: I was langweiligeres als den gibts net du (0.5) 09 also a pri'ori sag=i halt ne (**) 10 X: aja d:es is halt (.) irgendwie i=glaub da (wieder) stark mit rein 11 daß sich der halt aus (.) ner ganz anderen Gegend kommt 12 also die Leute da oben tendieren eher dazu (.) 13 "(also)" ganz sich I aufzufühm M* 14 S: I aah! des is son richtig verstreuter Professor in spe du (.) 15 fürchterlich. (.) naja In Beispiel (4) leitet naja in Zeile 06 eine gleichlaufende, aber deskalierte zweite Bewertung ein, die nur So als zustimmende Gegenbewertung interpretiert (vgl. sein minimales Rezipientensignal in Zeile 07), während sie S als Nichtübereinstimmung versteht, denn in Zeile 08 eröffnet er erneut die Bewertungssequenz mit einer modifizierten ersten Bewertung. Diese Modifikation enthält jedoch keine deskalierte Bewertung, die vielleicht geeignet wäre, die Differenz zwischen S und X in der Einschätzung des Evaluandums zu verringern, sondern S verwendet eine eskalierte Bewertung in Form einer Extremformulierung (extreme case, vgl. Pomerantz 1986). Der bewertete Referent ist nicht nur eine trübe Tasse, sondern was langweiligeres als den gibts net. Durch diese extreme Formulierung legitimiert S seine negative Bewertung und wirkt zugleich dem entgegen, was Pomerantz (1986: 221) als nichtempathische Interpretation des Rezipienten (unsympathetic hearing) 12 analysiert hat. Xs Redezug in Zeile 10 ist eine Erläuterung seiner zweiten Bewertung, und in der Tat gibt er zu bedenken, daß S' Beschreibung zwar die beobachtbaren Tatsachen korrekt wiedergibt, die Beurteilung aber deshalb nicht richtig ist, weil das Verhalten des Bewertungsobjekts auf differierende Verhaltensnormen zurückzuführen und der bewertete Referent daher ein Opfer interkultureller Mißverständnisse ist.

"An unsympathetic hearing is one in which a hearer reconstructs a circumstance that could be referenced by the description offered but that supports a position contrary to the original one" (Pomerantz 1986: 221).

Ill Diese Erklärung wird nicht mehr durch die Partikel naja, sondern durch aja eingeleitet. Aja findet, wie das Beispiel (13) zeigt, zusammen mit niveaugleichen Bewertungen auch in übereinstimmenden Gegenbewertungen Verwendung. Diese Kombination ist jedoch ambig, denn eine solche Gegenbewertung kann auch als Nichtübereinstimmung und damit als sequenzexpandierend interpretiert werden. Zum dritten Mal erneuert S seine negative Bewertung in Zeile 14, ohne Xs Argumente zu berücksichtigen. Wieder ist eine Gegenbewertung konditioneil relevant, diese bleibt jedoch auch nach der Expansion des Redezugs (vgl. Zeile 15) aus. Nachdem X und S in ihrer Einschätzung so weit divergieren, wird eine explizite Übereinstimmung nicht erreicht. Die Formulierung einer expliziten Nichtübereinstimmung unterbleibt jedoch ebenfalls. Auch das Beispiel (14) unterstützt die bisher präsentierte Analyse der Funktion von naja: (14) Schreibtischmäßig 01 T: ich find ja auch er hat=wieder (.) wesentlich schöneres 02 glänzenderes Fell gekricht; 03 (·) 04 X: seit er hier is? 05 T: also ich fan er- war sah ziemlich so rupfig und stumpf aus; h (.) 06 X: noja; 07 (3.0) 08 T: naja es kann aber auch sein 09 daß ich diese ganzen (.) halb ausgefallenen Haare rausgebürstet habe 10 I daß I des jetz was ausmacht, 11 X: I mm I Die ersten drei Redezüge zeigen die bereits vertraute Abfolge von Redezügen mit einer verzögerten Nichtübereinstimmung: A: Erste Bewertung Redezugvakanz B: Bitte um Erläuterung der ersten Bewertung A: Erläuterung und/oder Modifikation der ersten Bewertung Aber nach Ts deskalierter Modifikation ihrer ersten Bewertung (vgl. auch den Reparaturindikator also in Zeile 05 sowie Kapitel 2.4.3) produziert X die konditionelle relevante Gegenbewertung nicht vollständig, sondern nur das Vorlaufelement naja. Im Anschluß an diese Partikel entwickelt sich eine redezuginterne Pause (Vgl. FN 8), die nach drei Sekunden Dauer jedoch nicht von X, sondern von Τ terminiert wird und damit wird das Schweigen, das als redezuginterne Pause (pause) begonnen hat, von Τ in eine Redezugvakanz (gap) transformiert. Betrachtet man Ts Redezug in Zeile 08, so zeigt sich, daß dieser nicht das Format einer modifizierten ersten Bewertung aufweist (keine Reparaturindikatoren wie in Zeile 03), sondern als Gegenargument (aber) gegen Ts eigene erste Bewertung mit dem Format einer zweiten

112 Bewertung (vgl. das Vorlaufelement noja) formuliert wird. Damit orientiert sich Τ an der zurückgehaltenen Nichtübereinstimmung von X, die er in Zeile 06 durch das Vorlaufelement naja angekündigt hat. Diese Analyse, daß Ts Redezug als konditioneil relevante Gegenbewertung fungiert, kann durch die Tatsache gestützt werden, daß die Bewertungssequenz ohne eine explizite zweite Bewertung von X, der nur ein minimales Rezipientensignal in Zeile 11 produziert, abgeschlossen wird. Vorlaufelemente sind ein konstitutiver Bestandteil von zweiten Bewertungen im Deutschen, und sie sind wesentlich daran beteiligt, daß zweite Bewertungen sowohl von der Analysierenden als auch von den Gesprächsteilnehmern nicht starr den disjunkten Kategorien Übereinstimmung versus Nichtübereinstimmung zugeordnet werden, sondern daß eine skalare Interpretation vorgenommen wird, die die formale Präferenz für Übereinstimmung widerspiegelt. Bei formaler Dispräferenz für Nichtübereinstimmung und der Aushandlung von Übereinstimmung spielt das Vorlaufelement naja eine wichtige Rolle. Die noch positive, aber doch als Nichtübereinstimmungsvorlauf erkennbare Partikel hat die Funktion, die dispräferierte offene Nichtübereinstimmung zu vermeiden und dem ersten Bewerter die Möglichkeit zu eröffnen, seine ursprüngliche Bewertung so zu modifizieren, daß Übereinstimmung erzielt werden kann. Aufgrund der Ambiguität von gleichlaufenden und niveaugleichen zweiten Bewertungen und den Vorlaufelementen ja und ihren Modifikationen (aja, och ja etc.) können nur eskalierte zweite Bewertungen mit dem Vorlaufelement ja als klare Übereinstimmungen gelten: (15) Zweite Bewertungen in Bewertungssequenzen Übereinstimmung/mögliche Nichtübereinstimmung klare Übereinstimmung ja+ Eskalierung

implizite NichtÜbereinstimmung

modifiziertes ja + modifiziertes ja + Niveaugleichheit Deskalierung

naja (+ Deskalierung)

In diesem Abschnitt wurde gezeigt, daß Bewertungs(paar)sequenzen in einer Weise organisiert werden, die Übereinstimmungen maximiert und Nichtübereinstimmungen minimiert. Dies wird durch die Verzögerung der zweiten Bewertungen erreicht, die als zurückgehaltene Nichtübereinstimmung interpretiert und von dem ersten Bewerter durch Modifizierung seiner Bewertung quittiert wird. Doch obwohl Übereinstimmung die präferierte Handlungsalternative ist, gibt es ein systematisches Ungleichgewicht im Bezug auf die Position des ersten bzw. zweiten Bewerters, denn erste Bewertungen müssen abgegeben werden, ohne daß ihr Produzent um die Einschätzung seines Gesprächspartners weiß. Damit setzen sich erste Bewerter prinzipiell immer der Gefahr aus, eine nicht zustimmungsfähige Einschätzung zu formulieren.

113 3.1.2

Nachrichten und Kommentare

Nach der Vorstellung des Paarsequenzformats Bewertung + Gegenbewertung möchte ich mich nun konversationellen Aktivitäten zuwenden, die mit der bereits beschriebenen eng verwandt sind: Übermittlung einer Neuigkeit bzw. einer Nachricht oder Erzählung einer Geschichte + Kommentar. Zwischen diesen verschiedenen Aktivitätstypen besteht eine weitgehende Verschränkung. Die aus Bewertung + Gegenbewertung bestehende Bewertungssequenz kann innerhalb der Redezugfolge Neuigkeit/Nachricht/Geschichte13 + Kommentar realisiert werden, indem zunächst eine Neuigkeit zusammen mit einer ersten Bewertung produziert wird, die Aufschluß über die Einschätzung des Übermittlers der Nachricht gibt. Es folgt ein Kommentar in Form einer Gegenbewertung. Häufiger als diese vollständige Verschränkung der beiden Redezugfolgen sind jedoch solche Fälle, in denen die Neuigkeit oder Nachricht keinen bewertenden Ausdruck enthält, die Einschätzung des Übermittlers der Neuigkeit jedoch aufgrund des alltagsweltlichen Wissens der Teilnehmer oder aufgrund der mit dem berichteten Inhalt verbundenen Konnotationen rekonstruierbar ist. Ein Beispiel für eine solche implizite Bewertung liegt in dem Transkriptausschnitt (16) vor. (16) China 9 01 T: 02 * 03 04 05 ** 06 I: 07 08 T: ** 09 I:

°Ich 'muß übrigens heut noch zum 'Michelsen," "um 'drei,0 weils 'Schwierigkeiten gibt, mit dem 'PeTdng'auf enfhalt. (0.5) Ich hab den jetz einfach ge'buxht, "das: find=ich ja interessant! also da (0.5) hmhm 'das find ich ja (0.7) find ich ja 'wirklich en 'Hammer. (0.4)

Auch das nächste Beispiel, das zunächst wie eine erste Bewertung mit einem Vorlaufelement und eine zweite Bewertung ohne Vorlaufelement aussieht, (17) China 8f * 011: 'Ja, ist natürlich 'unheimlich "blöd. ** 02 T: "Und das natürlich ne 'irre Belastung". entpuppt sich bei genauerer Analyse als eine zweite Bewertung, die als Reaktion auf eine sich von Zeile 01 bis 12 erstreckende Nachricht produziert wird:

13

Vgl. Pomerantz (1975: Kap. 2), Sacks (1971) und besonders Jefferson (1978) für eine detaillierte Analyse von Bewertungen beim Erzählen von Geschichten.

China 8f 01 T: 02 03 I: 04 05 T: 06 07 08 I: 09 T: 10 11 12 13 I: 14 15 I: 16 T: 17 I: 18 19 I: 20 21 T:

Also=die=ham irgendwie en 'Vorschlag 'ein:gerei:cht, man Tcönnte jetzt weiterhin 'Slavistik 'Staatsexamen stul'dieren, Ihmhm (0.5) 'aber 'nur als 'zweites Hauptfach, (0.4) Iwo'beil ma=noch=n 'Zusatzfach 'braucht, Ihm 1 also 'zwei Hauptfächer hast dann:= =zum Beispiel Deutsch, 'Russisch. (0.3) l'undl #brauchst=dann noch nen# 'Zusatzfach. Ihm 1 (0.6) 'Ja, ist natürlich 'unheimlich Ijlöd. "Und das natürlich ne 'irre Be'lastung". Ja (1.8) °°Ach=du 'je'mi'ne:'"' (1.4) "hm"

Doch auch die Analyse der vermeintlichen zweiten Bewertung, die von T, dem Überbringer der Information, in Zeile 16 geliefert wird, kann nicht ohne ein caveat erfolgen. Denn wenn man diese allein auf der Basis der sequentiellen Organisation durchführt, würde sie als eine typische bestätigende

Bewertung (confirming assessment, vgl. Pomerantz 1975: 59) klassifiziert

werden, die die Überbringer von Nachrichten oder Neuigkeiten systematisch und regelmäßig im Anschluß an die Bewertung des Rezipienten liefern. Im Rahmen dieser Analyse würde Zeile 16 der dritte Redezug einer aus zwei Paarsequenzen bestehenden Triple-Sequenz14 sein, wobei die erste Paarsequenz den ersten Paarteil der zweiten Paarsequenz bilden würde: Nachricht/Neuigkeit = 1. Bewertung I Reaktion auf die Nachricht = 2. Bewertung" - H Bestätigende Bewertung

1. Paarsequenz 2. Paarsequenz

Dies ist zwar eine naheliegende, jedoch nicht die einzige Analyse, denn so wie Τ in Zeile 16 ihre Bewertung produziert, weist diese ebenfalls die Eigenschaften einer

abschließenden

Bewertung (concluding assessment, vgl. Pomerantz 1975: 40) auf, da sie durch kohärenzstiftende Merkmale eng mit der vorangehenden Nachricht verknüpft ist:

Triple-Sequenzen finden sich typischerweise auch in Lehrer-Schüler-Interaktionen, vgl. dazu Streeck (1979).

115 Α:

Nachricht/ Neuigkeit = implizite od. explizite 1. Bewertung + abschließende Bewertung

B:

Reaktion auf die Nachricht = 2. Bewertung

Paarsequenz

Die Bewertung wird durch die koordinierende Konjunktion und eingeleitet und die anaphorische Pro-Form das referiert auf Ts vorangegangene Nachricht. Abschließende Bewertungen dienen dazu, das Ende komplexer Aktivitäten - wie sie die Überbringung von Nachrichten oder Neuigkeiten und auch das Erzählen von Geschichten darstellen - für den Rezipienten erkennbar zu produzieren 15 . Für die Analyse von Zeile 16 als abschließende Bewertung spricht, daß I, obwohl sie bereits eine zweite Bewertung als Reaktion auf die Nachricht produziert hat, erneut in 19 einen bewertenden Kommentar produziert. Die in dem vorangegangenen Abschnitt vorgestellte Präferenz für Übereinstimmung und das erhöhte Risiko des ersten Bewerters, eine nicht zustimmungsfähige Einschätzung zu präsentieren, gilt auch für die Redezugfolge Nachricht/Neuigkeit/Geschichte + Kommentar. Liefert der Übermittler der Neuigkeit oder der Erzähler der Geschichte wie in Beispiel (18) jedoch weder eine explizite erste Bewertung noch eine abschließende Bewertung, so stellt sich in diesem sequentiellen Kontext aber auch für den zweiten Bewerter das Problem, daß er - ohne die Einschätzung des Erzählers sicher zu kennen - einen Kommentar zu produzieren hat, der sich auch tatsächlich mit der Einschätzung des Erzählers deckt und von diesem als Produktion von Übereinstimmung interpretiert wird: (18) Verhebt 5 * Ol H: und ah: ich bin damit Ende März fertich (0.5) 02 (und) dann wollt ich Anfang April hier ma ne Woche (.) 03 äh (0.5) mich ruhich:: vom Zahnarzt behandeln la(h)sse(h)n ((Rauschen)) ** 04 X Zahnarzt ha hehe he I hehe * 05 Η I (...) diverse Weisheitszähne ausgraben; (.) ** 06 X um Gottes Willen! In dem Beispiel (18) gelingt dies dem Rezipienten erst im zweiten Anlauf. Durch Hs lachend realisierte Information, daß sie sich ruhig vom Zahnarzt behandeln lassen will, verkennt X das Ausmaß der Beeinträchtigung. Erst der Hinweis, daß Η diverse Weisheitszähne ausgraben lassen will, führt zu einer als gleichlaufende Bewertung interpretierten Reaktion. Bis zu diesem Punkt wurde die rhythmische Gestaltung der bewertenden Redezüge nicht für die Analyse herangezogen. In Übereinstimmung mit den Prinzipien der ethnomethodologischen Konversationsanalyse stand die sequentielle Organisation im Zentrum des Interesses. Es wird sich jedoch zeigen, daß rhythmische Gestaltung interaktiv relevant ist und daß eine Kon-

15

Vgl. Jefferson (1978: 244) zur Analyse von Bewertungen als ein prototypisches Schlußwort (telling-endingdevice) im Gegensatz zu Zusammenfassungen (story-exit-device).

116 versationstheorie zu kurz greift, die auf die systematische Einbeziehung dieses sprachlichen Mittels verzichtet. Außerdem eröffnet sich mit der Betrachtung dieses Formaspekts die Möglichkeit, die Zuständigkeitsbereiche von Grammatikforschung und Konversationsanalyse zu präzisieren und in Bezug auf die in Kap. 1 formulierten konkurrierenden Thesen zu überprüfen.

3.2 Prominenz und Rhythmus Sprechen ist aber ein rhythmischer Prozeß. In dieser Hinsicht unterscheidet sich menschliche Sprache und besonders verbale Interaktion in keiner Weise von anderen in der Zeit wiederkehrenden Ereignissen, die bestimmend für die Art und Weise sind, in der wir uns selbst (ζ. B. über den Herzschlag oder die Atmung) und unsere Umwelt mit dem Wechsel von Tag und Nacht oder dem Zu- und Abnehmen des Mondes erleben.16 Doch obwohl alle Menschen mit den Rhythmen ihres Körpers leben, haben ihre Sprachen keinen biologisch determinierten 'Rhythmusgeber', denn natürliche Sprachen unterscheiden sich auch in ihrer Rhythmustypologie. Die traditionelle Distinktion zwischen akzentzählenden und silbenzählenden Sprachen, geht auf Pike (1945) und Abercrombie (1967) 17 zurück. Hinter dieser Klassifikation steht die Vorstellung, daß je nach Sprachtyp unterschiedliche Einheiten in zeitlich gleichen Abständen, d.h. rhythmisch isochron, aufeinanderfolgen: The timing of rhythm units produces a rhythmic succession which is an extremely important characteristic of English phonological structure. The units tend to follow one another in such a way that the lapse of time between the beginning of their prominent syllables is somewhat uniform. [...] The tendency towards uniform spacing of stresses in material which has uneven numbers of syllables within its rhythmic groups can be achieved only by destroying any possibility of even time spacing of syllables. [...] This rhythmic crushing of syllables into short time limits is partly responsible for many abbreviations - in which syllables may be omitted entirely - and the obscuring of vowels; [...].[...] it may convieniently be labelled a stress-timed rhythm unit. [...] Many non-English languages (Spanish, for example) tend to use a rhythm which is more closely related to the syllable than the regular stress-timed type of English; in this case it is the syllables, instead of the stresses, which tend to come at more-or-less evenly recurrent intervals [...]. [...]. The type may be called a syllable-timed rhythm unit. (Pike 1945: 35f)

Pikes Formulierung ist recht vorsichtig und enthält wichtige Einschränkungen. Er verweist darauf, daß nur eine Tendenz zur Isochrome besteht, die durch Störfaktoren überdeckt werden

Durch rhythmische Organisation sind natürlich auch komplexe Bewegungsabläufe wie Laufen, Schwimmen, Tanzen und Kulturtechniken wie Musik und Lyrik geprägt. Auch in der Malerei spielt der Rhythmus eine wichtige Rolle: Kinder malen sogenannte "Atembilder" gleichzeitig mit beiden Händen, die ältesten Ornamentfriese zeigen primitive rhythmische Strukturen, und der Pinselduktus ist sowohl in impressionistischer und expressionistischer Malerei als auch im "action painting" ein wichtiges Ausdrucksmittel. Abercrombie zitiert auch Lloyd James (1940: 25), der die beiden Rhythmustypen als "machine-gun rhythm" und "morse-code rhythm"bezeichnet hat.

117 kann. Pointierter als Pike hat Abercrombie das Phänomen beschrieben. In seinen "Elements of General Phonetics" (1967: 96f) vertritt er die Auffassung, daß alle Sprachen rhythmisch isochron sind und in Bezug auf ihren Rhythmusgeber entweder als "stress-timed" oder "syllable-timed" klassifiziert werden können: Although hesitation and other pauses tend at times to disguise the fact, all human speech possesses rhythm. [...] Rhythm in speech as in other human activities, arises out of the periodic recurrence of some sort of movement, producing an expectation that the regularity of succession will continue. [...] There are two basically different ways in which chest-pulses and stress-pulses can be combined, and these give rise to two main kinds of speech-rhythm. As far as is known, every language in the world is spoken with one kind of rhythm or with the other. In the one kind, known as a syllable-timed rhythm, the periodic recurrence of movement is supplied by the syllable-producing process: the chest pulses, and hence the syllables recur at equal intervals of time - they are isochronous. [...] In the other kind, known as a stress-timed rhythm, the periodic recurrence is supplied by the stress-producing process: the stress-pulses, and hence the stressed syllables, are isochronous. [...] When one of the two series of pulses is in isochronous succession, the other will not be. Thus in a syllable-timed rhythm, the stress-pulses are unevenly spaced, and in a stresstimed rhythm the chest-pulses are unevenly spaced. (Abercrombie 1967: 960

Pikes und Abercrombies Aussagen lassen sich zu der folgenden Formulierung der IsochronieHypothese zusammenfassen: (Isochronie-Hypothese) (1) Natürliche Sprachen sind rhythmisch organisiert. Ohne intervenierende Einflüsse (Verzögerungen, Pausen) weisen sie Isochrome auf. (2) Jede Sprache läßt sich genau einem Rhythmustyp zuordnen: Sprachen sind entweder akzentzählend (mit dem Fuß als rhythmischer Grundeinheit) oder silbenzählend (mit der Silbe als Grundeinheit). Als Füße zählen eine obligatorische Iktus- oder Akzentsilbe und (falls vorhanden) alle unakzentuierten Silben bis zur nächsten Iktussilbe. (3) In akzentzählenden Sprachen sind die rhythmischen Füße isochron. In silbenzählenden Sprachen findet sich Isochrome auf der Silbenebene. Daraus folgt, daß die Silbendauer in akzentzählenden Sprachen variabel sein muß, um auch bei unterschiedlich komplexen Füßen Isochrome sicherzustellen. Für silbenzählende Sprachen hingegen folgt, daß die Abstände zwischen zwei Akzenten in Abhängigkeit von der Anzahl intervenierender Silben proportional anwachsen. Mit dem zweiten und dritten Teil wird ein typologisches Kriterium eingeführt. Als Kandidaten für den akzentzählenden Typ werden in der Literatur das Englische, aber auch das Deutsche, das Schwedische und das Dänische, das Russische, das Portugiesische, das Arabische, das Vietnamesische, das Thai und die gesamte Mon-Khmer-Sprachenfamilie sowie Newari, Chepang, Gurung und Tamang genannt. Zu den Sprachen des silbenzählenden Typs sollen u.a. das Spanische, aber auch das Standard-Italienische, das Französische, das Türkische und andere altaische Sprachen, das Yoruba, das Telugu, das Hindi, das Tamil, das Indonesische sowie die gesamte Munda-Sprachenfamilie zählen. Zur Isochroniehypothese wurden zunächst vor allem phonetische Analysen durchgeführt.18 Eine detailierte und kritische Diskussion findet sich in Auer & Uhmann (1988). Die Argumentation in

118 Diese einzelsprachlichen und sprachvergleichenden meßphonetischen Untersuchungen lassen sich folgendermaßen resümieren. Während Teil (1) der Isochroniehypothese (gleiche Abstände zwischen den Hervorhebungen) eindeutig nicht bestätigt werden konnte und Teil (2) (der Unterschied zwischen silben- und akzentzählenden Sprachen) höchstens in Form eines Kontinuums, nicht aber in Form einer kategorialen typologischen Unterscheidung haltbar ist, bestätigen einige Messungen die Folgerungen aus Teil (3), indem sie die Abhängigkeit der Silbendauer von der Silbenzahl im Fuß für die akzentzählenden Sprachen nachweisen. Die Dauer eines Fußes scheint jedoch in allen Sprachen mit der Anzahl der unbetonten Silben anzuwachsen, zugleich scheint dieser Zuwachs jedoch unter dem Niveau zu bleiben, das bei einer rein additiven Dauerberechnung zu erwarten wäre. Außerdem schwankt das Ausmaß der Komprimierung der Silben im Fuß. Eine schwächere Version der Isochroniehypothese könnte nun darin bestehen, die Unterscheidung zwischen silben- und akzentzählenden Sprachen als ein Kontinuum zu sehen und zu postulieren, daß akzentzählende Sprachen mehr als silbenzählende die Dauerverhältnisse innerhalb des Fußes ausgleichen, während die silbenzählenden Sprachen mehr als die akzentzählenden die Dauerverhältnisse innerhalb der Silbe ausgleichen. Es hat sich jedoch gezeigt, daß die Isochroniehypothese auch in ihrer schwachen Form durch phonetische Messungen zumindest in ihren zentralen Komponenten nicht eindeutig bestätigt werden konnte. Die Untersuchungen, die die Schwankung der Fußdauer erfassen, haben zu eindeutig negativen Ergebnissen geführt. Andererseits scheint die Silbe in den einzelnen Sprachen unterschiedlich komprimierbar zu sein, wobei unter den vielen Faktoren, die eine solche Komprimierung auslösen, auch die Anzahl der folgenden unbetonten Silben eine Rolle spielen kann. Einige Autoren (z.B. Nakatani et al. 1981) haben aus diesen niederschmetternden Ergebnissen den Schluß gezogen, das Isochroniekonzept ganz aufzugeben. Andere Forscher haben nach Rettungsmaßnahmen Ausschau gehalten und diese entweder in einer phonetischen Präzisierung oder in einer Phonologisierung des Konzepts gesucht. Die phonetisch orientierten Rettungsversuche zielen meist auf eine Kritik an den bisher verwendeten Meßmethoden ab. Vor allem die folgenden drei Einwände wurden gegen die älteren Untersuchungen vorgebracht. Erstens: Die Abstände zwischen den Silben sind an den falschen Punkten gemessen worden. Zweitens: Wesentlich ist nicht die phonetisch meßbare Isochrome im Sprachsignal, sondern ihre Perzeption. Da der Perzeption von Dauerschwankungen aber physiologische Grenzen gesetzt sind, sind die Abweichungen zwischen den Meßintervallen nur dann perzeptiv relevant, wenn sie diese Grenzen überschreiten. Drittens: Isochronie ist keine Eigenschaft fortlaufender Texte, sondern kleinerer sprachlicher Einheiten; die Domäne der Isochronie muß also genauer definiert werden, bevor man mißt. Der erste Einwand gegen Teile der phonetischen Rhythmusforschung betrifft das Problem des Meßpunkts. Ganz offensichtlich muß der Phonetiker, der von einer betonten Silbe zur

119 nächsten (in akzentzählenden Sprachen), oder auch nur von Silbe zu Silbe (in silbenzählenden Sprachen) Abstände messen will, eine Entscheidung darüber treffen, wo im phonetischen Signal der Silbenbeginn anzusetzen ist. In der Regel entschied man sich für einen der drei folgenden Meßpunkte: Gemessen wurde (a) der Beginn der (Quasi-)Periodizität, also der silbentragende Vokalansatz, (b) der Beginn des akustischen Signals, also auch silbeninitiale Konsonanten (soweit meßbar, d.h. ohne die stimmlosen Plosive), oder (c) der Intensitätsgipfel der Silbe, also ein Punkt im Vokal. Untersuchungen von Morton, Marcus & Frankish (1976), Fowler (1979) und Tuller & Fowler (1980) haben aber gezeigt, daß die Punkte im Silbenanstieg, die vom sprachverarbeitenden Rezipienten als Ansatzpunkte wahrgenommen werden, mit keiner von diesen phonetischen Meßmethoden übereinstimmen. Vielmehr verändert sich der "psychologische Meßpunkt" (das "P-center")19 je nach der Struktur des Silbenanstiegs (und sogar des Silbenabfalls). Um perzeptive rhythmische Isochrome zu erzielen, werden z.B. nach Morton et al. (1976) längere Intervalle zwischen den akustischen Stimulusansätzen benötigt, wenn der erste Stimulus mit Konsonanten längerer Dauer oder einem Konsonantencluster und der zweite Stimulus mit einem Konsonanten kürzerer Dauer oder einem Vokal beginnt; das Intervall muß entsprechend kürzer gewählt werden, wenn die Reihenfolge der Stimuli umgekehrt wird. Der zweite und der dritte Einwand sind für die Analyse natürlicher Konversationen besonders interessant. Es ist zum einen fraglich, ob akustische Messungen überhaupt ein valides Instrumentarium für die Untersuchung des Rhythmus natürlicher Sprache darstellen. Bekannt ist, daß Sprecher einer akzentzählenden Sprache wie Englisch eine silbenzählende Sprache wie Spanisch deutlicher als silbenzählend wahrnehmen als dessen Muttersprachler, die wiederum das Englische mehr als dessen 'native speakers' als akzentzählend einstufen. Statt hierin ein Indiz dafür zu sehen, daß Pike einem Artefakt seiner eigenen sprachlichen Voreingenommenheit aufgesessen ist (wie das manchmal in der Literatur zu lesen ist), kann diese Überspitzung der Wahrnehmung durch Exophone gerade ein deutlicher Hinweis auf die psychologische Realität akustisch-phonetisch möglicherweise gar nicht so deutlicher Unterschiede sein. Experimentelle Unterstützung für die These, daß mehr Rhythmus wahrgenommen wird, als physikalisch im untersuchten Signal vorhanden ist, ergibt sich aus Mitklopf-Experimenten (z.B. Donovan & Darwin 1979). Bittet man Versuchspersonen, den Rhythmus einer vorgelesenen Passage des Englischen mitzuklopfen, so ist der geschlagene Rhythmus isochroner als der gesprochene - ein Effekt, der bei nicht-sprachlichen Vorbildgeräuschen verschwindet, also ganz offensichtlich an die Wahrnehmung von Sprache gebunden ist. Dasselbe Ergebnis erhält man bei Rhythmus-Anpassungs-Experimenten, bei denen die Versuchspersonen die Abstände zwischen synthetisch erzeugten Geräuschen mit denen zwischen den 4 phonetischen "The P-Center of a word corresponds with its psychological moment of occurrence" (Morton et al. 1976: 405). Zum Deutschen vgl. Pompino-Marschall (1990).

120 Hervorhebungen eines natürlichsprachigen Satzes - entweder mit natürlichem Tonhöhenverlauf oder monoton gefiltert - in Übereinstimmung bringen müssen. Darüber hinaus ist ein weiterer Aspekt zu beachten. Die meisten phonetischen Messungen gehen zumeist ohne Diskussion davon aus, daß die festgestellte Varianz der Fuß- oder Silbendauer in einem Bereich liegt, der vom menschlichen Wahrnehmungsapparat auch verarbeitet werden kann. Dabei wird das Differenzierungsvermögen des Ohrs, das zwar subtile Tonhöhenunterschiede wahrnimmt, nicht aber kleine Unterschiede der Dauer, oft überschätzt. Lehiste (1973, 1977) und Allen (1975) haben auf physiologische Wahrnehmungsgrenzen hingewiesen, die sicherlich nicht unter 30-50 msec liegen - etwa 10% der Dauer eines rhythmischen Fußes im Englischen. Lehiste (1979) hat sogar gezeigt, das selbst bei nicht-sprachlichen Stimuli (deren Dauerschwankungen zuverlässiger perzipiert werden als sprachliche Stimuli) eine Abweichung von 100 msec in bestimmten Positionen - nämlich im phraseninitialen Fuß - nicht zuverlässig perzipiert werden. Schwankungen in diesem Bereich sind also für die Wahrnehmung und Verarbeitung von Sprache völlig unerheblich. Der dritte Einwand, der die Domäne der Isochronie betrifft, ist für die funktionale Analyse natürlicher Konversationen deshalb besonders wichtig, weil sich die mögliche interaktive Relevanz von Isochronie nicht mithilfe von Meßmethoden feststellen läßt, die Mittelwerte über längere Textpassagen errechnen. Durch die Analyse von natürlichen Konversationen konnte interaktive Relevanz sowohl rhythmisch isochroner als auch rhythmisch anisochroner Passagen gezeigt werden. 20 Isochronie, d.h. rhythmische Integration, liegt dann vor, wenn über eine monologische oder dialogische Passage des Diskurses hinweg eine Sequenz von rhythmischen Schlägen (beats) in perzeptiv gleichen Abständen aufeinderfolgen. Die Etablierung eines rhythmischen Musters (Takt) setzt also mindestens drei isochrone Schläge voraus. Die Beziehung zwischen phonetischer Hervorhebung (accent) und Schlagposition ist aber nicht eineindeutig. Vielmehr kann ein Schlag in einem schon etablierten Takt auf eine Pause fallen (silent beat) oder umkehrt auch eine phonetische Hervorhebung zwischen zwei Schlägen liegen. Auch die Veränderung des Tempos, die Verkürzung oder Verlängerung von Schlagintervallen, erfüllt diskursive Funktionen. Obwohl sowohl das Deutsche als auch das Englische zu den akzentzählenden Sprachen gerechnet werden, scheint der unmarkierte Grad der Isochronie im britischen und amerikanischen Englisch höher zu sein als im Deutschen. Eine hohe Anzahl von Nebenakzenten könnte hierfür verantwortlich sein. Damit sollten isochrone Passagen im Deutschen interaktiv besonders relevant sein. Im Gegensatz zu den phonetischen Untersuchungen haben Phonologen ihr Augenmerk auf typologische Unterschiede und sprachspezifische phonologische Regeln und Prozesse gerich-

Vgl. dazu besonders die Arbeiten des von Auer and di Luzio geleiteten Forschungsprojekts zur "Kontextualisierung durch Rhythmus und Intonation": Auer & Di Luzio (eds.) (1992) and Auer et al. (in prep.) sowie zur Isochronie besonders Auer (1990), Couper-Kuhlen (1993) sowie Erickson & Schulz (1982).

121 tet. In einem phonologischen Licht betrachtet können Abweichungen von der idealen Isochrome, die sich allein auf die Messung rhythmischer Intervalle im akustischen Signal beschränkt, ignoriert werden, da die Abstände zwischen den relevanten Einheiten als nur ein Aspekt der unterschiedlichen rhythmischen Organisation von Sprachen betrachtet werden. Eine phonologisch motivierte Reinterpretation des Konzeptes der Isochrome findet sich bei Ladefoged (1975/1982: 109f): [...] English has a number of processes that act together to maintain the rhythm. [...]. Taking all these facts together [...] it is as if there were a conspiracy in English to maintain a regular rhythm. However, this conspiracy is not strong enough to completely override the irregularities caused by variations in the number and type of unstressed syllables.

Zusammen mit der Phonologisierung21 wird die kategoriale Unterscheidung von silben- und akzentzählenden Sprachen zu einem Kontinuum, an dessen Enden prototypische Vertreter der Isochronietypen angesiedelt werden können. Der folgende Überblick über die relevanten phonologischen Aspekte entstammt Auer & Uhmann (1988: 253): (19) prototypische "silbenzählende" Sprachen prototypische "akzentzählende" Sprachen

21

überwiegend CV-Silbenstruktur

verschiedene, teils sehr komplexe Silbenstrukturen

keine Unterschiede in der Struktur betonter und unbetonter Silben

schwere vs. leichte Silben = betonte vs. unbetonte Silben

konstante, gut definierte Silbengrenzen, Geminaten

tempoabhängig variable, schlecht definierte Silbengrenzen (Ambisilbizität), Schwächung ambisilbischer Konsonanten und Geminatenreduktion

Vokalsystem stabil, Vokalharmonie möglich

Vokalsystem im Nebenakzent reduziert, keine Vokalharmonie möglich

Vokalausfall zur Optimierung der Silbenstruktur

Vokalausfall aus akzentuellen Gründen

Akzent wenig grammatisch distinktiv, Wortakzent fehlt teils

Akzent grammatisch distinktiv, komplexe Akzentregeln, Euphonieregeln

Iktus- und Akzentposition: kodachron: ("trailer-timing")

Iktus- und Akzentposition: kapochron ("leader-timing")

Vgl. auch Donegan & Stampe (1983) und Dauer (1983: 55): "I would like to propose that the rhythmic differences we feel to exist between languages such as English and Spanish are more a result of phonological, phonetic, lexical, and syntactic facts about that language than any attempt on the part of the speaker to equalize interstress or intersyllable intervals". Für eine Phonologisierung plädiert auch Auer (1993) - im Gegensatz zu der von ihm in Auer & Uhmann (1988) vertretenen Meinung. Zur Unterstreichung der Phonologisierung des Konzepts spricht Auer (1993,1994) von Silbensprachen und Wortsprachen bzw. von Silbenrhythmus (syllable-rhythm) und Wortrhythmus (word-rhythm). Als konstitutiv für Wortsprachen wird in Auer (1993: 14) auch noch der Verzicht auf die lexikalische Ausnutzung tonaler Merkmale genannt

122 Für das Thema dieses Kapitels sind zwei Aspekte besonders interessant. Das ist zum einen die Annahme, daß in akzentzählenden Sprachen eine Beziehung zwischen Silbengewicht und Betonung besteht.22 An dieser Stelle ist jedoch zunächst eine terminologische Klärung des Begriffs Betonung nötig, mit der ich mich an der von Bolinger (1964/1972: 22f) eingeführten Unterscheidung zwischen stress (Iktus) und accent (Akzent) orientiere. Ich verwende diese Begriffe im folgenden in dem in (20) gezeigten Sinn: (20) Iktus versus Akzent Silbe

Akzent Unter stress wird in Anlehnung an Bolingers Modell ein abstraktes lexikalisches Merkmal verstanden, das in der Regel einer einzigen Silbe eines Wortes zugewiesen wird. Damit eine Silbe in einer Sprache wie dem Englischen oder Deutschen dieses Merkmal erhalten kann, darf 22

Unterschiede im Gewicht einer Silbe und der Zusammenhang zwischen schweren Silben und der Iktuszuweisung haben zur Postulierung der Relevanz der "Morenstruktur" von Silben geführt (vgl. Hyman 1975: 232f und 198S, van der Hülst 1984: Kap. 2 sowie als Überblick Auer 1991b). Schwere Silben bestehen nach dieser Theorie aus zwei Moren, leichte Silben aus einer More: schwere Silbe leichte Silbe

σ m / s

c

σ I m

m Λ

}

vlvl

c

c

ν

Silben, die im Deutschen als leichte Silben nicht für die Iktuspostion ausgewählt werden können, müssen die V-Position mit einem reduzierten Vokal besetzen.

123

sie keinen reduzierten Vokal enthalten. Von dieser abstrakten morpho-phonologischen Hervorhebungsposition und ihrem inhärenten Potential für Akzentuierbarkeit unterscheidet Bolinger die tatsächlich realisierte phonetische Hervorhebung (accent).23 Ich möchte mich hier der Bolinger-Tradition anschließen und eine Trennung zwischen abstrakter Hervorhebungsposition, Iktus, und phonetischer Hervorhebung, Akzent, vornehmen. Der zweite wichtige Aspekt betrifft den Status von Euphonieregeln wie Schlagtilgung, Schlaghinzufügung und Schlagverschiebung. Solche rhythmischen Veränderungen sind im Rahmen der metrischen Phonologie ausführlich beschrieben worden. Ich werde zentrale Aspekte im folgenden kurz vorstellen, denn ich möchte zeigen, daß auf der Basis der dort entwickelten Analysemodelle wichtige Erkenntnisse für die Beschreibung rhythmischer Strukturen in natürlichen Konversationen gewonnen werden können.

3.2.1 Akzentzusammenstöße in der metrischen Phonologie Im Rahmen der metrischen Phonologie werden im wesentlichen zwei Aufgabenbereiche bearbeitet. Die Theorie behandelt zum einen Prominenzrelationen innerhalb von morphologischen und syntaktischen Domänen oder ebenfalls hierarchisch organisierten prosodisch-phonologischen Domänen24 wie Silben (σ), Füße (φ), prosodische Wörter (ω), Akzentdomänen (AD), Intonationsphrasen (IP), intonatorische Äußerungen. Prominenz ist in diesem Ansatz weniger eine Eigenschaft von Silben, die sie z.B. über ein Merkmal [±stress] erhalten, als eine Eigenschaft von Strukturen. Ihr relationaler Charakter wird in metrischen Bäumen repräsentiert (vgl. dazu Kapitel 2.3.1). Zum anderen werden rhythmische Strukturen beschrieben. Die hierarchische Struktur des metrischen Baums wird in einem metrischen Gitter25 linearisiert, das 23

Obwohl der Gebrauch dieser Terminologie auch in der anglo-amerikanischen Literatur nicht völlig konsistent ist, erweist sich doch die Ambiguität von Bezeichnungen wie Wort-, Phrasen- oder Satzakzent im Deutschen als besonders problematisch, da sie nicht zwischen dem Potential für Akzentuierbarkeit und der realisierten phonetischen Hervorhebung unterschiedet, vgl. dazu auch Uhmann (1991: 21ff). Im Deutschen wird die Akzentuierung im wesentlichen durch F0-Veränderungen erreicht; und obwohl ein mehrsilbiges Wort mit einer völlig flachen FO-Kontur realisiert werden kann, bleibt doch die abstrakte lexikalisch-phonologische Hervorhebungsposition erhalten, die eine Silbe als Iktussilbe auszeichnet. Diskussionen zur Isochrome müssen diese Unterscheidung berücksichtigen, denn es ist ein wichter Unterschied, ob Isochrome wie bei Selkirk (1984: 41ff) auf der phonologischen Ebene (Iktuspositionen) oder auf der phonetischen Ebene (Akzentpositionen) erwartet wird. Vgl. dazu auch Couper-Kuhlen (1993: Kap. 3).

24

Es gibt in der Literatur keine Übereinstimmung darüber, ob es sich bei diesen Domänen um Sprachuniversalien handelt, ob alle Domänen in allen Sprachen die gleiche Bedeutung haben, ob ihre hierarchische Strukturierung von der "Strict Layer Hypothesis" (vgl. Selkirk 1984: 26; Nespor & Vogel 1986: 5ff) gesteuert wird oder ob prosodische Strukturen, z.B. auf der Ebene der Intonationsphrase, auch rekursiv organisiert sein können (vgl. Ladd 1986: 322ff, 1991,1992).

25

Für eine detaillierte Beschreibung des metrischen Gitters vgl. Kapitel 2.3.1 sowie Uhmann (1991: Kap. 4.2). Die dort vorgeschlagene Analyse ist zwar stark an Selkirk (1984) orientiert, aber es gibt doch auch wichtige Unterschiede zu Selkirks Theorie. So ist die prosodische Struktur reicher (vgl. Akzentdomänen) und die Akzenttonverstärkung, eine Art von Nuclear Stress Rule, wird nicht zyklisch angewendet, sondern hat als Regelanwendungsdomäne die Intonationsphrase.

124 die Alternanz von starken und schwachen Silben direkt wiedergibt. Metrische Gitter werden über Schlagpositionen (x) aufgebaut, die der Silbe (σ) als der kleinsten Einheit für die Beschreibung rhythmischer Strukturen zugeordnet sind. Der Aufbau des metrischen Gitters beginnt also mit der Identifikation der Silben und der Zuweisung von Schlagpositionen in Eins-zu-EinsRelation. Im Rahmen der nicht-linearen Phonologie fungiert diese unterste Gitterebene auch als gemeinsame Zeitachse (timing tier) für die auf unabhängigen Ebenen untergebrachten Autosegmente (z.B. tonale Merkmale und metrische Merkmale), indem sie die Text-Melodie- und die Text-Gitter-Verbindung herstellt. Horizontal bilden sich Gitterebenen, die der morphosyntaktischen oder der prosodischen Phrasierung der Äußerung entsprechen. Vertikal bilden sich Türme von Schlägen (beats), die die metrische Prominenz der jeweiligen Schlagposition widerspiegeln. Mit diesen beiden Aufgaben hat sich auch eine kontroverse Diskussion um die Beschreibungsebenen, metrische Bäume vs. metrische Gitter, entwickelt, die hier aber nicht nachvollzogen werden soll. 26 Das hier entwickelte Modell arbeitet (im Gegensatz zu Uhmann 1991) mit beiden Beschreibungsebenen, wobei die in diesem Kapitel zu analysierenden Akzentzusammenstöße mithilfe des metrischen Gitters besonders gut als 'abweichende' rhythmische Strukturen dargestellt werden können. Mit einer phonologischen Generalisierung, dem Principle of Rhythmic Alternation, hat Selkirk (1984: 52) die Beobachtung zusammengefaßt, daß natürliche Sprachen dazu tendieren, eine Altemanz zwischen prominenten und nicht-prominenten Silben herzustellen. Natürliche Sprachen vermeiden sowohl Folgen von prominenten als auch Folgen von nicht-prominenten Silben: (21) Principle of Rhythmic Alternation (a) Every strong position on a metrical level η should be followed by at least one weak position on that level. (b) Any weak position on a metrical level η may be preceded by at most one weak position on that level. Verletzungen von (21a) führen zu Akzentzusammenstößen (beat clash), Verletzungen von (21b) führen zu Akzentlücken (beat lapse). Akzentzusammenstöße und ihre Auflösung wurden seit Liberman & Prince (1977) mit Hilfe von Wohlklangsregeln Schlagverschiebung

(Grid Euphony Rules) wie

(Stress Shift, Rhythm Rule, Iambic Reversal, Beat Movement) oder

Schlagtilgung (Beat Deletion) und Schlaghinzufügung (Beat Addition) diskutiert: 26

Zur Einführung in die metrische Phonologie vgl. Goldsmith (1990: Chap. 4) oder Hogg & McCully (1987). Eine gute Übersicht und eine ausführliche Diskussion von Argumenten für und gegen metrische Gitter sowie für und gegen metrische Bäume findet sich in Visch (1990: Kap.3). Für das Deutsche vgl. u.a. Giegerich (1985) als Vertreter einer "tree-only"-Theorie, Uhmann (1991) für eine "grid-only-"Theorie und Jacobs (1991, 1993) als Vertreter von Gittern und Bäumen entsprechend der Notation von Prominenzrelationen und rhythmischen Strukturen. Für die Bestimmung der Iktuspositionen werden in der Literatur verschiedene Ansätze diskutiert vgl. u.a. Eisenberg (1991), Ramers (1992) oder Vennemann (1991).

125 (22) Akzentzusammenstoß (Liberman & Prince 1977: 317) χ χ χ X XXX achromatic S

χ χ χ χ χ achromatic lens s w s w s

W S W

\/ W

ν

S

Liberman & Prince (1977: 317) definieren die Beziehung der metrischen Elemente untereinander (Adjazenz, Alternanz und Zusammenstoß) wie folgt: Elements are metrically adjacent if they are on the same level and no other elements of that level intervene between them; adjacent elements are metrically alternating if, in the next lower level, the elements corresponding to them (if any) are not adjacent; adjacent elements are metrically clashing if their counterparts one level down are adjacent. (Liberman & Prince 1977: 317)

Obwohl Akzentzusammenstöße über das metrische Gitter definiert werden, erfolgt die Auflösung dieser Struktur, Schlagverschiebung

(Iambic Reversal), unter Bezugnahme auf die

27

metrische Baumrepräsentation : (23) Iambic Reversal (Liberman & Prince 1977: 318)

Ki

K2

Kl

K2

Bei der Anwendung von Iambic Reversal müssen jedoch zwei Bedingungen beachtet werden. Dabei ist vor allem die erste Bedingung für die Diskussion der Akzentzusammenstöße von besonderer Bedeutung, denn sie verhindert, daß die metrische Prominenz des "designated terminal elements" (DTE) abgebaut wird: Condition: (1) K2 is not the DTE (i.e. strongest element) of the phrase (2) Kl is not [-stress] 27

Zur Kritik an Liberman & Prince (1977) vgl. u.a. auch Hayes (1984) und Selkirk (1984). Hayes, der - im Gegensatz zu Selkirks Lösung auf der Basis von metrischen Gittern - wie Liberman & Prince (1977) sowohl metrische Gitter als auch metrische Bäume verwendet, geht davon aus, daß Wohlgeformtheitsprinzipien (principles of eurhythmy) über Regeln wie die "Quadrisyllable Rule" den Aufbau des metrischen Gitters steuern.

126 Folgt man jedoch der Argumentation von Nespor & Vogel (1989), dann ist sowohl die von Liberman & Prince (1977) als auch die von Selkirk (1984) vorgelegte Analyse von Akzentzusammenstößen problematisch. Die Probleme entstehen zum einen bei der Definition der rhythmischen Struktur, die als Akzentzusammenstoß wahrgenommen wird, und zum anderen bei den phonologischen Regeln zur Auflösung der abweichenden Strukturen. Nespor & Vogel argumentieren, daß eine phonologische Regel wie die Schlagverschiebung überflüssig ist. Die rhythmischen Veränderungen werden von ihnen als Resultate von Schlagtilgung

(Beat

Deletion) 28 , fakultativer Schlaghinzufügung

(Beat

(Beat Addition) und Schlageinfügung

Insertion) beschrieben. Die von Schlagtilgung betroffenen Silben werden perzeptiv schwächer und damit wird der Akzentzusammenstoß aufgelöst: What we would like to propose here is that there is no rule that moves a prominence, or a beat (x), form one position in the grid to another. Instead, [...], what happens is that a beat is merely deleted by a rule of Beat Deletion (BD). In certain cases, another strong stress may appear elsewhere in the string but, [..], this is the result of a more general phenomenon of Beat Addition (BA), a rule that eliminates lapses, whether they are inherently present or whether they arise as the result of BD. The physical correlate of BD is Destressing, which causes the relevant syllable to be perceived weaker, thus eliminating the perception of the clash. (Nespor & Vogel 1989: 76)

Bei der Definition des Akzentzusammenstoßes müssen auch sprachspezifische Gesichtspunkte berücksichtigt werden. So muß in einer akzentzählenden Sprache (vgl. Abschnitt 3.2) wie dem Englischen oder Deutschen für die Bestimmung von Adjazenz nicht nur auf zwei (wie bei Selkirks Principle of Rhythmic Alternation), sondern auf mindestens drei Gitterebenen Bezug genommen werden und auch die maximale Anzahl intervenierender unakzentuierter Silben muß begrenzt werden: (24) Minimal stress clash (Nespor & Vogel 1989: 98) x X χ

(χ)

χ X X

word foot syllable

Nach Nespor & Vogel erfüllen also nur solche Konfigurationen die rhythmische Struktur des Akzentzusammenstoßes, bei denen zwei Silben mit einer minimalen Prominenz von drei Schlägen aufeinanderstoßen. Diese beiden Silben können durch maximal eine unakzentuierte Silbe voneinander getrennt sein. Schlagtilgung, "Delete an χ at the level at which the minimal clash is defined. (An χ may be deleted only if it is the topmost one in a column)" (Nespor & Vogel 1989: 77), wird aber zur Reduzierung von Prominenz nur dann angewendet, wenn die zu reduzierende Silbe eine maximale Prominenz von drei Schlägen aufweist. Damit folgt der Schutz des DTEs vor Schlagtilgung aus der Regel selbst. Für die Auflösung von Akzent28

Vgl. dazu auch Gussenhoven (1986, 1991) und Hörne (1990).

127 Zusammenstößen auf höheren Prominenzebenen wird nach Nespor & Vogel (1989: lOOff) Schlageinfügung

(BI) 29 angewendet. Schlageinfügung, "Insert an X at the lowest grid level

between two clashing positions if the first is more prominent than the level at which the minimal clash is defined" (Nespor & Vogel 1989: 79), hebt den Akzentzusammenstoß auf, indem die Distanz zwischen zwei Akzentpositionen vergrößert wird. Gibt es eine intervenierende unakzentuierte Silbe, so kann die Schlageinfügung entweder vor oder nach der unakzentuierten Silbe durchgeführt werden. Das akustische Korrelat der Schlageinfügung ist im ersten Fall die Dehnung der akzentuierten Silbe und im zweiten Fall eine Pause. In bestimmten Fällen können also sowohl Schlageinfügung als auch Schlagtilgung angewendet werden. Die beiden Lösungen sind aber bezüglich der Fokus-Hintergrund-Gliederung der betroffenen Konstituenten nicht äquivalent (vgl. 25b und 25c). Die Beispiele (25) bis (27) zeigen die von Nespor & Vogel vorgeschlagenen Auflösungen von Akzentzusammenstößen im Englischen: (25) (a) stress clash

(b) BD χ χ X X X X three books

X X three books (26) (a) stress clash

(b) BI (pause) χ

XX χ Missisipi won (27) (a) stress clash

X

X XX

achromatic

χ χ χ X X X X XX X X Missisipi won (b) BD

χ lens

χ χ X X X X X XX X achromatic lens

(c) BI χ χ χ χ X χ X χ books three (c) BI (lengthening) χ χ χ χ X Mississip

χ X X X X X pi won

(c) BA χ X X X XXX achromatic

χ X X X lens

Auch im Deutschen liegen Akzentzusammenstöße bzw. Akzentlücken dann vor, wenn das Prinzip der rhythmischen Alternation verletzt wird:

29

Nespor & Vogels BI- Regel unterscheidet sich wesentlich von Selkirks "Silent Demi Beat Addition", da BI auf Akzentpositionen und nicht auf Phrasengrenzen Bezug nimmt.

128 (28) Prinzip der rhythmischen Alternation im Deutschen (a) Eine Sequenz von zwei Schlagpositionen, die beide mindestens eine metrische Prominenz von 3 Schlägen haben, sollte von mindestens einer intervenierenden schwächeren Schlagposition auf der Ebene 2 getrennt werden. (b) Auf der Ebene 2 können maximal 2 schwache Schlagpositionen aufeinanderfolgen. Für das Deutsche wurde besonders von F6ry (1986) im Anschluß an Kiparsky (1966) (vgl. aber auch Wiese 1988: lOff und 1996: 306ff) betont, daß Schlagverschiebung bei der Auflösung von Akzentzusammenstößen eine wesentlich wichtigere Rolle als im Englischen spielt, da Schlagverschiebungen im Deutschen symmetrisch sowohl in rechts- als auch in linksköpfigen Strukturen durchgeführt werden. Die folgenden Beispiele für Akzentzusammenstöße 30 werden von Kiparsky (1966: 94) und Firy (1986:34) diskutiert: (29) (a)

(c)

(b) χ XX XX halbtot

(30) (a)

χ XX XXX der halbtote Mann

χ XXX X der halbtote Mann (b)

χ χ χ X X X

anziehen

(c) χ Ix

χ χ I 2UX

x x x x x

>

x x x x

den Rock anziehen

x x x x

den Rock anziehen

Diese Analyse scheint mir jedoch für Beispiel (29) problematisch und für Beispiel (30) falsch zu sein. Mit (29c) wird zwar ein intuitiv korrektes Akzentmuster wiedergegeben, die Analyse ist aber deshalb problematisch, weil das Akzentmuster des Adjektivs halbtot Besonderheiten aufweist, auf die ich am Ende dieses Abschnitts zurückkommen möchte. Um Akzentuierungsmuster wie im Beispiel (30) korrekt überprüfen zu können, ist es unbedingt erforderlich, interferierende Einflüsse auszuschließen, wie sie besonders durch die Bildung von Intonationsphrasengrenzen Zustandekommen. Am Ende von Intonationsphrasen werden Fo-Bewegungen auch auf unakzentuierten oder schwach akzentuierten Silben realisiert, diese Fo-Veränderungen können ebenso wie die Endakzentstärkung (vgl. dazu auch die in Kapitel 2.3.1 beschriebenen Intonationsphrasenbildung) im Sinne von Akzentverschiebungen mißinterpretiert werden. Konstruiert man also wie in (30') einen Kontext, in dem die Intonationsphrasengrenzen von dem zu testenden Bereich weiter entfernt ist, so wird deutlich, daß auch im Deutschen in linksköpfigen Konstruktionen Schlagtilgung und nicht Schlag30

Zu den AkzentzusammenstöBen kommt es, weil innerhalb des phonologischen Wortes drei Gitterebenen angesetzt werden. Bei Verzicht auf die besondere Behandlung von Schwa-Silben würde bereits auf Ebene 2 die Iktussilbe identifiziert.

129 Verschiebung angewendet wird. Darüberhinaus zeigen diese Beispiele, daß auch hier die Schlagtilgung das DTE unberührt läßt: (30·) (a)

(b)

(C)*

χ χ χ X X XX X X x x x X XXX weil sie einen Rock anziehen will einen Rock anziehen will

X X X X XX X XXX einen Rock anziehen will

Wie oben gesagt, muß für die korrekte Definition des Akzentzusammenstoßes auch die Anzahl möglicher intervenierender unakzentuierter Silben berücksichtigt werden. Schlagverschiebung findet nach Kiparksky (1966: 77) auch bei Adjektiven wie unvergeßlich in attributiver Stellung statt. Zu dem Akzentzusammenstoß kommt es in dem Beispiel (31) zwischen den Silben -geßund Tag. Das metrische Gitter zeigt 31 , daß sowohl nach Selkirk als auch nach Liberman & Prince die Bedingungen für Akzentzusammenstoß und damit auch für Schlagverschiebung gegeben wären: (31) (a)

(b)

(c)

12

χ χ X X XX unvergeßlich

X X XX ein unvergeßlicher Tag

3 4

5 X X χ X X X XX X ein unvergeßlicher Tag

Im Vergleich zu Beispiel (29) klingt (31b) jedoch weniger rhythmisch abweichend als (29b), und (31c) ist rhythmisch nicht so optimal wie (29c). Für diesen Eindruck könnten mehrere Gründe verantwortlich gemacht werden. Erstens: Nach Hayes (1984) ist die Anwendung von Akzentverschiebung in Fällen wie (31) deshalb problematisch, weil die Akzentpositionen auf der Skandierungsebene (level of scansion), notiert durch die gestrichelte Linie in (31c), einen Abstand von fünf Silben aufweisen. Ohne Akzentverschiebung besteht ein dreisilbiger Abstand. Da das Ideal nach Hayes (1984: 46) "Quadrisyllable Rule"32 aber vier Silben sind, wird die rhythmische Struktur durch Akzentverschiebung nicht verbesssert. Das von Kiparsky (1966: 77) gewählte Beispiel, ein unvergeßliches Erlebnis, ist in bezug auf die "Quadrisyllable Rule" sogar perfekt, da die Akzentpositionen ohne Akzentverschiebung auf der relevanten 31

Die Silbe -lieh erhält als akzentneutrales Derivationssuffix nur einen Schlag auf der Silbenebene. Als betonbare Silbe (kein Schwa) kann sie aber über Wohlklangsregeln zur Beseitigung von Akzentlücken (lapses) einen Schlag auf der zweiten Ebene erhalten, wenn auf diese Weise ungebundene FüBe mit mehr als zwei unbetonten Silben vermieden werden. Vgl. dazu Eisenberg (1991:56ff) und Wiese (1988:102f), der sich Giegerichs Analyse (1985: 105ff), Silben wie -isch, -lieh, -ig seien wie Schwa-Silben unbetonbar, anschließt.

32

Nach Hayes (1984) sorgen drei Wohlgeformtheitsregeln für eine möglichst gleichmäßige Alternanz von starken und schwachen Silben: Die "Quadrisyllable Rule" (S. 46), die "Disyllabic Rule" (S. 48) und die "Phrasal Rule" (S. 52).

130 Skandierungsebene im Abstand von vier Silben folgen. Die Akzentverschiebung würde diese Struktur verschlechtern, indem sie den Abstand auf sechs Silben erhöhen würde. Zweitens: Auch Kiparsky (1966: 77) weist darauf hin, daß die Iktusposition in Adjektiven wie unvergeßlich, unbeschreiblich, unverkennbar etc. nicht frei von Variation ist; dabei kann es sich um ideolektale, dialektale oder stilistische Variation handeln. Der Iktus kann nämlich auch auf dem Präfix un- liegen.33 Auch in diesem Fall entsteht ein wohlgeformtes metrisches Gitter: (32) χ X X X X X X X X X X ein unvergeßlicher Tag

X X X XXXX unvergeßlich

X

Drittens: Im Gegensatz zu Beispiel (29) weist (31) zwei intervenierende unakzentuierte Silben auf. Perzeptiv scheint (3 lb) auch nicht so unrhythmisch wie (29b) zu sein. Damit weisen die Beispiele darauf hin, daß auch für das Deutsche ein Akzentzusammenstoß nur dann vorliegt, wenn zwei akzentuierte Silben von maximal einer unakzentuierten Silbe getrennt werden. Doch auch wenn die Bedingungen für einen Akzentzusammenstoß gegeben sind, scheint Schlagtilgung die rhythmischen Strukturen adäquater wiederzugeben als Schlagverschiebung. Diese Hypothese läßt sich am besten anhand solcher Strukturen überprüfen, bei denen die Akzente ohne intervenierende unakzentuierte Silben aufeinandertreffen und die damit einen maximalen Druck im Hinblick auf Umformungen ausüben. Solche Konfigurationen finden sich im Deutschen nicht in Nominalphrasen mit der Struktur Adjektiv + Nomen, sondern z.B. in Adj.+Verb-, Adv.+Verb-Phrasen (wie befreit jubeln) oder auch in Nomen + Nomen-Phrasen: (33) (a)

(b)

I

X

£

X X X

(c)?

χ

X

x|

X

x| x

X X X X

X X X

X

Präsident Weizsäcker

X

X

X

X

X X

X

X X X X X

Präsident Weizsäcker

X

X

X

X

X

X

Präsident Weizsäcker

Hier zeigt sich deutlich, daß Schlagtilgung anstelle von Schlagverschiebung angewendet wird, denn (33c) ist eine sehr unnatürliche Realisierung. Intervenierende unakzentuierte Silben aufgrund von Flektion kommen auch innerhalb von Komposita nicht vor. Wieder zeigt sich, daß Nach Kiparsky (1966) liegt der Iktus auf dem Präfix -un, wenn Adjektive gebildet werden, die auch ohne diese Negation existieren ('schön • 'unschön, 'logisch • 'unlogisch, 'freundlich - 'unfreundlich etc.). Der Iktus liegt auf dem Stamm, wenn ein un-loses Adjektiv nicht existiert und wenn keine intervenierende unakzentuierte Silbe zwischen Präfix und Stamm tritt (un'glaublich, un'säglich etc). Bei intervenierender unakzentuierter Silbe kommt es zu Variation ('unermüdlich - uner'müdlich, 'unvergeßlich -unver'geßlich etc.). Die Frage, ob die Akzentvariation über verschiedene Lexikoneinträge, Unterspezifikation oder postIexikalische rhythmische Umstrukturierung adäquat beschrieben wird, kann im Rahmen dieser Arbeit nicht beantwortet werden.

131 Schlagtilgung die rhythmischen Strukturen adäquater wiedergibt als Schlagverschiebung. Auch hier muß aber vermieden werden, daß Intonationsphrasengrenzen Einfluß auf die Perzeption der Akzentuierungsmuster nehmen: (34) (a)

(c)*

(b) χ χ X XX X XXX [Urgroßvater]]

χ χ s & X X XX [Urfgroßvater]] (35) (a)

(0?

(b)

Ix χ X | x X| X X XX X X X X [General[feldmarschall]]

X X X X XX X XXX [Urgroßvater]]

X X X X X X X XXX X X X [General[feldmarschall]]

χ χ χ χ χ χ χ χ XX X X X X [General[feldmarschall]]

Es besteht jedoch, entgegen der Darstellung von F6ry (1986), wieder ein deutlicher Akzeptabilitätsunterschied zwischen dem linksköpfigen Akzentmuster (34c) und dem rechtsköpfigen (35c). (35c) ist vergleichbar abweichend wie (33c), aber deutlich besser als (34c). Für rechtsköpfige Strukturen scheint Akzentverschiebung nicht völlig ausgeschlossen zu sein - zumindest nicht auf einem Kasernenhof. Eine andere, und vielleicht die natürlichste Variante wird jedoch über Schlageinfügung erzielt. Schlageinfügung hebt den Akzentzusammenstoß auf, indem durch eine Pause die Distanz zwischen zwei Akzentpositionen vergrößert wird: (35d) χ

χ χ

x x x x x xx χ Χ χ χ χ [General [feldmarschall]] Ich möchte nun zu dem Beispiel (29) mit dem Kompositum halbtot zurückkommen. Die Komposita der Beispiele (34) und (35) gehörten zu einer Gruppe von Komposita, die man traditionell als Determinativkomposita bezeichnet. Determinativkomposita des Typs [ABl denotieren eine bestimmte Art von B-Entitäten, wobei die Konstituente Α spezifiziert, um welche Art von B-Entität es sich handelt. Die Teilausdrücke sind nicht autonom, sondern sie werden zu einer semantisch kompakten Einheit verschweißt. Mit anderen Worten: Die Tochterkonstituenten von Determinativkomposita unterliegen den in Kapitel 2.3.1 diskutierten Integrationsbedingungen (Bedl) (vgl. Jacobs 1993). Die für die Integration von Komposita relevanten Bedingungen sind die folgenden:

132 (Bedl) 1. 2. 4.

Konstituente Χι ist nur dann in Konstituente X2 integriert, wenn 1.-4. gelten: Xi und X2 sind Tochterkonstituenten der Konstituente Y und X2 ist Kopf von Y; Y ist ein Wort und X1 ist eine nähere Bestimmung zu X2; X2 enthält nicht mehr Teilkonstituenten als eine nicht-komplexe Kernkonstituente L.

Es gibt jedoch (mindestens) zwei weitere Gruppen von Komposita, die sich semantisch von Determinativkomposita unterscheiden. Zum einen die Koordinativkomposita [ABl, bei denen die Tochterkonstituenten Α und Β in additiver Relation zueinander stehen und zum anderen die Augmentiv- oder Elativkomposita [Aß], bei denen die Konstituente Α die Konstituente Β intensiviert. Diese semantische Differenzierung spiegelt sich auch in unterschiedlichen Akzentuierungsmustern wider. Bei den Determinativkomposita wird über die Anwendung der P-Regel 3 (Jacobs 1993: 85) die Iktussilbe einer Konstituente als prominenteste Silbe des Kompositums (DTE) ausgewählt: (P-Regel 3) Wenn kein Χ ε SK das Merkmal [F] enthält und die Elemente von SK im Verhältnis der Integration stehen, dann geht "+" an die integrierte Konstituente, wenn diese neutral betonbar ist, andernfalls an die Zielkonstituente. Bei Koordinativ- und Elativkomposita hingegen werden deren Tochterkonstituenten über die Anwendung der P-Regel 2 (Jacobs 1993: 84) als gleichberechtigt behandelt: (P-Regel 2) Wenn kein Χ ε SK das Merkmal [F] enthält, erhalten alle neutral betonbaren Χ ε SK "+". (Die P-Regel 1 ist hier nicht einschlägig, weil alle Komposita als voll fokussiert betrachtet werden sollen.) Ein Gewichtungsunterschied ergibt sich bei Koordinativ- und Elativkomposita nur über die fakultative Anwendung der Endakzentstärkung (Uhmann 1991: 179): (Endakzentstärkung) Von mehreren rhythmisch stärksten Silben innerhalb einer Intonationsphrase erhält die letzte ein zusätzliches "x". Bei identischer Baumstruktur ergeben sich also aufgrund semantischer Unterschiede die folgenden rhythmischen Strkuturen:

133 (36) (a) Koordinativkompositum

(b) Elativkompositum

0

+X+ χ χ

P-R2 \

+

+

P-R3 /

schwarzweiß χ

/

(c) Determinativkompositum

Fischmarkt

Pfundskerl

χ

χ χ χ

χ χ (x)

\

χ χ χ

χ

χ

χ

χ

χ

(χ)

Echte Koordinativkomposita sind relativ selten im Deutschen, und oft verschmelzen sie mit weiteren Konstituenten zu Determinativkomposita wie rotgrünblind, oder Schwarzweißfilm,34 Aber Elativkomposita sind zahlreich und produktiv.35 Die meisten der folgenden Beispiele sind lexikalisiert, womit besonders bei einsilbigen Konstituenten auch der Akzentzusammenstoß lexikalisiert ist. Silbengrenzen werden durch einen Punkt (.) und Ambisillabizität36 durch eine Tilde (~) notiert: 'stroh.'dumm, 'stink.'faul, 'stock.'steif, 'haut.'nah, 'stock.'schwul, 'scheiß.e.'gal,

'pu.del.'naß,

'sau.'dumm,

'tot.'schick, 'Bom.ben.er.'folg,

'sau.'kalt,

'eis.'kalt,

'stock.'kon.ser.va.tiv,

'blut.'jung,

'blut.'arm,

'Scheiß.'spiel, 'Rie.sen.skan.'dal,

'Bul~len.-

1

'hi.tze, 'Höl~len. 'lärm, Pfunds, 'kerl etc). Bekannte Minimalpaare wie'blut.'arm vs. 'blut.arm, 'stein.'reich vs.'stein.reich

oder

'Höl~len. 'lärm vs. 'Höl~len.lärm zeigen, daß Schlagtilgung zur Aufhebung des Akzentzusammenstoßes in diesen Fällen nicht angewendet werden kann, weil Schlagtilgung das Elativkompositum in ein Determinativkompositum verwandeln würde. (Die Endakzentstärkung fällt in diesen Beispielen auf die Iktussilbe des Nomens): (37) (a) Determinativkompositum χ χ χ x x x

(x) χ χ χ χ

ein blutarmes Mädchen

(b) Elativkompositum (Χ) χ χ χ χ X X X

χ χ χ

χ

ein blutarmes Mädchen

34

Vgl. dazu Breindl & Thurmaier (1992).

35

Zur Morphologie vgl. u.a. Fleischer & Barz (1992: 204f, 230ff) sowie zum Akzentmuster Köhler (1995 2 : 189) und Wurzel (1980).

36

Vgl. u.a. Jespersen ( 4 1926: Kap 13), Vennemann (1982: 296ff), Wiese (1986: 8f) sowie Ramers (1992).

134 (Figur I) Determinativkompositum

Elativkompositum

N\rx(\r\ r

\

«Λ.

jΛ

i Λ

-

v

\

ein blut armes Mädchen

V ein

S blut

'

NT

a r m e s Mädchen

Ich komme nun auf die zu Beginn dieses Abschnitts angekündigte Analyse des Beispiels (29) zurück. F6rys (1986) Analyse dieses Beispiels ist deshalb problematisch, weil das Akzentmuster des Kompositums halbtot im Gegensatz zu Adjektivbildungen wie 'halbstark, 'neureich, 'bildungsfeindlich, 'wasserdicht, 'liebenswert nicht eine der beiden unmittelbaren Konstituenten als DTE ausweist. Obwohl halbtot kein prototypisches Elativkompositum 37 wie z.B. mausetot ist, weist das Adjektiv nicht das für Determinativkomposita typische Akzentmuster auf, das eindeutig eine Konstituente als Trägerin des DTEs ausweist. Da 'halb, 'tot kein semantisch differenziertes Pendant 'halb.tot hat, mit dem es ein Minimalpaar bildet, kann Schlagtilgung angewendet werden. Damit käme auch (29c) nicht durch Schlagverschiebung sondern durch Schlagtilgung zustande: (29') (a) χ χ XX XX halbtot

(b) XX X x X i XXX X der halbtote Mann

(c)

X X X XX X XXX X der halbtote Mann

Was folgt aus den Analysen dieses Abschnitts? Das Prinzip der rhythmischen Alternanz erfaßt im Sinne einer rhythmisch unmarkierten Struktur eine zwar Tendenz, mit der Folgen von prominenten und Folgen von nicht-prominenten Silben vermieden werden. Rhythmisch markierte Strukturen, insbesondere Akzentzusammenstöße, sind aber in bestimmten Konstellationen nicht ungrammatisch. Eine solche Konstellation, wie die von den P-Regeln erzeugten 37

Das gleiche Problem ergibt sich bei Farbadjektiven wie grasgrün oder knallgelb. Auch hier handelt es sich eher um Elativkomposita. Farbadjektive wie dunkelblau oder hellrot stellen noch einmal ein besonderes Problem bei der Akzentzuweisung dar, da sie im Gegensatz zu prototypischen Determinativkomposita die B-Konstituente als Trägerin des DTEs ausweisen.

135 Akzentzusammenstöße bei Elativ- und Koordinativkomposita, wurde in diesem Abschnitt vorgestellt. Es scheint daher so zu sein, daß sich das Prinzip der rhythmischen Alternation über die Anwendung von Euphonieregeln nur dann durchsetzt, wenn die von den P-Regeln erzeugten Prominenzstrukturen diese Alternation auch zulassen. Damit wäre erwartbar, daß auch Prominenzstrukturen, die nicht auf Elativkomposita, sondern auf eine bestimmte Verteilung von Fokusmerkmalen zurückgehen, von Schlagtilgung zur Aufhebung eines Akzentzusammenstoßes ausgeschlossen sind. Wie das Beispiel (38) zeigt, ist dies auch tatsächlich der Fall: (38) A: Wer; liebt denn nun eigentlich wenjj? B: [Fi FRITZ] [FÜ GERda] und [pi CLAUS] [FÜ ANna]. Solche Beispiele falsifizieren aber die Gültigkeit des Prinzips der rhythmischen Alternation nicht. Auch die in natürlichen Konversationen systematisch produzierten Akzentzusammenstöße, die in den folgenden Abschnitten diskutiert werden, stehen, wie sich zeigen wird, nicht im Konflikt mit dem grammatischen Prinzip der rhythmischen Alternation, wenn dessen Anwendungsdomäne in der im Vorangehenden deutlich gewordenen Weise eingeschränkt ist. 38 Ich möchte nun auf der Basis der Analyse von Akzentzusammenstößen als markierte rhythmische Strukturen im Rahmen der metrischen Phonologie zeigen, wie Konversationsteilnehmer diese rhythmischen Strukturen durch ihre systematische Produktion über die Akzentuierung nicht-prominenter Silben zu einem interaktiv relevanten Kontextualisierungsmittel machen können.

3.2.2 Akzentzusammenstöße in natürlichen Konversationen Durch die Analyse von natürlichen Konversationen konnte gezeigt werden, daß die Art und Weise, in der sprachliche Äußerungen rhythmisch realisiert werden, von besonderer interaktiver Relevanz ist, da der Rhythmus in vielfältiger Weise als Kontextualisierungsmittel (vgl. FN 20) genutzt wird. Mit dem für diese Arbeit zentralen Konzept der Kontextualisierung19, das auch schon in Kapitel 2 eine wichtige Rolle bei der Analyse der Mittelfeldentleerungen gespielt hat, werden Techniken und Prozeduren erfaßt, mit denen Interaktionsteilnehmer nicht nur Propositionen kommunizieren, sondern zugleich die Kontexte aufbauen, in denen ihre Äußerungen interpretierbar sind. Am Beispiel der rhythmischen Alternation läßt sich meiner Meinung nach gut demonstrieren, daB sich - im Gegensatz zu Seltings (1992) Hinschätzung - phonologische Analysen dann auf die Analyse natürlicher Konversationen übertragen lassen, wenn die Anwendungsdomänen der phonologischen Regeln bekannt sind. 39

Vgl. Cook-Gumperz & Gumperz (1978), Gumperz (1982, 1992a,b) und Auer (1986a, 1992, 1995) sowie Kapitel 1 und FN 57 in Kap. 2.

136 Die Analyse von Akzentzusammenstößen als Kontextualisierungsmittel führt zur Analyse natürlicher Konversationen zurück. Damit stehen nicht mehr Prominenzrelationen als abstrakte grammatische Eigenschaften von Konstituenten unterschiedlicher Komplexität im Zentrum des Interesses, sondern Akzentmuster in gesprochener Sprache. Diese Umorientierung hat auch Auswirkung auf die Akzentnotation (vgl. auch Kap. 2.3.1). In den Transkripten wird eine relationale Akzentnotation

angewendet, die Akzente

innerhalb von Intonationsphrasen bewertet. Falls Intonationsphrasen nicht zu komplex sind, entspricht jede Zeile des Transkripts einer Intonationsphrase. Damit eine Silbe innerhalb einer Intonationsphrase mit einem Primärakzent (') notiert wird, muß sie phonetisch durch Akzenttonzuweisung markiert sein. Wenn eine Intonationsphrase mehr als eine durch Akzentton markierte Silbe enthält, so werden als gleichstark perzipierte Silben ebenfalls mit Primärakzenten notiert. Akzente, die in der Perzeption schwächer erscheinen, aber dennoch über Dauer, Intensität oder Fo-Kontur prosodisch hervorgehoben sind, d.h. nicht nur lexikalische Iktussilben (vgl. die Übersicht (20) und FN 23) sind, werden als Sekundärakzente (') notiert. Wieder ist es natürlich möglich, daß eine Intonationsphrase mehr als einen Sekundärakzent enthält. Manchmal wird eine primärakzentuierte Silbe mit zusätzlicher Prominenz realisiert. Dies geschieht durch eine Ausdehung des Tonumfangs (pitch range), die auch durch Erhöhung von Intensität und Dauer der betroffenen Silbe begleitet sein kann. Diese besonders hervorgehobenen Silben werden als extra starke Akzente (") notiert. Aus dem relationalen Charakter der Akzentnotation folgt, daß die phonetisch meßbare Prominenz eines Sekundärakzentes in einer Intonationsphrase identisch sein kann mit der phonetischen Prominenz eines Primärakzents in einer anderen Intonationsphrase, wenn es sich um die prominenteste Silbe innerhalb dieser Intonationsphrase handelt. Die relationale Akzentnotation orientiert sich an dem Umstand, daß Konversationsteilnehmer keine Hertz- oder Dezibelberechnungen durchführen und auch nicht Hundertstelsekunden messen, sondern Folgen von alternierenden Prominenzen oder Folgen von gleichstarken bzw. gleichschwachen Prominenzen wahrnehmen. Als Akzentzusammenstöße werden nur Folgen von phonetisch hervorgehobenen Silben gewertet; analysiert werden also im folgenden Afaenfzusammenstöße im eingeführten Sinne (vgl. Kap. 3.2) und nicht /teiizusammenstöße wie bei einigen in Abschnitt 3.2.1 behandelten Beispielen. Anhand der Beispiele (38) und (39) möchte ich einen ersten Einblick geben, wie Akzentzusammenstöße in natürlichen Konversationen realisiert werden. Die Akzentzusammenstöße auf den Elativkomposita 'haut, 'nah und 'eis. 'kalt scheinen hier ihre Umgebungen zu 'infizieren', denn sie werden in Intonationsphrasen realisiert, in denen die Dichte der akzentuierten Silben 40 deutlich höher ist als in den vorangehenden oder nachfolgenden Intonationsphrasen des gleichen Sprechers:

40

Vgl. dazu Uhmann (1989b, 1992) sowie Kapitel 4.

137 (38) China 52 O i l : für 'mich wär das ja auch ne 'irre 'Chance 02 gleich dann (0.9) in das 'volle 'Leben da ei(h)nzustei(h)gen hehehe 03 T: jajajaja (.) -> 04 I: s(h)o 'a(h)lles 'ganz 'haut'nah (0.5) "mit'zu'krie'gen," (39) Hunderfünfzig 10 01 H: (...) schon richtig 'Frühlings(stimmung)? 02 X: jaja (.) wie es: wa03 also =es blüht alles: (.) und: (0.5) (sehr) 'warm 04 (1.0) 05 es war 'schön 06 und jetzt stehn wir hier wieder in diesem häßlichen 'Kiel -> 07 es is 'eis'ka:lt 'regnerisch (.) 'miese 'Stadt, Die Transkriptausschnitte zeigen sowohl Auflösungen von Akzentzusammenstößen, wie sie in Abschnitt 3.2.1 beschrieben wurden, als auch den Verzicht darauf. In Beispiel (38) wird durch Schlageinfiigung (X) mit dem phonetischen Korrelat der Pause der Abstand zwischen der dritten und der vierten akzentuierten Silbe erhöht: (38)

(39) χ

χ X

(x)

χ XX X Χ χ χ X X ganz haut.nah mit.zu.krie.gen

JJL

X X X i X Ϊ X X X X X eis.kalt reg.ne.risch

Wellendiagramm und Fo-Kontur41 des Beispiels (38) (Fig. Π) zeigen deutlich, daß die Silben, die als Akzentzusammenstöße wahrgenommen werden, in ihrer Dauer annähernd identisch sind und durch Fo-Veränderungen, die phonologisch als Akzenttöne analysiert werden, hervorgehoben sind. Damit bilden die von Akzentzusammenstößen betroffenen Silben rhythmisch isochrone Intervalle. In der akzentzählenden Sprache Deutsch wird also kurzfristig ein silbenzählendes Akzentmuster etabliert. 42 Die phonologischen Veränderungen kommen durch Akzenttonassoziation und durch Akzenttonzuteilung zustande (vgl. dazu ausführlich Uhmann 1991: 182). Wie in Kapitel 2.3.1 beschrieben, ist Akzenttonzuweisung über die I-Regeln auf das engste mit der phonologischen Materialisierung des F-Merkmals verbunden. Unter 41

Die akustischen Messungen dieses Kapitels wurden mithilfe des Phonetikprogramms "Signalize™" durchgeführt. Für die Benutzung und einige hilfreiche Anwendungserklärungen danke ich P. Auer. Auch Pike (194S: 35f) hat bereits auf die silbenzählenden Rhythmen in akzentzählenden Sprachen hingewiesen: " [...] in English, however, the [syllable-timed, S.U.] type is used only rarely. In these particular rhythm units each unstressed syllable is likely to be sharp cut, with a measured beat on each one: [...] the general impression is that of spoken chant." Solche silbenzählenden Rhythmen finden sich auch häufig in Kinderreimen und Abzählversen. Allen & Hawkins (1980) haben gezeigt, daB im Spracherwerb auch beim Erlernen einer akzentzählenden Sprache zunächst ein silbenzählendes Stadium durchschritten wird, weil z.B. Vokalreduktionen erst im Alter von vier Jahren systematisch verwendet werden.

138 Emphase weicht die Akzenttonassoziation erheblich von den in Uhmann (1991: 183) formulierten Assoziationskonventionen ab, denn unter Emphase erhalten alle so verstärkten Silben tonale Information, darüberhinaus entsteht eine charakteristische Emphase-Kontur,43 (Figur Π)

2190.0 2110.0 2070.0 -MJ0 O™ 1 1)100 1930 0 i»io.o 400 0 320 0 JOO 0 2 >0 0 2(0 0 240 0 220.0 200 0

Ii »i •• 11 ! 700 0 1000 0 1100.0 too U000 nah haul alles ganz

200.0 2300 0 2(00.0 ΪΙΟΟ.Ο 1400.1 nu m i t ζ u krie gen

'·' " r' 400 0

700 0 1000 0 1JOOO 1400

nooo

200 0 2500 0 2800 0 1100.0 3400 m*

Aber Akzentzusammenstöße brauchen nicht unbedingt Elativkomposita als 'Starter'. In natürlichen Konversationen werden sie nicht nur wie in den Beispielen (38) und (39) als lexikalisch induzierte Akzentzusammenstöße hingenommen, sondern sie werden auch als konversationeil induzierte von den Teilnehmern produziert: (40) China 52f 01 T: aha (0.3) dann ists auch viel 'spannender; 02 I: hm 03 T: weil man dann so die Strukturen gut mitkriegt= 04 =vor allem das to- intere'ssante ist halt das sind 'Leute. -> 05 die 'alle "jah're'lang in TEngland stu'diert I ham; 06 I: l'hhh (41) China 56 05 I: ist es 'schön da? 06 T: in Kuala'lumpur? 07 I: mhm 'lohnts sich da zwei Tage zu 'bleiben 08 T: aah lohnts sich'schon weil die hm Stadtzentrum ist noch so in Kolonialstil 09 ist eine der 'wenigen Städte wo nicht nach der (.) Befreiung 10 ä:h die ganzen Kolo'nialgebäude 'niedergerissen wurden 11 I: mhm Die Emphasekonturen ähneln den von Gussenhoven (1993) analysierten Vokativ-Konturen sowie den von Beckman & Pierrehumbert (1986) beschriebenen Downstep-Konturen. Die tonale Analyse von Downstep wird in der autosegmentalen Phonologie äußerst kontrovers diskutiert. Zur Diskussion der unterschiedlichen Ansätze sowie zum Englischen vgl. Grice (1995). Tonassoziation und Downstep unter Emphase sind im Deutschen weitgehend unerforscht (vgl. Uhmann (i.V.a) und können in Kap. 3.4 nur skizziert werden.

139 12 Τ: von daher ises schon interessant 13 so vom Stadt I bild Iher 14 I: I mhm I 15 T: aber s=is halt "ir're: 'heiß ° in der Großstadt" Welche Funktion könnten diese Akzentzusammenstöße in Alltagsgesprächen haben? Es scheint, als ob die Bedeutung der Elativkomposita, in der ein Element ein anderes intensiviert und verstärkt, über das Akzentmuster als eine Art Blaupause fungiert, indem es 'Intensität' und 'emphatische Verstärkung' dort kontextualisiert, wo ohne Akzentzusammenstoß dieser Interpretationskontext nicht gegeben wäre. So ist etwas, das als "Ir're 'heiß bezeichnet wird, deutlich heißer als etwas, das 'irre heiß ist. Und mit "jah 're'lang bezeichnet man nicht nur ein oder zwei Jahre, sondern eine deutlich längere Zeitspanne. In Beispiel (38) spielt Ikonizität sicher ebenfalls eine Rolle, denn das Akzentuieren von drei Silben erfordert wegen des größeren artikulatorischen Aufwands eine größere Dauer als das Akzentuieren einer Silbe. Ich gehe also im folgenden davon aus, daß Konstituenten von unterschiedlicher Komplexität ein Emphasemerkmal (Ε-Merkmal) zugewiesen werden kann, das die Erhöhung der metrischen Prominenz als phonologisches Korrelat hat (vgl. auch Uhmann 1991: 258ff). Akzentzusammenstöße werden in den Beispielen (40) und (41) dadurch erzielt, daß alle Silben auf einer theoretisch offenen Skala der Verstärkung zur Emphasemarkierung von Schlaghinzufügung betroffen sind: (Emphaseverstärkung) (vorläufig) Alle von einem Ε-Merkmal dominierten Silben erhalten mindestens zwei zusätzliche "x". Verstärkt werden also Schwa-Silben, die lexikalisch nur einen Schlag auf der ersten Ebene erhalten würden, Silben, die im 'idealen' Gitter von Schlagtilgung betroffen wären, sowie die Silben, die als DTE der Phrase ausgezeichnet sind. Unter Emphaseverstärkung ändern sich die lexikalischen Akzentmuster von (40a) und (41a) zu (40b) bzw. (41b): (40) (a)

(41) (a)

(b)

(b) χ

χ X χ X X X jah.re. lang

X X X Λ X i. x x x jah.re. lang

χ X X XX X ir~re heiß

χ χ x x xx χ ir~re heiß

Wieder zeigt die akustische Analyse (Figur ΠΙ) die Übereinstimmungen in der Dauer, den erweiterten Tonumfang auf der emphatisch akzentuierten Silbe ir- sowie die schon erwähnte Downstep-Kontur:

140 (Figur ΠΙ)

2190.0 2130.0 .^2070.0, 2010 0 1950.0 1890.0 1830.0 2 00.0

500.0

inner

über u Kall

2 5 0 0 . 0 ms G r ο Q s t a dt

270.0 250.0 230.0 210.0 190.0 170.0 500.0

900.0

300.0

170i 1.0

2 5 0 0 . 0 ms

Besonders interessant ist jedoch der Vergleich zwischen einer Realisation des Adjektivs irre mit Akzentzusammenstoß in Beispiel (41) (Figur ΙΠ) und einer von der gleichen Sprecherin produzierten Realisation ohne Akzentzusammenstoß in Beispiel (42) (Figur IV): (42) China 15 Ol I: Ja=die Ho'tels sind=sicher (0.6) -> 02 Τ: ° 'irre I 'teuer ° 03 I Γ 'relativ I ja (0.5) relativ I teuer. ° (Figur IV)

500 0

800.0

IC3.C

1400.0

1700.0 ms

500.0

800.0

I10 3.C

1400 .0

1 700.0 ms

270.0 250.0 230 0 2100 190.0 170.0

141 In dem Beispiel (42) wird das Adjektiv nämlich in dem lexikalisierten Akzentmuster realisiert, d.h. die Schwa-Silbe ist völlig unakzentuiert. Bei der Ausnutzung von Akzentzusammenstößen als Kontextualisierungshinweis sind Emphase und die Intensivierung von Bewertungsausdnicken sicher die funktionale Basis für Konversationsteilnehmer.44 Dennoch möchte ich hier versuchen, einen Schritt weiterzugehen und die konversationelle Funktion an die in Abschnitt 3.1 vorgestellte sequentielle Analyse anzubinden. Ich möchte zeigen, daß Bewertungen mit rhythmisch markierten Akzentzusammenstößen in anderen sequentiellen Kontexten verwendet werden als Bewertungen, die eine rhythmische Alternanz von starken und schwachen Silben aufweisen.

3.3 Konversationelle Restriktionen für Akzentzusammenstöße Auf der Basis der bisherigen Analyse können in diesem Abschnitt nun das konversationelle Objekt Bewertung und das phonologische Objekt Akzentzusammenstoß

auf ihre konversa-

tionellen Restriktionen hin untersucht werden. Wie in Abschnitt 3.1 ausgeführt, finden sich Bewertungen in vier unterschiedlichen sequentiellen Kontexten. Akzentzusammenstöße lassen sich in dem vor mir ausgewerteten Datenmaterial jedoch nur in zwei sequentiellen Kontexten nachweisen: in elaborierten ersten Bewertungen (Geschichten, Neuigkeiten etc.) und in den konditioneil relevanten Kommentaren zu diesen ersten Bewertungen.

3.3.1 Akzentzusammenstöße in Kommentaren Die Analyse von bewertenden Kommentaren als zweite Bewertungen, die auf Geschichten, Nachrichten oder Neuigkeiten folgen, wurde durch die Analyse dieser konversationellen Objekte als 'elaborierte erste Bewertungen' motiviert. Die explizite Realisierung der ersten Bewertung mithilfe von lexikalischen Bewertungsausdrücken kann jedoch wie in den Beispielen (17) und (18) dann fehlen, wenn der Erzähler der Geschichte oder der Überbringer der Nachricht davon ausgehen, daß eine ganz bestimmte Interpretation und Bewertung ihrer Erzählung aus ihrem Inhalt und den damit verbundenen Konnotationen rekonstruierbar ist und damit auch eine zweite Bewertung konditioneil relevant macht. Das nächste Beispiel zeigt eine solche Struktur:

Zur Beschreibung des emphatischen Sprechstils in Geschichten vgl. Selting (1994), zu grammatischen Aspekten der Intensivierung im Deutschen vgl. van Os (1989) sowie Müller (1991) zu metrischer Emphase und rhythmischer Skandierung im Italienischen.

142 (43) China 34f ehe=ansonsten von Kuala Lumpur bis Cota Baro 01 02 sinds=so (0.2) 'sechs 'acht 'Stunden; 0 03 mim 'Bus; ° 04 (0.6) 05 geht 'schon 'auch. 06 (0.9) 07 Ja aber das is doch ähm der 'Witz schlecht I hin, I 08 Ijaja I 1 erst bis hier erst nach 'da: und dann wieder zurück die ganze Strecke I 09 * 10 I jaja hmhm hmhm das 'blöde ist halt hier inner I Mitte 11 (1.4) 12 ist 'alles nur 'Dschungel, 13 da komms halt kaum I durch I 14 I hhhha I "span I 'nend I 15 i hehehehel 16 (0.8) 17 u(h)nd 'da(h)rum gibt(h)s k(h)aum 'Querstraßen= 18 =die 'bauen zur Zeit eine, 19 von (0.3) Penang nach Cota Baro 'die müßt jetzt fertig sein= 20 =Darum glaub ich daß es da 'Busverbindungen gibt 21 (1-0) 22 Aber ansonsten 'hier gibts 'absolut 'keine Verbindungen "ruber" In diesem Gesprächsausschnitt sitzen Τ und I über einer Landkarte und Τ hilft I, ihre Reise nach Malaysia zu planen. Unter anderem teilt sie I mit, daß sie für die Strecke von Kuala Lumpur bis Cota Baro ungefähr acht Stunden brauchen wird. Diese Information wird durch die zweite Bewertung in Zeile 07, diese Verbindung sei der Witz schlechthin, und eine Erläuterung dieser Einschätzung (Zeile 09) kommentiert. Wie in Beispiel (18) ist Is bewertende Kommentierung nicht sequenzterminierend, denn in "recognitional terminal overlap" (vgl. Jefferson 1983a) und in Überlappung mit Is Erklärung folgt eine gleichlaufende Bewertung von Τ in Zeile 08 (das blöde is halt). Sequentiell könnte es sich bei dieser dritten Bewertung um eine bestätigende und damit sequenzterminierende Bewertung handeln, aber der für den Redezug gewählte Konstruktionstyp ermöglicht I die Antizipation einer für die Bewertung entscheidenden Informationsergänzung. Diese wird jedoch solange zurückgehalten, bis die Phase des simultanen Sprechens sicher abgeschlossen ist (vgl. die redezuginterne Pause von 1.4 Sekunden von T): Was auf der Landkarte wie eine kurze Distanz aussieht, ist undurchdringlicher Dschungel. Daß Ts Redezug von I jedoch nicht nur als Informationsergänzung betrachtet wird, läßt sich durch die Analyse ihrer Reaktion in Zeile 14 zeigen, die ja als materialisiertes Dokument ihrer Interpretationsleistung zur Verfügung steht. I macht in und mit ihrer Reaktion deutlich, daß sie sich primär an den Konnotationen und der affektiven Bedeutungskomponente orientiert, die der Ausdruck Dschungel für Westeuropäer hat. Wie der Beitrag diverse Weisheitszähne ausgraben in Beispiel (18) erlaubt Ts Redezug I nun, eine als Übereinstimmung interpretierbare modifizierte zweite Bewertung zu produzieren. Sie beginnt diese zweite Bewertung mit einer

143 nicht-lexikalischen Bewertungsvokalisation, einem tiefen, Beeindruckheit zum Ausdruck bringendem Einatmen hhhha, der das bewertende Adjektiv 'spannend folgt. Das lexikalische Akzentmuster für dieses Adjektiv weist die erste Silbe als Iktusposition und als Trägerin der für die Akzentwahrnehmung notwendigen phonetischen Hervorhebung aus, doch in Is Redezug wird auch die zweite Silbe akzentuiert "span'nend. Durch den Akzentzusammenstoß wird, wie in Abschnitt 3.2.2 ausgeführt, die Bewertung intensiviert und die Dokumentation der emotionalen Anteilnahme des Rezipienten, die auch schon in der Bewertungsvokalisation ihren Ausdruck gefunden hat, fortgesetzt. Eines der zentralen Ziele des Abschnitts 3.1 war es zu zeigen, daß zweite Bewerter im Gegensatz zu ersten Bewertern in einer strukturell besseren Position sind, da ihnen die Einschätzung ihres Gesprächspartners bereits bekannt ist. Mit einer zweiten Bewertung als Reaktion auf eine Neuigkeit kann der Rezipient nicht nur dokumentieren, daß die Nachricht nun Bestandteil seines Wissensvorrats ist, sondern er kann darüberhinaus zeigen (und dies ist die zentrale Funktion der Bewertung), daß er die implizite oder explizite Bewertung des Überbringers der Nachricht teilt bzw. nicht teilt. Im Gegensatz aber zu zweiten Bewertungen in Bewertungspaarsequenzen terminiert eine übereinstimmende Bewertung des Rezipienten die Bewertungssequenz nicht unbedingt. Übereinstimmenden zweiten Bewertungen in diesem Aktivitätstyp folgen regelmäßig 'dritte Bewertungen', d.h. die Überbringer der Nachricht oder Neuigkeit produzieren direkt im Anschluß an die zweite Bewertung eine

bestätigende

Bewertung (confirming assessment, vgl. Abschnitt 3.1.2). In dem Gesprächsausschnitt (43) wird die bestätigende dritte Bewertung in teilweiser Überlappung mit Is zweiter Bewertung produziert. Ts Redezug enthält jedoch keine explizite Bewertung, sondern die Bestätigung wird durch Ts Lachen (Zeile 16) und ihre teilweise lachend gesprochene Zusammenfassung (Zeile 17 bis 22) zum Ausdruck gebracht. Mit ihrer Sequenz von Bewertungen und Ts Lachen dokumentieren die Gesprächspartner, daß sie die in der übermittelten Information enthaltene Bewertung teilen. Diese wechselseitig produzierte, deckungsgleiche Einschätzung führt zur Terminierung der Sequenz. Wenn diese Analyse korrekt ist und die Überbringer von Nachrichten oder Neuigkeiten systematisch in dritter Position die Einschätzung ihrer Rezipienten bestätigen, dann ist es zu erwarten, daß sie in manchen Fällen diese Position benutzen, um die Aushandlung von Übereinstimmung einzuleiten.45 Dies sollte dann geschehen, wenn ein Informationsübermittler die in dem Kommentar zum Ausdruck gebrachte Einschätzung seines Rezipienten als Nichtübereinstimmung interpretiert. Dies geschieht in dem Beispiel (44), in dem Κ von den Gefahren berichtet, denen Fußgänger und Benutzer von öffentlichen Verkehrsmitteln im Dschungel der Großstadt ausgesetzt sind:

45

Vgl. auch Schegloff (1992).

144 (44) Rheinuferbahn 01 K: die: (.) ähm (.) Rheinuferbahn hat vorher die ähm (.) Kölner Hohenzollernbrücke mit dem 'h alten Kölner Hauptbahnhof verbunden 02 * =?aber: äh 'h um vom Kölner Hauptbahnhof 03 De 04 zum Bonner Hauptbahnhof zu komn is also imma: schwierig gewesen weil dazwischen also noch 'hh zirka zweihundertfiinfzig Meter (*) 05 'Fußweg waren und I he (*) 06 I 'wie:: 'ent'setz'lich! - > * * 07 E: I hehe I 'h he I 'hh 08 ljaaber:äh 09 K: I ja:, I wenn das äh "grade wäre 10 dann wäre das ja noch was gewesen 11 aber da mußte man über mehrere Straßen I und äh 12 13 E: I hm (.) "Slalom (0.5) 14 K: richtich Κ informiert Ε in Zeile 03f über die schwierige Verbindung zwischen den Hauptbahnhöfen Köln und Bonn. Es folgt in den Zeilen 05 und 06 eine Erläuterung, die E, weil diese mit den Problemen der öffentlichen Verkehrsmittel in der Region Köln/Bonn nicht vertraut ist, die notwendige Information zur Verfügung stellen soll, damit sie Ks Einschätzung zustimmen kann. Κ führt aus, daß die Verbindung deshalb schwierig ist, weil zweihundertfiinfzig Meter Fußweg bewältigt werden müssen. Es Kommentar ist sowohl semantisch als auch sequentiell eine übereinstimmende, eskalierte zweite Bewertung, denn entsetzlich ist ein stärkerer Bewertungsausdruck als schwierig und die zweite Bewertung wird nicht verzögert produziert, sondern in Überlappung mit Ks Redezug. In Ks Reaktion ist aber erkennbar, daß er den Kommentar nicht als Produktion von Übereinstimmung interpretiert hat. Es Kommentar ist nicht sequenzterminierend, es folgt auch keine bestätigende Bewertung, sondern eingeleitet mit ja aber ergänzt Κ seine Information in den Zeilen 09 bis 12 mit weiteren Aspekten, die seine Einschätzung untermauern. Diese zusätzliche Erläuterung wird erneut in Zeile 13 kommentiert und dieser Kommentar erhält eine bestätigende, sequenzterminierende Bewertung. Es stellt sich nun die Frage, ob die in der Graphik (7) in Abschnitt 3.1.1 zusammengefaßte Analyse der sequentiellen Organisation von Bewertungssequenzen korrekt ist, denn dieser Transkriptausschnitt zeigt, daß auch eskalierte Gegenbewertungen zur Sequenzexpansion führen können. Diese Schlußfolgerang wäre aber nur dann gerechtfertigt, wenn es sich bei dem Redezug in Zeile 07 tatsächlich um eine übereinstimmende eskalierte Gegenbewertung handelte. Nun gehört es zu den zentralen Maximen der ethnomethodologischen Konversationsanalyse, den Sinn und die Funktion, den ein Redezug eines Teilnehmers Α für einen Teilnehmer Β hat, nicht allein an dem Redezug von Α festzumachen, sondern vor allem Bs reagierenden Redezug als materialisiertes Dokument des von Β geleisteten Sinngebungsprozesses zur Deutung heranzuziehen. Im Gegensatz zu einem monologisch aufgebauten Text bietet ja ein Dialog dem Konversationsanalytiker eine wichtige interpretative Ressource, da ein Sprecher, der einen reagierenden Redezug produziert, in seiner Äußerung seine Interpretation des vorangegangenen

145 Redezugs zum Ausdruck bringt. Betrachtet man also dieser Maxime folgend Ks Redezug, so dokumentiert sein Beitrag, daß er Es Kommentar nicht als Übereinstimmung, sondern als Nichtübereinstimmung interpretiert hat. Wenn Es Redezug eine Nichtübereinstimmung ist, so muß sie für Κ erkennbar als solche produziert worden sein. Es stellt sich also nun die Frage, ob es Indikatoren in Es Redezug gibt, die für die Interpretation als Nichtübereinstimmung verantwortlich sein könnten. Eine erneute Betrachtung von Es Kommentar zeigt zwei Auffälligkeiten: Erstens: Im Anschluß an ihre Bewertung lacht E. Zweitens: Der bewertende Ausdruck ist rhythmisch markiert, da anstatt der lexikalisierten Akzentuierung auf der Pänultima ent'setzlich alle drei Silben metrisch prominent realisiert werden 'ent'setz'lieh. Zusammen mit dem Akzent auf dem w-Element ergibt sich eine Sequenz von vier unmittelbar aufeinanderfolgenden Akzenten. Diese Akzentzusammenstöße dienen - wie in den bisher analysierten Beispielen - der Intensivierung des Bewertungsausdrucks. Indem Κ eine sehr starke Übereinstimmung als Nichtübereinstimmung behandelt, dokumentiert er, daß Es Bewertung das Gegenteil von dem meint, was sie sagt; d. h. er dokumentiert, daß er Es Kommentar als Ironie interpretiert hat. Im Anschluß an die sequentielle Analyse von Bewertung und Gegenbewertung wurde in Abschnitt 3.1.1 die Binnenstruktur zweiter Bewertungen analysiert. Eine solche Analyse steht für jene zweiten Bewertungen noch aus, die als Kommentare auf Geschichten oder Neuigkeiten folgen. Im Rahmen einer Arbeit, die sich eine empirische Klärung des Verhältnisses von grammatischen Formen und konversationellen Funktionen zum Ziel gesetzt hat, sind aber gerade über die sequentiellen Plazierungen hinausgehende Regularitäten der sprachlichen Ausdrucksformen mögliche Hinweise auf die Wirksamkeit grammatischer Regeln. Betrachtet man die zweiten Bewertungen, die als Kommentare zu Geschichten oder Neuigkeiten produziert werden, so stellt man fest, daß diese ebenfalls nach bestimmten Strukturschemata aufgebaut sind: (16) China 9 ** 06 I: "das: find=ich ja interessant! (17) China 8f ** 15 I: 'Ja, ist natürlich 'unheimlich "blöd. ** 19 I:

°°Ach=du 'je'mi'ne:"

(18) Verhebt 5 ** 06 X: um Gottes Willen! (43) China 34f ** 14 I: hhhha "span'nend (44) Rheinuferbahn ** 07 E: 'wie:: 'ent'setz'lich!

146 Vorlaufelemente kommen zwar - wie das Beispiel (17) Zeile 15 zeigt - auch in der sequentiellen Position von Kommentaren vor, aber zweite Bewertungen in der Funktion von Kommentaren weisen darüberhinaus weitere, zum Teil sehr unterschiedliche Formtypen auf. Diese lassen sich grob zwei Form- bzw. Funktionstypen zuordnen: Interjektionen und Exklamative. So finden sich, z.B. in Beispiel (43), nicht-lexikalische Bewertungsvokalisationen bzw. Interjektionen46 anstelle des Vorlaufelements. Inteijektionen können sowohl allein (und diese Eigenschaft teilen sie ebenfalls mit den Vorlaufelementen) als auch in Kombination mit anderen Inteijektionen auftreten. Im Beispiel (17) Zeile 19 wird die Interjektion ach mit der verkürzten Interjektion jemine kombiniert. Auch komplexe Phrasen, wie Gottseidank oder wie in Beispiel (18) um Gottes Willen, aus dem nicht-interjektionalen Lexembestand, die Fries (1990: 8, 1992b: 311) im Anschluß an Wundt als "sekundäre Interjektionen" bezeichnet, können in dieser sequentiellen Position verwendet werden. Beispiele für den zweiten Funktionstyp, Exklamativa*1, werden in den Gesprächsausschnitten (16), (44) und (17) Zeile 19 realisiert. Dem prätheoretisch hohen Konsens in der Beurteilung und Interpretation von Äußerungen als exklamativ steht eine formale, sprachsystematische Heterogenität des Formtyps gegenüber: Es finden sich alle Stellungstypen des Verbs (Verberst-, Verbzweit-, Verbletzt-Stellung); darüberhinaus können Exklamativa in zwei Gruppen aufgeteilt werden, wobei die Exklamative der einen Gruppe ein w-Element im Vorfeld oder als Subjunktor aufweisen, die anderen dagegen nicht. Diese Liste muß durch solche, elliptische Konstruktionstypen ergänzt werden, denen ein finites Verb fehlt. Problematisch für die Klassifizierung von Exklamativsätzen ist jedoch, daß sie sich ebenso wie Wunschsätze allein auf der syntaktisch-segmentalen Ebene nur schwer von Deklarativa und Interrogativa unterscheiden lassen. Zieht man allerdings wie Altmann (1987, 1993) die intonatorische Realisierung als grammatische, satztypkonstituierende Eigenschaft heran, so zeigen Kategorisierungstests48, daß "funktionale bedingte Fehlkategorisierungen v.a. zwischen Wunschsätzen und Exklamativen vorkommen [...] kaum hingegen zwischen diesen und den formal so ähnlichen Aussage- und Fragesätzen " (Altmann 1993: 26). Obwohl die phonetisch-phonologischen Details der intonatorischen Disambiguierung von Exklamativsätzen nicht völlig klar sind, so ist doch unbestritten, daß die Prosodie hier eine entscheidende Rolle spielt. Prototypisch weisen Exklamativsätze die folgenden prosodischen Natürlich ist das Vorkommen von Interjektionen und nicht-lexikalischen Bewertungsvokalisationen nicht auf diese Position beschränkt (vgl. auch Bsp. (6) Zeile 05). Der Status von Exklamativen im Satzmodussystem wird in der Literatur kontrovers diskutiert, wobei der Intonation eine entscheidende Rolle bei der Klassifizierung zukommt, vgl. u.a. Altmann (1987, 1993), Batliner (1988), Fries (1988), Näf (1987) und Rosengren (1992). Altmann bezieht sich hier auf Kategorisierungstests, die von Scholz (1991) durchgeführt wurden. Zu Problemen der Testpersonen bei der Idenfikation von Exklamativsätzen vgl. Oppenrieder (1988a). intonarischen Realisierung von Exklamativen innerhalb eines Modells von intonatorischen Prototypen Batliner (1988) und Oppenrieder (1988b, 1989) sowie Kohler (1987) zur kategorialen Wahrnehmung funktionalen Interpretation der Verschiebung von FO-Gipfeln zwischen Silbenperipherie und Silbenkern Ladd (1983a, 1983b) zur Phonologisierung und Merkmalsspezifizierung als "delayed peak".

den Zur vgl. und und

147 Eigenschaften auf: (i) eine fallende Intonationskontur mit tiefen Grenzton T%, (ii) Doppelakzentuierung mit einem relativ früh innerhalb der Intonationsphrase realisierten Akzent und einem zweiten Akzent, der bevorzugt auf einem "skalierbaren Lexem" (Altmann 1993: 33) realisiert wird, und (iii) sowohl akustische als auch perzeptive Exklamativakzentrealisierung mit einem deutlich nach dem Amplitudengipfel realisierten Fo-Maximum und einer im Vergleich zur Gesamtdauer der Äußerung deutlich erhöhten Dauer der akzentuierten Silbe. Betrachtet man die Ausdrucksvielfalt für Kommentare in der Übersicht (45), (45) Binnenstruktur zweiter Bewertungen Gegenbewertungen: Vorlaufelement + Bewertungsausdruck Kommentare:

Vorlaufelement + Bewertungsausdruck oder Inteqektion + (Bewertungsausdruck) (Interjektion) oder (Interjektion) + Exklamativ

so stellt sich die Frage nach ihrer kommunikativen Motivierung. Oder anders gefragt: Was bringen Interjektionen, Interjektionen + Bewertungen und Exklamative zusammen mit fakultativen Interjektionen zum Ausdruck, was die Kombination Vorlaufelement + Bewertungsausdruck nicht leistet? Ich denke, diese zusätzliche Leistung ist im Bereich der Expressivität und der affektiven Anteilnahme zu finden: Zusätzlich zu dem denotierten Sachverhalt werden affektive, emotional nicht neutrale Einstellungen des Rezipienten zu dem kommunizierten Sachverhalt ausgedrückt. Dabei ist wichtig, daß diese kommunizierten Einstellungen nicht in einer Eins-zu-EinsBeziehung mit den tatsächlich empfundenen Gefühlen stehen müssen. Im Anschluß an Fries (1996: 39f) kann man zwischen subjektiven und nur introspektiv zugänglichen Gefühlen und mittels Sprache systematisch ausdrückbaren Emotionen unterscheiden, wobei "Emotionen jene Aspekte der Äußerungsbedeutung sprachlicher Strukturen (erfassen), für welche grammatischsystematische bzw. phonologisch/phonetisch-systematische Form-Bedeutungs-Beziehungen konstatierbar sind." Zu diesen sprachsystematischen Mitteln, mit denen Emotionen ausgedrückt werden können, gehören Interjektionen und Exklamative. Sie dokumentieren in dem sequentiellen Kontext bewertender Kommentare die konditionell relevante reziproke, affektiv-emotionale Stellungnahme des Rezipienten (reciprocal affect display, vgl. Goodwin & Goodwin 1992: 157). Eine weitere Eigenschaft von Exklamativa, die in dem hier diskutierten Zusammenhang von besonderem Interesse ist, liegt in der Unabhängigkeit der Akzentplazierung von der FokusHintergrund-Gliederung (vgl. Altmann 1993: 30ff). Wie in Kapitel 2.3.1 gezeigt wurde, nimmt die Fokus-Akzentton-Relation entscheidenden Einfluß auf die Realisierung der Intonations-

148 phrase. Der bzw. die primären Akzente in Exklamativsätzen scheinen sich jedoch nicht nur akustisch und perzeptiv von fokussierenden Akzenten zu unterscheiden, sie lassen sich auch durch entsprechende Vorgängeräußerungen und kontextuelle Einbettungen kaum steuern. Dies weist darauf hin, daß bei der Akzentplazierung in Exklamativa andere Prinzipien als die Informationsgliederung gelten. Sind die Akzente in Exklamativa von dieser grammatisch zentralen Aufgabe befreit, so können sie als ein idealer Träger für stilistische Akzentmuster wie die hier beschriebenen Akzentzusammenstöße fungieren.

3.3.2 Akzentzusammenstöße in Nachrichten Akzentzusammenstöße und Bewertungen sind jedoch nicht auf die Position von Kommentaren beschränkt. Sie kommen ebenfalls in der Position impliziter oder expliziter erster Bewertungen in Geschichten, Neuigkeiten oder Nachrichten vor. Ein Beispiel für diesen Vorkommenstyp ist die Zeile 03 in dem Transkriptausschnitt (46): (46) China 25f 01 T: Ich hab Idirne I 02 I: I aber irgendwie Ija -> * 03 T: ja. ne 'Karte von 'Ma"lay:'sja mal I mit gebracht I ((ehrfurchtsvoll)) ** 04 I: I ts ((click)) ahhh:: I to:ll: I 'ah-° 05 Τ: Γ jetz paß auf." 06 #und zwar ich hab# 07 son 'ganz 'tolles 'dickes 'Buch über Ma'laysia; 14 15 16 17 I:

ähm (0.8) des is jetz (0.7) der 'Hauptteil da'zu gehört noch (0.3) der Teil von 'Borneo, der 'Norden von ΈΟΓ I neo=da= I kannsse aber 'nich hin Ihmhm I

Τ teilt I in Zeile 03 mit, daß sie eine Karte von Malaysia mitgebracht hat. Auf diese Mitteilung folgt in Zeile 04 eine starke Bewertung, die das im vorangegangen Abschnitt analysierte Format zweiter Bewertungen aufweist, die im Anschluß an Mitteilungen als konditioneil relevante Kommentare produziert werden: Der Bewertungsvokalisation, einem dentalen Click [I], folgen die vokalische Inteijektion ahhh:: und das bewertende Adjektiv toll. Da eine explizite erste Bewertung in Ts Redezug fehlt (denn er enthält kein Evaluandum, dem ein Bewertungsausdruck zugeordnet wird), stellt sich die Frage, wie die in Is Redezug dokumentierte Interpretation zustandegekommen ist. Sowohl das Evaluandum ids auch Is affektiv-emotionale Einstellung werden prosodisch bei der Produktion des Eigennamens Malaysia vermittelt. Denn durch die

149 Abweichung von dem lexikalischen Akzentmuster, das die Pänultima 49 von Ma. 'lay.sja als Iktusposition und als Trägerin der für die Akzentwahrnehmung notwendigen phonetischen Hervorhebung ausweist, und durch die Produktion von drei aufeinderfolgenden akzentuierten Silben und die Dehnung der Iktussilbe zeigt Τ an, daß nicht die Benennung und Identifizierung eines referentiellen Objektes, sondern ihre Einstellung zu dem Referenten im Zentrum ihres Beitrags steht. Damit ist Ts Redezug eine implizite erste Bewertung. I dokumentiert diese Interpretation, indem sie die konditioneil relevante Folgeäußerung, eine reziproke affektivemotionale Stellungnahme, produziert. Damit zeigt sie, daß sie nicht nur auf den denotierten Sachverhalt Bezug nimmt und den Erhalt der Nachricht bestätigt. Eine rein bestätigende Reaktion mit der Interjektion hmhm produziert I in Zeile 17, nachdem Τ einen weiteren Landesnamen, diesmal jedoch ohne prosodische Markierung durch Akzentzusammenstöße, eingeführt hat. Betrachtet man die sequentielle Plazierung von Is Beiträgen in diesem Transkriptausschnitt, so zeigt sich ein interessanter Unterschied zwischen der Plazierung der kommentierenden Bewertung in Zeile 04 und der Interjektion hmhm in Zeile 17. Wie von Goodwin (1986: 207f) beschrieben, werden Inteijektionen in der Funktion von Rederechtausschlagungspartikeln50 an den Grenzen zwischen zwei Redezugkonstruktionseinheiten piaziert; sie überbrücken deren Ende und Anfang. Kommentierende Bewertungen hingegen werden als

gleichzeitige

Bewertungen (concurrent assessment, vgl. Goodwin 1986: 213) innerhalb von der Redezugskonstruktionseinheit produziert, auf die sich die Bewertung bezieht. Bevor Τ ihren Redezug mit weiterer Information über ein anderes Referenzobjekt, ein Buch über Malaysia, fortsetzt, beendet sie Is Bewertung durch die Fokussierungsformulierung51 jetz paß auf. Auch das nächste Beispiel (47) zeigt, daß Akzentzusammenstöße innerhalb von Nachrichten oder Geschichten ein ideales Kontextualisierungsmittel sind, um den Rezipienten auf die affektiv-emotionale Einstellung des Sprechers aufmerksam zu machen und für die konditionell relevante reziproke, affektiv-emotionale Stellungnahme des Rezipienten zu sorgen:

4y

Die lexikalische Iktusposition liegt natürlich auf der Antepänultima Ma. 'lay.si.a. Bei der hier gewählten realisationsphonologischen Variante wurde jedoch der Hiatus aufgelöst und der Silbennukleus der Pänultima als Glide produziert Zur Analyse der Interjektion hmhm (uh huh) als "continuer" (Rederechtausschlagungspartikel) vgl. Schegloff (1982). Mit hmhm wird aber auch auf die Initiierung von Reparaturen verzichtet, dadurch fungiert die Inteijektion als Indikator für den Erhalt einer Mitteilung und als Ubereinstimmungssignal. Fokussierung ist hier nicht im Sinne von Fokus-Hintergrund-Gliederung zu verstehen, sondern im AnschluB an Goffmans (1963: 83ff) "focused interaction" (fokussierte Interaktion):"(...) the kind of interaction that occurs when persons gather close together and openly cooperate to sustain a single focus of attention, typically by taking turns at talk" Goffman (1963: 24). Doch auch in Konversationen kann der gemeinsame Aufmerksamkeitsfokus suspendiert werden, indem einer der Beteiligten der gemeinsamen Aktivität die Aufmerksamkeit entzieht (z.B. durch Schreiben, aus dem Fenster schauen etc.). Fokussierungsformulierungen weisen auf die hier und jetzt notwendige Orientierung an dem gemeinsamen Aufmerksamkeitsfokus hin.

150 (47) China 19 01 I: 02 03 Τ: 04 05 I: 06 07 08 Τ: 09 * 10 I: 11 (*) 12 13 14 -> 15 ** 16 Τ:

ge'nau in 'der 'Zeit; gabs=en Ar'tikel in 'News'week, hmhm (0.8)

ähm (.) da hatte en en son amerikanischer Journalist, (1.0) ähm halt son paar 'schwarze Stu'denten da inter'viewt, hmhm (1.0) und (0.8) die: die ham also richtige 'Hor'ror, so 'Horrormeldungen (0.6) von sich gegeben; (0.3) der 'eine (0.5) war ma ver'droschen worden, vonner 'ganzen (0.3) 'Horde chinesischer Kommili'ton; (0.3) "weil 'er sich er'dreistet hatte, eine 'Chi'ne'sin 'zum "Tee einzuladen;= ="N e i : : η : : ! ((entsetzt))

I berichtet Τ von einem Artikel über schwarze Studenten in China, den sie in Newsweek gelesen hat. Is Erzählung beginnt mit einem einleitenden Vorwort (story preface, vgl. Jefferson 1978 und Sacks 1971) in den Zeilen 10 bis 11, das eine starke erste Bewertung (Horrormeldungen) enthält und als Vorausschau und eine Art von Blaupause für die Interpretation des Rezipienten fungiert, indem es seine Aufmerksamkeit auf Schreckliches in Is Erzählung lenkt. Die angekündigte Geschichte folgt in den Zeilen 12 bis 16. Sequentiell eine Erläuterung der Bewertung (*), besteht sie aus einer komplexen, in vier Intonationsphrasen unterteilten Redezugkonstruktionseinheit. Die Geschichte beginnt in den Zeilen 12 und 13 mit einer Beschreibung, was chinesische Studenten mit einem schwarzen Kommilitonen gemacht haben, es folgt die Angabe des Grundes für ihr Verhalten mit dem Höhepunkt in Zeile 15. Diese letzte Intonationsphrase wird mit einer Folge von fünf akzentuierten Silben produziert. Im direkten Anschluß (=) an das Ende dieser Konstruktionseinheit produziert Τ einen Beitrag, der sich wesentlich von ihren Beiträgen in den Zeilen 03 und 08 unterscheidet: Sie bestätigt nicht länger allein den Erhalt der Information, sondern kommentiert ihren Inhalt durch die Antwortpartikel nein. Der bewertende Bestandteil des Kommentars, Entsetzen und Mißbilligung, und die reziproke affektiv-emotionale Anteilnahme werden auch hier prosodisch durch die Dehnung und die steigend-fallende exklamative Intonation vermittelt. Wie in dem Beispiel (46) wird im Anschluß an den Akzentzusammenstoß eine übereinstimmende, affektive Bewertung produziert. Im Gegensatz zu dem vorangegangenen Beispiel (46) wird die gleichlaufende Bewertung jedoch nicht im unmittelbaren Anschluß an den Akzentzusammenstoß produziert, eine solche Plazierung sähe aus wie (47'): (47') 14 A: "weil'er sich er'dreistet hatte, 15 eine 'Chi'ne'sin 'zum "Tee I einzuladen; I 16 B: l"N e i : : η : : ! I

151 Da sich der Kommentar in Beispiel (47) nicht auf einen bestimmten, durch Akzentzusammenstöße hervorgehobenen Referenten, sondern auf eine Proposition bezieht, beginnt Τ ihre reziproke Bewertung im direkten Anschluß an das Ende der syntaktischen Konstruktionseinheit: (47) China 19 14 I: "weil 'er sich er'dreistet hatte, 15 eine 'Chi'ne'sin 'zum "Tee einzuladen;= 16 Τ: = "N e i : : η : : ! ((entsetzt)) = Die syntaktische Abgeschlossenheit eines Redezug ist für die Übernahme des Rederechts von entscheidender Bedeutung, und es ist für die Konversationsteilnehmer fortwährend notwendig, syntaktische Abschlußpunkte und damit übergaberelevante Stellen (transition-relevance space, vgl. Sacks, Schegloff & Jefferson 1974, sowie Kap. 2.4.2) zu erkennen und sogar zu antizipieren. Τ ist in der Lage, die Redezugübernahme so präsize zu piazieren, weil I das Ende der Konstruktionseinheit auf jeder für diese Interpretation relevanten Ebene signalisiert hat: Erstens: Auf der textlinguistischen Ebene ist der Höhepunkt der Geschichte erreicht, denn wie angekündigt hat I etwas Schreckliches erzählt und diese affektive Komponente auch durch den Akzentzusammenstoß kontextualisiert. Zweitens: Die syntaktische Antizipierbarkeit des Endes wird dadurch gewährleistet, daß die subordinierende Konjunktion weil einen Verbletzt-Satz52 ankündigt und der Valenzrahmen des Verbs sich erdreisten ein Infinitivkomplement verlangt. Das Infinitivkomplement ist ebenfalls eine Verbletzt-Phrase, so daß mit der erkennbaren Produktion des infiniten Verbs das Ende dieser Redezugkonstruktionseinheit erreicht ist. Drittens: Das infinite Verb einzuladen wird mit fallender Intonation produziert. Wie ausführlich in Kapitel 2 analysiert wurde, ist jedoch syntaktische Abgeschlossenheit als Signal für die Rederechtsübernahme dann ein Problem, wenn der Sprecher Konstituenten, die er auch vor dem antizipierbaren syntaktischen Ende hätte produzieren können, erst nach diesem Abschlußpunkt realisiert. Es konnte gezeigt werden, daß die als Mittelfeldentleerungen bezeichneten Konstruktionen systematische Probleme bei der 'störungsfreien1 Redezugabfolge mit sich bringen, weil diese Konstituenten oft in Überlappung mit dem Beginn des nächsten Redezugs produziert werden. Dies geschieht vor allem dann, wenn die Konstituenten prosodisch selbständig, nach einer tiefen Intonationsphrasengrenze und ohne redezuginterne Pause in direktem Anschluß produziert werden (vgl. Kapitel 2.4.2 und 2.4.4). Die Fortsetzung des Transkriptausschnittes zeigt, daß genau dies auch hier geschieht:

Zu wi'/-Verbzweit-Sätzen und ihren diskurspragmatischen Funktionen vgl. u.a. Gaumann (1983), Günthner (1993a), Keller (1993), Küper (1991), Wegener (1993) sowie zur kritschen Literarübersicht und zur Formulierung einer lexikalistischen Hypothese Uhmann (1996a).

152 (47) China 19 15 I: eine 'Chi'ne'sin 'zum "Tee einzuladien;= 16 T: =I"N e i : : η : : ! I ((entsetzt)) = 17 I: =1 'nachmittags I Störungen bei der Organisation des Sprecherwechsels wurden in Kapitel 2.4.2 als ein Grund diskutiert, warum Konversationsteilnehmer auf Mittelfeldentleerungen auch dann verzichten, wenn ihnen diese Vorteile bei der Optimierung der Hawkinsschen (1992) ElC-Werte verschaffen würden. Die Gestalt eines einzelnen Redezugs ist aber nie das Resultat einer einzigen gesprächsorganisatorischen Regel. Konversationelle Aktivitäten reflektieren vielmehr immer mehrere Organisationsstrukturen zugleich. Konversationsteilnehmer beachten also bei der Produktion ihrer Redezüge Regeln verschiedenster Art, und die Verletzung einer Regel wird u.U. dann in Kauf genommen, wenn sie die Einhaltung anderer Regelsysteme ermöglicht. Ein Aspekt, der für die Organisation und sequentielle Plazierung von kommentierenden Bewertungen relevant ist und deshalb bei der Analyse dieses Transkriptausschnitts in Kapitel 2 nicht diskutiert wurde, ist der Umstand, daß die potentiellen Konstituenten des Mittelfelds sowohl semantisch als auch syntaktisch zu der Redezugkonstruktionseinheit gehören, obwohl sie erst nach ihrem syntaktischen Endpunkt produziert werden: (47) (a) "weil 'er sich er'dreistet hatte, eine 'Chi'ne'sin [nachmittags] 'zum "Tee einzuladen; (b) "weil 'er sich er'dreistet hatte, eine 'Chi'ne'sin 'zum "Tee einzuladen;= 'nachmittags Damit eröffnet sich eine neue Analyseperspektive, denn wie Goodwin (1986: 213) und Goodwin & Goodwin (1992) gezeigt haben, sind auch die Sprecher bestrebt, ihre Beiträge so zu organisieren, daß die bewertenden Kommentare der Rezipienten als gleichzeitige Bewertungen in Überlappung mit der Redezugkonstruktionseinheit der ersten Bewertung produziert werden können. Unter dem Gesichtspunkt der besonderen sequentiellen Plazierung von kommentierenden Bewertungen könnte der Transkriptausschnitt (47) nicht nur ein Fall von 'gestörter' Redezugübernahme sein, sondern vielmehr Is aktiven Beitrag zur Expansion ihres Redebeitrags bis zum Abschluß der kommentierenden Bewertung dokumentieren: (47) China 19 14 I: "weil 'er sich er'dreistet hatte, 15 eine 'Chi'ne'sin 'zum "Tee einzuladen;= I 'nachmittags I 16 Τ: I "N e i : : η : : ! I ((entsetzt)) Für diese Interpretation spricht nicht nur die absolut gleichzeitige Beendigung von Is und Ts Redezügen, sondern vor allem - wie auch schon bei der Analyse vorangegangener Transkript-

153 auszüge - die sich in Is nächstem Redezug dokumentierende Interpretation. Obwohl gerade der in Überlappung produzierte Teil einen für die Bewertung von Is Geschichte äußerst wichtigen Aspekt enthält, daß nämlich die Einladung zum Tee nachmittags stattgefunden hat, behandelt I die Überlappung nicht als Störung oder 'problematischen' Einbruch in ihren Redezug (vgl. auch Goodwin 1986: 211), denn bei einer Interpretation als Störung wäre eine Reparatur erwartbar (z.B. eine Wiederholung der in Überlappung produzierten Teile des Redezugs). Die Abwesenheit von Reparaturen ist ein wichtiger Indikator dafür, daß die Konversationsteilnehmer die Überlappung nicht als Störung der Redezugabfolge interpretieren, sondern daß die Überlappungsstruktur ein von Erzähler und Rezipient kollaborativ produziertes Ereignis ist. Statt einer Reparatur entwickelt sich ein "Entrüstungsdialog" (vgl. Günthner 1993b: 13): (47) China 19 15 I: eine'Chi'ne'sin'zum "Tee einzuladen;= 16 T: =1 "N e i : : η : : ! I ((entsetzt)) = 17 =1 'nachmittags 1= 18 I: =Doch! 19 T: "Nein; das s 'ab'surd." 20 (1.0) 21 "hmhm" 22 I: "Das 'wirklich verrückt." 23 (0.5) 24 T: "hmhm" 25 (1.8) 26 T: 'komisch,· 27 also ich kenn das auch von Malaysia und 'Thailand her, Der erzählte Sachverhalt wird in Zeile 18 zunächst bestätigt (doch), der Bestätigung folgt eine Wiederholung von Ts Kommentar in Zeile 19. Diese Wiederholung ist jedoch nicht ein formal identisches Eigenzitat. Der prosodisch vermittelten affektiv-emotionalen Anteilnahme wird nun durch ein bewertendes Adjektiv lexikalische 'Gestalt' verliehen. Darüberhinaus wird dieser bewertende Redezug mit reduzierter Lautstärke (°) produziert. Ihm folgt - noch leiser (") - eine bestätigende Bewertung von I in Zeile 22. Die zwischen diesen beiden Bewertungen entstehende Pause und die Rederechtausschlagungspartikel hmhm dokumentieren, daß weder I noch Τ weitere thematisch kohärente Beiträge liefern wollen und daß statt einer weiteren Elaboration die Themenbeendigung 53 angeboten wird. Durchgeführt wird die Themenbeendigung von Τ in Zeile 26. T, die bis zu diesem Punkt Rezipient von Is Geschichte gewesen ist, beginnt nun selbst damit, eine Geschichte zu erzählen und sie dokumentiert die-Beziehung zwischen der 53

f ü r die Analyse von Bewertungen als prototypische "telling-ending devices" vgl. Jefferson (1978), Goodwin (1986) und Goodwin & Goodwin (1992: 169ff) zur Lautstärkereduktion als einem für diese Interpretation zentralen Kontextualisierungshinweis (vgl. auch Beispiel (17) Zeilen 16 bis 21). Zu Lautstärkeverändenmgen in natürlichen Dialogen vgl. auch Goldberg (1978). Weitere Techniken zur Endmarkierung in Geschichten sowie Themenbeendigungsstrukuren werden u.a. in Button (1990), Covelli & Murray (1980), Maynard (1980), Uhmann (1989a: 154ff) sowie in Kap. 4.2.4 vorgestellt.

154 gerade gehörten und der noch zu erzählenden Geschichte durch den anaphorischen Ausdruck das, der auf ein bereits im vorangegangenen Diskurs eingeführtes Antezedens verweist. Durch die Andeutung eines ähnlichen Erlebnisses (auch) etabliert sie ihre Geschichte darüberhinaus auch als thematisch kohärente Fortsetzung des Dialogs.54 Die Produktion in Überlappung scheint, so zeigt die bisherige Analyse, eine häufig auftretende Eigenschaft kommentierender Bewertungen zu sein. Um aber eine gleichzeitige zweite Bewertung produzieren zu können, darf die kommentierende Bewertung eine gewisse Komplexität nicht Uberschreiten, denn nur dann ist gewährleistet, daB der Produzent der ersten Bewertung und der Rezipient (Produzent der zweiten Bewertung) gemeinsam - eventuell mit Hilfe von Redezugexpansionen wie in Beispiel (47) - die Produktion in Überlappung leisten können. Solche kommentierenden Bewertungen finden sich auch in dem nächsten Beispiel (48) in den Zeilen 09, 13 und 19 und sie sind hinreichend kurz, so daß sie bis zum Ende der im Vollzug befindlichen Redezugkonstruktionseinheit abgeschlossen werden können: (48) China 60f ((Thema: ein Seemannsclub)) 01 I: =hat eine 'irrsinnige Bar= =das ist das 'einzige, 02 03 wo man noch so en "biBchen (.) 'Gefü:hl kriegt für=s alte Schang'hai; 04 T: aha I aha 05 I: I da ist also von 'oben bis 'unten alles in ähm in "E:benholz; und dann laufen da 'richtig so richtige 'Bilderbuch'see I leute rum I 06 07 T: I'wirklich? I 08 I: ja! so mit I 'wei'ßen 'Bär'ten I -> 09 T: Τ: I wirklich! toll:: I 10 I: und oder hm hm hm ganz 'asiatisch aussehende 11 T: ähm 12 I: und die erzählen sitzen dann auch 'da und erzählen von ihren (.) I 'Pör'tten I -> 13 T: Τ: I "ahtolTl 14 I: und werden auch werden auch 'gerne 'angesprochen I auf ihre Schiffe I im Hafen 15 aha I 16 T: I aha 17 I: und hm das mhm das kann man durchaus auch 'hinkriegen dann von denen mal so en grossen Kahn (.) I gezeigt (.) gezeigt zu kriegen I 18 -> 19 T: laja. ajatoll I 20 muß man da Mitglied sein= Auch das nächste Beispiel zeigt wieder eine implizite erste Bewertung mit einem Akzentzusammenstoß. Im Gegensatz zu den bisher diskutierten Beispielen folgt die kommentierende zweite Bewertung aber nicht unmittelbar auf diese rhythmische Hervorhebung. Dennoch gelingt es dem Erzähler und dem Rezipienten, die in diesem Fall sehr elaborierte zweite Bewertung innerhalb von Ts Redezug zu piazieren:

54

Zu zweiten Geschichten (second stories) vgl. Sacks (1992: 764ff Vol. 1) und Sacks (1992: 249ff und 261ff Vol. 2).

155 (49) China 9 01 T: - > * 02 03 04 ** 05 I: 06 07 08 T: ** 09 I: (**) 10 11 12 T: 13 I: 14 15 16 T: 17 I: 18 T: 19 T: 20 21 T:

°Ich 'muß übrigens heut noch zum 'Köhlersen um 'drei; weils 'Schwierigkeiten gibt mit dem 'PeTcing'auf'entTialt, (0.5) Ich hab den jetz einfach ge"bu:cht? "das: find=ich ja interessant! also da (0.5) hmhm 'das find ich ja (0.7) find ich ja 'wirklich en 'Hammer. (0.4) weil=ich weil ich 'glaube daß das so die 'Linie is, (0.6) die: die wir auch schon äh g- be I merkt I haben, (0.3) llimhm I daß nämlich die Chi'nesen 'anfangen, an 'allen 'Ecken, I zu redu l'zieren und zu kür'zen und zu 'sparen, I ° zu kürzen" I 'wo l'sie 'nur I 'kön'nen; I hmhm I hmhm (0.5) 'hh weil d 'des: war ja 'so,=

Die kommentierende Bewertung erstreckt sich von Zeile 05 bis Zeile 17. Sie bezieht sich auf Ts Information, daß es Schwierigkeiten mit ihrem Pekingaufenthalt gibt. Obwohl Τ äußerst elegant die Spannung im Verlauf ihres Redezugs erhöht hat, indem sie mit leiser, vertraulicher Stimme beginnend am Ende ihres Redezugs den Höhepunkt ihrer Mitteilung mit Akzentzusammenstößen hervorhebt, erfolgt die kommentierende Bewertung nicht im direkten Anschluß an das Ende der semantisch und syntaktisch kompletten Redezugkonstruktionseinheit. Obwohl eine übergaberelevante Stelle erreicht ist, entsteht eine Pause von 0,5 Sekunden, die nach der Regel (lc) zur Zuteilung des Rederechts (vgl. Kapitel 2.4.2) von Τ beendet wird. Am Ende der Intonationsphrase in Zeile 05 hingegen hat Τ bei der Elaborierung ihrer Mitteilung erkennbar keine übergaberelevante Stelle im Verlauf ihres Redezugs erreicht. Aber bevor Τ fortfahren kann, um ihre Schilderung weiter auszuführen, beginnt I mit ihrer komplexen kommentierenden Bewertung, die ebenfalls mit einer Folge von akzentuierten Silben in Zeile 17 ihren Höhepunkt erreicht. Trotz der Distanz zwischen dem Beginn von Ts Redezug in Zeile 05 und seiner Fortsetzung in Zeile 21 gibt es auch in diesem Beispiel keinen Hinweis, daß die Plazierung der kommentierenden Bewertung als Störung der Redezugabfolge interpretiert wird: (49) China 9f 05 T: Ich hab den jetz einfach ge'buxht, ((Zweite Bewertung)) 21 T: 'hh weil d- 'des: war ja 'so,= 22 =daß die Frau "Matz:, 23 'mich ge'fragt hat, 24 ob=ich nich en paar Tage in 'Peking bleiben wollte,

156 Geht man hingegen davon aus, daß kommentierende Bewertungen idealiter als gleichzeitige Bewertungen produziert werden, so ist die hier gewählte Plazierung der elaborierten zweiten Bewertung eine Möglichkeit, zwei divergierende sequentielle Forderungen zu berücksichtigen: Die starke reziproke emotionale Stellungnahme des Rezipienten wird so nahe wie möglich an dem Akzentzusammenstoß piaziert, und zugleich wird eine sequentielle Überlappung mit dem Redezug des Übermittlers der Nachricht erzielt. Zusammenfassend läßt sich festhalten, daß Akzentzusammenstöße in bewertenden Redezügen effektive Kontextualisierungshinweise darstellen. Das phonologisch markierte Akzentuierungsmuster kontextualisiert auf der Interpretationsblaupause der Elativkomposita besondere Intensität und die emotionale Anteilnahme des Sprechers. In den kommentierenden Bewertungen werden Intensität und Expressivität der Bewertung zusätzlich durch die Verwendung von Interjektionen und die Realisierung als Exklamativa erhöht. Überschreiten Intensivierung und Expressivität ein dem denotierten Sachverhalt adäquates Maß, so dienen Akzentzusammenstöße auch der Kontextualisierung von Ironie. In ersten Bewertungen, die implizit oder explizit bei Erzählungen, Neuigkeiten oder Mitteilungen produziert werden, fungieren Akzentzusammenstöße nicht nur als Hinweise auf die affektiv-emotionale Haltung des Produzenten, sondern sie unterstreichen auch die konditionale Relevanz zur Produktion reziproker Kommentare des Rezipienten.

3.3.3 Risiken bei der Verwendung von Akzentzusammenstößen In diesem Abschnitt möchte ich mich nun der Analyse von Problemen zuwenden, die systematisch bei der Verwendung von Akzentzusammenstößen im sequentiellen Kontext von Bewertungen auftauchen. Ich möchte zeigen, daß dieses Akzentmuster aufgrund der Kontextualisierung von Intensität und Expressivität das Risiko der Produktion von Nichtübereinstimmung, die in Abschnitt 3.1 als dispräferierte Handlungsalternative diskutiert wurde, deutlich erhöht. Welche Konsequenzen hat es für die Interpretation von bewertenden Redezügen, wenn ein Sprecher nicht nur eine Bewertung produziert, sondern diese darüberhinaus mit einer rhythmisch markierten Folge von akzentuierten Silben realisiert? Eine Möglichkeit, die Funktion solcher Redezüge zu analysieren, liegt in der Betrachtung der Reaktionen, die im Anschluß an die fraglichen konversationeilen Objekte von ihren Rezipienten geliefert werden. Bei der Analyse von Akzentzusammenstößen bei ersten Bewertungen in Geschichten, Neuigkeiten oder Nachrichten konnte gezeigt werden, daß in der unmittelbaren Umgebung von Akzentzusammenstößen bewertende Kommentare produziert werden. Aus dieser Beobachtung kann gefolgert werden, daß Akzentzusammenstöße die konditioneile Relevanz von affektiv-emotionalen

157 Stellungnahmen des Rezipienten verstärken, indem sie ihn daraufhinweisen, daß präferentiell gleichlaufende Stellungnahmen hier und jetzt erwartbar sind. Wenn aber nach Abschluß einer sequenzinitiierenden ersten Aktivität die normativ erwartbare Folgeäußerung ausbleibt, so folgt aus dem Organisationsprinzip der konditioneilen Relevanz ebenfalls, daß dieses Ausbleiben als notizwürdiges, bedeutungsträchtiges Ereignis interpretiert wird. 55 Für das Ausbleiben von zweiten Bewertungen wurde in Abschnitt 3.1 gezeigt, daß dieses Ereignis als die Ankündigung von Nichtübereinstimmung interpretiert wird. In dem Transkriptausschnitt (50) wären an drei Stellen gleichlaufende Bewertungen und/oder reziproke affektiv-emotionale Stellungnahmen erwartbar, diese bleiben jedoch aus: (50) China 17 * 01 I: 'Ja:, die ham 'ganz 'irre Ge'schichten erzählt; 02 (1.6) 03 T: 0 hmhm ° 04 (1.3) (*) 05 I: die hatten 'alle durch die Bank die ^Einschätzung daß 'China äh -> 06 'durch ' und 'durch 'ras'sis'tisch is. 07 (1.0) 08 und=daß=sie 'sie als Schwarze werden 'immer zu'letzt bedient, 09 (0.73) 10 stehen immer zuletzt I ähm I in der Schlange, 11 Χ: I ((Unterbrechung)) I ((Unterbrechung)) 1. 15 1: ° äh das an der 'Bar in" in diesem Dhing Dho I ng im IHotel erlebt, story 16 T: Ihmhm I 17 I: da kam ein Afrikaner an die 'Bar,= 18 =also das ist ne "Mini Ibar, I 19 T: l°hm° I 20 I: das da sitz könn pf- da gibt=es höchstens 'acht 'Sitzplätze (0.6) 22 und ähm (0.8) da kam also dieser Afrikaner, 23 (0.5) 24 'und so ne Mi'nute später kamen der Hans-'Gert und 'ich;= 25 T: =hmhm 26 I: und die Chi"nesin hat sich sofort an den Hans-'Gert und an 'mich gewandt; 27 und ge'fragt was wir 'trin Iken woll Iten. 28 T: Ihmhm I 29 I: und 'wir ham dann gesacht ehm 30 daß: doch der 'Herr: zu'erst I dagewesen I sei= 31 Τ: I hmhm hmhm I -> 32 I: =und da hat=se uns ziemlich (.) 'komisch (.) 'so 'kon'ster'niert 'an'gelcuckt, 33 und dann hat sie 'ihn (.) be'dient. 34 (1.7) 2. 35 I: und I in=ner l'Zug (0.6) inner=inner 'Bahnhofsschlange, story 36 Τ: I "hm" I 37 I: hab ich das 'auch mal gesehn, 38 (0.6) "By conditional relevance of one item on another we mean: given the first, the second is expectable; upon its occurrence it can be seen to be a second item to the first; upon its nonoccurrence it can be seen to be officially absent (Hervorhebung, SU) all this provided by the occurence of the first item" (Schegloff 1972: 364).

158 39 40 41 -> 42 43 ** 44 45 46 47 48 49 50 51

Τ: hmhm (1.0) 'wie: da 'wurden 'Weiße nach 'vorne geschoben, und (.) und zwar "vor 'ein 'Schwarzen. (1.4) I: "Irrsinnich! (1.4) I: und 'das ham 'die 'auch er'zählt, (1.0) ahm daß ihnen das in 'Schlangen 'dauernd (0.4) 'dau'ernd passiert= =daß I die Chine I sen sich 'vordrängeln. (0.5) Τ: I hmhm I T: "hmhmhmhm" (0.9)

I:

Das erste Ausbleiben (vgl. Zeile 06) ereignet sich im Anschluß an Is komplexes Vorwort (vgl. auch Beispiel (47)), mit dem sie irre Geschichten über Rassismus in China ankündigt. Ankündigungen dieser Art bereiten zum einen den Raum für solche konversationelle Aktivitäten vor, die mehr als eine Redezugkonstruktionseinheit umfassen, und sichern dem prospektiven Erzähler der Geschichte ein Rederecht, das ihm nicht an der ersten übergaberelevanten Stelle wieder streitig gemacht wird. Zum anderen enthalten sie in der Regel auch einen Hinweis für den Rezipienten, was für eine Art von Geschichte er zu erwarten hat (Gestern ist mir etwas Wunderbares/ Schreckliches/ Komisches passiert) und was die passende affektiv-emotionale Reaktion ist. In diesem sequentiellen Kontext benutzen prospektive Geschichtenerzähler oft besonders starke Bewertungen 56 (vgl. durch und durch rassistisch), die affektiv-emotionale Reaktionen und damit die Aufforderung elizitieren, die angekündigte Geschichte auch zu erzählen. Eine solche Aufforderung bleibt an dieser Stelle und auch nach der Elaborierung in den Zeilen 08 und 11 aus. Nach der Pause setzt I ihren Redezug fort und erzählt ihre erste, auf persönlichen Beobachtungen basierende Geschichte, die zeigen soll, daß Schwarze in China tatsächlich bei der Bedienung warten müssen. Der Höhepunkt dieser Geschichte ist in den Zeilen 32 und 33 erreicht, doch auch hier bleibt die erwartbare Folgehandlung, eine kommentierende Bewertung, aus und es entsteht eine Pause von 1,7 Sekunden. Was kann ein Erzähler in einem solchen Fall tun? Jefferson (1978: 234) hat gezeigt, daß Geschichtenerzähler do not explicitly challenge or complain of tangential recipient talk (as they do not complain of recipient silence). Instead, they propose that the story was not yet completed by offering a next story component. Upon completion of that component, a next point occurs at which the story can be responded to [...].

Genau dieser Ausweg wird von I hier auch gewählt. Eingeleitet durch die koordinierende Konjunktion und, setzt sie ihren Beitrag mit einer zweiten Geschichte fort, die ebenfalls auf persönlichen Erlebnissen beruht und die den zweiten in Zeile 10 angekündigten Aspekt

"Superlative assessments"(vgl. Jefferson (1978: 243) gehören zur Klasse von konversationeilen Objekten, die "newsmarks" elizitieren.

159 rassistischen Verhaltens belegen soll. Doch auch hier bleibt die kommentierende Bewertung im Anschluß an den Höhepunkt in den Zeilen 41 und 42 aus. Wieder entsteht eine Pause von 1,4 Sekunden. Diese Abwesenheit von Beiträgen des Rezipienten ist konversationell dramatisch, da Τ weder die Erzählungen würdigt, noch ihr Verstehen dokumentiert und auch nicht über eine gleichlaufende Bewertung zum Ausdruck bringt, daß sie die Einschätzung der Erzählerin teilt. Statt einer weiteren Elaborierung produziert I nun die bis zu diesem Zeitpunkt ausgebliebene kommentierende Bewertung des Rezipienten in Zeile 44 selbst.57 Es stellt sich nun natürlich die Frage, ob es in dem Transkriptausschnitt Hinweise gibt, warum I so dramatisch scheitert. Betrachtet man die prosodische Realisierung von Is Geschichten, so stellt man fest, daß auch hier Akzentzusammenstöße eine wichtige Rolle spielen. Die erwartbaren Reaktionen des Rezipienten bleiben entweder direkt nach einer Folge von akzentuierten Silben (vgl. Zeile 06 und 42) aus, oder sie fehlen im Anschluß an das Ende der Redezugkonstruktionseinheit, die den Akzentzusammenstoß enthält (vgl. Zeile 33). Akzentzusammenstöße, so die Analyse der vorangegangenen Abschnitte, kontextualisieren Intensivierung. Bewertungen, die mit diesem rhythmisch markierten Akzentuierungsmuster realisiert werden, sind semantisch stärker als solche, die ohne diese prosodische Verpackung realisiert werden. In dem Transkriptausschnitt (50) produziert I eine sehr starke Bewertung, nämlich daß China durch und durch rassistisch ist. Diese Bewertung wird darüberhinaus noch als Allaussage präsentiert. In Abschnitt 3.1 wurde gezeigt, daß erste Bewertungen im Gegensatz zu zweiten Bewertungen sequentiell riskante Aktivitäten sind, weil erste Bewerter ihre Einschätzung ohne Wissen um die Bewertung ihres Rezipienten formulieren müssen. Je stärker die erste Bewertung nun formuliert wird, umso mehr steigt auch das Risiko, daß der Rezipient die Bewertung nicht teilt. Nachdem die offene Produktion von Nichtübereinstimmung dispräferiert ist, verzögern Rezipienten ihre Gegenbewertungen und geben dem ersten Bewerter die Gelegenheit, ihre Bewertung in Antizipation einer Nichtübereinstimmung zu modifizieren. Erste Bewerter haben bei dieser Modifikation zwei Optionen. Sie können ihre ursprüngliche Bewertungen deskalieren (vgl. Beispiel (11) in Abschnitt 3.1.1), um mit einer abgeschwächten Einschätzung Übereinstimmung zu erzielen. Sie können aber auch versuchen, ihren Rezipienten zu überzeugen, indem sie (vgl. Beispiel (6), Abschnitt 3.1.1) niveaugleiche oder eskalierte Bewertungen produzieren, die sich auf einen anderen Aspekt des Evaluandum beziehen, oder weitere Evidenz für die korrekte Einschätzung liefern. Letzteres geschieht auch in Beispiel (50), denn im unmittelbaren Anschluß an den Transkriptausschnitt, in dem I keine übereinstimmende Bewertung erzielen kann, beginnt sie eine dritte Geschichte, die ihre Bewertung absichern soll

Wie dramatisch hier das Schweigen des Rezipienten ist, kann man sich leicht im Selbstversuch bei einem vergleichbaren Aktivitätstyp demonstrieren. Man stelle sich vor, daB man einen Witz erzählt hat, nach dessen Pointe niemand lacht. Auch eine Elaborierung und erneute Präsentation der Pointe führt nicht zur konditionell relevanten Folgehandlung, so daB man als Erzähler des Witzes schließlich selbst (und allein) über seinen eigenen Witz lacht.

160 (vgl. Beispiel (47), Abschnitt 3.3.2). Diesmal ist sie auch erfolgreich, die geschilderte Begebenheit überzeugt T, sie produziert nicht nur reziproke affektiv-emotionale Anteilnahme, sondern erzählt selbst eine Geschichte über Rassismus in Malaysia und Thailand. Die Intensivierung von Bewertungen durch Akzentzusammenstöße erhöhen aber nicht nur das Risiko der Nichtübereinstimmung bei ersten Bewertungen. Auch die sequentiell sicherere Aktivität der zweiten Bewertung kann durch die Produktion einer sehr starken Bewertung, die durch Akzentzusammenstöße weiter intensiviert wird, konversationelle Risiken in sich bergen. Der Gesprächsausschnitt, der im folgenden Beispiel vorgestellt wird, folgt auf eine detaillierte Diskussion zum Thema "Pekingaufenthalt": (51) China 15 9/ 01 T: "Ich 'muß übrigens heut noch zum 'Köhlersen um 'drei; 02 weils 'Schwierigkeiten gibt mit dem 'PeTdng'auf'entTialt, (0.5) ((Elaborierte 2. Bewertung (vgl. Bsp! (49)). Ausführliche Erzählung von T, daß ein zugesagter Pekingaufenthalt voraussichtlich nicht stattfinden kann, weil weder Betreuung noch Kostenübernahme sichergestellt sind. I gibt Ratschläge, wie Τ durch Übernachtung bei Bekannten von I ihren Aufenthalt selbständig organisieren kann.)) 15/01 02 03 04 05 06 -> ** 07 08 09 10

T:

I: I: T:

"Aha; aha;" 'hh=ja,= =ich 'frag dich dann nochmal, weil: nachher treff ich mich mit dem 'Michelsen= =mal 'sehn was das er'gibt, das Ge'spräch. (2.5) Ah: das is ja ne "Un'ver'schämfheit! (2.5) Γ find ich" I I ° finds sei I tsam.° (0.5)

Nach der detaillierten Diskussion, deren Verlauf hier vernachlässigt werden kann, produziert Τ in den Zeilen 02 bis 05 eine als Schlußwort (stoiy exit device) fungierende Zusammenfassung, die auf die Einleitung Bezug nimmt. Obwohl Τ und I dem Problem, einen Aufenthalt in Peking ohne offizielle Betreuung zu organisieren, geraume Redezeit gewidmet haben, hat Τ weder explizite Vorwürfe noch starke negative Bewertungen produziert. Liefert der Übermittler der Neuigkeit oder der Erzähler der Geschichte weder eine explizite erste Bewertung noch eine abschließende Bewertung, so befindet sich auch der zweite Bewerter in einer Situation, daß er, ohne die Einschätzung seines Gesprächspartners zu kennen, einen bewertenden Kommentar zu liefern hat, der sich mit der Einschätzung des Erzählers deckt und als reziproke affektivemotionale Anteilnahme interpretiert wird. I, die ja keinen direkten Zugang zu Ts Gefühlen hat, ist also darauf angewiesen, Ts Einschätzung auf der Basis der mit dem berichteten Sachverhalt verbundenen Konnotationen zu inferieren. Ihr bewertender Kommentar in Zeile 07 ist das Produkt dieses Inferenzprozesses, mit dem I dokumentiert, daß sie Ärger und Enttäuschung auf

161 Seiten von Τ sowie eine klare Schuldzuweisung unterstellt. Aber Is kommentierende Bewertung (Inteijektion + Exklamativ und Akzentzusammenstoß) ist offensichtlich zu stark, denn Τ produziert erst nach einer Pause von 2,5 Sekunden und in Überlappung mit Is Modifikation in Zeile 09 eine deskalierte bestätigende Bewertung in Zeile 10. Beide Bewertungen thematisieren die persönliche Einschätzung und sind damit in ihrer Aussagekraft abgeschwächt. Abschließend kann also festgestellt werden, daß Akzentzusammenstöße ambivalente Kontextualisierungsmittels darstellen. Zum einen kontextualisieren sie Intensität und emotionale Anteilnahme des Sprechers. In ersten Bewertungen unterstreichen sie auch die konditioneile Relevanz zur Produktion von reziproken Kommentaren. Zum anderen bergen sie - wie die Analysen dieses Abschnitts gezeigt haben - gerade wegen des expressiven Potentials die Gefahr, daß sowohl die ersten Bewertungen, die implizit oder explizit in Geschichten oder Nachrichten produziert werden, als auch die kommentieren Bewertungen der Rezipienten zu stark werden.

3.3.4 Rhythmus in Bewertungspaarsequenzen Obwohl die prosodische Realisierung der Bewertungs(paar)sequenzen in Abschnitt 3.1.1 nicht systematisch betrachtet worden ist, so ist doch vielleicht aufgefallen, daß kein einziges Beispiel vorgestellt worden ist, das Akzentzusammenstöße auf ersten oder zweiten Bewertungen aufwies. Zur Erinnerung hier noch einmal die Beispiele (1) und (4): (1)

Hundertfunfzig 4 01 H: Wie alt, 02 X: Ja:: so:: sechsenzwanzig glaub=ich * 03 H: "Schö::nes Alter ** 04 X: Janehehe(0.8)'best(h)en'Jah(h)re

(4) Seglerinnen 3 * Ol A all die 'Segler sin da 'glücklich draußen, ne, ** 02 B: haja die sin ganz (.) 'happy. Es stellt sich nun die Frage, ob diese Abwesenheit rein zufällig ist und sich auf ein zu kleines Korpus zurückführen läßt, oder ob sie systematisch ist und aus der Interaktion der konversationeilen Organisation und der Kontextualisierungsfunktion von Akzentzusammenstößen in Bewertungssequenzen folgt. Um diese Frage beantworten zu können, ist es erforderlich, sich kurz noch einmal die wichtigsten Aspekte der Organisation von Bewertungssequenzen in Erinnerung zu rufen.

162 In Abschnitt 3.1 wurde gezeigt, daß in Alltagskonversationen eine formale Präferenz für Übereinstimmung und eine Dispräferenz für Nichtübereinstimmung besteht. Trotz dieser konversationellen Präferenz für Übereinstimmung kann sich ein erster Bewerter aber nicht absolut sicher sein, daß sein Konversationspartner seine Einschätzung teilt. Erste Bewerter sind damit in einer vergleichsweise schlechteren Position als zweite Bewerter, da sie, ohne die Meinung ihres Gegenübers zu kennen, das Risiko tragen müssen, eine nichtzustimmungsfähige erste Bewertung zu produzieren. Um die Präferenz für Übereinstimmung konversationeil zu realisieren, können erste Bewerter solche Bewertungen formulieren, die die Wahrscheinlichkeit einer Zustimmung erhöhen. Zweite Bewerter können hingegen, auch wenn sie die Meinung ihres Gegenübers nicht teilen, auf die Produktion offener Nichtübereinstimmung verzichten und durch Verzögerung der dispräferierten Aktivität dem ersten Bewerter die Gelegenheit geben, seine Bewertung so zu reformulieren, daß sie zustimmungsfähig wird. Wenn ein erster Bewerter nun eine starke Bewertung produziert, die darüberhinaus durch Akzentzusammenstöße prosodisch intensiviert wird, so stellt sich für den zweiten Bewerter das Problem, daß er für die Produktion von Übereinstimmung eine mindestens gleichstarke Bewertung realisieren muß, die ebenfalls Akzentzusammenstöße aufweist. Solche Gegenbewertungen sind natürlich prinzipiell möglich, aber nachdem Konversationsteilnehmer für die von ihnen vertretenen Positionen verantwortlich zeichnen, erhöhen erste Bewerter systematisch das Risiko der Produktion von Nichtübereinstimmung, wenn sie eine Bewertung produzieren, die am Ende einer denkbaren Bewertungsskala angesiedelt ist. Aber erste Bewerter erhöhen mit solchen Bewertungen nicht nur das Risiko von Nichtübereinstimmung, sie lassen auch kaum Raum für den Rezipienten, die präferierteste Folgehandlung zu produzieren - eine gleichlaufende eskalierte Bewertung. Falls diese Beschreibung des Zusammenspiels von Präferenzorganisation in Bewertungssequenzen und Kontextualisierungsfunktion von Akzentzusamenstößen korrekt ist, dann sind zwei Phänomene empirisch erwartbar. Erstens: Konversationsteilnehmer, die eine Bewertungssequenz eröffnen, vermeiden starke erste Bewertungen mit Akzentzusammenstößen. Zweitens: Wenn Konversationsteilnehmer solche Bewertungen verwenden, folgen diesen ersten Bewertungen nicht die präferierten nivaugleichen oder eskalierten zweiten Bewertungen, die ebenfalls Akzentzusammenstöße aufweisen, sondern wie in (38) dispräferierte Handlungsalternativen: (38) China 52 * Ol I: für 'mich wär das ja auch ne 'irre 'Chance (*) 02 gleich dann (0.9) in das 'volle 'Leben da ei(h)nzustei(h)gen hehehe 03 T: jajajaja (.) ->(*) 04 I: s(h)o 'a(h)lles 'ganz 'haut'nah (0.5) "'mit'zu'krie'gen,'' 05 (2.6) M* 06 ah das is find ich schon 'unheimlich 'gut. 07 (2.0)

163 (Μ*) 08 da 'seh ich dann auch mehr. 09 (2.2) (M*) 10 dann: (.) renn ich da nicht so ver'loren tou'ristisch (0.8) in der 'Gegend rum; 11 (1.7) ** 12 Τ: aja (0.3) dann ists auch viel 'spannender; 13 I: hm (**) 14 T: weil man dann so die Strukturen gut mitkriegt= I beginnt mit der nun schon vertrauten Struktur: Erste Bewertung (01) + Erläuterung (02). Die Möglichkeit, während ihres Aufenthalts in Malaysia Freunde von Τ zu besuchen, statt in einem Hotel zu logieren, wird von I als irre Chance bewertet, weil ihr das die Gelegenheit verschafft, in das volle Leben einzusteigen. Am Ende dieser Redezugkonstruktionseinheit produziert Τ zwar keine kommentierende Bewertung, aber eine Bestätigung. Solche Bestätigungssignale sind jedoch nicht sequentiell implikativ, d.h. nach ihrem Abschluß können sowohl 1 als auch Τ mit einem neuen Redezug einsetzen. In Zeile 04 folgt eine zweite Erläuterung, die nicht als selbständige Redezugkonstruktionseinheit präsentiert wird, sondern syntaktisch an die vorangegangene angebunden wird. Konversationsteilnehmer arbeiten häufig mit solchen expansiven Konstruktionen, die eine syntaktisch bereits abgeschlossene Struktur erweitern, damit retrospektiv den ersten Abschlußpunkt aufheben und die Stelle, an der die Übergabe des Rederechts relevant wird, auf einen späteren, aber wieder antizipierbaren Zeitpunkt verschieben. An diesem Beispiel wird auch die Funktion solcher Expansionen deutlich, denn nicht nur ein Sprecherwechsel wird an dem verschobenen Ende der Konstruktionseinheit wieder relevant, sondern auch die Folgeäußerung des Rezipienten, die an dem ersten möglichen Abschlußpunkt nicht produziert wurde. Die zweite Erläuterung in Zeile 04 enthält das Elativkompositum 'haut, 'nah und wird mit einer Folge von sechs akzentuierten Silben realisiert. Im Vergleich zu der Erläuterung in Zeile 02 ist 04 sowohl semantisch als auch prosodisch verstärkt. Auf diese reformulierte Erläuterung bleibt eine Reaktion des Rezipienten nun aber ganz aus, und es entsteht eine Redezugvakanz von 2.6 Sekunden. Daß I Ts Schweigen wie in den Beispielen (6) und (9) als zurückgehaltene Nichtübereinstimmung interpretiert, zeigt sich bei der Analyse der Fortsetzung ihres Redezugs. I beginnt mit einer deskalierten Modifizierung ihrer ersten Bewertung in Zeile 06, mit der sie jedoch wiederum keine Zustimmung von Τ elizitieren kann. Wieder entsteht eine konversationeil dramatische Schweigephase, die I nun durch zwei Reformulierungen und Modifikationen ihrer Erläuterungen (M*) beendet, die ebenfalls im Vergleich zu 02 und 04 wesentlich schwächere Argumente enthalten. Doch nach ihrer Bestätigung in Zeile 03 produziert Τ bis Zeile 12 keinen weiteren Gesprächsbeitrag, obwohl ihr durch die Modifikationen immer wieder struktureller Raum für die konditionell relevante Folgeäußerung angeboten werden. Durch dieses Nichteingreifen entsteht ein von drei langen Pausen durchsetzter Redezug, der die vergeblichen Bemühungen seines Produzenten dokumentiert, den Monolog in einen Dialog zu überführen. Die zweite Bewertung wird von Τ aber

164 erst nach der sehr schwachen zweiten Modifikation der Begründung geliefert. Diese zweite Modifikation ist deshalb viel schwächer, weil der positive Effekt, den die Unterbringung bei Freunden von Τ mit sich bringt, nun nur noch ex negativo formuliert wird (nicht so verloren touristisch)

und die Intonationsphrase im Gegensatz zu Zeile 04 auch keine Akzent-

zusammenstöße aufweist. In bezug auf diese modifizierte erste Bewertung ist Ts zweite Bewertung nicht nur eine nivaugleiche, sondern die konversationell präferierte eskalierte Gegenbewertung. Hätte Τ diese präferierte Folgehandlung im Anschluß an die Erläuterung in Zeile 04 ausführen wollen, so wäre eine viel stärkere Bewertung erforderlich gewesen. Da Konversationsteilnehmer - wie eingangs erwähnt - für die von ihnen vertretenen Positionen verantwortlich gemacht werden können, erhöhen die Produzenten mit sehr starken Bewertungen die Wahrscheinlichkeit der Produktion von dispräferierten Handlungsalternativen. Auch das nächste Beispiel, das ebenfalls bereits in Abschnitt 3.2.2 kurz vorgestellt wurde, zeigt eine solche dispräferierte Handlungsalternative des Rezipienten: (39) Hundertffinfzig 10 01 Η: (...) schon richtig Frühlings(stimmung)? 02 Χ: jaja (.) wie es: wa03 also =es blüht alles: (.) und: (0.5) (sehr) 'warm 04 (1.0) 05 es war 'schön und jetzt stehn wir hier wieder in diesem häßlichen Kiel * 06 es is 'eis"ka:lt 'regnerisch (.) 'miese 'Stadt; ·>(*) 07 08 (1.5) E'xa(h)men. (*) 09 * 10 Is(h)=a(h)lles sehr 'une(h)r 1 freu(h)lich he 11 Η: 1 hasse Rainer mitgenommen? 12 Χ: ja ja sicher, (.) 13 ach sonst würd=ich das überhaupt nich aushalten Xs Redezug hat die gleiche Struktur wie Is Redezug in Beispiel (38): Erste Bewertung + Erläuterung mit Akzentzusammenstoß. Die Erläuterung wird hier in Form einer dreiteiligen Liste (vgl. Jefferson 1990) präsentiert. Aber nachdem das dritte Item produziert worden ist, und die Liste damit für den Rezipienten erkennbar abgeschlossen worden ist, folgt nicht die konditioneil relevante Gegenbewertung, sondern es entsteht wieder eine Redezugvakanz von 1,5 Sekunden. Wieder ist es die Produzentin der ersten Bewertung, die ihren Redezug expandiert und damit das Schweigen zu einer redezugintemen Pause transformiert. In diesem Beispiel wird ein viertes Item präsentiert, das ihre negative Einstellung zu Kiel unterstreichen soll. Dieses vierte Item, Examen, ist zumindest unter Studenten eindeutig negativ konnotiert, d.h. es trägt eine implizite Bewertung, auf die Η mit einer gleichlaufenden Gegenbewertung wie ja das ist wirklich schrecklich reagieren sollte. Darüberhinaus eröffnet X in der Präsentation dieses Items für Η eine zweite Handlungsalternative, denn indem sie diese Redezugexpansion lachend produziert, lädt sie Η zu gemeinsamem Lachen ein (vgl. Jefferson 1979, Jefferson,

165 Sacks & Schegloff 1987), und Η könnte durch ihr Lachen die geteilte Einschätzung dokumentieren. Weder in Überlappung mit dem vierten Item noch bei seinem Abschluß wird eine der beiden präferierten Handlungsalternativen ausgeführt. Durch die Fortsetzung ihres Redezugs in Zeile 10 wird sowohl die Möglichkeit zum Lachen verlängert als auch die erneute Gelegenheit zu einer Gegenbewertung geboten. Betrachtet man wieder Hs Redezug in Zeile 11 als Dokumentation ihrer Interpretationsleistung, so zeigt sich, daß Η weder den Bewertungsaspekt noch das Lachangebot aufgreift. Η produziert in Überlappung eine thematisch nur schwach kohärente Frage, die eine neue Paarsequenz eröffnet und die von Xs Redezug offerierten sequentiellen Implikationen konversationell tilgt. Konversationsteilnehmer vermeiden aber nicht nur Akzentzusammenstöße in ersten Bewertungen. In dem gesamten Korpus konnte darüber hinaus kein einziges Beispiel gefunden werden, in dem eine Gegenbewertung in einer Bewertungspaarsequenz mit einem Akzentzusammenstoß prosodisch verstärkt wurde. Ist auch dieses Fehlen systematisch und eine Folge des Zusammenspiels von konversationeller Organisation und Kontextualisierungsfunktion von Akzentzusammenstößen? Auf den ersten Blick scheint eine solche Schlußfolgerung problematisch zu sein, denn eskalierte zweite Bewertungen wurden als die präferierteste Folgehandlung identifiziert. Daher sollten Akzentzusammenstöße zur Intensivierung der Bewertung in dieser Sequenzposition verwendet werden. Wie jedoch in Abschnitt 3.3.3 bei der Diskussion des Beispiels (51) gezeigt wurde, können auch zweite Bewertungen, die über Akzentzusammenstöße intensiviert werden, zu stark werden und statt zur Sequenzterminierung zur Sequenzexpandierung führen, da sie vom ersten Bewerter nicht mehr als Produktion von Übereinstimmung interpretiert werden. In der Bewertungspaarsequenz wäre das gleiche Sequenzmuster erwartbar: Α Erste Bewertung B: Eskalierte Gegenbewertung mit Akzentzusammenstoß Sequenzexpansion Dieser Möglichkeit würden sich zweite Bewerter ohne Not aussetzen, denn sie haben genug Ausdrucksmittel zur Verfügung, mit denen sie die geteilte Einschätzung dokumentieren können, ohne das Risiko einer zu starken Bewertung oder der nichtintendierten Kontextualisierung von Ironie einzugehen. Der Verzicht auf Akzentzusammenstöße in Gegenbewertungen könnte also ebenfalls ein Indiz für die Orientierung der Teilnehmer an der formalen Präferenz für Übereinstimmung sein.

166

3.4 Grammatische Restriktionen für konversationell induzierte Akzentzusammenstöße Nach der Analyse der konversationeilen Funktionen von Akzentzusammenstößen sieht es so aus, als ob diese ein lupenreines Kontextualisierungsmittel seien, das Sprecher bei der rhythmischen Gestaltung ihrer Äußerungen abhängig von den verschiedenen sequentiellen Positionen und konversationeilen Aktivitäten einsetzen können. Phonologische Regeln, wie das Prinzip der rhythmischen Alternanz, scheinen außer Kraft gesetzt zu sein. Akzentzusammenstöße sollten also als ein Beispiel par excellence die von Bolinger (1986: Kap. 9; 1989) vertretene Auffassung, daß die Prosodie ein von der Grammatik autonomes, primär interaktiv relevantes Signalisierungssystem sei 58 , und damit die in Kapitel 1 formulierte THESE 2 belegen. Eine solche Einschätzung greift aber zu kurz, denn sie ist nicht in der Lage, die Interaktion zwischen konversationeilen und grammatischen Regeln aufzudecken. Zum einen wurde ja gezeigt, daß Akzentzusammenstöße gerade auf der Basis der Analyse als rhythmisch markierte Strukturen als interaktiv relevantes Kontextualisierungsmittel fungieren. Zum anderen wird eine genauere Analyse der internen Struktur von Intonationsphrasen mit konversationeil induzierten Akzentzusammenstößen zeigen, daß auch bei stilistischer Emphase satzphonologische Akzentregeln nicht suspendiert und durch eine "phonology-for-conversation" ersetzt werden. Wie in Kapitel 2 bei der Analyse der Mittelfeldentleerungen gezeigt, werden vielmehr entsprechend der THESE 1 auch bei der konversationeil induzierten Produktion von Akzentzusammenstößen nur die Spielräume genutzt, die die Akzentphonologie für pragmatische Funktionen offen läßt. Um das Wirken der grammatischen Regeln aufzuzeigen, werde ich in dieser Zusammenfassung noch einmal alle in diesem Kapitel analysierten Akzentzusammenstöße betrachten. Ich beginne mit der Gruppe der Exklamativa: (43) China 34f -> 14 I: hhhha "span'nend (44) Rheinuferbahn -> 07 Ε: 'wie:: 'ent'setz'lich! (51) China 15 -> 07 I: Ah: das is jane "Un'ver'schämtTieit! In allen drei Beispielen findet sich der Akzentzusammenstoß, wie von der Analyse der Exklamativa vorhergesagt (vgl. Abschnitt 3.3.1), auf dem skalierbaren Element. Wenn es zwei Vgl. Bolinger (1986: viii), "[...] the approach [...] differs from others mainly in its insistence on the independence of intonation from grammar. Intonation has more in common with gesture than with grammar", und Setting (1992).

167 Akzente gibt, so wird der erste Akzent relativ früh in der Intonationsphrase realisiert. Zwei Akzentpositionen finden sich in dem Beispiel (44): neben dem Bewertungsausdruck wird auch das w-Element hervorgehoben. Diese Möglichkeit der Doppelakzentuierung wird von I in (51) zwar nicht genutzt, aber da die Akzente in Exklamativa - wie in Abschnitt 3.3.1 gezeigt weitgehend unabhängig von der Fokus-Hintergrund-Gliederung sind, wäre dies ebenso eine grammatisch und konversationell zulässige Variante (vgl. 51') wie die Hervorhebung der gesamten exklamativen Intonationsphrase mit Akzenten (vgl. (51"): (51') China 15 07 I: Ah: 'das is ja ne "Un'ver'schämtTieit! (51") China 15 07 I: "Ah: 'das 'is 'ja 'ne "Un'ver'schämtTieit! Die Fo-Kontur des Beispiels (51) zeigt deutlich den für die emphatische Hervorhebung typischen silbenzählenden Rhythmus: (Figur V) 2t tO.O 2080 0 ,„2050.0, 2020 0 1990 0 1960.0 500.0

900 0

a h: das

is

1300.0

1700.(

ja ne

Un

2100 0

ver

2500

schämt

2 9 0 ) 0 m$

heit

270.0 240.0 2100

_

180 0 150 0 500 0

900 0

1300 0

I 1700.d

2100D

2500

290

) 0 mi

Der treppenartige Abfall der Fo-Kontur (Downstep) könnte durch die Zuweisung des Akzenttons H*+T an die Iktussilbe Un- sowie durch Akzenttonkopierung und Assoziation des kopierten Tons mit den emphatisch verstärkten Silben enstanden sein, wobei der T-Ton als unassoziierter Ton den Downstep des nachfolgenden H*-Tons auslöst. Da die Details der Akzenttonzuweisung und Akzenttonassozialtion der weitgehend unerforschten Downstep-

168 Konturen im Deutschen 59 für die Argumentation nicht benötigt werden, beschränke ich mich im folgenden auf die Präsentation der in Kapitel 2.3.1 eingeführten prosodischen Strukturen der Intonationsphrasen, die nur die phraseninterne Akzenttonplazierung nicht aber ihre tonale Realisierung abbilden (Die akzenttontragende Silben werden wieder durch Kapitälchen notiert.): (51) Prosodische Struktur [IP Ah: das is ja ne UN.VER.SCHÄMT.HEIT ] Da die Akzenttonplazierung in Exklamativa von der grammatisch zentralen Aufgabe der Informationsgliederung weitgehend befreit ist, sind Exklamativa damit ein idealer und in Alltagskonversationen regelmäßig verwendeter Träger für stilistische Akzentmuster wie die hier beschriebenen Akzentzusammenstöße. Verläßt man jedoch den Formtyp der Exklamativa, so stellen sich die erwarteten, von der grammatischen Fokus-Hintergrund-Gliederung abhängigen Restriktionen ein. Diese spielen, wie gezeigt werden kann, bei der phonetischen Realisierung des Emphase-Merkmals

(E-

Merkmal) eine zentrale Rolle. An dieser Stelle ist es erforderlich, daß ich noch einmal auf Analyse der Intonationsphrasenbildung in Kapitel 2.3.1 zurückgreife, denn ich möchte nun zeigen, daß sowohl die dort vorgestellten Integrationsbedingungen

(Bedl), die über die P-

Regeln entscheidenden Einfluß auf die Prominenzstruktur eines Satzes ausüben, als auch die IRegeln zum Aufbau wohlgeformter Intonationsphrasen auch bei Emphase wirksam bleiben. Um diese Behauptung zu belegen, werde ich die rhythmischen und prosodischen Strukturen der verbleibenden Beispiele im Rahmen des in Kapitel 2.3.1 vorgestellten Modells ableiten. Ich beginne mit den Beispielen (38) und (47): (38) China 52 0 1 1 : für 'mich wär das ja auch ne 'irre 'Chance ->

04 I:

(47) China 19 12 I: 13 14 -> 15

s(h)o 'a(h)lles 'ganz 'haut'nah (0.5) "'mit zu'krie'gen,"

der 'eine (0.5) war ma ver'droschen worden, vonner 'ganzen (0.3) 'Horde chi'nesischer Kommili'ton; (0.3) "weil 'er sich er'dreistet hatte, eine 'Chi'ne'sin 'zum "Tee einzuladen;=

Wenn man die Zeilen 04 in Beispiel (38) und 15 in Beispiel (47) miteinander vergleicht, so stellt man fest, daß in (38) die Akzentzusammenstöße bis ans Ende der Intonationsphrase produziert werden und auch das Verb einbeziehen, während in (47) das Verb keine wahrnehm-

59

Vgl. dazu FN 43 sowie Uhmann (i.V. b)

169 bare Prominenz aufweist, die über die Identifizierung der nicht notierten lexikalischen Iktusposition hinausgeht. Worauf sind die Unterschiede zwischen (38) und (47) zurückzuführen? Betrachten wir dazu die jeweiligen syntaktischen Strukturen: (38a) Syntaktische Struktur

(47a) Syntaktische Struktur

Der entscheidende Unterschied liegt in den beiden Mengen von fokusfreien Schwesterkonstituenten {ganz hautnah, mitzukriegen} und {zum Tee, einzuladen}: Das präpositionale Objekt zum Tee ist ein Argument des Kopfes einzuladen. Die Adjektivphrase ganz hautnah ist hingegen eine freie Angabe zu mitzukriegen. Dieser Befund hat Auswirkungen auf die von den P-Regeln erzeugten Prominenzstrukturen (38b) und (47b). Die einschlägigen P-Regeln (vgl. auch Kap. 2.3.1 und 3.2.1) lauten: (P-Regel 2) Wenn kein Χ ε SK das Merkmal [F] enthält, erhalten alle neutral betonbaren Χ ε SK "+".

170 (P-Regel 3) Wenn kein Χ ε SK das Merkmal [F] enthält und die Elemente von SK im Verhältnis der Integration stehen, dann geht "+" an die integrierte Konstituente, wenn diese neutral betonbar ist, andernfalls an die Zielkonstituente. (38b) Prominenzstruktur

al les

ganz

haut nah

mit zu krie gen

(47b) Prominenzstruktur [E] P-R2

/ x ,/v Κ Λ/I f/I + P-R3

/

\

+

y s ,

+

+ ι ι eine Chinesin

zum

Tee

+ I I ein zu laden

Innerhalb von V' von (47) wird die P-Regel 3 angewendet, die dem neutral betonbaren Argument ein "+" und dem Verb ein "-" zuweist, denn diese Struktur erfüllt die Integrationsbedingungen - insbesondere (Bedl) 2a. Innerhalb von V von (38) wird hingegen die P-Regel 2 angewendet, die den neutral betonbaren Schwesterkonstituenten ein "+" zuweist, denn als Adjunkt erfüllt ganz hautnah die Integrationsbedingung (2a) nicht. In (38) liegt damit im Gegensatz zu (47) keine Integration vor. Innerhalb von VP wird hingegen in beiden Beispielen P-Regel 2 angewendet. Die P-Regel 3 kann auch in {eine Chinesin, zum Tee einzuladen} nicht angewendet werden, denn die Bedingung (4) für Integration (vgl. Kap. 2.3.1 und 3.2.1)

171 schließt aus, daß das direkte Objekt in eine Schwesterkonstituente integriert wird, die bereits ein Argument enthält60: Nach Anwendung des R-Prinzips und der fakultativen Endakzentstärkung ergeben sich für die beiden Beispiele die folgenden rhythmischen Strukturen. Man beachte insbesondere die von den P-Regeln erzeugten Akzentzusammenstöße in Beispiel (38), die - wie in Abschnitt 3.2.1 gezeigt - nicht durch Schlagtilgung aufgelöst werden können. In Beispiel (47) hat die Sprecherin von der fakultativen Endakzentstärkung Gebrauch gemacht, denn Tee ist die prominenteste Silbe der Intonationsphrase: (38c) Rhythmische Struktur alles ganz xx χ χ χ χ χ

hautnah mitzukriegen x x x x x x χ χ χ χ χ x x x

(47c) Rhythmische Struktur ei ne xx X

Chi ne sin x x x XXX X

zum Tee χ χ X X X (x)

ein zu la den x x x x X X

Dies könnten wohlgeformte rhythmische Strukturen sein, die die von der Plazierung des Fokusmerkmals und den Integrationsbedingungen abhängigen Prominenzrelationen reflektieren. Das wäre dann der Fall, wenn die Strukturen kein Emphase-Merkmal erhalten hätten. Im Gegensatz zum F-Merkmal, das nicht in die prosodische Struktur übernommen wird, erscheint das Ε-Merkmal jedoch auch in der prosodischen Struktur, weil es - im Gegensatz zum FMerkmal - Auswirkungen auf die rhythmische Struktur hat. Unter Emphase, so der auditive Eindruck, werden alle Silben 'stärker' als dies ohne emphatische Hervorhebung der Fall wäre. Daher wurde in Abschnitt 3.2.2 die Hinzufügung von zwei zusätzlichen Schlägen an alle von dem Ε-Merkmal dominierten Silben als phonologische Interpretation des Ε-Merkmals vorgeschlagen. Die so formulierte Emphaseverstärkung produziert für (38) das korrekte Resultat:

Bei Schwesterkonstituenten wie {ein Paket, zur Post bringen] oder {das Auto, in die Garage fahren) scheint jedoch P-R3 mit Akzent auf dem direkten Objekt angewendet zu werden. In Uhmann (1991: 216) wurden für diese Fälle integrationsfördernde Bedingungen vorgeschlagen, die dann vorliegen, wenn die zweite Schwesterkonstituente semantisch als nicht-komplex interpretiert wird, weil ihre internen Konstituenten in "prototypischer, kulturell unmarkierter Verbindung zueinander stehen".

172 (38d) Rhythmische Struktur und emphatische Hervorhebung

χ JL χ x x ganz hautnah

x X χ X Xx X x x x mit.zu.krie.gen

-->

χ x x ganz haut.nah

X

x x x x mit.zu.krie.gen

Für die prosodische Struktur bedeutet das, daß neben der Akzenttonzuweisung zur Materialisierung des F-Merkmals auch die von dem Ε-Merkmal dominierten Silben, die durch die Schlaghinzufügung eine Prominenz von mindestens drei Schlägen aufweisen, mit einem Akzentton assoziiert werden, der die emphatische Hervorhebung akustisch materialisiert: (38e) Prosodische Struktur [n> alles [F Ε [AD GANZ] [AD HAUT.NAH] [AD MIT.ZU.KRIE.GEN]]]

Trotz der Lautstärkereduktion nach der intonationsphraseninternen Pause (vgl. den deutlich geringeren Ausschlag im Wellendiagramm) sieht man in der Fo-Kontur (Figur Π) des Beispiels (38) die Akzentzusammenstöße auf dem Veib mitzukriegen. (Figur Π)

2153.0 2110 0 2070.0

1,1 m

1*900 1*30 0 uio.o

B f I i 1 400.0

700.0 alles

120 0 100.0 2(0 0 2(0.0 240 0 220.0 200 0

1000 0 g a n z

1 500 0

ItOOJ

l»00 0

200.0

2300 0

"•:

2800.0 m i t

n a h

h a u l

^

700 0

1000 0

I 500 0

1600

nooo

200 0

2300 0

2800.0

34001 m* kr i c

ζ u

V

/ 400 0

3100.0

gen

w

31000

1400 { ms

Die Kontur sinkt auch im Bereich des Verbs von einem mit dem Offsetniveau der Silbe -nah identischen Onsetniveau weiter treppenartig ab, bis sie auf der letzten Silbe mit einem hohen finalen Grenzton wieder ansteigt. Die Downstepstufen am Ende der Intonationsphrase sind allerdings durch den Deklinationseffekfo1 weniger hoch als am Anfang der Intonationsphrase.

Zur Unterscheidung zwischen Downstep und Deklination vgl. Uhmann (1991: 2.2.3) sowie FN 22 in Kapitel 4.

173 Vor allem jedoch sind die Silben, die als Akzentzusammenstöße wahrgenommen werden, in ihrer Dauer annähernd identisch und bilden isochrone Intervalle. Die rhythmische Struktur des Beispiels (47) weicht hingegen von (38) deutlich ab. Das Verb erhält keine zusätzlichen Schläge, statt dessen wird sogar Schlagtilgung angewendet, um den lexikalisch induzierten Akzentzusammenstoß zwischen den Silben Tee und ein- abzubauen: (47d) Rhythmische Struktur und emphatische Hervorhebung

1

χ χ χ χ X X Xχ Xχ X X x xX x x ei.ne Chi.ne.sin zum Tee ein.zu.la.den

χ X χ x x x JL. XXX X χ X X x x x -> χ XXX X XX ei.ne Chi.ne.sin zum Tee ein.zu.la.den

Durch die Schlagtilgung erhält das Verb keinen Akzentton mehr. Durch Endakzentstärkung (wieder notiert durch Unterstreichung) ist Tee die prominenteste Silbe der Intonationsphrase: (47e) Prosodische Struktur hp [F Ε [AD eine CHI.NE.SIN] [AD ZUM TEE einzuladen]]]

Der Verzicht auf Akzenttonzuweisung oder Akzenttonassoziation an das Verb hat den Effekt, daß die Fo-Kontur (Figur VI) bereits zu Beginn der Silbe ein- das Fo-Minimum erreicht hat, das bis zum Ende der Intonationsphrase beibehalten wird: (Figur VI)

2)20.0 2080.0 2000.0 1960.0 1920 0 1880 0 500.0 270.0 240.0 2100 180 0 150.0

jji W 900.( 13 30.0 1700.0 2100 0 25< 0.0 2900 0 mi Chi: η e: s i η zum Tee ein zu la den eine

^^

500.0

900.(

ν·

13 30.0

1700.0

2100 0 25< 0.0

2900.0 rtu

174 Die Beispiele (38) und (47) zeigen also, daß die in Abschnitt 3.2.2 formulierte Regel der Emphaseverstärkung modifiziert werden muß, da offensichtlich nicht alle von dem E-Merkmal dominierten Silben zusätzliche Schläge erhalten können. Ausgeschlossen sind die Silben der Konstituente, die von der P-Regel 3 ein "-" erhalten hat: (Emphaseverstärkung) Alle von einem Ε-Merkmal dominierten Silben erhalten dann mindestens zwei zusätzliche "x", wenn sie nicht zu Konstituenten gehören, denen die P-Regel 3 ein "-" zugewiesen hat. Die so formulierte Emphaseverstärkung trägt dem Faktum Rechnung, daß eine prosodische Strukturen wie (47') bei der vorliegenden Fokus-Hintergrund-Gliederung keine zulässige Realisierungsvariante darstellt: (47') Prosodische Struktur *[IP

[F Ε [AD eine CHI.NE.SIN] [AD ZUM TEE ] [AD EIN.ZU.LA.DEN]]]

(47') wäre nur bei enger Fokussierung des Verbs eine zulässige Realisierungsvariante (vgl. auch Uhmann 1991 sowie Kap. 2.3.1) Ich möchte nun noch kurz die restlichen Beispiele dieses Kapitels analysieren 62 und zeigen, wie die Emphaseverstärkung auf die durch Integration erzeugte Prominenzrelationen Bezug nimmt. Die Beispiele (50) und (39) gehören zu der Gruppe, bei der die P-Regel 3 an der für die phonologische Materialisierung des Ε-Merkmals entscheidenden Stelle nicht angewendet wird. Damit kann die Schlaghinzufiigung alle von dem Ε-Merkmal dominierten Silben erfassen. (39) Hunderfünfzig 10 -> 07 X: es is 'eis'ka:lt 'regnerisch (.) 'miese 'Stadt, (50) China 17 -> 32 I: =und da hat=se uns ziemlich'komisch (.) so'kon'ster'niert'an'geTaickt, Bei dem Beispiel (50) kann die P-Regel 3 nicht angewendet werden, weil die Schwesterkonstituenten {so konsterniert, angekuckt} die Integrationsbedingungen nicht erfüllen. Wie in dem Beispielen (38) ist so konsterniert kein Argument von angekuckt und erfüllt damit die Integrationsbedingung (2a) nicht:

Um dies tun zu können, werde ich für die Angabe der syntaktische Struktur wieder einige 'Bereinigungen' der Daten (vgl. FN 38 Kap. 2) vornehmen. In Beispiel (50) tilge ich das Reparandum der redezuginternen Selbstreparatur (ziemlich komisch) und in Beispiel (39) den elliptischen Nachtrag (miese Stadt).

175 (50a)

Syntaktische Struktur

uns

so konsterniert

angekuckt

Die Prominenzstruktur und die prosodische Struktur entsprechen in den wesentlichen Punkten dem Beispiel (38): (50b) Prominenzstruktur:

+ [E] P-R2

uns (50c)

so kon

ster

niert

Prosodische Struktur [iP [AD und da hat=se uns ziemlich Komisch] [E [AD SO KON.STER.NIERT] [AD AN.GE.KUCKT ] ] ]

Das Beispiel (39) unterscheidet sich von den bisher vorgestellten darin, daß seine integrationshemmenden strukturellen Eigenschaften auf eine Koordinationsstruktur zurückzuführen sind. Innerhalb der Adjektivphrase muß also die P-R 2 angewendet werden, die beide Schwesterkonstituenten {eiskalt, regnerisch} zu "+"-Konstituenten macht. Da das Adjektiv eiskalt ein Elativkompositum ist, wird erneut die P-R 2 angewendet. Damit ergeben sich die syntaktische Struktur (39a), die Prominenzstruktur (39b) und die prosodische Struktur (39c):

176 (39a) Syntaktische Struktur VP

(39b) Prominenzstruktur

(39d) Prosodische Struktur [N> es is [F [E [AD EIS.KALT] [AD REG.NE.RISCH]] [AD miese STADT]]]

Die ebenfalls Beispiel (50) entstammende Intoantionsphrase der Zeile 06 gehört hingegen zu der von Beispiel (47) exemplifizierten Gruppe, denn die Schwesterkonstituenten {durch und durch rassistisch, ist} erfüllen die Integrationsbedingungen: (50) China 17 05 I: die hatten 'alle durch die Bank die "Einschätzung daß 'China -> 06 äh 'durch ' und 'durch 'ras'sis'tisch is. Damit führt die Anwendung der P-Regel 3 innerhalb der VP dazu, daß die von dem EmphaseMerkmal hervorgehobene Konstituente durch und durch rassistisch gegenüber ihrer Schwesterkonstituente ist prosodisch hervorgehoben wird:

177 (50a) Syntaktische Struktur

durch und durch rassistisch

ist

(50b) Prominenzstruktur

+

+

+ +

Κ -

+

I I durch und durch ras sis tisch

is

Diese Prominenzstruktur wird nach der emphatischen Verstärkung der Silben, die von dem EMerkmal dominiert sind und nicht über die P-R3 ein "-" erhalten haben, durch die I-Regeln und in die prosodische Struktur (50c) überführt: (50c) Prosodische Struktur

[ip [ρ ε [ad durch UND DURCH ] [ad ras.sis.tisch is]]] Die prosodische Struktur (50') ist ebenso wie (47') unzulässig, da eine Silbe einen Akzentton erhält, der druch die P-Regeln ein "-" erhalten hat: (50') Prosodische Struktur

*[lP [F Ε [AD durch UND DURCH ] L\D RAS.SIS^SCH [AD IS ]]]

178 Die verbleibenden Beispiele zeichnen sich dadurch aus, daß das Ε-Merkmal weniger komplexen Konstituenten als in den bisher diskutierten Beispielen zugewiesen wird. Doch auch hier lassen sich zwei Gruppen unterscheiden: Zum einen handelt es sich um Strukturen, bei denen das EMerkmal nur einem einzigen Lexem zugeordnet wird. Zum anderen wird die Konstituente mit dem Ε-Merkmal durch eine syntaktische Realisierungsvariante als eigene Intonationsphrase realisiert. Ich beginne mit den Beispielen (40) und (46), bei denen das Ε-Merkmal jeweils nur einem Lexem, nämlich jahrelang bzw. Malaysia , zugewiesen worden ist: (40) China 52f 04 =vor allem das to- interessante ist halt das sind 'Leute. -> 05 die 'alle "jah're'lang in 'England stu'diert ham; (46) China 25f 01 T: Ich hab dime -> 03 Τ: ne 'Karte von 'Ma"lay:'sja mal mitgebracht (40a) Syntaktische Struktur

jahrelang

in England

studiert

ham

179 (40b) Prominenzstruktur

+ [E] + +

+

-

+

I I

I I jah

/X

re

lang in

Eng land

stu

diert

ham

(40c) Prosodische Struktur [IP [ad die AL~le] [ a d [f [e JAH.RE.LANG] in England studiert ham ] Die Fo-Kontur (Figur VII) zeigt, daß die Sprecherin in diesem Beispiel von der Möglichkeit Gebrauch macht, auch der Hintergrundkonstituente alle einen Akzentton zuzuweisen. Die sekundären Akzente auf den Konstituenten 'England und stu 'diert werden dagegen nicht durch Akzenttöne realisiert: (Figur ΥΠ)

1980.0 1940.0 1900.0 500.0

2600.0

2900.0

3 2 0 0 . 0 ms

in England studiert ham 270.0 250.0 230.0 210.0 190.0 170.0 500.0

2600.0

2900.0

3200.0 mi

180 Eine ganz ähnliche Struktur weist das Beispiel (46) auf. Hier wird jedoch durch die Anwendung der P-Regel 3 innerhalb von V' ausgeschlossen, daß nach der emphatischen Hervorhebung weitere Akzenttöne zugewiesen werden: (46a) Syntaktische Struktur

P P[E]

NP

dir

z\ A /

'ne Karte

von Malaysia

/

\

\

mal mitgebracht e v

(46b) Prominenzstruktur

dir 'ne Kar te

von Malay sja mal mit ge bracht

e,

(46c) Prosodische Struktur [iP F [AD ne KAR.te ] [AD v o n [E MA.LAY.SJA ] mal mitgebracht ]]

181 Ich komme nun zur letzten Gruppe, bei der die durch Emphase hervorgehobene Konstituente eine eigene Intonationsphrase bildet. Es handelt sich um Beispiele mit in Kapitel 2 diskutierten Mittelfeldentleerungen: (49) China 9 01 T: 02 03 -> 04

°Ich 'muß übrigens heut noch zum 'Michelsen,' 'um 'drei," weils 'Schwierigkeiten gibt, mit dem 'PeTdng'auf'enthalt. (0.5)

(50) China 17 34 I: da 'wurden 'Weiße nach 'vorne geschoben, -> 35 und (.) und zwar "vor 'ein 'Schwar'zen. Vergleicht man die prosodischen Strukturen der beiden Beispiele mit ihren Versionen ohne Mittelfeldentleerung, so zeigt sich, daß Interaktionsteilnehmer in optimaler Weise von den Regeln zum internen Aufbau von Intonationsphrasen Gebrauch machen, wenn sie durch Emphase hervorgehobene Konstituenten in einer eigenen Intonationsphrase produzieren: (49b) Prosodische Struktur Qp [F [AD weils SCHWlErigkeiten gibt ]]] [IP [F [AD mit dem [E PE.KING.AUF.ENT.HALT ]]]]

(49') Prosodische Struktur der Variante ohne Mittelfeldentleerung [IP [F [AD weil es SCHWlErigkeiten ][AD mit d e m [E PE.KING.AUF.ENT.HALT ] gibt ]]]

(50b) Prosodische Struktur [iP [F [AD da wurden WElße] [AD nach VORne geschoben ]]] [ip [F [AD UND zwar [ß VOR EIN SCHWAR.ZEN ]]]

(50') Prosodische Struktur der Variante ohne Mittelfeldentleerung [IP [F [AD da wurden WElße] [AD nach VORne] L\D [E VOR EIN SCHWAR.ZEN ] geschoben ]]]

Durch die Mittelfeldentleerungen gelingt es beiden Sprechern, eine Intonationsphrase zu produzieren, bei der die durch Emphase ausgelöste Akzenttonassoziation bis zum Ende der Intonationsphrase durchgeführt werden kann. Bei der Produktion von konversationeil induzierten Akzentzusammenstößen machen Sprecher also auch von den in Kapitel 2 analysierten Realisierungsvarianten Gebrauch, die ihnen die Syntax zur Verfügung stellt.

182

3.5

Zusammenfassung

Akzentzusammenstöße sind in der metrischen Phonologie als rhythmisch deviante Struktur beschrieben worden, bei der die phonologisch unmarkierte Alternanz von akzentuierten und unakzentuierten Silben nicht gegeben ist und daher über Wohlklangsregeln wiederhergestellt wird. Anhand der Elativkomposita konnte jedoch gezeigt werden, daß nicht alle Akzentzusammenstöße aufgelöst werden dürfen. Darüberhinaus werden Akzentzusammenstöße in natürlichen Konversationen auch systematisch produziert, indem lexikalisch nicht-prominente Silben prosodisch verstärkt und akzentuiert werden. Solche konversationeil induzierten Akzentzusammenstöße kommen vor allem in Bewertungsredezügen vor. Es scheint, als ob die Bedeutung der Elativkomposita als eine Art von Blaupause für die Interpretation von Bewertungen mit Akzentzusammenstößen fungiert, denn durch die sequentielle Analyse konnte gezeigt werden, daß die verwendeten bewertenden Ausdrücke durch diese rhythmische Markierung intensiviert und emphatisch verstärkt werden und gegenüber den Varianten ohne Akzentzusammenstoß als eskalierte Bewertungen interpretiert werden. Bewertungen kommen in Alltagskonversationen in vier verschiedenen sequentiellen Kontexten vor: in Bewertungspaarsequenzen (Bewertung + Gegenbewertung) und in elaborierten Bewertungssequenzen (Geschichte/Nachricht/Neuigkeit + Kommentar/Reaktion). Die sequentiellen Parallelen zwischen den beiden Äußerungsformaten bestehen darin, daß die Bewertung bzw. die Geschichte eines Sprechers Α als erstes Paarglied fungiert, das die Bewertung bzw. den Kommentar eines Rezipienten Β als zweites Paarglied konditionell relevant macht, sobald das erste Paarglied mit dem Erreichen einer übergaberelevanten Stelle erkennbar abgeschlossen ist. Darüber hinaus gilt für beide Äußerungsformate eine Präferenz für Übereinstimmung und eine Dispräferenz für Nichtübereinstimmung. Offene Nichtübereinstimmung wird vor allem durch die Verzögerung der zweiten Bewertung vermieden. Diese ist deshalb als solche erkennbar, weil Konversationsteilnehmer das Ende von Redezugkonstruktionseinheiten aufgrund ihres grammatischen Wissens antizipieren können. Daher sind schon relativ geringe Verzögerungen, die durch den Verzicht der Übernahme des Rederechts im übergaberelevanten Raum entstehen, als zurückgehaltene Nichtübereinstimmungen interpretierbar. Neben diesen Parallelen gibt es jedoch auch wichtige Unterschiede. Während erste Bewertungen in Bewertungspaarsequenzen häufig aus nur einer Redezugkonstruktionseinheit bestehen, benötigen Geschichten, Nachrichten und Informationen meist mehrere solcher Einheiten. Daraus folgt, daß ihre Rezipienten bei der Antizipation des Endes dieser Aktivitäten eine komplexere Aufgabe zu bewältigen haben. Doch auch die Produzenten von Geschichten stehen vor einer komplexeren Aufgabe, denn auch sie müssen das Ende dieser Aktivität für ihre Rezipienten erkennbar produzieren. Schließlich kommen Akzentzusammenstöße häufig in Geschichten, Nachrichten und Neuigkeiten sowie in Reaktionen und Kommentaren, aber nicht in

183

Bewertungspaarsequenzen vor. Es konnte jedoch gezeigt werden, daß dies keine Zufallsverteilung ist, sondern daß hierfür die Präferenzorganisation von Bewertungssequenzen und die unterschiedlichen strukturellen Eigenschaften der Aktivitätstypen verantwortlich sind. Das Fehlen von Akzentzusammenstößen in Bewertungspaarsequenzen kann dadurch erklärt werden, daß weder die Minimierung von Nichtübereinstimmung noch die Maximierung von Übereinstimmung automatisch aus geteilten Wertesystemen folgt, sondern von den Konversationsteilnehmern aktiv produziert wird. Obwohl Übereinstimmung die formal präferierte Handlungsalternative ist, gibt es ein systematisches Ungleichgewicht in bezug auf die Position der ersten bzw. zweiten Bewertung: Erste Bewerter setzen sich immer der Gefahr aus, eine nicht zustimmungsfähige Einschätzung zu formulieren, da sie ihre Bewertung abgeben müssen, ohne die Einstellung ihres Rezipienten zu kennen. Das Risiko, aufgrund einer nicht zustimmungsfähigen Bewertung eine dispräferierte Handlungsalternative zu evozieren, erhöht sich durch die Formulierung von sehr starken ersten Bewertungen, die durch Akzentzusammenstöße weiter intensiviert werden, denn nur Rezipienten, die willens sind, eine gleichstarke oder sogar stärkere Bewertung zu vertreten, können die präferierten Handlungsalternativen produzieren. Mit dem Verzicht auf durch Akzentzusammenstöße intensivierte erste Bewertungen orientieren sich erste Bewerter also an der konversationellen Präferenz für Übereinstimmung, indem sie das Risiko der Produktion einer nichtzustimmungsfähigen Bewertung senken und dem zweiten Bewerter auf einer (im Gegensatz zur Richter-Skala) nicht offenen Bewertungsskala die Möglichkeit bieten, eine eskalierte Gegenbewertung als präferierteste Handlungsalternative zu produzieren. Akzentzusammenstöße fehlen jedoch auch in Gegenbewertungen. Hier sollten Rezipienten eigentlich Gebrauch von diesem Kontextualisierungsmittel machen, denn eskalierte Gegenbewertungen sind ja die präferierteste Folgehandlung. Es konnte jedoch gezeigt werden, daß auch zweite Bewertungen zu stark werden können. Dieser Möglichkeit würden sich zweite Bewerter ohne Not aussetzen, denn sie haben genug Ausdrucksmittel zur Verfügung, mit denen sie die geteilte Einschätzung dokumentieren können, ohne das Risiko einer zu starken Bewertung oder der nicht-intendierten Kontextualisierung von Ironie einzugehen. Der Verzicht auf Akzentzusammenstöße in Gegenbewertungen könnte also ebenfalls ein Indiz für die Orientierung an der formalen Präferenz für Übereinstimmung sein. Doch warum verwenden Konversationsteilnehmer Akzentzusammenstöße in Geschichten, Nachrichten und Neuigkeiten sowie in den Reaktionen und Kommentaren auf diese konversationeilen Objekte? Obwohl die Bewertung eines Evaluandums, sei es nun einer Person, eines Ereignisses oder einer Erfahrung, auch ein wichtiger Bestandteil von Geschichten, Nachrichten oder Neuigkeiten ist, ist dieser Aspekt hierbei weniger zentral als in Bewertungspaarsequenzen, die sich mehr oder weniger ausschließlich dieser Aufgabe widmen. Zudem handelt es sich ja komplexere konversationeile Aktivitäten, und ihre Produzenten müssen ihren Rezipienten u.a. ermöglichen, den Höhepunkt einer Geschichte oder den zentralen Punkt einer Information zu

184

erkennen. Bewertungen, die innerhalb dieser konversationeilen Aktivitäten mit Akzentzusammenstößen realisiert werden, kontextualisieren nicht nur die interne Struktur, sie dokumentieren auch die affektiv-emotionale Einstellung des Produzenten. Beide Aspekte enthalten wichtige Infomationen für den Rezipienten. Die Dokumentation der affektiv-emotionalen Einstellung des Produzenten der Geschichte oder Nachricht erlaubt dem Rezipienten auch dann eine übereinstimmende reziproke Stellungnahme zu produzieren, wenn explizite Bewertungsausdrücke fehlen. Das für erste Bewerter erhöhte Risiko, nicht-übereinstimmungsfähige Bewertungen zu formulieren, gilt natürlich auch für die Erzähler von Geschichten und die Überbringer von Neuigkeiten oder Nachrichten. Doch für sie könnte die Kosten-Nutzen-Rechnung anders ausfallen als für erste Bewerter in Bewertungspaarsequenzen, da Akzentzusammenstöße nicht nur auf den Inhalt der konditioneil relevanten Folgeäußerung hinweisen, sondern auch anzeigen, daß die präferentiell gleichlaufenden Kommentare hier und jetzt erwartbar sind. Untersucht man die Abwesenheit von Akzentzusammenstößen in Gegenbewertungen und ihre Anwesenheit in Kommentaren, so kann die Expressivität, die diese markierte rhythmische Struktur kontextualisiert, für die unterschiedliche Verteilung verantwortlich gemacht werden. Zwar ist das Risiko einer zu starken zweiten Bewertung auch hier nicht ausgeschlossen, aber Akzentzusammenstöße sind dann ein geeignetes Mittel, wenn von den Rezipienten nicht nur eine gleichlaufende Bewertung, sondern auch die Dokumentation reziproker, affektiv-emotionaler Anteilnahme erwartet wird. Auch das unterschiedliche interne Format von Gegenbewertungen und Kommentaren spiegelt die Funktionsunterschiede wider, denn diese für Kommentare relevante affektive Anteilnahme wird durch die Verwendung von Interjektionen und Bewertungsvokalisationen sowie Exklamativa, aber nicht durch die Vorlaufelemente, unterstrichen. Diese vielfältigen konversationellen Funktionen und Restriktion bei der Plazierung von Akzentzusammenstößen verweisen diese aber nur auf den ersten Blick in den ausschließlichen Wirkungsbereich der Pragmatik. Mit den Analysen dieses letzten Abschnitts konnte nämlich gezeigt werden, daß und in welchem Umfang grammatische, in diesem Fall satzphonologische Akzentregeln, wirksam bleiben. Denn auch unter Emphase werden nicht einfach alle Silben verstärkt, sondern die Emphaseverstärkung darf nur dort wirksam werden, wo sie die von den P-Regeln erzeugten Prominenzrelationen nicht zerstört. Diese sind essentieller Bestandteil der Grammatik, da sie die semantisch relevante Fokus-Hintergrund-Gliederung steuern. Die konversationell induzierten Akzentzusammenstöße liefern also kein Argument, das für die Notwendigkeit der Entwicklung einer "phonology-for-conversation" herangezogen werden kann. Sie sind zwar ein interaktiv relevantes Kontextualisierungsmittel, aber die phonologischen Wohlgeformtheitsregeln werden nur auf den ersten Blick verletzt, die grammatisch relevanten P-Regeln bleiben immer in Kraft. Emphatische Hervorhebung durch Akzentzusammenstöße beschränkt sich somit wieder auf die Ausnutzung des Spielraums, den die Grammatik gemäß der in Kapitel 1 formulierten THESE 1 als Freiraum zur Verfügung stellt.

4. Sprechgeschwindigkeitsveränderungen: Formen und Funktionen in Alltagsgesprächen

'Schnelles' oder 'langsames Sprechen' gehört mit zu den naiven, laienhaften Urteilen, die wir ohne große Probleme in unseren alltäglichen Interaktionen zur Verfügung haben. Sprich nicht so schnell, oder Sprich nicht so langsam können wir unsere Gesprächspartner auffordern, und vielleicht bemühen sie sich auch, unserer Aufforderung nachzukommen, indem sie ihre Sprechweise auf die eine oder andere Weise verändern. Für die Erforschung der Interaktion von grammatischen Regeln und konversationeilen Strategien führt das Thema dieses Kapitels nun in einen Bereich, in dem die Satzgrammatik, in diesem Fall die Satzphonologie, einen maximal großen Spielraum für die Besetzung durch konversationeile Strategien läßt, da sie keinerlei Restriktionen für die Geschwindigkeit formuliert, mit der Sprecher ihre Beiträge zu produzieren haben. Dieser maximale Spielraum ermöglicht nun die Besetzung und Nutzung durch eine elaborierte Textgrammatik: Die Sprechgeschwindigkeit wird u.a. dazu verwendet, Informationsstrukturierungen auf der Ebene der Textsemantik zu kontextualisieren, wobei der Faktor 'Relevanz' eine entscheidende Rolle zu spielen scheint. Für die Analysen dieses Kapitels sollen zwei Schwerpunkte gewählt werden: Neben der Produktion wird vor allem die Perzeption der Sprechgeschwindigkeit im Mittelpunkt des Interesses stehen. Das Kapitel beginnt (Abschnitt 4.1) mit der Vorstellung und Diskussion der für die Perzeption von Sprechgeschwindigkeitsveränderungen relevanten Faktoren1 mit dem Ziel, die wichtigsten mit der Perzeption von Sprechgeschwindigkeitsveränderungen korrelierenden phonologischen Parameter in den als 'schnell' bzw. 'langsam' wahrgenommenen Passagen zu ermitteln - nämlich die Silbendichte und die Dichte der akzentuierten Silben. Zur empirischen Überprüfung dient hierzu ein in Studioqualität aufgenommener Vorlesetext. Anhand von Alltagskonversationen folgt in 4.2 die Analyse des interaktiv relevanten Einsatzes von Sprechgeschwindigkeitsveränderungen. Es werden fünf Funktionen vorgestellt: in Abschnitt 4.2.1 die ikonische Kontextualisierung von Geschwindigkeit, in Abschnitt 4.2.2 die ebenfalls ikonische Markierung von bestimmten Selbstreparaturen und in den Abschnitten 4.2.3 bis 4.2.5 die textsemantischen informationsstrukturierenden Funktionen der Sprechgeschwindigkeit (thematische Relevanz bzw. Irrelevanz, Wiederholungen und Zusammenfassungen, sowie Parenthesen, Einschübe und Seitensequenzen).

1

Diese Ausführungen erheben allerdings weder den Anspruch auf Vollständigkeit noch auf erschöpfende Diskussion der einzelnen Faktoren. Jedem Aspekt könnte mühelos eine eigene phonetisch-phonologische Untersuchung gewidmet werden. Zur relativen Dauer findet sich z.B. ein ausfuhrlicher Literaturüberblick bei Lehiste (1970: Kap. 2.). Vgl. speziell zum Deutschen auch Grunwald (1983) sowie Kowal (1991).

186

4.1

Zur Perception von Sprechgeschwindigkeitsveränderungen

Was genau passiert eigentlich, wenn man schneller oder langsamer spricht? Die Beschäftigung mit dieser Frage kann auf eine ziemlich kontinuierliche phonetische Forschungstradition seit B e g i n n dieses Jahrhunderts zurückblicken. Dabei wurde auch schon früh auf die N o t w e n digkeit hingewiesen, 'naive' Verwendungen der Begriffe nicht unreflektiert in die phonetische Analyse eingehen zu lassen. S o weist zum Beispiel Sievers (1901) darauf hin, daß absolute und relative Dauer (Quantität) sowie Tempo strikt voneinander getrennt werden müssen. Die Lehre von der Quantität oder Dauer hat es mit den Zeitmassen der verschiedenen phonetischen Gebilde [Laute, Silben oder Takte; S.U.] zu tun. Die hier in Betracht kommenden Erscheinungen sind äusserst mannigfaltig und verlangen deshalb genaue Classifikation. [...] Unter absoluter Quantität verstehen wir das ZeitmaB eines im Einzelfalle gegebenen Lautes, einer solchen Silbe u.s.w., das sich mit den üblichen Zeitmessern feststellen und also z.B. nach Secunden oder deren Bruchteilen angeben läBt. Bei der relativen Quantität handelt es sich dagegen um das Verhältnis der absoluten Quantitäten der einzelnen phonetischen Gebilde zueinander. [...] Die absolute Dauer aller phonetischen Gebilde wechselt stets nach dem Tempo der Rede: je schneller das Tempo umso kürzer die Dauer des einzelnen Gebildes und umgekehrt. Die relative Dauer braucht beim Tempowechsel nicht erheblich verschoben zu werden. (Sievers 1901: 254f)

Auch eine funktionale Interpretation bei der Unterscheidung von mittlerer Sprechgeschwindigkeit und Tempo wird bereits angedeutet, wenn er fortfährt: Im Uebrigen unterscheide man beim Tempo wieder die mittlere oder allgemeine Sprechgeschwindigkeit der einzelnen Sprecher oder Idiome, und das willkürlich wechselnde Tempo verschiedener Satztheile, das wesentlich von Sinn und Stimmung abhängig ist. (Sievers 1901: 255f)

Auch Jespersens Bemerkungen zur Dauer, die sich in seinem Lehrbuch

der Phonetik

(21913)

2

finden, zielen auf eine funktionale Interpretation der Dauerverhältnisse ab: Die absolute Länge beruht erstens auf dem Tempo der Rede. Es gibt in der Rede ebensoviele verschiedene Tempi wie in der Musik, und ebenso wie der Komponist vor jedes Stück ein Allegro oder ein Andante usw. setzt oder sogar eine Metronomzahl angibt, so müßte eigentlich in einer vollkommenen Lautschrift jedem kleinen Stück ein ähnliches Zeichen vorgesetzt werden. Das Tempo, das sogar innerhalb ein und desselben Satzes oft wechseln kann, hängt von der ganzen geistigen Haltung des Redenden ab und ausserdem von seiner augenblicklichen Stimmung und Laune: der Lebhafte, Eifrige spricht rascher als der Niedergeschlagene oder Träge. Wer sich, sei es den Inhalt, sei es die Form dessen, was er sagen will, erst überlegt, spricht langsam; [...]. Andererseits können kräftige Stimmungen sich durch Verweilen auf gewissen starken Lauten, also durch augenblicklichen Verzögerung des Tempos, kenntlich machen, z.B. 'das ist doch zu:: toll', ach, wie schö:::n!' usw. [...] als wichtiges Tempogesetz läßt sich konstatieren, daß der Redende das Tempo beschleunigt, wenn er sich bewußt ist, dass er eine lange Lautreihe zu sprechen hat (die am liebsten 'in einem Zuge' gesprochen werden soll). Das zeigt sich [...] bei parenthetisch eingeschobenen kurzen Sätzen, z.B. 'mit eigentümlichem, man möchte beinahe sagen, metallischen Klang', wo die kursiv

2

Jespersen unterscheidet auf der Segmentebene fünf Dauerabstufungen: extra kurz, kurz, halblang, lang und überlang. Die Doppelpunkte im obigen Zitat markieren die Überlänge (bei Jespersen werden je nach Ausdehnung zwei oder mehr hochgestellte Punkte verwendet). Sievers hingegen unterscheidet im Wesentlichen nur drei Stufen (Länge, Überlänge und Kürze).

187 gedruckten Worte sehr rasch gesprochen werden. [...] Als allgemeine Regel kann aufgestellt werden, dass bei Beschleunigung des Tempos die langen Laute mehr leiden als die kurzen, indem ihre Dauer sich mehr derjenigen nähert, die die kurzen gewöhnlich haben; kurze Laute bleiben entweder (fast) unverändert kurz oder schwinden in gewissen Fällen ganz; ferner wird natürlich die Anzahl und die Ausdehnung der Pausen beschränkt. (Jespersen 21913: 179f)

Diese beiden Zitatausschnitte machen zwar deutlich, daß die Spiechgeschwindigkeit, oder, wie es hier genannt wird, "das Tempo der Rede", schon früh in die phonetische Beschreibung Eingang gefunden hat. Vor allem die funktionalen Interpretationen der zitierten Autoren zeigen aber auch deutlich die Begrenzungen ihrer Betrachtungsweise. Sie beschränken sich - von einigen Hinweisen auf den "Sinn" (Sievers) und den "parenthetisch eingeschobenen kurzen Sätzen" (Jesperson), auf die ich noch zurückkommen werde, - im allgemeinen auf psychologisierende Deutungsmuster, die nicht weit über das hinausgehen, was uns auch an Alltags(vor)urteilen zur Verfügung steht.3 Im Mittelpunkt dieses Kapitels sollen allerdings nicht wie in den oben präsentierten Zitaten psychologische Dispositionen und sprecherindividuelle Eigenschaften (das "Tempo der Lebensführung", "Stimmungen" oder Zugehörigkeiten zu einer bestimmten Ethnie) stehen, sondern ich möchte vor allem diskutieren, inwieweit Veränderungen des Sprechtempos der Kontextualisierung von sprecherunabhängiger Information dienen können. Die Datengrundlage für die nachfolgenden Analysen ist eine kurze, einem alten Reiseführer entnommene Vorlesepassage, in der die Stadt Köln vorgestellt wird. Der Text wurde von der Sprecherin vor der Aufnahme probeweise gelesen und anschließend zweimal in einer schallreduzierten Aufnahmekabine vorgelesen. Für die Analyse wurde die zweite Version herangezogen. Die Sprecherin unterteilt den Text in 35 Intonationsphrasen.4 Diese werden zu neun prosodischen Abschnitten (vgl. die "phonological utterance" bei Nespor & Vogel 1986: 221ff sowie Ladd 1986) mit tief fallender Intonationskontur auf der letzten Intonationsphrase zusammengefaßt.5 Die Satzzeichen ( . ; , ? ) notieren die intonationsphrasenfinalen Tonverläufe (tief fallend, fallend, steigend, hoch steigend). Die Akzente sind in drei Abstufungen notiert: primär ('), sekundär Ο und extra strak (") (vgl. dazu Kapitel 2.3.1). Als 'schnell' perzipierte Sequenzen wurden mit (#) markiert. Der Text wurde zunächst konversationsanalytisch transkribiert: 3

Vgl. auch von Essen (1949: 317): "Jeder hat sein eigenes Tempo der Lebensführung. Ist der eine rasch zufahrend, agil, 'spritzig' in seinen Bewegungen, so der andere gemessen und bedächtig, ein dritter trag, matt, schleppend, und so wie jemand sich bewegt, wie er arbeitet, geht, schreibt, so spricht er." Oder auch Goldman-Eisler (1961:174): "[...] an increase of speed of articulation thus indicates an increase in the use of prepared and well learned sequences, of cut and dried phrases and clichis, of trite and vernacular speech, of commonplace utterances or professional jargon. It indicates that there is less creative activity and that time serves no function other than that of sound transmission."

4

Zur Intonationsphrasenbildung vgl. Abschnitt 4.1.4 sowie Kapitel 2.3.1. Neben dem finalen tiefen Grenzton am Ende des phonologischen Abschnitts scheint auch die Deklination (vgl. dazu Sluijter & Terken (1993) sowie FN 22) eine perzeptiv relevante Rolle zu spielen.

5

188

(la) (lb) (lc) (ld) (le) (lf) (lg) (2a) (2b) (2c) (2d) (3a) (3b) (3c) (4a) (4b) (4c) (5a) (5b) (5c) (6a) (6b) (6c) (6d) (6e) (7a) (7b) (7c) (8) (9a) (9b) (9c) (9d) (9e) (9f)

"Köln; die 'Hauptstadt (.) des 'gleichnamigen: Regierungsbezirks, und be'deutenste 'Stadt der 'Rheinprovinz, (.) liegt in de::r nach 'Norden und Nord'westen, (.) 'weit ge'öffneten, (.) nach 'Osten 'Süden und 'Südwesten geschlossenen, (.) TDraunkohlenreichen 'Kölner 'Bucht. Die'Altstadt, und ein Teil der 'eingemeindeten 'Vororte, (.) "breiten sich im 'weiten Halbkreis am linken Ufer des 'Rheins 'au::s? am 'rechten Ufer liegen 'Deutz 'Mühlheim und 'einige 'Vororte. Die 'Stadt 'zählt 'über 'siebenhunderttausend 'Einwohner, (.) etwa vier Tünftel Katho:'liken, (0.5) und ist 'einer der 'wichtigsten liisenbahn'knotenpunkte und 'Handelsplätze des 'deutschen 'Reichs. Sie ist der 'Sitz eines Kardi'nal'erzbischo:fs; (.) des Ober'landesgerichts für den 'südlichen Teil der 'Rheinprovinz, (0.5) 'und einer 'Neunzehnhundert'neunzehn 'neu gegründeten Universität. Die vielen 'Türme der 'Dom und die großen 'Rheinbrücken;'(.) "bieten bei der 'Ankunft mit dem 'Dampfboot, einen 'höchst 'stattlichen 'Anblick. In ihren 'mittelalterlich 'schmalen 'Straßen be'wahrt die 'Altstadt? (0.5) die durch Jahr'hunderte in ihrer Ent'wicklung, (.) durch einen 'engen Testigungsring be'hindert war, (.) auch 'manche beachtenswerten Pri'va:tbauten; (.) aus dem'dreizehnten und 'vierzehnten Jahr'hundert. (1.0) Erst 'na::ch der: Hi'nausschiebu:ng: 'des-; (.) #der 'Festungswerke im 'Jahre'Achzehnhunderteinen#'a:chzig? (1.0) "konnte sich das 'Stadtgebiet be'deutend 'ausdehnen. (0.5) Seit'dem hat 'Köln einen 'großartigen 'Aufschwung genommen. (0.5) #Von 'Achzehnhundertachten'achtzig bis Neunzehnhunderteinen'zwanzig?* wurden die 'Vororte:, (0.5) #'Bayenthal 'Lindental 'Ehrenfeld 'Nippes 'Sülz;# Me Taten 'Bickendorf 'Mehrheim 'Worringen am 'linken Ufer? (.) und 'Deutz 'Kalk "Vingst 'Mühlheim:, am 'rechten Ufer 'eingemeindet.

Diese Passage wurde mit einem Kay/Tektronix Visi-Pitch analysiert und über einen SiemensOszillomink wurden die Intensität und die Grundfrequenz separat und synchron mit einem Zeittaktgeber ausgedruckt. Die Konturen wurden segmentiert und mit einer orthographischen Transkription versehen, die die Zuordnung von Segmenten und Kontur wiedergibt. Auf diese Weise konnte die für die Analyse wichtige Akzentnotation abgesichert werden. Die letzten vier prosodischen Abschnitte der Vorlesepassage, die die deutlichsten Sprechgeschwindigkeitsveränderungen aufwiesen, wurden schließlich mithilfe eines MacRecorders digitalisiert, um die Dauer der Intonationsphrasen und der intervenierenden Pausen exakt messen zu können. Die Dauer der Intonationsphrasen wird in eckigen Klammern, die Dauer der Pausen in runden Klammem angegeben:

189 (6a) (6b) (6c) (6d) (6e) (7a) (7b) (7c) (8) (9a)

In ihren 'mittelalterlich 'schmalen 'Straßen be'wahrt die 'Altstadt? (0.44) die durch Jahr'hunderte in ihrer Ent'wicklung, (0.29) durch einen 'engen Testigungsring be'hindert war, (0.35) auch 'manche beachtenswerten Pri'vatbauten, (0.29) aus dem 'dreizehnten und 'vierzehnten Jahr'hundert. (0.72) (0.17) Erst 'na::ch der: Hi'nausschiebung: 'des-; (0.74) #der 'Festungswerke im 'Jahre 'Achzehnhunderteinen#'achzig? (0.43) Tconnte sich das 'Stadtgebiet be'deutend 'ausdehnen. (0.44) Seit'dem hat 'Köln einen 'großartigen 'Aufschwung genommen. #Von 'Achzehnhundertachten'achtzig bis Neunzehnhunderteinen'zwanzig?* (0.06) wurden die 'Vororte:, (0.40) (0.04) #'Bayenthal 'Lindental 'Ehrenfeld 'Nippes 'Sülz,# (0.39) Me l a t e η 'Bickendorf 'Mehrheim 'Worringen am 'linken Ufer? (0.04) und 'Deutz 'Kalk 'Vingst 'Mühlheim:, am 'rechten Ufer 'eingemeindet.

(9b) (9c) (9d) (9e) (9f)

[3.80] [2.18] [2.92] [2.84] [2.13] [2.54] [2.71] [2.88] [3.32] [2.74] [1.40] [2.71] [3.39] [2.03] [1.63]

Diese Messungen sind die Datengrundlage für die nächsten Abschnitte, in denen nicht nur objektiv meßbare, sondern auch perzeptiv relevante Grundlagen für die Beurteilung von Sprechgeschwindigkeitsschwankungen festgelegt werden sollen. Denn nur auf dieser Basis können in einem nächsten Analyseschritt die konversationell relevanten Funktionen von Sprechgeschwindigkeitsveränderungen betrachtet werden.

4.1.1 Anzahl der Laute, Wörter oder Silben pro Zeiteinheit

In der phonetischen Fachliteratur werden recht unterschiedliche Maße zur Bestimmung der Sprechgeschwindigkeit herangezogen. Die drei wichtigsten sind der Laut, das Wort und die Silbe. Relativ häufig wird der Laut als Meßgröße für die Bestimmung der Sprechgeschwindigkeit angesetzt, und über die Anzahl der Laute pro Zeiteinheit wird die Sprechgeschwindigkeit bestimmt. 6 Diese Berechnung hat jedoch den Nachteil, daß die beim schnellen Sprechen häufigen Assimilationen und Elisionen nicht erfaßt werden. Deshalb hat Hildebrandt (1963) 7 vorgeschlagen, die Zahl tatsächlich artikulierter Laute (effektive Lautzahl) in Beziehung zu

6

Vgl. u.a. Heinitz (1921) und von Essen (1949). Ebenfalls auf der Basis von Lauten pro Zeiteinheit haben Fönagy & Magdics (1960), zitiert nach Lehiste (1970: 52), für das Ungarische die Abhängigkeit des Sprechtempos von der kommunikativen Gattung nachgewiesen: Beim Lesen von Gedichten wurde ein Durchschnitt von 9,4 Lauten pro Sekunde erreicht, Sportnachrichten dagegen wurden durchschnittlich mit 13,83 Lauten/Sek. gelesen.

7

Zitiert nach von Essen (1979: 218).

190 einem Vergleichsmuster (z.B. nach der Siebsschen Hochlautung, fiktive, virtuelle Lautzahl) zu setzen. Ein Beispiel aus von Essen (1979): [Der] Ausspruch: Ich habe nichts gesehen [...] erfordert, wenn er sorgfaltig artikuliert werden soll, 17 Lautbildungen: [19 habe nifts gsse^n]. Nun hat aber der Sprecher Α in Wirklichkeit gesprochen: [90p niks gase:n], also nur 12 Laute, und zwar in 0,8 Sekunden; das ergibt, auf 1 Sekunde umgerechnet, IS Laute/Sek. Hätte Α in der selben Zeit von 0,8 Sekunden der strengen sprachlichen Forderung gemäß alle 17 Laute gebracht, so wäre er auf 21 Laute/Sek. gekommen, (von Essen 1979: 218)

Solche hypothetischen Berechnungen sind natürlich problematisch, denn außerhalb eines experimentellen Kontexts sind vergleichbare assimilierte und nicht assimilierte Realisationen nicht zu erhalten. Ein weiteres gebräuchliches Maß in der Literatur zur Sprechgeschwindigkeit ist das Wort. Wörter pro Zeiteinheit wurden von Goldman-Eisler (1961) bei der Analyse identischer Textgruppen gemessen. Ihre Versuchspersonen wurden angewiesen, zunächst Cartoons zu beschreiben und anschließend eine zusammenfassende 'Moral' zu formulieren; diese beiden Aktivitätstypen wurden sechs mal wiederholt. Goldman-Eisler (1961) kam zu folgendem Ergebnis: [...] the rate of articulation [Wörter/Sek., S.U.] is a personality constant of remarkable invariance. This invariance, however, proved subject to modification as a result of practise. (Goldman-Eisler 1961:173)

Während nämlich beim ersten Durchgang die Beschreibungen mit einer durchschnittlichen Artikulationsgeschwindigkeit von 3,5 Wörtern/Sek. und die Zusammenfassungen mit 3,6 Wörter/Sek. produziert wurden, stieg die Geschwindigkeit bei der sechsten Wiederholung auf 4,0 bzw. 4,1 Wörter/Sek. Von Scollon (1982, 1981Ms) wurden Wörter pro Zeiteinheit in 18 verschiedenen Kontexten gezählt. Die ermittelte Größe bezeichnet er als Dichte (density). Er stellte fest, daß ein Gespräch zwischen den Eltern und ihrem einjährigen Kind mit 1,1 Wörter/Sek. die geringste Dichte aufwies, während drei Radioaufnahmen die höchsten Dichtewerte erreichten: Programmhinweise 3,43 Wörter/Sek., Sportnachrichten 3,19 Wörter/Sek. und eine Groucho Marx Show 2,92 Wörter/Sek. Für Scollon ist eine hohe Wortdichte das Korrelat zur Perzeption einer erhöhten Sprechgeschwindigkeit. Allerdings weist er auch darauf hin, daß die Anzahl von Wörtern pro Zeiteinheit eine problematische Meßgröße ist, da sie vor allem in kontrastiven Studien eine mangelhafte Vergleichsbasis liefert. Sprachen unterscheiden sich nämlich stark im Hinblick auf die typische Anzahl der Silben pro Wort (vgl. Scollon 1981Ms: 14). Die Silbe als linguistische Zwischengröße oberhalb der Laut- und unterhalb der Wortebene ist damit nach der Meinung vieler Autoren am besten geeignet, die Basisgröße für die Bestimmung der Sprechgeschwindigkeit zu liefern. So definiert Abercrombie (1967: 96) die

191 Sprechgeschwindigkeit als "rate of syllable succession". Auch Grosjean & Deschamps (1972) bauen ihre Analysen zur Sprech- und Artikulationsgeschwindigkeit im Französischen auf der Silbe als Bestimmungseinheit auf. Als Rede- oder Sprechgeschwindigkeit

(vitesse de parole)

definieren die Autoren die Anzahl der Silben dividiert durch die gesamte Sprechzeit, während die Artikulationsgeschwindigkeit

(vitesse d'articulation) nur auf die Sprechzeit minus der

Pausenzeit, also die reine Artikulationszeit Bezug nimmt. (Auf die Notwendigkeit, zwischen Artikulationszeit und Sprechzeit zu unterscheiden, werde ich in Abschnitt 4.1.3 noch einmal zurückkommen.) Grosjean & Deschamps (1972:136ff) ermittelten als Artikulationsgeschwindigkeit für spontanes Französisch (Radiointerviews) einen Durchschnittswert von 5,29 Silb./Sek. Die mittlere Variation lag zwischen 4,4 und 6,0 Silben/Sek. mit einem Minimum bei 3,5 Silben/Sek. und einem Maximum bei 8,5 Silben pro Sekunde. Goldman-Eisler (1961:171) kommt für das Englische bei der Analyse von Interviews, bei der sie im Gegensatz zu dem oben zitierten Experiment auch Silben pro Sekunde berechnet, auf eine Variation zwischen 4,4 und 5,9 Silben pro Sekunde. In einer späteren Arbeit, Goldman-Eisler (1968), errechnet sie einen Durchschnittswert von 4,95 Silben/Sek. Für das Deutsche hat Meinhold (1972) eine Untersuchung durchgeführt, in der vier monologische Textgruppen (Lyrik, Belletristik, Nachrichten und Programmansagen) die Analysegrundlage bildeten. In bezug auf die Artikulationsgeschwindigkeit bildeten sich zwei distinkte Gruppierungen: Während die Nachrichten mit 5,6 Silben/Sek., die Belletristik mit 5,4 Silben/Sek. und die Programmansagen mit 5,2 Silben/Sek. eine relativ homogene Gruppe bildeten, setzte sich die Lyrik mit nur 3,7 Silben/Sek. deutlich ab. Als Grund für den extrem niedrigen Wert in der Lyrik führt Meinhold (1972: 496) die große Informationsdichte, die besondere rhythmische Stuktur und die suprasegmentale Gestaltung an. Für die Perzeption von Sprechgeschwindigkeit wird die Dichte der Silben pro Zeiteinheit als relevanter phonologischer Parameter angenommen. Dennoch darf nicht übersehen werden, daß sich hier im Prinzip die gleichen Probleme ergeben, die auch schon beim Laut als Meßeinheit diskutiert wurden. Assimilationen und Segmenttilgungen, die zu Silbentilgungen führen können, werden nicht erfaßt. Gerade Resilbifizierungen könnten jedoch ein wichtiger Indikator für die Perzeption von Sprechgeschwindigkeitserhöhung sein. Ein Ausweg bietet sich darin, wie Barden (1991) in Anlehung an Hildebrandt (1963) zwischen effektiver und virtueller Silbenzahl oder wie den Os (1985:124) zwischen orthographisch begründeten phonologischen Silben (linguistic syllables) und den tatsächlich produzierten phonetischen

Silben (phonetic

8

syllables) zu unterscheiden. Bei der Ausweitung seiner Testergebnisse, die die Frage beantworten sollten, welche von drei objektiven Meßgrößen am besten geeignet ist, die Perzeption

In der Untersuchung von den Os (1985) werden auch Perzeptionsexperimente durchgeführt, bei denen Exophone Sprechgeschwindigkeitsbeurteilungen abgeben müssen. Auf die interessanten Unterschiede zu den Beurteilungen durch Muttersprachler kann hier jedoch nicht näher eingegangen werden.

192 von Sprechgeschwindigkeitsveränderungen wiederzugeben, stellte den Os (1985: 127) fest, daß beide Meßeinheiten ebenso wie die dritte, die Anzahl der Laute, relativ hohe Determinationskoeffizienten erzielen konnten. In den meisten Fällen war jedoch der auf der phonetischen Silbe basierende Koeffizent niedriger als die beiden anderen Meßwerte. In dem Vorleseausschnitt Köln besteht eine Eins-zu-Eins-Beziehung zwischen den beiden Meßgrößen phonologische und phonetische Silbe. Die Sprecherin produziert 184 Silben in 43,8 Sekunden, das entspricht einer durchschnittlichen Sprechgeschwindigkeit von 4,2 Silben/Sek. ein Ergebnis, das im Vergleich mit den anderen Analysen eher am unteren Rand der beobachteten Variation der Sprechgeschwindigkeit liegt.9

4.1.2 Anzahl der Schläge oder akzentuierten Silben pro Zeiteinheit In den bereits zitierten Arbeiten von Scollon (1982, 1981Ms) wird ein weiterer Parameter zur zeitlich-rhythmischen Organisation von natürlicher Sprache eingeführt: Ensprechend der Verwendung in der Musiktheorie bezeichnet Scollon als Tempo (tempo) die Anzahl von Schlägen (schwere oder akzentuierte Silben) pro Minute. Bei einer um 20% reduzierten Bandlaufgeschwindigkeit konnte er in allen von ihm untersuchten Sprechaktivitäten einen 2/4 Takt mit einem starken ersten Taktteil (downbeat) und einem schwächeren zweiten Taktteil (upbeat) identifizieren. Auch Scollon findet wie schon Jespersen (1913: 197) "in der Rede ebensoviele Tempi wie in der Musik". Und entsprechend Jespersens Vorschlag hält Scollon die Tempiwechsel im Transkript in der Metronomnotierungskonvention fest (z.B. , I = 72, vgl. Scollon 1981 Ms: 12f). Die Variabilität des Tempos ist seiner Meinung nach das überraschendste Resultat seiner Analysen. In my whole sample, the range of mean tempos is from 115.4 beats per minute in a radio spot announcement to 70.2 beats per minute also in a radio programm. Within 15 minutes of a conversation around a breakfast table there is a range in tempos from 103.4 beats per minute to 60.9 beats per minute. In other words, there ist a highly variable range of tempos both within situations and across situations. It is also impossible to characterize individual speakers as having a unique tempo. The variability within speakers is as great as across situations. [...] tempos appear to be used as the means of negotiating the interaction between speakers. As in music, it is the tempo that keeps the participants in touch with each other. (Scollon 1981: 340)

Scollon weist allerdings darauf hin, daß nicht jede akzentuierte Silbe einem Schlag in dem von ihm intendierten Sinn entspricht. Das Problem liegt dann allerdings bei der Identifizierung von Schlägen. Zählen primäre, sekundäre oder extra starke Akzente gleichermaßen als Schläge? 9

Bei diesen Werten muß allerdings beachtet werden, daß es sich auch hier um die Vorlesegeschwindigkeit handelt. Nach Lieberman (1963) wird bei schnellem Lesen eine Durchschnittsgeschwindigkeit von 4,5 Silben pro Sekunde erreicht. Bei normalen englisch-amerikanischen Konversationen wird hingegen ein Wert von 5,5 Silben erreicht, der in kurzen Abschnitten auch auf 8 Silben/Sek. ansteigen kann.

193 Gibt es die Notwendigkeit der besonderen phonetischen Realisierung, z.B. durch F0-Veränderungen? Ein weiteres Problem ist die Entscheidung, welche akzentuierten Silben bei der rhythmischen Organisation unberücksichtigt bleiben können. Wenn man Scollon folgen würde, sind diese Fragen für die Untersuchungen der Sprechgeschwindigkeit irrelevant, da seiner Meinung nach das Tempo ein unabhängiger Parameter rhythmischer Gestaltung ist, der nicht mit der perzipierten Sprechgeschwindigkeit korreliert. So weist die schon erwähnte Groucho Marx Show ein relativ niedriges Tempo auf (75,9 Schläge pro Minute). Der Eindruck der hohen Sprechgeschwindigkeit ergibt sich nach Scollon durch die hohe Dichte der Rede (2,92 Wörter pro Sekunde). In short, the intuitive sense of rapid speech seems to be closely tied to density and not at all related to tempo. (Scollon 1981 Ms: 19)

Analysen wie Auer (1990a) zum Deutschen und Couper-Kuhlen (1992,1993) zum Englischen haben Scollons Einschätzung bezüglich der Unabhängigkeit von Tempoveränderungen und Sprechgeschwindigkeitswahrnehmung jedoch nicht bestätigt. Vor allem Couper-Kuhlens (1992) Analyse von Reparatursequenzen macht deutlich, daß auch die Erhöhung des Tempos, also die Plazierung von Schlägen in kürzeren Abständen, sowohl zur Perzeption von Beschleunigung beiträgt als auch (zusammen mit dem Faktor Isochronie bzw Anisochronie, vgl. FN 42 und Kapitel 3.2) wichtige Kontextualisierungsfunktionen übernimmt. Für die folgenden Analysen wird das Konzept der Abfolge von Schlägen in einem zentralen Sinn ausgebaut. Für den perzeptiven Eindruck der Beschleunigung oder der Verlangsamung werden im Gegensatz zu Scollon alle akzentuierten Silben berücksichtigt, und zwar unabhängig davon, ob sie für den zwischen den Gesprächsteilnehmern etablierten Rhythmus relevant sind oder nicht. Dieser zusätzliche Parameter teilt mit der Silbendichte die Eigenschaft, daß alle Vorkommen eines bestimmten linguistischen Elements berücksichtigt werden, und mit Scollons Tempoparameter, daß es sich bei den Elementen um akzentuierte Silben handelt. Für die Perzeption von Sprechgeschwindigkeitsveränderungen werde ich die Dichte der akzentuierten Silbe pro Zeiteinheit als zweiten Parameter verwenden. Wenn man also Sprechgeschwindigkeit als Anzahl von akzentuierten Silben pro Zeiteinheit betrachtet, so ergibt sich für den Testausschnitt bei einer Gesamtzahl von 51 akzentuierten Silben eine durchschnittliche Dichte von 1,1 akzentuierten Silben/Sek. (bzw. 66 akzentuierten Silben/Min.).

194 4.1.3 Anzahl, Dauer und Plazierung von Pausen pro Zeiteinheit Für die Beurteilung der Sprechgeschwindigkeit spielen auch Pausen10 eine wichtige Rolle, denn wenn Tempo wie bei Scollon als Anzahl von Schlägen pro Zeiteinheit definiert wird, kann man bei der Transkription von Konversationen feststellen, daß manche dieser Schläge still sind (silent beats), also Schläge, die nicht mit Vokalisierungen zusammenfallen.11 Ihren prozentualen Anteil hat Scollon in den bereits erwähnten 18 Gesprächskontexten ermittelt und eine Variation von nahezu 50% festgestellt: Von 48,6% in einem Frühstücksgespräch bis zum praktischen Nichtvorkommen von nur 2,6% in einer Radioansage. Der Faktor stille Schläge korrelierte in Scollons (1981 Ms: 17) Daten zwar am deutlichsten mit dem Grad der Fokussierung12 der Interaktion, aber auch der auditive Eindruck der Sprechgeschwindigkeit ist seiner Meinung nach nicht unabhängig von den Schweigephasen, die sich jedoch nicht unbedingt nur aus stillen Schlägen zusammensetzen: [...] I find that our intuitive impressions of 'lots of talk' relate more to the density and the relative amount of silence than to the tempo. (Scollon 1982:339)

Auch Jespersen hat - wie bereits zitiert - darauf hingewiesen, daß die Anzahl und Dauer von Pausen bei der Perzeption der Sprechgeschwindigkeit eine entscheidende Rolle spielen, und Goldman-Eisler (1961) schreibt: A continuous flow of speech, rarely broken by periods of silence, is felt to be fast speech, and speech the flow of which is haltered by frequent pauses of hesitation is experienced as slow speech. (Goldman-Eisler 1961:171)

Es herrscht in der Literatur allerdings keine Einigkeit darüber, ob nun der Anzahl der Pausen (Pausenhäufigkeit) oder ihrer Dauer (Pausenlänge) für die Perzeption der Sprechgeschwindigkeit größere Bedeutung zukommt. Nach Meinholds (1972) Untersuchung zum Deutschen ist es die Pausenhäufigkeit, die besonders auf die perzipierte Sprechgeschwindigkeit einwirkt. Dagegen sind Lass & Deem (1972) der Meinung, daß beide Faktoren in gleicher Weise ausschlaggebend sind. Meinholds Aussage wird allerdings durch die Analysen von Grosjean & Deschamps (1972) bestätigt. In ihren bereits zitierten Untersuchungen zum gesprochenen Französisch (vgl. Abschnitt 4.1.1) konnte von den berücksichtigten Variablen nur die geringere

1

0

Zur Funktion von Sprechpausen als Atempausen oder Planungspausen gibt es vor allem umfangreiche psychologische und psycholinguistische Literatur, die hier leider nicht ausreichend berücksichtigt werden konnte. Zur Funktion von Pausen und Verzögerungen in Politikerreden und als umfassenden LiteraturÜberblick vgl. Kowal (1991).

'1

"In my work I am defining silence as beats on which speech does not occur" (Scollon 1981: 339).

12

Vgl. Goffman (1963) sowie Kapitel 3 FN 51.

195 Anzahl der Pausen (nicht ihre geringere Dauer oder eine erhöhte Artikulationsgeschwindigkeit) den Umstand erklären, daß die Autoren für das Französische eine höhere Sprechgeschwindigkeit festgestellt haben als für das Englische. Weitgehende Einigkeit (vgl. auch Kowal 1991: Kap. 9) herrscht hingegen darüber, daß Pausenzeit und Sprechzeit für die Berechnung von Sprechgeschwindigkeit und Artikulationsgeschwindigkeit unterschieden werden müssen: It is customary to make a fundamental distinction between gross rates based on the total time of speaking (i.e. including pauses) and net rates based on the period of actual utterance (excluding pauses). (Wood 1975: 100)

Als Beispiel für die Notwendigkeit der methodischen und terminologischen Trennung (letztere ist allerdings in der Literatur recht inkonsistent) weist Wood (1975: 101) darauf hin, daß eine seiner Versuchspersonen 333 Silben in 74 Sekunden produzierte, also 4,5 Silben pro Sekunde. Zwischen der ersten und der letzten Lautäußerung gab es jedoch auch Pausen, und zwar für insgesamt 24 Sekunden. Das heißt, Woods Versuchsperson benötigte also eigentlich nur 50 Sekunden, um die 333 Silben zu produzieren, was einer Artikulationsgeschwindigkeit von 6,7 Silben in der Sekunde entspricht. Sprechgeschwindigkeit und Artikulationsgeschwindigkeit eines Sprechers geben uns also ganz verschiedene Interpretationsdaten. Die erste Größe macht deutlich, wieviel Zeit ein Sprecher benötigt, um einen bestimmten Gedanken zu kommunizieren, während die zweite uns zeigt, wie schnell er seine Lautäußerungen produziert. Die für die Vorlesepassage angegebenen 4,1 Silben/Sek. sind also die Sprechgeschwindigkeit

der

Sprecherin. Zieht man alle Pausen innerhalb dieser Passage ab (insgesamt 4,8 Sek./Pause), so ergibt sich eine mittlere Artikulationsgeschwindigkeit von 4,6 Silben/Sek. So einleuchtend die Trennung auf den ersten Blick auch erscheinen mag, so zeigen sich doch bei näherer Betrachtung einige recht gravierende Probleme, wenn es nämlich darum geht zu definieren, was als Pause und was als Nicht-Pause betrachtet werden soll. Eine Möglichkeit wäre zweifellos, Pausen als Phasen der völligen Abwesenheit von artikulatorischen Lautäußerungen (also als Schweigen zu definieren), und wenn man wie Bolls Dr. Murke alle solchen Phasen aus dem Beitrag eines Sprechers ausschnitte und diese Tonbandabschnitte aneinanderklebte, dann könnte man die Gesamtdauer dieses "gesammelten Schweigens" messen und der Berechnung von Sprech- und Artikulationsgeschwindigkeit zugrundelegen. Es erhebt sich allerdings die Frage, ob alle Phasen tatsächlicher Artikulation gleich behandelt werden können. Sind also alle ähms und äähs, also das, was als vokalisierte Pause oder gefiillte Pause (pause filier)13 bezeichnet wurde, oder alle Versprecher und alle nur unvollständig produzierten Wörter als 'Nicht-Pausen' zu zählen, weil hier ja Vokalisierungen vorliegen?

13

Vgl. z.B. Butterworth (1980).

196 Diese Probleme mögen für viele phonetische Untersuchungen irrelevant sein 14 , denn wenn die Produktion von Nonsense-Silben die Datengrundlage ist oder aber einzelne kurze Sätze vorgelesen werden müssen, wird es die genannten Phänomene entweder gar nicht geben, oder sie werden als defiziente Daten von der Analyse ausgeschlossen. Bei der Analyse natürlicher, spontaner Gespräche müssen solche Aspekte hingegen unbedingt berücksichtigt werden. Das zweite Problem, das in diesem Zusammenhang vielleicht noch relevanter ist, betrifft die Perzeption von 'schnellem' oder 'langsamem Sprechen'. Meinen wir mit solchen Urteilen die Sprech- oder die Artikulationsgeschwindigkeit eines Sprechers? Oder ist unser Eindruck vielleicht ein holistischer, der beide Komponenten berücksichtigt? Wie steht es mit den beiden Parametern Dichte der Silben und Dichte der akzentuierten Silben? Welcher ist für den Eindruck des 'schnellen' oder 'langsamen Sprechens' primär verantwortlich? Oder spielen vielleicht auch hier beide Parameter eine vergleichbar wichtige Rolle? Bevor diese Fragen beantwortet werden können, muß aber ein weiterer Problemkreis diskutiert werden.

4.1.4 Intonationsphrasen als Meßeinheiten Alle bisher zitierten Methoden zur Geschwindigkeitsmessung operierten ausschließlich auf der Zeit als relevanter Meßgröße, d.h. bestimmte Einheiten (Laute, Silben, Wörter, Pausen) wurden in ihrer Vorkommenshäufigkeit pro Zeiteinheit berechnet. Für die Ermittlung von Durchschnittsgeschwindigkeiten, die als sprecherindividuelle oder stiltypische Konstanten angegeben werden können, ist dies sicherlich auch eine legitime Vorgehensweise. Ist aber die funktionale Analyse von Geschwindigkeitsveränderungen das Ziel, so bietet diese Meßmethode dann keinen Ansatzpunkt mehr zur Interpretation der Daten, wenn nur über große Zeitabschnitte gemessene Mittelwerte berechnet werden, denn auf diese Weise werden interaktiv relevante Schwankungen der Sprechgeschwindigkeit neutralisiert (vgl. dazu auch Miller, Grosjean & Lomanto 1984). In diesem Fall bietet es sich vielmehr an, eine bestimmte Einheit als Analysegrundlage festzulegen, innerhalb deren Grenzen die Sprechgeschwindigkeit berechnet wird. Eine in der Literatur verbreitete phonologische Einheit ist die Intonationsphrase. Mit diesem oder ähnlichen Begriffen (tone group, Phrasierungseinheit, tone unit, breath group, Tongruppe, rhetorisches Syntagma etc.; vgl. auch FN 19) versucht man, ein prosodisches Phänomen terminologisch und analytisch zu fassen, das dadurch gekennzeichnet ist, daß sich bestimmte Abschnitte von Äußerungen aufgrund besonderer interner und flankierender prosodischer Eigenschaften zu auditiv identifizierbaren und phonologisch relevanten Einheiten 14

Diese Kritik trifft nicht auf die zitierte Arbeit von Grosjean & Deschamps (1972) zu. Die Autoren unterscheiden explizit zwischen "pauses non sonores" und "pauses sonores" (pauses remplier, syllabes allongie, ripititions, faux departs). Letztere beziehen sie als sekundäre Variablen in die Analyse der Sprechgeschwindigkeit mit ein.

197 gruppieren lassen. Wie schon in Kapitel 2.3.1 zur Intonationsphrasenbildung ausgeführt, werden in der Literatur für die Analyse des internen Aufbaus von Intonationsphrasen kontroverse Ansätze diskutiert.15 Es besteht jedoch weitgehende Einigkeit, daß Intonationsphrasen obligatorisch mindestens eine prosodisch besonders prominente Position (eine akzentuierte Silbe) enthalten müssen und daß sie idealiter durch eine Pause voneinander getrennt sind. Für die empirischen Analysen sind beide Komponenten jedoch nicht unproblematisch: Zumindest im Deutschen können sowohl Pausen innerhalb von Intonationsphrasen auftreten als auch zwei Intonationsphrasen ohne intervenierende Pause aufeinanderfolgen. Gerade bei höherer Sprechgeschwindigkeit ist zu erwarten, daß keine Pausen auftreten, sondern die Phrasierungsgrenze durch andere prosodische Mittel markiert wird. Und was die Anzahl der prosodisch besonders hervorgehobenen Silben anbetrifft, so gibt es eine beträchtliche Variation, die z.B. in der Vorlesepassage bei zwischen 1 und bis zu 7 solcher Hervorhebungen liegt. Trotz dieser Schwierigkeiten bei der Definition der Intonationsphrase gab es selten Probleme, die Phrasengrenzen in dem hier analysierten Datenmaterial akustisch oder auditiv festzustellen.16 Neben der Möglichkeit, SprechgeschwindigkeitsVeränderungen zu messen, wurde gerade für die Relevanz von Pausen bei der Perzeption der Sprechgeschwindigkeit häufig diskutiert, ob neben ihrer Vorkommenshäufigkeit und ihrer Dauer nicht auch ihre Position innerhalb oder außerhalb von Intonationsphrasen Einfluß auf die Wahrnehmung von Geschwindigkeitsveränderungen haben könnte. 17 So unterscheidet Scollon (1982, 1981Ms) zwischen Schweigephasen (vgl. Abschnitt 4.1.3, FN 10), die innerhalb von Intonationsphrasen auftreten, und solchen, die an ihren Rändern piaziert werden. I argue that silent beats which follow the closure of a tone group are qualitatively different from those which occur within a tone group, and suggest that it is the silent beats following tone group closure which are interactively and cognitively useful. I have been tentatively calling these silent beats 'useful silences'. (Scollon 1982: 339)

15

Vgl. Kapitel 2 FN 13.

16

Zur auditiven und akustischen Bestimmung von Intonationsphrasengrenzen in natürlichen Konversationen vgl. auch Schuetze-Cobum et al. (1991). Bei der auditiven Analyse sind Interferenzen über die syntaktische und semantische Information, die bei der Beurteilung von Phrasierungsgrenzen ja auch immer zur Verfügung stehen, jedoch nicht abzuschließen. Inwieweit Hörer in der Lage sind, intonatorische Phrasierung allein auf der Basis suprasegmentaler Information zu beurteilen, läßt sich nur durch Maskierungsexperimente (Inhaltsverdeckung durch Rauschen oder Filterung) feststellen (vgl. dazu Swerts & Geluykens 1993).

17

Untersuchungen von Butcher (1981) weisen jedoch darauf hin, daß Pausen bei der Perzeption von Sprechgeschwindigkeitsveränderungen eine geringere Rolle als bei der Beurteilung von durchschnittlicher Sprechgeschwindigkeit spielen. Wie Lass (1970) analysiert Butcher jedoch nur intonationsphrasenexterne Pausen, die jedoch danach unterschieden werden, ob sie zwischen Intonationsphrasen innerhalb von Sätzen oder an Satzgrenzen vorkommen.

198 Diese Unterscheidung ist sicherlich im Prinzip korrekt, und sie konnte vor allem in bezug auf die interaktive Funktion von Pausen in Konversationen überzeugend bestätigt werden. 18 Für die Perzeption der Sprechgeschwindigkeit scheint die Dichotomie (intonationsphraseninterne vs. intonationsphrasenexterne Pausen) auf den ersten Blick wesentlich weniger einleuchtend zu sein, und in der Tat ist sie in der Literatur auch entsprechend umstritten. Wie bereits erwähnt haben Grosjean & Deschamps (1972) Analysen gezeigt, daß die höhere Sprechgeschwindigkeit in ihren französischen Daten auf die höhere Anzahl der vokalisationslosen Pausen (silent pauses) zurückzuführen ist. 75% dieser Pausen werden am Ende von einer Sinneinheit (group de sens, vergleichbar mit der Intonationsphrase)19 gemessen. Die Autoren zitieren ein Ergebnis von Hawkins (1971), der Entsprechendes für das Englische festgestellt hat: 2/3 der Pausen erscheinen zwischen zwei Intonationsphrasen. Aus diesen Ergebnissen kann man schließen, daß intonationsphrasenexterne Pausen bei der Perzeption der Sprechgeschwindigkeit eine größere Rolle spielen müssen als interne Pausen. Bei dieser Schlußfolgerung muß allerdings bedacht werden, daß nur vokalisationsfreie Pausen berücksichtigt wurden. Demgegenüber sind Lass & Deem (1972) zu Ergebnissen gekommen, die die größere Bedeutung der internen Pausen aufzeigen. 12 Testpersonen wurden angewiesen, einen kurzen Text zunächst in normaler Sprechgeschwindigkeit (Standart Reading Task), dann halb so schnell (Fractionation Reading Task) und zuletzt doppelt so schnell wie normal (Multiplication Reading Task) zu lesen. Bei der normalen Sprechgeschwindigkeit produzierten 10 der 12 Sprecher zwar mehr externe als interne Pausen, bei der Verlangsamung stieg der Anteil der internen Pausen jedoch deutlich an: Alle 12 VPs produzierten mehr interne als externe Pausen. Bei der Erhöhung der Sprechgeschwindigkeit sank der Anteil der internen Pausen wieder: 6 VPs produzierten nun überhaupt keine internen Pausen mehr. Aus diesen Ergebnissen schließen die Autoren, daß sowohl die Erhöhung als auch die Verringerung der Sprechgeschwindigkeit primär über Veränderungen bei den phrasenintemen Pausen erzielt wird. Vor allem aufgrund der Möglichkeit, statt der Ermittlung von Durchschnittsgeschwindigkeiten genauere Messungen von perzeptiv und interaktiv relevanten Geschwindigkeitsveränderungen in kürzeren Zeiträumen vornehmen zu können, wird die Intonationsphrase die phonologische Basisgröße für die folgenden Analysen bilden. Betrachten wir dazu die Intonationsphrasen (8) sowie (9a) und (9b):

18

Vgl. u.a. Sacks, Schegloff & Jefferson (1974: 715ff), Bergmann (1982), Goodwin (1979, 1981), CouperKuhlen (1993) und Jefferson (1983c) und FN 8 Kap. 3.

19

Vgl. u.a. auch die Konzepte "Informationseinheit" bei Brandt & Rosengren (1991a, 1991b) und Pheby (1983), "idea unit" bei Chafe (1993), "informational phrase" bei Gumperz & Berenz (1993) oder "utterance unit" bei Nakajima & Allen (1993) oder "phonodische Einheit" bei Roy£ (1983). Zur Diskussion der Intonationsphrasenbildung im Rahmen der prosodischen Phonologie vgl. besonders Ladd (1986), Beckman & Pierrehumbert (1986), Gussenhoven (1990), Gussenhoven & Rietveld (1992). Für eine kritische Diskussion dieser Konzepte vgl. Uhmann (i.V.b).

199 (8) (9a) (9b)

Seit'dem hat 'Köln einen 'großartigen 'Aufschwung genommen. (0.44) [3.32] #Von 'Achzehnhundertachten'achtzig bis Neunzehnhunderteinen'zwanzig ?# (0.06) [2.74] wurden die'Vororte:, (0.40) [1.40]

Die Intonationsphrase (8) hat ohne die phrasenfinale Pause von 0.44 Sek. eine Länge von 3,32 Sekunden. In dieser Zeit produziert die Sprecherin nur 15 Silben, was einer Artikulationsgeschwindigkeit von 4,5 Silben/Sek. entspricht. (9a) hingegen enthält 18 Silben gesprochen in 2,74 Sekunden. Hier beträgt die Artikulationsgeschwindigkeit 6,6 Silben/Sek. Außerdem fallen bei dieser Intonationsphrase Artikulations- und Sprechgeschwindigkeit fast zusammen, da die Phrase nur eine sehr kurze externe Pause von 0.06 Sek. aufweist. (9b) ist mit 1,40 Sekunden eine sehr kurze Intonationsphrase, deren 6 Silben mit einer Geschwindigkeit von 4,3 Silben/Sek. produziert werden. Damit ist die Sprechgeschwindigkeit in (9b) noch etwas langsamer als in der Intonationsphrase (8). Leider gibt es, wie (7a) und (7b) zeigen, keine absolute Eins-zu-Eins-Beziehung zwischen Intonationsphrasen und Phasen der Akzeleration: (7a) Erst'na: :ch der: Hi'nausschiebung: 'des-; (7b) # der'Festungswerke im'Jahre'Achzehnhunderteinen #'achzig?

(0.17) [2.54] (0.74) [2.71]

Auch eine perzeptiv schnelle Intonationsphrase wie (7b), deren 16 Silben mit einer Artikulationsgeschwindigkeit von 5,9 Silben/Sek. (Sprechgeschwindigkeit 4,6 Silben/Sek.) produziert wird, kann eine phrasenfinale Verlangsamung aufweisen. 20 Die Artikulationsrate beträgt 6,3 Silben/Sek. für den schnellen Abschnitt (Dauer: 2.20), aber nur 3,9 Silben/Sek. für die beiden letzten Silben, deren Dauer 0.51 Sekunden beträgt. Intonationsphraseninteme Pausen, zu denen ich wie auch Grosjean & Deschamps (1972) Silbendehnungen zähle, spielen sicher in der sehr langsamen Intonationsphrase (7a) eine entscheidende Rolle. Die Sprechgeschwindigkeit liegt hier bei 3,2 Silben pro Sekunde. Doch auch der zweite Faktor, die Dichte der akzentuierten Silben, sollte auf der Intonationsphrasenebene betrachtet werden. Dazu möchte ich die folgenden Intonationsphrasen 21 vergleichen: 20

Kohler (1986: 137) weist darauf hin, daB nicht phrasenfinale Pausen, sondern die mit diesen Pausen verbundenen segmentalen und suprasegmentalen Veränderungen für die Perzeption von Verlangsamung verantwortlich sein könnten: "Pausing in naturally produced texts is correlated with prepausal lengthening and F0 gliding, which are both tempo cues, without necessarily affecting the usual rate measure of syllables/sec." Phrasengrenzen und Pausen sind jedoch nicht notwendigerweise mit phrasenfinaler Dehnung verbunden. Vgl. dazu die Diskussion in Beckmann & Edwards (1990), Selkirk (1990), Fowler (1990), Cutler (1990) sowie auch Gussenhoven & Rietveld (1992).

21

In den Intonationsphrasen (7c), (8) und (9c) zählen alle akzentuierten Silben auch als Schläge, und die Sequenzen werden als rhythmisch isochron perzipiert. Zum Konzept der rhythmischen Isochrome in natürlichen Konversationen vgl. Auer (1990a), Couper-Kuhlen & Auer (1991), Couper-Kuhlen (1993) sowie Kapitel 3.2.

200 (7a) (7b) (7c) (8) (9a) (9b) (9c) (9d) (9e) (9f)

Erst 'na::ch der: Hi'nausschiebung: 'des-; (0.17) #der'Festungswerke im'Jahre'Achzehnhunderteinen#'achzig? (0.74) "konnte sich das 'Stadtgebiet be'deutend 'ausdehnen. (0.43) Seit'dem hat 'Köln einen 'großartigen 'Aufschwung genommen. (0.44) #Von 'Achzehnhundertachten'achtzig bis Neunzehnhunderteinen'zwanzig?# (0.06) wurden die'Vororte:, (0.40) #'Bayenthal 'Lindental 'Ehrenfeld TSfippes 'Sülz,# (0.04) Melaten'Bickendorf'Mehrheim'Worringen am'linken Ufer? (0.39) und 'Deutz 'Kalk 'Vingst 'Mühlheim:, (0.04) am'rechten Ufer'eingemeindet.

[2.54] [2.71] [2.88] [3.32] [2.74] [1.40] [2.71] [3.39] [2.03] [1.63]

Die Intonationsphrase (7c) enthält 4 akzentuierte Silben. Bei einer pauseninklusiven Dauer von 3,31 Sekunden ergibt sich eine Dichte von 1,2 akzentuierten Silben/Sek. und eine Silbendichte von 3,9 Silben pro Sekunde. Die Intonationsphrase (8) weist fast die gleichen Dichtewerte auf: 1,1 akzentuierte Silben/Sek. und 4,0 Silben pro Sekunde. Beide Phrasen werden bezüglich ihrer Sprechgeschwindigkeit als unmarkiert wahrgenommen. Die als langsam perzipierte Intonationsphrase (7a) weist ebenfalls eine Dichte von 1,2 akzentuierten Silben/Sek. auf. Für den Eindruck der reduzierten Sprechgeschwindigkeit muß bei unmarkierter Dichte der akzentuierten Silben also die geringe Silbendichte von nur 3,2 Silben/Sek. verantwortlich gemacht werden. In der als schnell perzipierten Intonationsphrase (9c) drängen sich hingegen 5 akzentuierte Silben auf 2,71 Sekunden mit einer Dichte von 1,8 akzentuierten Silben/Sek. zusammen. Mißt man dagegen die Silbendichte (12 Silben in 2,71 Sekunden), so ergibt sich eine Geschwindigkeit von 4,4 Silben/Sek. Das ist ein Wert, der für sich allein genommen eher die Perzeption einer mittleren Sprechgeschwindigkeit vermuten ließe. Die Phrase (9e) hingegen, die eine etwas höhere Dichte der akzentuierten Silben aufweist (1,9 akzentuierte Silben/Sek.), kombiniert diese Rate mit einer extrem niedrigen Silbendichte (2,9 Silben/Sek.). Perzipiert wird diese Intonationsphrase als sehr langsam und sehr emphatisch. In Kontrast dazu zeigt (9a) das folgende Muster: 1,1 akzentuierte Silben/Sek. und 6,4 Silben/Sek. Perzeptiv ist dieser Abschnitt sehr schnell. (7b) wird ebenfalls als sehr schnell wahrgenommen; seine Werte sind: 6,3 Silben/Sek. und 1,4 akzentuierte Silben/Sek. Der Unterschied zwischen (7b) und (9a) betrifft nur die Dichte der akzentuierten Silben. Obwohl beide Intonationsphrasen als schnell perzipiert werden, ist also nicht sicher, ob sie auch funktional identisch sind. Die hohe Dichte der akzentuierten Silben in Phrase (9e) wird kombiniert mit einer extrem niedrigen Silbendichte. Im Gegensatz zu (9c) kann die hohe Dichte der akzentuierten Silben in (9e) nicht den Eindruck von Akzelerierung erzielen, denn dazu scheint die Silbendichte zu niedrig zu sein. Diese Beobachtungen legen nahe, daß die Silbendichte und die Dichte der akzentuierten Silben zwei unabhängige Parameter für die Perzeption der Sprechgeschwindigkeit und die zeitliche Organisation gesprochener Sprache sind. Für die Perzeption von Schnelligkeit können sie in einem kompensatorischen und vielleicht auch in einem additiven Verhältnis zueinander stehen.

201

4.1.5 Grundfrequenz Abschließend möchte ich nun noch kurz die Frage diskutieren, inwieweit der Tonhöhenverlauf der Intonationsphrasen (mit dem akustischen Korrelat der Grundfrequenz) zur Perzeption von Beschleunigung und Verlangsamung beiträgt. Im Gegensatz zu den bisher vorgestellten akustischen Parametern und phonologischen Entitäten beruht die Beeinflussung der Perzeption von Sprechgeschwindigkeitsveränderungen durch die Grundfrequenz nicht auf intrinsischen Dauereigenschaften. Dennoch lassen sich Wirkungen auf die Perzeption von Sprechgeschwindigkeit nachweisen (vgl. Hoequist 1984, Hoequist & Kohler 1986 und Köhler 1986). Dabei lassen sich Beeinflussungen, die auf das Fo-Niveau zurückgehen, von solchen Wirkungen unterscheiden, die auf die Ausschöpfung des Tonumfangs (pitch range) zurückzuführen sind (vgl. Kohler (1986: 133ff). Die in der Literatur immer wiederkehrenden Beobachtungen werden folgendermaßen resümiert: A higher Fo level cues a faster, a lower Fo level a lower speed, in relation to some medium reference. (Kohler 1986: 134) It [...] turned out that monotone utterances were heard to sound faster than normal ones [...]. This finding can be related to the results of Lehiste (1976) and Hoequist (1984). Both found an influence of a changing Fo pattern on the perception of duration: a changing Fo pattern gives a slower impression than a flat pattern. (den Os 1985: 132)

Aber nicht nur die Ausdehnung des Tonumfangs, d.h. Anwesenheit bzw. Abwesenheit von signifikanten Fo-Veränderungen22, spielt bei der Geschwindigkeitswahrnehmung eine wichtige Rolle. Rietveld & Gussenhoven (1987) konnten zeigen, daß auch die Komplexität der FoKontur Einfluß auf die Sprechgeschwindigkeitswahrnehmung nimmt. Dieser Effekt wird auf die Wirksamkeit einer "tone linking"-Regel (vgl. Gussenhoven 1985, 1988 sowie Uhmann 1991: Kap. 2.4.3) zurückgeführt, die das letzte tonale Element eines komplexen Akzenttons dann tilgt, wenn ein weiterer Akzentton folgt. In den Intonationskonturen des Lesetexts zeigt sich der folgende Zusammenhang: Die Abschnitte, die als schneller perzipiert werden, zeigen eine vergleichsweise flache Fo-Kontur mit weniger FQ-Veränderungen im Bereich der akzentuierten Silben. Die Intonationsphrase (7b) 22

Was für die Akzentwahrnehmung eine signifikante FO-Veränderung ist, hängt von drei Faktoren ab. Ein Faktor ist der absolute Tonumfang: Vgl. u.a. Beckmann (1986), Rietveld· & Gussenhoven (1985) zum Niederländischen, Hasegawa & Hata (1992) zum Englischen und Japanischen sowie Kohler (1990) und Altmann et al. (eds.) (1989) zum Deutschen. Daneben spielt aber auch die Positionierung innerhalb der Intonationsphrase eine wichtige Rolle, da aufgrund der Deklination für die Perzeption von späten Akzenten geringere FO-Veränderungen erforderlich sind als fur frühe: Vgl. u.a. Ladd (1990a) sowie zur Deklination van den Berg et al. (1992), Cohen, Collier & 't Hart (1982), Ladd (1984), (1988), (1993), Terken (1991), (1993) sowie die kontroverse Debatte zwischen Lieberman et al. (1985), Lieberman (1986) und 't Hart (1986). Der dritte Faktor betrifft die Wahrnehmung von Akzentfolgen: Vgl. Gussenhoven & Rietveld (1988) und Ladd et al. (1994).

202 (Fig. I) mit der Verlangsamung der Sprechgeschwindigkeit auf den letzten beiden Silben zeigt diesen Zusammenhang besonders deutlich. (7b) (Figur I)

*^ s

^

Γ

der Festungswer ke imJahre achzehnhunderteinenachzig

Im Vergleich zu den langsameren Passagen scheint es jedoch (im Gegensatz zu Kohlers Ergebnissen) so zu sein, daß schnelle Passagen eher mit niedrigem Fo-Verlauf produziert werden. Diese Diskrepanz zu den Ergebnissen von Kohler könnte auf seine artifizielle Testsituation zurückzuführen sein, denn Sprechgeschwindigkeitsveränderungen wurden von ihm über Logatome, isolierte Wörter und kontextungebundene Sätze gemessen. Da jedoch das hier diskutierte Material ebenfalls sehr beschränkt ist, muß auf eine abschließende Beurteilung verzichtet werden.

4.1.6 Resümee Für die Perzeption der Sprechgeschwindigkeit haben sich vor allem die folgenden phonologischen Faktoren als relevant erwiesen: Erstens: Die Dichte der Silben pro Zeiteinheit (Dichte I) sowie die Dichte der akzentuierten Silben pro Zeiteinheit (Dichte Π). Die Kombination dieser beiden Komponenten beeinflußt den internen Aufbau der Intonationsphrase, indem sie metrische Füße (vgl. Kapitel 3.2.1) von unterschiedlicher Komplexität aufbaut. Eine niedrige Dichte Π-Rate kombiniert mit einer hohen Dichte I-Rate erhöht die Anzahl unakzentuierter Silben im Fuß. Diese Silben unterliegen Kompressionseffekten, die für die Perzeption von erhöhter Sprechgeschwindigkeit aufgrund einer negativen Korrelation von Silbenanzahl und Silbendauer verantwortlich sind. Je mehr unakzentuierte Silben zu einem metrischen Fuß zusammengefaßt werden, umso stärker

203 sind die Kompressionseffekte. 23 Experimentelle Untersuchungen zur Produktion und Perzeption von Sprechgeschwindigkeitsveränderungen an der Universität Kiel (vgl. Kohler et al. 1981, Kohler 1983, Hoequist 1984, Hoequist & Kohler 1986) konnten diesen Effekt nachweisen. Aber die Analyse von natürlichen Konversationen hat gezeigt, daß (im Gegensatz zu den experimentell gestützten Ergebnissen der Arbeitsgruppe in Kiel) diese Kombination von Dichte I und Dichte II nicht die einzige ist, die mit der Perzeption erhöhter Sprechgeschwindigkeit korreliert. Auch die Kombination von hoher Dichte I und hoher Dichte Π ist ein phonetisch-phonologisches Korrelat erhöhter Sprechgeschwindigkeit. In diesem Fall sind die resultierenden metrischen Füße wenig komplex. Eine niedrige Sprechgeschwindigkeit wird hingegen perzipiert, wenn ein Sprecher wenige Silben, d.h. eine geringe Dichte I-Rate mit einer hohen Dichte Ii-Rate kombiniert. Die Übersicht (10) zeigt die theoretisch möglichen vier Kombinationstypen, die neben einer unmarkierten Kombination von Dichte I und Dichte Π als markierte Formen entstehen können: (10) Produktion

Perzeption

hoch (+)

Dichte I (Silb./Sek.)

+ -

'schnell'

+ +

unma rkiert - -

'langsam'

- +

niedrig(-)

hoch (+)

Dichte Π (akz. SilbVSek.)

Zweitens: Die Intonationsphrase ist die maximale Meßeinheit, in der Dichte I und Dichte II berechnet werden. Damit wird die Möglichkeit eröffnet, kurzfristige, funktional relevante Veränderungen der Sprechgeschwindigkeit zu analysieren, indem umliegende Intonationsphrasen als Vergleichswert herangezogen werden. Drittens: Auch eine segmentale Komponente, nämlich die Unterscheidung zwischen der Anzahl der phonologischen und der phonetischen Silben (vgl. den Os 1985), wird für die Analyse herangezogen. Diese Unterscheidung ist deshalb wichtig, weil gerade Silbentilgungen

23

Die Kompressionseffekte innerhalb des Fußes wurden im Rahmen der Diskussion des Isochroniekonzeptes überprüft. Vgl dazu Auer & Uhmann (1988) sowie Kapitel 3.2.

204 als Resultate von Assimilation oder anderen realisationsphonologischen Prozessen 24 und Allegro-Regeln25 Einfluß auf die Perzeption erhöhter Sprechgeschwindigkeit haben. Wenn ein Sprecher zum Beispiel nur ziehungsweise statt der Standardrealisation beziehungsweise produziert, wird dies ein weiterer Faktor sein, der bei seinem Rezipient den Eindruck von schnellerem Sprechen unterstützt. Zusätzliche Interpretationen wie 'casual speech' sind natürlich ebenfalls möglich. Für perzeptiv schnelle Intonationsphrasen, die Silbentilgungen aufweisen, wird daher die Anzahl der phonologischen Silben, die bei einer standardsprachlichen Lento-Sprechweise produziert worden wären, berechnet. Damit wird berücksichtigt, daß Sprecher inhaltlich 'Gleiches' in weniger Zeit produzieren können - ein Effekt, der bei der Zählung der phonetischen Silben unberücksichtigt bleiben würde. Die Zählung der phonologischen Silben ist allerdings nicht unproblematisch. Das Problem verbirgt sich hinter dem Terminus Standardsprache und betrifft die Unterschiede zwischen Hochdeutsch und den zahlreichen dialektalen Varietäten. Die beträchtlichen Differenzen zeigen sich nämlich auch auf der Silbenebene. So ist das Partizip Perfekt von gehen im Standarddeutschen gegangen aber gangen im Bairischen und in anderen süddeutschen Dialekten. Die l.Pers./Sing.Präs. des Verbs haben lautet ich habe im Standarddeutschen aber i(ch) hab in süddeutschen Dialekten. Damit kann das Auftauchen von hab in einem Transkript nicht allein auf der Oberfläche und unter Rekurs auf die standardsprachliche Lento-Realisierung als zweisilbiges ha.be gezählt werden, wenn die Sprecher eine Variante süddeutscher Dialekte sprechen, denn in diesem Fall ist die einsilbige Realisierung weder in Produktion noch Perzeption ein Indiz für erhöhte Sprechgeschwindigkeit. Wenn jedoch ein Sprecher des Standarddeutschen, der bisher ich habe produziert hat, zu ich hab überwechselt, liegt tatsächlich eine realisationsphonologische Silbentilgung vor, und die Anzahl der virtuellen Silben der Lento-Realisation ist ein adäquateres Korrelat für die perzipierte Sprechgeschwindigkeit. Viertens: Die Fo-Kontur, bzw. die An- und Abwesenheit von Akzenttönen wird berücksichtigt. Fünftens:

Auch Pausen, und damit die Unterscheidung von Artikulationsgeschwindigkeit

und Sprechgeschwindigkeit, sind für die Perzeption von Geschwindigkeitsveränderungen relevant. Dabei wird als Pause nicht nur die Abwesenheit von Vokalisation (Schweigen) gewertet, sondern auch gefüllte (ähm, äh etc.) Pausen und Silbendehnungen, die über die Standardlängen der jeweiligen Silben hinausgehen). Darüberhinaus wird zwischen intonationsphraseninternen und intonationsphrasenexternen Pausen unterschieden.

24

25

Andere Phänomene wie Vokalkürzung, Assimilation, Elision etc. sind vermutlich ebenfalls relevant, aber werden in die folgenden Analysen nicht systematisch miteinbezogen. Vgl. dazu u.a. Kohler (1995 2 : Kap. 6.3). Vgl. Dressier, W. (1975) und Dressler, W. et al. (1976).

205

4.2 Kontextualisierungsfunktionen von Sprechgeschwindigkeitsveränderungen Ohne der Analyse dieses Abschnitts vorzugreifen, möchte ich schon an dieser Stelle darauf hinweisen, daß die zwei Realisierungsvarianten für perzeptiv schnelles bzw. langsames Sprechen nicht auf die Irrelevanz des Parameters Dichte II hinweisen. Denn die aus hoher Dichte I mit niedriger Dichte II resultierende erhöhte Sprechgeschwindigkeit kann perzeptiv von der aus hoher Dichte I und hoher Dichte II resultierenden unterschieden werden. Darüberhinaus ist auch nicht zu erwarten, daß funktionale Äquivalenz vorliegt. Ich werde nun zeigen, daß diese vier Typen nicht nur theoretische Konstrukte sind, sondern daß zumindest drei von ihnen spezifizierbare, textgrammatische Kontextualisierungsfunktionen übernehmen. Das Problem, das in diesem Abschnitt untersucht werden soll, ist nun nicht mehr die Beschreibung der phonetisch-phonologischen Basis von Sprechgeschwindigkeitsveränderungen, sondern die Frage, ob und wie Konversationsteilnehmer die beschriebenen Veränderungen in systematischer Weise einsetzen, um ihre Äußerungen zu kontextualisieren und interpretierbar zu machen und um den maximalen Spielraum, der in diesem Bereich zur Verfügung steht, so zu nutzen, daß von der Entwicklung einer Textgrammatik gesprochen werden kann. Datengrundlage für diese Analysen sind daher nicht mehr monologische Vorlesetexte, sondern zwei längere face-to-face Kommunikationen, eine standardnahe 'two-party-Konversation' (China) mit den Sprechern I und Τ sowie eine dialektale 'multi-party-Konversation' (Kurzsichtig) mit den Sprechern B, C, L und M. 26 Wieder wurde die Dauer der untersuchten Intonationsphrasen über digitalisierte Werte gemessen. Darüberhinaus wurden für die Sprecher Τ, I und C die Mittelwerte der Sprechgeschwindigkeit (Dichte der phonetischen Silben inklusive intonationsphraseninterner Pausen) sowie Minimal- und Maximalwerte ermittelt:

Durchschnittswerte (mittlere Sprechgeschwindigkeit) ~C: T: 1:

6,29 Silben/Sek. 5,11 Silben/Sek. 4,24 Silben/Sek.

Vergleicht man diese von Barden (1991: 1 Iff) ermittelten Werte mit den Werten in Abschnitt 4.1.1, so zeigt sich, daß die Sprecherin C mit 6,29 Silben pro Sekunde deutlich über den z.B. von Meinhold (1972) ermittelten Werten liegt. Dieser hohe Wert entspricht dem auditiven

Der Sprecher M, der sich nur selten äußert, spricht Standarddeutsch, während die drei anderen Konversationsteilnehmer 'Konschtanzerisch' sprechen. Zur Phonologie der Konstanzer Stadtsprache vgl. Auer (1990b) sowie zum Lexikon Auer & Joos (1988). Zum Problem der Dichotomie 'Dialekt' vs. 'Standard' sowie zu Formen und Funktionen des 'Code-Shifting' in natürlichen Konversationen vgl. Auer (1986b).

206 Eindruck, daß C sehr schnell spricht. Die Sprecherin Τ erreicht einen Durchschnittswert von 5,11 Silben und I einen Durchschnittswert von 4,24 Silben. Da I auch die Sprecherin der Vorlesepassage ist, lassen sich die Werte von spontaner Sprechgeschwindigkeit in natürlichen Dialogen und Vorlesegeschwindigkeit vergleichen: Der in der natürlichen Konversation ermittelte Wert liegt leicht über dem Wert der Vorlesepassage (4,1 Silben/ Sek.). Interessanter sind aber vielleicht die ebenfalls von Barden (1991: 12) ermittelten minimalen und maximalen Sprechgeschwindigkeitswerte27:

C: T: I:

Maximalwert

Minimalwert

11,11 Silben/Sek. 11,29 Silben/Sek. 8,33 Silben/Sek.

2,3 Silben/ Sek. 1,87 Silben/Sek. 1,6 Silben/Sek.

Diese lassen sich für I wieder mit den Sprechgeschwindigkeitsschwankungen in der Vorlesepassage vergleichen. In der schnellsten Intonationsphrase erreicht I einen Wert von 6,6 Silben/Sek., in der langsamsten einen Wert von 3,2 Silben/Sek. Die Schwankungsbreite ist gegenüber dem spontanen Gespräch wesentlich geringer. Darüberhinaus zeigt sich auch der von Lieberman (1963) (vgl. FN 9) beobachtete Effekt, daß in spontanen Dialogen wesentlich höhere Werte erzielt werden als in den als 'schnell' perzipierten Passagen vorgelesener Texte. Die der Analyse zugrundegeigten Tonbänder wurden außerdem fünf Versuchspersonen vorgespielt, die angewiesen wurden, schnelle Passagen durch (#), sehr schnelle durch (##), langsame Passagen durch ein Pluszeichen (+) und sehr langsame durch (++) zu markieren. 28 Für die Perzeption von Sprechgeschwindigkeitsveränderungen scheint es besonders relevant zu sein, ob Sprecher innerhalb eines komplexen, aus mehreren

Redezugkonstruktionseinheiten

(vgl. Kap. 2.4.2) bestehenden Redezugs ihre Sprechgeschwindigkeit verändern oder ob Sprechgeschwindigkeitsveränderung und Sprecherwechsel zusammenfallen. Im Fall von redezuginternen Geschwindigkeitsveränderungen sind es, wie in der Zusammenfassung in Abschnitt 4.1.6 betont, die relationalen Veränderungen der Sprechgeschwindigkeit, die perzipiert werden. Eine Intonationsphrase wird dann als 'schnell' perzipiert, wenn die sie umgebenden

Diese Werte basieren auf den phonetischen Silben inklusive phraseninterner Pausen. Für die Sprecherin C habe ich allerdings einen leicht höheren Wert als Barden ermittelt, da in der relevanten Intonationsphrase (vgl. Bsp. (49) Zeile 05) sechs und nicht nur fünf Silben realisiert werden. Die Messungen und die Perzeptionserhebungen wurden von Barden (1990 Ms, 1991) durchgeführt. Dort wird auch die Frage diskutiert, ob und inwieweit Perzeption und Messung korrelieren. Von den vier theoretisch möglichen Kombinationen (Perzeption und Messung stimmen überein; Perzeption und Messung widersprechen sich; Meßdaten weisen auf eine Veränderung der Sprechgeschwindigkeit hin, diese wird aber nicht perzipiert; Geschwindigkeitsveränderungen werden perzipiert, lassen sich aber nicht meBphonetisch nachweisen) ist die erste Kombination die häufigste. "Die betreffenden Intonationsphrasen werden immer von mehreren Testpersonen gleich markiert, wobei sich Anfangs- und Endmarkierung leicht (um zwei oder drei Silben) verschieben können" (Barden 1991: 17ff).

207 Intonationsphrasen des gleichen Sprechers eine geringere Sprechgeschwindigkeit aufweisen. Je deutlicher der Unterschied zwischen benachbarten Intonationsphrasen ist, umso stärker wird Veränderung perzipiert. Barden (1991: 19f) weist jedoch daraufhin, daß beim Zusammenfallen von Geschwindigkeitsänderung und Sprecherwechsel die Durchschnittsgeschwindigkeit eine größere Rolle zu spielen scheint.29 Ich werde mich im folgenden vor allem auf redezuginterne Sprechgeschwindigkeitsveränderungen konzentrieren und auch bei Sprecherwechsel möglichst nahe Intonationsphrasen des gleichen Sprechers als Vergleichsbasis heranziehen, da hier die Korrelation zwischen Perception und objektiver Messung am höchsten ist.

4.2.1 Ikonische Funktion Der erste Transkriptausschnitt, der hier vorgestellt werden soll, demonstriert eine Kontextualisierungsfunktion von Sprechgeschwindigkeitsveränderungen, die ich als 'onomatopoetisch' bzw. 'ikonisch' bezeichnen möchte. Die Dauer der Intonationsphraseen (inklusive phraseninterne Pausen) wird wieder in eckigen Klammern angegeben, es folgt der Dichte I-Wert (Silben pro Sekunde) sowie ggf. der Dichte Π-Wert (akzentuierte Silben pro Sekunde). (11) Kurzsichtig 01 C: Des hat mir kein Mensch gsagt 02 ob jetz mein Augapfel zu kurz isch 03 oder ob meine Linse falsch isch (.) 04 es könnt ja au sein 1 die Li(nse) isch falsch 05 B: 1 wo: (.) ja: du musch06 hat des der Augearzt nicht 1 so 07 C: Ipfh 08 Ich 'war bei so me 'Volltrottel 'da, 09 der Tiat mir die 'Gläser da vor "hinglatscht,= 10 =s- aso # ziehungsweise # 'eine 'Volltrotte'lin war des (0.57) 11 ((Seitensequenz, Lachen)) 12 C: Und=ähm (1.31) 13 'jedenfalls -> 14 # die hot=ma da so 'Gläser hinknallt # -> 15 ## Isch 'so besser isch 'so besser## -> 16 ° # un hot mi denn mitme Re'zept wieder rausgschickt #° -> 17 ° # bevor i hab richtig 'gugge ° hab könne. # 0 0 (0.47) 18 Und 'jetz geh i zume 'Richtige (.)

[1.75] 5,1; 1,7 [1.80] 5,5; 1,6 [2.36] [0.60] [0.63] [1.00] [1.06] [1.75] [1.38] [1.83]

3.3 4,7; 9,0; 7,5; 6,8; 7,9; 4,9;

1,5 1,0 1,8 0,5 0,7 1,1

Dieser Zusammenhang zeigt sich nach Barden (1991: 19f) vor allem an der Auswertung des Transkriptes 'Kurzsichtig'. Da C durchgängig schneller spricht als ihre Gesprächspartner, hätten die Versuchpersonen bei der Orientierung an den umliegenden Intonationsphrasen bei jeder Redezugübernahme von C eine Erhöhung der Sprechgeschwindigkeit notieren müssen - was aber nicht der Fall war. Leider krankt dieses interessante Argument an der Tatsache, daB Barden für die Gesprächspartner von C weder Durchschnittswerte noch die exakten Berechnungen der Dichte I- und Dichte Ii-Werte in den benachbarten Intonationsphrasen durchgeführt hat.

208 In diesem Transkriptausschnitt bringt C ihre Unzufriedenheit mit einem Augenarztbesuch zum Ausdruck. Was sie primär an dieser Konsultation auszusetzten hatte, war die Geschwindigkeit, mit der diese Ärztin ihr eine Brille verschrieben hat. C beklagt sich nicht explizit, daß ihr diese Prozedur zu schnell ging. In den Zeilen 14-17 akzeleriert C ihre Sprechgeschwindigkeit jedoch genau an dem Punkt ihrer Geschichte, an dem sie von der Untersuchung berichtet, so daß die Geschwindigkeit, mit der diese ablief, ikonisch über ihre Sprechgeschwindigkeit kontextualisiert wird. Diese Passage wird von allen VPs als schnell perzipiert. Die akustischen Messungen der Silbendichte (Dichte I) bestätigen die Perzeption der Versuchspersonen. Die Passage beginnt mit Intonationsphrasen, die in bezug auf die Sprechgeschwindigkeit unmarkiert sind: Zeile 8 (5,1 Silben/Sek., 1,7 akz. Silben/Sek.), Zeile 9 (5,5 Silben/Sek., 1,6 akz. Silben/Sek.). In den Zeilen 12 und 13 werden 2 bzw. 3 Silben produziert, dies entspricht einer Silbendichte von 3,3 bzw. 4,7 Silben pro Sekunde. Die Silbendichte steigt in den nächsten Intonationsphrasen, Zeile 14 mit 9,0 und Zeile 15 mit 7,5 Silben/Sek., dramatisch an und bleibt mit 6,8 Silben/Sek. in Zeile 16 und 7,9 Silben/Sek. in Zeile 17 bis zum Ende der Schilderung hoch. Am Ende der Intonationsphrase in Zeile 17 gibt es auch die erste intonationsphrasenexterne Pause. In der als schnell perzipierten Passage von Zeile 14 bis Zeile 17 gibt es auch keine phraseninternen Pausen. In Zeile 18 reduziert C ihre Sprechgeschwindigkeit wieder: Mit 4,9 Silben/Sek. erreicht sie einen Wert, der noch ein wenig unter der Silbendichte der Zeilen 08 bis 09 liegt. Die Messungen der Dichte I geben jedoch keinen Aufschluß darüber, warum die Versuchspersonen die Zeile 14 als besonders schnell transkribiert haben, da die Silbendichte dieser Intonationsphrase sogar noch etwas niedriger als die der umliegenden Intonationsphrasen ist. Betrachtet man jedoch auf der Basis der akzentuierten Silben die Dichte Π-Werte, so zeigt sich, daß Zeile 14 hier deutlich von den umliegenden Intonationsphrasen abweicht. Zeile 14 hat einen Dichte Π-Wert von 1,8 akzentuierten Silben/Sek., während in Zeile 15 und Zeile 16 nur 0,5 akzentuierte Silben/Sek. bzw. 0,7 akzentuierte Silben/Sek. erreicht werden. Die Kontextualisierung der erhöhten Geschwindigkeit ist an dieser Stelle der Erzählung auch besonders relevant. Wenn C in Zeile 14 die Geschwindigkeit nämlich nicht erhöht ## Isch 'so besser isch 'so besser ## sondern reduziert hätte++ Isch 'so:: besser? (Pause) isch 'so:: besser? ++, dann hätte sie nicht 'schnelle Abfertigung' sondern das Gegenteil, nämlich 'eine-sich-Zeit-nehmendeÄrztin' kontextualisiert. Bei dieser Interpretation der Sprechgeschwindigkeit muß man allerdings noch darauf hinweisen, daß die in diesem Transkriptausschnitt mit der erhöhten Geschwindigkeit verbundene negative Bewertung nicht über die akzelerierte Sprechgeschwindigkeit kontextualisiert wird, denn hohe Geschwindigkeit kann natürlich auch mit positiven Bewertungen verbunden sein. Ihre negative Einschätzung macht C durch Lexeme wie Volltrottelin und hinknallen deutlich.

209 4.2.2

Selbstreparaturen

Eine weitere, eventuell ebenfalls ikonisch-natürliche Kontextualisierungsfunktion übernimmt die Erhöhung der Sprechgeschwindigkeit bei der Markierung von Selbstreparaturen

(vgl.

Schegloff, Jefferson & Sacks 1977). Selbstreparaturen wurden bereits in Kapitel 2.4.3 diskutiert. Während dort bestimmte syntaktische Strukturen, die Mittelfeldentleerungen, im Mittelpunkt des Interesses standen, wird es hier darum gehen zu zeigen, daß die zeitliche Organisation von Reparaturen Einfluß auf ihre Ausführung haben kann. Wird nämlich die Durchführung einer Reparatur notwendig, so folgt daraus in der Regel, daß eine laufende Aktivität unterbrochen und so lange nicht fortgesetzt wird, bis der Reparaturvorgang abgeschlossen ist. 30 Da 'Fehler' aller Art immer und überall auftreten können, müssen Konversationsteilnehmer ständig damit rechnen, daß Reparaturen erforderlich werden und daß die erforderlichen Reparaturen jeden Aspekt der Sprachproduktion und Sprachperzeption betreffen können: Any of the systems and contingencies implicated in the production and reception of talk - articulatory, memory, sequential, syntactic, auditory, ambient noise, etc. can fail. Aspects of the production and analysis of talk that are rule-governed can fail to integrate. In short, the exchange of talk is indigeniously and exogenously vulnerable to trouble that can arise at any time. (Schegloff 1979:269)

Die ständige Möglichkeit, daß Reparaturen initiiert und durchgeführt werden, macht es erforderlich, daß die Interaktionsteilnehmer als Produzenten und Rezipienten nach möglichen Reparanda Ausschau halten31 und daß sie sich auch die Initiierung von Reparaturen anzeigen, so daß der Rezipient erkennen kann, welcher Teil des gerade in Vollzug befindlichen Redezugs korrigiert, präzisiert, modifiziert oder ergänzt werden soll. Als Indikatoren für eine selbstinitiierte Selbstreparatur wurden in Kapitel 2.4.3 Abbrüche, Pausen oder Dehnungen, Reparaturpartikeln wie äh und ähm sowie Ausdrücke wie oder, also oder beziehungsweise

identifiziert (vgl. auch Rath 1975: 8). Manchmal weisen nur die

30

Reparaturen, die über Seitensequenzen zur Unterbrechung der Aktivität führen, wurden von Jefferson (1972) analysiert. In Jefferson (1983b/1987) findet sich hingegen eine Analyse von 'en passant'-Korrekturen (embedded correction), in denen das Reparandum eines Gesprächspartners durch eine korrigierte Version in dem Folgebeitrag des Rezipienten ersetzt wird. Eigene Erfahrungen mit dieser 'gesichtsschonenden' Variante weisen allerdings auf Begrenzungen ihrer Tauglichkeit hin. So ist mir noch nie eine 'en passant'-Korrektur gelungen, in der das [ra.di.tfi.jo] meiner Gemüseverkäuferin in ihren Folgeredezügen ebenfalls als [ra.di.kjs ] realisiert worden wäre.

31

Das Ausschauhalten nach Reparanda sowie ihre Beseitung ist für die Psycholinguistik bei der Erforschung der Interaktion von Sprachproduktion und Selbstüberwachung der Sprachproduktion von herausragender Bedeutung. Vgl. dazu Levelt (1989: Kap. 12), der aus dieser Perspektive eine wichtige Ergänzung zu der konversationsanalytisch orientierten Beschreibung von Reparaturorganisation liefert. So spielt psycholinguistisch die Unterscheidung zwischen Korrekturen und Reparaturen (vgl. Kap. 2.4.3 FN 43), bei Levelt (1989: 459) "error repairs" and "appropriateness repairs", eine wichtige Rolle. Vgl. aber auch Schegloff (1991: 54ff) zu den Besonderheiten der Reparaturorganisation durch den quasi-monologischen Versuchsaufbau.

210 verwendeten Reparaturindikatoren darauf hin, daß der Sprecher ein 'Problem' bei der Produktion seiner Äußerung hatte: (12) China 4 01 I: Sie meinte sie hat (0.2) äh ge'nug stu'diert und so, In einem solchen Fall kann der Rezipient nach der Reparaturpartikel äh, die in diesem Fall nur eine Art von 'Fehlalarm' auslöst, die lineare Dekodierung des Redezugs fortsetzen. 32 Etwas anders stellt sich die Verarbeitung der Reparatur in den folgenden Beispielen dar: (13) China 19 - > 01 I: und I inner I 'Zug- (0.57) inner=inner 'Bahnhofsschlange 02 Τ: I "hm" I 03 I: hab ich das 'auch mal gesehn, (0.58) (14) Hundertfünfzig 8 01 X: Aber: irgendwie (.) die Tatsache daß man 'weiß, 02 daß es fürs Examen is (.) -> 03 verdirbt einem: :=sel- sämtliche Freude (15) Hundertfünfzig 28 01 X : vielleicht könn=wer das ja auch machen -> 02 wenn ich in K- in Hamburg bin (16) Hundertfünfzig 12 -> 01 X: Im Geben- (.) im Gegensatz zu 'Kiel und 'Koblenz 02 is das doch 'eigentlich wirklich direkt vor der 'Tür sozusagen (17) China 50 -> 09 T: man schickt dann die 'zweite Frau- äh=die='erste=Frau meistens weg, (18) Seglerinnen 01 A: des 'scheint aber in Frankreich 'üblich zu sein. 02 die sind völlig un(..)selbständig 03 des war ja: (.) im 'Grunde genommen auch bei der (1.0) äh (.) - > 04 bei der Ni'cole der Fall ne? (19) (aus Eikmeyer et al. 1995: 124) 01 X : und vorne drauf liegt ein grünes äh ein blaues Dreieck

In bezug auf das Reparandum können selbstinitiierte Selbstreparaturen an drei sequentiell verschiedenen Positionen durchgeführt werden: Im gleichen Redezug wie das Reparandum, innerhalb des redezugübergaberelevanten Raums und in dem dritten Redezug, der auf den Redezug mit dem Reparandum folgt. Vgl. dazu Schegloff, Jefferson & Sacks (1977: 366) sowie Kapitel 2.4.3.

211 (20) Hundertfünfzig 18 01 C: " Charlotte brauch was (solides) Nettes 02 was mich zum 'Arbeiten anhält I (...) 02 -> 03 I der arbeitet jeden Morgen bis- (.) jeden Tach bis um elf (21) (aus 01 -> 02

die Barschecks gegebenhat öhm die hat mir damals gesagt öhm

An einer bestimmten Stelle unterbricht der Sprecher seinen Redezug inmitten des Reparandums. 33 Nach der Reparaturindizierung kann die lineare Dekodierung nicht wie in Beispiel (12) einfach fortgesetzt werden, sondern ein Teil der schon produzierten Äußerung wird retrospektiv zum Reparandum, weil dieser im Anschluß an die Reparaturinitiierung durch einen paradigmatisch äquivalenten anderen Ausdruck ersetzt wird. Das folgende Schaubild (22) mit dem zum Zweck der Darstellung etwas vereinfachten Redezug zeigt die einzelnen Schritte bei der Entdeckung, Initiierung und Durchführung der Reparatur. (Das Reparandum wird durch Kapitälchen und die Reparatur durch Schrägstriche markiert.): (22) syntaktische

Schleife

und in=ner 'ZUG^O.57) j/in=ner=in=ner 'Bahnhofsschlange/1

/

i

V " Reparatur

Reparandum

Reparaturindizierung

Ein Hinweis darauf, ob und wenn ja welchen Regeln diese Wiederholungen folgen, findet sich in der konversationsanalytischen Literatur nicht. Schegloff (1979: 278) beschränkt sich auf die lapidare Bemerkung: "It is common for same-turn repair to repeat a bit of the talk preceding the 33

In den Transkriptausschnitten (43 - 46) erfolgt die Selbstunterbrechung innerhalb der Wortgrenzen des Reparandums. Nach Levelt (1989: 481) handelt es sich um Se\bs\korrekturen (vgl. FN 31), d.h. ein bestimmtes Item Zugfschlange) wird durch ein anderes Bahnhofsschlange ersetzt, für die diese Struktur der Selbstunterbrechung typisch sein soll. Selbstkorrekturen im engeren Sinne liegen aber auch in den Beispielen (47), (49) und (50) vor.

212 repairable, (...)." Damit bleibt aber eine entscheidende Frage unbeantwortet, nämlich die welches "bit of the talk" wiederholt werden kann oder muß. Da jedoch in diesem Kapitel die Reparaturphonologie und nicht die für die Wohlgeformtheit dieser syntaktischen Wiederholungsschleife verantwortliche Reparatursyntax diskutiert werden soll, möchte ich mich hier auf die Diskussion einiger weniger syntaktischer Aspekte beschränken; die Argumentation folgt dabei im wesentlichen Uhmann (1996b, 1997). 4.2.2.1 Reparatursyntax In der Literatur zur Reparatursyntax 34 ist oft beobachtet worden, daß Sprecher bei der Durchführung ihrer Selbstreparaturen offensichtlich Phrasen- oder Konstituentengrenzen beachten, indem sie die Durchführung der Reparatur immer an einer solchen Grenze beginnen. Es könnte also die folgende elementare Regel angenommen werden: (23) Konstituentenregel Beginne die Reparatur immer an einer syntaktischen Konstituentengrenze. Diese Regel verbietet unter anderem Reparaturen wie (24): (24) *Alle Arbeitgeber äh (.) nehmerinnen sollen um vier den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. Solche Reparaturen finden sich tatsächlich an keiner Stelle des von mir ausgewerteten Datenmaterials. Es scheint, daß unsere Sprachkenntnis uns nicht nur sagt, wie ein grammatisch wohlgeformter Satz auszusehen hat, wir wissen auch, wie eine wohlgeformte Reparatur aufgebaut sein muß. Und wenn die Konstituentenregel Gültigkeit hat, setzt dieses Wissen über wohlgeformte Reparaturen satzgrammatisches Wissen voraus.35 Die Konstituentenregel ist jedoch offensichtlich noch zu schwach. Ihre Beachtung führt, wie die Beispiele (25) bis (28) zeigen, nicht notwendigerweise zu natürlichen Selbstreparaturen: (25) ?Alle Arbeitgeberinnen äh (.) Arbeitnehmerinnen sollen um vier den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (26) ?Alle Arbeitnehmerinnen sollen um vier den zweistündigen äh (.) einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (27) ??Alle Arbeitnehmerinnen sollen um vier den einstündigen Film äh (.) um vier den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. 34

Vgl. u.a. Nooteboom (1980), Levelt (1983, 1989), Hoffman (1991), Kindt (1994a), Kindt & Laubenstein (1991) und Eikmey er et al. (1995).

35

Diese These wird auch von den in FN 34 genannten Autoren vertreten.

213 (28) ??Alle Arbeitnehmerinnen sollen um vier den einstündigen Vortrag äh (.) drei den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. Auch bei geeigneter intonatorischer Realisierung bleiben diese konstruierten Beispiele unnatürlich, eine Intuition, die auch hier dadurch gestützt wird, daß sich entsprechende Fälle in dem von mir analysierten natürlichen Dialogen nicht finden ließen. Ihre Unnatürlichkeit läßt sich im übrigen nicht, wie man vielleicht vermuten könnte, psycholinguistisch, nämlich durch einen zu hohen Verarbeitungsaufwand beim Rezipienten, erklären. Dieser Aufwand ist zwar in (27) recht hoch, aber die Beispiele (25), (26) und (28), die direkt mit der Ersetzung des Reparandums beginnen, sollten leichter zu rezipieren sein. Doch auch diese Beispiele sind nicht wohlgeformt. In Uhmann (1996c, 1997) konnte gezeigt werden, daß der Anfangspunkt der Wiederholung syntaktischen Materials, die für den fraglichen Reparaturtyp charakteristisch ist und durch die man eine Art syntaktische Schleife (vgl. Schaubild 22) bildet, wesentlich durch eine satzgrammatische Kategorie - nämlich die des funktionalen Kopfes36 - bestimmt wird. Nach der Reparaturinitiierung beginnt die Selbstreparatur nicht an irgendeiner Konstituentengrenze, sondern die linke Grenze des "bit of talk", das bei der syntaktischen Schleife wiederholt wird, bildet regelmäßig der die Reparandumphrase direkt c-kommandierende funktionale Kopf. Den Einfluß der funktionalen Köpfe auf die Selbstreparaturen (13) und (15) bis (22) kann man in folgender, oben schon angedeuteter (jedoch noch vorläufiger) Kopfregel festhalten: (Kopfregel) Selbstreparaturen werden präferiert mit der Wiederholung des funktionalen Kopfes begonnen, der das Reparandum unmittelbar c-kommandiert.37 Die Kopfregel wird als Präferenzregel (vgl. dazu Hawkins 1994: 77ff, sowie Kap. 2.1.2) formuliert, um nicht gänzlich auszuschließen, daß sie in natürlichen Dialogen auch verletzt werden kann. Solche Regelverletzungen sollten jedoch nicht nur intuitiv weniger natürlich, sondern auch quantitativ deutlich seltener sein als Selbstreparaturen, die die Kopfregel beachten.

Ein zentrales Prinzip der X-bar-Theorie (vgl. z.B. Haegeman (1994) ist, daß alle Phrasen endozentrisch sind, d.h. Projektionen eines Kopfelements. Als funktionale Köpfe, im Gegensatz zu lexikalischen Köpfen, werden nun solche nicht-komplexen Konstituenten in Kopfposition bezeichnet, die - vereinfacht gesagt grammatische Bedeutung tragen, z.B. die Präposition in einer P(räpositional-)P(hrase) oder der Artikel in einer Nominalphrase, die deshalb eigentlich eine D(eterminator-)P(hrase) ist. Für alle funktionalen Köpfe gilt darüberhinaus, daB sie ein obligatorisches Komplement und einen fakultativen Spezifikator haben. C-Kommando wird wie üblich definiert: X c-kommandiert Y, wenn Y Teil einer Schwesterkonstituente von X ist; unmittelbares c-Kommando besteht, wenn zwischen X und Y kein weiteres c-kommandierendes Element interveniert.

214 Die Beispiele (25), (26) und (28) verletzen die Kopfregel, weil dort nur die Reparanda, nicht jedoch die funktionalen Köpfe der DPs bzw. der PP in die syntaktische Wiederholungsschleife mit einbezogen werden. In (27) wird die Kopfregel deshalb verletzt, weil die Reparaturdurchführung zwar mit der Wiederholung eines funktionalen Kopfes (der Präposition um) beginnt, es sich jedoch nicht um den funktionalen Kopf handelt, der das Reparandum Film unmittelbar c-kommandiert. - Eine Beseitigung dieser Verstöße gegen die Kopfregel macht die Beispiele deutlich natürlicher: (25) ?Alle Arbeitgeberinnen äh (.) Arbeitnehmerinnen sollen um vier den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (25') Alle Arbeitgeberinnen äh (.) alle Arbeitnehmerinnen sollen um vier den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (26) ?Alle Arbeitnehmerinnen sollen um vier den zweistündigen äh (.) einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (26') Alle Arbeitnehmerinnen sollen um vier den zweistündigen äh (.) den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (27) ??Alle Arbeitnehmerinnen sollen um vier den einstündigen Film äh (.) um vier den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (27') Alle Arbeitnehmerinnen sollen um vier den einstündigen Film äh (.) den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (28) -Alle Arbeitnehmerinnen sollen um vier den einstündigen Vortrag äh (.) drei den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. (28') Alle Arbeitnehmerinnen sollen um vier den einstündigen Vortrag (.) äh um drei den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. Ein weiterer erfreulicher Effekt der Kopfregel ist, daß ihre Einhaltung stets die der Konstituentenregel zur Folge hat, da funktionale Köpfe immer an syntaktischen Konstituentengrenzen stehen. Die Postulierung der Konstituentenregel als eigenes Prinzip der Reparaturorganisation wird also durch die Kopfregel überflüssig. Doch auch wenn die Kopfregel beachtet wird, können noch inakzeptable Strukturen entstehen, wie (29) zeigt: (29) *Alle Arbeitnehmerinnen sollen um vier den einstündigen Vortrag äh (.) um drei Mutterschutz in der Arbeitswelt besuchen. Damit solche diskontinuierlichen Strukturen nicht entstehen, müssen alle auf das Reparandum nachfolgenden Konstituenten bis zu dem Punkt, wo unterbrochen wurde, wiederholt werden. Das muß in einer zusätzlichen Regel festgehalten werden:

215 (Regel zur Vermeidung von Lücken) Zur Vermeidung diskontinuierlicher Strukturen müssen alle auf das Reparandum folgenden Konstituenten bis zum Unterbrechungspunkt wiederholt werden. Die Ausdehnung der Wiederholung ist damit abhängig davon, wann das Reparandum vom Sprecher 'entdeckt' wird. Besteht zwischen Produktion und Endeckung nur eine kurze Distanz, weil der Abbruch noch innerhalb der minimalen Reparandumphrase geschieht, bleibt die syntaktische Schleife auf diese Phrase beschränkt. Hat der Sprecher hingegen bereits die minimale Reparandumphrase verlassen, wenn er die Reparatur initiiert, so müssen alle Konstituenten in die syntaktische Schleife einbezogen werden, die nach dem Reparandum und bis zum Beginn der Reparatur bereits produziert wurden: (29') Alle Arbeitnehmerinnen sollen um vier den einstündigen Vortrag (.) äh um drei den einstündigen Vortrag Mutterschutz in der Arbeitswelt besuchen. Zur Erklärung der besprochenen Daten müssen also zwei Regeln angenommen werden - ein nicht ganz befriedigendes Resultat, da eine Erklärung mit nur einer Regel (etwa einer geeigneten Präzisierung der Begriffe "Wiederholung" bzw. "syntaktische Schleife" in der Kopfregel) natürlich attraktiver wäre. So wie die Kopfregel bisher formuliert ist, ergibt sich jedoch ein weiteres Problem, nämlich in Beispielen wie (30) bis (33), in denen das Reparandum selbst ein funktionaler Kopf ist: (30) China 41 01 T: Ich muß dir heut abend auch noch die Adresse durchgeben 02 ich hab die verschlampt 03 aber die Gitta in Hamburg hat sie -> 04 die hol (0.3) ich- ruf ich heut abend an (0.47) (31) Aktienberatung -> 01 Μ aber 'son 'Wert liegt nat- legt natürlich am ersten März 'zu. (32) China 31 01 T: und die 'reden anscheinend noch en Portu'giesisch, (0.77) -> 02 das ver'wandt is: oder das: (0.26) ja (0.21) äh-> 03 das halt 'eher 'dem Portugiesisch ähnelt, (0.31) 04 1 vom 1 'siebzehnten Jahr'hundert; 05 I: Ihm 1 06 T: als die 'aus (0.59) äh 'fuhren nach Ma'laysia;= 07 als dem 'heutigen Portugiesisch. (33) (aus Hoffmann 1991: 103, adaptierte Notation) 01 X: äh diese Medikamente -> 02 die machen-die verändern die Atmung und das Sprechen etwas

216 In diesen Fällen haben Sprecher offensichtlich zwei Optionen38: Sie können entweder, wie in (30) und (31), die syntaktische Schleife bis zum zu reparierenden Kopf der Reparandumphrase ausdehnen, sie können aber auch, wie in (32) und (33), die fakultative Spec-Position des funktionalen Kopfes (vgl. FN 36) in die syntaktische Schleife miteinbeziehen. Die syntaktische Äquivalenz der beiden Optionen läßt sich anhand der jeweils anderen Möglichkeit in den Beispielen (28') bis (31') demonstrieren: (30) (30')

die hol (0.3) ich- ruf ich heut abend an die hol (0.3) ich- die ruf ich heut abend an

(31) (31')

aber 'son IVert liegt nat- legt natürlich am ersten März 'zu. aber 'son 'Wert liegt nat- son Wert legt natürlich am ersten März 'zu

(32)

und die 'reden anscheinend noch en Portugiesisch, (0.77) das ver'wandt is: oder das: (0.26) ja (0.21) äh- das halt 'eher 'dem Portugiesisch ähnelt, und die 'reden anscheinend noch en Portugiesisch, (0.77) das ver'wandt is: oder (0.26) ja (0.21) äh- halt 'eher 'dem Portugiesisch ähnelt,

(32') (33) (33')

die machen- die verändern die Atmung und das Sprechen etwas die machen- verändern die Atmung und das Sprechen etwas

Alle Versionen scheinen mir gleichermaßen natürlich und akzeptabel zu sein. Wenn dies so ist, muß die Kopfregel so liberalisiert werden, daß sie neben der Wiederholung des den funktionalen Kopf realisierenden Lexems auch die des Spec-Materials erlaubt, dessen Präsenz syntaktisch von der dieses Kopfes abhängt39, wie etwa der Vorfeld-Konstituente, die von der Präsenz des die Verbzweitstellung induzierenden Kopfes abhängt. Entsprechend wäre die Kopfregel wie folgt zu erweitern: (Erweiterte Kopfregel) (a) Selbstreparaturen, die nicht selbst einen funktionalen Kopf betreffen, werden präferiert mit der Wiederholung des funktionalen Kopfes begonnen, der das Reparandum unmittelbar c-kommandiert. (b) Ist das Reparandum selbst ein funktionaler Kopf, wird die Selbstreparatur präferiert mit diesem (optional einschließlich seines Spezifikators) begonnen. 38

Ich gehe hier von der verbreiteten Auffassung aus, daß das Finitum in Verbzweitstellungssätzen in der Kopfposition einer C(omplementizer-)P(hrase) sitzt, also in der Position, in der in Verbletztstellungssätzen die Konjunktion ist - eine Position, die in Verbletzt-(Relativ)sätzen im Standarddeutschen unsichtbar ist, vgl. auch kap. 2.1. Nach anderen Analysen (etwa nach Jacobs 1996a) ist die Position des Finitums bei Verbzweitstellung die Kopfposition einer Satzmodus-Projektion. Wir müssen hier nicht zwischen diesen Vorschlägen entscheiden, da es ja nur darauf ankommt, daß das Finitum in solchen Sätzen in einer funktionalen Kopfposition sitzt.

39

Diese Option scheint darüberhinaus auch in Beispielen, in denen nicht-funktionale Konstituenten repariert werden, zu intuitiv akzeptablen Ergebnissen zu führen: Die ruf ich morgen äh (.) ruf ich heut abend noch an/Die ruf ich morgen äh (.) die ruf ich heut abend noch an. Da solche Selbstreparaturen in dem von mir untersuchten Alltagsdialogen nicht gefunden werden konnten, muß die weitere Forschung zeigen, ob auch der Teil (a) der Erweiterten Kopfregel entsprechend Teil (b) liberalisiert werden kann und in welchem Umfang vielleicht weitere Faktoren (z.B. der Umfang des Spezifikators) eine Rolle spielen.

217 Teil (b) der Erweiterten Kopfregel kommt auch dann zur Anwendung, wenn der zu reparierende Kopf der einer PP (wofür ich allerdings keine belegten Daten gefunden habe) oder einer DP wie in (34) und (35) ist: (34) Verhebt Ol X: ahja (.) und=dann kommst du auch so schnell nicht wieder? (.) -> 02 H: ja also die nä- (.) den nächsten Monat nich (35) (aus Hoffmann 1991: 108) Ol X: also der Kinder warn na-> 02 die Kinder warn natürlich η Ansatzpunkt Da die Spec-Position bei solchen PPs und DP leer ist, setzt die syntaktische Schleife hier bei der Wiederholung des funktionalen Kopfes an. (Beispiel (34) ist allerdings insofern nicht ganz eindeutig zu analysieren, weil das Reparandum auch ein zum Zeitpunkt der Reparaturinitiierung zwar geplantes, aber noch nicht realisiertes Nomen sein könnte, so daß die möglicherweise geplante NP in der nächsten Zeit nach Teil (a) der Erweiterten Kopftegel repariert wird. Diese Ambiguität stellt aber die Gültigkeit der Kopfregel nicht in Frage.) Trotz der diskutierten und möglicherweise weiterer Detailprobleme scheint die Erweiterte Kopfregel anderen einschlägigen Vorschlägen in der Literatur überlegen zu sein (vgl. dazu ausführlich Uhmann 1996c, 1997). Sie erklärt auf elegante und korrekte Weise Reparaturmuster, die in natürlichen Dialogen besonders häufig verwendet werden bzw. schließt solche aus, die praktisch nie vorkommen und auch intuitiv nicht vollständig wohlgeformt erscheinen. Darüberhinaus erlaubt sie es vielleicht eher als andere vorgeschlagene Regeln, die Ausdehnung der syntaktischen Schleife psycholinguistisch zu motivieren und an Forschungsarbeiten40 zur inkrementellen Verarbeitung anzuschließen. Dies zu zeigen, würde jedoch den Rahmen der vorliegenden Arbeit sprengen. Ich verlasse nun die syntaktische Ebene und wende mich der Reparaturphonologie zu. Ich möchte im folgenden zeigen, daß Sprechgeschwindigkeitserhöhungen geeignet sind, dem Rezipienten Ausdehnung und Umfang der Reparatur anzuzeigen und zusammen mit den Reparaturindikatoren ihre Verarbeitung aber auch ihre Interpretation zu unterstützen.

Die Bedeutung, die der funktionale Kopf für die syntaktische Wohlgeformtheit von Selbstreparaturen spielt, läBt sich z.B. an Hawkins' (1994) Konzept der Mother Nodes anbinden, die bei der Erkennung von Constituent Recognition Domains und damit für die möglichst rasche Verarbeitung der syntaktischen Struktur eines Satzes eine zentrale Rolle spielen. Die Reparatur beginnt nach der syntaktischen Schleife ja mit der Wiederholung des Kopfes, und das ist in der Regel die Konstituente, die als Mutterknoten die Identifizierung der das Reparandum beherbergenden Constituent Recognition Domain erlaubt (vgl. dazu die ausführliche Diskussion von Hawkins Theorie in Kap. 2.1.2).

218 4.2.2.2 Reparaturphonologie Die folgenden Beispiele zeigen, daß selbstinitiierte Selbstreparaturen von Sprechgeschwindigkeitserhöhungen41 begleitet sein können: (17) China 50 -> 01 T: man schickt dann die 'zweite Frau äh=#die='erste=Frau# meistens weg, [2.62] 5,7 02

in irgend nen (0.3) en 'Haus in der Um'gebung

(30) China 41 01 T: Ich muß dir heut abend auch noch die Adresse durchgeben 02 ich hab die verschlampt 03 aber die Gitta in Hamburg hat sie -> 04 die 'hol (0.3) ich- # ruf ich heut abend an # (0.47) (36) China 5 01 T: Mich "wundert=des,= 02 =weil 'sonst die Vera bei-> 03 #zum=Beispiel bei# 'Li:s Vortrag hat se problemlos, 04 (0.64) 05 äh also=hat se den'mitgekriegt, 06 'mitdiskutiert und alles.

[2.60] 4.2

[2.51] 5,9 [1.16] 4,3 [1.63] 6,1 [ 1.59] 5,6 [0.78] 5,1 [ 1.03] 5,8 [2.42] 4,9 [1.23] 5,7 [1.23] 5,2

(37) China 20 01 I: und der hatte: in-> 02 #genau=in# 'der 'Zeit gabs=en Ar'tikel in 'Newsweek,

[1.95] 2,6 [4.27] 3,1

(38) China 47 01 T: und dann hat sie das akzeptiert 02 und ist- (0.66) -> 03 # in Kuala Lumpur bei ihrer'Schwester wohnt sie jetzt #

[1.64] 4,9 [0.40] 5 [2.12] 6,6

(39) China 20 01 I: und 'dann und- und äh ähm (0.27) -> 02 # ich hab das dann dem 'Michael geschrieben #

[2.47] 2,4 [2.62] 4,2

(40) Kurzsichtig 01 C: Ich 'war bei so me 'Volltrottel 'da, 02 der Tiat mir die 'Gläser da vor Tiinglatscht,= -> 03 =s- # aso ziehungsweise # 'eine 'Volltrotte'lin war des (0,57)

[1.75] 5,7 [1.80] 6,1 [2.36] 5,9

Hoffmann (1991: 105) findet in dem von ihm untersuchten Datenmaterial keinen systematischen Zusammenhang zwischen intonatorischer Markierung und Reparatur (Reparans) und nur gelegentliche Erhöhungen der Sprechgeschwindigkeit: "Eine intonatorische Markierung durch Tonbewegung oder Akzentuierung am Beginn des Reparans finden wir nicht. [...] Insgesamt haben wir im Bereich das Reparans eine mehr oder minder leicht fallende Tonbewegung zum ÄuBerungsende hin, wie sie auch ohne Reparatur anzutreffen ist. In wenigen Fällen haben wir eine Tempoerhöhung." Vgl. dagegen Selting (1987a, 1987b), Couper-Kuhlen (1992) und Levelt & Cutler (1983).

219 In allen Transkriptausschnitten markieren die Sprecherinnen den Beginn ihrer durch Abbrüche angekündigten, selbstinitiierten Selbstreparatur durch die Akzelerierung ihrer Sprechgeschwindigkeit. Es scheint, als ob die Sprecher durch die Erhöhung der Sprechgeschwindigkeit direkt nach der Reparaturindizierung versuchen, die zusätzliche Zeit, die sie durch die hinzugefügte Selbstkorrektur in Anspruch nehmen, so gering wie möglich zu halten. Im Gegensatz zu gleichbleibender oder sogar verringerter Sprechgeschwindigkeit markieren sie auf diese Weise, daß sie sich zumindest bemühen, keine längere Redezeit in Anspruch zu nehmen, als dies ohne die Reparaturbedürftigkeit ihres Redezugs der Fall gewesen wäre. Aus diesem Grund kann die Funktion, die die Sprechgeschwindigkeitserhöhung bei der Durchführung von Selbstreparaturen übernimmt, als ikonisch bezeichnet werden. Betrachtet man jedoch die Dichtewerte der von Selbstreparatur betroffenen Intonationsphrasen, so zeigt sich, daß diese nicht immer ein phonologisches Korrelat zu der perzipierten Geschwindigkeitserhöhung liefern. Die Reparaturen können durch die Reparaturindizierung intonationsphraseninteme Pausen oder Silbendehnungen sowie starke Akzente enthalten. Darüberhinaus besteht abgesehen von den Beispielen (38) und (39) keine Eins-zu-EinsBeziehung zwischen den Phasen der Akzelerierung und der intonatorischen Phrasierung (vgl. dazu Abschnitt 4.1.4). Es liegt also nahe, solche Reparaturen zu betrachten, bei denen Akzeleration und Intonationsphrasenbildung zusammenfallen. Damit stellt sich die Frage, ob es nicht einen anderen Typus von Selbstreparaturen gibt, bei dem die Wahrscheinlichkeit hoch ist, daß die Phase der Akzelerierung mit der Intonationsphrasenbildung zusammenfällt. Einen solchen Typus könnte man bei den in Kapitel 2 diskutierten Mittelfeldentleerungen finden. Obwohl bereits ein syntaktischer Abschlußpunkt erreicht ist, wird dennoch eine Selbstreparatur durchgeführt. Diese ist jedoch im Gegensatz zu den bisher diskutierten Selbstreparaturen eine durch das Schweigen des Rezipienten subtil fremdinitiierte Selbstreparatur. Diese wird dann, wie die Analyse in Kapitel 2.4.3 ergeben hat, in einer selbständigen Intonationsphrase durchgeführt. Damit können die Intonationsphrasenbildung und Phase der Akzelerierung ebenso wie der perzeptive Eindruck der Sprechgeschwindigkeitserhöhung und die Messung der Silbendichte kongruieren. Die Beispiele (41) und (42) belegen diese Erwartung, denn in allem drei Fällen erhöht sich die Silbendichte deutlich und diese Intonationsphrasen wurden auch von den Versuchpersonen als 'schnell' notiert: (41) China 7f 01 T: die mußte ja nach "Freiburg; 02 (0.7) 'hh #zum 'Kul I tusmi I nisterium#.= -> 03 I hmhm I 04 I: -> 05 Τ: = Γ# wegen I der Sla'vistik.#° I warum? I 06 I: 07 (1.3)

[1.56] 4,5 [1.23] 6,5 [0.99] 6,1

220 (42) China 22 01 Τ: ähm aber die'anderen Inder, 02 die sind so 'Arbeiter (1.0) -> 03 # 'Gastarbeiter; #

[1.52] 5,2 [1.29] 4,7 [0.64] 6,3

Fremdinitiierte Selbstreparaturen, die nach einem syntaktischen Abschlußpunkt produziert werden, erhöhen zwar die Wahrscheinlichkeit, daß die Phase der Akzelerierung die gesamte Intonationsphrase umfaßt, eine absolute Übereinstimmung ist jedoch auch hier nicht erwartbar. Wie der Transkriptausschnitt (43) belegt, umfaßt die Phase der Akzelerierung auch bei diesem Typus der Selbstreparatur nicht immer die gesamte Intonationsphrase: (43) China 29 01 T: ähm da=sgibts "wahnsinning'tolle'Strände; (1.5) -> 02 #also=richtige# 'Bilderbuch'Strände.

[3.15] 3,2 [2.04] 4,9

Zwar sind die Dichte I-Werte auch in diesem Beispiel erhöht, sie steigen von 3,2 Silben/Sek. auf 4,9 Silben pro Sekunde, der perzeptive Eindruck der Sprechgeschwindigkeitserhöhung entsteht aber nur im ersten Teil der Intonationsphrase. In den bisher diskutierten Beispielen wurden die Dichte II-Werte, also die Anzahl der akzentuierten Silben in der Intonationsphrasen nicht zur Abstützung der perzipierten Sprechgeschwindigkeitsveränderung herangezogen. Die vorgestellten Transkriptausschnitte hatten gemeinsam, daß die akzelerierte Intonationsphrase nur eine einzige akzentuierte Silbe enthielt und der Dichte Π-Werte damit sehr niedrig war. Dies ist im Beispiel (44) nicht der Fall: (44) China 23 01 I: hmhm 02 Ich glaub in'China kommt noch da'zu 03 daß die: (0.42) 'meisten, -> 04 #zu'mindest die Stu'denten,# 05 die wer I den von'Chi I na 06 Τ: I "hm" I

finanziert;

[1.76] 5,1; 1,1 [2.26] 1,7; 0,8 [1.35] 5,2; 1,4 [2.15] 4,2; 0,9

Hier kündigen Silbendehnungen und eine intonationsphrasen- und redezuginterne Pause die selbstinitiierte Selbstreparatur an. Die Dichtewerte zeigen wieder, daß es nicht die absoluten Werte sind, die Versuchspersonen und Konversationsteilnehmer den Eindruck von erhöhter oder reduzierter Geschwindigkeit vermitteln, sondern daß dieser Eindruck relational und auf der Basis benachbarter Vergleichswerte getroffen wird. Vor allem der mit 1,7 Silben/Sek. extrem niedrige Dichte I-Wert von Zeile 03, der durch Silbendehnung und phraseninterner Pause zustandekommt, macht es möglich, daß der mittlere Wert von 5,2 Silben/Sek. in Zeile 04 als Erhöhung der Sprechgeschwindigkeit perzipiert wird. In Zeile 05 sinkt der Dichte I-Wert wieder leicht ab (4,2 Silben/Sek.). Doch in diesem Transkriptausschnitt sind es die

221 Veränderungen der Dichte II-Werte, die entscheidend zur Perzeption erhöhter Geschwindigkeit beitragen. In den direkt benachbarten Intonationsphrasen 03 und 05 werden nur Dichte Π-Werte von 0,8 bzw. 0,9 akzentuierten Silben/Sek. erreicht, während in der als schneller perzipierten Intonationsphrase 04 ein Wert von 1,4 akzentuierten Silben/Sek. erreicht wird. Leider enthält mein Datenmaterial nur dieses eine Beispiel einer Selbstreparatur, bei der die Dichte Π deutlich erhöht ist, sodaß über eine mögliche interaktive Relevanz nur spekuliert werden kann. Aufgrund der Arbeiten von Couper-Kuhlen (1992, 1993) kann jedoch vermutet werden, daß hier 'Schuldzuschreibungen' 42 eine Rolle spielen könnten. Es kann also zum jetzigen Zeitpunkt der Erforschung der Kontextualisierung von Reparaturen durch Sprechgeschwindigkeitsveränderungen nicht ausgeschlossen werden, daß das Beispiel (44) einen eigenen Typ von Selbstreparatur darstellt. Ich möchte nun noch einmal auf die obenaufgestellte Behauptung zurückkommen, daß die Erhöhung der Sprechgeschwindigkeit zur Markierung von bestimmten selbstinitiierten Selbstreparaturen ein ikonisches Kontextualisierungsmittel darstellt. Dies ist deshalb der Fall, weil durch den Geschwindigkeitswechsel nicht nur für den Rezipienten die Unterbrechung der Aktivität, innerhalb der die Reparatur durchgeführt wird, erkennbar gemacht wird, sondern auch die zusätzliche für die Durchführung der Reparatur benötigte Zeit reduziert wird. Da eine Reparatur ja immer auf ein kommunikatives Problem hinweist, dessen Lösung einen gewissen Zeitraum in Anspruch nimmt, dokumentieren Sprecher, die eine Selbstreparatur durchführen, zum einen, daß sie sich zumindest bemühen, keine längere Redezeit in Anspruch zu nehmen, als dies ohne die Reparaturbedürftigkeit ihres Redezugs der Fall gewesen wäre, und zum anderen, daß sie ihren Rezipienten nicht länger als nötig auf den Erfolg ihrer Reparaturbemühungen warten lassen wollen, denn: [...] repair aims for success and is overwhelmingly successful at achieving it quickly. (Schegloff 1979: 277)

Seine volle Überzeugungskraft erreicht dieses Argument aber erst dann, wenn man sich die Konsequenzen vor Augen hält. Aus dem Argument folgt ja, daß Sprecher dann keine Sprechgeschwindigkeitserhöhung produzieren sollten, wenn kein Grund für die Bemühung erkennbar ist, keine längere Redezeit in Anspruch zu nehmen, als dies ohne die Reparaturbedürftigkeit ihres Redezugs der Fall gewesen wäre. Es sollte also auch Selbstreparaturen geben, bei denen die Sprechgeschwindigkeit systematisch nicht erhöht, sondern vielleicht sogar reduziert wird. Couper-Kuhlen (1992: 348ff) konnte zeigen, daß fremdinitiierte Selbstreparaturen, die auf

Couper-Kuhlens (1992: 350ff) Analyse zum Englischen macht deutlich, daß Konversationsteilnehmer hier einen gewissen Spielraum nutzen können, um über rhythmische Isochrome oder Anisochronie (vgl. Kap. 3.2) ihrer Beiträge, die ja über Folgen von akzentuierten Silben (also Dichte II) zustande kommen, 'Schuldzuschreibungen' auszuhandeln.

222 Probleme bei der akustischen Übertragung zurückgehen, systematisch mit einer reduzierten Sprechgeschwindigkeit (und oft auch mit erhöhter Lautstärke) produziert werden. Auch im folgenden Transkriptausschnitt zeigt die durch bitte in Zeile 10 fremdinitiierte Selbstreparatur diese prosodischen Eigenschaften, wobei die Verlangsamung primär durch die Silbendehnungen zustandekommt. Eine weitere systematische Eigenschaft solcher Reparaturen ist aber auch der silbenzählende Rhythmus, der durch eine Folge von Akzentzusammenstößen (vgl. dazu Kap. 3.2) entsteht: (45) Verhebt 11 01 X: du ich versteh "kein ΊΥοΠ, 02 (1.5) 03 H: ja, ich sach ja (.) das 'Telefon is kaputt 04 X: "Lau'ter! 05 G: hörst du mich 'jetzt, ?hm 'nein (1.0) haha 06 X: 'jetz besser 07 H: 08 X: "ja en "bißchen" 'dieses "Scheiß (...) 09 H: 10 X: bitte? -> 11 H: ich sagte < 'die'ses "Schei:ß'din:g! Im Gegensatz zu den selbstinitiierten Selbstreparaturen und den durch Schweigen subtil fremdinitiierten Selbstreparaturen ist für die akustisch bedingten fremdinitiierten Selbstreparaturen keiner der Konversationsteilnehmer verantwortlich zu machen. Damit besteht auch keine Notwendigkeit, über eine Erhöhung der Sprechgeschwindigkeit bei der Reparaturdurchführung zu dokumentieren, daß der zusätzliche Zeitaufwand minimiert wird. Im Gegenteil: Bei Reparaturen dieser Art steht die Verbesserung der Übertragungsbedingungen im Vordergrund, was - wieder ikonisch-natürlich - zu Wiederholungen mit erhöhter Intensität und reduzierter Sprechgeschwindigkeit führt. In bezug auf die Kontextualisierung von Reparaturen durch Veränderungen der Parameter Dichte I und Dichte II lassen sich also mindestens zwei interaktiv relevante Kombinationen unterscheiden. Reparturtyp Α ist durch die als schnell perzipierte Kombination von hoher Dichte I und niedriger Dichte Π charakterisiert. Auf diese Weise wurden die Selbstreparaturen realisiert, bei denen die Sprecher offensichtlich versuchen, die durch die Selbstreparatur benötigte zusätzliche Zeit so gering wie möglich zu halten. Reparaturtyp Β weist die komplementäre Verteilung auf: niedrige Dichte I und hohe Dichte Π. In dieser als langsam perzipierten Sprechgeschwindigkeit werden solche Selbstreparaturen produziert, die von keinem der Gesprächsteilnehmer zu verantworten sind, sondern z.B. akustisch bedingt sind (vgl. Bsp. 45). Bei dem bisher empirisch schlechter abgesicherte Reparturtyp C schließlich wird die ebenfalls als schnell perzipierte Sprechgeschwindigkeit durch eine hohe Dichte I kombiniert mit einer hohen Dichte Π erzielt.

223 4.2.3 Thematisch relevante vs. weniger relevante Information In Abschnitt 4.2.1 wurde bereits darauf verwiesen, daß bestimmte Passagen für die Interpretation von Redebeiträgen relevanter als andere sind. Ich möchte mich in diesem Abschnitt dem textsemantischen Konzept der 'Relevanz' zuwenden. Ich möchte zeigen, daß Sprecher durch eine bestimmte prosodische Gestaltung ihrer Redezüge die Rezipienten auf besonders relevante Abschnitte hinweisen können und daß sie durch eine andere prosodische Verpackung auch das Gegenteil kontextualisieren, um so ihre Rezipienten auf neben- oder untergeordnete Abschnitte ihres Redebeitrags aufmerksam zu machen. Diese beiden unterschiedlichen prosodischen Gangarten43

entsprechen den in (46)

dargestellten Kombinationen von Dichte I und Dichte Π: (46) Produktion hoch (+) Dichte I (Silb./Sek.)

Perzeption

+ -

'schnell'

[-Relevanz]

unmarkiert -

+

'langsam'

[+ Relevanz]

niedrig (-)

•

hoch (+)

Dichte II (akz. Silb./Sek.)

Die prosodische Differenzierung erfolgt also dadurch, daß die weniger wichtigen Passagen schneller und mit weniger Akzenten realisiert werden, während die wichtigeren Passagen langsamer gesprochen werden und mehr Akzente aufweisen. Für die Kontextualisierung von weniger wichtigen Passagen des Redezugs wird also eine hohe Anzahl von Silben pro Zeiteinheit mit einer geringen Anzahl von akzentuierten Silben pro Zeiteinheit kombiniert. Solche Passagen werden als schnell perzipiert und in den Transkripten durch (->) hervorgehoben. Die wichtigen Passagen hingegen werden durch die komplementäre Kombination von Dichte I und Dichte Π markiert: Eine geringe Anzahl von Silben pro Zeiteinheit wird mit einer hohen Anzahl von akzentuierten Silben pro Zeiteinheit kombiniert. Solche Passagen werden als langsam perzipiert und in den Transkriptausschnitten durch (=>) hervorgehoben. 43

Vgl. dazu auch Goffmans (1979) Begriff "footing" sowie Levinson (1988a).

224 Das Beispiel (47) dokumentiert diese beiden Gangarten besonders deutlich, denn die beiden komplementären Verteilungen von Dichte I und Dichte Π werden von der gleichen Sprecherin in direkt aufeinanderfolgenden Intonationsphrasen (Zeile 13 und 14) verwendet: (47) China 17 01 I: und des war "unheimlich intre'ssant, 02

03 04 05 06 07 08 09 10 11 12 -> 13 => 14 15 16 17

(1.12)

Τ: T: I: Τ: I: Τ: I:

[1.72] 4,7; 1,1

mit denen zu'reden'einfach= [1.54] 5,2; 1,2 I die-=weil die I 'to'tal unterdrückt sind in 'China. [2.94] 4,1; 1,3 10 hmhm' I Ja::? Ahh die I äh die ham gan- I I Als Afrikaner? I 'Ja:, die ham 'ganz 'irre Ge'schichten erzählt; [2.31] 4,8;1,7 β (1.59) * hmhm ° (1.33) #die hatten 'alle durch die Bank die Tinschätzung daß 'China äh# [2.66] 6,0; 1,1 +'du:rch 'und 'durch 'ras'sis'tisch is. + [2.28] 3,0;2,6 (1.07) und=daß=sie'sie als Schwarze werden 'immer zu'letzt bedient, (0.73) [2.31] 5,2; 1,2

Wie bereits in Kapitel 3 (vgl. Bsp. (50)) bei der Analyse dieses Transkriptausschnittes gezeigt, kündigt I in Zeile 09 mit ihrem Vorwort (story preface) an, daß sie von einigen afrikanischen Studenten in China irre Geschichten gehört hat. Was I hier als irre bezeichnet, wird in den Zeilen 13 und 14 präzisiert. Der erste Teil (Zeile 13) faßt noch einmal zusammen, daß I hier die Meinung afrikanischer Studenten reponiert (die hatten alle durch die Bank die Einschätzung daß China). In Zeile 14 und in einer neuen Intonationsphrase wird dann der Schlüsselbegriff für die angekündigte Geschichte produziert (durch und durch rassistisch). Daß es sich tatsächlich um den für die Interpretation der nachfolgenden Geschichten relevanten Schlüsselbegriff handelt, läßt sich nicht nur durch die inhaltliche Analyse des Redezugs untermauern. Zum einen folgen Is Ankündigung nun drei Geschichten, die den Rassismusvorwurf exemplifizieren (vgl. Bsp. (47) und (50) in Kap. 3), zum anderen wird durch die Plazierung der Reparaturpartikel äh in Zeile 13 eine von Schegloff (1979, 1980: 141) beschriebene Markierungstechnik verwendet: For such sentences (first sentences in topic-initial turns or in topic shift position, S.U.), it is the case that: [...] They very regularly have self-repair in them, the nature of the trouble being repaired often being obscure and the positioning of the repair regularly being at the word that keys the new topic being initiated [-]. Schegloff (1979: 270f)

Betrachtet man die Werte von Dichte I und Dichte II, so wird die postulierte unterschiedliche Gewichtung prosodisch reflektiert. Von einer unmarkierten Kombination der Werte in den Intonationsphrasen 01, 03, 04 und 09 mit den Durchschnittswerten 4,7 Silben/Sek. und 1,3

225 akzentuierte Silben/Sek. steigt die Dichte I in Zeile 13 deutlich an (6,0 Silben/Sek.), während die Dichte Π auf 1,1 akzentuierte Silben/Sek. abfällt. In der Intonationsphrase 14, die den für die Interpretation der angekündigten Geschichte zentralen Schlüsselbegriff enthält, ist die Verteilung der Dichtewerte genau komplementär: Die Dichte I sinkt auf die Hälfte des Wertes von Zeile 13 ab (3,0 Silben/Sek.), während sich die Dichte Π mit 2,6 akzentuierten Silben/Sek. mehr als verdoppelt. Die Fo- Konturen zeigen diese beiden komplementären Gangarten deutlich: (47) China 17: 13 (Figur Π)

2130.1 2080. 2030.1 1980.1 1930.

1880.1 500.0

1300.0

900.0

1700.0

2100.0

2500.0

die hatten alle durch die Bank die Einschätzung daß

2900.0

3300.0 ms

China eh

270.0 240.0 210.0 180.0 150.0 500.0

1300.0

900.0

1700.0

2100.0

2500.0

2900.0

(47) China 17: 14 (Figur III)

2120.0 2090.0 2060.0 2030.0' 2000.0 1970.0 1940.0 500 )

800 3

durch

1100 0

und

140( .0

17 )0.0

2 300.0

230 3.0 ms

durch r a s s i s t i sch is

270.0 240.0 210.0 180.0

„s

150.0 500. )

800. 3

1100 0

140C .0

17 50.0

2 •00 0

2 3 0 3.0 ms

3300.0 ms

226 Auch das nächste Beispiel (vgl. auch (49) in Kap. 3 und (61) in Kap. 2) zeigt wieder, wie Sprecher Silbendichte und Akzentdichte kombinieren, um den Aufbau ihres Redezugs fur den Rezipienten erkennbar zu strukturieren: (48) China 9f Ol T: "Ich 'muß übrigens heut noch zum 'Köhlersen um 'drei;0 -> 02 #weils 'Schwierigkeiten gibt # => 03 +mit dem l Pe'king'auf'ent'halt+, 04 (0.5) 05 Ich hab den jetz 'einfach ge'buxht,

[2.7] 4,8; 1,1 [0.98] 6,1; 1,0 [1.79] 3,9; 2,7 [1.78] 4,7; 1,1

(48) China 9: 02-03 (Figur IV)

Λr

k>

'

.

I

l·'

>

1

Λ, r :· ·

v MΨ. 4V

i

"

weils Schwierigkeiten gibtlmit dem P e : : k i n g a u f

ent

halt

Wieder ist anhand der Fo-Kontur die für diese beiden Gangarten typische Verteilung von Akzenten und Akzenttönen zu sehen. Doch auch die Fortsetzung des Transkriptausschnittes bleibt für die Analyse der Kontextualisierungsfunktionen von Sprechgeschwindigkeitsveränderungen interessant, denn nun werden eine ganze Folge von Redezugkonstruktionseinheiten mit wesentlich höherer Sprechgeschwindigkeit produziert: 49) China 9f 05 T: Ich hab den jetz 'einfach ge'buxht, 06 I: "das: find=ichjainteres'sant!

[1.78] 4,7

((elaborierte 2. Bewertung, vgl. Bsp. (49) Kapitel 3.3.2))

-> -> -> -> -> ->

-> ->

21 22 23 24 25 26 27 28 29 30 31 32 33

T: 'hh weil d- 'des: war ja 'so,= =#daß die Frau "Matz:#, ##'mich ge'fragt hat,## ##ob=ich nich en paar Tage in #'Peking bleiben 1 wollte,# 1= I: 1 ja=es=is 1 T: #des=sei so 'üblich.= I: =ja=ja T: ##un=da hab ich 'dich gefragt,=## ## un=du hat gesagt # ja=ja 'auch. (0.21) ahm un='da hab ich das ge'buxht, (0.40) mit 'vier Tage 'Aufenthalt in 'Peking, un 'jetz meine die Frau 'Matz,

[1.48] [0.79] [0.67] [2.04]

4,7 5,0 5,9 6,9

[0.78] 6,4 [0.80] 8,8 [1.12] 6,3 [1.29] 5,4 [2.11] 4,7 [1.45] 4,8

227 34 35 36

ich müßt "dringend mit Herrn 'Köhlersen reden, das würd nich 'gehn (0.35) die Wang Tang würd mich 'nicht be'treuen. (0.67)

[2.17] 5,1 [0.93] 4,3 [1.71] 5,3

Auch in diesem Transkriptausschnitt kongruieren prosodische Markierung und textsemantische Strukturierung. Im Abschnitt 21 bis 29 liefert Τ begründende Hintergrundinformation (weil) für ihre Probleme mit dem Pekingaufenthalt. Diese Passage ist mit den Durchschnittswerten von 6,2 Silben/Sek. deutlich schneller als der Abschnitt 31 bis 36, bei dem die Durchschnittsgeschwindigkeit im Bereich der für die Sprecherin I unmarkierten Dichte von 4,9 Silb./Sek. liegt. Auf die Präsentation dieser Information hätte Τ auch verzichten können, ohne die Übermittlung der textsemantisch zentralen Aussage ihres Beitrags zu beeinträchtigen, daß nämlich ihr Aufenthalt in Peking gefährdet ist, weil die Gastuniversität WangTang ihre Betreuung nicht übernimmt. Intuitiv läßt sich die Differenzierung von textsemantisch wichtigen und weniger wichtigen Passagen also durchaus nachvollziehen. Wenn man jedoch versucht, die Distinktion von zentralen oder relevanten Passagen und nicht zentralen oder nicht relevanten Passagen textsemantisch zu operationalisieren, so zeigt sich, daß wir zwar über Intuitionen verfügen, die auch in den nicht-analytischen Alltagsgebrauch der Begriffe eingehen, daß aber eine präzise Begriffsbestimmung äußerst schwierig ist. Ich glaube, daß diese Schwierigkeit nicht zuletzt darin begründet liegt, daß die Konzepte auch im Alltagsgebrauch diffus und wenig präzise sind. Wir können zwar auf einen Redebeitrag mit der Bemerkung Das ist nicht relevant reagieren, und wir können uns auch beschweren, daß wir nur irrelevante Informationen erhalten haben, die vielleicht sogar mit der 'falschen' Gangart übermittelt wurden, d.h. verkleidet als äußerst wichtiger Beitrag mit einer hohen Akzent- und einer niedrigen Silbendichte. Solche Beschwerden sind aber interaktiv viel problematischer als z.B. eine Beschwerde, daß wir von einer bestimmten Person nicht gegrüßt worden sind. Der Unterschied besteht darin, daß wir sehr präzise bestimmen können, was ein Gruß ist, während unsere Einschätzung, was einen relevanten Gesprächsbeitrag ausmacht, sehr viel ungenauer ist. Von konversationsanalytischer Seite ist bei dem Versuch, den Begriff der 'Relevanz' zu präzisieren, wenig Hilfe zu erwarten. Zwar handelt es sich um eine Alltagskategorisierung, die im Sinne ethnomethodologischer Forschung von dem Konversationsteilnehmern selbst in und durch ihre Interaktion methodisch hervorgebracht werden muß ('doing being relevant')44, aber

44

Durch die für die Ethnomethodologie typische Frage nach dem 'Wie' aller praktischen Handlungen soll die methodische Struktur des Alltagshandeln offengelegt werden: "The ethnomethodologist continually asks the technical question, 'How is that social activity done?'. Harvey Sacks keeps this question in front of him by using the verb 'to do' in thinking about social activities. He refers to arguing as doing arguing; being embarrassed as doing embarrassment; exclaiming as doing exclaiming; questioning as doing questioning, etc. In this way he tried to keep focused on the methodical ways in which social activities are produced by members of the culture" (Churchill 1971: 183).

228 in diese methodische Hervorbringung gehen bei diesem Untersuchungsobjekt in einem wesentlichen Umfang inhaltliche Aspekte mit ein. Der textsemantische, inhaltsanalytische Zugriff auf konversationeile Daten ist jedoch in der ethnomethodologischen Konversationsanalyse fast ebenso verpönt wie der Zugriff auf psychologisierende Deutungsmuster, da in beiden Ansätzen die Gefahr liegt, daß sich die vermeintliche Analyse in intuitiven Paraphrasierungen oder endlosen Spekulationen über den 'eigentlichen' Sinn des Gesagten erschöpft, die oft auch noch von dem leisen Bedauern begleitet sind, daß man leider doch nie absolut sicher wissen kann, was 'wirklich' gemeint und gefühlt wurde.45 Es könnte sich an dieser Stelle also anbieten, 'ausnahmweise' Zuflucht zu pragmatischen Theorien zu suchen, die sich in der Tradition von Grice (1975) mit der Explizierung der Maxime Be relevant auseinandergesetzt haben. Folgt man Sperber & Wilson (1986: Kap. 3) 46 , so ist die Kontextwirkung (contextual effect) die zentrale Bedingung für die als theoretisches Konzept zu explizierende Relevanz eines Beitrags: The notion of contextual effect is essential to the description of the comprehension process. As a discourse proceeds, the hearer retrieves or constructs and then processes a number of assumptions. These form a gradually changing background against which new information is processed. Interpreting an utterance involves more than merely identifying the assumption explicitly expressed: it crucially involves working out the consequences of adding this assumption to a set of assumptions that have themselves already been processed. In other words, it involves seeing the contextual effects of this assumption in a context determined, at least in part, by earlier acts of comprehension. (Sperber & Wilson 1986: 118)

Damit ist eine Information dann irrelevant, wenn von ihr keine Kontextwirkung ausgeht. Sperber & Wilson (1986: 121) stellen exemplarisch drei solche Kontext/InformationsRelationen vor, für die die Kontextwirkung systematisch fehlt: (1), the assumption may contribute new information, but this information does not connect up with any information present in the context. [...] (2), the assumption is already present in the context and its strength is uneffected by the newly presented information; this newly presented information is therefore entirely uninformative and, a fortiori, irrelevant. [·.·] (3), the assumption is inconsistent with the context and is too weak to upset it; processing the assumption thus leaves the context unchanged.

Zur Abgrenzung der ethnomethodologischen Konversationsanalyse von anderen Ansätzen wie Diskursanalyse oder Textlinguistik, vgl. Levinson (1983: 286-294) sowie den kritischen Überblick in de Beaugrande & Dressler (1981: 15-31). Es ist im Rahmen dieser Arbeit nicht möglich, den Ansatz von Sperber & Wilson (1986) ausführlich darzustellen. Die wenigen Bemerkungen versuchen nur, die (für diese Arbeit) 'relevantesten' Aspekte anzureißen. Kürzere Überblicke finden sich u.a in Wilson & Sperber (1988) und Blakemore (1988: 237ff). Als Ausgangpunkt für eine kritische Betrachtung mit zahlreichen weiteren Literaturverweisen vgl. Levinson (1988b) aber auch Liedtke (1986). Werth (1981) weist auf Ähnlichkeit zum Konzept der Kohärenz (coherence) (vgl. FN 49) hin.

229 Da Sperber & Wilson (1986) aber eine Theorie entwickeln, in der die Infoimationsverarfcei/w/ig eine zentrale Rolle spielt, ist die Kontextwirkung nicht der einzige Faktor, der auf die Relevanz eines Beitrags Einfluß nimmt. Eine zentrale Idee ihres Ansatzes ist es, daß Informationsverarbeitung ein Prozess ist, bei dem Kosten-Nutzen-Rechnungen eine wichtige Rolle spielen. In Analogie zur industriellen Produktivität muß der Verarbeitungsaufwand (vgl. Sperber & Wilson 1986: 124 und Levinson 1989: 459) als negativer Faktor bei der Berechnung der Relevanz mit berücksichtigt werden: ^

Ε (number of contextual effects) C(cost of effort involved in obtaining E)

Mit dem negativen Faktor des Verarbeitungsaufwands führen die Autoren das Konzept der Relevanz von einem dichotomischen in ein skalares Konzept über: [...]: other things being equal, the greater the processing effort, the lower the relevance. (Sperber & Wilson 1986: 124)

Es verbleibt jedoch ein weiteres Problem. Wie bereits gesagt, spielt der Kontext bei der Beurteilung der Kontextwirkung eine zentrale Rolle. Nur wenn klar festgelegt wird, was als Kontext für eine bestimmte Äußerung zählt, kann auch die kontextverändernde Wirkung angegeben werden. Die Festlegung des Kontexts ist jedoch problematisch (vgl. auch Kap. 1). Die Autoren schlagen daher vor, auch den Rezipienten in die Kalkulation aufzunehmen und das skalare Konzept der Relevanz auf diese Weise zu individualisieren. Ihrer Meinung nach kann die Kontextwirkung nur beurteilt werden, wenn man berücksichtigt, welche Kontexte für die zu verarbeitende Information dem Rezipienten zum Zeitpunkt der Informationsverarbeitung auch zugänglich47 sind: Relevance to an individual (comparative) Extent condition 1: an assumption is relevant to an individual to the extent that the contextual effects achieved when it is optimally processed are large. Extent condition 2: an assumption is relevant to an individual to the extent that the effort required to process it optimally is small.

Bei dem Versuch, Sperbers und Wilsons Theorie für die Analyse natürlicher Konversationen zu nutzen, ergeben sich die üblichen Probleme. Sie betreffen die Einwände, die empirisch arbeitende Konversationsanalytiker immer dann formulieren, wenn ein einziges, in diesem Fall kognitives Prinzip in das Zentrum einer Kommunikationstheorie gestellt wird. Worin könnte dennoch der Nutzen für den Konversationsanalytiker liegen? Ich glaube, die Aufgabe des "An assumption is relevant to an individual at a given time if and only if it is relevant in one or more of the contexts accessible to that individual at that time" (Sperber & Wilson 1986: 144). Vgl. dazu auch Chafe (1976) und (1987).

230 Konversationsanalytikers müßte es sein, 'Relevanz' als Alltagskategorisierung der Konversationsteilnehmer mit den theoretischen Konzeptionen, z.B. der von Sperber und Wilson, in Verbindung zu bringen, wobei der spezielle ethnomethodologische Beitrag in der Beschreibung der methodischen Hervorbringung ('doing being relevant', vgl. FN 44) liegen müßte. Meiner Meinung nach lassen sich mindestens zwei Aspekte festhalten, die sowohl für die Charakterisierung der Alltagskategorie als auch für die Bestimmung als theoretisches Konstrukt wichtig sind. Erstens: Relevanz ist kein dichotomisches, sondern ein skalares Konzept. Alle Informationen, die Sprecher produzieren und die Rezipienten verarbeiten, lassen sich also auf einer (virtuellen) textsemantischen Skala piazieren, die als einen Endpunkt Irrelevanz und als Gegenpol einen sehr hohen Relevanzgrad aufweist. Zweitens: Relevanz ist ein relationales Konzept. Die Relevanz eines bestimmten Beitrags kann nur in bezug auf einen bestimmten Rezipienten und seinen Wissensstand an einer bestimmten Stelle innerhalb einer Konversation beurteilt werden. Alle diese Überlegungen lassen sich in konversationsanalytische Konzepte überführen. Wenn die Relevanz eines Beitrags auch als Alltagskonzept eine skalare Eigenschaft ist, können wir erwarten, daß Konversationsteilnehmer in der Lage sind, mindestens zwei Einordnungen auf dieser Skala vorzunehmen. Wir können erwarten, daß Konversationsteilnehmer in Produktion und Perzeption sehr hohe Relevanz von niedriger Relevanz unterscheiden können. Darüberhinaus ist vielleicht auch eine dritte Klassifikation erwartbar, denn die Relevanz eines bestimmten Beitrags kann auch in einem unmarkierten Bereich angesiedelt sein, d.h. weder besonders hoch noch besonders gering sein. Die relationale Konzeption des Relevanzbegriffes enthält bei Sperber & Wilson (1986) drei Bezugspunkte: Den Rezipienten, den Zeitpunkt der Informationsverarbeitung und den für die zu verarbeitende Information zugänglichen Kontext. Daß die Relevanz eines Beitrags nur unter Rekurs auf einen oder mehrere Rezipienten bestimmt werden kann, ist ein weiterer Bereich, in dem sich der rezipientenspezifische

Zuschnitt

(recipient design, vgl. Kap. 2.4.4) von Äußerungen manifestiert. Daß die Äußerungen eines Konversationsteilnehmers nicht aus ihrem unmittelbaren sequentiellen Kontext losgelöst betrachtet werden dürfen, kann sogar als Credo der ethnomethodologischen Konversationsanalyse betrachtet werden. Ein weiterer Kandidat für ein Credo ist der Verweis der Ethnomethodologen auf die Zeitlichkeit von Konversationen. Auch wenn das Transkript eines längeren Gesprächs vorliegt, muß jeder Analyseschritt aus der Perspektive der Teilnehmer erfolgen, die ja auch zu einen Zeitpunkt tj noch nicht das wissen, was sie zu einem späteren Zeitpunkt tj wissen. Als eine weitere konversationsanalytische Übersetzung für den Kontext,

231 auf den der informationsverarbeitende Teilnehmer bei seiner Relevanzbeurteilung zugreift, bietet sich der Rekurs auf das Gesprächsthema48 zum Zeitpunkt t n an. Daß Konversationen 'Themen' haben, gehört ebenfalls zu den Kategorisierungen, auf die die Teilnehmer selbst und damit auch die Konversationsanalytiker zurückgreifen. Was Thema oder Themen einer Unterhaltung war(en), kann man erfahren, wenn man sich berichten läßt, 'worüber' gesprochen wurde. Für den Fall, daß jemand die Unterhaltung mitprotokolliert hat, sollte diese Information ebenfalls aus dem Protokoll hervorgehen. Gerade in Alltagskonversationen ist es jedoch oft problematisch, mit präzisen Überschriften anzugeben, was zu einem bestimmten Zeitpunkt 'das Thema' der Unterhaltung ist. Aus diesem Grund meiden Konversationsanalytiker auch bei der Analyse der Thematizität den textsemantischen Zugriff (vgl. Schegloff 1990). Die Frage, was Thema einer Unterhaltung ist, wird in der Regel zugunsten der Frage verschoben, wie Thematizität von den Teilnehmern hergestellt wird. Ausgangspunkt der Analyse sind also nicht die Themen selbst (inhaltsanalytisches Vorgehen), sondern die Bindungstechniken, mit denen die Teilnehmer Kohärenz 49 herstellen, und der Verzicht auf Bindungstechniken bzw. der Einsatz von Diskohärenzmarkierung50, mit denen die Teilnehmer Themenwechsel vornehmen und neue Themen einleiten. Ich möchte der Inhaltsanalyse hier jedoch ausnahmsweise nicht völlig ausweichen. Um aber die oben kritisierten Textparaphrasen zu vermeiden, möchte ich vorab folgende Festlegungen vornehmen. Wenn die Relevanz eines Beitrags unter Rekurs auf ein Geprächsthema beurteilt wird, ist ein Gesprächsbeitrag nur dann relevant, wenn die übermittelte Information den Rezipienten nicht bereits bekannt ist. Nun kann ein Sprecher natürlich nicht absolut sicher wissen, was seinem Rezipienten bekannt ist und was nicht. Bestimmte Informationen können jedoch vom Sprecher dann als bekannt unterstellt werden, wenn es sich um eine zu einem Zeitpunkt tj wiederholte Information handelt, die in der Konversation bereits zu einem früheren Zeitpunkt tj schon einmal übermittelt wurde, oder wenn es sich um Information handelt, die vorangegangene Informationen zusammenfaßt. Ein Beitrag ist auch dann weniger relevant, wenn er

Vgl. dazu besonders Brown & Yule (1983: Kap. 3), die auch ausführlich die Problematik von 'Überschriften' zur Festlegung eines Themas kritisieren. Unter diesen Kritikpunkt fällt auch die Annahme eine 'Quaestio' (vgl. Klein & Stutterheim 1987) für eine Erzählung. 49

Vgl. dazu auch die Unterscheidung zwischen Kohärenz (coherence) und Kohäsion (cohesion) bei Halliday & Hasan (1976), zur Übersicht de Beaugrande & Dressier (1981: Kap. IV und V) sowie u.a. Dorval (ed.) (1990), Ehlich (1982), Giv 01 C: # Ich hab jetz emol ne 'andre Frage; # [1.20] 8,3 -> 02 # ich hab mirs nämlich mal über'legt, # [0.95] 10,5 -> 03 # da liest=ma in letschter Zeit imma wieder Ar'tikel # drii: ber (0.3) [ 1.941 8,2 04 ähm (0.37) 05 aso bei 'mir isch des zum Beispiel 'so: [1.47] 6,8 06 + daß ich 'ganz mini'mal 'kurzsichtig bin; += [1.86] 5,4 + =also 'null'fünf.+ [0.83] 4,8 = > 07 08 des heißt ich brauchs 'wirklich 'nur, [2.25] 5,5 09 [2.24] 5,3 wenn=ich (0.37) 'lange 'Zeit auf 'ein Tunkt kugge muß.= -> 10 ="# zum Beispiel im 'Film oder im The'ater oder so:, ne, [1.85] 8,1 11 C: 1 sonsch: 1 fürd nor'male- (0.14) [1.40] 4,3 12 B: Ihmhm 1 13 C: denn wenn=ich die TJrille 'aufzieh [1.05] 6,6 14 seh ich 'schon [0.47] 6,4 15 'etz seh ichs 'schärfer als 'vorher [1.55] 5,2 16 aba ich brauchs 1 'it wenn=i 1 'no:h seh [1.80] 5,2 17 B: 1 auf "beide? 1 18 C: Auf 'beide Auge null'fünf ja [1.17] 6,8 19 M: ((Räuspem)) -> 20 C: #und ez 'gibts ebbe so Ar'tikel,#= [1.27] 7,1 = > 21 + daß es 'Au'ge'trai'ning gibt,+ [1.43] 4,9 -> 22 #aso daß ich# 1 es 'Auge 1 trai'niere kann.= [1.92] 5,7 23 B: 1 ?a?a 1 ((verneinend)) Der Aufbau von Geschichten ist natürlich nicht identisch mit der internen Strukturierung von Argumenten. Ein wesentlicher Unterschied liegt in der für Geschichten konstitutiven Zeitachse (narrative skeleton), vgl. dazu Labov (1972) und Labov & Waletzky (1967) sowie zum Deutschen u.a. Ehlich (ed.) (1980). Schon bei Wundt ( 3 1887: 253ff) findet sich die Unterscheidung zwischen Phasen der Spannung und Phasen der Entspannung. Zur Unterscheidung von Vordergnindstrukturen und Hintergrundstrukturen vgl. u.a. Hooper (1979: 213): "[...] in any extended text an overt distinction is made between the language of the actual story line and the language of supportive material which does not itself narrate the main events. I refer to the former - the parts of the narrative which relate events belonging to the skeletal structure of the discourse - as foreground and the latter as background."

233

=>

-> ->

=> -> ->

=> ->

=>

24 C: l='doch 1 des 'gibts. 25 B: 1 ?a?a 1 ((verneinend)) L: doch des glaub ich schon. 2 6 27 B: 1 bei 'Kurzsichtigkeit 1 da isch einfach der 'Augapfel zu lang, (.) ?: 1 ( 2 8 ) ι 29 B: da kannsch 'mache was de willsch, da kannsch niks 'ändern.= 3 0 31 ?: na: 32 C: +'o:'der die 'Lin'se 'krümmt sich 'falsch.+ [ 1 . 8 9 ] 4 , 2 33 ?: h m ( 0 . 6 2 ) 34 C: 'daran liegts nämlich (0.3) [ 0 . 8 3 ] 6 , 0 35 ?: (ach) und da kamma: au=e-=#so e 'Augetraining mache#= [ 1 . 6 0 ] 8 , 7 3 6 37 ?: (ach) =#un 'wenn ich jetz mir über'leg,#= [0.94] 8,5 38 = Ich "hab die Alterna'ti:ve: [1.17] 6,8 39 'entweder die 1 "Brille1 (0.3) [0.83] 7,2 40 1 ((Räuspern)) 1 41 ?: 42 C: #die Alternative entweder die Brille# 'an'zu'ziehe, [ 2 . 0 6 ] 7 , 8 + 'im'ma + (0.3) [0.44] 4,5 43 44 #aber des 'kann=i it,# [0.54] 11,1 45 #weil die im Moment so 'häßlich isch# (0.5) [ 1 . 0 6 ] 8 , 5 'o:der ich 1 zieh se nur 'denn auf, [1.27] 6,3 46 1 hehehe 47 ?: [2.09] 4,3 48 C: + wenn=i se 'wirklixh 'effektiv "brauxh; + # un versuch in der 'andre Zeit# [0.94] 8,5 49 + so "Trai'ning zu mache.+ [1.25] 4,8 50

Dieses Gesprächsfragment weist eine Ablaufstruktur auf, die aus vier Interaktionskomplexen besteht. Der Transkriptausschnitt beginnt in Zeile Ol mit einem Format, das Schegloff (1980) als Ankündigung einer Aktivität (action projection) analysiert hat. In diesem Transkriptausschnitt wird nicht nur eine Frage angekündigt (ich hab jetz emol ne Frage), sondern eine andere Frage, d.h. in Zeile 01 wird zugleich mit der Aktivitätsankündigung auch ein Themenwechsel (Diskohärenzmarkierung) vollzogen. Formulierungen dieser Art fungieren aber nicht nur als Ankündigungen, die den Vollzug der angekündigten Aktivität einleiten (z.B. prequestions). Aufgrund der Tatsache, daß ihnen systematisch nicht die angekündigten Aktivitäten selbst, sondern weitere Präliminarien folgen, ist ihre Funktion die Ankündigung 53

Präliminarien

von

(preliminaries to preliminaries, pre-pre's):

Action projections are themselves preliminaries, or pre's. Initially it might be thought that they are pre's to whatever action they project - pre-questions, pre-tellings, pre-requests. However, in view of the regular occurence of preliminaries after them, the possibility can be entertained that-they have just that outcome as what they are designed and employed to achieve. Accordingly, they should be understood as preliminaries to preliminaries, or pre-pre's. [...] They make room for and mark, what follows them as preliminary. (Schegloff 1980: 116)

Aktivitätsankündigungen fungieren aber auch als "pre-delicates" vgl. Schegloff (1980:131ff).

234 Der weitere Verlauf yon C's Redezug bestätigt diese Analyse. In den Zeilen 02 und 03 folgen keine Fragen, sondern Präliminarien. Diese sind jedoch nach C's eigener Einschätzung nicht unbedingt geeignet, den Rezipienten die Informationen zur Verfügung zu stellen, die sie für die Interpretation der angekündigten Aktivität benötigen. Da dies aber die Funktion der Präliminarien ist, initiiert C in Zeile 04 eine Selbstreparatur. C beginnt in Zeile 05 mit der Reparaturpartikel also eine neue Redezugkonstruktionseinheit. Sie setzt ihre Rezipienten davon in Kenntnis, daß sie nur ganz minimal kurzsichtig ist. C's Bericht über ihre Kurzsichtigkeit erstreckt sich bis Zeile 16. Die textsemantische Strukturierung dieses Redezugabschnitts läßt Relevanzunterschiede erkennen: Zeile 07 mit der präzisen Angabe des Dioptrienwerts nullßnf ist relevanter als die Nennung eines zweiten, konkreten Beispiels in Zeile 10, wann C die Brille benötigt. Ohne die Zeile 01 würden diese Informationen die Rezipienten jedoch mit einem Problem konfrontieren, denn der Beitrag allein würde kaum die für Konversationsteilnehmer immer relevante Frage "why that now?" (Schegloff & Sacks 1973: 299) beantworten. Als Sequenz, die auf eine Ankündigung von Präliminarien folgt, ist jedoch klar, daß die Information über C's minimale Kurzsichtigkeit nicht als "said in its own right but as a preliminary" (Schegloff 1980: 120) zu interpretieren ist. Nach einer kurzen Frage/Antwort-Sequenz, die diese Kurzsichtigkeit präzisiert (Zeile 17,18), wiederholt C die Information von Zeile 03 (da liest ma in letschter Zeit imma wieda Artikel drüber) in Zeile 20 (und ez gibts ebbe so Artikel). Obwohl Zeile 20 für die Strukturierung von C's Redezug wichtig ist, indem sie die Reparatur der Präliminariensequenz abschließt, wird textsemantisch wenig relevante Information übermittelt, da es sich ja um eine Wiederholung von Zeile 03 handelt. In Zeile 21 nennt C jedoch zum erstenmal etwas, das als Schlüsselbegriff für das angekündigte neue Thema in Frage kommen könnte: Augetraining. Diese Zeile sollte damit für die Rezipienten besonders relevant sein. Zeile 22 ist eine wieder mit Selbstreparaturmarkierung (also) versehene Reformulierung von Zeile 21. Von Zeile 23 bis Zeile 31 folgt nun ein Disput, ob Kurzsichtigkeit durch Augentraining behoben werden kann, an dem sich C, B, L und Μ beteiligen. Während sich L in Zeile 24 C's Darstellung anschließt, ist Β gegenteiliger Meinung (vgl. 23, 25,27 und 29 bis 30). In Zeile 32 C präsentiert C einen bisher nicht erwähnten Aspekt, um ihre These zu untermauern (oder die Linse krümmt sich falsch). Diese Intonationsphrase sollte einen hohen Relevanzgrad aufweisen. Nachdem keiner von C's Rezipienten die Argumentation fortsetzt, wiederholt C in den Zeilen 36 und 38 die Informationen von 21 bis 22 und 02. Im Sinne der obigen Festlegung sollten diese beiden Zeilen textsemantisch wenig relevant sein. Zeile 38 kündigt zugleich eine Conclusio an, die in den Zeilen 39 bis 50 entwickelt wird. Auch bei der Conclusio, die zwei Alternativen benennt, lassen sich unterschiedliche Relevanzeinstufungen erkennen. Der wichtigste Aspekt der ersten Alternative, daß C die Brille immer tragen könnte, wird über Mittelfeldentleerung (vgl. Kap. 2) in einer eigenen Intonationsphrase

235

realisiert. Wenn potentielle Mittelfeldkonstituenten nach der rechten Satzklammer in einer eigenen Intonationsphrase realisiert werden, so können Sprecher die Relevanz, die die Konstituente für das Gesprächsthema hat, über die Ausdehnung des Tonumfangs und über die Zuteilung von Akzenttönen kontextualisieren (vgl. Kap. 2.4.4). Es folgt (Zeile 44 - 45) eine kommentierende Bemerkung, die bezüglich der Conclusio Nebenaspekte des Brillentragens thematisiert. Die zweite Alternative wird ab Zeile 46 entwickelt, hier enthalten die Zeilen 48 und 50 die für diese Alternative wichtigsten Informationen. Soweit die Inhaltsanalyse des komplexen Redebeitrags. Wie eingangs gesagt, wird erwartet, daß Konversationsteilnehmer in Produktion und Peizeption sehr hohe Relevanz von niedriger Relevanz unterscheiden und diese Unterscheidung auch durch die prosodische Gestaltung ihrer Beiträge reflektieren. Der Transkriptausschnitt (50) wird von C mit einer durchschnittlichen Silbendichte (Dichte I) von 6,4 Silben/Sek. produziert. Es wird daher erwartet, daß Passagen von hoher Relevanz mit deutlich geringerer (langsamer) und Passagen mit niedriger Relevanz mit deutlich höherer Silbendichte (schneller) produziert werden sollten. Die Dichte der akzentuierten Silben (Dichte Π) hingegen sollte in Passagen von hoher Relevanz ansteigen und in Passagen mit niedriger Relevanz abfallen. Die verkürzte Form des Transkriptausschnitts (50) zeigt den argumentativen Aufbau von C's Beitrag: (50) Kurzsichtig 1 -> 01 Pre-Pre: Ich hab jetz emol ne 'andre Frage -> 02 Pre: ich hab mirs nämlich mal über'legt -> 03 Pre: da liest=ma in letschter Zeit imma wieder Ar'tikel drü: ber 04 Selbstreparaturindizierung 05 - 1 9 Pre 05 -06 C ist nur minimal kurzsichtig => 07 Nennung der Dioptrinzahl: also 'nulVfünf 08 - 09 1. Beispiel -> 10 2. konkretisiertes Beispiel: zum Beispiel im 'Film oder im The'ater oder so: ne, 11-16 Pre 17-18 Präzisierung von C's Kuzsichtigkeit -> 20 Wiederholung von 03: und ez gibts ebbe so Ar'tikel => 21 Schlüsselwort: daß es 'Au'ge'trai'ning gibt -> 22 Wiederholung/Reparatur: #aso daß ich# es 'Auge trai'niere kann. 23 - 35 Diskussion zwischen C, B, L und Μ 27- 30 Gegenposition von B: der Augapfel ist zu lang; daran ist nichts zu ändern

[ 1.20] 8,3; 0,8 [0.95] 10,5; 1,0 [1.94] 8,2; 0,5

[0.83] 4,8; 2,4 [1.85] 8,1; 1,8

[ 1.27] 7,1; 1,5 [1.43] 4,9; 2,8 [ 1.92] 5,7; 1,0

236 =>

32

->

36

->

38

39 - 4 3 = > 43 44-•45 -> 44 -> 45 46 - 5 0 = > 48 -> 49 = > 50

Neues Argument von C: 'o: 'der die 'Lin 'se 'krümmt sich 'falsch Wiederholung von 22: und da kamma: au=e-=#so e 'Augetraining mache Wiederholung von 02: un "wenn ich jetz mir über'leg 1. Alternative: C trägt ihre Bnlle 'im 'ma Kommentierende Nebenbemerkung aber des 'kann-i it weil die im Moment so 'häßlich isch 2. Alternative: Brille nur wenn nötig und Augentraining wenn=i se 'wirklich 'effektiv "brauxh un versuch in der 'andre Zeit so "Trai'ning zu mache.

[189] 4,2; 3,1 [1.60] 8,7; 0,6 [0.94] 8,5; 2,1 [0.44] 4,5; 4,5 [0.54] 11,1; 1,8 [1.06] 8,5; 0,9 [2.09] 4,3; 1,9 [0.94] 8,5; 1,0 [1.25] 4,8; 1,6

Mit durchschnittlich 9 Silben/Sek. liegen die ersten drei Intonationsphrasen dieses Abschnitts deutlich über dem Durchschnittswert des Gesamtausschnitts. Bis auf Zeile 22 wird der durchschnittliche Dichte I-Wert auch in den anderen als wenig relevant bewerteten Intonationsphrasen deutlich überschritten: Die Dichte I-Werte schwanken hier zwischen 7,1 Silben/Sek. (Zeile 20) und 11,1 Silben/Sek. (Zeile 44). Die Dichte Π-Werte schwanken in den als schnell perzipierten Intonationsphrasen zwischen 0,5 akzentuierten Silben/Sek. und 1,8 akzentuierten Silben/Sek. Betrachtet man die als besonders relevant eingestuften Intonationsphrasen, so ergibt sich das erwartete komplementäre Bild: Die Dichte I-Werte liegen mit der Variationsbreite von 4,2 Silben/ Sek. bis 4,9 Silben deutlich unter und die Dichte II-Werte (zwischen 1,6 und 4,5 akzentuierten Silben/Sek.) deutlich über den Werten der wenig relevanten Intonationsphrasen. Zu Beginn dieses Abschnitts wurde bei der Vorstellung der Theorie von Sperber & Wilson (1986) daraufhingewiesen, daß für eine psycholinguistisch adäquate Konzeption des Begriffs der Relevanz die Kosten/Nutzen-Rechnungen, die die Rezipienten bei der Informationsverarbeitung aufstellen, berücksichtigt werden müssen. Dabei geht der Verarbeitungsaufwand als negativer Faktor in die Berechnung der Relevanz eines Beitrags ein. Wenn man versucht, auch diesen Aspekt für eine Analyse konversationeller Daten zu nutzen, so bietet sich auch hier das Konzept des rezipientenspezifischen Zuschnitts (vgl. Kap. 2.4.4) und vor allem die Idee der Kontextualisierung (vgl. Kap. 1) an. Der Verarbeitungsaufwand wird möglicherweise psycholinguistisch nachweisbar gesenkt, wenn durch prosodische Kontextualisierungshinweise die Aufmerksamkeit des informationsverarbeitenden Rezipienten auf die besonders relevanten Passagen des Redebeitrags gelenkt wird und wenn zugleich - ebenfalls durch die Prosodie kontextualisiert - auch weniger relevante Passagen markiert werden (vgl. FN 52). In den nun folgenden beiden Abschnitten möchte ich die Beobachtungen dieses Abschnitts präzisieren und die textsemantische Funktion von Sprechgeschwindigkeitsveränderungen weiter herausarbeiten.

237 4.2.4 Zusammenfassungen und Wiederholungen

Zusammenfassungen und Wiederholungen konnten bereits im letzten Abschnitt als textsemantisch wichtige und komplexe Redebeiträge strukturierende Redezüge beschrieben werden. Mit dieser Eigenschaft korrelierten bestimmte prosodische Realisierungen, die auch in dem folgenden Transkriptausschnitt (Zeile 18) wieder auftreten: Die als schnell perzipierte Intonationsphrase enthält nur nur eine einzige akzentuierte Silbe und die Silbendichte ist höher als in den sie umgebenden Phrasen. Aber im Ausschnitt (51) kommt eine weitere suprasegmentale Eigenschaft hinzu, denn die Zeile 18 wird mit reduzierter Lautstärke (° °) produziert: China 01 I: 02 T: 03 04 I: 05 06 07 08 T: 09 10 I: 11 12 13 T: 14 I:

->

15 16 17 18 19

T: T: I: T:

Die 'Vera war 'richtig "sauer. ° ahm a h m ' (1.0)

weil sie- ähm weil siesie=hat=Tcein Wort verstanden:,= =und hat das überf- (.) 'sah (d)as 'einfach 'überhaupt nich 'ein.= =hmhm (0.5) sie meinte (.) sie hat (.) äh ge'nug stu'diert und so, und es is (.) für- °äh° auf ner (.) 'interdisziplinlären ITagung isses einfach ne 'Unverschämtheit, (.) r°hm°°l so (0.63) ähm 'hochtrabend (.) mit 'solchen 'Ausdrück I en da'her Izukommen; I I [4.56] 3,5 Γ" hmhm°°l (1.33) I "hm'" I l°#wie=die l'Moellmann das gemacht hat [1.43] 5,6 Mich wundert des ...

In dem Transkriptausschnitt berichtet I ausführlich, wie verärgert Vera über einen Vortrag von Moelimann gewesen ist. Einer ersten Bewertung54 reduzierte Rederechtausschlagungspartikel

in Zeile 1 folgen eine in der Lautstärke

(continuer) von Τ und eine Pause von 1 Sekunde.

Ab Zeile 5 begründet I, warum Vera sauer war. In den Zeilen 8 und 9 folgen wieder minimale Rezipientensignale und eine Pause. I fährt fort, in indirekter Rede Veras Beschwerde zu reportieren, bis sie in Zeile 14 das Ende einer Redezugkonstruktionseinheit und damit eine mögliche redezugübergaberelevante Stelle erreicht hat. Diese Intonationsphrase beendet sie allerdings nicht mit stark fallender Intonation. Kurz vor dem syntaktischen Abschlußpunkt hat Τ erneut eine Rederechtausschlagungspartikel produziert, und nach Abschluß der Konstruktionseinheit

Zur Organisation von Bewertungen vgl. Kapitel 3.

238 ensteht eine freie Gesprächspause (lapse)55 von 1.33 Sekunden, die simultan sowohl von Τ mit einem weiteren minimalen Rezipientensignal als auch von I mit der Fortsetzung ihres Redezugs aufgrund der Sprecherwechselregel (lc) (Wenn der bis zu diesem Punkt realisierte Tum keine Fremdwahl enthält, kann der gegenwärtige Sprecher seinen Redezug fortsetzen, vorausgesetzt es erfolgt keine Selbstwahl, vgl. Kap. 2.4.2) beendet wird. Diese Fortsetzung des Redezugs in Zeile 20 produziert I nun, wie bereits gesagt, prosodisch deutlich anders als ihre vorangehenden Beiträge: Schneller, mit weniger Akzenten und leiser. Wie das Transkript zeigt, erfolgt der Sprecherwechsel in Zeile 19 nun ohne die geringste Verzögerung in direktem Anschluß (latching) an das Ende der Intonationsphrase 18. Denn nun produziert Τ keine Rederechtausschlagungspartikel mehr, mit denen sie I ihren Rezipientenstatus anzeigt, sondern sie thematisiert nun ihre Verwunderung über Veras Nichtverstehen. Man könnte also die Hypothese formulieren, daß die Intonationsphrase 18 mit ihrer prosodischen Markierung (schneller, leiser und weniger Akzente) kontextualisiert, daß mit dem für den Rezipienten antizipierbaren nächsten syntaktischen Endpunkt nicht nur ein möglicher

Abschlußpunkt (possible turn

completion point) und eine mögliche übergaberelevante Stelle (transitions relevance place) erreicht wird, sondern daß I tatsächlich ihren Redezug beendet hat und ein Sprecherwechsel damit antizipierbar relevant wird. Die prosodische Markierung (schneller, leiser, wenig Akzente) wäre damit eine Technik, die Sprecher einsetzen können, um ihren Rezipienten das Ende des Redezugs (turn exit device) anzuzeigen. Doch betrachten wir dazu den Transkriptausschnitt (52): (52) China 30f 01 T: =und Me'lakka is ganz witzig, 02 weil da der'Stadtkern portugiesisch ist.= 03 I: =a l'ha:: ((schwärmerisch)) 04 Τ: I und es paßt "ab'so'lut 'nicht 'in 'die 'Tropen. 05 (0.72) 06 un:d (.) da 'gibts auch noch so 'Leute, 07 die portugiesischer'Abstammung sind; 08 und die 'reden anscheinend noch en Portugiesisch, 09 (0.77) 10 das: (.) ver'wandt is, 11 oder das: (0.26) ja (0.21) e- (.) 12 das halt 'eher 'dem Portugiesisch 'ähnelt, (0.31) 13 Ivom l'siebzehnten (.) Jahr'hundert; 14 I: Ihm I 15 T: als die 'aus (0.59) äh 'fuhren nach Ma'laysia;= 16 =als dem 'heutigen Portugiesische 17 =#und des 'reden die 'immer noch.# 18 (0.37) 19 I: °ja° -> 20 T: #Also Melakka is'schon ganz interessant als'Stadt.#= 21 I: 55

=Wie 'weit is des ent'fernt?

Vgl. FN 8 in Kapitel 3.

[1.67] 4,8 [1.84] 5,4 [2.61] 4,2 [1.88] 4,3 [1.77] 5,7 [2.23] 5,8 [1.88] [2.44] [2.27] [1.62]

2,1 2,1 4,4 4,3

[3.34] 3,3 [1.74] 4,5 [117] 6,8

[1.82] 7,1

239 Die Intonationsphrase 20 in Beispiel (52) weist keine zusätzliche Lautstärkereduktion auf, dennoch übernimmt I im Anschluß an Zeile 20 den Redezug nach einem längeren Beitrag. Daß die beiden Intonationsphrasen dennoch die gleiche Funktion haben, wird deutlich, wenn man den Aufbau von Ts Redezug in Beispiel (52) näher betrachtet. Wie in Beispiel (51) beginnt Τ ihren Redezug in Zeile 01 mit einer Bewertung (Melakka ist ganz witzig), der ebenfalls wie in Beispiel (51) von Zeile 02 bis Zeile 17 eine elaborierte Begründung ihrer Einschätzung folgt. Im Vollzug dieser Begründung ereicht Τ an zwei Stellen einen Punkt, an dem ein Sprecherwechsel möglich und erwartbar gewesen wäre. Im Anschluß an Zeile 04 ist das Ende einer Redezugkonstruktionseinheit erreicht, und die Intonationsphrasengrenze wird durch eine tief fallende Kontur gekennzeichnet. Dennoch entsteht eine Pause von 0.72 Sekunden, die wieder von Τ durch die Fortsetzung des Redezugs beendet wird. Der nächste Abschlußpunkt dieser Art ist in Zeile 17 erreicht. Thematisch wird an diesen beiden Stellen ebenfalls ein Endpunkt erreicht, denn von Zeile 02 bis Zeile 04 schildert Τ eine architektonische und von Zeile 06 bis Zeile 17 eine linguistisch interessante Besonderheit von Melakka. Doch auch im Anschluß an Zeile 17 übernimmt I den Redezug nicht, sondern produziert nach 0.37 Sekunden erneut eine Rederechtausschlagungspartikel, so daß Τ in 19 ihren Redezug fortsetzt. Erst im Anschluß an diese Fortsetzung erfolgt die Redezugübernahme. Ohne Berücksichtigung der durch Selbstreparaturen und redezuginterne Pausen deutlich reduzierten Intonationsphrasen 10,11 und 15 (vgl. dazu Abschnitt 4.2.2) erreicht Τ in diesem Redezug bis einschließlich Zeile 16 eine Durchschnittsgeschwindigkeit von 4,8 Silben/Sek. pro Intonationsphrase. Gegenüber dieser Durchschnittsgeschwindigkeit ist Zeile 20 mit 7,1 Silben/Sek. deutlich erhöht. Die Redezugübernahme, die auch in diesem Beispiel ohne die geringste Verzögerung im Anschluß an das Ende der Intonationsphrase 20 erfolgt, weist darauf hin, daß auch hier die Geschwindigkeitserhöhung als Technik zur Kontextualisierung des Redezugendes fungiert. Ist also die reduzierte Lautstärke, die diese Markierung in Beispiel (51) begleitet, ein irrelevanter Kontextualisierungshinweis? Ich glaube nicht. Meiner Meinung nach ist es vielmehr so, daß die beiden Transkriptausschnitte zeigen, daß Kontextualisierungstechniken einer gewissen Merkmalsredundanz (vgl. dazu auch Kap. 1) unterliegen, indem verschiedene Mittel einem gemeinsamen Ziel dienen. Unter bestimmten Umständen - nämlich dann, wenn die Interpretierbarkeit bereits durch andere Techniken sichergestellt ist - kann auf weitere zusätzliche Kontextualisierung verzichtet werden. Um diese These untermauern zu können, ist es notwendig, noch einmal die Geschwindigkeitsveränderung in dem Transkriptausschnitt (52) zu betrachten. Es bleibt nämlich noch zu klären, warum im Anschluß an Zeile 17 kein Sprecherwechsel stattgefunden hat, obwohl I bereits hier ihre Sprechgeschwindigkeit mit 6,8 Silben/Sek. deutlich erhöht hat. Nach dem bisherigen Stand der Argumentation gibt es nur zwei mögliche Begründungen für dieses Ausbleiben. Entweder erfolgt hier kein Sprecherwechsel, weil die Geschwindigkeitserhöhung

240 ohne die Lautstärkereduktion doch keine Markierung des Redezugendes kontextualisieren kann, oder in Zeile 20 gibt es eine zusätzliche Kontextualisierung, die in Zeile 17 fehlt, so daß die Sprechgeschwindigkeitserhöhung hier nicht ausreichend ist. Meiner Meinung nach ist die Lautstärkereduzierung in Zeile 20 deshalb verzichtbar, weil das Ende des Redezugs auch auf der inhaltlichen Ebene durch

Themenbeendingungsmarkierung

(topic exit device) angezeigt wird. Covelli & Murray (1980: 385) haben drei Techniken identifiziert, mit denen Geprächsteilnehmer signalisieren können, daß ein bestimmtes Thema hinreichend erörtert worden ist. 56 Eine dieser Techniken besteht darin, daß ein Sprecher seinem Redebeitrag keine für den Rezipienten neue Information mehr hinzufügt, sondern nur noch bereits Gesagtes wiederholt oder zusammenfaßt. Genau dies geschieht in Beispiel (52) dadurch, daß Τ mit Zeile 20 den Beginn ihres Redezugs, in dem sie die Besonderheiten der Stadt Melakka schildert, wiederaufgreift, resümierend zusammenfaßt (also) und keine weiteren, neuen Argumente für ihre Einschätzung mehr liefert: ->

01 T:

=und Me'lakka is ganz'witzig,

->

20 T:

#Also Melakka is 'schpn ganz interessant als Stadt.#=

Nun könnte man aber argumentieren, daß diese Themenbeendigungstechnik bereits in Zeile 17 angewendet wird, denn auch hier wird keine neue Information angefügt, sondern ebenfalls Bekanntes resümierend zusammengefaßt (und des reden die immer noch). In der Tat wird auch hier ein Themenabschluß kontextualisiert, doch im Gegensatz zu Zeile 20 wird nur eines der beiden Argumente zur Begründung von Ts Einschätzung beendet, aber es wird nicht kontextualisiert, daß der gesamte Redezug nun an einem Punkt angekommen ist, an dem der Sprecher keine neue Information mehr liefert. Strukturell hätte Τ nämlich die Besonderheit von Melakka auch nach dem Abschluß von Zeile 17 mit einem dritten Begründungsaspekt, z.B. einer besonderen Kleidung, weiter elaborieren können: >

>

56

undMe'lakka is ganz witzig,

01 02 - 0 4 06 - 1 6 17

#und das reden die immer nocM (Kleidung)

Bewertung 1. Begründung 2. Begründung Themenbeendigung (3. Begründung)

20 T:

#Also Melakka is 'schon ganz interessant

Redezugende

Architektur Sprache

Vgl. dazu auch Uhmann (1989a: 154ff) sowie FN 53 in Kap. 3.

241 Die Wirksamkeit, mit denen die identifizierten Kontextualisierungsmittel (schnell, leise und wenig Akzente) und die Wiederholung von bereits Gesagtem mögliche Redezugübergabepunkte zu tatsächlich durchgeführten Redezugübergabepunkten macht, zeigt sich besonders deutlich in dem nächsten Transkriptausschnitt: (53) China 2f (Thema: eine Tagung, die Τ und I besucht haben, und die Unsicherheit einer Referentin bezüglich ihres dort gehaltenen Vortrage) 01 T: und da hab ich erstmal be'merkt, °daß die 'wirklich auch 'unsicher sein kann.° 02 (0.5) 03 04 I: hmhm 05 T: °° hat mich schon gewundert,'"' (0.5) 06 #< Und dann vor allem als die# (0.37) die 'Vera >= [2.46] 4,0 07 08 =die bei 'di::r gewohnt hat, [ 1.09] 5,5 09 (0.7) 10 I: hmhm 11 T: als'die sie auf den 'Vortrag 'abgesprochen hat [2.17] 5,5 I #°wäh I rend der Tagung.°# [0.70] 7,1 -> 12 13 I: I "hm' I 14 I: Ja=das- ich hab Ein von langen Pausen durchsetzter Redezug, in dem der Rezipient nur Rederechtausschlagungspartikenn (hmhm) produziert, wird genau im Anschluß an eine so markierte Intonationsphrase durch Selbstwahl (vgl. die Regel lb der Redezugzuweisung in Kap. 2.4.2) in Zeile 14 beendet. Der Visi-Pitch-Ausdruck57 dieses Transkriptfragments zeigt deutlich die Unterschiede in der Sprechgeschwindigkeit zwischen den Zeilen 11 und 12. Die Silbendichte steigt in Zeile 11 von 5,5 Silb./Sek. auf 7,1 Silb./Sek. in Zeile 12 an. Außerdem sieht man deutlich die Abwesenheit von Akzenttönen in Zeile 12, denn der sekundäre Akzent wird nicht über die Grundfrequenz markiert. (53) China 2f: 12 (Figur V)

57

Der Visi-Pitch-Ausdruck zeigt auch, daß es sich bei den Zeilen 11 und 12 um eine Intonationsphrase handelt. Wie in Kapitel 2.4.4 beschrieben, handelt es sich um eine prosodisch unselbständige Mittelfeldentleerung. Für die Analyse der Sprechgeschwindigkeitsveränderung wurde die Dauer dieser Passage jedoch ausnahmsweise unterhalb der Intonationsphrasengrenze gemessen.

242 Bei diesem Transkriptausschnit zeigt sich vielleicht auch, daß die Geschwindigkeitserhöhung das primäre Kontextualisierungsmittel ist, denn deutlich reduzierte Lautstärke allein fuhrt, das zeigen die Zeilen 02 und vor allem 05, hier offenbar nicht zur Selbstwahl. Vielleicht wurden die prosodischen Mittel (schneller, leiser weniger Akzente) in Zeile 12 aber zu früh piaziert, denn der weitere Fortgang des Gesprächs zeigt, daß Τ noch nicht alles mitgeteilt hat, was sie zu diesem Thema sagen wollte. Die Fortsetzung ihres Redezugs ist nach der erfolgten Selbstwahl von I jedoch zunächst nicht mehr möglich. Erst durch Is Frage in Zeile 21 erhält Τ noch einmal die Gelegenheit zur weiteren Elaborierung ihres Themas in den Zeilen 23 und 24: (53) China 2f (Fortsetzung) 14 I: Ja=das- ich=hab= ldas=nur=von (0.5) 'Weitem ? -> 15 S: 1 ° (das hat die) total verunsichert ° 16 (0.57) 17 I: g-gehört inner: 18 das war 1 unten in 1 ner 'Arche. 19 T: 1 "hm"" 1 20 T: °hmhm° 21 I: Hat sie das (0.21) 'sehr ver'un 1 sichert? 22 T: 1 °°hmhm" -> 23 T: #Vor=allem=auch#in=dem='Ton.= -> =°in dem" (0.41) ähm die 'Vera se 'angesprochen hat. 24 25 (0.58) 26 I:

Die 'Vera war 'richtig "sauer.

Doch ebenso wie manchmal (z.B. in Bsp. 52) bei Merkmalsredundanz auf bestimmte Kontextualisierungshinweise verzichtet werden kann, ist es in anderen Fällen notwendig, weitere Kontextualisierungshinweise einzusetzen, die die Interpretation eines Redezugs sicherstellen. Einen solchen Fall dokumentiert die Zeile 34 in Beispiel (54): (54) Kurzsichtig 14 01 C: äh 'mir 'könntet j a 'eigentlich mal, 02 # s=fällt=mir=grad apropos 'Bratkartoffeln ein # 03 'mir 'könntet ja mal ähm (0.27) bißle 'Geld zammelege,= 04 =könnte=mal was zamme ähm aso esse oda so (0.55) 05 S: Koche (0.32) 06 C: ja koche es=isch vielleicht zu aufwendig ((Diskussion: gemeinsames Kochen)) 10 M: also wie war des mit der Einladung zum Abendessen 11 das wolle=wir=doch=nochma en bißchen präzisie:ren 12 C: des hab ich nicht gesagt 13 ((Gekicher)) 14 C: also ma könnte j a 15 angenomme ich würde jetz en 'Kä:sfondue mache:, 16 denn könnt=ich des natürlich für so viele Leute (0.19) nicht verzahle

243 17 #beziehungsweise würde=des ga nit 'einsehe# des verzahle zu 'müsse (0.28) 18 un denn könnt=ma ja sage 19 M: da kann ich leider nich 20 ich ich habe einen Leberschaden ((Diskussion: Μ verträgt Käsefondue nicht, Allgemeines Gekichere)) 30 31 32 33 34 35 36 37 38 39 40

C: ja oda mir würde was=weiß='ich (0.39) wa:s mache irgend=was halt (0.24) oda'griechische Sa'lat #oda=irgendwas# un 'jeder zahlt 'zwei 'Mark (0.38) des wär doch aumal was andres; oda, (0.28) B: mhm L: mhm (1.34) L: wenn du des denn mache würdesch (0.14) gern M; vielleicht kommen dann auch noch mehr

[1.54] 5,1 [0.58] 5,2 [1.39] 8,6 [1.13] 5,3 [ 1.20] 8,3

Ausgangspunkt dieses Transkriptausschnitts ist Cs Vorschlag in den Zeilen 03 und 04, Geld zusammenzulegen, um davon ein gemeinsames Essen zu bezahlen. Da sich die Gruppe ansonsten nur in unregelmäßigen Abständen zum Kaffeklatsch trifft, ist dies eine qualitative Veränderung in der Organisation ihres Zusammenseins. Aus dem Vorschlag entwickelt sich im weiteren Verlauf des Gesprächs eine Einladung zum Abendessen (vgl. Zeile 10 bis 15), die C jedoch von zwei Bedingungen abhängig macht: Es soll nicht zu aufwendig gekocht werden, und alle sollen sich an den Kosten beteiligen. Trotz dieser Einschränkungen hat C für ihre Rezipienten erkennbar einen Vorschlag bzw. eine Einladung ausgesprochen und damit sequentiell das erste Paarglied einer Paarsequenz eröffnet. D.h., ein Akzeptieren des Vorschlags bzw. eine Annahme der Einladung sind dann die normativ erwartbaren und präferierten Folgehandlungen, die - wie die Analyse der Bewertungspaarsequenzen in Kapitel 3 gezeigt hat - ohne Verzögerung produziert werden sollten, sobald das erste Paarglied für die Rezipienten erkennbar abgeschlossen ist (vgl. Kap. 3.1.1). Die Frage stellt sich also, wann in diesem Transkriptausschnitt das erste Paarglied erkennbar abgeschlossen ist. Ich glaube, man kann zeigen, daß der erste Abschlußpunkt von Cs Vorschlag (gemeinsames Essen mit Kostenbeteiligung) in Zeile 04 erreicht worden ist. Trotz der redezugprolongierenden Maßnahmen (oder so) entsteht aber eine Redezugvakanz

(gap), die von S nicht mit der konditioneil

relevanten Folgeäußerung, sondern mit der Verschiebung des Vorschlags auf gemeinsames Kochen beendet wird. Von Zeile 14 bis 18 erneuert C ihren Vorschlag, der jetzt zu einer Essenseinladung präzisiert worden ist. Am Ende der Intonationsphrase 18 ist C jedoch erkennbar nicht am Ende des wiederholten ersten Paarglieds angelangt, denn bis zu diesem Punkt wurde nur ein Vorschlag bezüglich des Essens präzisiert, aber die Kostenbeteilung nicht erneut thematisiert. Der komplette Vorschlag wird in den Zeilen 30 bis 33 wiederholt.

244 Spätestens 5 8 mit der Zeile 33 ist das erste Paarglied (Vorschlag/Einladung) erkennbar abgeschlossen und die präferierte konditioneil relevante Folgeäußerung (Akzeptieren des Vorschlags bzw. der Einladung) sollte ohne Verzögerung (upon completion) produziert werden. Es entsteht jedoch wieder (vgl. Zeile 33) eine Redezugvakanz, die von C durch die Fortsetzung ihres Redezugs in eine redezuginterne Pause transformiert wird. Die Fortsetzung von Cs Redezug in Zeile 34 hat nun alle Eigenschaften, mit denen Sprecher in den vorher diskutierten Transkriptausschnitten das Ende ihres Redezugs kontextualisiert haben. Er wird mit einer Silbendichte von 8,3 Silben/Sek. deutlich schneller als die direkt vorangehende Intonationsphrase produziert, er ist in der Lautstärke reduziert, und er ist inhaltlich eine bewertende Zusammenfassung des Vorschlags (vgl. auch Maynard 1980: 266), die keine neuen Aspekte mehr thematisiert. Darüberhinaus enthält er eine weitere Technik zur Signalisierung des Endes eines Redezugs - nämlich die Rederechtzuteilungspartikel

(tag) oda, (vgl. auch

Covelli & Murray 1980: 385). Im Gegensatz zu den bisher vorgestellten Transkriptausschnitten erfolgt im Anschluß an diese Intonationsphrase jedoch keine unverzögerte Redezugübernahme. Da aber das Ausbleiben nicht darauf zurückzuführen sein kann, daß C ihr erstes Paarglied nicht für die Rezipienten erkennbar abgeschlossen hat oder daß dieser Abschluß nicht von den Rezipienten antizipiert werden konnte, kann die Verzögerung der Folgehandlung und die schwache Zustimmung nur als ein weiteres Indiz für das in Kapitel 3 ausführlich diskutierte formale Präferenzsystem interpretiert werden: Offene Ablehnung ist dispräferiert und wird durch die Verzögerung und die Realisierung der präferierten Annahme in schwacher Form (wenn du des denn mache würdesch (0.14) gern) vermieden. Es läßt sich also festhalten, daß die in Abschnitt 4.2.3 analysierte Funktion der Sprechgeschwindigkeitserhöhung zur Kontexualisierung von Zusammenfassungen und Wiederholungen von bereits Gesagtem, die prosodisch durch die Erhöhung der Sprechgeschwindigkeit markiert werden, nicht nur der Themenstrukturierung dienen, sondern sie werden auch redezugintem zur Kontextualisierung des Endes eines Redezugs (tum exit device) eingesetzt. Das heißt, daß die Eigenschaft, auf einer textsemantischen Ebene wenig relevant zu sein, nicht bedeutet, daß die so markierten Intonationsphrasen auch interaktiv wenig relevant sind. Ganz im Gegenteil - denn die Organisation des Sprecherwechsels gehört zu den zentralen Aufgaben, die Konversationsteilnehmer in Alltagsgesprächen zu leisten haben.

Aufgrund meiner Kompetenz als 'native member' erscheint es mir so zu sein, als ob eine allgemeine Zustimmung bzw. Annahme der Einladung bereits an einem viel früheren Zeitpunkt möglich und erwartbar gewesen wäre, wenn Cs Vorschlag mit einer gewissen Begeisterung aufgenommen worden wäre. Hier fehlen jedoch systematische Analysen zur Annahme bzw. Ablehung von Einladungen. Die schwachen Reaktionen in den Zeilen 35, 36, 38 und 39 sowie das Ausbleiben einer Reaktion von S weisen jedoch auf ein 'Problem' hin.

245 4.2.5 Parenthesen, Appositionen, Einschübe und Seitensequenzen In der Literatur 59 wurde immer wieder darauf hingeweisen, daß Parenthesen

nicht nur

syntaktisch, sondern auch prosodisch von ihrer Umgebung abgesetzt werden. Ich möchte in diesem Abschnitt wieder die Kontextualisierungsfunktionen von Sprechgeschwindigkeitsveränderungen analysieren und zeigen, daß (wie bei den in den beiden letzten Abschnitten behandelten Phänomenen) Sprechgeschwindigkeitsveränderungen von den Interaktionsteilnehmern eingesetzt werden, um auf der Ebene der thematischen Diskursorganisation die Informationsgewichtung ihrer Beiträge anzuzeigen. Bevor ich dies zeigen kann, muß jedoch der Phänomenbereich näher eingegrenzt werden, denn wenn man die Literatur zur Parenthese konsultiert, so zeigt sich, daß unter dieser Überschrift eine Reihe, teilweise sehr heterogene Konstruktionen subsumiert werden. Beginnen wir mit zwei Grammatiken. In der Akademiegrammatik (Heidolph et. al. 1984: 705) wird die Parenthese wie folgt definiert: Parenthesen sind selbständige Wortgruppen und Sätze, die zwar in einem Matrixsatz eingebettet, aber nicht syntaktisch einbezogen sind: Anredenominative, Inteijektionen, 'Schaltsätze'. (Heidolph et. al. 1984: 760)

(55) Ludwig Renn hat - ich glaube während des Krieges - viele Jahre in Mexiko gelebt. Deutlich enger ist dagegen Eisenbergs (1989: 255) Definition, denn für ihn ist eine Parenthese ein "eingeschobener Hauptsatz. Die Eisenberg (1989: 254) entlehnten Beispiele (56) (a -c) zeigen jedoch, (56) (a) Ronald - er ist der berühmte Kammersänger - tritt in Berlin auf. (b) Ronald, der ein berühmter Kammersänger ist, tritt in Berlin auf. (c) Ronald, der berühmte Kammersänger, tritt in Berlin auf. daß die Abgrenzung zwischen Parenthesen, appositiven Relativsätzen und Appositionen, die als Spezialfall der Attribuierung syntaktisch und referentiell mit dem Bezugswort übereinstimmen und es näher spezifizieren (vgl. auch Kap. 2.3.2), nicht unproblematisch ist. Raabe (1979) identifiziert sowohl Schaltsätze als auch appositive Nominalphrasen als Appositionen, während Altmann (1983: 63) Appositionen (appositive Adjektive, Nominalst

Zur Analyse von Parenthesen vgl. auch die Arbeiten von Altmann (1981), Bassarek (1987), Brandt (1995), Schindler (1990) und Schönherr (1993), auf die ich im folgenden noch eingehen werde. Zum Englischen vgl. Reinhart (1983), die zwischen "speaker-oriented" {Ed\ will be late he\ said, 1 Intonationsphrase) und "subject-oriented-parentheticals" (He\would be late, Ed[ said, 2 Intonationsphrasen) unterscheidet, und Ziv (1983), die Parenthesen im Rahmen der Funktionalen Grammatik als Instanziierungen der pragmatischen Funktion Tail' (modifiziert gegenüber der Definition von Dik (1978) als 'afterthought') untersucht.

246 phrasen, adverbiale Präpositionen und Genitivattribute, aber nicht appositive Relativsätze) als "spezielle Typen von Parenthesen, nämlich solche, die sich auf eine Basis im gleichen Satz beziehen und zu dieser syntaktisch und semantisch in bestimmten Beziehungen stehen", klassifiziert. 60 Als eigentliche Parenthesen werden bei Altmann (1981: 63f) die folgenden Konstruktionen genannt: (57) (a) Satzadverbien Die alte Generation, natürlich, war noch bereit draufzuzahlen. (b) Satzgliedstrukturen (auch Gliedsätze) Und dieser, nachdem er meine Arbeiten studiert hatte, sicherte mir zu, daß ... Ich habe mich, was die Spätwirkungen dieser Erfahrung betrifft, doch verschätzt. (c) Satzstrukturen Schika... sah wahrhaftig aus - hier wollte die abgegriffenen Redewendung her - wie einer, der nicht bis drei zählen konnte. Parenthesen weisen nach Altmann (1981: 64f) die folgenden Eigenschaften auf: "ein korreferentes Element oder ein Bezugselement [...] muß nicht vorhanden sein [...]", topologisch betrachtet können Parenthesen an "Parenthesennischen" piaziert werden, d.h., "zwischen Vorfeldelement und finitem Verb, nach dem finiten Verb, an Satzgliedgrenzen innerhalb des Mittelfeldes, aber offenbar nicht zwischen klammerschließendem Element und Nachfeld, dagegen durchaus am Satzende."61 Schindler (1990: 210) bezeichnet parentheseverdächtige Erscheinungen als "HOSPITANTEN in Gastsätzen, im Ggs. zu den PARTIZIPANTEN des Träger- bzw. Matrixsatzes". Die parentheseverdächtigen Konstruktionen werden von ihm in zwei Großklassen unterteilt: (a) Einschübe (z.B. Schaltsätze, Inteijektionen, Anreden) Einschübe weisen "Satz- bzw. Äußerungswertigkeit" auf, ihr Bezugselement ist "der gesamte Satz [...] oder aber 'Teile der Kommunikationssituation"', sie sind "sehr stellungsvariabel". (b) Zusätze (Apposition, Rechtsversetzung, Nachtrag) Zusätze haben "ein Satzglied als Bezugselement" oder fungieren selbst "als Satzglied im Gastsatz", sie sind "hinsichtlich ihrer Stellungsmöglichkeiten [...] deutlich eingeschränkt."

60 61

Zur Abgrenzungsproblematik und ausführlicher Literaturdiskussion vgl. Schindler (1990: Kap. 11). Schaltsätze können jedoch auch innerhalb der NP vorkommen: Die - wie sie alle wissen/ ?meine Damen und Herren - exzessiven Orgien müssen aufhören (Schindler (1999: 211 FN 13). Schindlers eigenes Beispiel weist jedoch darauf hin, daß die gemeinsame Einordung von Schaltsätzen und Anreden nicht unproblematisch ist. Ansonsten bestätigen die Beipiele aus meinen Korpus die Parenthesennischen, wobei die Positionierungen in Bsp. (66) nach der C-Position und in Bsp. (67) nach der Mittelfeldentleerung besonders interessant sind.

247 Bei der Abgrenzenung der appositions- und parentheseverdächtigen Konstruktionen spielt das unterschiedliche Stellungsverhalten eine wichtige Rolle: Während die stellungsvariablen Einschübe "sowohl zwischen den Satzgliedern (Parenthesennischen) als auch rechts und - mit Einschränkungen - links des Satzes [...]" (Schindler (1990: 210) vorkommen können, sind die Zusätze "relativ zum Bezugselement beschränkt, z.T. ist lediglich unmittelbare Nachstellung möglich" (Schindler 1990: 214). Speziell auf die Erforschung der Syntax gesprochener Sprache bezogen, wurden Parenthesen von Bayer (1973) analysiert. Seinen Untersuchungsgegenstand legt er wie folgt fest: Untersucht werden nicht nur die sogenannten 'Schaltsätze', sondern alle Sequenzen im Bereich eines Satzes, die nicht als dessen Teil beschrieben werden können und auch nicht als 'Versprecher' oder sprachliche Fehlplanung identifizierbar sind. [...] Unter diese Parenthese-Definition fallen vollständige Sätze nur dann, wenn sie innerhalb eines anderen Satzes, des 'Trägersatzes' stehen. Sequenzen, die im Sinne des Satzbegriffs [...] (Subjekt + finites Verb) nicht satzwertig sind, können auch am Anfang oder am Ende des Trägersatzes auftreten. (Bayer 1973: 71)

Aufgrund dieser Definition kommt Bayer (1973: 71) zu folgender Liste von parenthetischen Konstruktionen: (58) (a) Schaltsätze die Regierungserklärung enthält vieles (ich will es schlicht und einfach sagen) wozu wir ja sagen können (b) Anredeformen und Anredenominative (Herr Präsident) (meine Damen und Herren) ich habe mich als Bundeskanzler der Großen Koalition (c) absolute Nominative62 es ist verbunden mit einem extremen Bewußtsein von Freiheit eben dieses ständige Abtasten des unendlichen Feldes von Möglichkeiten (eine Situation, die es früher überhaupt nicht gab) (d) Inteijektionen (ah) (oh) (na) (au) usw. (e) Satzwörter (bitte) (danke) (ja) (nein) usw. (ja) dazu muß man Talent haben (f) eingeschobene stereotype Floskeln (ich mein) (glaub ich) (nicht wahr) (sagen wir) usw. aber es ist meine Absicht zu einigen der (ich glaube) zum erstenmal in diesen Räumen des Bundestages umhergeisternden Parolen wenige Worte zu sagen

Gemeint sind wohl nicht Vorkommen des Nominativus Pendens, sondern Satzappositionen (vgl. auch Schindler (1990: 204).

248 Diese recht heterogene Liste wird bei der funktionalen Interpretation auf die Realisierung von zwei unterschiedlichen Funktionstypen zurückgeführt: "kontaktbezogene Parenthesen" (Funktion I) und "kommentierende Parenthesen" (Funktion II). Erstere dienen nach Bayers Analyse (1973: 79) "der Eröffnung, Prüfung und Aufrechterhaltung des psychischen und physischen Kontaktes innerhalb der in Kommunikation stehenden Gruppe", während letztere für die "Kommentierung der Nachricht bezüglich ihres Inhaltes, ihrer Formulierung und Gliederung oder bezüglich des zur Kodierung verwendeten Zeichensystems" verwendet werden. Aus diesen unterschiedlichen Funktionen leiten sich weitere Eigenschaften ab: Die vorwiegend wenig informationshaltigen Parenthesen der Funktion I wiederholen sich häufig in derselben Form. Dabei handelt es sich zumeist um formelhafte Sequenzen aus einer geschlossenen Liste von geringem Umfang: vorwiegend um Anreden, Ablehnungen, Ausdrücke für unbestimmte Zustimmung und Solidarität und Interjektionen. Diese kontaktbezogenen Parenthesen sind vorwiegend sehr kurz und syntaktisch wenig differenziert. Die überwiegend mehr informationshaltigen kommentierenden Parenthesen der Funktion Π wiederholen sich kaum einmal in derselben Form. Es handelt sich überwiegend um Sequenzen aus einer offenen Liste, um eingeschobene sogenannte Schaltsätze, die meistens syntaktisch gegenüber den Parenthesen der Funktion I erheblich differenzierter und länger sind. (Ausnahmen bilden hier nur einige Parenthesen, welche die Formulierung und Gliederung der Rede kommentieren: [...] genauer gesagt, mit anderen Worten usw. [...]. (Bayer 1973: 82)

Bei der stilistischen Analyse zur Überprüfung der Textsortenabhängigkeit (Vortrag, Diskussion und spontanes Gespräch) von Parenthesen erwies sich jedoch der syntaktische Teil der Definition ("alle Sequenzen im Bereich eines Satzes, die nicht als dessen Teil beschrieben werden können") für die Analyse der Textsorte 'spontanes Gespräch' als "unpraktikabel, da eben dieser Satz, relativ zu dem die Parenthese definiert werden soll, nur selten normadäquat auftritt" (Bayer 1973: 93). Deshalb gelten für die Textsorte 'spontanes Gespräch' nur die kontaktbezogenen Parenthesen (Funktion I) als Parenthesen. Eine solche Vorgehensweise, die grammatische Faktoren nur dann berücksichtigt, wenn sie sich problemlos in die funktionale Analyse einbeziehen lassen, ist für die Erforschung des Zusammenspiels von Grammatik und Interaktion jedoch wenig dienlich. Darüberhinaus ist die von Bayer (1973) vorgenommene Erweiterung des Phänomenbereichs auch funktional problematisch, denn es ist nicht zu sehen, worin die Gemeinsamkeit der beiden Funktionstypen bestehen könnte - ohne eine solche ist aber die Zuordnung zur der Überkategorie 'Parenthese' nicht zu rechtfertigen.63

Ähnlich kritisch äußert sich auch Betten (1976: 219). Bettens Arbeit krankt jedoch selbst an einem vergleichbaren Problem. Sie fordert eine gemeinsame Analyse von Anakoluthen, Ellipsen, Parenthesen und Korrekturen, die aber nur mithilfe von sehr allgemeinen und damit empirisch uninteressanten Funktionsbeschreibungen anvisiert wird: "So gesehen könnte die Parenthese dem Anakoluth und der Korrektur an die Seite gestellt werden als aktive Leistung des Sprechers, der noch während seiner Rede dem Hörer gewisse Konzessionen macht, wenn aus dessen Reaktion ersichtlich wird, daß er nicht ganz versteht oder erstaunt ist, mißbilligt etc., oder wenn dem Sprecher während des Redens bewußt wird, daß er den Hörer ohne gewisse Zusatzinformationen überfordert und anderes mehr" (Betten 1976: 219).

249 Einen völlig anderen Weg beschreiten Winkler (1969) und Brandt (1994). In seiner "kleinen Studie über eine Form der Rede" beschreibt Winkler den "Einschub" als eine der drei Grundgestalten der Intonation: [Es zeigt sich,] daß die Normalform des Einschubs akustisch gekennzeichnet ist durch jene Umkehr des Spannbogens der Aussage zur 'Mulde', durch ein beschleunigtes oder gar rasches Zeitmaß, durch einen tieferen Gliederungseinschnitt nach dem Einschub als davor, während der Einschub selbst möglichst nicht mehr gegliedert wird. (Winkler 1969: 286)

Aufgrund dieser primär prosodischen Definition des Einschubs untersucht Winkler in seinem Datenmaterial 179 Einschübe. 64 Gegenüber Bayers Liste von Parenthesen wird der Untersuchungsgegenstand sowohl erweitert als auch reduziert. Bei Winkler fehlt vor allem die bei Bayer am wenigsten überzeugende Gruppe der "Satzwörter" (ja, nein etc.). Die wichtigsten Erweiterungen sind: wörtliche Rede, Relativsätze, Nebensätze, Attribute und Appositionen. Auch bei Brandt (1994: 10), auf deren Arbeit ich bei der Analyse der Funktionen von Parenthesen noch einmal kurz zurückkomme, ist die Prosodie bzw. die graphische Abgrenzung 6 5 durch Klammern, Gedankenstriche oder Kommata das entscheidende Definitionskriterium, denn bei der Parenthese handelt es sich um einen intonatorisch abgrenzten Einschub in eine syntaktisch geschlossene Einheit, den sog. Trägersatz". [...] Es kann sich dabei um Ausdrücke jeder Art, von vollständigen und selbständigen Sätzen bis zu einzelnen Wörtern und Morphemen handeln.

Die von Winkler (1969) als Einschübe identifizierten Formen haben jedoch zumindest 'ex negativo' auch eine syntaktische Gemeinsamkeit: Da der Einschub, grammatisch genommen, immer wegfallen könnte, ohne den Satzverband zu zerstören, entfallen hier alle vom Verb notwendig geforderten 'Ergänzungen'. (Winkler 1969: 291)

Bei der funktionalen Analyse unterscheidet Winkler (1969: 293f) zwischen solchen Einschüben, die den "Redegegenstand" präzisieren, spezifizieren, ergänzen oder erläutern, und solchen, die als Kommentare zur "Redelage", zur Person des Sprechers oder Hörers, inter-

Datengrundlage waren 9 Tonbandaufnahmen von verschiedenen Studenten, die angewiesen wurden, einen "selbstgewählten Gegenstand in freier, zusammenhängender Rede verständlich darzustellen. [..]. Der Wortlaut wurde zunächst festgehalten und von Berichterstatter und einer gut eingehölten Hilfskraft [...] einzeln abgehört. Dabei entstand häufig der Eindruck, daB die Aussage nicht im Bogen gleichförmig durchgeführt war, sondern von einem Einschub unterbrochen, danach aber wieder aufgenommen wurde. Wir gingen also allein vom auditiven Eindruck im Zusammenhang der Rede aus" (Winkler 1969: 283). Die durchschnittliche Anzahl der Wörter pro Versuchsperson betrug 639 Wörter, durchschnittlich produzierten die VPs 20 Einschübe. Es gab jedoch eine beträchtliche, sprecherindividuelle Variation: Minimum 9 Einschübe - Maximum 36 Einschübe. 65

Datengrundlage sind Briefe (vgl. Brandt 1994: 16).

250 pretiert werden können. Aus dieser Beschreibung läßt sich also erkennen, daß ein großer Teil der von Winkler untersuchten Einschübe zu den bereits in Kapitel 4.2.3 ausführlich diskutierten Selbstreparaturen gehören: (59) ... von denen der letzte (also der Großvater) kein König war Abbrüche, Silbendehnungen und Pausen, die als Indizierungen von selbstinitiierten Selbstreparaturen fungieren (vgl. Kap. 2.4.3), wurden von Winkler allerdings nicht systematisch transkribiert, Beispiele wie (59) mit der reparaturindizierenden Partikel also (vgl. Winkler 1969: 286) sind in seinem Korpus jedoch häufig. Was kann als Fazit am Ende dieser (sicher nicht vollständigen, aber doch repräsentativen) Literaturbetrachtung stehen? Welche Konstruktionstypen sollen im folgenden der funktionalen Analyse unterzogen werden? Die weite Parenthesendefinition von Bayer (1973), der sich auch Schönherr (1993) 66 anschließt und die sowohl Schaltsätze (Parenthesen im 'engeren Sinne') als auch Gliederungssignale (Kontaktparenthesen) umfaßt, erscheint mir aus den oben genannten Gründen wenig sinnvoll. Die Beschränkung auf Schaltyäize, wie bei Eisenberg (1989), ist jedoch auch nicht zu rechtfertigen. Die Prosodie scheidet für diese Analyse als definitorisches Kriterium deshalb aus, weil sie in Form der Sprechgeschwindigkeitsveränderung als ein die Parenthese systematisch begleitendes Kontextualisierungsmittel ja Gegenstand der Analyse ist. Als Parenthesen werden im folgenden gewertet: selbständige Ausdrücke, die erstens in einen Matrixsatz eingefugt sind, die sich zweitens inhaltlich auf diesen beziehen und die drittens in diesem Matrixsatz ein korreferentes Bezugselement - im Sinne von Altmann - haben können, aber nicht müssen. Damit fallen auch bestimmte Appositionen (vgl. Bsp. 62, Zeile 02) unter die Rubrik der Parenthese, alle Gliederungssignale und Inteijektionen (kontaktbezogene Parenthesen im Sinne von Bayer) sind ausgeklammert, da sie sich inhaltlich nicht auf den Matrixsatz beziehen, sondern rezipientenorientiert sind. An dieser Stelle ist jedoch noch eine Präzisierung der Aussage notwendig, daß Parenthesen in ihren Matrixsatz "eingebettet" sind. Obwohl Parenthesen nicht nur anhand von verschriftlichen Daten analysiert wurden, ist eine besondere Art der Einbettung, wie sie in Beispiel (60) exemplifiziert wird, meines Wissens nach in der Literatur noch nicht beschrieben worden: (60) Kurzsichtig 14 01 C: äh'mir'könntet ja'eigentlich mal, -> 02 s=fällt=mir=grad apropos 'Bratkartoffeln ein 03 'mir 'könntet ja mal ähm (0.27) bißle 'Geld 'zammelege,= 04 ='könnte=mal was 'zamme ähm aso 'esse oda 'so (0.55) Schönherr (1993: 225) grenzt ihre Analyse jedoch von Bayers ab, indem sie darauf hinweist, daß sie weder gefüllte Pausen (äh etc.) noch Wortfragmente als Parenthesen wertet. Diese Formen werden jedoch von Bayer explizit ausgeschlossen (vgl. die Beispiele 25 - 30).

251 Das Beispiel (60) zeigt, daß es bei der syntaktischen Organisation von Parenthesen in Alltagskonversationen ein Phänomen gibt, das bereits bei der Reparaturorganisation (vgl. Abschnitt 4.2.2) eine wichtige Rolle gespielt hat. An einer bestimmten Stelle im Redezug wird die Verarbeitung des Rezipienten aufgehalten 67 , die bis zu dem Ende der Zeile 01 entwickelte Redezugkonstruktionseinheit setzt sich mit Zeile 02 nicht so fort, wie der Rezipient aufgrund seines grammatischen Wissens erwarten konnte, sondern die Redezugkonstruktionseinheit wird zugunsten einer Parenthese unterbrochen. Nach Abschluß der Parenthese wird der Matrixsatz jedoch nicht an der Abbruchstelle fortgesetzt, sondern deutlich vorher. (60)

# s=fallt=mir=grad apropos 'Bratkartoffeln ein # Parenthese äh 'mir 'könntet ja 'eigentlich mal,

'mir 'könntet ja

\

mal ahm (0.27) bißle 'Geld 'zammelege,

syntaktische Schleife

Mit einer syntaktischen Schleife 68 , die am Beginn der Redezugkonstuktionseinheit des Matrixsatzes ansetzt, wird ein Teil dieses Matrixsatzes nach Beendigung der Parenthese wiederholt, bevor der Sprecher seinen Redezug fortsetzt. Welchen Regeln diese Wiederholungsschleifen folgen, ist jedoch noch völlig unerforscht. Ich möchte mich nun der Analyse der prosodischen Markierung von Parenthesen zuwenden, beschränke mich aber auf die Analyse von Sprechgeschwindigkeitsveränderungen.69 67

Funktional handelt es sich bei diesem parenthetischen Einschub auch um eine Fehlplazierungsmarkierung (misplacement marker), mit der sich Konversationsteilnehmer an der konversationellen Maxime orientieren, daß die thematische Progression möglichst kohärent auf bereits thematisierte Aspekte der Konversation aufbaut." A further feature of the organization of topic talk seem to involve 'fitting' as a preferred procedure. That is, it appears that a preferred way of getting mentionables mentioned is to employ the resources of the local organization of utterances in the course of the conversation" (Schegloff & Sacks 1973: 301). Vgl. auch Jefferson (1978: 221ff).

68

Syntaktische Schleifen, die den Beginn einer Redezugkonstruktionseinheit wiederholen (recycled tum beginnings), spielen auch bei der Organisation des Sprecherwechsels eine wichtige Rolle (vgl. Schegloff (1987). Vgl. z.B. Jespersen ( 2 1913: 179f): "[···] als wichtiges Tempogesetz läßt sich konstatieren, daß der Redende das Tempo beschleunigt, wenn er sich bewuBt ist, dass er eine lange Lautreihe zu sprechen hat (die am liebsten 'in einem Zuge' gesprochen werden soll). Das zeigt sich [...] bei parenthetisch eingeschobenen kurzen Sätzen, z.B. 'mit eigentümlichem, man möchte beinahe sagen metallischen Klang', wo die kursiv

69

252 (60) Kurzsichtig 14 01 C: äh'mir'könntet ja'eigentlich mal, -> 02 #s=fällt=mir=grad apropos'Bratkartoffeln ein# 03 'mir "könntet ja mal ähm (0.27) bißle 'Geld 'zammelege,= 04 ='könnte=mal was 'zamme ähm aso 'esse oda 'so (0.55) (61) China 38™ 01 T: 'Komischerweise 'wußten die "andren Touristen, -> 02 #die'Deutschen und so#= -> 03 =#die ich da ge'troffen hab# 04 "wußten es überhaupt 'nicht; (0.79) 05 und I waren I deshalb "nie'da 06 I: I ahh I 07 T: und haben 'nie danach ge'fragt. (62) Kurzsichtig 14 01 C: äh 'mir 'könntet ja 'eigentlich mal, -> 02 # s=fällt=mir=grad apropos'Bratkartoffeln ein # 03 'mir 'könntet ja mal ähm (0.27) bißle 'Geld 'zammelege,= 04 -könnte=mal was 'zamme ähm aso 'esse oda 'so (0.55) (63) China 25 -> 01 I: bei 'China isses # glaub=ich # 'sehr 'wichtig, 02 inner 'dritten 'Welt, (0.88) 03 äh ne 'große 'Rolle zu spielen.

[1.90] [1.09] [2.51] [2.43]

4,7; 11; 5,1; 5,8;

1,5 0,9 1,5 1,6

[2.20] 5,9; 1,8 [0.62] 8,1; 1,6 [0.83] 8,4; 1,2 [ 1.39] 5,1; 2,1 [1.05] 6,7; 1,9

[1.90] [1.09] [2.51] [2.43]

4,7; 11; 5,1; 5,8;

1,5 0,9 1,5 1,6

[2.03] 4,9 [1.11] 4,5 [ 1.92] 4,6

Wieder wird anhand der Transkripte (60) bis (63) deutlich, daß die gemessene Silbendichte nur dann als phonologisches Korrelat des perzeptiven Eindrucks der Geschwindigkeitserhöhung dienen kann, wenn die Phase der Akzelerierung und die Intonationsphrasenbildung zusammenfallen. Dies scheint jedoch bei Parenthesen, wie ich sie definiert habe, häufig der Fall zu sein: (64) Selting 01 S: -> 02 03

(1987a: 144, adaptierte Transkription) das 'kostet allerdings # sag ich ihn ma gleich 'vorher # 'pro Seite drei 'Mark

(65) Schönherr (1995: 229, adaptierte Transkription) 01 X: 'damals (.) 'gab es, -> 02 #also in den 'ersten 'Jahren#, 03 'keine (.) offizielle äh Kulturpolitik, (.) 04 für die 'Jungen.

gedruckten Worte sehr rasch gesprochen werden." Als weitere prosodische Markierungen werden Pausen, z.B. Heidolph et al. (1984: 293) und Altmann (1981: 202), eine "zurückgenommene" Intonation und intonationsphrasenfinal ein "progredienter" Tonhöhenverlauf (Altmann 1981: 202) sowie ein niedrigerer bzw. höherer Tonhöhenverlauf (vgl. Abschnitt 4.1.5) genannt. Dieses Beispiel weist mit der Zeile 02 eine zusätzliche Besonderheit auf, die als pivot, Zeugma oder Apokoinu beschrieben wurde. Vgl. dazu Schegloff (1979:275f), Franck (1985) und Scheutz (1993).

253

Schönherr (1993: 228) stellt fest, daß in dieser Gruppe 86% der Parenthesen eine eigenständige Intonationsphrase bilden, allerdings werden in ihrem Korpus nur 29% der Parenthesen (i.e.S.) durch Sprechgeschwindigkeitserhöhungen markiert. Wenn dies der Fall ist, zeigen die Intonationsphrasen der parenthetischen Konstruktionen in meinem Korpus noch ein weiteres Merkmal, das sie prosodisch von ihrer Umgebung abhebt: Alle parenthetischen Intonationsphrasen enthalten nur einen einzigen Akzent, der konstitutiv für eine wohlgeformte Intonationsphrase des Deutschen ist (vgl. Kap. 2.3.1).71 Das Zusammenspiel der Parameter Silbendichte (Dichte I) und Dichte der akzentuierten Silben (Dichte Π) zeigt sich besonders deutlich in dem Beispiel (60): Während die Dichte I in Zeile 02 dramatisch ansteigt, fällt die Dichte II deutlich ab, und in den umliegenden Intonationsphrasen zeigt sich die komplementäre Verteilung. Welche Funktion haben nun die durch Veränderungen der Sprechgeschwindigkeit markierten Parenthesen? Sind sie, wie Winkler (1969) meint, Präzisierungen, Spezifizierungen, Ergänzungen oder Erläuterungen des "Redegegenstands" bzw. Kommentare zur "Redelage", zur Person des Sprechers oder Hörers? Oder dienen sie im Sinne von Bayers Analyse (1973) der psychischen und physischen Kontakteröffnung, -prüfung und -aufrechterhaltung einer kommunizierenden Gruppe (Funktion I) bzw. der Kommentierung einer Nachricht bezüglich ihres Inhaltes, ihrer Formulierung und Gliederung oder bezüglich des zur Kodierung verwendeten Zeichensystems (Funktion II)? Die von Bayer (1973) genannte Kontaktfunktion wurde als genuine Funktion der Parenthese bereits in Zweifel gezogen. Die anderen Vorschläge haben den Nachteil, daß sie einen so weiten Funktionsbereich angeben, daß dieser wohl kaum die Besonderheiten der parenthetischen Konstruktionen erfassen kann. Auf der Suche nach einer funktionalen Bestimmung von Parenthesen, kann jedoch vielleicht der Zugriff auf die konversationsanalytische Literatur hilfreich sein. In der Einleitung ihres Artikels "Side Sequences" beschreibt Jefferson (1972) ein Untersuchungsobjekt, das sich dadurch auszeichnet, daß eine Aktivität Α für einen gewissen Zeitraum unterbrochen wird, um einer Aktivität Β Platz zu machen. Nach Abschluß der Aktivität Β wird Α wiederaufgenommen und fortgesetzt: In the course of some on-going activity [...] there are occurences one might feel are not 'part' of that activity but which appear to be in some sense relevant. Such an occurence constitutes a break in the activity - specifically, a 'break' in contrast to a 'termination'; that is, the on-going acitivity will resume. This could be described as a 'side sequence within an on-going sequence'. (Jefferson 1972: 294)

Ähnliches bemerkt auch Schönherr (1993: 230f): Parenthesen weisen "im Gegensatz zur Trägerkonstruktion weniger oder gar keine Primärakzente a u f . Diese Aussage verweist aber auf eine problematische Akzentnotation, denn wenn die Parenthese eine eigenen Intonationsphrase bildet, sollte die relationale Akzentnotion auf diese Bezugsgröße beschränkt sein. Damit wäre die ausschließliche Notation von Sekundärakzenten unzulässig.

254 Zu den konstitutiven Eigenschaften des Untersuchungsobjektes gehört auch, daß die Aktivitäten Α und Β nicht gleichberechtigt nebeneinanderstehen, sondern Β ist Α untergeordnet: [...] the latter sequence is not merely 'another' sequence, but [...] it and others like it are [...] subsidiary to the former sequence. (Jefferson 1972: 309) As a first step in developing a description of 'subsidiary' sequences it can be noted that for formal events such as games there is frequently an alternative to the on-going activity which is not a competitive activity, does not result in termination of the on-going sequence. That alternative resides in the various sequences called 'time-outs'. Time-outs are formal subsidiary sequences. They are [...] of shorter duration than the game itself [...]. (Jefferson 1972: 314)

Solche 'Aus-Zeiten' 72 oder 'Intermezzi' unterbrechen nicht nur das Geschehen auf dem Fußballfeld oder auf der Bühne, sondern sie haben auch ein satzgrammatisches Pendant. Ich möchte mich hier Jeffersons Analyse anschließen, denn auch die Produktion eines Satzes A kann zugunsten eines Satzes Β für einen gewissen Zeitraum unterbrochen werden, wobei A nach Abschluß von Β wiederaufgenommen und fortgesetzt wird. Wenn darüber hinaus Α und Β nicht gleichberechtigt nebeneinander stehen, sondern der Satz Β dem Satz Α untergeordnet oder nebengeordnet und Β von Α syntaktisch unabhängig ist, liegt eine satzgrammatische AusZeit - eine Parenthese

- vor, die die Funktion erfüllt, Unterbrechungen des Arguments

anzuzeigen oder zusätzliche Informationen einzuschieben, die aber im Vergleich zu den Matrixsätzen als nebenrangig markiert werden. Der Vollzug einer "Nebenhandlung" wird auch von Bassarek (1987: 174) als die "spezifische pragmatischen Leistung von Parenthesen" angesehen. Nach Bassarek (1987) werden mit Parenthesen eigenständige illokutive Handlungen vollzogen, die jedoch von dem Sprecher gegenüber der illokutiven Rolle des Trägersatzes als nebenrangig eingestuft werden. Brandt (1994) wendet sich explizit gegen diese Analyse und identifziert die Funktion von Parenthesen nicht als "Nebenhandlungen", sondern als "Nebeninformationen".73 Die Erhöhung der Sprechgeschwindigkeit ist zwar ein häufig anzutreffendes Kontextualisierungsmittel für Parenthesen, es ist jedoch auch möglich, daß Konversationsteilnehmer ihre Sprechgeschwindigkeit reduzieren:

72

Vgl. auch Turner (1972/1976:178), der Aus-Zeiten als Zeitabschnitte bezeichnet, "die zwar irgendwie als Teil des Ereignisses, innerhalb dessen sie piaziert sind, angesehen werden müssen, die aber dennoch von den Teilnehmern als ein vorübergehendes Außerkraftsetzen zumindest einiger der ereignisgebundenen Regeln wahrgenommen werden können."

73

Es handelt sich bei Brandt (1994) um Nebeninformationen in bezug auf die 'Quaestio' eines Textes (vgl. FN 48). Zusammen mit Hauptinformationen sowie Vordergrund- und Hintergrundinformationen entwickelt sie vier Kategorien der Informationsstrukturierung, die die "Reliefgebung" in Texten auch ikonisch widerspiegeln. Brandt (1994) analysiert schriftliche Texte, bei Bassarek (1987) finden sich leider keine Hinweise auf das Datenmaterial

255 (65) China 12 01 I: 02 -> 03 04 T: 05 I:

Du aber (0.35) äh 'dann würd ich aber versuchen:; (0.68) + ähm über die A'dresse von der 'Ga: bi: zum Beispiel + hmhm versuchen bei 'irgendwelchen Leuten zu (0.42) zu über'nachten,

[1.79] 4,5 [3.83] 3,6 [3,39] 4,7

Dieses Kontextualisierungsmittel legt die Interpretation nahe, daß sich sich bei solchen parenthetisch eingeschobenen Äußerungsteilen zwar um nebengeordnete, nicht aber um untergeordnete Information handelt, denn die 'Gangart' (niedrige Dichte I, hohe Dichte II) ist ja die, die in Kap. 4.2.3 als typisch für solche Äußerungsabschnitte identifiziert wurde, denen auf einer textsemantischen Organisationsebene eine erhöhte Relevanz zugeschrieben wird.74 Bei den folgenden Transkriptausschnitten mit parenthetischen Konstruktionen wird die Sprechgeschwindigkeit wieder erhöht. Die Beispiele unterscheiden sich jedoch von den bisher diskutierten Parenthesen in zweierlei Weise. Die erste Gruppe enthält sequentiell implikative Parenthesen, die als initiale Redezüge Folgeäußerungen der Rezipienten elizitieren, die auf diesen parenthetischen Teil des Redezugs zugeschnitten sind. Es handelt sich also um Seitensequenzen in dem von Jefferson (1972) definierten Sinn. Die auf die Parenthese zugeschnittenen Folgeäußerungen sind Zustimmung (vgl. die Zeilen 08 und 10) in Beispiel (66) und Lachen in Zeile 08 in Beispiel (67): (66) China 39 01 I: 'entweder es 'gibt ne 'Flugverbindung (0.51) nach Cota 'Baru:, 02 T: hmhm 03 I: und dann 'mach ich das auch; 04 T: hmhm 05 I: und wenn- wenn es die 'nicht gibt (0.64) dann: (.) -> 06 # da hab ich keine 'Lust zu # -> 07 # zwei Tage 1 lang 1 im 1 'Zug zu 1 sitzen # lja=ja I 1 hmhm 1 08 T: -> 09 I: # und da 'hoch zu 1 fahren # 1 1 hmhm 1 10 T: 11 I: dann: ähm (.) bleib ich einfach 'hier; 12 + undh (0.73) fa:hre na:ch (0.2) IPortDixon 1 + 1 Port Dixon 1 okay. 13 T: (67) Kurzsichtig 2f 01 C: Ich Tiab die Alterna'tive (.) 'entweder die I TJrille, I (.) 02 ?: I ((Räuspern)) I 03 C: die Alternative entweder die Brille 'an'zu'ziehe,

7 4

[3.21] 2,4 [1.43] 4,8 [2.23] 4,1 [1.21] 4,9 [2.59] 2,7 [3.51] 1,9

[2.06] 7,8

Vgl. dazu auch Fleischer & Michel (1975: 183). Die Reduktion der Sprechgeschwindigkeit über die Kombination einer niedrigen Silbendichte mit einer hohen Dichte von akzentuierten Silben scheint mir ein auffälliges Stilelement der Politikerrede zu sein. Von diesem Kontextualisierungsmittel wird gerade bei dieser Textsorte häufig auch dann Gebrauch gemacht, wenn der kommunizierte Inhalt bei der Informationsgewichtung das Merkmal [- Relevanz] erhalten müBte.

256 04 -> 05 ->

06

07 08 09

+ 'im ma +, (0.3) #aber des 'kann=i it,# #weil die im Moment so 'häßlich isch# (0.5) 'o:der ich I zieh se nur 'denn auf, I hehehe ?: C: + wenn=i se 'wirklich (.) 'effektiv 'brauch; +

[0.44] [0.54] [1.06] [1.27]

4,5 11 8,4 6,3

[2.09] 4,3

Die Sprechgeschwindigkeitserhöhungen sind in diesen Beispielen dramatisch. In Beispiel (66) verdoppelt die Sprecherin beim Übergang von Matrixsatz zur Parenthese die Silbendichte von 2.4 Silben/Sek. in Zeile 05 auf 4,8 Silben/Sek. in Zeile 06. Nach Abschluß der Parenthese in Zeile 11 wird mit 2,7 Silben/Sek. fast die gleiche Sprechgeschwindigkeit wie vor der Unterbrechung durch die Parenthese erzielt. In Beispiel (67) ist der Übergang von Matrixsatz zu parenthetischer Seitensequenz noch deutlicher kontextualisiert. C reduziert ihre Sprechgeschwindigkeit zunächst: Die Silbendichte in Zeile 03 von 7,8 Silben/Sek. geht in Zeile 04 auf 4.5 Silben/Sek. bei der Realisierung der prosodisch selbständigen potentiellen Mittelfeldkonstituente imma zurück. Die erste Intonationsphrase der Seitensequenz, Zeile 05, wird dann mit einer Silbendichte von 11 Silben/Sek. realisiert. Ebenfalls noch sehr hoch ist die Silbendichte mit 8,4 Silben/Sek. in Zeile 06. Die Geschwindigkeitserhöhung in diesen beiden Intonationsphrasen wurde auch von allen Versuchspersonen perzipiert. Auch in diesem Beispiel fällt die Silbendichte nach Beendigung der Seitensequenz auf ein vergleichbares Maß zurück. Auch diese komplexen parenthetischen Seitensequenzen sind syntaktisch in Matrixsätze eingebettet. Die Unterbrechung erfolgt syntaktisch an einer Parenthesenische und konversationell an einer Stelle, an der die für den Matrixsatz gewählte Redezukonstruktionseinheit nicht an einem möglichen Endpunkt und damit an keiner redezugübergaberelevanten Stelle angelangt ist. Die Einbettung erfolgt in Beispiel (67) so, daß beim Herausschneiden der Parenthese keinerlei syntaktische Auffälligkeit zurückbleiben würde: (67) Ich hab die Alternative entweder die Brille 'an'zu'ziehe, 'im'ma, (aber des 'kann=i it, weil die im Moment so 'häßlich isch) 'o:der ich zieh se nur 'denn auf, wenn=i se 'wirklich 'effektiv 'brauch, In Beispiel (66) gibt es jedoch die bereits beschriebene syntaktische Schleife: (66) 'entweder es 'gibt ne Flugverbindung nach Cota 'Baru:, und dann 'mach ich das auch; und wenn- wenn es die 'nicht gibt -> dann: (da hab ich keine 'Lust zu zwei Tage lang im 'Zug zu sitzen und da 'hoch zu fahren) -> dann: ähm bleib ich einfach 'hier; und fa:hre na:ch (0.2) PortDixon

257 Die zweite Gruppe unterscheidet sich von der ersten nun darin, daß vor Beginn der parenthetischen Konstruktion ein möglicher syntaktischer Endpunkt und konversationell eine redezugübergaberelevante Stelle passiert worden ist, an der jedoch kein Sprecherwechsel stattgefunden hat (vgl. Regel lc der Redezugzuweisung in Kap. 2.4.2 und 4.2.4). Diese Parenthesen sind also syntaktisch nicht in einen Matrixsatz eingeschoben. Dennoch sind die Konstruktionen der nächsten Beispiele in komplexe Redezüge eingebettet und diese Seitensequenzen erfordern auch wieder Reaktionen der Rezipienten im Anschluß an den parenthetischen Einschub: (68) Kurzsichtig 01 C: Ich hab jetz emo ne andre Frage 02 ich hab mirs nämlich mal überlegt 03 da liest ma in letschter Zeit imma wieder Artikel drüber (0.3) 04 ähm (0.37) # aso bei 'mir isch des zum Beispiel 'so # 05 daß ich 'ganz mini'mal 'kurzsichtig bin;= =also 'null'fünf. 06 07 des heißt ich brauchs 'wirklich 'nur, wenn=ich (0.37) 'lange 'Zeit auf 'ein Tunkt kugge muß.= 08 =°# zum Beispiel im 'Film oder im The'ater oder so: ne, #° -> 09 10 B: hmhm 11 C: sonscht (.) fürd nor'male- (0.14) (69) China 22 01 T: "Komisch", 02 Also ich 'kenn das auch von Malaysia und 'Thailand her, 03 da ist das auch "ganz 'ganz 'stark so 04 je 'dunkler die Hautfarbe umso 'minderwertiger. 05 I: Ja? 06 T: Hm. und da 'zeigts sich auch an den 'Indern, 07 # in Ma'laysia is des so #, 08 daß die 'Inder rüberkamen als "Gastarbeiter 1 prak 1 tisch Ihm 1 09 I: 10 T: und 'den Status auch 'haben; 11 I: hmhm 12 (0.79) 13 T: Außer den 'Ärzten; -> 14 # es gibt indische 'Ärzte #, -> 15 # die ham irgendwie nen 'andren Status #. (0.35) 16 I: hmhm 17 T: ähm aber die 'andren Inder, 18 die sind so 'Arbeiter (1.0)

[2.25] 5,5 [2.24] 5,3 [1.85] 8,1 [1.40] 4,3

[2.84] 5,3 [1.40] 5,0 [0.96] 5,2 [0.92] 7,6 [1.56] 6,4 [1.52] 5,3 [1.29] 4,7

(70) Kurzsichtig 01 C: Ich 'war bei so me 'Volltrottel 'da, 02 der Tiat mir die 'Gläser da vor Tiinglatscht,= 03 =s- aso # ziehungsweise # 'eine ~Volltrotte'lin war des. (0.57) -> 04 I °#wenns l'Burchglese hosch weischja'au daßmades sage muß#° I I 05 Β: I ja I 06

(1.0)

[1.80] 5,5 [2.36] (0.8) [1.37] 10,2

258 07 08 09 05 06

L: C: ?: C:

Ihehehe I I'Urnd hehehe lge(j)? "hm" Und=ähm (1.31) je:denfalls

[0.60] 3.3 [0.63] 4,7

Eine Einbettung liegt deshalb vor, weil die Fortsetzung des Redezugs nach der Parenthese thematisch und syntaktisch (durch Konjuktionen oder Adverbien) an die Redezugkonstruktionseinheit vor der Parenthese angebunden wird: (68) des heißt ich brauchs 'wirklich 'nur, wenn=ich (0.37) 'lange 'Zeit auf 'ein T»unkt kugge muß. (zum Beispiel im 'Film oder im The'ater oder so: ne,) sonscht (.) fürd nor'male (69) in Ma'laysia is des so daß die 'Inder rüberkamen als "Gastarbeiter praktisch und 'den Status auch 'haben; Außer den 'Ärzten; (es gibt indische 'Arzte die ham irgendwie nen 'andren Status), ähm aber die 'andren Inder, die sind so 'Arbeiter (70) Ich 'war bei so me 'Volltrottel 'da, der "hat mir die 'Gläser da vor Tiinglatscht, s- aso ziehungsweise 'eine 'Volltrotte'lin war des. (wenns 'Bu:ch glese hosch weisch ja 'au daß ma des sage muß) Und=ähm jedenfalls die hot ma da so 'Gläser hinknallt Auch bei diesen Beispielen ensteht also retrospektiv der Eindruck, daß eine Aktivität Α für einen kurzen Zeitraum unterbrochen worden ist, um einer Aktivität Β Platz zu machen. Diese Aktivität Β wird der Aktivität Α unter- oder nebengeordnet. Damit erfüllen Parenthesen in der Diskursorganisation die Funktion, eine Unterbrechung des Arguments anzuzeigen oder zusätzliche Informationen einzuschieben, die aber im Vergleich zu den Matrixsätzen als nebenrangig markiert werden. Die Unterbrechung wird prosodisch durch Geschwindigkeitsveränderungen angezeigt, wobei in Alltagskonversationen in der Regel die Sprechgeschwindigkeit über die Erhöhung der Silbendichte akzeleriert wird. Im Zusammenspiel von Dichte I und Dichte II sind Parenthesen und Seitensequenzen meist dadurch gekennzeichnet, daß eine hohe Dichte I mit einer niedrigen Dichte II kombiniert wird. Die niedrigen Dichte II-Werte werden dadurch ereicht, daß die parenthetischen Intonationsphrasen zumeist nur eine einzige akzentuierte Silbe enthalten. Die komplementäre Gangart, niedrige Dichte I und hohe Dichte II, ist aber auch möglich. Solche Parenthesen werden als neben- aber nicht untergeordnet kontextualisiert.

259

4.3 Zusammenfassung Die in diesem Kapitel diskutierten Kontextualisierungsfunktionen, so konnte auch anhand der konversationeilen Daten gezeigt werden, kommen über unterschiedliche Kombinationen der für die Perzeption von Sprechgeschwindigkeit relevanten Parameter Dichte I und Dichte II zustande. Wenn diese Veränderungen über kurze Abschnitte gemessen und nicht als Mittelwerte über eine gesamte Interaktion errechnet werden, so läßt sich durch konversationsanalytische Methoden feststellen, welche Kontextualisierungsfunktionen die theoretisch möglichen Kombinationstypen übernehmen. Die Übersicht (71) zeigt die in diesem Kapitel diskutierten Funktionen:

(71) Produktion

Perzeption

hoch(+)

Dichte I

.

(Sil./Sek.)

+ .

+ +

'ikonisch' [- Relevanz] Parenthesen Wiederholungen Reparatur A

7

•

Reparatur C 'schnell'

'ikonisch' [+ Relevanz] _ Reparatur Β - +

langsam

niedrig (-)

Dichte II

Ausgangspunkt der Analyse war die ikonisch-onomatopoetische Kontextualisierungsfunktion. Durch erhöhte Sprechgeschwindigkeit (hohe Dichte I/hohe Dichte II) können Sprecher Passagen ihrer Redebeiträge, bei denen 'hohe Geschwindigkeit' eine für die Interpretation der Rezipienten wichtige Rolle spielt, kontextualisieren, ohne diesen Aspekt explizit thematisieren zu müssen. Ikonizität spielt auch bei der Durchführung von Selbstreparaturen eine Rolle. Durch die Erhöhung der Sprechgeschwindigkeit (hohe Dichte 1/ hohe Dichte II oder hohe Dichte I/niedrige Dichte Π) können Konversationsteilnehmer dokumentieren, daß sie sich bemühen, keine längere Redezeit in Anspruch zu nehmen, als dies ohne die Reparaturbedürftigkeit ihres Redezugs der Fall gewesen wäre. Im Rahmen des maximalen Spielraums, den die Satzgrammatik hier zur Verfügung stellt, konnte als zentrale Kontextualisierungsfunktion der Sprechgeschwindigkeit jedoch die text-

260 semantischen Funktion, die Informationsstrukturierung, identifiziert werden. Durch die Reduzierung der Sprechgeschwindigkeit (niedrige Dichte I/hohe Dichte Π) weisen Konversationsteilnehmer ihre Rezipienten auf besonders relevante Abschnitte ihrer Redebeiträge hin, während sie durch eine komplementäre Verpakkung (hohe Dichte I/niedrige Dichte II) das Gegenteil kontextualisieren und so ihre Rezipienten durch die Erhöhung ihrer Sprechgeschwindigkeit auf neben- oder untergeordnete Abschnitte ihres Redebeitrags aufmerksam machen können. Um von der Prosodie unabhängige Evidenz für die Relevanz bestimmter Passagen zu haben, wurden Zusammenfassungen und Wiederholungen sowie Parenthesen, Appositionen, Einschübe und Seitensequenzen untersucht. Im Bereich der Informationsstrukturierung kann man vielleicht tatsächlich von einer 'Grammatikalisierung' sprechen, da 'Verletzungen' der Kontextualisierungskonventionen, die dadurch Zustandekommen, daß Textsemantik und Kontextualisierungsmittel nicht in der oben genannten Weise übereinstimmen, von den Rezipienten bemerkt und als 'Verletzungen' kommentiert werden können. Die Analyse der Kontextualisierungsfunktionen der Sprechgeschwindigkeit belegt auch eine ihrer in Kapitel 1 vorgestellten Eigenschaften, daß nämlich die Bedeutung eines Kontextualisierungsmittels nicht kontext- und aktivitätsunabhängig gegeben ist. Bei der Realisierung von bestimmten Selbstreparaturen erhöhen Konversationsteilnehmer zwar häufig ihre Sprechgeschwindigkeit, dies darf jedoch nicht zu der Annahme verleiten, daß auch hier niedrige Relevanz kontextualisiert wird. Diese Kontextualisierungsfunktion weist, wie gesagt, ikonische Aspekte auf. Darüberhinaus ist jedoch auch hier ein informationsstrukturierender Aspekt relevant, denn der Rezipient wird bei der Informationsverarbeitung unterstützt, weil zusammen mit syntaktischen Hinweisen die Reparaturschleife bei der Verarbeitung der Information auch prosodisch markiert wird. Drei der möglichen vier Kombinationen von Dichte I und Dichte II werden von den Konversationsteilnehmern also systematisch als Kontextualisierungshinweise gentzt, wobei in diesem Kapitel sicher nicht alle Funktionen vorgestellt wurde. Nur bei dem vierten Kombinationstyp, niedrige Dichte I und niedrige Dichte II, sieht es so aus, als läge hier ein theoretisches Artefakt vor. Diese Gangart tauchte an keiner Stelle in den von mir untersuchten Daten auf, und sie ist auch im Gegensatz zu den anderen Typen artikulatorisch kaum zu realisieren.

5. Rück- und Ausblick Diese Arbeit versuchte anhand von drei Fallstudien zu zeigen, wie zwei Forschungsstränge, die oft für antagonistisch gehalten werden, nämlich die Grammatikforschung und die Konversationsanalyse, in fruchtbarer Weise miteinander verbunden werden können. Zentrales Ziel einer solchen Verbindung ist es, ein Bild des in der alltäglichen sprachlichen Interaktion aktivierten sprachlichen Wissens zu zeichnen, das dessen hoher Komplexität besser Rechnung trägt als Untersuchungen aus der Perspektive nur eines der beiden Forschungsstränge. Eine der sich dabei stellenden grundsätzlichen Fragen, der im Vorangehenden besondere Aufmerksamkeit gewidmet wurde, ist die nach der Grenze der Zuständigkeitsbereiche von Grammatikforschung und Konversationsanalyse bei der Beschreibung einer entsprechend weit gefaßten sprachlichen Kompetenz, die Frage also, wie die Arbeitsteilung zwischen dem grammatischen und dem konversationellen Teil dieser Kompetenz organisiert ist. Zur Präzisierung dieser Fragestellung wurden in der Einleitung zwei mögliche Hypothesen über die Natur der fraglichen Arbeitsteilung formuliert. Erstens: Der der Grammatik zugeordnete Kompetenzbereich läßt Spielräume, die vom konversationellen Kompetenzbereich systematisch genutzt werden. In diesen grammatischen Nischen - und nur in ihnen - entfalten sich konversationeile Regularitäten bzw. das ihnen entsprechende sprachliche Wissen. Zweitens: Regeln der Gesprächsorganisation können grammatische Regeln außer Kraft setzen. In Konversationen situierte sprachliche Ausdrücke folgen also zumindest partiell anderen Formund Inhaltsgesetzen als Ausdrücke in Isolation. Um zu einer Entscheidung zwischen diesen beiden Hypothesen etwas beitragen zu können, mußte das empirische Blickfeld im Vergleich sowohl zur orthodoxen Konversationsanalyse als auch zu gängigen Formen der Grammatikforschung erweitert werden. Zum einen bildeten sprachliche Formen (Satzgliedstellung, Akzentplazierung, Sprechgeschwindigkeit) und nicht die "unproblematischen Probleme" (Bergmann 1980: 22) der Konversationsteilnehmer (Organisation des Sprecherwechsels, Reparatur von Sprech-, Hör- oder Verstehensfehlern, etc.) den Hauptuntersuchungsgegenstand dieser Arbeit. Das war deshalb notwendig, weil nur in solchen sprachlichen Formen und den sie betreffenden Regularitäten die Nahtstelle zwischen grammatischer und konversationeller Kompetenz sichtbar wird, nämlich dann, wenn es gelingt, in den Formregularitäten den Beitrag der Grammatik von dem der interaktiven Strategien zu isolieren. Die zweite Erweiterung betrifft die Herkunft des analysierten Datenmaterials. Diesbezüglich wurde im Vergleich sowohl zu grammatischen als auch zu konversationsanalytischen Arbeiten die empirische Basis vergrößert. Als Datengrundlage dienten sowohl konstruierte Beispielsätze als auch literarische Texte, in Tonstudioqualität aufgenomme systematisch variierte Testbatterien, Vorlesepassagen und vor allem auch (und zwar in erheblichem Umfang) transkribierte Alltagskonversationen. Gerade die Analyse von Alltagskonversationen spielte in dieser Arbeit

262 eine zentrale Rolle, denn sowohl die Ordnungsprinzipien 'oberhalb' der sprachlichen Formen als auch die für unsere Fragestellung relevanten Formdetails entziehen sich häufig der durch konstruiertes oder reglementiertes Material elizitierbaren Introspektion. In den empirischen Analysen in den Kapiteln 2, 3 und 4 zeigte sich, daß die in natürlichen Konversationen zu beobachtenden sprachlichen Formcharakteristika in keinem Fall über die grammatisch zulässige Variation hinausgehen. Vielmehr sahen wir, daß konversationellen Strategien und Kontextualisierungskonventionen sich gerade in den Spielräumen entfalten, die durch die einschlägigen grammatischen Regeln offengelassen werden. Dabei ist die Ausdehnung dieser Spielräume allerdings sehr unterschiedlich. Während syntaktische Regeln, die für Mittelfeldentleerungen einschlägig sind, entsprechenden konversationeilen Strategien vergleichsweise enge Grenzen setzen, eröffnet sich im Bereich der rhythmischen Realisierung ein größerer und bei der Sprechgeschwindigkeit ein maximaler Freiraum. In Kapitel 2 wurde gezeigt, daß die Grammatik des Deutschen zwar eine breite Variation der Abfolge der Stellungsglieder im Mittelfeld erlaubt, daß dieser Spielraum aber konversationeil kaum genutzt wird. Warum dies so ist, muß als offene Frage betrachtet werden. Konversationsteilnehmer machen hingegen in erheblichem Umfang Gebrauch von einem anderen Variationsangebot der Grammatik, indem sie potentielle Satzglieder des Mittelfeldes erst im Anschluß an die rechte Satzklammer produzieren. Bei der Analyse des konversationeilen Datenmaterials zeigte sich, daß sich in den dabei von der Satzsyntax des Deutschen offengelassenen Variationsräumen genuin konversationeile Regularitäten entfalten. Es wurde deutlich, daß gesprächsorganisatorische Aspekte wie Sprecherwechsel, Selbstreparaturen und Informationsgliederung für die Auslagerung mittelfeldfähiger Satzglieder hinter die rechte Satzklammer eine entscheidende Rolle spielen. In Kapitel 3 wurden Akzentzusammenstöße untersucht, also ein lautliches Phänomen, das von manchen Modellen der Satzphonologie als ungrammatisch eingestuft wird. Bei der Analyse konversationeller Daten zeigte sich jedoch, daß Sprecher in natürlichen Dialogen systematisch Akzentzusammenstöße produzieren, indem sie die metrische Prominenz von Silben erhöhen, die von der Grammatik nicht als Träger von Hauptakzenten ausgewiesen werden. Solche konversationeilen Akzentzusammenstöße sollten also ein Paradebeleg für die zweite der obigen Hypothesen sein, nach der grammatische Regeln zumindest teilweise von Regeln der Gesprächsorganisation oder von Kontextualisierungskonventionen außer Kraft gesetzt werden. Es konnte jedoch gezeigt werden, daß sich Akzentzusammenstöße, obwohl sie konversationeil sehr spezifische Funktionen übernehmen, nicht aus dem durch die einschlägigen satzphonologischen Regeln abgesteckten Variationsraum herausbewegen. Akzentzusammenstöße müssen schon innergrammatisch als unter bestimmten Umständen zulässig betrachtet werden. In Kapitel 4 wurden funktional und interaktiv relevante Veränderungen der Sprechgeschwindigkeit analysiert. Die Sprechgeschwindigkeit wurde als Beispiel für Eigenschaften

263 der sprachlichen Form analysiert, denen Grammatiken (wahrscheinlich universell) keinerlei Restriktionen auferlegen. Damit sollte sich hier ein maximal großer Spielraum für die Entfaltung konversationeller Regularitäten bieten. Es konnte gezeigt werden, daß der durch grammatische Regeln nicht eingeschränkte Spielraum für Sprechgeschwindigkeitsvariationen unter anderem dazu genutzt wird, Informationsstrukturierungen zu kontextualisieren. Eine im Anschluß an diese Resultate naheliegende, aber über den Rahmen der vorliegenden Arbeit hinausgehende Frage ist, ob es sich bei den konversationeilen Regularitäten und/oder Kontextualisierungskonventionen um Gesetze handelt, die mit grammatischen Regeln vergleichbar sind. Diese Frage wird von einigen Forschern bejaht1, von anderen hingegen strikt verneint bzw. nur mit großen Einschränkungen bejaht 2 . Diejenigen, die eine "Grammatik des Sprachgebrauchs" annehmen, gehen davon aus, daß es nicht nur syntaktische, semantische, morphologische und phonologische Regeln gibt, die die wohlgeformten Sätze einer Sprache erzeugen, sondern auch Dialogregeln, die die wohlgeformten Dialoge einer Sprache generieren. Diejenigen dagegen, die in der Konversation eine grundlegend andere Art von sprachlichen Prinzipien wirken sehen, weisen darauf hin, daß es (von einigen trivialen Ausnahmen abgesehen) praktisch unmöglich ist, Folgen von Redezügen zu konstruieren, die in vergleichbarer Art und in vergleichbarem Umfang abweichend sind wie durch Verletzung grammatischer Regeln erzeugbare Wortketten. Das liegt, so meinen Vertreter dieser Position, daran, daß konversationeile Regularitäten, wie z.B. die Paarsequenzorganisation, keine Strukturzwänge aufbauen, die nicht zu interaktiven Zwecken verletzt werden könnten.3 Die für die Kontextualisierung erforderliche Kompetenz teilt zwar einige Eigenschaften mit der grammatischen Kompetenz,"[...] conventional in nature, learned as part of the everyday language socialization process, and once internalized [...] usually employed automatically without conscious reflection" (Gumperz 1984MS : 1), aber es gibt auch Unterschiede. Diese ergeben sich u.a. aus einer bestimmten Qualität der zur Kontextualisierung verwendeten sprachlichen Mittel: Im Gegensatz zu grammatisch relevanten Formmerkmalen sind sie sehr oft skalar oder graduell ausgeprägt (wie wir es am Beispiel der Sprechgeschwindigkeit gesehen haben). Solange man diese Unterschiede zwischen konversationellen oder Kontextualisierungsstrategien einerseits, satzgrammatischen Regeln andererseits, nicht als unwesentlich wegerklären kann, muß man wohl davon ausgehen, daß an der Nahtstelle zwischen Grammatik und Konversation, die wir an einigen Beispielen in dieser Arbeit betrachtet haben, sprachliche Regelsysteme sehr verschiedener Art aufeinandertreffen. Vielleicht läßt sich aus den Unter1 2

3

Vgl. dazu exemplarisch Weigand (1992) sowie zur Kritik u.a. Rehbock (1993). Zu konversationeilen Regularitäten vgl. Levinson (1983:286ff) sowie zur Kontextualisierung Gumperz (1984MS:lf). Das erinnert an eine bekannte Eigenschaft anderer pragmatischer Phänomene, vor allem von konversationellen Implikaturen, die, falls sie mit den sprechsituationellen Gegebenheiten konfligieren, einfach annulliert werden. - Auf diese Ähnlichkeit weist auch Levinson (1983: 292ff.) hin, der sich explizit gegen die erste der beiden genannten Positionen wendet.

264 schieden in der Art der Regelung letztlich auch eine Erklärung für die zentrale Beobachtung des Vorangehenden gewinnen, nämlich dafür, daß das konversationeile System die von der Grammatik gesetzten Grenzen sprachlicher Variation genau respektiert. - Ich hoffe, daß sich die hier dargestellten Untersuchungen als zum Ziel führende Schritte auf dem (voraussichtlich noch langen) Weg zur Beantwortung dieser tieferen Fragen nach dem Verhältnis von Grammatik und Konversation erweisen, auch wenn sie selbst diese Fragen bewußt offen gelassen haben.

Transkriptionsnotation

Jede Zeile entspricht einer Intonationsphrase. Dies ist nur dann nicht der Fall, wenn die Intonationsphrase zu komplex ist. S: gem Τ: =

Ida lieben I ja ? I

Prüfunk11 schon

Senkrechte Striche in aufeinanderfolgenden Zeilen markieren Anfang und Ende gleichzeitigen Sprechens. Zwei Intonationsphrasen oder zwei Wörter werden mit direktem Anschluß (latching) produziert. Pause mit Dauerangabe in Sekunden (geschätzt) bzw. maschinell gemessen (1.38) Nicht gemessene Pause unter (O.S) Sekunden. Satzzeichen notieren die finalen Grenzen von Intonationsphrasen: stark fallend, fallend, steigend, stark steigend. Exklamative Intonation. Primärakzent auf der folgenden Silbe. Sekundärakzent auf der folgenden Silbe. Extra starker (emphatischer oder kontrastiver) Akzent auf der folgenden Silbe. Leise Passagen, sehr leise Passagen. Abnehmende Lautstärke. Zunehmende Lautstärke. Deutlich erhöhte Lautstärke. Deutlich reduzierte Lautstärke. Schnell gesprochene Passage, sehr schnell gesprochene Passage. Langsam gesprochene Passage, sehr langsam gesprochene Passage. Dehnung des vorangehenden Lautes. Je mehr Doppelpunke desto länger die Dehnung. Aspiration. Kürzere Realisierung des Vokals als nach der Standardlautung erwartbar.

η ? Chi(....) (China) ((Räuspern)) 'hh hh hehe CJbilMt oder Chi(h)na

Silbischer Nasal. Glottal stop. Abbruch mit glottalem Verschluß. Nicht transkribieibare Passage. Unsichere Transkription. Kommentare zum Transkript oder non-verbale Aktivitäten des Sprechers. Hörbares Einatmen. Hörbares Ausatmen. Lachen. Lachend gesprochene Passagen.

(1.5) (.) . ;, ? ! 'China 'China "China 'China*, " China" 'China" "China' < China > China #China#, ##China## +China+, ++China++ schö::n

Literaturverzeichnis

Abercrombie, D. (1967), Elements of General Phonetics. Edinburgh: University Press. Allen, G.D. (1975), Speech rhythm: its relation to performance universale and articulatory timing. Journal of Phonetics 3, 75-86. Allen, G.D. & Hawkins, S. (1980), Phonological rhythm: definition and development, in: Yeni-Komshian, O.H. (ed.), Child phonology. New York, 227-256. Altmann, H. (1981), Formen der 'Herausstellung' im Deutschen. Tübingen: Niemeyer. Altmann, H. (1987), Zur Problematik der Konstitution von Satzmodi als Fonntypen, in: Meibauer, J. (ed.) 1987, 22-56. Altmann, H. (1993), Fokus-Hintergrund-Gliedening und Satzmodus, in: Reis, M. (ed.) 1993, 1-37. Altmann, H. (ed.) (1988), Intonationsforschungen. Tübingen: Niemeyer. Altmann, H. Batliner, A. & Oppenrieder W. (eds.) (1989), Zur Intonation von Fokus und Modus im Deutschen. Tübingen: Niemeyer. Arbeitsgruppe Bielefelder Soziologen (eds.) (1973), Alltagswissen, Interaktion und gesellschaftliche Wirklichkeit. (Bd.l: Symbolischer Interaktionsmus und Ethnomethodologie, Bd.2: Ethnotheorie und Ethnographie des Sprechens). Hamburg: Rowohlt. Atkinson, J.M. & J. Heritage (eds.) (1984), Structures of social action. Studies in conversational analysis. Cambridge: University Press. Auer, P. (1979), Referenzierungssequenzen in Konversationen: das Beispiel 'Ortsangaben', Linguistische Berichte 62, 94-106. Auer, P. (1981), Zur indexikalitätsmarkierenden Funktion der demonstrativen Artikelform in deutschen Konversationen, in: Hindelang, G. & Zillig, W. (eds.) Sprache: Verstehen und Handeln, Bd. 2 (Akten des 15. Linguistischen Kolloquiums, Münster 1980). Tübingen: Niemeyer, 301-310. Auer, P. (1983), Überlegungen zur Bedeutung der Namen aus einer 'realistischen' Sichtweise, in: Faust, M. et al. (eds.), Allgemeine Sprachwissenschaft, Typologie und Textlinguistik (Festschrift für P. Hartmann). Tübingen: Narr, 173-185. Auer, P. (1984), Referential problems in conversation, Journal of Pragmatics 8,627-648. Auer, P. (1986a), Kontextualisierung, Studium Linguistik 19, 22-47. Auer, P. (1986b), Konversationelle Standard/Dialekt-Kontinua (Code-Shifting), Deutsche Sprache 1986,97-124. Auer, P. (1990a), Rhythm in telephone closings, Human Studies 13, 361-392. Auer, P. (1990b), Phonologie der Alltagssprache. Eine Untersuchung zur Standard/Dialekt-Variation am Beispiel der Konstanzer Stadtsprache. Berlin: de Gruyter. Auer, P. (1991a), Vom Ende deutscher Sätze, Zeitschrift für Germanistische Linguistik 19-2,139-157. Auer, P. (1991b), Zur More in der Phonologie, Zeitschrift für Sprachwissenschaft 10, 3-36. Auer, P. (1992a), A "clash of ideas" or an exercise in scholastic 'misunderstanding'?: A response to Button's response, Human Studies 15, 291-297. Auer, P. (1992b), Introduction: John Gumperz' approach to contextualization, in: Auer, P. & Di Luzio, A. (eds.) 1992, 1-37. Auer, P. (1993), Is a rhythm-based typology possible? A study on the role of prosody in phonological typology. KontRI Arbeitspapier Nr. 21. Universität Konstanz. Auer, P. (1994), Einige Argumente gegen die Silbe als universale prosodische Hauptkategorie, in: Ramers, K.H. e t al. (eds.) Universale phonologische Strukturen und Prozesse. Tübingen: Niemeyer, 55-78. Auer, P. (1995), Context und contextualization, in: Verscheuren, J. et al. (eds.), Handbook of Pragmatics. Amsterdam: Benjamins, 1 -19. Auer, P. (1996), On the prosody and syntax of turn continuations, in: Couper-Kuhlen, Ε. & M. Selting (eds), Prosody in conversation. Cambridge: University Press, 57 - 100. Auer, P. & Di Luzio, A. (eds.) (1992), The contextualization of language. Amsterdam: Benjamins. Auer, P. et al. (in prep.). Language in time: The rhythm and tempo of verbal interaction. Oxford: University Press. Auer, P. & K. Joos (1988), Kleiner seealemannischer Wortschatz gehoben auf Konstanzer Grund. Konstanz: Faude.

268 Auer, P. & S. Uhmann (1982), Aspekte der konversationeilen Organisation von Bewertungen, Deutsche Sprache 1, 1 - 32. Auer, P. & Uhmann, S. (1988), Silben- und akzentzählende Sprachen. Literaturüberblick und Diskussion, Zeitschrift für Sprachwissenschaft 7,214-259. Barden, B. (1990Ms), Kontextualisierungsfunktionen von Sprechgeschwindigkeit. Magisterarbeit Universität Konstanz. Barden, B. (1991), Sprechgeschwindigkeit und thematische Struktur. KontRi Arbeitspapier 15. Universität Konstanz. Bassarek, A. (1985), Zu den Beziehungen zwischen Parenthesen und ihren Trägersätzen, Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung 38-4, 368 - 375. Bassarek, A. (1987), Parenthese als illokutive Handlungen, in: Mötsch, W. (ed.) Satz, Text, sprachliche Handlung (Studia Grammatica XXV) Berlin: Akademie-Verlag, 163-178. Bateson, G. (1956), The message 'This is play1, in: Schaffner, Β. (ed.), Group processes. New York: J. Macy Jr. Foundation, 145-242. Batliner, A. (1988), Der Exklamativ: Mehr als Aussage oder doch nur mehr oder weniger Aussage; Experimente zur Rolle von Höhe und Position des F()-Gipfels, in: Altmann, H. (ed.) 1988, 21-70. Bauman, R. & J. Sherzer (eds.) (1974), Explorations in the ethnography of speaking. Cambridge: University Press. Bayer, K. (1973), Verteilung und Funktion der sogenannten Parenthese in Texten gesprochener Sprache, Deutsche Sprache 1, 64-115. de Beaugrande, R.-A. & Dressler, W.U. (1981), Einführung in die Textlinguistik. Tübingen: Niemeyer. Beckman, M.E. (1986), Stress and non-stress accent. Dordrecht: Foris. Beckman, Μ. E. & J. Pierrehumbert (1986), Intonational structure in English and Japanese, Phonology Yearbook 3,255-309. Beckman, Μ. Ε. & Edwards, J. (1990), Lengthenings and shortenings and the nature of prosodic constituency, in: Kingston, J. & M.E. Beckman (eds.) 1990, 152-177. Behaghel, O. (1932), Deutsche Syntax. Eine geschichtliche Darstellung. Band 4. Heidelberg. Benson, D. & Hughes, J.A. (1983), The perspective of ethnomethodology. London: Longman. van den Berg, R., Gussenhoven, C. & Rietveld, A. (1992) Downstep in Dutch: implications for a model, in : Docherty, G.J. & Ladd, D. R. (eds.) 1992, 335-367. Berger, P.L. & Luckmann, Th. (1966), The social construction of reality. New York: Doubleday; dt.: (1969), Die gesellschaftliche Konstruktion der Wirklichkeit. Eine Theorie der Wissenssoziologie. Frankfurt: Fischer. Bergmann, J. (1974MS), Der Beitrag Harold Garfinkeis zur Begründung des ethpomethodologischen Forschungsansatzes. Konstanz Nov. 1974. Bergmann, J. (1980), Frage und Frageparaphrase: Aspekte der redezug-internen und sequentiellen Organisation eines Äußerungsformats, in: Winkler, P. (ed.), Methoden der Analyse von face-to-face-Situationen. Stuttgart: Metzler, 128-142. Bergmann, J. (1981), Ethnomethodologische Konversationsanalyse, in: Schröder, P. & Steger, H. (eds.), Dialogforschung: Jahrbuch 1980 des Instituts für deutsche Sprache. Düsseldorf, 9-51. Bergmann (1982), Schweigephasen im Gespräch - Aspekte ihrer interaktiven Organisation, in: Soeffner, H.-G. (ed.), Beiträge zu einer empirischen Sprachsoziologie". Tübingen, 143-184. Bergmann, J. (1985), Flüchtigkeit und methodische Fixierung sozialer Wirklichkeit: Aufzeichnungen als Daten der interpretativen Soziologie, in: Bonß, W. & Hartmann, H. (eds.), Entzauberte Wissenschaft: Zur Relativität und Geltung soziologischer Forschung (Soziale Welt Sonderheft 3). Göttingen: Schwartz, 299-320. Bergmann, J. (1991a), Über Erving Goffmans Soziologie des Gesprächs und seine ambivalente Beziehung zur Konversationsanalyse, in: Hettlage, R. & Lenz, K. (eds.), Erving Goffman - ein soziologischer Klassiker der zweiten Generation. Bern/Stuttgart, 301-320. Bergmann, J. (1991b), Deskriptive Praktiken als Gegenstand und Methode der Ethnomethodologie, in: Herzog, M. & Graumann, C.F. (eds.), Sinn und Erfahrung: Phänomenologische Methoden in den Humanwissenschaften. Heidelberg, 86-102. Bergmann, J. (1994), Ethnomethodologische Konversationsanalyse, in: Fritz, G. & Hundsnurscher, F. (eds.) 1994, 3-16. Betten, A. (1976), Ellipsen, Anakoluthe und Parenthesen. Fälle für Grammatik, Stilistik, Sprechakttheorie oder Konversationsanalyse?, Deutsche Sprache 4, 207-230.

269 Blakemore, D. (1988), The organisation of discourse, in: Newmeyer, F. J. (ed.), Linguistics: The Cambridge survey. Vol. IV: The socio-cultural context, 229-250. Boden, D. & Zimmerman, D.H. (eds.) (1991), Talk and social structure, Studies in ethnomethodology and conversational analysis. Cambridge: Polity Press. Bolinger, D. (1964/1972), Around the edge of language: Intonation, Harvard Educational Review 34-2, 282-293. Wiederabgedruckt in: Bolinger, D. (ed.) (1972), Intonation. Harmondsworth, 19-29. Bolinger, D. (1986), Intonation and its Parts. Melody in spoken English. London: Arnold. Bolinger, D. (1989), Intonation and its uses. Melody in grammar and discourse. Stanford: University Press. Bolkestein, A. M. (1993), General ideas of functionalism in syntax, in: Jacobs, J. et al. (eds.) 1993, 339 - 348. Brandt, M. (1994), Subordination und Parenthese als Mittel der Informationsstrukturierung in Texten, S & Ρ 32, 1 - 37 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Brandt, M. & Rosengren, I. (1991a), Zur Handlungsstruktur des Textes, S & Ρ 5, 3 - 46 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Brandt, M. & Rosengren, I. (1991b), Handlungsstruktur und Informationsstruktur - zwei Seiten einer Münze, S & Ρ 5, 120 - 139 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Breindl, E. & Thurmair, M. (1992), Der Fürstbischof im Hosenrock. Eine Studie zu den nominalen Kopulativkomposita des Deutschen, Deutsche Sprache 20, 32-61. Brown, G. & Yule, G. (1983), Discourse analysis. Cambridge: University Press. Büring, D. (1995 MS), The 59th street bridge accent. On the meaning of topic and focus. Dissertation. Universität Tübingen Butcher, A. (1981), Aspects of speech pause: Phonetic correlates and communicative functions, Arbeitsberichte des Instituts für Phonetik der Universität Kiel (AIPUK) 15, 1-233. Butterworth. B. (1980), Evidence form pauses in speech, in: Butterworth, B. (ed.). Language production (Vol. 1). London: Academic Press, 155-176. Button, G. (1990a), A clash of ideas: a response to Auer, Human Studies 13, 393-404. Button, G. (1990b), On varieties of closings, in: Psathas, G. (ed.) 1990, 93-149. Button, G. & J. R. E. Lee (eds) (1987), Talk and social organisation. Clevedon: Multilingual Matters. Chafe, W. (1976), Givenness, contrastiveness, definiteness, subjects, topics, and point of view, in: Li, C.N. (ed.) Subject and topic. New York: Academic Press. 1976, 25-55. Chafe, W. (1987), Cognitive constraints on information flow, in: Tomlin, R. (ed.), 1987, 21-55. Chafe, W. (1993), Prosodic and functional units of language, in: Edwards, J. A. & Lampert, M.D. (eds.) 1993, 33-43. Chomsky, N. (1971), Deep structure, surface structure and semantic interpretation, in: Steinberg, D. & Jacobvitz, L. (eds.), Semantics: an interdisciplinary reader in philosophy. Cambridge: University Press, 183-216. Churchill, L. (1971), Ethnomethodology and measurement, Social Forces 50: 182-191. Cicourel, A. (1973), Cognitive Sociology. Harmondsworth: Penguin; dt.: (1975), Sprache in der sozialen Interaktion. München: List. Clement, D. & W. Thümmel (1975), Grundzüge einer Syntax der deutschen Standardsprache. Frankfurt: Athenäum. Cohen, A. Collier.R. & J. 't Hart (1982), Declination: construct or intrinsic feature of speech pitch, Phonetica 39, 254-273. Cook-Gumperz, J. & J. Gumperz (1976/1978), Context in children's speech, in: Cook-Gumperz, J. & J. Gumperz (eds.), Papers on Language and Context (Working Paper No. 46 Berkeley: University of California). Wiederabgedruckt in: Waterson, N. & C. Snow (eds.) (1978), The development of communication. Chichester: Wiley, 3-23. Corsaro, W.A. (1985), Sociological approaches to discourse analysis, in: van Dijk, T. (ed.) Vol. 1,167-192 Couper-Kuhlen, E. (1986), An introduction to English prosody. Tübingen: Niemeyer. Couper-Kuhlen, Ε. (1992), Contextualizing discourse: The prosody of interactive repair, in: Auer, P. & A. Di Luzio (eds.) 1992, 337 - 364. Couper-Kuhlen, Ε. (1993), English speech rhythm. Amsterdam: Benjamins. Couper-Kuhlen, E. & Auer, P. (1991), On the contextualization function of speech rhythm in conversation: Question-answer sequences, in: Verschueren, J. (ed.). Levels of linguistic adaption. Selected papers of the 1987 International Pragmatics Conference. Amsterdam: Benjamins, Vol Π, 1-18.

270 Covelli, L.H. & S.O. Murray (1980), Accomplishing topic change, Anthropological Linguistics 22, 382-389. Cruttenden, A. (1986), Intonation. Cambridge: University Press. Cutler, A. (1990), From performance to phonology: comments on Beckman and Edward's paper, in: Kingston, J. & M.E. Beckman (eds.) 1990, 208-214. Dauer, R.M.(1983): Stress-timing and syllable-timing reanalysed. Journal of Phonetics 11, 51 - 62. Dietrich, R. (1994), Wettbewerb - aber wie? Skizze einer Theorie der freien Wortstellung, in: Haftka, B. (ed.) 1994, 33 - 47. van Dijk, T. (ed.) (198S), Handbook of discourse analysis. 4 Bde. London: Academic Press. Dik, S.C. (1978), Functional grammar. Dordrecht: Foris. Docherty, GJ. & D.R. Ladd (eds.) (1992), Papers in laboratory phonology Π. Gesture, segment, prosody. Cambridge: University Press. Donegan, P. & Stampe, D. (1983), Rhythm and the holistic organization of language structure, in: CLS 19, Richardson, F. (ed.), Parasession on the interplay of phonology, morphology and syntax, 337-353. Donovan, A. & Darwin, C.J.(1979): The perceived rhythm of speech. Proceedings of the Ninth International Congress of Phonetic Science, Vol.11, Copenhagen, 268 - 274. Dorval, B. (ed.) (1990), Conversational organization and its development. Norwood: Ablex. (Advances in discourse processes XXXVK). Douglas, J.D. (ed.) (1970), Understanding everyday life. Chicago: Aldine Publishing Company. Dowty, D. (1991), Thematic proto-roles and argument selection, Language 67, 547-619. Drach, E. (1937), Grundgedanken der Deutschen Satzlehre. Frankfurt. Dressier, W. (1975), Methodisches zu Allegroregeln. In: Dressier, W. & F.v. Mares (eds.), Phonologica 1972. München, 219-234. Dressler, W., Leodolter, R. & Chromec, E. (1976), Phonologische Schnellsprechregeln in der Wiener Umgangssprache. In: Viereck, W. (ed.), Sprachliches Handeln - soziales Verhalten. München, 71-92. Drew, P. & Heritage, J. (eds.) (1992), Talk at work. Interaction in institutional settings. Cambridge: University Press. Drew, P. & Wootton, A. (eds.) (1988), Erving Goffman. Exploring the interaction order, Cambridge: Polity Press. Duden (1995s), Grammatik der deutschen Gegenwartssprache. Mannheim: Dudenverlag. Duranti, A. & Ch. Goodwin (eds.) Rethinking context. Cambridge: University Press. Edwards, J. A. & Lampert, M.D. (eds.) (1993), Talking data: Transcription and coding in discourse research. Hillsdale ,Ν.J.: Lawrence Erlbaum. Ehlich, K. (1982), Anaphora and deixis: same, similar, or different?, in: Jarvella, R. J. & Klein, W. (eds.) 1982, 315-338. Ehlich, K. (ed.) (1980), Erzählen im Alltag. Frankfurt: Suhrkamp. Ehlich, K. (1986), Inteijektionen. Tübingen: Niemeyer. Eikmeyer, H.-J. et al. (1995), Coherence regained, in: Rickheit, G. & Habel, C. (eds.), Focus and Coherence in Discourse Processing. Berlin: De Gruyter, 115 - 142. Eisenberg, P. P. (1991), (19892),Syllabische GrundriB der deutschen Grammatik. Stuttgart: Eisenberg, Struktur und Wortakzent: PrinzipienMetzler. der Prosodik deutscher Wörter, Zeitschrift für Sprachwissenschaft 10, 37-64. Engel, U. (1988), Deutsche Grammatik. Heidelberg: Groos. Erickson, F. & Shultz, J. (1982), The counselor as gatekeeper. New York. von Essen, O. (1949), Sprechtempo als Ausdruck psychischen Geschehens, Zeitschrift für Phonetik 3, 317-341. von Essen, Ο. (19642), Grundzüge der hochdeutschen Satzintonatioa Ratingen: A. Henn. von Essen, O. (1979), Allgemeine und angewandte Phonetik. Berlin. F£ry, C. (1986), Metrische Phonologie und Wortakzent im Deutschen, Studium Linguistik 20, 16-43. Fleischer, W. & Michel, G. (1975), Stilistik der deutschen Gegenwarssprache. Leipzig. Fleischer, W. & I. Barz (1992), Wortbildung der deutschen Gegenwartssprache. Tübingen: Niemeyer. Fönagy, I.& Magdics, K. (1960), Speed of utterance in phrases of different lengths, Language and Speech 4, 179-192. Ford, C. (1993), Grammar in interaction. Cambridge: University Press. Fowler.C.A. (1979): Perceptual centers in speech production and perception, Perception and Psychophysics 25, 375 - 398.

271 Fowler, C. A. (1990), Lengthenings and the nature of prosodic constituency: comments on Beckman and Edward's paper, in: Kingston, J. & M.E. Beckman (eds.) 1990, 201-207. Fox, B. (1987), Discourse structure and anaphora. Cambridge: University Press. Fox, B. & Thompson, S. (1990), A discourse explanation of the grammar of relative clauses in English conversation, Language 66,297-316. Frake, Ch. (1961), The diagnosis of disease among the Subanum of Mindanao, American Anthropologist 63, 113-132. Franck, D. (1985), Sentences in conversational turns: A case of syntactic 'double bind', in: Dascal, M. (ed.), Dialogue: An interdisciplinary approach. Amsterdam: Benjamins, 233-245. Fries, N. (1988), Ist Pragmatik schwer! Über sogenannte 'Exklamativsätze' im Deutschen, Deutsche Sprache 16, 193-205. Fries, N. (1990), Interjektionen und Interjektionsphrasen. S & Ρ 14, 1-43 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Fries, N. (1992a), Emotionen und sprachliche Struktur. S & Ρ 30, 1-28 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Fries, N. (1992b), Inteijektionen, Interjektionsphrasen und Satzmodus, in Rosengren, I. (ed.) (1992), 307-341. Fries, N. (1996), Grammatik und Emotionen, Zeitschrift für Literaturwissenschaft und Linguistik 101, 37 - 69. Fritz, G. & Hundsnurscher, F. (eds.) (1994), Handbuch der Dialoganalyse. Tübingen: Niemeyer. Fuchs, A. (1976), 'Normaler' und 'kontrastiver' Akzent, Lingua 38: 293-312. Fuchs, A. (1980), Grammatische und pragmatische Determinanten der Satzakzentuierung, in: Weiss, W., Wiegand, H.E. & Reis, M. (eds.) 1986, 287-297. Fujisaki, H. (1988), A note on the physiological and physical basis for the phrase and accent components in voice fundamental frequency contour, in: Fujimura, O. (ed.), Vocal physiology: voice production, mechanisms and functions. New York: Raven, 347-355. Gaumann, U. (1983), "Weil die machen jetzt bald zu". Angabe und Junktivsatz in der deutschen Gegenwartssprache. Göppingen: Kümmerle. Garfinkel, H. (1963), A conception of, and experiments with, 'trust' as a condition of stable concerted actions, in: Harvey, O.J. (ed.), Motivation and social interaction, New York: Ronald Press, 187-238. Garfinkel, Η. (1967), Studies in ethnomethodology. Englewood Cliffs, N.J.: Prentice Hall. Garfinkel, Η. (1972), Remarks on ethnomethodology, in: Gumperz, J. & Hymes, D. (eds.) 1972, 301-302. Garfinkel, H. (1964), Studies of the routine grounds of everyday activities, Social Problems 11, 225-250; wiederabgedruckt in: Garfinkel (1967), 35-75 sowie in: Sudnow (ed.) 1972, 1-30); dt. (auszugsweise): Studien über die Routinegrundlagen von Alltagshandeln, in: Steinert, H. (ed.) (1973) Symbolische Interaktion. Stuttgart, 280-293. Garfinkel, H. (1974), The origins of the term 'ethnomethodology', in: Turner, R. (ed.) 1974, 15-18. Garfinkel,H. & Sacks, H. (1970), On the formal structures of practical actions, in: Mckinney, J.C. & Tiryakian, E. (eds.). Theoretical Sociology: Perspectives and development. New York: Appleton, 338-366; dt.: (1976), Über formale Strukturen praktischer Handlungen, in: Weingarten, E. et al. (eds.), 130-176. Giegerich, H.J. (1985), Metrical phonology and phonological structure. German and English. Cambridge: University Press. Givön, Τ. (1988), The pragmatics of word order: predictability, importance and attention, in: Hammond, Μ., E. Moravcsik & J. Wirth (eds.) (1988), Studies in Syntactic Typology. Amsterdam, 243-284. Givön, Τ. (1990), Syntax. A functional-typological introduction. Amsterdam: Bejamins. 2 Bde. Goffman, E. (1959), The presentation of self in everyday life. New York: Doubleday Anchor. Goffman, E. (1963), Behaviour in public places. Notes on the social organization of gatherings. New York: Free Press. Goffman, Ε (1964), The neglected situation, American Anthropologist 66 (Special Issue), 133-136; dt.: Die vernachlässigte Situation, in: Steger, H. (ed.) (1982), Anwendungsbereiche der Soziolinguistik. Darmstadt: Wissenschaftliche Buchgesellschaft, 199-205. Goffman, Ε. (1971), Relations in Public. Microstudies of the public order. New York: Harper & Row; dt.: (1974), Das Individuum im öffentlichen Austausch. Mikrostudien zur öffentlichen Ordnung. Frankfurt: Suhrkamp. Goffman, E. (1974), Frame analysis. An essay on the organization of experience. New York: Harper & Row; dt: (1980), Rahmen-Analyse. Ein Versuch über die Organisation von Alltagserfahrungen. Frankfurt: Suhrkamp.

272 Goffman, Ε. (1976), Replies and responses, Language in Society 5, 257-313 (wiederabgedruckt in: Goffman 1981, 5-77). Goffman, E. (1978), Response cries. Language 54-3, 787-815 (wiederabgedruckt in: Goffman 1981, 78-123). Goffman, E. (1979), Footing, Semiotica 25,1-29 (wiederabgedruckt in: Goffman 1981, 124-159). Goffman, E. (1981), Forms of talk. Oxford: Blackwell. Goldberg, J.A. (1978), Amplitude shift. A mechanism for the affiliation of utterances in conversational interaction, in: Schenkein, J. (ed.), 1978, 199-218. Goldman-Eisler, F. (1961), The rate of changes in the rate of articulation. Language and Speech 4,171-174. Goldman-Eisler, F. (1968), Psycholinguistics: experiments in spontanous speech. London: Academic Press. Goldsmith, J. (1990), Autosegmental and metrical phonology. Oxford: Blackwell. Goodenough, W.H. (1964), Cultural anthropology and linguistics, in: Hymes, D.H. (ed.). Language in culture and society. A reader in linguistics and anthropology. Ney York: Harper & Row, 36-39. Goodwin, Ch. (1979), The interactive construction of a sentence in natural conversation, in: Psathas, G. (ed.) 1979, 97-121. Goodwin, Ch. (1981), Conversational organization: Interaction between speakers and hearers. New York: Academic Press. Goodwin, Ch. (1986), Between and within: alternative sequential treatments of continuers and assessments, Human Studies 9, 205-217. Goodwin, Ch. (1993), Recording human interaction in natural settings, Pragmatics 3:2, 181-209. Goodwin, Ch. & Durand, A. (1992), Rethinking context: an introduction, in: Duranti, A. & Goodwin, Ch. (eds.) 1992, 1-42. Goodwin, Ch. & Goodwin, M. (1992), Assessments and the construction of context, in: Duranti, A. & Ch. Goodwin (eds.), 1992, 147-189. Goodwin, M. (1990), He-said-she-said: Talk as social organization among black children. Bloomington: Indiana University Press. Grewendorf, G. (1993), Der Sprache auf der Spur: Anmerkungen zu einer Linguistik nach Jäger Art, Zeitschrift für Sprachwissenschaft 12, 113-132. Grewendorf, G., Hamm, F. & Sternefeld, W. (1987), Sprachliches Wissen. Eine Einführung in moderne Theorien der grammatischen Beschreibung. Frankfurt: Suhrkamp. Grice, H.P. (1975), Logic and conversation, in: Cole, P. & Morgan, J.L. (eds.), Syntax and semantics 3: Speech acts. New York: Academic Press, 41-58. Grice, M. (1995), Leading tones and downstep in English, Phonology 12, 183 - 233. Gr0nnum, Ν. (=Thorsen)(1992), The groundworks of Danish intonation. An introduction. University of Copenhagen: Museum Tusculanum Press. Grosjean, F. & Deschamps, A. (1972), Analyse des variables temporelles du frangais spontan6, Phonetica 26, 129-156. Grunwald, Th. (1983), Reduktion und Kompensation als Funktion der Sprechgeschwindigkeit im Deutschen. Hamburg: H.Buske. Gumperz, J. (1968), The speech community, in: International encyclopedia of the social sciences. London: MacMillan, 381-386. Gumperz, J. (1977), Sociocultural knowledge in conversational inference, in: Saville-Troike, M. (ed.), Linguistics and Anthropology, Washington: Georgetown University Press, 191-211. Gumperz, J. (1981), The linguistic bases of communicative competence, in: Tannen, D. (ed.), Analysing discourse: text and talk (GURT 1981). Georgetown: University Press, 323-334. Gumperz, J. (1982), Discourse strategies. Cambridge: University Press. Gumperz, J. J. (1984), Ethnography in urban communication, in: Auer, P. & A. DiLuzio (eds.). Interpretive Sociolinguistics. Tübingen: Narr, 1-12. Gumperz, J. (1984 MS), Communicative competence revisited. Cognitive Science Program. Institute of cognitive Studies. University of California Berkely, June 1984. Gumperz, J. (1989 MS), Contextualization cues and metapragmatics. University of California, Berkeley. Gumperz, J. (1992a), Contextualization revisited, in: Auer, P. & Di Luzio, A. (eds.) 1992, 39-53. Gumperz, J. (1992b), Contextualization and understanding, in: Duranti, A. & Goodwin, Ch. (eds.) 1992, 229252. Gumperz, J. (1994), Sprachliche Variabilität in interaktionsanalytischer Perspektive, in: Kallmeyer, W. (ed.), Kommunikation in der Stadt. Berlin: DeGruyter, 611-639.

273 Gumperz, J. J., Aulakh, G. & Kaltman, H. (1982), Thematic structure and progression in discourse, in: Gumperz, J.J. (ed.) Language and social identity. Cambridge: University Press, 22-56. Gumperz, J. & Berenz, N. (1993), Transcribing conversational exchanges, in: Edwards, J. A. & Lampert, M.D. (eds.) 1993,91-121. Gumperz, J. (ed.) (1982), Language and social identity. Cambridge: University Press. Gumperz, J. & Hymes, D. (eds.) (1964), The ethnography of communication. American Anthropologist 66 (Sonderband). Gumperz, J. & Hymes, D. (eds.) (1972), Directions in sociolinguistics. The ethnography of communication. New York: Holt, Rinehart &Winston. Giinthner, S. (1992), Sprache und Geschlecht: Ist Kommunikation zwischen Frauen und Männern interkulturelle Kommunikation?, Linguistische Berichte 138, 123-143. Giinthner, S. (1993a), "... weil - man kann es ja wissenschaftlich untersuchen" - Diskurspragmatische Aspekte der Wortstellung in weiV-Sätzen, Linguistische Berichte 143, 37-59. Giinthner, S. (1993b), Moralische Geschichten - Beispielerzählungen mit Einladungen zur moralischen Entrüstung, Arbeitspapier Nr. 5. Projekt Moral, FG Soziologie Universität Konstanz. Gussenhoven, C. (1985), Intonation: a whole autosegmental language, in: van der Hülst, Η. & N. Smith (eds.), Advances in nonlinear phonology. Dordrecht: Foris, 117-131. Gussenhoven, C. (1986), Review of Selkirk (1984), Journal of Linguistics 22, 455-474. Gussenhoven, C. (1988), Adequacy in intonation analysis: the case of Dutch, in: van der Hulst, Η. & N. Smith (eds.) Autosegmental studies on pitch accent. Dordrecht: Foris. Gussenhoven, C. (1990), Tonal association domains and the prosodic hierarchy in English, in: Ramsaran, S. (ed.), Studies in the pronunciation of English. London/New York: Routledge, 27-37. Gussenhoven, C. (1991), The English rhythm rule as an accent deletion rule, Phonology 8, 1-35. Gussenhoven, C. (1992), Sentence accents and argument structure, in: Roca, I.M (ed.), Thematic structure: its role in grammar. Berlin: De Gruyter, 79 - 106. Gussenhoven, C. (1993), The Dutch foot and the chanted call, Journal of Linguistics 29, 37-63. Gussenhoven, C. & A.C.M. Rietveld (1988), Fundamental frequency declination in Dutch: Testing three hypotheses, Journal of Phonetics 16, 355-369. Gussenhoven, C. & A.C.M. Rietveld (1992), Intonation contours, prosodic structure and preboundary lengthening, Journal of Phonetics 20, 283-303. Habermas, J. (1971), Vorbereitende Bemerkungen zu einer Theorie der kommunikativen Kompetenz, in: Habermas, J. & Luhmann, N. (eds.), Theorie der Gesellschaft oder Sozialtechnologie. Frankfurt, 101-141. Haegeman, L. (1994), Introduction to Government & Binding Theory. Oxford: Blackwell. Haftka, B. (ed.) (1994), Was determiniert die Wortstellungsvariation? Studien zu einem Interaktionsfeld von Grammatik, Pragmatik und Sprachtypologie. Opladen: Westdeutscher Verlag. Halliday, M.A.K. (1967a), Notes on transitivity and theme in English, Journal of Linguistics 3, 37-81, 199244. Halliday, M.A.K. (1967b), Intonation and grammar in British English. The Hague: Mouton. Halliday, M.A.K. & Hasan, R. (1976), Cohesion in English. London: Longman. 't Hart, J. (1986), Declination has not been defeated - A reply to Lieberman et al.. Journal of the Acoustical Society of America 80, 1838 - 1840. Hasegawa, Y. & Hata, K. (1992), Fundamental frequency as an acoustic cue to accent perception, Language and Speech 35, 87-98. Hawkins, P.R. (1971), The syntactic location of hesitation pauses. Language and Speech 14, 277-288. Hawkins, J. (1990), A parsing theory of word order universals, Linguistic Inquiry 21-2, 223-261. Hawkins, J. (1992), Syntactic weight versus information structure in word order variation, in: Jacobs, J. (ed.) 1992, 196-219. Hawkins, J. (1994), A performance theory of order and constituency. Cambridge: University Press. Hayes, B. (1984), The phonology of rhythm in English, Linguistic Inquiry 15, 33-74. Heidolph, K.E. et al. (1984), Grundzüge einer deutschen Grammatik. Berlin: Akademieverlag. Heinitz, W. (1921), Die Bewertung der Dauer in phonetischen Aufnahmen, Vox, 153. Heritage, J. (1984), Garfinkel and Ethnomethodology, Cambridge: Polity Press. Heritage, J. (1985), Recent developments in conversation analysis, Sociolinguistics 15, 1-19. Heritage, J. (1989), Current developments in conversation analysis, in: Roger, D. & Bull, P. (eds.) 1989, 21-47.

274 Heydrich, W. et al. (eds.) (1989), Connexity and coherence: Analysis of text and discourse. Berlin. Hildebrandt, B.F.O. (1963), Effektives Sprechtempo, reflektives Sprechtempo und Lautzahlminderung, Zeitschrift für Phonetik 16, 63-76. Hoequist, C.E. (1984), Parameters of speech rate perception: Further results, Arbeitsberichte des Instituts für Phonetik der Universität Kiel (AIPUK), Nr. 21, 151-191. Hoequist, C.E.& K.J. Kohler (1986), Summary of speech rate perception research at Kiel. Arbeitsberichte des Instituts für Phonetik der Universität Kiel (AIPUK), Nr.22,7-28. Hoffmann, L. (1991), Anakoluth und sprachliches Wissen, Deutsche Sprache 19,97-119. Hofmann, U. (1994), Zur Topologie im Mittelfeld: Pronominale und nominale Satzglieder. Tübingen: Niemeyer. Hogg, R. & C.B. McCully (1987), Metrical phonology: a coursebook. Cambridge. Höhle, T. (1982), Explikation für 'normale Betonung' und 'normale Worstellung' im Deutschen, in: Abraham, W. (ed.) (1982), Satzglieder im Deutschen. Tübingen: Narr, 75-152. Höhle, T. (1986), Der Begriff 'Mittelfeld'. Anmerkungen über die Theorie der topologischen Felder, in: Weiss, W „ Wiegand, H.E. & Reis, M. (eds.) 1986, 329-340. Höhle, T. (1988), VERUM-Fokus, S & Ρ 5, 1 - 7 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Höhle, T. (1992), Über Verum-Fokus im Deutschen, in: Jacobs, J. (ed.) 1992, 112-141. Hooper, P. (1979), Aspect and foregrounding in discourse, in: Givön, Τ. (ed.), Syntax and semantics 12: Discourse and syntax. New York: Academic Press, 213-241. Home, M. (1990), Empirical evidence for a deletion formulation of the rhythm rule in English, Linguistics 28, 959-981. van der Hulst, H. (1984), Syllable structure and stress in Dutch. Dordrecht: Foris. Husserl, E. (1913), Ideen zur einer reinen Phänomenologie und phänomenologischen Philosophie. Erstes Buch: Allgemeine Einführung in die reine Phänomenologie. Halle a.d. Saale: Niemeyer (Neuabdruck: (1952) Husserliana Bd. ΙΠ, Den Haag: Nijhoff). Hyman, L. M. (1975), Phonology. Theory and analysis. New York: Holt, Rinehart & Winston. Hyman, L. M. (1985), A theory of phonological weight. Dordrecht: Foris. Hymes, D. (1962), The ethnography of speaking, Gladwin, T. & Sturtevant, W.C. (eds.), Anthropology and human behavior. Washington: Anthropology Society of Washington. Jacobs, J. (1982), Neutraler und nicht-neutraler Satzakzent im Deutschen, in: Vennemann, Th. (ed.) (1982), Silben, Segmente, Akzente. Tübingen: Niemeyer, 141-169. Jacobs, J. (1984), Funktionale Satzperspektive und Ulokutionssemantik, Linguistische Berichte 91, 25-58. Jacobs, J. (1988a), Probleme der freien Wortstellung im Deutschen, S & Ρ 5, 8-37 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Jacobs, J. (1988b), Fokus-Hintergrund-Gliederung und Grammatik, in: Altmann, H. (ed.), 1988, 89 - 134. Jacobs, J. (1991), Focus ambiguities, Journal of Semantics 8, 1-36. Jacobs, J. (ed.) (1992), Informationsstruktur und Grammatik. Opladen (=Linguistische Berichte, Sonderheft 4). Jacobs, J. (1993), Integration, in; Reis, M. (ed.), 1993, 63-116. Jacobs, J. (1996a), Wieviel Syntax braucht die Semantik? Möglichkeiten und Grenzen einer sparsamen Theorie der Bedeutungskomposition. Wuppertal. (Arbeiten des SFB 282 Nr. 73). Jacobs, J. (1996b), Bemerkungen zur I-Topikalisierung, S & Ρ 41, 1- 48 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Jacobs (i.E.), I-Topikalisierung, erscheint in: Linguistische Berichte 1997. Jacobs, J., von Stechow, Α., Sternefeld, W. & Th. Vennemann (eds.) (1993), Syntax. Ein internationales Handbuch zeitgenössischer Forschung (HSK Band 9.1). Berlin: de Gruyter. Jarvella, R. J . & Klein, W. (eds.) (1982), Speech, place, and action. Studies in deixis and related topics. Chichester: J. Wiley & Sons LTD. Jefferson, G. (1972), Side sequences, in: Sudnow, D. (ed.), 1972, 294-338. Jefferson, G. (1973), A case of precision timing in ordinary conversation: Overlapped tag positioned address terms in closing sequences, Semiotica IX, 1973, 47-96. Jefferson, G. (1974), Error correction as an interactional resource, Language in Society 2,181-199. Jefferson, G. (1978), Sequential aspects of storytelling in conversation, in: Schenkein, J. (ed.) 1978, 219-248.

275 Jefferson, G. (1979), A technique for inviting laughter and its subsequent acceptance declination, in: Psathas, G. (ed.), 1979, 76-96. Jefferson, G. (1983a), Notes on some orderliness of overlap onset, in: D'Urso, V. & P. Leonardi (eds.), Discourse analysis and natural rhetorics. Padova: Cleup Editore, 11-38. Jefferson, G. (1983b), On exposed and embedded correction in conversation, Studium Linguistik 14, 58-68. Wiederabgedruckt in: Button, G. & J.R.E. Lee (eds) 1987, 86-100. Jefferson, G. (1983c), Preliminary notes on a possible metric which provides for a 'standard maximum' silence of approximately one second in conversation, in: Roger, D. & P. Bull (eds.) 1989, 166-196. Jefferson, G. (1984), Notes on a systematic deployment of the acknowledgement tokens 'yeah' and 'mm h m ' , Papers in Linguistics 17, 197-216. Jefferson, G. (1986), Notes on 'lantency' in overlap onset, Human Studies 9, 153-183. Jefferson, G. (1990), List construction as a task and resource, in: Psathas, G. (ed.) 1990, 63-92. Jefferson, G., H. Sacks & E. Schegloff (1987), Notes on laughter in the pursuit of intimacy, in: Button, G. & J. R. E. Lee (eds.) 1987, 152-205. Jefferson, G. (ed.) (1989), Harvey Sacks Lectures 1964-1965. Dordrecht: Kluwer. (Sonderband Human Studies 12, 217-393). Jefferson, G. (ed.) (1992), Harvey Sacks: Lectures on Conversation. 2 Volumes. Oxford/Cambridge: Blackwell. Jespersen, O. (1904), Lehrbuch der Phonetik. Ab (^1913) unverändert. 1926) Leipzig/Berlin: Teubner. Kallmeyer, W. & Schütze, F. (1976), Konversationsanalyse, Studium Linguistik 1, 1-28. Keller, R. (1993), Das epistemische weil - Bedeutungswandel einer Konjunktion, in: Heringer, H.J. & Stötzel, G. (Hrsg.), Sprachgeschichte und Sprachkritik. Festschrift für P. v. Polenz. Berlin: De Gruyter. Kendon, A. (1990), Conducting interaction. Patterns of behaviour in focused encounters. Cambridge: University Press. Kindt, W. (1994a), Satzbegriff und gesprochene Sprache, Lingua 94: 25 - 48. Kindt, W. (1994b), Wortstellung als Problem einer dynamischen Grammatik, in: Haftka, B. (ed.) 1994, 49 - 62. Kindt, W. & Laubenstein, U. (1991), Reparaturen und Koordinationskonstruktionen. Ein Beitrag zur Strukturierung des gesprochenen Deutsch. KoLiBri -Arbeitsbericht Nr. 20. Universität Bielefeld. Kingston, J. & M.E. Beckman (eds.) (1990), Papers of laboratory phonology I: Between grammar and the physics of speech. Cambridge: University Press. Kiparsky, P. (1966), Über den deutschen Akzent, Studia Grammatica VII, 69-98. Klein, W. & v. Stechow, A. (1982), Intonation und Bedeutung von Fokus. Arbeitspapiere des SFB 99 Nr. 77. Universität Konstanz. Klein, W. & v. Stutterheim, Ch. (1987), Queastio und referentielle Bewegung in Erzählungen, Linguistische Berichte 109, 163-183. Klein, W. & Ch. von Stutterheim (1991), Text structure and referential movement, S & Ρ 22 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Kohler, K.J. (1983), Stress-timing and speech rate in German, Arbeitsberichte des Instituts für Phonetik der Universität Kiel (AIPUK), Nr. 20, 5-53. Köhler, K.J. (1986). Parameters of speech rate perception in German words and sentences: duration Fo movement and Fo level, Arbeitsberichte des Instituts für Phonetik der Universität Kiel (AIPUK), Nr. 22, 137-177. Auch in: Language and Speech 29, 115-139. Kohler, K.J. (1987), Funküonen von Fo-Gipfeln im Deutschen, in: Tillmann, H. G. & Willie, G. (eds.) (1987), Analyse und Synthese gesprochener Sprache. Hildesheim, 133-139. Kohler, K.J. (1990), Macro and micro Fo in the synthesis of intonation, in: Kingston, J. & M.E. Beckman (eds.) 1990, 115- 138. Kohler, K.J. (1995 2 ), Einführung in die Phonetik des Deutschen. (1. Aufl. 1977) Berlin: Erich Schmidt Verlag. Köhler, K.J. et al. (1981), Sprechgeschwindigkeit in Produktion und Perzeption, Arbeitsberichte des Instituts für Phonetik der Universität Kiel (AIPUK), Nr. 16, 139-205) Kohrt, M. (1986), Dialoggrammatik und/oder Konversationsanalyse?, in: Hundsnurscher, F. & Weigand, E. (eds.) (1986), Dialoganalyse. Referate der 1. Arbeitstagung Münster 1986. Tübingen: Niemeyer, 69-82. Kowal, S. (1991), Über die zeitliche Organisation des Sprechens in der Öffentlichkeit. Bern/Stuttgart/Toronto: Hans Huber. Kratzer, A. (1991), The representation of focus, in: von Stechow, A. & Wunderlich, D. (eds.) 1991,825-834.

276 Krifka, Μ. (1995), Focus and operator scope in German, in: Bosch, P. & van der Sandt, R. (eds.), Focus & natural language processing. (Vol.1 Intonation and Syntax). Heidelberg. (Working Paper No. 6 of the IBM Institute for Logic and Linguistics). Küper, Ch. (1991), Geht die Nebensatzstellung im Deutschen verloren? Zur pragmatischen Funktion der Wortstellung in Haupt- und Nebensätzen, Deutsche Sprache 19, 133-158. Labov, W. (1972), The transformation of experience in narrative syntax, in: ders., Language in the inner city. Philadelphia: University of Pensylvania Press, 354-396. Labov, W. & Waletzky, J. (1967). Narrative analysis. Oral versions of personal experience, in: Helm, J. (ed.) Essays on the verbal and visual arts. Seattle: University of Washington, 12-44. Dt.: Erzählanalyse. Mündliche Versionen persönlicher Erfahrung, in: Ihwe, J. (ed.) (1973), Literaturwissenschaft und Linguistik Bd. 2. Frankfurt: Athenäum, 78-126. Ladd, D.R. (1980), The structure of intonational meaning. Bloomington: Indiana University Press. Ladd, D. R. (1983a), Phonological features of intonational peaks, Language 59, 721-759. Ladd, D. R. (1983b), Peak features and the overall slope, in: Cutler, An. & D.R. Ladd (eds.), Prosody: Models and measurements. Berlin, 39-52. Ladd, D. R. (1984), Declination: a review and some hypotheses, Phonology Yearbook 1,53-74. Ladd, D. R. (1986), Intonational phrasing: the case for recursive prosodic structure, Phonology Yearbook 3,311340. Ladd, D. R. (1988), Declination 'reset' and the hierarchical organization of utterances, Journal of the Acoustical Society of America 84, 530-544. Ladd, D.R. (1990a), Metrical representation of pitch register, in: Kingston, J. & M.E. Beckman (eds.) 1990, 3557. Ladd, D.R. (1990b), Intonation: emotion vs. grammar, Language 66, 806-816. Ladd, D.R. (1991), One word's strength is another word's weakness: integrating syntagmatic and paradigmatic aspects of stress. Occasional Papers Universitiy of Edinburgh, Linguistics Department. Jan. 1991. Ladd, D.R. (1992), Compound prosodic domains. Occasional Papers Universitiy of Edinburgh, Linguistics Department. Feb. 1992. Ladd, D.R. (1993), On the theoretical status of 'the baseline' in modelling intonation, Language and Speech 36, 435-451. Ladd, D.R., Verhoeven, J. & K. Jacobs (1994), Influence of adjacent pitch accents on each other's perceived prominence: two contradictory effects, Journal of Phonetics 22, 87-99. Ladefoged, P. (1975/1982): A course in phonetics. New York: Harcourt Brace Jovanovich. Lambert, P. J. (1976), Ausklammerung in modern standard German. Hamburg: Buske. Lass, N.J. (1970), The significance of intra- and intersentence pause times in perceptual judgements of oral reading rate, Journal of Speech and Hearing Research 13, 777-784. Lass, N.J. & Deem, J.F. (1972), Temporal patterns of speech rate alternations. In: A. Rigault & R. Charbonneau (eds.). Proceedings of the 7th International Congress of Phonetic Sciences. Den Haag, 922-928. Lehiste, I. (1970), Suprasegmentals. Cambridge: The ΜΓΓ Press. Lehiste, I. (1973), Rhythmic units and syntactic units in production and perception, Journal of the Acoustical Society of America 54, 1228-1234. Lehiste, I. (1976), Influence of fundamental frequency pattern on the perception of duration, Journal of Phonetics 4, 113-117. Lehiste, I. (1977), Isochrony reconsidered, Journal of Phonetics 5, 253 - 263. Lehiste, I. (1979), The perception of duration within sentences of four intervals, Journal of Phonetics 7, 113316. Lenerz, J. (1977), Zur Abfolge nominaler Satzglieder im Deutschen. Tübingen: NarT. Levelt, W.J.M. (1983), Monitoring and self-repair in speech, Cognition 14, 41 - 104. Levelt, W.J.M. (1989), Speaking. From intention to articulation. Cambridge/London: MIT Press. Levelt, W.J.M. & A. Cutler (1983), Prosodic marking in speech repair, Journal of Semantics 2-2, 205-217. Levinson, S.C. (1978), Activity types and language, Pragmatics Microfiche 3: 3-3 Dl - G 5. In überarbeiteter Form wiederabgedruckt in: Drew, P. & Heritage, J. (eds.) 1992, 66-110. Levinson, S. C. (1983), Pragmatics. Cambridge: University Press. Levinson, S.C. (1988a), Putting linguistics on a proper footing: explorations in Goffman's concepts of participation, in: Drew, P. & Wootton, A. (eds.) 1988, 161-227. Levinson, S. C. (1988b), A review of relevance, Journal of Linguistics 25, 455-472.

277 Liberman, Μ. & A. Prince (1977), On stress and linguistic rhythm, Linguistic Inquiry 8, 249-336. Lieberman, P. (1963), Some effects of semantic and grammatical context on the production and perception of speech, Language and Speech 6,172-187. Lieberman, P. et al. (1985), Measures of sentence intonation of read and spontanous speech in American English, Journal of the Acoustical Society of America 77, 649-657. Lieberman, P. (1986), Alice in declination land - A reply to J. 't Hart, Journal of the Acoustical Society of America 80, 1840-1842. Liedtke, F. (1986), Relevanz und Konversation, in: Hundsnurscher, F. & Weigand, Ε. (eds.), Dialoganalyse. Referate der 1.Arbeitstagung, Münster 1986. Tübingen: Niemeyer, 319-334. Lloyd James, A. (1940), Speech signals in telephony. London. Lötscher, A. (1983), Satzakzent und funktionale Satzperspektive im Deutschen . Tübingen: Niemeyer. Maitz, D.N. & Broker, R.A. (1982), A cultural approach to male-female miscommunication, in: Gumperz, J. (ed.), 195-216; dt.: Mißverständnisse zwischen Männern und Frauen - kulturell betrachtet, in: Günthner, S. & Kotthoff, H. (eds.) (1991), Von fremden Stimmen. Frankfurt: Suhrkamp, 52-74. Marslen-Wilson, W. , Levy, Ε. & Komisarjevsky Tyler, L. (1982), Producing interpretable discourse: The establishment and maintenance of reference, in: Jarvella, R.J. & Klein, W. (eds.) 1982, 339-378. Maynard, D.W. (1980), Placement of topic changes in conversation, Semiotica 30, 263-290. Mead, G.H. (1934), Mind, Self and Society. From the standpoint of a social behaviorist. Chicago: University Press; dt.: (1968), Geist, Identität und Gesellschaft (aus der Sicht des Sozialbehaviorismus). Frankfurt: Suhrkamp. Mehan, H. & Wood, H. (1975), The reality of ethnomethodology. New York: Wiley. Meibauer, J. (1987) (ed.), Satzmodus zwischen Grammatik und Pragmatik. Tübingen: Niemeyer. Meinhold, G. (1972), Allgemeine Probleme der Sprechgeschwindigkeit. Zeitschrift für Phonetik 25,492-505. Miller, J.L., Grosjean, F. & C. Lomanto (1984), Articulation rate and its variability in spontanous speech: A reanalysis and some implications, Phonetica 41,215-255. Möbius, B. (1993), Ein quantitatives Modell der deutschen Intonation. Tübingen: Niemeyer. Moerman, M. (1988), Talking culture: Ethnography and conversation analysis. Philadelphia. Molnär, V. (1991), Das TOPIK im Deutschen und im Ungarischen. Lund (Lunder germanistische Forschungen 58): Almquist & Wikseil. Morton, J„ Marcus, S. & Frankish, C. (1976), Perceptual centers, Psycholingual Review 83, 405 - 409. Mötsch, W„ Reis, M. & Rosengren, I. (1990), Zum Verhältnis von Satz und Text, Deutsche Sprache 18, 97125. Müller, F. E. (1991), Metrical emphasis: Rhythmic scansions in Italian conversation. KontRi Arbeitspapier 14. Universität Konstanz. Näf, Α. (1987), Gibt es Exklamativsätze?, in: Meibauer, J. (ed.) 1987, 140-160. Nakajima, S. & Allen, J.F. (1993), Α study on prosody and discourse structure in cooperative dialogues, Phonetica 50, 197-210. Nakatani, L.H., O'Connor, K.D. & Aston, C.h. (1981), Prosodic aspects of American English speech rhythm, Phonetica 38, 84-106. Nespor, Μ. & I. Vogel (1986), Prosodic phonology. Dordrecht: Foris. Nespor, Μ. & I. Vogel (1989), On clashes and lapses, Phonology 6, 69-116. Nofsinger, R.E. (1991), Everyday conversation. Newbury Park: Sage. Nooteboom, S. (1980), Speaking and unspeaking: detection and correction of phonological and lexical errors in spontanous speech, in: Fromkin, V.A. (ed.), Errors in linguistic performance. New York: Academic Press. Oppenrieder, W. (1988a), Intonation und Identifikation. Kategorisierungstests zur kontextfreien Identifikation von Satzmodi, in: Altmann (ed.) 1988, 153-167. Oppenrieder, W. (1988b), Intonatorische Kennzeichnung von Satzmodi, in: Altmann, H. (ed.), 1988, 169-205. Oppenrieder, W. (1989), Selbständige Verb-Letzt-Sätze: Ihr Platz im Satzmodussystem und ihre intonatorische Kennzeichnung, in: Altmann, H. Batliner, A. & Oppenrieder W. (eds.) 1989, 163-244. den Os, E. (1985), Perception of speech rate of Dutch and Italian utterances, Phonetica 42, 124-134. van Os, Ch. (1989), Aspekte der Intensivierung. Tübingen: Narr. Patocka, F. (1991), Vorschläge zu einem Korpustauglichen Satztypen- und Feldermodell, Deutsche Sprache 19, 120-132.

278 Patzelt, W J . (1987), Grundlagen der Ethnomethodologie: Theorie, Empirie und politikwissenschaftlicher Nutzen einer Soziologie des Alltags. München. Paul, H. (1880), Prinzipien der Sprachgeschichte. Darmstadt. Pheby, J. (1980), Phonologie: Intonation. In: K.E. Heidolf et al., Grundzüge einer deutschen Grammatik. Berlin: Akademie Verlag, 839-897. Pheby, J. (1983), Intonationsbeschreibung des Deutschen mit Hilfe von 'Informationseinheit' und 'Intonationseinheit', Zeitschrift für Literaturwissenschaft und Linguistik 49, 35-52. Pierrehumbert, J. (1980/1987), The phonology and phonetics of English intonation. PhD. Diss MIT. Erschienen: IULC Bloomington 1987. Pierrehumbert, J. & Beckman, M. (1988), Japanese tone structure. Cambridge: ΜΓΓ Press. Pierrehumbert, J. & Hirschberg, J. (1990), The meaning of intonational countours in the interpretation of discourse, in: Cohen, P., Morgan, J. & Pollack.M. (eds.), Intentions in communication. Cambridge: MIT Press, 271-311. Pike, K.L. (1945), The intonation of American English. Ann Arbor, Mich.: Univ. of Michigan Publications. Pomerantz, A. (1975), Second assessments: Studies of some features of agreements/ disagreements. Ph.D. Diss., University of California. Pomerantz, A. (1978), Compliment responses. Notes on the co-operation of multiple constraints, in: Schenkein, J. (ed.) 1978,79-112. Pomerantz, A. (1984), Agreeing and disagreeing with assessments: some features of preferred/dispreferred turn shapes, in: Atkinson, J.M. & J. Heritage (eds.) 1984, 57-101. Pomerantz, A. (1986), Extreme case formulations: A way of legitimizing claims, Human Studies 9, 219-229. Pompino-Marschall, B. (1990), Die Silbenprosodie. Ein elementarer Aspekt der Wahrnehmung von Sprachrhythmus und Sprechtempo. Tübingen: Niemeyer. Primus, B. (1993), Word order and information structure: A performance based account for topic positions and focus positions, in: Jacobs, J. et al. (eds.), 1993, 880-896. Primus, B. (1994), Wortstellung und Performanz: Faktoren der Wortstellungsvariation im Mittelfeld, S & Ρ 32, 39 - 86 (Arbeitsberichte "Sprache und Pragmatik", Germanistisches Institut der Universität Lund). Psathas, G. (1990), Introduction: methodological issues and recent developments in the study of naturally occuring interaction, in: Psathas, G. (ed.) 1990, 1-29. Psathas, G. (ed.) (1979), Everyday language. Studies in ethnomethodology. New York: Irvington Publishers. Psathas, G. (ed.) (1990), Studies in ethnomethodology and conversation analysis. Vol.1. Interaction competence. Washington: University Press of America. Raabe, H. (1979), Apposition. Tübingen: Narr. Radford, A. (1988), Transformational grammar. A first course. Cambridge: University Press. Ramers, K.H. (1992), Ambisilbische Konsonanten im Deutschen, in: Eisenberg, P., K.H. Ramers & Η. Vater (eds.) (1992), Silbenphonologie des Deutschen. Tübingen: G. Narr, 246-283. Rath, R. (1975), Korrektur und Anakoluth im Gesprochenen Deutsch, Linguistische Berichte 37, 1-12. Rehbock, H. (1993), 'Grammatik' als tollkühne Metapher (Zu Edda Weigand: Grammatik des Sprachgebrauchs, ZGL 20, 182-192), Zeitschrift für Germanistische Linguistik 21, 205-214. Reinhart, T. (1983), Point of view in language - the use of parentheticals, in: Rauh, G. (ed.), Essays on deixis. Tübingen: Narr, 169-194. Reis, Μ. (1987), Die Stellung der Verbargumente im Deutschen. Stilübungen zum Grammatik:PragmatikVerhältnis, in: I.Rosengren (ed.), Sprache und Pragmatik (LgF 55). Stockholm 1987, 139-177. Reis, M. (ed.) (1993), Wortstellung und Informationsstruktur. Tübingen: Niemeyer. Rietveld, A. C. M. & C. Gussenhoven (1985), On the relation between pitch excursion size and prominence, Journal of Phonetics 13, 299-308. Rietveld, A. C. M. & C. Gussenhoven (1987), Perceived speech rate and intonation, Journal of Phonetics 15, 273-285. Roger, D. & Bull, P. (eds.) (1989), Conversation: An interdisciplinary perspective. Clevedon/Philadelphia: Multilingual Matters LTD. Rooth, M. (1992), A theory of focus interpretation, Natural Language Semantics 1, 75-116. Rosengren, I. (1992), Zur Grammatik und Pragmatik der Exklamation, in: Rosengren, I. (ed.) 1992, 263-306. Rosengren, I. (1992) (ed.), Satz und Illokution, Band 1. Tübingen: Niemeyer. Royi, H.-W. (1983), Segmentierung und Hervorhebungen in gesprochener deutscher Standardsprache. Analyse eines Polylogs. (Phonai Monographien 17). Tübingen: Niemeyer.

279 Sacks, Η. (1971), Das Erzählen von Geschichten innerhalb von Unterhaltungen, in: Kjolseth, R. & F. Sack (eds.) Zur Soziologie der Sprachen (Sonderheft 15 der KZfSS), Opladen, 307-314. Sacks, H. (1972), An intial investigation of the usability of conversational data for doing sociology, in: Sudnow, D.N. (ed.) 1972, 31-63. Sacks, H. (1974), The analysis of the course of a joke's telling in conversation, in: Bauman, R. & J. Sherzer (eds.), Explorations in the ethnography of speaking. Cambridge, 337-347. Sacks, H. (1987), The preference for agreement and contiguity, in: Button, G. & J. Lee (eds.) 1987,54-69. Sacks, H. (1989), Lectures 1964-1965, in: Jefferson, J. (ed.) 1989: 35-211. Sacks, H. (1992), Lectures on Conversation, in: Jefferson, J. (ed.) 1992: Vol 1, Vol. 2. Sacks, H. & Schegloff, E. (1979), Two preferences in the organization of reference to persons in conversation and their interaction, in: Psathas, G. (ed.) 1979, 15-21; dt.: Zwei Präferenzen in der Organisation personaler Referenz in der Konversation und ihre Wechselwirkung, in: Quasthoff, U. (ed.) (1978), Sprachstruktur Sozialstruktur. Königstein/Ts.: Scriptor, 150-157. Sacks, Η., Ε. A. Schegloff & G. Jefferson (1974), A simplest systematics for the organization of turn-taking for conversation, Language 50,696-735. Schegloff, E. (1972) Sequencing in conversational openings, in: Gumperz, J. & Hymes, D. (eds.) Directions in sociolinguistics. New York, 346-380. Schegloff, E. (1978), On some questions and ambiguities in conversation, in: Dressier, W. U. (ed.), Current trends in textlinguistic. Berlin/New York, 81-102. Schegloff, E. (1979), The relevance of repair to syntax-for-conversation, in: Givon, T. (ed.), Syntax and Semantics 12: Discourse and Syntax. New York 1979: Academic Press, 261-286. Schegloff, E. A. (1980), Preliminaries to preliminaries: "Can I ask you a question?", Sociological Inquiry 50: 104-152. (Special double issue: Zimmerman, D. & West, C. (eds.), Language and social interaction). Schegloff, E. (1982), Discourse as an interactional achievement: Some uses of 'uh huh' and other things that come between sentences, in: Tannen, D. (ed.), Analysing Discourse: text and talk. GURT 1981. Washington, D.C.: Georgetown University Press, 71-91. Schegloff, E. (1987a), Between micro and macro: context and other connections, in: Alexander, J. et al. (eds.), The micro-macro link: Berkeley: University of California Press, 207-234. Schegloff, E. A. (1987b), Recycled turn beginnings: A precise repair mechanism in conversation's turn-taking organisation, in: Button, G. & J.R.E. Lee (eds.) 1987, 70-85. Schegloff, E. (1988), Goffman and the analysis of conversation, in: Drew, P. & Wootton, A. (eds.) 1988, 89135. Schegloff, E. A. (1990), On the organization of sequences as a source of 'coherence in talk-in-interaction, in: Dorval, B. (ed.) 1990, 51-77. Schegloff, E. A. (1991), Reflections on talk and social structure, in: Boden, D. & Zimmerman, D.H. (eds.) 1991, 44-70. Schegloff, E. (1992), Repair after next turn: the last structurally provided defense of intersubjectivity in conversation, American Journal of Sociology Vol. 97-5, 1295-1345. Schegloff, E., Jefferson, G. & Sacks, H. (1977), The preference for self-correction in the organization of repair in conversation, Language 53, 361-382. Wiederabgedruckt in: Psathas, G. (ed.) 1990, 31-62. Schegloff, Ε. & H. Sacks (1973), Opening up closings, Semiotica 8, 289-327. Schenkein, J. (ed.) (1978), Studies in the organization of conversational interaction. New York: Academic Press. Scherer, K.R. (1977), Affektlaute und vokale Embleme, in: Posner, R. & Reinecke, H.P. (eds.), Zeichenprozesse. Wiesbaden, 199-214. Scheutz, H. (1993), Apokoinoukonstruktionen. Gegenwartssprachliche Erscheinungsformen und Aspekte ihrer historischen Entwicklung, in: Weiss, A. (ed.), Dialekte im Wandel. Göppingen: Kiimmerle, 243-264. Schindler, W. (1990), Untersuchungen zur Grammatik appositionsverdächtiger Einheiten im Deutschen. Tübingen: Niemeyer. Scholz, U. (1991), Wunschsätze im Deutschen - Formale und funktionale Beschreibung. Tübingen: Niemeyer. Schönherr, B. (1993), Prosodische und nonverbale Signale für Parenthesen. Parasyntax in Fernsehdiskussionen, Deutsche Sprache 21-3,223 - 243. Schütz, A. (1932), Der sinnhafte Aufbau der sozialen Welt. Eine Einleitung in die verstehende Soziologie. Wien: J. Springer Schütz, A. & Luckmann, Th. (1979), Strukturen der Lebenswelt. Bd. 1. Frankfurt: Suhrkamp. Schütz, A. & Luckmann, Th. (1984), Strukturen der Lebenswelt. Bd. 2. Frankfurt: Suhrkamp.

280 Schuetze-Coburn, S., Shapley, M. & E.G. Weber (1991), Units of intonation in Discourse. A comparison of acoustic and auditory analyses, Language and Speech 34, 207-234. Scollon, R. (1981 MS), Tempo, density, and silence: rhythms of ordinary talk. University of Alaska: Fairbanks. Scollon, R.(1982), The rhythmic integration of ordinary talk, in: Tannen, D. (ed.), Analysing discourse: Text and Talk (GURT 1981). Washington DC: Georgetown University Press, 335-349. Selkirk, E. (1980), T h e role of prosodic categories in English word stress, Linguisitc Inquiry 11, 563-605. Selkirk, E. (1984), Phonology and syntax: The relation between sound and structure. Cambridge. Mass.: ΜΓΓ Press. Selkirk, E. (1986), On derived domains in sentence phonology, Phonology Yearbook 3, 371-405. Selkirk, E. (1990), On the nature of prosodic constituency: comments on Beckman and Edward's paper, in: Kingston, J. & M.E. Beckman (eds.) 1990, 179-200. Selting, M. (1987a), Reparaturen und lokale Verstehensprobleme oder: Zur Binnenstruktur von Reparatursequenzen, Linguistische Berichte 108, 128-149. Selting, M. (1987b), Fremdkorrekturen als Manifestationsformen von Verständigungsproblemen, Zeitschrift für Sprachwissenschaft 6, 37-58. Selting, M. (1992), Phonologie der Intonation. Probleme bisheriger Modelle und Konsequenzen einer neuen interpretativ-phonologischen Analyse, Zeitschrift für Sprachwissenschaft 11,99-138. Selting, M. (1993), Voranstellungen vor den Satz. Zur grammatischen Form und interaktiven Funktion von Linksversetzung und Freiem Thema im Deutschen, Zeitschrift für Germanistische Linguistik 21, 291-319. Selting, M. (1994a), Konstruktionen am Satzrand als interaktive Ressource in natürlichen Gesprächen, in: Haftka, B. (ed.), 1994, 299 - 318. Selting, M. (1994b), Emphatic (speech) style - with special focus on the prosodic signalling of heigthened emotive involvement in conversation, in: Caffi, C. & R. W. Janney (eds.), Involvement in Language. Special Issue of the Journal of Pragmatics 22, 375 - 408. Selting, M. (1995), Der 'mögliche Satz' als interaktiv relevante syntaktische Kategorie, Linguistische Berichte 158: 298 - 325. Sievers, E. (1901), Grundzüge der Phonetik. Leipzig. Sluijter, A.M.C. & Terken, J.M.B. (1993), Beyond sentence prosody: paragraph intonation in Dutch, Phonetica 50,180-188. Sperber, D. & D. Wilson (1986), Relevance. Cambridge. von Stechow, A. (1991), Current issues in the theory of focus, in: von Stechow, A. & Wunderlich, D. (eds.), 1991, 804-825. von Stechow, A. & Sternefeld, W . (1988), Bausteine syntaktischen Wissens. Ein Lehrbuch der generativen Grammatik. Opladen: Westdeutscher Verlag. von Stechow, A. & Uhmann, S. (1984), On the focus - pitch accent relation, Groninger Arbeiten zur Germanistischen Linguistik (GAGL) Nr. 25, 223-263. von Stechow, A. & Wunderlich, D. (eds.) (1991), Semantik. Ein internationales Handbuch der zeitgenössischen Forschung (HSK Band 6). Berlin: de Gruyter. Streeck, J. (1979), SANDWICH. GOOD FOR YOU.- Zur pragmatischen und konversationeilen Analyse von Bewertungen im institutionellen Diskurs der Schule, in: Dittmar, N. (ed.) (1979), Arbeiten zur Konversationsanalyse. Tübingen: Niemeyer, 235- 256. Streek, J. (1983), Konversationsanalyse. Ein Reparaturversuch, Zeitschrift für Sprachwissenschaft 2, 72-104. Streek, J. (1989), Methodologische Aspekte der linguistischen Analyse von Gesprächen, Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung 42, 192-207. Sturtevant, W.C. (1964), Studies in ethnoscience, American Anthropologist 66, 99-131 (Sonderband: Romney, A.K. & D'Andrade, R.G. (eds.), Transcultural studies in cognition). Sudnow, D. (ed.) (1972), Studies in social interaction. New York: Free Press. Swerts, M. & Geluykens, R. (1993), The prosody of information units in spontanous monologue, Phonetica 50, 189-196. Tannen, D. (1984), Conversational style: Analysing talk among friends. Norwood: Ablex. Tannen, D. (1986), That's not what I meant: How conversational style makes or breaks your relations with others. New York: W. Morrow. Tannen, D. (1989), Talking voices. Repetion, dialogue, and imagery in conversational discourse. Cambridge: University Press.

281 Tannen, D. (1990a), Gender differences in conversational coherence: Physical alignment and topical cohesion, in: Dorval, B. (ed.) 1990, 167-206. Tannen, D. (1990b), You just don't understand. Women and men in conversation. New York: W. Morrow and Comp.; dt.: (1991), Du kannst mich einfach nicht verstehen. Warum Männer und Frauen aneinander vorbeireden. Hamburg: Kabel. Tannen, D. (ed.) (1984), Coherence in spoken and written discourse. Norwood: Ablex (Advances in discourse processes ΧΠ). Taylor, Τ. & Cameron, D. (1987), Analysing conversation. Rules and units in the structure of talk. Oxford: Pergam Press. Terken, J. (1991), Fundamental frequency and perceived prominence of accented syllables, Journal of the Acoustical Society of America 89, 1768-1776. Terken, J. (1993), Baselines revisited: Reply to Ladd, Language and Speech 36,453-459. Thorsen, N. (1988), Standard Danish intonation. Annual Report of the Institute of Phonetics, Univ. of Copenhagen (ARIPUC 22), 1-23. Tomlin, R. S. (ed.) (1987), Coherence and grounding in discourse. Amsterdam: Benjamins. Tuller, B. & Fowler, C.A. (1980): Some articulatory correlates of perceptual isochrony. Perception and Psychophysics 24, 277 - 283. Turner, R. (1972), Some formal properties of therapy talk, in: Sudnow, D. (ed.), Studies in Social interation. New York: Free Press, 367-396; dt.: Einige formale Eigenschaften des therapeutischen Gesprächs, in: Auwärter, M. et al. (eds.) (1976), Seminar: Kommunikation, Interaktion, Identität. Frankfurt: Suhrkamp, 140-190. Turner, R. (ed.) (1974), Ethnomethodology. Selected readings. Harmondsworth: Penguin. Uhmann, S. (1987 MS), Fokussierung und Intoantion. Eine Untersuchung zu Deutschen anhand von FrageAntwort-Sequenzen in experimentellen Dialogen. Dissertation Universität Konstanz. Uhmann, S. (1988), Akzenttöne, Grenztöne und Fokussilben. Zum Aufbau eines phonologischen Intonationssystems für das Deutsche, in: Altmann, H. (ed.), Intonationsforschungen. Tübingen 1988, 65-88. Uhmann, S. (1989a), Interviewstil: Konversationelle Eigenschaften eines sozialwissenschaftlichen Erhebungsinstruments, in: Hinnenkamp, V. & Selting; M. (eds.) Stil und Stilisierung. Arbeiten zur interpretativen Soziolinguistik. Tübingen: Niemeyer, 125-165. Uhmann, S. (1989b), On some forms and functions of speech rate changes in everyday conversation. KontRI Arbeitspapier Nr. 7. Universität Konstanz. Uhmann, S. (1991), Fokusphonologie. Eine Analyse deutscher Intonationskonturen im Rahmen der nichtlinearen Phonologie. Tübingen: Niemeyer. Uhmann, S. (1992), Contextualizing relevance: On some forms and functions of speech rate changes in conversation, in: Auer & Di Luzio (eds.) 1992, 297-336. Uhmann, S. (1993), Das Mittelfeld im Gespräch, in: Reis, Μ. (ed.) 1993, 313-354. Uhmann, S. (1996a), On rhythm in everday German conversation: Beat clashes in assessment utterances, in: Ε. Couper-Kuhlen & Μ. Selting (eds.), Prosody in conversation: interactional studies. Cambridge: University Press, 303 - 365. Uhmann, S. (1996b), Nur ein Sturm im Lexikonglas: Zur aktuellen Verbstellungsvariation in we/Z-Sätzen. Wuppertaler Arbeitspapiere zur Sprachwissenschaft (WAS) 13, 1 - 27. Uhmann, S. (1996c), Warum man den Kopf nicht verlieren darf, wenn man sich selbst korrigiert. Wuppertaler Arbeitspapiere zur Sprachwissenschaft (WAS) 13, 29 - 55 . Uhmann (1997), Selbstreparaturen in Alltagsdialogen: Ein Fall für eine integrative Konversationstheorie, in: P. Schlobinski (Hg.) (1997), Syntax des gesprochenen Deutsch. Opladen: Westdeutscher Verlag, 157 - 180. Uhmann, S. (i.V.a), On downstep and emphasis in German. Uhmann, S. (i.V.b), Intonationsphrase und Informationseinheit: same or different? Uszkoreit, Η. (1986), Constraints on Order, Center for the Study of Language and Information No. 86-46, Stanford University 1986. Vallduvi, E. (1993), Information packaging: a survey. Research Paper HCRC/RP-44. University of Edinburgh. Vennemann, Th. (1982), Zur Silbenstruktur der deutschen Standardsprache, in: Vennemann, Th. (ed.) (1982), Silben, Segmente, Akzente. Tübingen: Niemeyer. Vennemann, Th. (1991), Skizze der deutschen Wortprosodie, Zeitschrift für Sprachwissenschaft 10, 86-111. Vennemann, Th. & Jacobs, J. (1982) Sprache und Grammatik. Grundprobleme der linguistischen Sprachbeschreibung. Darmstadt: Wissenschaftliche Buchgesellschaft.

282 Visch, Ε. (1990), A metrical theory of metrical stress phenomena. Dordrecht: Foris. Watson, R. (1987), Interdisciplinary considerations in the analysis of pro-terms, in: Button & Lee (eds.) 1987, 261-289. Wegener, H. (1993), weil das hat schon seinen Grund. Zur Verbstellung in Kausalsätzen mit weil im gegenwärtigen Deutsch, Deutsche Sprache 21, 289-305. Weigand, E. (1992), Grammatik des Sprachgebrauchs, Zeitschrift für Germanistische Linguistik 20,182-192. Weingarten, E., Sack, F. & Schenkein, J. (eds.) (1976), Ethnomethodologie: Beiträge zu einer Soziologie des Alltagshandelns. Frankfurt: Suhrkamp. Weiss, W., Wiegand, H.E. & Reis, M. (eds.) (1986), Kontroversen, alte und neue. Akten des VII. Internationalen Germanisten-Kongresses Göttingen 1985. Bd. 3 (Textlinguistik contra Stilistik? Wortschatz und Wörterbuch. Grammatische oder pragmatische Organisation von Rede?). Tübingen: Niemeyer. Werth, P. (1981), The concept of 'relevance' in conversational analysis, in: Werth, P. (ed.), Conversation and discourse. Structure and interpretation. London: Croom Helm, 129-154. Wiese, R. (1986), Zur Theorie der Silbe, Studium Linguistik 20, 1-15. Wiese, R. (1988), Silbische und lexikalische Phonologie. Beiträge zum Chinesischen und zum Deutschen. Tübingen: Niemeyer. Wiese, R. (1996), The phonology of German. Oxford: Clarendon Press. Wilson; D. & Sperber, D. (1988), Representation and relevance, in: Kempson, R. (ed.) 1988), Mental representations. The interface between language and reality. Cambridge: University Press. Winkler, Ch. (1969), Der Einschub. Kleine Studie über eine Form der Rede, in: Engel, U. et al. (eds.), Festschrift fiir Hugo Moser. Düsseldorf: Schwann, 282-295. Wood, S. (1975), Speech tempo, Working Papers No. 9, Phonetics Laboratory Lund University, 99-147. Wotton, T. (1989), Remarks on the methodology of conversation analysis, In: Roger, D. & Bull, P. (eds.) 1989, 238-258. Wunderlich, D. (1978), Wie analysiert man Gespräche. Beispiel Wegauskünfte, Linguistische Berichte 58, 4176. Wundt, W. (31887), Grundzüge der physiologischen Psychologie. Leipzig: Engelmann. Wurzel, W.U. (1980), Der deutsche Wortakzent: Fakten - Regeln - Prinzipien, Zeitschrift für Germanistik 3, 299-318. Zacharski, R. et al. (1992), Bridge: Basic research on intonation for dialogue generation. Occasional Paper, University of Edinburgh. September 1992. Zahn, G. (1991), Beobachtungen zur Ausklammerung und Nachfeldbesetzung in gesprochenem Deutsch. Erlangen: Palm und Enke. Ziv, Y. (1985), Parentheticals and functional grammar, in: Bolkestein, A.M. et al. (eds.) Syntax and Pragmatics in functional grammar. Dordrecht: Foris, 181-199.