Die Ursprünge der menschlichen Kommunikation 9783518585382

Dieses Buch beruht auf den Jean-Nicod-Vorlesungen, die ich im Frühjahr 2006 in Paris gehalten habe. Um den Interessen de

270 35 5MB

German Pages [406] Year 2009

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Die Ursprünge der menschlichen Kommunikation
 9783518585382

Table of contents :
Vorwort und Danksagung 9
1 Konzentration auf die Infrastruktur 12
2 Intentionale Kommunikation bei Primaten 24
2.1 Stimmliche Displays 26
2.2 Gestische Signale 31
2.3 Kommunikation mit Menschen 46
2.4 Intentionalität bei der Kommunikation von Affen. 56
2.5 Schlußfolgerung 66
3 Kooperative Kommunikation beim Menschen 68
3.1 Zeigegesten und Gebärdenspiel. 71
3.2 Das Kooperationsmodell 83
3.3 Kommunikationskonventionen 112
3.4 Schlußfolgerung 119
4 Ontogenetische Ursprünge 121
4.1 Zeigegesten bei Kleinkindern 123
4.2 Quellen der Zeigegesten von Kleinkindern 148
4.3 Frühes Gebärdenspiel 159
4.4 Geteilte Intentionalität und frühe Sprache 168
4.5 Schlußfolgerung 180
5 Phylogenetische Ursprünge 183
5.1 Die Entstehung von Zusammenarbeit 186
5.2 Das Entstehen kooperativer Kommunikation 206
5.3 Die Entstehung konventioneller Kommunikation . 234
5.4 Schlußfolgerung 254
76 Die grammatische Dimension 260
6.1 Die Grammatik des AufForderns 263
6.2 Die Grammatik des Informierens 288
6.3 Die Grammatik des Teilens und der Erzählung . . . 301
6.4 Die Konventionalisierung von Sprachkonstruktionen 3i6
6.5 Schlußfolgerung 336
7 Von AfFengesten zur Sprache des Menschen 339
7.1 Zusammenfassung des Arguments 339
7.2 Hypothesen und Probleme 347
7.3 Sprache als geteilte Intentionalität 362
Literatur 367
Namenregister 390
Sachregister 395

Citation preview

Michael Tomasello Die Ursprünge der menschlichen Kommunikation Aus dem Amerikanischen von Jürgen Schröder

Suhrkamp

Titel der Originalausgabe: Origins of Human Communication. Erstmals veröffentlicht 2008. Die Übersetzung erscheint mit freundlicher Genehmigung von MIT Press, Cambridge (Mass.)/London. © 2008 Massachusetts Institute of Technology

Bibliografische Information der Deutschen Nationalbibliothek. Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Erste Auflage 2009 © der deutschen Ausgabe Suhrkamp Verlag Frankfurt am Main 2009. Alle Rechte vorbehalten, insbesondere das des öffentlichen Vortrags sowie der Übertragung durch Rundfunk und Fernsehen, auch einzelner Teile. Kein Teil des Werkes darf in irgendeiner Form (durch Fotografie, Mikrofilm oder andere Verfahren) ohne schriftliche Genehmigung des Verlages reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden. Druck: Druckhaus Nomos, Sinzheim Printed in Germany ISBN 978-3-518-58538-2

2 3 4 5 6 7 - 15 14 13 12 11 10

Zeig auf ein Stück Papier! - Und nun zeig auf seine Form, - nun auf seine Farbe, nun auf seine Anzahl... - Nun, wie hast du es gemacht? Ludwig Wittgenstein, Philosophische Untersuchungen

Inhalt

Vorwort und Danksagung

9

1 Konzentration auf die Infrastruktur

12

2 Intentionale Kommunikation bei Primaten 2.1 Stimmliche Displays 2.2 Gestische Signale 2.3 Kommunikation mit Menschen 2.4 Intentionalität bei der Kommunikation von Affen. 2.5 Schlußfolgerung

24 26 31 46 56 66

3 Kooperative Kommunikation beim Menschen 3.1 Zeigegesten und Gebärdenspiel. 3.2 Das Kooperationsmodell 3.3 Kommunikationskonventionen 3.4 Schlußfolgerung

68 71 83 112 119

4 Ontogenetische Ursprünge 4.1 Zeigegesten bei Kleinkindern 4.2 Quellen der Zeigegesten von Kleinkindern 4.3 Frühes Gebärdenspiel 4.4 Geteilte Intentionalität und frühe Sprache 4.5 Schlußfolgerung

121 123 148 159 168 180

5 Phylogenetische Ursprünge 183 5.1 Die Entstehung von Zusammenarbeit 186 5.2 Das Entstehen kooperativer Kommunikation 206 5.3 Die Entstehung konventioneller Kommunikation . 234 5.4 Schlußfolgerung 254

7

6 Die grammatische Dimension 6.1 Die Grammatik des AufForderns 6.2 Die Grammatik des Informierens 6.3 Die Grammatik des Teilens und der Erzählung . . . 6.4 Die Konventionalisierung von Sprachkonstruktionen 6.5 Schlußfolgerung

260 263 288 301

7 Von AfFengesten zur Sprache des Menschen 7.1 Zusammenfassung des Arguments 7.2 Hypothesen und Probleme 7.3 Sprache als geteilte Intentionalität

339 339 347 362

Literatur Namenregister Sachregister

367 390 395

8

3i6 336

Vorwort und Danksagung

Dieses Buch beruht auf den Jean-Nicod-Vorlesungen, die ich im Frühjahr 2006 in Paris gehalten habe. Um den Interessen der Wissenschaftler, die am Institut Jean Nicod arbeiten, entgegenzukommen, entschloß ich mich dazu, das Thema »Kommunikation« in den Mittelpunkt zu stellen. Ich habe umfangreiche theoretische und empirische Arbeiten durchgeführt, erstens zur gestischen Kommunikation bei Menschenaffen; zweitens zur gestischen Kommunikation bei Kleinkindern; und drittens zur frühen Sprachentwicklung bei Kindern. Außerdem habe ich ausführlich über allgemeinere kognitive und sozio-kognitive Prozesse geforscht, die an menschlicher Kommunikation und Sprache beteiligt sind: (1) soziale und kulturelle Kognition; (2) soziales und kulturelles Lernen; und (3) Kooperation und geteilte Intentionalität. In diesem Band unternehme ich den Versuch, all diese Dinge in einer zusammenhängenden Darstellung der Evolution und der Entwicklung menschlicher Kommunikation zusammenzuführen. Die leitende Idee, von der dieser Versuch inspiriert ist, besagt, daß es einige recht spezifische Verbindungen geben muß zwischen der grundlegend kooperativen Struktur menschlicher Kommunikation, wie sie ursprünglich von Grice entdeckt wurde, und der besonderen kooperativen Struktur sozialer Interaktion und Kultur im allgemeinen, wie sie für Menschen im Gegensatz zu anderen Primaten kennzeichnend ist. Die Gedanken in diesem Buch stammen hauptsächlich aus der gemeinsamen Forschung und den Diskussionen mit meinen vielen Kollegen in der Abteilung für Vergleichende und Entwicklungspsychologie am Max-Planck-Institut für Evolutionäre Anthropologie. Vieles von dem, was hier vorgestellt wird, hat seinen Ursprung in diesem Forschungszusammen9

hang, und ich wünschte nur, ich könnte mich an all die einzelnen Quellen deutlicher erinnern. Deutlich ist jedoch die große Schuld, in der ich bei verschiedenen Einzelpersonen stehe. An erster Stelle ist hier Malinda Carpenter zu nennen. Malinda und ich haben fast täglich über Themen, die sich mehr oder weniger direkt auf den vorliegenden Band beziehen, gesprochen. Durch diese Diskussionen wurde mein Denken so grundlegend geformt, daß es leider unmöglich ist, spezifische Anerkennung für einzelne Gedanken zu zollen (oder alle diejenigen Punkte anzugeben, in denen Malinda mir nicht zustimmt). Von besonderer Bedeutung waren außerdem die vielen Gespräche, die ich über die Jahre hinweg mit Josep Call über die gestische Kommunikation von Menschenaffen und mit Elena Lieven über den Spracherwerb von Kindern geführt habe. Eine frühere Fassung der in diesem Band enthaltenen Gedanken stellte ich den Mitgliedern unserer Forschungsgruppe zur sozialen Kognition (in den berüchtigten September-Sitzungen) vor. Dabei erhielt ich äußerst nützliche Rückmeldungen von Hannes Rakoczy, Tanya Behne, Henrike Moll, Ulf Liszkowski, Felix Warneken, Emily Wyman, Suse Grassmann, Kristin Liebal, Maria Gräfenhain, Gerlind Hauser und anderen. Darunter war auch der Vorschlag, eine Reihe von Diagrammen wegzulassen, die noch verwegener waren als diejenigen, die nun hier enthalten sind. Die Zuhörer der Jean-Nicod-Vorlesungen selbst machten ebenfalls eine Reihe nützlicher Vorschläge, insbesondere Dan Sperber. Verschiedene Personen haben mehr oder weniger den gesamten Band gelesen und halfen mir dabei, ihn gewaltig zu verbessern: Malinda Carpenter, Elena Lieven, Bill Croft, Adele Goldberg und Gina Conti-Ramsden - zusammen mit einem anonymen Gutachter für MIT-Press. Andere haben ausgewählte Teile gelesen und gaben mir ebenfalls wertvolle Rückmeldungen. Dazu gehören Hannes Rakoczy, Henrike Moll, 10

Joe Henrich, Danielle Matthews, Nausicaa Pouscoulous, Felix Warneken, Colin Bannard, Emily Wyman und Kristin Liebal. Aufgrund der durchdachten Kritik dieser Leser wurde dieser Band empirisch exakter, theoretisch kohärenter und zudem benutzerfreundlicher. Ich danke auch Esteban Rivas für hilfreiche Informationen, die in Tabelle 6.1 eingegangen sind. Schließlich möchte ich wie immer Henriette Zeidler danken, die nicht nur bei verschiedenen Aspekten des Buchs eine Hilfe war, sondern auch die Angelegenheiten in der Abteilung gewohnt souverän und herzlich regelte, während ich zu Hause war und schrieb. Ich danke auch Annett Witzmann für ihre Hilfe bei den Literaturangaben und Tom Stone von MITPress für seine Betreuung des gesamten Veröffentlichungsprozesses.

11

i Konzentration auf die Infrastruktur

Was wir Bedeutung nennen, muß mit der primitiven Gebärdensprache (Zeigesprache) zusammenhängen. Ludwig Wittgenstein, The Big Typescript

Versuchen Sie einmal, irgendeinem Tier im Zoo etwas Einfaches mitzuteilen. Teilen Sie einem Löwen, einem Tiger oder einem Bären mit, seinen Körper »so« zu drehen, indem Sie ihm durch eine Geste Ihrer Hand oder Ihres Körpers zeigen, was er tun soll, und ihm dafür eine köstliche Leckerei anbieten. Oder zeigen Sie einfach auf die Stelle, wo sich das Tier hinstellen soll oder das Futter versteckt ist. Oder informieren Sie es darüber, daß ein furchterregendes Raubtier hinter einem Busch lauert, indem Sie sowohl auf die Stelle zeigen als auch durch Gebärdenspiel die Handlungen des Raubtiers nachahmen. Das Tier wird Sie nicht verstehen. Das liegt nicht daran, daß es nicht interessiert oder motiviert oder auf seine eigene Art intelligent ist, sondern daran, daß Sie Tieren einfach nichts mitteilen können, nicht einmal nonverbal, und auch nicht erwarten können, daß sie das Gesagte verstehen. Menschen finden solche Gesten wie Zeigen und Gebärdenspiel gewiß völlig natürlich und durchsichtig: Schauen Sie einfach, wohin ich zeige, und Sie werden sehen, was ich meine. Tatsächlich verwenden und verstehen sogar Kleinkinder, die noch nicht sprechen können, die Zeigegeste, und in vielen sozialen Situationen, in denen verbale Verständigung unmöglich oder unpraktisch ist - beispielsweise über einen überfüllten Raum hinweg oder in einer lauten Fabrik - , kommunizieren Menschen natürlicherweise durch Zeigegesten und Gebärdenspiel. Touristen schaffen es in vielen Situationen innerhalb fremder Kulturen, in denen niemand ihre konventionelle Sprache teilt, zu überleben und erfolgreich zu 12

interagieren, indem sie sich gerade auf solche von Natur aus bedeutungstragenden Formen gestischer Kommunikation stützen. Meine zentrale Behauptung in diesem Buch ist, daß wir zuerst verstehen müssen, wie Menschen durch den Gebrauch natürlicher Gesten miteinander kommunizieren, bevor wir nachvollziehen können, wie Menschen durch den Gebrauch einer Sprache miteinander kommunizieren und wie diese Fertigkeit im Lauf der Evolution entstanden sein könnte. Meine evolutionäre Hypothese wird nämlich lauten, daß die ersten, nur beim Menschen vorkommenden Formen der Kommunikation im Zeigen und Gebärdenspiel bestanden. Die soziokognitive und sozio-motivationale Infrastruktur, die diese neuen Formen der Kommunikation ermöglichte, wirkte dann als eine Art psychologische Plattform, auf der die verschiedenen Systeme konventioneller sprachlicher Kommunikation (alle 6000 existierenden) aufgebaut werden konnten. Zeigen und Gebärden waren somit die entscheidenden Übergangspunkte in der Evolution menschlicher Kommunikation und beinhalteten schon die meisten der nur beim Menschen vorkommenden Formen sozialer Kognition und Motivation, die für die spätere Schaffung konventioneller Sprachen erforderlich waren. Das Problem ist, daß natürliche Gesten im Vergleich zu konventionellen menschlichen Sprachen (einschließlich konventionalisierter Zeichensprachen) sehr schwache Kommunikationsmittel zu sein scheinen, da sie viel weniger Information »im« Kommunikationssignal selbst enthalten. Betrachten wir das Zeigen, das, wie ich später argumentieren werde, die ursprüngliche Form der nur beim Menschen vorkommenden Kommunikation war. Nehmen wir an, Sie und ich seien auf dem Weg zur Bibliothek, und aus heiterem Himmel zeige ich in die Richtung einiger Fahrräder, die an der Mauer der Bibliothek lehnen. Ihre Reaktion wird sehr wahrscheinlich 13

»Häh?« sein, weil Sie keine Ahnung davon haben, auf welchen Aspekt der Situation ich hinweise oder warum ich das tue, da das Zeigen an sich nichts bedeutet. Aber wenn Sie sich einige Tage zuvor auf besonders üble Weise von Ihrem Freund getrennt haben, und wir beide wissen, daß der andere das weiß, und eines der Fahrräder ihm gehört, wovon wir ebenfalls wissen, daß der andere das weiß, dann könnte genau dieselbe Zeigegeste in genau derselben Situation etwas sehr Komplexes bedeuten wie zum Beispiel »Ihr Exfreund ist schon in der Bibliothek (wir sollten sie deshalb vielleicht meiden)«. Wenn andererseits eines der Fahrräder dasjenige ist, von dem wir beide wissen, daß der andere weiß, daß es Ihnen vor kurzem gestohlen wurde, dann wird genau dieselbe Zeigegeste etwas völlig anderes bedeuten. Oder vielleicht haben wir uns gefragt, ob die Bibliothek zu dieser späten Stunde noch geöffnet ist, und ich weise auf die vielen Fahrräder draußen hin als Zeichen dafür, daß sie geöffnet ist. Man könnte sagen, daß das, was die Bedeutung in diesen verschiedenen Beispielen trägt, der »Kontext« ist, aber das ist nicht sehr hilfreich, da alle physischen Merkmale des unmittelbaren kommunikativen Kontextes in den verschiedenen Szenarien (per Festsetzung) identisch sind. Unterschiedlich waren jeweils und einzig unsere vorgängigen gemeinsamen Erfahrungen, und diese waren nicht der eigentliche Inhalt der Kommunikation, sondern nur ihr Hintergrund. Unsere Frage lautet daher: Wie kann etwas so Einfaches wie ein ausgestreckter Finger auf so komplexe Weise etwas mitteilen - und das bei verschiedenen Gelegenheiten auf so verschiedene Weise? Jede denkbare Antwort auf diese Frage wird sich stark auf kognitive Fertigkeiten beziehen müssen, die manchmal Fertigkeiten des Erfassens geistiger Zustände oder des Erfassens von Intentionen genannt werden. Um eine Zeigegeste zu interpretieren, muß man also feststellen können, welche 14

Absicht der andere mit einer derartigen Lenkung meiner Aufmerksamkeit verfolgt. Um aber diese Feststellung einigermaßen zuverlässig zu treffen, ist im prototypischen Fall eine Art von gemeinsamer Aufmerksamkeit oder geteilter Erfahrung erforderlich (Wittgensteins Lebensformen; Bruners Formate gemeinsamer Aufmerksamkeit; Clarks gemeinsamer begrifflicher Hintergrund).1 Wenn ich beispielsweise einer Ihrer Freunde bin, nicht in derselben Stadt lebe und es unmöglich ist, daß ich mit dem Fahrrad Ihres Exfreundes vertraut bin, dann werden Sie nicht annehmen, daß ich Sie daraufhinweise. Das ist selbst dann so, wenn ich wundersamerweise tatsächlich wissen sollte, daß dies sein Fahrrad ist, Sie aber nicht wissen, daß ich das weiß. Im allgemeinen genügt es für eine reibungslose Kommunikation nicht, daß Sie und ich gesondert und privat wissen, daß dies sein Fahrrad ist (es genügt nicht einmal, daß der andere das weiß). Diese Tatsache muß vielmehr ein wechselseitig zwischen uns geteiltes Wissen sein. Und wenn wir ein geteiltes Wissen darüber besitzen, daß dies sein Fahrrad ist, aber nicht, daß Sie und Ihr Freund sich gerade getrennt haben (selbst wenn jeder von uns das privat weiß), dann werden Sie wahrscheinlich denken, daß ich auf das Fahrrad Ihres Exfreundes hinweise, um zum Betreten der Bibliothek anzuregen, und nicht, um Sie davon abzubringen. Die Fähigkeit, einen gemeinsamen begrifflichen Hintergrund2 zu schaffen - gemeinsame Aufmerksamkeit, geteilte Erfahrung, gemeinsames kulturelles Wissen 1 Wittgenstein 1953/2008, Bruner 1983/1987, Clark 1996. 2 Herbert Clarks Ausdruck »common ground« wird in der sprachpsychologischen Literatur mit »gemeinsames Weltwissen« oder »gemeinsame Welterfahrung« wiedergegeben. Um gegenüber einem Wissen, das verschiedene Individuen unabhängig voneinander erworben haben, und einem Wissen, das sie sich durch gemeinschaftliche Tätigkeiten angeeignet haben, neutral zu bleiben, wurde »common ground« im folgenden mit »gemeinsamer Hintergrund« übersetzt. (A.d.Ü.) 15

ist eine absolut entscheidende Dimension aller menschlichen Kommunikation, einschließlich der sprachlichen mit all ihren (Personalpronomina) er, sie und es. Von einem evolutionären Gesichtspunkt aus gesehen, ist der andere bemerkenswerte Aspekt dieses alltäglichen Beispiels einer menschlichen Zeigegeste seine prosoziale Motivation. Ich informiere Sie über die wahrscheinliche Gegenwart Ihres Exfreunds oder den Standort Ihres gestohlenen Fahrrads einfach deshalb, weil ich glaube, daß Sie diese Dinge wissen möchten. Im Tierreich ist eine derartige nützliche Mitteilung von Information äußerst selten, selbst bei unseren nächsten Verwandten unter den Primaten (in Kapitel 2 werden wir uns mit entsprechenden Beispielen befassen, etwa mit Warnschreien und auf Nahrung hinweisenden Rufen). Wenn beispielsweise ein wimmerndes Schimpansenjunges nach seiner Mutter sucht, haben mit an Sicherheit grenzender Wahrscheinlichkeit alle anderen Schimpansen in der unmittelbaren Umgebung davon Kenntnis. Wenn ein sich in der Nähe befindendes Weibchen nun weiß, wo die Mutter ist, wird sie es dem suchenden Jungen aber nicht sagen, obwohl sie durchaus in der Lage ist, ihren Arm in einer Art von Zeigegeste auszustrecken. Sie wird es dem Kind deshalb nicht sagen, weil es einfach nicht zu ihren Kommunikationsmotiven gehört, andere auf hilfreiche Weise über etwas zu informieren. Menschliche Kommunikationsmotive sind im Gegensatz dazu so grundlegend kooperativ angelegt, daß wir andere nicht nur über bestimmte Dinge auf hilfreiche Weise informieren, sondern wir einen Wunsch anderen einfach zur Kenntnis bringen, in der Erwartung, daß sie von sich aus Hilfe anbieten werden. So kann ich beispielsweise Wasser zum Trinken erbitten, indem ich einfach sage, daß ich es will (und Sie dadurch über meinen Wunsch informiere), wobei ich weiß, daß Ihre Neigung zu helfen (und unser gegenseitiges Wissen darüber) die Handlung des Informierens in den 16

meisten Fällen in eine vollständige Aufforderung verwandelt. Menschliche Kommunikation ist somit ein grundlegend kooperatives Unternehmen, das am natürlichsten und reibungslosesten im Kontext eines wechselseitig vorausgesetzten, gemeinsamen begrifflichen Hintergrunds (1) und wechselseitig vorausgesetzter, kooperativer Kommunikationsmotive (2) funktioniert. Die grundlegend kooperative Eigenart menschlicher Kommunikation ist natürlich die zentrale Einsicht von Grice3 und wird in verschiedenen Graden und auf verschiedene Weise von anderen angenommen, die in dieser Tradition stehen, wie zum Beispiel Clark,4 Sperber und Wilson5 und Levinson.6 Wenn wir jedoch die letzten Ursprünge sowohl phylogenetisch als auch ontogenetisch verstehen wollen, müssen wir uns außerhalb der Kommunikation selbst umsehen und uns die menschliche Kooperation auf allgemeinere Weise anschauen. Es stellt sich heraus, daß die menschliche Kooperation in vielen Hinsichten einzigartig im Tierreich ist, sowohl was ihre Strukturen als auch ihre Motive betrifft. Insbesondere wird die menschliche Kooperation durch etwas strukturiert, das einige zeitgenössische Handlungstheoretiker »geteilte Intentionalität« oder »Wir-Intentionalität« nennen.7 Im allgemeinen ist geteilte Intentionalität für die Beteiligung an spezifisch menschlichen Formen von Zusammenarbeit notwendig, bei denen ein Subjekt im Plural, ein »Wir« auftritt: gemeinsame Ziele, gemeinsame Absichten, wechselseitiges Wissen, geteilte Überzeugungen - und das alles im Kontext diverser Kooperationsmotive. Diese Gemein3 4 5 6 7

Grice i957/i977> 1975/1979Clark 1992,1996. Sperber und Wilson 1986. Levinson 1995, 2006. Searle 1995/1997, Bratman 1992, Gilbert 1989. 17

samkeit ist besonders auffällig bei Interaktionen, die Institutionen betreffen und solche kulturell konstruierten Dinge wie Geld, Ehe und Regierung einschließen, die nur innerhalb einer institutionellen, kollektiv konstituierten Wirklichkeit existieren, an die wir alle glauben und in der wir gemeinsam handeln, so als ob es sie wirklich gäbe. Geteilte Intentionalität gibt es aber auch bei einfacheren und konkreteren Aktivitäten der Zusammenarbeit, etwa wenn wir uns das Ziel setzen, zusammen ein Werkzeug herzustellen oder zusammen spazierenzugehen, oder wenn wir einfach den Anblick eines Berges zusammen bewundern oder gemeinsam eine religiöse Handlung vollziehen. Der Vorschlag lautet also, die menschliche kooperative Kommunikation - gleichgültig, ob dabei »natürliche« Gesten oder »willkürliche« Konventionen benutzt werden - als einen Fall, wenn auch einen besonderen, einer nur beim Menschen vorkommenden Aktivität der Kooperation zu begreifen, die auf geteilter Intentionalität beruht.8 Die Kompetenzen und Motivationen geteilter Intentionalität machen somit das aus, was wir die »kooperative Infrastruktur der menschlichen Kommunikation« nennen können. Wenn menschliche Kommunikation in einer Weise kooperativ strukturiert ist, wie das bei anderen Primaten nicht der Fall ist, stellt sich natürlich die Frage, wie sie entstanden sein könnte. Die Entstehung von Kooperation oder zumindest von Altruismus ist in der modernen Evolutionstheorie jedoch immer ein problematisches Thema. Wenn aber die Infrastruktur menschlicher kooperativer Kommunikation im Grunde dieselbe ist wie die aller anderen kollaborativen Aktivitäten, dann könnte es sein, daß sie sich als Teil einer umfassenderen menschlichen Anpassung in Richtung Kooperation und Kulturleben im allgemeinen entwickelte. Aus Gründen, die wir nicht kennen, hatten an einem bestimmten Punkt der 8 Tomasello, Carpenter, Call, Behne und Moll 2005. 18

menschlichen Entwicklung Individuen, die mit gemeinsamen Absichten, gemeinsamer Aufmerksamkeit und kooperativen Motiven ein gemeinsames Ziel verfolgen konnten, einen Anpassungsvorteil. Kooperative Kommunikation entstand dann als ein Mittel, diese Aktivitäten der Zusammenarbeit effizienter zu koordinieren, indem eine gemeinsame psychologische Infrastruktur geteilter Intentionalität zunächst vererbt und dann durch die Kommunikation weiter ausgebaut wurde. All das nahm mit ziemlicher Sicherheit seinen Anfang mit wechselseitigen Aktivitäten, bei denen ein Individuum, das seinem Partner half, zugleich sich selbst half. Dann fand jedoch eine Verallgemeinerung auf altruistischere Situationen statt, in denen Individuen einfach andere informierten oder mit ihnen zwanglos Dinge teilten, und zwar möglicherweise, um Reziprozität zu pflegen und zu demonstrieren, daß sie kooperativ sind. Erst später begannen die Menschen außerhalb kooperativer Kontexte auf diese neue kooperative Weise zu übergeordneten, nichtkooperativen Zwecken zu kommunizieren - bis sie sogar in der Lage waren, andere durch Lügen zu täuschen. Die anfänglichen Schritte in diesem Prozeß vollzogen sich höchstwahrscheinlich im Modus der Geste. Das wird besonders deutlich, wenn wir die stimmliche und gestische Kommunikation unserer nächsten Verwandten unter den Primaten, den Menschenaffen, vergleichen. Die Vokalisierungen der Menschenaffen sind beinahe vollständig genetisch festgelegt, eng mit spezifischen Emotionen verknüpft und werden wahllos an alle in der unmittelbaren Umgebung gerichtet. Dagegen sind viele Gesten der Menschenaffen erlernt und werden in verschiedenen sozialen Situationen ganz flexibel zu verschiedenen sozialen Zwecken eingesetzt, wobei neue Gesten manchmal gelernt werden, um mit Menschen zu interagieren. Außerdem richten Menschenaffen diese Gesten an bestimmte Individuen und berücksichtigen dabei deren gegen19

wärtigen Aufmerksamkeitszustand. Lernen, Flexibilität und die Aufmerksamkeit für das Gegenüber sind offensichtlich grundlegende Merkmale der menschlichen Kommunikation. Bevor diese Merkmale existierten, konnten sich die Dinge nicht in die menschliche Richtung entwickeln. Wie viele Vertreter einer Theorie des gestischen Ursprungs zuvor bemerkt haben, ist es ebenfalls von Bedeutung, daß die menschliche Verwendung von Zeigegesten und Gebärdenspiel - als Nachfolger der Affengesten, sobald ein Zustand der Kooperation erreicht wurde - auf eine Weise »natürlich« ist, wie es arbiträre sprachliche Konventionen nicht sind. Insbesondere beruht das Zeigen auf der natürlichen Neigung von Menschen, der Blickrichtung von anderen zu externen Objekten zu folgen, und das Gebärdenspiel beruht auf der natürlichen Neigung, die Handlungen anderer als absichtlich zu interpretieren. Diese Natürlichkeit macht diese Gesten zu guten Kandidaten für einen Zwischenschritt in der Entwicklung der Kommunikation von Menschenaffen zu willkürlichen sprachlichen Konventionen. Wie steht es nun mit der Sprache? Die vorliegende Hypothese macht geltend, daß willkürliche sprachliche Konventionen evolutionär nur innerhalb des Zusammenhangs von kollaborativen Aktivitäten, in denen die Teilnehmer Absichten und Aufmerksamkeit teilen und die durch natürliche Formen gestischer Kommunikation koordiniert werden, in Erscheinung treten konnten. Konventionelle Sprachen (die zuerst Zeichensprachen und dann stimmliche Sprachen waren) entstanden also auf dem Rücken dieser bereits verstandenen Gesten und ersetzten die Natürlichkeit des Zeigens und Gebärdenspiels durch eine gemeinsame Geschichte des sozialen Lernens (von der alle wechselseitig wissen, daß sie gemeinsam ist). Dieser Prozeß wurde natürlich durch die einzigartigen Fertigkeiten der Menschen zum kulturellen Lernen und zur Imitation ermöglicht, wodurch sie in die Lage versetzt 20

werden, von anderen und deren intentionalen Zuständen auf einzigartig leistungsfähige Weisen zu lernen.9 Im Rahmen derselben evolutionären Entwicklung begannen Menschen, verschiedene grammatikalische Konventionen zu schaffen und kulturell weiterzugeben, die in komplexe sprachliche Konstruktionen gegliedert wurden, welche komplexe Typen von Botschaften zum Gebrauch in wiederkehrenden Kommunikationssituationen festschrieben. Wir benötigen also grundlegende evolutionäre Prozesse, die auf unterschiedliche Weisen operieren, um den Ursprung der zugrundeliegenden psychologischen Infrastruktur menschlicher kooperativer Kommunikation zu erklären. Um die Ursprünge der 6000 verschiedenen konventionellen menschlichen Sprachen zu erklären, brauchen wir zusätzlich noch kulturgeschichtliche Prozesse, durch die besondere sprachliche Formen in einzelnen Sprachgemeinschaften konventionalisiert werden. Abfolgen dieser Formen werden dann in grammatikalische Konstruktionen aufgenommen, und alle diese Konventionen und Konstruktionen werden schließlich durch kulturelles Lernen an neue Generationen weitergegeben. So können wir hier besonders deutlich die anhaltende Dialektik zwischen evolutionären und kulturgeschichtlichen Prozessen beobachten, die zuerst von Vygotskij10 und in einem moderneren evolutionären Rahmen von Richerson und Boyd11 beschrieben wurde - und von der ich selbst eine Zeit lang besessen war.12 Diese Perspektive auf die menschliche Kommunikation und Sprache stellt somit im Grunde den Vorschlag Chomskys vom Kopf auf die Füße, da die grundlegendsten Aspekte menschlicher Kommunikation als biolo9 Tomasello 1999/2002. 10 Vygotskij 1978/1992. 1 1 Richerson und Boyd 2005. 12 Tomasello, Kruger und Ratner 1993, Tomasello 2002, Tomasello et al. 2005. 21

gische Anpassungen zur Kooperation und sozialen Interaktion im allgemeinen aufgefaßt werden, während die im engeren Sinne sprachlichen Dimensionen der Sprache, einschließlich der grammatikalischen, kulturell konstruiert und von einzelnen Sprachgemeinschaften weitergegeben werden. Der Weg zur modernen menschlichen Kommunikation war insgesamt betrachtet höchstwahrscheinlich ein sehr langer, ziemlich weitschweifiger und von vielen Wendungen durchsetzter. Um eine theoretische Darstellung zu bieten, die hauptsächlich auf empirischen Daten beruht, müssen wir daher viele verschiedene Aspekte des Lebens von Menschenaffen und Menschen betrachten - was diese Darstellung ebenfalls lang und weitschweifig ausfallen läßt. Aber trotz der vielen Verwicklungen, denen wir unterwegs begegnen, ist unser endgültiger Bestimmungsort eindeutig und läßt sich leicht angeben: die Identifikation der für die Spezies einzigartigen Merkmale menschlicher Kommunikation und ihre ontogenetischen und phylogenetischen Wurzeln. Im Hinblick auf dieses Ziel werde ich im folgenden drei spezifische Hypothesen bewerten: 1. Die menschliche kooperative Kommunikation trat in der Evolution zuerst (und tritt in der Ontogenese zuerst) in der Form natürlicher, spontaner Gesten des Zeigens und des Gebärdenspiels auf. 2. Die menschliche kooperative Kommunikation beruht wesentlich auf einer psychologischen Infrastruktur geteilter Intentionalität, die im Laufe der Evolution zur Unterstützung von Aktivitäten der Zusammenarbeit entstand und deren wichtigste Komponenten die folgenden sind: (a) sozio-kognitive Fertigkeiten zur gemeinschaftlichen Erzeugung gemeinsamer Absichten und gemeinsamer Aufmerksamkeit (und anderer Formen eines gemeinsamen begrifflichen Hintergrunds), und (b) prosoziale Motive (und sogar Normen) des Helfens und Teilens mit anderen. 22

3. Konventionelle Kommunikation, wie sie in menschlichen Sprachen verkörpert ist, wird nur möglich, wenn die an ihr Beteiligten schon über folgendes verfugen: (a) natürliche Gesten und ihre Infrastruktur geteilter Intentionalität sowie (b) Fertigkeiten des kulturellen Lernens und der Nachahmung, um gemeinsam verstandene kommunikative Konventionen und Konstruktionen zu schaffen und weitergeben zu können.

23

2 Intentionale Kommunikation bei Primaten

Denn welche Logik für ein primitives Verständigungsmittel genügt, deren brauchen wir uns auch nicht zu schämen. Die Sprache ist nicht aus einem Räsonnement hervorgegangen. Ludwig Wittgenstein, Über Gewißheit

Die menschliche Art des Kommunizierens - aufgrund kooperativer Motive andere über bestimmte Dinge absichtlich zu informieren - ist für uns so natürlich, daß wir uns kaum eine andere vorstellen können. In der biologischen Welt muß Kommunikation jedoch weder absichtlich noch kooperativ sein. Für Biologen fallen unter Kommunikation alle möglichen Merkmale des Körpers und des Verhaltens, die das Verhalten anderer beeinflussen - von charakteristischen Färbungen bis zum Dominanzgebaren -, unabhängig davon, ob der Signalgebende absichtliche Kontrolle über das Signal hat (oder überhaupt weiß, daß es andere beeinflußt). Für Biologen spielen die unmittelbaren Motive des Kommunizierenden, gleichgültig, ob es sich um kooperative oder andere handelt, einfach keine Rolle.1 Von einem psychologischen Standpunkt aus spielen sie dagegen sehr wohl eine Rolle. Zu Beginn müssen wir daher zwischen dem, was wir »Kommunikationsdisplays« und »Kommunikationssignale« nennen können, unterscheiden. Kommunikationsdisplays sind prototypische körperliche Merkmale, die das Verhalten anderer in bestimmter Weise beeinflussen, wie beispielsweise lange Hörner, die Mitbewerber abschrecken, oder helle Farben, die Geschlechtspartner anziehen. In funktionaler Hinsicht können wir auch Reflexe, i Dawkins und Krebs 1978, Maynard-Smith und Harper 2003. 24

die stereotyp von bestimmten Reizen ausgelöst werden, oder emotionale Zustände, über die das Individuum keine willentliche Kontrolle hat, zu den Displays rechnen. Solche starren körperlichen und verhaltensbezogenen Displays, die durch evolutionäre Prozesse entstanden sind und von diesen gesteuert werden, sind für die große Mehrheit der Kommunikation in der biologischen Welt typisch. In scharfem Kontrast dazu stehen Kommunikationssignale, die von einzelnen Organismen flexibel und strategisch für bestimmte soziale Ziele ausgewählt, hervorgebracht und auf verschiedene Weise an bestimmte Umstände angepaßt werden. Diese Signale sind intentional in dem Sinne, daß das Individuum ihren Gebrauch flexibel im Hinblick auf das Ziel, andere zu beeinflussen, steuert. Intentionale Signale sind in der biologischen Welt äußerst selten und beschränken sich wahrscheinlich auf Primaten oder gar nur auf Menschenaffen. Aus dieser Perspektive spielt der Kommunizierende die Schlüsselrolle. Die Adressaten der Signale sind einfach nur Individuen, die damit beschäftigt sind, die Situation einzuschätzen, und herauszufinden versuchen, was sie tun sollen. Sie suchen nach relevanten Informationen aus allen möglichen Quellen, weshalb das Kommunikationsdisplay eines anderen Individuums lediglich eine weitere Informationsquelle ist, gleichgültig, ob der »Kommunizierende« überhaupt von dessen Existenz weiß (er mag beispielsweise nicht einmal wissen, daß er einen roten Schwanz besitzt). Erst wenn hingegen die Kommunizierenden versuchen, das Verhalten oder die psychologischen Zustände der Empfänger absichtlich zu beeinflussen, beginnt Kommunikation aus psychologischer Perspektive. Wenn es solche Intentionalität gibt und die Adressaten bzw. Empfänger sie außerdem zumindest bis zu einem gewissen Grad erkennen, dann können wir den gesamten Prozeß als intentionale Kommunikation bezeichnen. Um als kooperative Kommunikation zu gelten, muß es unter 25

anderem das unmittelbare Ziel des Kommunizierenden sein, dem Empfänger irgendwie zu helfen oder etwas mit ihm zu teilen - obwohl es natürlich, evolutionär betrachtet, auch für den Kommunizierenden einen Nutzen geben muß, seine Hilfe anzubieten. Wenn wir diese grundlegende psychologische Perspektive auf die Kommunikation zum Ausgangspunkt nehmen, dann beginnt der beste Weg, die evolutionären Wurzeln menschlicher kooperativer Kommunikation freizulegen, natürlich bei der Beobachtung nichtmenschlicher Primaten, und zwar insbesondere (so werde ich zumindest argumentieren) ihrer gestischen, im Unterschied zu ihrer stimmlichen, Kommunikation. 2.1 Stimmliche Displays Wenn eine grüne Meerkatze einen »Schlangenwarnruf« hört, weiß sie, daß eine Schlange in der Nähe ist; hört sie einen »Adleralarmruf«, weiß sie, daß ein Adler in der Nähe ist. Als Adressaten von Kommunikation extrahieren Grüne Meerkatzen also Informationen aus Warnrufen, die sich auf ganz bestimmte Dinge beziehen. Das wurde wiederholt durch Playback-Studien demonstriert, in denen der Ruf über einen Lautsprecher gespielt wird, wenn kein Raubtier in der Nähe ist. Die Signalempfänger zeigen dann immer noch das entsprechende raubtierspezifische Vermeidungsverhalten.2 Beeindruckenderweise können die Angehörigen einer Reihe von Affenarten sogar während der Ontogenese lernen, Alarmrufe anderer Arten zu verarbeiten, einschließlich derjenigen bestimmter Vögel, um Information über Raubtiere in ihrer Nähe zu gewinnen.3 Obwohl Menschenaffen keine 2 Cheney und Seyfarth 19908/1994. 3 Zuberbühler 2000. 26

Rufe hervorbringen, die einen spezifischen Bezug haben (sie produzieren lediglich leicht variierte Rufe angesichts unterschiedlicher Mengen oder Qualitäten von Futter4), extrahieren sie ebenfalls Informationen aus stimmlichen Rufen und können sogar während der Ontogenese lernen, auf neue Rufe zu reagieren.5 In völligem Gegensatz zu diesem Bild flexiblen Erfassens der Rufe anderer Arten ist bei Affen und Menschenaffen das Hervorbringen ihrer eigenen stimmlichen Rufe überhaupt nichts Erlerntes, und die Tiere haben sehr wenig willentliche Kontrolle darüber. Es folgen einige wichtige Tatsachen:6 - Innerhalb jeder Art von Affen oder Menschenaffen haben alle Individuen dasselbe grundlegende Repertoire von Rufen, wobei es im wesentlichen keine individuellen Unterschiede in diesem Repertoire gibt; - Affen, die in sozialer Isolation aufgezogen wurden, und Affen, die zusätzlich von Angehörigen einer anderen Affenart (mit ganz anderen Rufen) gehegt wurden, bringen immer noch ihre eigenen, grundsätzlich artspezifischen Vokalisierungen hervor (und nicht die der anderen Art); - die Verbindung zwischen einem Ruf und seiner auslösenden Emotion oder Situation ist in den meisten Fällen streng festgelegt; nichtmenschliche Primaten vokalisieren nicht auf flexible Weise, indem sie sich an die Kommunikationssituation anpassen; und - Versuche von Menschen, Affen und Menschenaffen neue Vokalisierungen zu lehren, schlagen immer fehl; und Versuche, sie zu lehren, ihre eigenen Vokalisierungen auf Befehl hervorzubringen, sind entweder erfolglos oder es be4 Hauser und Wrangham 1987, Crockford und Boesch 2003. 5 Seyfarth und Cheney 2003. 6 Siehe die Übersicht bei Tomasello und Zuberbühler 2002. 27

darf Tausender von Testversuchen, um nur ein spärliches Ergebnis zu erzielen. Die einzige Dimension von Flexibilität, die systematisch dokumentiert wurde, besteht darin, daß Individuen zwar keine bestimmten Rufe hervorbringen, wenn sie alleine oder keine Familienmitglieder bei ihnen sind, dies aber in Anwesenheit anderer oder von Familienmitgliedern tun können. Da andere Tierarten ihre Rufe in diesen Situationen jedoch ebenfalls unterlassen (einschließlich Präriehunden und Haushühnern7), ist es leicht vorstellbar, daß dies Teil der genetisch festgelegten Anpassung ist. Der Grund für diesen Mangel an Flexibilität der stimmlichen Produktion liegt in der sehr engen Kopplung der Vokalisierungen nichtmenschlicher Primaten an Emotionen. Goodall schreibt: Die Produktion eines Lautes bei Abwesenheit des geeigneten emotionalen Zustands scheint für einen Schimpansen eine nahezu unmögliche Aufgabe zu sein.8

Aus evolutionärer Sicht ist das deshalb so, weil stimmliche Rufe oft mit besonders dringlichen Funktionen, wie zum Beispiel der Flucht vor Raubtieren, dem Überleben bei Kämpfen, dem Aufrechterhalten des Kontakts zur Gruppe usw., verbunden sind. In solchen Fällen muß dringend gehandelt werden, und es gibt wenig Zeit für sorgfältiges Überlegen. Ein bestimmter Ruf wurde stets evolutionär selektiert, weil er dem Rufer einen bestimmten Nutzen bringt. In neueren Analysen wurde daher betont, daß Grüne Meerkatzen direkt von ihren Rufen profitieren, weil beispielsweise das Raubtier von dem schrillen Geräusch unmittelbar abgeschreckt wird oder weil 7 Siehe Owings und Morton 1998. 8 Goodall 1986, S. 125. 28

der Ruf dem Raubtier signalisiert, daß es entdeckt wurde.9 Die anderen Meerkatzen informieren sich selbst durch Lauschen, sind aber nicht Adressaten des Rufers. Bezeichnenderweise geben Makaken-Muttertiere keinen Alarmruf von sich, wenn sie in experimentellen Studien ein »Raubtier« sehen, das sich ihrem Nachwuchs nähert, solange sie nicht selbst in Gefahr sind.10 Dieses Muster vonflexiblemVerstehen, aber völlig unflexibler Produktion bei den Vokalisierungen von Primaten fassen Seyfarth und Cheney zusammen: Lauschende Tiere erwerben Information von Signalgebern, die ihrerseits jedoch nicht beabsichtigen, diese Information zur Verfügung zu stellen.11

Ein weiteres wichtiges Merkmal der Vokalisierungen von Primaten, das sich einfach aus der Physik des akustischen Kanals ergibt, ist, daß sie unterschiedslos an alles und jeden ausgesendet werden, das sich in der Nähe befindet. In hochemotionalen, evolutionär dringlichen Situationen ist das ein offensichtlicher Vorteil. Psychologisch bedeutet es jedoch, daß der Rufer den Empfängern keinerlei Aufmerksamkeit schenken muß und er in der Tat stimmliche Rufe auch nicht leicht an ausgewählte Individuen unter Ausschluß von anderen richten kann. Belege hierfür gehen aus der Tatsache hervor, daß Grüne Meerkatzen ihre Alarmrufe selbst dann noch ausstoßen, wenn sich alle Individuen der Gruppe schon in einer sicheren Position befinden und auf das Raubtier schauen.12 Außerdem geben Schimpansen sogenannte »pant-hoots« von sich, wenn sie große Mengen von Futter finden, und zwar auch dann, 9 Owren und Rendell 2001, siehe auch Bergstrom und Lachman 2001. 10 Cheney und Seyfarth 1990b. 1 1 Seyfarth und Cheney 2003. 12 Cheney und Seyfarth 1990a, siehe auch Gouzoules, Gouzoules und Ashley 1995. 29

wenn die ganze Gruppe schon da ist und bereits mit der Nahrungsaufnahme angefangen hat.13 Im großen und ganzen scheinen Vokalisierungen von Primaten hauptsächlich ein individualistischer Ausdruck von Emotionen zu sein, und keine Handlungen, die an Empfänger gerichtet sind. Zuberbühler meint hierzu: Nichtmenschliche Primaten vokalisieren als Reaktion auf wichtige Ereignisse, gleichgültig wie potentielle Empfanger die Situation auffassen mögen.14

Angesichts all dieser Tatsachen haben einige Theoretiker15 argumentiert, daß die stimmliche Kommunikation von Primaten hauptsächlich wegen der Fertigkeiten des Verstehens von Stimmsignalen ein wichtiger Schritt auf dem Weg zur menschlichen Sprache war. Das Problem ist, daß solche Fertigkeiten des »Verstehens« keine exklusiven Spezialisierungen mit Blick auf Kommunikation sind, sondern lediglich allgemeine Fertigkeiten, Dinge kognitiv zu bewerten. Wenn also ein Affe lernt, daß ein bestimmter Alarmruf einer bestimmten Vogelart oder auch der eigenen Art die Gegenwart eines Leoparden anzeigt, ist unklar, ob wir das als das Verstehen einer kommunikativen Handlung interpretieren sollten. Affen haben einfach gelernt, daß eine Sache eine andere anzeigt oder sie gar verursacht, und zwar auf dieselbe grundsätzliche Weise, wie es bei vielen anderen Erscheinungen ihres täglichen Lebens auch der Fall ist. Wenn wir nach evolutionären Stufen auf dem Weg zu den kommunikativen Aktivitäten des Menschen suchen, müssen wir daher untersuchen, wie die Produktion kommunikativer Signale funktioniert, da diese 13 Clark und Wrangham 1994, siehe aber auch Mitani und Nishida 1993.

14 Zuberbühler 2005, S. 126. 15 Zum Beispiel Seyfarth und Cheney 2003. 30

spezifisch kommunikativ sind. Vom Standpunkt der Produktion aus gesehen, scheinen stimmliche Displays von Säugetieren im allgemeinen, Primaten eingeschlossen, mit ihrer genetisch festgelegten und sehr unflexiblen Struktur sehr weit von der Kommunikation menschlichen Stils entfernt zu sein.

2.2 Gestische Signale Nichtmenschliche Primaten kommunizieren auch regelmäßig durch Gesten miteinander, wobei mit »Geste« ein kommunikatives Verhalten (und nicht ein körperliches Merkmal) im visuellen Kanal gemeint ist; meistens (oder überwiegend) sind das Körperhaltungen, Gesichtsausdrücke und Handbewegungen. Obwohl viele dieser Gesten genetisch festgelegt und so unflexibel wie die Vokalisierungen von Primaten sind - und deshalb Displays genannt werden sollten - , wird ein wichtiger Teil davon individuell gelernt und flexibel gebraucht, besonders bei den Menschenaffen, weshalb sie durchaus intentionale Signale genannt werden können. Diese intentionalen gestischen Signale betreffen oft soziale Aktivitäten wie Spielen, Stillen, Betteln und Fellpflege, die emotional weniger aufgeladen und evolutionär weniger dringlich sind. Der bei weitem größte Teil der Forschung zu gestischer Kommunikation bei Primaten wurde an Menschenaffen durchgeführt. Die Belege dafür, daß ein bedeutender Teil der Gesten von Menschenaffen individuell gelernte, absichtlich und flexibel hervorgebrachte Kommunikationssignale sind, sehen folgendermaßen aus:16

16 Siehe Tomasello et. al. 1985, 1989, 1994, 1997, Call und Tomasello 2007. 31

- Es gibt viele und sehr große individuelle Unterschiede im Gestenrepertoire verschiedener Individuen derselben Art und sogar innerhalb derselben Gruppe, einschließlich einiger idiosynkratischer Gesten, die von einzelnen Individuen hervorgebracht werden; - Individuen verwenden dieselbe Geste regelmäßig zu verschiedenen Zwecken der Kommunikation, und sie verwenden verschiedene Gesten für denselben Kommunikationszweck; - Individuen produzieren eine Geste typischerweise nur dann, wenn der Empfänger entsprechend aufmerksam ist, sie beobachten hinterher oft die Reaktion des Empfängers und warten auf eine Antwort; - Individuen verwenden manchmal Abfolgen oder Kombinationen mehrerer Gesten, wenn der andere nicht angemessen reagiert; und - Individuen mit ausgeprägtem Kontakt zu Menschen erfinden oder lernen ganz leicht verschiedene Arten neuer Gesten. Obwohl also die stimmliche Kommunikation von Primaten mit der sprachlichen Kommunikation des Menschen den stimmlich-auditiven Kanal teilt, ist es die gestische Kommunikation von Menschenaffen, die mit der sprachlichen Kommunikation des Menschen grundlegende funktionale Aspekte gemein hat, nämlich den absichtlichen und flexiblen Gebrauch gelernter Kommunikationssignale.

2.2.1 Zwei Typen von Gesten Mit Blick auf ihre kommunikative Funktion gibt es zwei Grundtypen der Gesten von Menschenaffen: Intentionsbewegungen und Aufmerksamkeitsfänger. Nichtgelernte Displays 32

von Intentionsbewegungen sind im Tierreich allgegenwärtig und wurden erstmals von Darwin informell erwähnt,17 um dann von Tinbergen in seinen klassischen Untersuchungen von Seemöwen benannt und systematisch beschrieben zu werden.18 Intentionsbewegungen liegen vor, wenn ein Individuum nur den ersten Schritt einer normalen Verhaltenssequenz vollzieht, häufig in abgekürzter Form, und dieser erste Schritt schon ausreicht, um eine Reaktion bei einem Empfänger auszulösen (das heißt dieselbe Reaktion, die normalerweise auf die gesamte Verhaltenssequenz erfolgen würde). Um jemanden in die Flucht zu schlagen, reicht es zum Beispiel schon aus, wenn Wölfe knurren und ihre Zähne blekken, also ein ritualisiertes Verhalten zeigen, das eigentlich nur der Vorbereitung des tatsächlichen Zubeißens dient. Manche Vögel vollziehen verschiedene Paarungsvorbereitungen, die ihre bevorstehenden sexuellen Annäherungsversuche signalisieren. Im Normalfall sind solche Displays phylogenetisch »ritualisiert«; so haben Wölfe, die sich auffällig zum Beißen anschicken, indem sie ihre Zähne blecken und knurren, einen Anpassungsvorteil, ebenso wie Wölfe, die auf dieses Vorbereitungsverhalten mit Rückzug reagieren, bevor der wirkliche Biß erfolgt. Über evolutionäre Zeitspannen hinweg ergibt sich daraus die genetische Fixierung der Displays von Intentionsbewegungen, die unter spezifischen emotionalen und/oder sozialen Umständen stets gleich vollzogen werden. Wir sind hier jedoch an Intentionsbewegungss/grca/en interessiert, die ontogenetisch ritualisiert (gelernt) wurden und deshalb mit größerer Flexibilität eingesetzt werden. Ontogenetisch ritualisierte Intentionsbewegungsgesten bei Schimpansen - diejenige Art von Menschenaffen, die am intensivsten untersucht wurde - sind etwa das Armheben, um 17 Darwin 1872/1910. 18 Tinbergen 1951/1979. 33

mit dem Spielen anzufangen, und das Berühren des Rückens (der Mutter durch die Jungtiere) als Aufforderung, getragen zu werden (siehe die Liste von Beispielen in Tabelle 2.1). Wie Intentionsbewegungsdisplays sind diese Intentionsbewegungssignale im Grunde Abkürzungen vollwertiger sozialer Handlungen, und sie sind fast immer dyadisch in dem Sinne, daß der Kommunizierende versucht, das Verhalten des Empfängers in der Interaktion direkt zu beeinflussen (und nicht über etwas Drittes zu kommunizieren). Bei den gelernten Intentionsbewegungsgesten scheint der Lernprozeß in etwa folgendermaßen abzulaufen (illustriert am Armheben): 1. Am Anfang nähert sich ein Jungtier einem anderen, um sich mit diesem im Spiel zu raufen, hebt seinen Arm zur Vorbereitung des spielerischen Zuschlagens, schlägt dann wirklich zu, springt auf und beginnt zu spielen; 2. durch mehrfache Wiederholung lernt der Empfänger, diese Abfolge nur aufgrund des anfänglichen Armhebens zu antizipieren, und beginnt zu spielen, nachdem er den Anfangsschritt wahrgenommen hat; und 3. lernt der Kommunizierende schließlich, diese Antizipation vorwegzunehmen. Er hebt dann seinen Arm, beobachtet den Empfänger und wartet auf dessen Reaktion, indem er erwartet, daß dieses Armheben das Spiel einleitet.

34

Tabelle 2.1 Einige absichtliche gestische Signale, die von Schimpansen bei ihren spontanen sozialen Interaktionen in sozialen Gruppen verwendet werden (K=Kommunizierender; E=Empfanger).19 Gestische Handlung

Ziel/Funktion

Armheben

K hebt den Arm gegenüber E und beginnt zu schlagen.

Mit einem Spiel beginnen

Berühren des Rückens

K berührt leicht den Rücken von E und beginnt, auf ihn zu klettern.

Aufforderung zum Tragen

Betteln mit der Hand

K plaziert die Hand unter den Mund von E und fängt an, sich Futter zu nehmen

Bitte um Futter

Ruckartige Bewegung des Kopfes

K »schaukelt und windet sich« in vorgebeugter Stellung gegenüber E und beginnt zu spielen.

Mit einem Spiel beginnen

Armauflegen

K nähert sich E, legt seinen Arm auf Es Rücken und beginnt zu

Einleitung von gemeinsamem Gehen

K schlägt auf den Boden (oder auf einen Gegenstand) und blickt E an.

häufig: Spielen

Intentionsbewegungen

Aufmerksamkeitsfänger Auf-den-BodenSchlagen

19 Siehe Call und Tomasello 2007. 35

Gestische Handlung

Ziel/Funktion

Anstupsen

K stupst einen Körperteil von E.

Verschieden

Etwas werfen

K wirft etwas nach E.

häufig: Spielen

Klatschen mit der Hand

K schlägt sich bei der Annäherung an E auf das eigene Handgelenk oder die Hand.

häufig: Spielen

Rücken anbieten

K bringt beharrlich seinen Rücken vor Es Gesicht

Meistens: Körperpflege

Wir haben nun eine ontogenetisch ritualisierte Geste, das Armheben, die der Kommunizierende absichtlich produziert- planvoll und unter Beobachtung der Reaktion des Empfängers (so daß etwas anderes versucht wird, wenn die erwünschte Reaktion sich nicht einstellt) - , um ein Spiel einzuleiten. Die Geste des Berührens des Rückens wird auf ähnliche Weise gelernt, wenn das Jungtier anfänglich nach dem Rücken der Mutter greift und ihn physisch nach unten zieht, um auf ihn zu klettern. Nachfolgend reagiert die Mutter bereits bei der ersten Berührung antizipierend und senkt ihren Rücken, wenn bloß dieser erste Teil des gesamten Ablaufs erfolgt. Das Jungtier lernt seinerseits, diese Reaktion vorwegzunehmen, und gelangt so dazu, die Geste absichtlich einzusetzen, indem es den Rücken der Mutter leicht berührt und darauf wartet, daß sie ihn, wie erwartet, als Reaktion darauf absenkt. Die wichtigste konkurrierende Erklärung dafür, wie Menschenaffen Intentionsbewegungsgesten erwerben, verweist auf Imitation. Es gibt jedoch bei Lichte betrachtet keine Belege dafür, aber viele dagegen. Zu den Belegen, die dafür sprechen, daß Schimpansen und andere Menschenaffen ihre flexibelsten Intentionsbewegungsgesten hauptsächlich durch 36

ontogenetische Ritualisierung lernen, und nicht durch Imitation, gehören zumindest die folgenden:20 - Wenn zwei verschiedene, in menschlicher Obhut lebende Gruppen miteinander verglichen werden, gibt es keine systematischen Unterschiede zwischen den Gruppen, aber viele individuelle Unterschiede innerhalb beider Gruppen; - Individuen in natürlichen sozialen Gruppen erwerben Gesten, zu deren Beobachtung sie gleichwohl wenig oder gar keine Gelegenheit hatten (z. B. Gesten des Stillens von Kleinkindern), und es gibt einige idiosynkratische Gesten, die nur von einzelnen Individuen verwendet werden (und für die es natürlich kein anderes Vorbild gab); - in menschlicher Obhut lebende Jungtiere, die mit Gleichaltrigen aufgezogen wurden und keine Gesten von Erwachsenen beobachten konnten, erwerben viele derselben Gesten wie Jungtiere in freilebenden Gruppen, weil sie an vielen derselben Aktivitäten teilnehmen (Spiel, Stillen usw.), in deren Rahmen diese Gesten ritualisiert werden; - In einer Studie von Tomasello und anderen21 wurde ein Individuum aus einer in menschlicher Obhut lebenden Gruppe herausgenommen. Es wurde dann darauf trainiert, eine neue Geste gegen eine Belohnung zu verwenden, und danach wieder in die Gruppe zurückgebracht. Keines der anderen Individuen lernte die neue Geste (die Studie wurde zweimal mit verschiedenen Personen, die die Gesten vorführten, und mit verschiedenen Gesten durchgeführt). Intentionsbewegungen werden also erzeugt, wenn zwei miteinander interagierende Individuen das jeweilige Verhalten 20 Siehe Tomasello et al. 1994, Call und Tomasello 2007. 21 Tomasello et al. 1997. 37

des anderen antizipieren und es auf diese Weise über mehrere Wiederholungen derselben Interaktion dyadisch formen. Das bedeutet insbesondere, daß die »Bedeutung« oder die kommunikative Signifikanz der Intentionsbewegungen diesen insofern innewohnt, als sie ein Teil einer schon vorhandenen, sinnvollen sozialen Interaktion sind - jener, die gerade überhaupt erst wechselseitig antizipiert wird. Daher müssen die Individuen nicht durch Nachahmung oder auf andere Weise lernen, das Signal mit seiner »Bedeutung« zu verbinden - die »Bedeutung« ist schon in die Gesten eingebaut. Aufgrund der Funktionsweise der Ritualisierung sind diese Gesten außerdem nur »einseitig« (und nicht wechselseitig) gerichtete Kommunikationsmittel in dem Sinne, daß der Kommunizierende und der Empfänger sie jeweils bezogen auf ihre eigene Rolle lernen, ohne die Rolle des anderen zu kennen (der Kommunizierende würde also die Geste nicht als »dieselbe« wie seine eigene erkennen, wenn ein anderer sie ihm gegenüber verwendete). Schließlich haben manche Forscher behauptet, daß einige Intentionsbewegungen sogar ikonisch funktionieren, zum Beispiel wenn ein Gorilla seine Arme in einem sexuellen Zusammenhang oder beim Spiel in eine bestimmte Richtung bewegt und ein Empfänger darauf reagiert, indem er sich in diese Richtung bewegt.22 Höchstwahrscheinlich sind das aber gewöhnliche ritualisierte Verhaltensweisen, die auf Menschen deshalb ikonisch wirken, weil sie von Versuchen herrühren, den Körper des anderen tatsächlich in die gewünschte Richtung zu lenken; für die Affen selbst funktionieren sie nicht ikonisch. Die andere Art von Affengesten sind Aufmerksamkeitsfänger, und diese Art von Gesten ist mit großer Sicherheit im Tierreich nichtweitverbreitet. Möglicherweise sind sie auf Primaten oder gar nur auf Menschenaffen beschränkt. Aufmerk22 Tanner und Byrne 1996. 38

samkeitsfänger umfassen Gesten wie Auf-den-Boden-schlageny Anstupsen und etwas werfen und dienen dazu, die Aufmerksamkeit des Empfängers auf den schlagenden, anstupsenden oder werfenden Kommunizierenden zu ziehen - erneut zumeist auf dyadische Weise ohne äußere Bezugsgegenstände (siehe die Liste von Beispielen in Tabelle 2.1). Da diese Gesten von Jungtieren recht häufig in Spielkontexten verwendet werden, klassifizierten wir sie bei unseren Forschungen anfänglich als Spielgesten. Aber dann sahen wir, daß sie auch in anderen Kontexten verwendet wurden, und es wurde uns klar, daß sie etwas anders als Intentionsbewegungen funktionieren. Im prototypischen Fall ist das Jungtier in Spiellaune - was aus seinem stimmungsinduzierten Display »auf Spiel eingestellter Gesichtsausdruck und entsprechende Körperhaltung« hervorgeht - , und der Aufmerksamkeitsfänger dient dazu, die Aufmerksamkeit auf das Display zu lenken. Ein anderes Beispiel liegt vor, wenn männliche Schimpansen, denen nach Sex zumute ist, ein Verhalten des Blätterzerschneidens zeigen, was einen scharfen, lauten Ton erzeugt, der die Aufmerksamkeit der Weibchen auf ihren erigierten Penis lenkt.23 Wichtig ist, daß in diesen beiden Fällen die »Bedeutung« oder Funktion des Kommunikationsakts insgesamt nicht in der aufmerksamkeitsheischenden Geste liegt, sondern vielmehr in einem unabsichtlich hervorgebrachten Display, von dem das Individuum weiß, daß der Empfänger es sehen muß, um angemessen darauf zu reagieren. Belegt wird diese Interpretation dadurch, daß Affen bei manchen Gelegenheiten tatsächlich ein Display vor anderen verbergen, beispielsweise das Display einer Furchtgrimasse mit ihren Händen verdecken.24 Eine kleine Variation über dieses Thema besteht in einer sehr interessanten Teilmenge von Aufmerksamkeitsfängern, 23 Sugiyama 1981. 24 Tanner und Byrne 1993, de Waal 1986. 39

die ohne Displays funktionieren und sich sogar in Richtung triadische (gegenstandsbezogene) Kommunikation bewegen. Diese beinhalten etwa, daß der Kommunizierende einem anderen Individuum entweder einen Körperteil, und zwar typischerweise zur Körperpflege, oder einen Gegenstand »anbietet«, der dann gleich wieder zurückgezogen wird, um zum Spielen aufzufordern. Es gibt sogar einige seltene Beobachtungen von Affen, die anderen unerwünschtes Futter »anbieten«.25 Obwohl das selten beobachtet wird, ist die Tatsache, daß Affen die Aufmerksamkeit von Artgenossen auf diese Weise steuern, theoretisch von großer Bedeutung, weil es der triadischen, gegenstandsbezogenen, absichtlichen Steuerung der Aufmerksamkeit von anderen auf äußere Gegenstände, wie sie bei nahezu der gesamten menschlichen Kommunikation geschieht, am nächsten kommt. Da sie anders als Intentionsbewegungen funktionieren, werden Aufmerksamkeitsfänger auch auf etwas andere Weise gelernt. Sie sind nicht an irgendeine besondere soziale Aktivität gebunden und können daher nicht direkt aufgrund wiederkehrender sozialer Verhaltensweisen ritualisiert werden (außerdem gibt es keine Belege dafür, daß sie imitiert werden). Statt dessen werden sie von Individuen gelernt, die aus nichtkommunikativen Gründen Verhaltensweisen, zum Beispiel Auf-den-Boden-schlagen, etwas werfen oder andere schubsen, zeigen, was die Aufmerksamkeit anderer auf natürliche Weise anzieht; dieses Ergebnis wird dann von dem sich so verhaltenden Individuum wahrgenommen und in der Zukunft ausgenutzt. Wenn ein Aufmerksamkeitsfänger einmal gelernt wurde, kann er weithin für viele verschiedene soziale Ziele wie Spielen, Körperpflege, Stillen usw. eingesetzt werden. Gerade diese Indirektheit ist hier die eigentliche Neuerung. Der Kommunizierende will, daß der Empfänger auf bestimm25 Liebal, Pieka und Tomasello 2006. 40

te Weise handelt - wir können das seine soziale Intention nennen. Um das zu erreichen, versucht er, die Aufmerksamkeit des Empfängers auf etwas zu lenken - dies können wir seine »referentielle« Intention26 nennen - in der Erwartung, daß er tun wird, was der Kommunizierende will, wenn er dorthin schaut, wohin er nach dem Wunsch des Kommunizierenden schauen soll. Diese zweistufige intentionale Struktur ist eine echte evolutionäre Neuerung - höchstwahrscheinlich beschränkt auf Menschenaffen und möglicherweise auf andere Primaten - und kann als etwas betrachtet werden, was einem missing link zwischen nichtmenschlicher Kommunikation von Primaten und dem raffinierten Merkmal der Aufmerksamkeitssteuerung und -teilung in der menschlichen gegenstandsbezogenen Kommunikation am nächsten kommt. Schließlich ist es von Bedeutung, daß Affen regelmäßig Sequenzen von Gesten aneinanderreihen, die sowohl Intentionsbewegungen als auch Aufmerksamkeitsfänger beinhalten. Die systematische Untersuchung dieser Gestenabfolgen hat jedoch keine »Grammatik« im Sinne spezifischer Kombinationen, die neue kommunikative Funktionen oder »Bedeutungen« erzeugen, zutage gefördert.27 Was hier anscheinend geschieht - und zusätzlich die Annahme der intentionalen Beschaffenheit der gestischen Kommunikation von Menschenaffen stützt ist, daß der Kommunizierende eine Geste ausprobiert, die Reaktion des Empfängers beobachtet und diese Geste bei Bedarf wiederholt oder es mit einer anderen versucht. Dieses Verhalten beweist die Beharrlichkeit gegen26 »Referentiell« wurde in Anfuhrungszeichen gesetzt, weil, wie ich argumentieren würde, das, was Affen tun, ein Vorläufer der menschlichen Bezugnahme ist, während es sich in bestimmten Hinsichten davon unterscheidet - was jedoch erst ausführlich beschrieben werden kann, nachdem die menschliche Bezugnahme im nächsten Kapitel dargestellt worden ist. 27 Liebal, Call und Tomasello 2004. 41

über einem Ziel, wobei die Mittel nach Bedarf angepaßt werden - der Prototyp intentionalen Handelns aber es zeigt keinerlei kombinatorische oder grammatikalische Fähigkeit (siehe Kapitel 6).

2.2.2 Die Aufmerksamkeit auf die Aufmerksamkeit des anderen richten Ein wesentlicher Unterschied zwischen der Kommunikation im stimmlichen und im gestischen Modus besteht darin, wie die Beteiligten dabei jeweils die Aufmerksamkeit des anderen überwachen. Bei der stimmlichen Kommunikation gibt es im Grunde keine solche Überwachung. In den meisten Fällen drückt der Kommunizierende einfach seine individuelle Emotion aus, und daher wird sein Ruf relativ unterschiedslos in die ganze Umgebung ausgesendet. Im Gegensatz dazu findet der Großteil der gestischen Kommunikation innerhalb des visuellen Kanals statt und wird räumlich auf ein einziges Individuum gerichtet. Das verlangt vom Kommunizierenden visuelle Aufmerksamkeit, weil die Geste andernfalls keine Wirkung hätte. Der Empfänger muß seinerseits herausfinden, ob die Geste an ihn oder an seinen Nachbarn adressiert ist, um zu erkennen, ob er reagieren soll oder nicht. Im Laufe unserer 20jährigen Erforschung von Affengesten haben wir wiederholt festgestellt, daß die Gesten von Affen mit einer Sensibilität gegenüber dem Aufmerksamkeitszustand des Empfängers hervorgebracht werden, und zwar insofern, als rein visuell basierte Gesten fast immer nur dann hervorgebracht werden, wenn der Empfänger schon visuell auf den Kommunizierenden ausgerichtet ist.28 Es gibt einige bekannte experimentelle Untersuchungen von Povinelli 28 Siehe die Übersicht bei Call und Tomasello 2007. 42

und Eddy,29 die zeigen, daß kommunizierende Schimpansen, konfrontiert mit der Wahl zwischen zwei möglichen menschlichen Empfängern - von denen einer nicht in der Lage ist, den Schimpansen zu sehen, weil er zum Beispiel einen Eimer über seinem Kopf hat gegenüber beiden auf die gleiche Weise visuell gestützte Bettelgesten hervorbringen, was nahelegt, daß ihr Vermögen, die Aufmerksamkeitszustände anderer einzuschätzen, nicht besonders ausgeprägt ist. Aber zu entscheiden, an wen man Gesten adressieren soll, ist eine sehr unnatürliche Kommunikationssituation. Wenn die Versuchsanordnung geändert wird, so daß der Schimpanse nicht zu wählen braucht - im ersten Durchgang ist er mit einem Menschen konfrontiert, der ihn sehen kann, im zweiten mit einem, der ihn nicht sehen kann (diese Situationen werden dann über verschiedene Durchgänge miteinander verglichen) -, ist seine Leistung sehr viel besser (auch wenn er, anders als menschliche Kleinkinder, kaum auf Augenbewegungen achtet30). Außerdem haben andere Studien, in denen es nicht um das Kommunikationsverhalten ging, auf vielerlei Weise gezeigt, daß Affen - etwa wenn sie miteinander konkurrieren oder wenn sie Dinge vor einem menschlichen Konkurrenten verbergen wollen - verstehen, was andere sehen und was nicht.31 Angesichts all dieser Aufmerksamkeit für die Aufmerksamkeit des anderen drängt sich die Frage auf, ob Schimpansen und andere Affen einige Gestensequenzen in der folgenden spezifischen Reihenfolge hervorbringen: Aufmerksamkeitsfänger (um die Aufmerksamkeit des anderen zu erlangen), gefolgt von einer Intentionsbewegung (die visuell basiert ist und deshalb die visuelle Aufmerksamkeit des Empfängers er29 Povinelli und Eddy 1996. 30 Kaminski, Call und Tomasello 2004. 31 Siehe die Übersicht bei Tomasello und Call 2006. 43

fordert). Die Antwort ist, daß sie so etwas nicht tun, das heißt, gelegentlich bringen sie zwar solche Sequenzen hervor, aber auch etliche andere (einschließlich solcher, in denen die Reihenfolge umgekehrt ist), weshalb es sich hier nicht um eine besonders privilegierte Reihenfolge handelt.32 Auf den ersten Blick scheint das nicht zu dem Befund zu passen, dem zufolge es eine Sensibilität für die Aufmerksamkeit des anderen gibt. Der Grund, weshalb Affen Abfolgen der Art Aufmerksamkeitsfänger -> Intentionsbewegung nicht privilegieren, ist jedoch, daß sie über eine alternative Strategie verfügen. Wenn sie eine visuell basierte Intentionsbewegungsgeste hervorbringen müssen, gehen sie sehr häufig zum anderen hin und vollziehen die Geste direkt vor ihm. Wir haben diese Beobachtung zuerst in der freien Natur und dann später in Studien gemacht. Wenn ein Mensch einem Affen gegenüberstand und etwas Futter hinter seinem Rücken hatte, gestikulierte der Affe direkt vor dem Gesicht des Menschen. Aber wenn der Mensch dem Affen seinen Rücken zuwandte, ging der Affe um ihn herum und gestikulierte vor dem Gesicht des Menschen, auch wenn sich das Futter direkt vor dem Affen befand.33 Die Arten, die das am bereitwilligsten taten, waren die beiden engsten Verwandten des Menschen, Schimpansen und Bonobos. Warum Affen auf diese Strategie des »Herumgehens« statt auf eine Abfolge von Aufmerksamkeitsfänger und Intentionsbewegung zurückgreifen, ist zur Zeit noch unbekannt. Dieser ganze Komplex - betreffend die Aufmerksamkeit für die Aufmerksamkeit des anderen im Zuge der Kommunikation - läßt sich im gesamten Tierreich nur bei Primaten und womöglich nur bei Menschenaffen beobachten.

32 Liebal, Call und Tomasello 2004. 33 Liebal, Pieka, Call und Tomasello 2004. 44

2.2.3 Zusammenfassung Von einem funktionalen, kommunikationsbezogenen Gesichtspunkt aus gesehen, zeigen Menschenaffen im gestischen Modus raffiniertere Kommunikationsfertigkeiten als im stimmlichen,34 und zwar in praktisch jeder vorstellbaren Dimension. Erstens werden viele Gesten individuell gelernt und flexibel verwendet, auch in Kombinationen, während das für die Vokalisierungen nicht gilt. Zweitens verwenden Affen viele Gesten unter Einbeziehung des Aufmerksamkeitszustands des Empfängers, was gewöhnlich für die stimmliche Kommunikation noch nicht einmal relevant ist. Der gesamte Kommunikationsakt bei Affengesten ist somit: Prüfe die Aufmerksamkeit des anderen -> gehe bei Bedarf um ihn herum -> gestikuliere -> beobachte die Reaktion des anderen -> wiederhole die Geste oder verwende eine andere. Das scheint ein paradigmatischer Fall einer absichtlichen auf einen anderen gerichteten Handlung zu sein, in der sich zudem ein gewisses Verständnis davon offenbart, inwiefern die Reaktion des anderen von dessen Fähigkeiten abhängt, Dinge wahrzunehmen und zu intendieren. Evolutionär betrachtet ist es ebenfalls von Bedeutung, daß die gestische Kommunikation bei Menschenaffen (unseren engsten Verwandten) raffinierter ist als bei anderen Affen und anderen Säugetieren,35 während ziemlich genau das Gegenteil für die stimmliche Kommunikation gilt. Alle diese Erwägungen stützen unsere Annahme, daß die Gesten der Menschenaffen verglichen mit ihren Vokalisierungen der wahrscheinlichere Kandidat für den evolutionären Vorläufer von menschlicher Kommunikation sind.

34 Siehe auch Pollick und de Waal 2007. 35 Maestripieri 1998. 45

2.3 Kommunikation mit Menschen Viele Affen und Menschenaffen wachsen, was immer man davon halten mag, in der einen oder anderen Art von menschlicher Umgebung auf, entweder in einem Zoo, einer Forschungseinrichtung oder einem menschlichen Zuhause. Es gibt jedoch keine systematischen Berichte über Affen, die irgendwelche neuen Kommunikationsfertigkeiten als Ergebnis ihres permanenten Umgangs mit Menschen auf natürliche Weise erwerben. Und Menschenaffen erwerben, wie oben bemerkt wurde, im Bereich stimmlicher Kommunikation nichts Neues, wenn sie unter Menschen aufwachsen. Menschenaffen, die bei Menschen aufwachsen, erwerben jedoch einige neue Gesten, die sie spezifisch gegenüber Menschen verwenden. Für den vorliegenden Zusammenhang ist die Tatsache am interessantesten, daß viele Menschenaffen - einige davon, ohne daß sie speziell dafür trainiert wurden - etwas lernen, das man »Zeigen« nennen könnte, und zwar als leistungsfähige Erweiterung ihrer natürlichen Gesten zur Gewinnung von Aufmerksamkeit.

2.3.1 Zeigen und andere imperative Gesten Schimpansen und andere Affen, die in menschlicher Obhut aufwachsen, lernen, ihren menschlichen Pflegepersonen gegenüber auf Dinge hinzuweisen, die sie wollen, aber sich selbst nicht beschaffen können. Die grundlegendste dieser Verhaltensweisen, die ausführlich von Leavens und Kollegen dokumentiert wurde,36 findet sich bei Schimpansen, die auf Futter zeigen, das außerhalb ihrer Reichweite liegt, damit ein Mensch es für sie holt. Annähernd 60 bis 70 Prozent aller in 36 Leavens und Hopkins 1998, Leavens, Hopkins und Baard 2005. 46

menschlicher Obhut lebenden Schimpansen tun dies spontan und ohne speziell darauf trainiert worden zu sein, wenn sie sich in einer entsprechenden Situation befinden, typischerweise in einem Käfig. Dabei stellen sie sich in Richtung des außer Reichweite liegenden Futters und strecken auch ihre Finger und Hände durch das Käfiggitter nach dem Futter aus. Sie greifen nicht nach dem Futter, denn sie zeigen dieses Verhalten nicht, wenn kein Mensch in der Nähe ist. Wie diese Schimpansen ihre Zeigefertigkeit erwerben, ist unbekannt. Dieses »Zeigen« wird relativ flexibel eingesetzt. Wenn beispielsweise mehrere Arten von Futter zur Verfügung stehen, zeigen Menschenaffen auf das am meisten begehrte, und sie zeigen auch weiterhin beharrlich auf dieses Futter, wenn ihnen ein weniger begehrenswertes Futter gegeben wurde.37 Wenn Affen, die von Menschen aufgezogen wurden, einen Menschen beobachten, der an einer allgemein zugänglichen Stelle außerhalb ihres Käfigs Futter versteckt, zeigen sie zudem viele Stunden später gegenüber einem uneingeweihten Menschen immer noch auf den Ort, an dem das Futter versteckt ist.38 Wenn Affen beobachten, daß ein Mensch ein Werkzeug benötigt, um das Futter für sie zu holen, und das Werkzeug dann während der Abwesenheit des Menschen versteckt wird, zeigen sie auf den Ort, an dem das Werkzeug versteckt wurde, wenn der Mensch zurückkehrt.39 Dieses Verhalten wird immer noch am besten als eine Aufforderung gedeutet, daß der Mensch das Werkzeug wiederfinden soll (damit er das Futter holen kann), weil Menschenaffen in dieser Situation nicht gestikulieren, wenn der Mensch das Werkzeug selbst braucht;40 aber seine Indirektheit ist dennoch bemerkenswert. 37 38 39 40

Leavens, Hopkins und Baard 2005. Menzel 1999. Call und Tomasello 1994. Haimerl et al. in Vorbereitung. 47

Von Bedeutung ist auch die Tatsache, daß Menschenaffen, die in reichhaltigen menschlichen Umgebungen aufgezogen worden sind, welche denen von menschlichen Kindern entsprechen, dabei beobachtet wurden, wie sie bestimmte Dinge auf andere Weisen mit Nachdruck verlangten. Beispielsweise zeigen manche dieser Affen auf eine verschlossene Tür, wenn sie Zugang zu dem haben wollen, was sich dahinter befindet, damit der Mensch sie für sie öffnet. In einigen Fällen führen sie den Menschen auch zur Tür oder zu einem hohen Regal, indem sie ihn an seiner Hand ziehen und dann davor anhalten und erwartungsvoll warten.41 Eine weitere verbreitete Beobachtung, die ich auch selbst bei der Interaktion mit jungen Schimpansen gemacht habe, ist die, daß sie Menschen einen unzugänglichen Gegenstand (zum Beispiel eine verschlossene Kiste) bringen und um Hilfe ersuchen. Dabei nehmen sie die Hand des Menschen und führen sie in oder auf seine Hosentasche, während sie auf ein günstiges Ergebnis warten. Menschenaffen, die im Zoo leben, entwickeln häufig Aufmerksamkeitsfänger, zum Beispiel In-die-Hände-klatschen, damit die menschlichen Besucher auf sie aufmerksam werden und ihnen Futter zuwerfen. Man kann Menschenaffen auch so etwas wie Zeichen einer menschlichen Zeichensprache beibringen oder das Berühren von visuellen Symbolen, um mit Menschen zu kommunizieren.42 Offenkundig haben von Menschen aufgezogene Affen ein recht flexibles Verständnis davon, daß Menschen viele Aspekte ihrer Welt kontrollieren und dazu veranlaßt werden können, Dinge zu tun, die ihnen dabei helfen, ihre eigenen Ziele in dieser menschlichen Umgebung durch aufmerksamkeitssteuerndes Verhalten zu erreichen. Da Affen häufig auf die Augen des Menschen schauen, wenn sie etwas verlangen, ist zudem davon auszugehen, daß 41 Gomez 1990. 42 Gardner und Gardner 1969, Savage-Rumbaugh et al. 1986,1993. 48

sie wissen, daß die Kausalität/Intentionalität irgendwie hinter den Augen ihren Ursprung hat und nicht in den externen Gliedmaßen, die die erwünschten Handlungen ausführen.43 Die vernünftigste Interpretation der Zeigegesten von Menschenaffen scheint zu sein, daß sie eine natürliche Ausweitung ihrer Gesten zur Erheischung von Aufmerksamkeit sind. Genauso wie sie die Aufmerksamkeit auf sich selbst ziehen, indem sie auf den Boden schlagen oder zum Zweck der Körperpflege die Aufmerksamkeit auf ihre Schulter lenken, lenken sie im Beisein von Menschen die Aufmerksamkeit auf begehrtes Futter, indem sie »bezugnehmend« daraufhinweisen - weil sie eine bestimmte soziale Intention haben und annehmen, dieses Verhalten werde ihnen helfen, diese Intention zu erfüllen. In allen diesen Fällen können kommunizierende Menschenaffen vermutlich aufgrund früherer Erfahrungen in ähnlichen Situationen vorhersagen, was der menschliche Empfänger tun wird, wenn er wirklich das sieht, was er nach ihrem Willen sehen soll. Eine naheliegende Frage ist jedoch, warum Menschenaffen gegenüber Menschen Zeigegesten verwenden, nicht aber gegenüber ihren Artgenossen. Die naheliegende Antwort darauf lautet, daß andere Affen nicht motiviert sind, ihnen auf dieselbe Weise zu helfen wie Menschen. Wenn ein Affe gegenüber einem anderen Affen im Sinne einer Aufforderung auf etwas zu essen zeigen würde, wäre es nicht sehr wahrscheinlich, daß er es am Ende auch bekommen würde - in menschlicher Obhut lebende Affen haben hingegen viel Erfahrung mit Menschen, die ihnen umstandslos Futter geben. Wenn ihre soziale Umgebung plötzlich kooperativer werden würde, so die evolutionäre Implikation dieser offensichtlichen Tatsache, könnten Affen nachdrücklich auf etwas zeigen, um Hilfe voneinander zu verlangen, ohne dazu eine zusätzliche kognitive Maschinerie zu benötigen. 43 Gomez 1990, 2004. 49

Zugleich ist es jedoch von entscheidender Bedeutung festzuhalten, daß Menschenaffen, gleichgültig in welcher Umgebung, weder gegenüber anderen Affen noch gegenüber Menschen Zeigehandlungen verwenden, die eine andere Funktion als die der Aufforderung erfüllen. Sie zeigen also nicht deklarativ, um einem anderen Individuum zu bedeuten, daß sie sich für etwas interessieren oder daß etwas ihre Aufmerksamkeit geweckt hat,44 und sie zeigen nicht informativ auf etwas, um einen anderen über etwas zu informieren, das er wollen oder brauchen könnte, was menschliche Kleinkinder in der Ontogenese schon sehr früh tun (siehe Kapitel 4). Tomasello und Carpenter45 konfrontierten drei junge, von Menschen aufgezogene Schimpansen sogar mit Situationen, die bei menschlichen Kleinkindern zuverlässig expressivesdeklaratives Zeigen auslösen (zum Beispiel überraschende, interessante Ereignisse), konnten aber bei ihnen keine deklarativen Gesten als Reaktion beobachten. Selbst die in Zeichensprache gefaßten Erzeugnisse »sprachlicher« Affen sind fast sämtlich Imperative - etwa 96 bis 98 Prozent in den beiden einzigen systematischen Untersuchungen46 - , während die anderen zwei bis vier Prozent nicht eindeutig funktional interpretiert werden können (sie sind nicht eindeutig deklarativ oder informativ, sondern eher wiedererkennend oder klassifizierend, insofern der Affe einfach etwas wiedererkennt und das entsprechende Zeichen beim Wiedererkennen hervorbringt). Wie wir nun sehen werden, erklärt diese funktionale Beschränkung wahrscheinlich zum großen Teil die überraschenden Schwierigkeiten, die Affen haben, wenn es darum geht, menschliche Zeigegesten zu verstehen, die den Zweck haben, sie hilfreich über Dinge zu informieren. 44 Gomez 2004. 45 Tomasello und Carpenter 2005. 46 Rivas 2005, Greenfield und Savage-Rumbaugh 1990. 50

2.3.2 Das Verstehen von Zeigegesten Menschenaffen folgen der Blickrichtung von anderen, und zwar sogar bis zu verborgenen Orten, die durch Hindernisse verstellt sind.47 Wenn ein Mensch eine Zeigegeste macht und auf Futter zeigt, das ein Affe zunächst nicht sieht, und der Affe dann Blickkontakt mit dem Futter herstellt, indem er der Zeigegeste und dem Blick des Menschen folgt, wird er es sich holen. Man könnte also meinen, daß der Affe in dieser einfachen Situation die Absicht hinter der aufmerksamkeitslenkenden Geste verstanden hat. Eine scheinbar geringfügige Änderung dieses Verfahrens führt jedoch zu einem komplett anderen Ergebnis - was uns dazu veranlassen sollte, die einfachere Situation neu zu beurteilen. Tomasello, Call und Gluckman führten Menschenaffen in ein Spiel ein, bei dem ein Mensch, der »Verstecker«, in einem von drei Eimern Futter versteckte und dieses dann zusammen mit einem anderen Menschen, dem »Helfer«, gefunden werden sollte - eine sogenannte Objektwahl-Aufgabe.48 Die Affen wußten aus vorangegangenen Erfahrungen, daß es nur ein verstecktes Stück Futter gab und sie nur einmal auswählen durften. Im zentralen Schritt der Studie versteckte die eine Person das Futter vor dem Affen, während der Helfer zuschaute. Dann zeigte der Helfer einfach informativ auf den Eimer, in dem das Futter versteckt war. Erstaunlicherweise wählten die Affen die Eimer zufällig aus, obwohl sie bei fast allen Durchgängen hochmotiviert waren, das Futter zu finden. Ziemlich häufig folgte ein Affe der Zeigegeste und dem Blick des Helfers auf den richtigen Eimer, wählte ihn dann aber nicht aus. Der Richtung der Zeigegeste zu folgen 47 Tomasello, Hare und Agnetta 1999, Bräuer, Call und Tomasello 2005. 48 Tomasello, Call und Gluckman 1997. 51

war also nicht das Problem; die Affen schienen einfach nicht deren Bedeutung zu verstehen, das heißt die Relevanz dieser Geste für ihre Futtersuche. Es scheint, als ob die Affen zu sich sagten: »Gut. Hier ist ein Eimer. Und nun? Wo ist das Futter?« Menschliche Kleinkinder schneiden bei dieser scheinbar trivialen Aufgabe bereits im Alter von 14 Monaten, größtenteils vor dem Spracherwerb, gut ab.49 Das Scheitern bei diesen Aufgaben kann zwar auf unbegrenzt viele Weisen erklärt werden. Aber eine Folgestudie schränkt die Möglichkeiten beträchtlich ein. Hare und Tomasello50 führten eine Wettbewerbsversion der einfachen Objektwahl-Aufgabe durch. Die Schimpansen nahmen daran unter zwei Experimentalbedingungen teil. Eine davon, die Kooperationsbedingung, war identisch mit der einfachen Aufgabe, und so waren es auch die Ergebnisse, was nicht überrascht: Obwohl sie der Zeigegeste zum richtigen Eimer folgten, trafen die Affen eine zufällige Wahl. In der anderen, der Wettbewerbsbedingung, begann ein Mensch in der Aufwärmsitzung, mit dem Schimpansen um das Futter zu konkurrieren und setzte dieses Konkurrenzverhalten dann in der Experimentalsitzung fort. Insbesondere griff der Mensch, ohne den Affen irgendwie anzuschauen, nach dem richtigen Eimer, aber aufgrund der in der Situation bestehenden physischen Einschränkungen (er konnte seinen Arm nicht sehr weit ausstrecken, weil das Loch in der Plexiglasscheibe nicht groß genug war) war er nicht in der Lage, ihn zu erreichen. Als die Eimer nun (von einem weiteren Experimentator) auf den Affen zugeschoben wurden, wußte dieser jetzt, wo das Futter war! Obwohl das oberflächliche Verhalten in beiden Experimentalanordnungen sehr ähnlich war - der Arm wurde zum richtigen Eimer hin ausgestreckt - , war das Ver49 Behne, Carpenter und Tomasello 2005. 50 Hare und Tomasello 2004. 52

ständnis der Affen bezüglich des Verhaltens der Menschen anscheinend ganz verschieden. Sie konnten also schließen: Er möchte selbst an diesen Eimer herankommen; deshalb muß wohl etwas Gutes darin sein. Aber sie konnten immer noch nicht schließen: Er will mich wissen lassen, daß das Futter in diesem Eimer ist. Wie sollen wir das Verhalten der Affen bei dieser Aufgabe deuten? Sie folgen der Zeigegeste auf den richtigen Eimer von sich aus, aber dann scheinen sie nicht zu wissen, was sie bedeutet. Wenn wir uns nur an die herkömmliche Objektwahl-Aufgabe hielten, könnten wir annehmen, daß sie nicht über das hinausgehen können, was sie sehen, um den Ort des versteckten Futters zu erschließen. Aber viele andere Untersuchungen zeigen, daß sie in anderen Situationen sehr wohl Schlüsse ziehen können,51 und in der Folgestudie von Hare und Tomasello52 zogen sie diesen Schluß mühelos (das heißt, »wenn er seinen Arm ausstreckt, heißt das, daß dort etwas Gutes drin sein muß«). Eine aussichtsreiche Hypothese besagt folglich, daß Menschenaffen nicht verstehen, daß der Mensch altruistisch kommuniziert, um ihnen beim Erreichen ihrer Ziele zu helfen. Sie kommunizieren selbst also nur absichtlich, um etwas imperativ zu verlangen, und verstehen daher die Gesten der anderen nur dann, wenn es sich bei diesen ebenfalls um imperative Aufforderungen handelt - andernfalls ist es für sie einfach rätselhaft, welchen Zweck das Gestikulieren haben soll.

51 Call 2004. 52 Hare und Tomasello 2004. 53

2.3.3 Zusammenfassung Insgesamt sind es drei Tatsachen, die bei der Kommunikation von Menschenaffen mit Menschen von großer Wichtigkeit sind: (1) Wieder trägt die gestische Modalität den Sieg davon; (2) wieder sind es die Aufmerksamkeitsfänger der Affen (d. h. »Zeigen«) mit ihrer Gespaltenheit zwischen der sozialen und der referentiellen Intention, die am menschenähnlichsten sind; und (3) kommunizieren Affen fast ausschließlich auffordernd, um andere zu veranlassen, bestimmte Dinge zu tun, selbst wenn ihnen relativ raffinierte Kommunikationsmittel von Menschen beigebracht wurden. In der Tat scheinen sie nicht einmal informative Gesten der Kooperation zu begreifen.

Kasten 2.1 Über Hunde und andere Säugetiere Interessanterweise schneiden Haushunde bei der einfachen Objektwahl-Aufgabe sehr gut ab, wenn ein Mensch zur Information auf den Ort des versteckten Futters zeigt. Wölfe zeigen eine schwache und Hundejunge eine sehr gute Leistung, auch wenn sie zuvor kaum Umgang mit Menschen hatten.53 Es scheint also, daß die Menschen» als sie in den letzten 10 000 bis 12 000 Jahren Hunde domestizierten, in irgendeiner Weise Individuen mit Eigenschaften selektierten, die diese in gewissem Sinne in die Lage versetzen, zu verstehen, was der Mensch in dieser Situation tut Wir wissen nicht wie die Hunde das tun - die Forschung dazu hält an aber eine Hypothese ist, daß sie nicht wirklich verstehen, daß der Mensch sie über den Ort des versteckten Futters auf kooperative Weise informiert, son-

53 Hare et al. 2002. 54

dem sie das Zeigen vielmehr als Aufforderung verstehen: Der Mensch befiehlt ihnen, zu diesem Ort zu gehen. Diese Interpretation leuchtet deshalb ein, weil Hunde zum großen Teil selektiert und domestiziert wurden, damit sie Befehle des Menschen befolgen. Eine andere plausible Interpretation stützt sich auf den Begriff des Helfens: Aufgrund ihrer einzigartigen Evolutionsgeschichte verstehen Haushunde auf eine Weise, die den Menschenaffen verschlossen ist, daß der Mensch ihnen wirklich zu helfen versucht Gestützt werden diese beiden Interpretationen zusätzlich dadurch, daß im Grunde alle Tiere, die bei dieser Aufgabe gut abschneiden, entweder Haustiere sind oder von Menschen aufgezogen oder ausgiebig trainiert wurden, einschließlich trainierter Delphine, Hausziegen und mancher Affen, die von Menschen aufgezogen wurden.54 Im gegenwärtigen Kontext können wir jedenfalls folgendes festhalten: Die ausgezeichnete Leistung von Hunden und anderen Haustieren liefert einen Beweis dafür, daß es zumindest einige Tiere gibt, die bei der Objektwahl-Aufgabe angemessen auf menschliche Zeigegesten reagieren. Was sie dazu befähigt, ist noch immer unbekannt Hinsichtlich der Verhaltensproduktion gibt es Beobachtungen von Hunden und anderen Haustieren, die mit Menschen auf scheinbar komplexe Weisen kommunizieren. Zwar sind noch nicht so viele systematische Untersuchungen zu dieser Thematik durchgeführt worden,55 aber auch wenn wir diese Beobachtungen bis zu einem gewissen Grad akzeptieren, ist es wichtig festzuhalten, daß diese Tiere mit Artgenossen nicht auf dieselben komplexen Weisen kommunizieren wie mit Menschen. Daher können diese Kommunikationsfertigkeiten in gewissem Sinne als »unnatürlich« aufgefaßt werden, da sie Beispiele für die Kommunikation zwischen biologischen Arten sind, die zumindest teilweise aus dem Prozeß der Domestikation resultieren. 54 Siehe eine Übersicht bei Call und Tomasello 2005. 55 Siehe Hare, Call und Tomasello 1998. 55

2.4 Intentionalität bei der Kommunikation von Affen Für Forscher, die nur Menschen untersuchen und die sich nie genauer mit der Kommunikation von Tieren beschäftigt haben, ist es schwierig zu würdigen, wie verblüffend die flexiblen Fertigkeiten zur gestischen Kommunikation seitens der Menschenaffen sind. Der überwältigende Teil der Kommunikation unter Tieren ist im Grunde genetisch festgelegt. Sogar bei Affen und Menschenaffen ist die stimmliche Kommunikation zum größten Teil genetisch fixiert. Obwohl sie nicht im einzelnen untersucht wurde,56 hat die gestische Kommunikation von Affen ein charakteristisch stereotypes Erscheinungsbild. Die Flexibilität der gestischen Kommunikation bei Menschenaffen ist daher wirklich eine evolutionäre Neuerung. Die Flexibilität des Verhaltens ist im allgemeinen ein Zeichen dafür, daß Lernen eine Rolle spielt, und wir haben auch Belege dafür angeführt, daß viele Gesten der Menschenaffen tatsächlich gelernt sind. Das könnte aber theoretisch entweder relativ einfaches assoziatives Lernen sein - wenn eine bestimmte Situation eintritt, ist wahrscheinlich eine bestimmte Geste wirksam oder es könnte sich um relativ komplexe kognitive Prozesse handeln, die ein Verständnis der Intentionalität des Kommunikationspartners beinhalten. Wir glauben, daß komplexe kognitive Prozesse beteiligt sind und daß diese Ansicht von Studien unterstützt wird, die das Verständnis von Intentionalität bei Menschenaffen in anderen Tätigkeitsbereichen dokumentieren.

56 Siehe Maestripieri 1998. 56

2.4-1 Das Verstehen intentionalen Handelns Genauso wie Tiere physische Probleme lösen können, ohne ein Verständnis der ganzen zugrundeliegenden Kausalität zu besitzen, sind sie auch imstande zu kommunizieren, ohne die daran beteiligte Intentionalität in vollem Umfang zu verstehen. Und genau das tun sie in der Tat die meiste Zeit. Wenn sie X tun, tun die Empfänger Y, das wissen sie, ohne in irgendeiner Weise zu verstehen, wie das funktioniert. Für eine flexiblere Kommunikation - bei der zum Beispiel verschiedene Signale zu verschiedenen Gelegenheiten in Abhängigkeit von solchen Dingen wie dem Aufmerksamkeitszustand des Empfängers ausgewählt werden, wie es bei der gestischen Kommunikation von Menschenaffen der Fall ist - braucht der Kommunizierende jedoch eine Art von kognitivem Modell dafür, wie der Empfänger das Signal wahrnimmt und in Reaktion darauf handelt. Die jüngste Forschung hat gezeigt, daß Menschenaffen viel darüber wissen, wie andere als intentionale, wahrnehmende Akteure funktionieren. Insbesondere verstehen Menschenaffen etwas von den Zielen und Wahrnehmungen der anderen und wie diese bei einzelnen intentionalen Handlungen zusammenwirken, ähnlich dem Verständnis von kleinen Kindern.57 Menschenaffen (der größte Teil der Forschung bezieht sich auf Schimpansen) verstehen zum einen, daß andere Ziele haben. Dafür gibt es folgende Belege: - Wenn ein Mensch einem Schimpansen Futter reicht und die Übergabe fehlschlägt, reagiert der Affe frustriert, falls der Mensch die Übergabe ohne Not fehlschlagen läßt (das heißt widerwillig ist), wohingegen er geduldig wartet, 57 Siehe jedoch eine abweichende Ansicht bei Povinelli und Vonk 2006. 57

-

-

-

-

wenn der Mensch ernsthaft versucht, den Gegenstand dem Affen zu geben, es ihm aber nicht gelingt oder etwas dazwischenkommt (das heißt, wenn er unfähig ist).58 Wenn ein Mensch oder ein Artgenosse beim Greifen nach einem außer Reichweite liegenden Gegenstand oder Ort Hilfe braucht, helfen Schimpansen ihm auf eine Weise, die wir auch bei Kleinkindern beobachten können - was ein Verständnis des Ziels des anderen erfordert.59 Wenn ein Mensch einem von Menschen aufgezogenen Schimpansen eine Handlung an einem Gegenstand vorführt, die auf irgendeine Weise als fehlgeschlagener Versuch erkennbar ist, den Zustand des Gegenstands zu ändern, führt der Affe seinerseits die beabsichtigte Handlung aus (und nicht die tatsächlich vorgeführte Handlung, zum Beispiel wenn die Hände am Gegenstand abgleiten).60 Wenn ein Mensch einem von Menschen aufgezogenen Schimpansen eine Folge von zwei Handlungen an einem Gegenstand vorführt, von denen eine auf irgendeine Weise als eine zufällige erkennbar ist, führt der Affe seinerseits gewöhnlich nur die beabsichtigte Handlung aus.61 Wenn ein von Menschen aufgezogener Schimpanse beobachtet, wie ein Mensch Handlungen hervorbringt, die entweder frei gewählt oder von den Umständen erzwungen sind, versteht der Affe den Unterschied - dies wird durch seine selektive Imitation der frei gewählten Handlungen,

58 Call et al. 2004; siehe Behne et al. 2005 für ähnliche Befunde bei Kleinkindern. 59 Warneken und Tomasello 2006, Warneken et al. 2007. 60 Tomasello und Carpenter 2005, auf der Grundlage von Meltzoffs Untersuchung an Kleinkindern 1995. 61 Tomasello und Carpenter 2005, auf der Grundlage von Carpenters, Akhtars und Tomasellos 1998 durchgeführter Untersuchung an Kleinkindern; siehe auch Call und Tomasello 1998 für weitere Belege. 58

aber nicht der von den Umständen erzwungenen demonstriert (wenn die Umstände ihn nicht betreffen) - und beweist damit nicht nur ein Verständnis der Intentionalität der Handlung, sondern auch ihrer Rationalität.62 Daraus läßt sich der Schluß ziehen, daß sowohl Affen als auch kleine Kinder (in einfachen Situationen) grundsätzlich auf dieselbe Weise verstehen, daß Individuen ein Ziel beharrlich verfolgen, bis sie es erreicht haben; und sie verstehen das Ziel nicht als das Ergebnis, das in der äußeren Umwelt hervorgebracht wurde, sondern vielmehr als die innere Repräsentation des Weltzustands, den der Akteur herstellen wollte. Sie verstehen auch, daß der Akteur eine Handlung wählt, um ein Ziel auf »rationale« Weise zu erreichen, und zwar indem sie die Gründe des Akteurs für seine Handlung berücksichtigen. Zweitens verstehen Menschenaffen (der überwiegende Teil der Forschung bezieht sich wiederum auf Schimpansen) auch, daß andere Wahrnehmungen haben. Dafür gibt es folgende Belege:63 - Wenn ein Mensch hinter ein Hindernis schaut, rücken die Affen heran, um einen besseren Blickwinkel zu erlangen, damit sie ebenfalls dahinterschauen können.64 - Wenn der Blick eines Menschen auf ein Hindernis gerichtet ist und es außerdem einen Gegenstand in derselben Richtung gibt, der weiter entfernt ist, blicken Affen nur auf das Hindernis und nicht auf den Gegenstand - es sei denn, 62 Buttelmann et al. 2007, auf der Grundlage der Untersuchung von Gergely, Bekkering und Kiräly 2002 an Kleinkindern. 63 Siehe die Übersicht bei Tomasello und Call 2006. 64 Tomasello, Hare und Agnetta 1999, Bräuer et al. 2006; siehe eine ähnliche Untersuchung mit Kleinkindern bei Moll und Tomasello 2004. 59

das Hindernis enthält ein Fenster; dann schauen sie auf den Gegenstand.65 - Wenn Affen bei einem Menschen um Futter betteln, berücksichtigen sie, ob der Mensch ihre Geste sehen kann.66 - Wenn Schimpansen miteinander um Futter konkurrieren, berücksichtigen sie, ob ihr Konkurrent das Futter, um das es geht, sehen kann,67 und versuchen manchmal sogar vor einem Konkurrenten zu verbergen, daß sie sich dem Futter nähern.68 Daraus läßt sich schließen: Sowohl Affen als auch kleine Kinder (in einfachen Situationen) verstehen auf dieselbe grundsätzliche Weise, daß Individuen Dinge in der Welt wahrnehmen und auf sie reagieren; außerdem verstehen sie, daß der Inhalt der Wahrnehmung anderer sich vom Inhalt ihrer eigenen Wahrnehmung unterscheidet. Die zuletzt angeführten Konkurrenzstudien sind von besonderer Bedeutung, weil sie zeigen, daß Schimpansen Ziele und Wahrnehmungen nicht nur gesondert verstehen, sondern vielmehr auch verstehen, wie sie in der grundsätzlichen Logik intentionalen Handelns zueinander in Beziehung stehen: Akteure wollen, daß bestimmte Zustände in ihrer Umgebung eintreten (sie haben Ziele); Akteure sehen die Welt und können daher die Situation im Hinblick auf den erwünschten Zielzustand einschätzen; und Akteure tun bestimmte Dinge, wenn sie wahrnehmen, daß die Umwelt nicht im gewünschten Zielzustand ist. Diese Art des Verstehens intentionaler Handlungen unterstützt eine elementare Form des prakti65 Okamoto-Barth, Call und Tomasello 2007; siehe ähnliche Befunde an Kleinkindern bei Caron et al. 2002. 66 Kaminski, Call und Tomasello 2004, Liebal, Pika, Call und Tomasello 2004. 67 Hare et al. 2000, Hare, Call und Tomasello 2001. 68 Hare, Call und Tomasello 2006, Melis, Call und Tomasello 2006. 60

sehen Schlußfolgerns, mit dessen Hilfe Individuen verstehen und vorhersagen können, was die anderen tun werden, selbst unter neuen Umständen. In den Konkurrenzstudien von Hare et al. verstehen die Teilnehmer also, daß ihr Konkurrent sein Ziel (das Futter) verfolgen wird, wenn er es sehen kann, er es dagegen nicht verfolgen wird, wenn er es nicht sehen kann; und umgekehrt: Wenn der Konkurrent etwas sieht, was nicht sein Ziel ist (zum Beispiel einen Stein), wird er es nicht verfolgen. Außerdem haben sie in neuen Situationen ein elementares Verständnis von Gelegenheiten und Hindernissen in bezug auf Ziele anderer - etwa wenn der andere freie Bahn zum Futter hat oder aber sein Weg versperrt ist - und wie dies ihre Verhaltenswahl beeinflußt. Diese Art des praktischen Schlußfolgerns im Hinblick auf andere - im Sinne der psychologischen Prädikate wollen, sehen und tun - ist grundlegend für alle Arten der sozialen Interaktion bei Primaten und Menschen, einschließlich der intentionalen Kommunikation, die als soziales Handeln aufgefaßt wird, bei dem Individuen versuchen, andere dazu zu bringen, das zu tun, was sie von ihnen wollen. Die Konklusion lautet also insgesamt, daß Affen andere verstehen, und zwar sowohl im Hinblick auf deren Ziele und Wahrnehmungen als auch im Hinblick darauf, wie diese zusammenwirken, um Verhaltensentscheidungen zu bestimmen. Mit anderen Worten: Sie verstehen andere als intentionale, möglicherweise sogar als rationale Akteure. Deshalb können sie jene praktischen Schlußfolgerungen ziehen, die der flexiblen, strategischen sozialen Interaktion und Kommunikation zugrunde liegen - beispielsweise herausfinden, was der andere will, den Grund, warum er es will, und was er wahrscheinlich als nächstes tun wird. Da die Gesten von Affen unmittelbar aus sinnvollen sozialen Interaktionen hervorgehen, wie sie in beobachtbarem Verhalten ausgedrückt werden - wohingegen Vokalisierungen individualistischere 61

Expressionen von Emotionen mit wenigen beobachtbaren Manifestationen im Verhalten sind scheinen die Fertigkeiten des praktischen Schlußfolgerns im Hinblick auf intentionales Handeln bei der gestischen Kommunikation auf besonders natürliche Weise anwendbar zu sein.

2.4.2 Wie Affengesten funktionieren Es ist möglich, daß Menschenaffen bei ihrer gestischen Kommunikation überhaupt keinen Gebrauch von diesem Verständnis individueller Intentionalität machen, sondern sich einfach auf Assoziationslernen oder etwas Ähnliches verlassen. Das scheint jedoch sehr unwahrscheinlich zu sein. Wenn sie in den oben referierten Studien wissen, was andere sehen, wollen und tun, dann wissen sie diese Dinge auch, wenn sie selbst gestikulieren und wenn ihnen gegenüber gestikuliert wird. Trotzdem müssen wir darauf achten, den Dingen nicht eine menschliche Interpretation unterzuschieben, wo eine solche nicht gerechtfertigt ist. Diese theoretische Einstellung eines »dritten Wegs« (der kognitivistisch, aber nicht anthropozentrisch ist)69 führt zu nachfolgender Analyse von Intentionsbewegungen und Gesten der Aufmerksamkeitserheischung bei Menschenaffen hinsichtlich der primitiven psychologischen Prädikate des Wollens, Sehens und Tuns, die von den erwähnten Studien gerechtfertigt wird. Intentionsbewegungsgesten bei Affen entspringen der sozialen Intention des Kommunizierenden, daß der Empfänger etwas tun soll, wie etwa spielen, den Rücken absenken oder Körperpflege betreiben. Die Erwartung des Kommunizierenden ist dabei, daß der Empfänger, wenn er seine Geste sieht, das tun wird, was der Kommunizierende will, weil es dasje69 Call und Tomasello 2005. 62

nige ist, was er in der Vergangenheit getan hat (die Grundlage des Prozesses der Ritualisierung). Nachdem er die Intentionsbewegung gesehen hat, weiß der Empfänger seinerseits, daß der Kommunizierende von ihm willy daß er etwas Bestimmtes tut (gestützt auf seine Fähigkeiten des Erkennens von Intentionen und seine früheren Erfahrungen bei ähnlichen Interaktionen). Im Gegensatz dazu entspringen die Gesten der Aufmerksamkeitserheischung bei Affen aus der sozialen Intention des Kommunizierenden: Der Empfänger soll etwas sehen, von dem der Kommunizierende aufgrund seines intentionalen Verstehens (in Kombination mit früheren Erfahrungen) erwartet, daß es den Empfänger höchstwahrscheinlich dazu veranlaßt, das zu tun, was er will. Dadurch entsteht eine zweischichtige intentionale Struktur, die die soziale Intention des Kommunizierenden als sein grundsätzliches Ziel und seine »referentielle« Intention als ein Mittel, um dieses Ziel zu erreichen, umfaßt. Wenn er den Aufmerksamkeitsfänger sieht, weiß der Empfänger seinerseits, daß der Kommunizierende von ihm will daß er etwas sieht, und möglicherweise auch, daß er die aufmerksamkeitsheischende Handlung als Mittel einsetzt, um den Empfänger dazu zu bringen, etwas zu tun. Als Reaktion blickt der Empfänger also auf die aufmerksamkeitsheischende Geste und reagiert dann auf natürliche Weise auf das, was er sieht und womöglich auf das, was der Kommunizierende will, wenn der Empfänger von sich aus dazu neigt. Unsere Analyse der beiden Gestentypen bei Menschenaffen aus der Sicht des Kommunizierenden läßt sich an diesem Punkt schematisch wie folgt darstellen (Abbildung 2.1):

63

fH

WOLLEN -

VW

TUN x soziale Intention

(|f

SEHENy referentielle Intention

Intentionsbewegung

WOLLEN - - •

TUNx soziale Intention

Aufmerksamkeitsfanger Abbildung 2.1 Dabei ist folgendes entscheidend: Da Intentionsbewegungen einfach Ritualisierungen (Abkürzungen) der Anfangsphase intentionaler Handlungen sind, ist ihre »Bedeutung« in sie eingebaut; sie besteht einfach in dem Tun, zu dem der Kommunizierende den anderen bei der Interaktion zu veranlassen beabsichtigt und was schon in einer früheren Handlung innerhalb der sozialen Interaktion gegenwärtig war, bevor das Signal ritualisiert wurde. Im Gegensatz dazu führen Aufmerksamkeitsfänger ein gewisses Maß an Indirektheit in den Prozeß ein. Ihre zweischichtige intentionale Struktur erzeugt eine »Distanz« zwischen dem beobachtbaren Kommunikationsmittel (der »bezugnehmenden« Handlung) und dem nicht beobachtbaren Kommunikationszweck (der sozialen Intention). Der Empfänger schließt dann von dem, was er sieht, auf das, was der Kommunizierende will (obwohl es auch möglich ist, daß er darauf einfach natürlicherweise reagiert, ohne einen solchen Schluß zu ziehen). Mit Blick auf die Kommunikation unter Tieren im allgemeinen ist dieser Prozeß zweifelsohne verblüffend; allerdings 64

unterscheidet er sich immer noch in einigen grundlegenden Hinsichten von der menschlichen Kommunikation, die im nächsten Kapitel ausführlicher erörtert werden wird. An dieser Stelle können wir uns jedoch auf einen Hauptunterschied konzentrieren, und zwar aus der Sicht des Empfängers. Wenn ein Mensch gegenüber einem anderen auf etwas zeigt, fragt sich der Empfänger stillschweigend, warum er das tut - warum meint er, daß ein Blick in diese Richtung für mich nützlich oder interessant sein wird? Diese Frage beruht auf der Annahme, daß er tatsächlich zum (wenigstens unmittelbaren) Nutzen des Empfängers auf etwas zeigt. Wenn ein Erwachsener im Zusammenhang einer Suchhandlung auf einen Eimer zeigt, so wissen zum Beispiel kleine Kinder, daß diese Zeigegeste wahrscheinlich in gewisser Weise für ihr gemeinsames Ziel relevant ist, das Spielzeug zu finden. Im Gegensatz dazu können Menschenaffen nicht annehmen und nehmen auch nicht an, daß der andere zu ihren Gunsten auf etwas zeigt. Daher fragen sie sich auch nicht »Warum denkt er, daß das für mich relevant ist?« Sie wollen wissen, was er für sich will (da Menschenaffen immer nur zu ihren eigenen Gunsten auf etwas zeigen), und nicht, warum er denkt, ihr Blick in diese Richtung werde für sie selbst relevant sein - und deshalb sehen sie die Zeigegeste eines anderen nicht als relevant für ihr eigenes Ziel an. (Meines Erachtens gilt dasselbe auch für die Empfänger der Vokalisierungen von Menschenaffen: Sie hören einen aufgeregten oder ängstlichen Schrei und fragen sich, was ihn ausgelöst hat. Aber sie fragen nicht, warum der Schreiende denkt, der Schrei sei relevant für sie.) Wie wir im nächsten Kapitel im einzelnen sehen werden, besteht der wesentliche Punkt darin, daß sich ein ganz neuer Prozeß des Schlußfolgerns ergibt, wenn die Kommunikation durch stärker kooperative Motive beherrscht wird - also nicht nur durch individuelle Intentionalität, sondern durch geteilte Intentionalität. 65

2.5 Schlußfolgerung Die große Mehrheit der Untersuchungen zur Kommunikation nichtmenschlicher Primaten konzentriert sich auf deren stimmliche Displays, und nahezu alle Abhandlungen mit Titeln wie »Primatenkommunikation und menschliche Sprache« konzentrieren sich auf den stimmlichen Kanal, ohne Gesten überhaupt zu erwähnen.70 Meiner Meinung nach ist das ein großer Fehler. Die stimmlichen Displays von Primaten unterscheiden sich im Grunde nicht von denen anderer Säugetiere; es gibt keinen Zuwachs an Raffinesse oder Komplexität von anderen Säugetieren zu Primaten oder, innerhalb der Primaten, von Affen zu Menschenaffen. Bei allen Säugetieren, nichtmenschliche Primaten eingeschlossen, sind stimmliche Displays zum größten Teil nicht gelernte, genetisch fixierte, emotional dringliche, unwillkürliche, unflexible Reaktionen auf evolutionär bedeutsame Ereignisse, die dem Vokalisierenden mehr oder weniger direkt nutzen. Sie werden mehr oder weniger unterschiedslos unter geringer Beachtung potentieller Empfänger ausgesendet. Wenn Menschenaffen in Gegenwart von Menschen aufwachsen, lernen sie keine neuen Vokalisierungen und können nicht einmal darauf trainiert werden, auf neue Weisen zu vokalisieren. Wie könnten solche mechanischen Reflexe direkte Vorläufer von einem jener komplexen Systeme menschlicher Kommunikation und Sprache sein, die über einfache Ausrufe von »Autsch!« hinausgehen? In völligem Gegensatz dazu sind eine beträchtliche Anzahl von Gesten nichtmenschlicher Primaten individuell gelernte und flexibel hervorgebrachte Kommunikationsakte, die ein Verständnis bedeutsamer Aspekte individueller Intentionalität beinhalten. Die Intentionsbewegungsgesten von Affen 70 Zwei Ausnahmen in jüngerer Zeit sind Corballis 2002 und Burling 2005. 66

drücken den Willen eines Individuums aus, daß ein anderes etwas tut, und werden im Lichte des Aufmerksamkeitszustands des Empfängers ausgewählt. Die aufmerksamkeitsheischenden Gesten der Affen drücken die zweischichtige Intention eines Individuums aus, daß ein anderes etwas sieht, damit es etwas tun wird, wobei einige Aufmerksamkeitsfänger sogar triadisch verwendet werden (etwa um einem anderen einen Körperteil oder einen Gegenstand »anzubieten« oder um gegenüber Menschen auf etwas zu »zeigen«). Die Aufmerksamkeitsfänger von Affen sind aus evolutionärer Perspektive eine äußerst seltene Form der Kommunikation - diesbezüglich habe ich sogar von einer Art missing link im Hinblick auf die menschliche Kommunikation mit all ihrer Steuerung und Teilung der Aufmerksamkeit gesprochen -, weil sie eine Aufspaltung einführen, und zwar zwischen der referentiellen Intention, daß der Empfänger auf etwas blicken soll, und der sozialen Intention, daß er infolgedessen etwas tun soll. Aus meiner Sicht gibt es keine Zweifel, daß die Gesten von Affen - mit all ihrer Flexibilität und Sensibilität gegenüber der Aufmerksamkeit des anderen - , und nicht ihre unflexiblen und ignoranten Vokalisierungen, die ursprüngliche Quelle sind, aus der der Reichtum und die Vielschichtigkeit menschlicher Kommunikation und Sprache flössen.

67

3 Kooperative Kommunikation beim Menschen

[Ich] wüßte [... ] nicht, worauf ich als Korrelat des Wortes »küssen« [oder »größer«] zeigen sollte. ... Es gibt freilich einen Akt, »die Aufmerksamkeit auf die Größe der Personen richten«, oder auf ihre Tätigkeit Das zeigt, wie der allgemeine Begriff der Bedeutung entstehen konnte. Ludwig Wittgenstein, The Big Typescript

Man könnte leicht denken, daß nichts von dem, was Menschenaffen tun, für die menschliche Kommunikation von großem Belang sei, weil Menschen durch die Verwendung einer Sprache kommunizieren und die Funktion der Sprache etwas äußerst Besonderes ist - eine Art symbolischer Code, der Bedeutung direkt vermittelt. Wenn unsere Frage sich jedoch auf Ursprünge bezieht, sind mit dieser Einschätzung zwei grundsätzliche Probleme verbunden. Das erste Problem ist, daß die sprachliche Kommunikation in einem viel größeren Ausmaß auf unkodierter Kommunikation und anderen Formen geistiger Feinabstimmung beruht, als man gewöhnlich wahrnimmt, gleichwohl konventionelle Sprachen in gewissem Sinne verschiedene Codes sind. Um nur zwei sehr einfache Beispiele zu nennen: Erstens, die alltägliche sprachliche Kommunikation ist gespickt mit Ausdrücken wie esy sie (3. Pers. Sg. und PL), hier, der Typ, den wir getroffen haben, deren Referenten nicht direkt anhand irgendeines Codes bestimmt werden können, sondern aufgrund eines gemeinsamen begrifflichen Hintergrunds erschlossen werden müssen; und zweitens sind alltägliche Unterhaltungen reich an Dialogen wie dem folgenden: Ernie: »Willst du ins Kino gehen?« Bert: »Ich habe morgen früh eine Prüfung.« - wobei Ernie Berts Antwort nur dann verstehen kann, wenn er über eine 68

hinreichend große Menge von geteiltem Hintergrundwissen und Schlußfolgerungen anhand von Tatsachen verfugt, die außerhalb jedes Codes liegen (zum Beispiel zu wissen, daß man am Abend vor einer Prüfung lernt, was ausschließt, daß man ins Kino geht). Der sprachliche »Code« gründet auf einer nichtsprachlichen Infrastruktur des intentionalen Verstehens und auf einem gemeinsamen begrifflichen Hintergrund, der tatsächlich logisch vorrangig ist.1 Das zweite Problem betrifft direkt die Ursprünge. Die menschliche Kommunikation, so der grundsätzliche Einwand, kann nicht mit einem Code entstanden sein, da das voraussetzen würde, was zu erklären beansprucht wird (wie alle Vertragstheorien es tun). Die Vereinbarung eines expliziten Codes erfordert eine schon bestehende Form der Kommunikation, die mindestens so reichhaltig ist wie dieser Code selbst. Wenn etwa zwei Angestellte einen Code vereinbaren wollen, dem zufolge sie zweimal an die Wand klopfen, um sich gegenseitig zu warnen, daß der Chef sich nähert, wie können sie diese Vereinbarung treffen, wenn nicht durch eine andere Form der Kommunikation? Ein symbolischer Kommunikationscode setzt eine schon bestehende Form der Kommunikation voraus, die kodifiziert ist - genauso wie Geld eine schon bestehende Praxis des Warentauschs und des Handels voraussetzt, die in gewissem Sinne kodifiziert ist. Explizite Codes sind daher ihrerseits etwas intrinsisch Abgeleitetes. Was ist jedoch mit »Codes«, die auf natürlichere Weise entstehen, wie zum Beispiel Sprachen? Sie werden nicht im voraus explizit formuliert und leiden daher vielleicht nicht an demselben Zirkularitätsproblem. Leider ist dem nicht so. Einer der zentralen Einsichten von Wittgensteins scharfsinniger Analyse sprachlicher Kommunikation2 zufolge können neue 1 Wittgenstein 1953/2008. 2 Wittgenstein 1953/2008. 69

potentielle Benutzer einer Sprache - etwa Kinder - den Code nur dann knacken, wenn sie über bestimmte andere Mittel verfügen, um mit reifen Benutzern zu kommunizieren oder zumindest umzugehen. Andernfalls sind sie in der Position von Quines Besucher einer fremden Kultur, der zwar einen Eingeborenen in dem Moment »Gavagai« rufen hört, in dem ein Tier vorbeiläuft, jedoch keine Ahnung hat, auf welchen Aspekt der Situation der Eingeborene mit diesem unbekannten sprachlichen Ausdruck hinzuweisen beabsichtigt.3 Der Eingeborene könnte dem Fremden »zeigen«, was er meint, aber dieses Zeigen wird schließlich auf eine Form unkodierter Kommunikation hinauslaufen oder aber auf eine andere unkodierte Form des Austauschs, in der die beiden sich geistig aufeinander abstimmen. Wenn wir die menschliche Kommunikation verstehen wollen, können wir daher nicht mit der Sprache beginnen. Als Ausgangspunkt müssen uns vielmehr die nicht-konventionalisierte, unkodierte Kommunikation und andere Formen der geistigen Abstimmung dienen. Hervorragende Kandidaten für diese Rolle sind die natürlichen Gesten des Menschen wie das Zeigen oder das Gebärdenspiel. Diese Gesten sind zwar einfach und natürlich, werden aber verwendet, um auf sehr leistungsstarke und einzigartige Weise zu kommunizieren. Unsere erste Frage muß daher lauten, wie diese Gesten funktionieren, bevor wir uns die Sprache und ihre unzähligen Komplexitäten vornehmen. Unsere Antwort wird sich auf die zum größten Teil verborgene, hoch komplexe, im Artvergleich einzigartige psychologische Infrastruktur geteilter Intentionalität konzentrieren, in deren Rahmen Menschen ihre natürlichen Gesten verwenden und die eine ganz neue Welt von Dingen generiert, über die kommuniziert werden kann. Die systematische Identifikation der Bestandteile dieser In3 Quine 1960/1980. 70

frastruktur - sowohl im Sinne der beteiligten kognitiven Fertigkeiten als auch der sozialen Motivationen - läuft auf die Konstruktion eines Modells menschlicher Kommunikation hinaus, das wir das Kooperationsmodell nennen werden.

3.1 Zeigegesten und Gebärdenspiel Bislang hat sich ein Großteil der Erforschung menschlicher Gesten auf die konventionalisierten Zeichensprachen von Taubstummen konzentriert.4 Da jedoch solche Sprachen praktisch alle Komplexitäten moderner, stimmlicher Sprachen aufweisen, stellen sie vermutlich nicht die frühesten evolutionären Stadien der nur beim Menschen vorkommenden gestischen Kommunikation dar. Andere Forschungen haben sich ausgiebig mit jenen Gesten beschäftigt, die die stimmliche Sprache begleiten und eine Reihe sehr spezieller Eigenschaften haben, die auf ihre nur unterstützende Rolle im Kommunikationsprozeß zurückgehen.5 Wenn aber Gesten in der Evolution des Menschen zuerst auftraten, dann sind wohl die frühesten Gesten der Menschen ohne Begleitung durch irgendwelche konventionalisierte Sprachen, gleichgültig ob in stimmlicher oder in Zeichenform, verwendet worden. Unser Interesse richtet sich hier also zumindest für den Anfang nicht auf menschliche Gesten, die als Ersatz oder Ergänzung für die stimmliche Sprache verwendet werden, sondern vielmehr auf Gesten, die selbst als vollständige Kommunikationsakte eingesetzt werden - weil wir hier am deutlichsten die verschiedenen Bestandteile der menschlichen kooperativen Kommunikation in ihrem Zusammenspiel erkennen können, so wie sie bei vorsprachlichen Kleinkindern zusammenwirken und 4 Beispielsweise Armstrong, Stokoe und Wilcox 1995, Liddell 2003. 5 McNeill 1992, Goldin-Meadow 2003a. 71

wie sie es vermutlich auch bei den frühen Menschen vor dem Entstehen der Sprache taten. Zweierlei wollen wir wissen: wie die einzigartigen Gestenformen von Menschen sich aus den Gesten von Affen entwickelt haben und wie diese Gesten im Anschluß daran den Weg für voll konventionalisierte, natürliche Sprachen bereitet haben. Von einem funktionalen, psychologischen Gesichtspunkt aus betrachtet - wenn wir also darauf achten, wie menschliche Gesten zur Kommunikation eingesetzt werden -, besteht weitgehend Übereinstimmung darüber, daß es im wesentlichen zwei Grundformen gibt, und zwar in Abhängigkeit davon, wie sie zur Bezugnahme verwendet werden.6 Menschen gestikulieren, um - die Aufmerksamkeit eines Empfängers räumlich auf etwas in der unmittelbaren Wahrnehmungsumgebung zu lenken (deiktisch); - die Einbildungskraft eines Empfängers auf etwas zu lenken, das sich normalerweise nicht in der unmittelbaren Wahrnehmungsumgebung befindet, indem eine Handlung, eine Beziehung oder ein Gegenstand durch ein bestimmtes Verhalten simuliert wird (ikonisch). Indem die Aufmerksamkeit oder die Einbildungskraft des Empfängers auf etwas gelenkt wird, sollen diese referentiellen Akte ihn veranlassen, die soziale Intention des Kommunizierenden zu erschließen - dasjenige, was der Empfänger nach dem Willen des Kommunizierenden tun, wissen oder empfinden soll. Diese beiden Grundtypen menschlicher Gesten sind auf eine sehr allgemeine Weise analog zu den beiden Typen von Gesten bei Menschenaffen. Menschliche Zeigegesten sind 6 Siehe Kendon 2004, S. 107. 72

den Aufmerksamkeitsfängern von Affen ähnlich, insofern sie beide darauf abzielen, die Aufmerksamkeit des Empfängers auf etwas in der unmittelbaren Wahrnehmungsumgebung zu lenken. Ikonische Gesten des Menschen sind den Intentionsbewegungen von Menschenaffen ähnlich, insofern beides zwar Handlungen, aber keine echten Handlungen sind: Intentionsbewegungen sind Abkürzungen der eigentlichen Handlungen, und ikonische Gesten stellen die reale Sache in ihrer Abwesenheit symbolisch dar. Es gibt aber auch wichtige Unterschiede. Während beispielsweise die Aufmerksamkeitsfänger von Affen auf der natürlichen Tendenz der Empfänger beruhen, ihre Aufmerksamkeit der Quelle von Geräuschen oder Berührungen zuzuwenden, beruht das menschliche Zeigen auf der natürlichen Neigung der Empfänger, der Blickrichtung und ebenso der Zeigerichtung anderer zu externen Objekten zu folgen. Und während die Intentionsbewegungen von Affen auf der natürlichen Neigung der Empfänger beruhen, den nächsten Schritt in einer Handlungssequenz sozusagen thematisch vorwegzunehmen, beruhen die ikonischen Gesten des Menschen auf der natürlichen Neigung der Empfänger, intentionales Handeln als solches zu verstehen - in diesem Fall außerhalb seines normalen Zusammenhangs, wenn es verwendet wird, um über eine Situation »wie diese hier« symbolisch und kategorial zu kommunizieren.

3.1.1 Zeigegesten Gesten der Lenkung der Aufmerksamkeit oder deiktische Gesten, wie wir sie nennen können, deren Prototyp das menschliche Zeigen ist, sind die grundlegendste Form menschlicher Gesten, die als vollständige Kommunikationsakte verwendet werden. Obwohl es beträchtliche Variationen dieser Form gibt (in manchen Kulturen ist beispielsweise Zeigen mit den 73

Lippen oder mit dem Kinn anstatt mit dem Zeigefinger die Norm), ist die grundlegende zwischenmenschliche Funktion der Lenkung von jemandes Aufmerksamkeit durch Gesten in allen bekannten menschlichen Gesellschaften vorhanden.7 Aufmerksamkeitslenkende Gesten (zu denen auch das Hochhalten von Gegenständen gehört, um sie anderen zu zeigen) steuern die Aufmerksamkeit des Empfängers räumlich auf einen bestimmten Ort in der unmittelbaren Wahrnehmungsumgebung. Dann muß zusätzliche kognitive Arbeit geleistet werden, um die soziale Intention zu erschließen: warum diese bezugnehmende Handlung vollzogen wurde, was der Kommunizierende vom Empfänger will. Wie genau Menschen das Zeigen lernen, sollten sie es wirklich lernen, ist zwar nicht bekannt, aber in Kapitel 4 über die Ontogenese besprechen wir einige alternative Vorschläge dazu. In den letzten Jahren habe ich öfters nach Beispielen von Menschen gesucht, die in natürlichen Kontexten Zeigegesten zum Großteil ohne Sprache gebrauchen. Diese kommen in Situationen vor, in denen Sprache aus dem einen oder anderen Grund unpraktisch oder ungeeignet ist. Einige dieser Gesten sind ganz einfach, während andere an kleine Seifenopern erinnern, in deren Hintergrund ganze Romane stehen. Jede Geste kann in Begriffen der referentiellen Intention (»die Aufmerksamkeit auf etwas richten«) und der sozialen Intention kommentiert werden. Einige Beispiele dafür sind folgende: Beispiel 1: Ein Mann in einer Bar will noch etwas trinken; er wartet, bis der Barkeeper ihn anschaut, und zeigt dann auf sein leeres Schnapsglas. Soll heißen: Richte deine Aufmerksamkeit auf das leere Glas; fülle es bitte mit Schnaps.

7 Kita 2003. 74

Beispiel 2: Wir klettern ein steiles Flußufer empor. Ich bin schon oben, und die Person, die mir folgt, reicht mir ein Buch hoch, um ihre Hände zum Klettern frei zu haben, und zeigt auf das hervorstehende Ende eines Füllers. Soll heißen: Richte deine Aufmerksamkeit auf die Empfindlichkeit des Füllers; bitte sei vorsichtig und laß ihn nicht herausfallen. Beispiel 3: Menschen in einer Warteschlange: Die Warteschlange hat sich vorwärts bewegt, aber ein Mann hat das nicht bemerkt, weil er sich umgedreht hat, um mit der Person hinter ihm zu sprechen. Jemand von noch weiter hinten weist ihn auf die eben entstandene Lücke hin. Soll heißen: Richte deine Aufmerksamkeit auf den leeren Raum; bitte bewege dich nach vorne. Beispiel 4: Ein bekannter Profisportler steht am Flughafen in einer Warteschlange. In einiger Entfernung weist ein Mann seinen Begleiter auf ihn hin, indem er auf den Sportler zeigt. Soll heißen: Richte deine Aufmerksamkeit auf Charles Barkley; ist doch toll, daß wir ihn sehen, nicht wahr? Beispiel 5: Ich stehe im hinteren Teil des Flugzeugs, in der Nähe der Toilette, um mich ein bißchen auszustrecken. Eine Frau nähert sich, und als sie mich sieht, zeigt sie mit fragendem Blick auf die Toilettentür. Soll heißen: Richte deine Aufmerksamkeit auf die Toilette; wartest du, daß sie frei wird? Wichtig an diesen ziemlich alltäglichen Beobachtungen sind einfach die Verschiedenheit und die Komplexität der Weisen, wie Zeigegesten in die verschiedenen Lebensformen integriert werden können, in denen wir im Alltag agieren. In allen diesen Beobachtungen kommt es zu einer Aufspaltung zwischen der referentiellen und der sozialen Intention, inso75

fern der Kommunizierende versucht, die Aufmerksamkeit des Empfängers aus einem bestimmten Grund auf etwas zu lenken, während der Empfänger versucht, dieser Lenkung der Aufmerksamkeit zu folgen und den Grund für sie zu erschließen, wobei manchmal eine große inferentielle »Distanz« zu überbrücken ist. Indem meine Freundin auf einen Füller in einem Notizbuch zeigt, soll ich beispielsweise erschließen, daß sie will, daß ich dafür sorge, daß er heil bleibt; indem jemand auf eine Stelle auf dem Boden zeigt, wird von dem Empfänger erwartet zu wissen, daß er dazu aufgefordert wird, sich zu dieser Stelle hinzubewegen; indem die Frau auf die Flugzeugtoilette zeigt, soll ich sagen, ob ich davor warte. Jede dieser Zeigegesten hängt von allen möglichen Arten von Hintergrundwissen ab, um sinnvoll zu sein (wie ich weiter unten argumentieren werde, muß dieses Wissen ein geteiltes und gemeinsames Hintergrundwissen sein). Damit ich zum Beispiel die soziale Intention der Frau verstehe, die sich nach der Toilette erkundigt - was mir natürlich sofort klar war - , ist eine große Menge gemeinsamen begrifflichen Hintergrunds im Hinblick auf Flugzeuge, Flugzeugtoiletten, die Biologie des Menschen, Abfallentsorgung, Schlangestehen, Höflichkeitskonventionen usw. zwischen uns erforderlich. Selbst das sehr einfache erste Beispiel funktioniert nur, weil wir alle wissen, daß Menschen an der Bar stehen, weil sie etwas trinken wollen, daß ein leeres Glas keine Möglichkeit zum Trinken bietet, daß der Barkeeper Getränke ausschenkt, wenn der Gast zahlen kann, daß ein Schnapsglas gewöhnlich Schnaps enthält und nicht Bier oder Wein usw. Man könnte meinen, nur jemand, der schon über eine Sprache verfügt, könne eine Zeigegeste verwenden, um auf so komplexe Weisen zu kommunizieren - daß die Fähigkeit, mit einer einfachen Zeigegeste so differenziert zu kommunizieren, irgendwie von sprachlichen Fertigkeiten abhängt. Wie wir jedoch im nächsten Kapitel sehen werden, können 76

Kleinkinder schon Zeigegesten verwenden, um andere auf die verschiedensten Bezugsgegenstände hinzuweisen, um dadurch alle möglichen Arten komplexer sozialer Intentionen zu kommunizieren - und dies, bevor sie in großem Umfang oder überhaupt über eine Sprache verfügen.

3.1.2 Ikonische Gesten (Gebärdenspiel) Der zweite Typ menschlicher Gesten, der für vollständige Kommunikationsakte genutzt wird, sind ikonische Gesten oder Pantomimen (darstellende, bildhafte, beschreibende, repräsentierende und symbolische Gesten sind andere Begriffe, die verwendet werden). In der einen oder anderen Form sind ikonische Gesten vermutlich auch kulturell universal. Eine ikonische Geste gebraucht der Kommunizierende, indem er eine Handlung mit seinen Händen und/oder seinem Körper vollzieht (oder einen Bezugsgegenstand auch statisch darstellt) und damit beabsichtigt, den Empfänger zu veranlassen, sich einen entsprechenden, ihm nicht gegenwärtigen Bezugsgegenstand (oder einen nicht gegenwärtigen Aspekt einer gegenwärtigen Bezugssituation) vorzustellen, zum Beispiel eine Handlung, von der der Kommunizierende will, daß der Empfänger sie vollzieht, oder einen Gegenstand, von dem er will, daß der Empfänger ihn holt. Mit anderen Worten: Der Gestikulierende symbolisiert die referentielle Situation für den Empfänger. Auch in diesem Fall muß zusätzliche kognitive Arbeit geleistet werden, nachdem der Bezugsgegenstand identifiziert wurde, damit die soziale Intention erschlossen werden kann. Da ikonische Gesten normalerweise Simulationen von Handlungen sind, die gegenwärtig nicht vollzogen werden (bzw. von Gegenständen oder Beziehungen, die nicht gegenwärtig sind), hängen sie in einer anderen Weise als Zeige77

gesten von Fertigkeiten ab, die eine bestimmte Art der Imitation, Simulation oder Symbolisierung beinhalten; das erklärt zu einem großen Teil, warum Affen diese Gesten nicht verwenden. Die anscheinend am meisten verbreiteten Verwendungen ikonischer Gesten sind (1) anzuzeigen, daß dies die Handlung ist, die der andere vollziehen soll oder die ich selbst zu vollziehen beabsichtige, oder über die ich den anderen informieren will, und (2) das Erbitten eines Gegenstands oder der Hinweis auf einen Gegenstand, der »dies macht« oder »mit dem man dies macht«. Diese Verwendungen werden natürlich in einer nahezu unendlichen Vielfalt von Zusammenhängen realisiert. Die folgenden Beispiele aus der Alltagsbeobachtung sind wieder mit einem Kommentar versehen, so daß die referentiellen und sozialen Intentionen klar voneinander unterschieden werden: Beispiel 6: Ich bin in einem Käseladen in Italien und verlange »parmigiano«. Der Inhaber fragt mich etwas, das ich nicht verstehe. Ich rate also, und da ich das geeignete Wort nicht kenne, reibe ich meine Finger aneinander, so als ob ich geriebenen Käse auf meine Nudeln streuen würde. Soll heißen: Stell dir vor, womit ich dies tue, und gib mir etwas davon. Beispiel 7: Ich bin im vorderen Teil des Hörsaals und mache mich bereit, eine Vorlesung zu halten. Eine Freundin im Auditorium spielt an ihrem Hemdknopf herum und runzelt mir gegenüber die Stirn. Als ich nach unten schaue, stelle ich fest, daß mein eigener Knopf nicht zugeknöpft ist. Soll heißen: Stell dir vor, wie du einen Knopf auf diese Weise zuknöpfst; tu das an deinem Hemd selbst. Beispiel 8: Der Sicherheitsbeamte am Flughafen bewegt seine Hand im Kreis, um mir zu sagen, daß ich mich umdrehen soll, damit er meinen Rücken scannen kann. Soll heißen: Stell 78

dir vor, daß dein Körper diese Bewegung macht; mache diese Bewegung. Beispiel 9: An einem Gemüsestand kommt die Besitzerin einige Meter entfernt und mit halb zugewandtem Rücken der Bitte eines Kunden nach, Kartoffeln in eine Tüte zu füllen. Sie hält mit fragendem Blick inne, um nonverbal die Frage zu stellen »Ist das genug?« Der Kunde macht mit seiner Hand eine Schaufelbewegung wie die, die sie gerade gemacht hat. Soll heißen: Stell dir vor, diese Handlung zu tun (die du gerade getan hast): tu sie (das heißt »mach weiter«). Beispiel 10: Auf einer lauten Baustelle führt ein Arbeiter gegenüber einem anderen, der zehn Meter entfernt ist, eine Pantomime auf, als ob er eine Kettensäge benutzen würde. Soll heißen: Stell dir vor, daß ich dies tue; bring mir den Gegenstand, den ich dazu brauche. Beispiel 11: Im Fernsehen läuft ein Fußballspiel. Ein Schuß aufs Tor verfehlt nur knapp das Netz. Die Fernsehkamera richtet sich auf den Trainer. Er stellt seinen Daumen und Zeigefinger so, daß sie etwa fünf Zentimeter voneinander entfernt sind, und wendet sich seinem Assistenten zu. Soll heißen: Stell dir einen kleinen Abstand wie diesen vor; »er hat ihn nur um so viel verfehlt.« Das grundsätzliche Verhalten besteht hier darin, eine Handlung darzustellen oder, wie im letzten Beispiel, ein räumliches Verhältnis, das gegenwärtig nicht wahrgenommen wird, um den Empfänger zu veranlassen, sich eine entsprechende wirkliche Handlung oder Beziehung vorzustellen (und somit in manchen Fällen auch einen entsprechenden Gegenstand), was ihm - auf der Grundlage eines bestimmten gemeinsamen begrifflichen Hintergrunds - gestatten sollte, die soziale 79

Intention zu erschließen. So weist meine Streugeste im Käseladen daraufhin, was ich mit dem gewünschten Gegenstand tun werde, und das Verstehen des Inhabers beruht auf einem gemeinsamen Wissen darüber, was man mit geriebenem Käse tun kann. Es ist wichtig festzuhalten, daß das Verstehen ikonischer Gesten grundlegend von einem Verstehen der kommunikativen Intention hinter der Geste abhängt: Erkennt er meine kommunikative Intention nicht, wird der Inhaber meine Streubewegung als eine seltsam deplazierte instrumenteile Handlung auffassen anstatt als eine Handlung, die den Zweck hat, ihn über etwas zu informieren.8 Da ikonische Gesten fast immer auf Abwesendes abzielen (und auch Handlungen einschließen, die von anwesenden Dingen vollzogen werden könnten oder sollten), funktionieren sie etwas anders als Zeigegesten - in diesem Fall unterscheiden sie sich durch das, was »in« der Geste symbolisch enthalten ist und erschlossen werden muß. Beispielsweise könnte ein Gast an einer Bar, der kein leeres Glas vor sich hat, dem Barkeeper ikonisch zu verstehen geben, daß er etwas trinken will, indem er eine Handbewegung des Einschenkens oder des Trinkens macht, das heißt, indem er entweder den einleitenden oder den abschließenden, konsumierenden Akt des Trinkens simuliert. Im Gegensatz dazu dient das Zeigen auf das wahrnehmbare vorhandene Glas (wie in Beispiel 1) dazu, auf seine Leere hinzuweisen und drückt den Wunsch aus, es möge gefüllt werden, was dann den Barkeeper dazu veranlassen wird, die erwünschte Handlung zu vollziehen. Meines Wissens gibt es keine systematische Forschung zu der Frage, auf welche Aspekte einer Situation durch verschiedene Arten von Gesten bei verschiedenen Gelegenheiten hingewiesen wird, in denen die Verwendung von Sprache unprak8 Siehe das Argument von Leslie 1987, dem zufolge es nötig ist, vorgespiegelte Tätigkeiten von wirklichen Tätigkeiten zu »isolieren«. 80

tisch ist; ebensowenig zu der Frage, wann eine Person eine Zeigegeste anstelle einer ikonischen Geste wählen würde. Es scheint plausibel zu sein, daß Menschen als erste Option auf wahrnehmbare, gegenwärtige Dinge zeigen, wenn das machbar und es wahrscheinlich ist, daß es für den Kommunikationszweck hinreicht; nur wenn - aus welchem Grund auch immer - Zeigegesten unpraktisch sind (etwa wenn die intendierte referentielle Situation gegenwärtig nicht wahrgenommen werden kann), verwenden Menschen ikonische Gesten. Erneut könnte man annehmen, nur jemand, der schon über eine Sprache verfügt, könne ikonische Gesten verwenden, um auf solche komplexe Weisen zu kommunizieren. Dagegen spricht erneut, daß Kleinkinder - wie schon beim Zeigen - mit komplexen Verwendungen ikonischer und/oder konventionalisierter Gesten noch vor dem Spracherwerb beginnen - obwohl sie es bei weitem nicht in demselben Maße tun wie beim Zeigen (siehe Kapitel 4). Außerdem erfinden gehörlose Kinder, die mit keiner konventionellen stimmlichen oder Zeichensprache in Berührung gekommen sind, ikonische Gesten, um schon früh in ihrer Entwicklung auf äußerst reichhaltige und komplexe Weisen zu kommunizieren.9 Ikonische Gesten sind also nicht von einer Sprache abhängig. Es ist wichtig, nochmals zu betonen, daß die beteiligte referentielle Intention sich auch auf einen Gegenstand beziehen kann, obwohl ikonische Gesten zum größten Teil zur Simulation von Handlungen eingesetzt werden: »der Gegenstand, der dies macht« oder »der Gegenstand, mit dem man dies macht« (analog zu einem Relativsatz in einer Sprache), wie in Beispiel 10, in dem der Arbeiter nach der Kettensäge verlangt, indem er die Art und Weise ihrer Benutzung pantomimisch darstellt. Es ist also nicht so, daß sich das Zeigen nur auf Ge9 Goldin-Meadow 2003b, siehe auch Kapitel 6. 81

genstände bezieht und ikonische Gesten nur auf Handlungen. Wir werden daher in den beiden nächsten Kapiteln nicht postulieren, daß in der Entwicklung und Evolution der Sprache das Zeigen der Vorläufer von Substantiven und ikonische Gesten die Vorläufer von Verben sind; vielmehr werden wir Zeigegesten mit Demonstrativa und anderen deiktischen Ausdrücken verknüpfen (die für räumliches Hinweisen verwendet werden), während wir ikonische Gesten mit inhaltlichen sprachlichen Konventionen verknüpfen werden, und zwar sowohl mit Substantiven als auch mit Verben.

3.1.3 Zusammenfassung Diese Akte des Zeigens und des Gebärdenspiels gingen nicht aus einem zwischen den Interagierenden zuvor ausgebildeten, sprachlichen oder sonstigen Code hervor, und unsere Frage lautet deshalb: Wie können sie auf so mannigfaltige Weisen kommunizieren? Wie können wir die große Verschiedenartigkeit und Komplexität der beteiligten kommunikativen Funktionen erklären, die sogar die Bezugnahme auf verschiedene Perspektiven gegenüber Dingen und gegenüber Abwesendem einschließen? Wie überbrückt der Empfänger die großen inferentiellen Distanzen vom bezeichneten Referenten zur sozialen Intention des Kommunizierenden? Die Antwort auf diese Fragen besteht in einer ganzen Reihe komplexer Prozesse, für deren Erläuterung wir einige Zeit brauchen und die letztlich ein Bestandteil dessen sind, was wir das Kooperationsmodell der menschlichen Kommunikation nennen können. Um die vollständige Antwort geben zu können, müssen wir tatsächlich die daran beteiligten ontogenetischen und phylogenetischen Prozesse erklären (was in den folgenden beiden Kapiteln geschieht). Vorerst können wir allerdings schon die Hauptelemente dieses Modells skizzie82

ren, damit wir den Endpunkt jenes Pfades deutlich vor Augen haben, den die Menschen durchschreiten mußten, um von Affengesten zum menschlichen Zeigen und Gebärdenspiel überzugehen.

3.2 Das Kooperationsmodell Die finale Erklärung dafür, was Menschen dazu befähigt, miteinander auf so komplexe Weisen durch so einfache Gesten zu kommunizieren, lautet, daß sie miteinander auf einzigartige Weise sozial interagieren. Etwas konkreter: Menschen kooperieren miteinander auf eine Weise, die wir von keiner anderen Spezies kennen, wobei diese Kooperation Prozesse geteilter Intentionalität beinhaltet. Einer Reihe von Handlungstheoretikern zufolge bezieht sich Intentionalität auf Verhaltensphänomene, die sowohl intentional als auch irreduzibel sozial sind, und zwar in dem Sinne, daß der Akteur der Intentionen und Handlungen das Pluralsubjekt »wir« ist. So analysiert beispielsweise Margaret Gilbert äußerst einfache gemeinschaftliche Tätigkeiten wie das gemeinsame Spazierengehen - im Unterschied dazu, daß man parallel zu einer unbekannten Person eine Straße entlanggeht - und kommt zu dem Schluß, daß der Akteur der sozialen Tätigkeit ein »wir« ist.10 Der Unterschied wird in dem Moment deutlich, wenn eine der beiden Personen einfach ohne Ankündigung in eine andere Richtung abbiegt. Wenn wir einfach nur zufällig parallel gehen, hat diese Abweichung keine Bedeutung; aber wenn wir zusammen gehen, ist mein Abbiegen eine Art von Verstoß, und der andere kann mich dafür zurechtweisen (da wir eine gemeinsame Verpflichtung eingegangen sind, zusammen spazierenzugehen, und daher 10 Gilbert 1989. 83

nun bestimmte soziale Normen gelten). In einem größeren Maßstab können wir sogar Phänomene in den Blick bekommen, bei denen »wir« gemeinsam Dinge so intendieren, daß sie neue Qualitäten annehmen - und etwa Papierstücke zu Geld werden oder gewöhnliche Leute sich innerhalb eines institutionellen Rahmens in Präsidenten verwandeln.11 Weil Menschen, so die These, in der Lage sind, miteinander durch Akte geteilter Intentionalität zu interagieren, nehmen ihre sozialen Interaktionen neue Qualitäten an - das gilt für alle ihre Interaktionen vom gemeinsamen Spazierengehen bis hin zur gemeinsamen Beteiligung an der Funktionsänderung, die aus »normalen« Menschen institutionelle, offizielle Personen macht. Die elementare psychologische Grundlage der Fähigkeit, mit anderen an Akten geteilter Intentionalität mitzuwirken, auch der Fähigkeit, mit ihnen auf typisch menschliche Weise zu kommunizieren, besteht darin, mit anderen auf typisch menschliche Weise zu kooperieren. Searle beschreibt das folgendermaßen: [Geteilte] Intentionalität setzt eine stillschweigende Auffassung des anderen als Kandidat für kooperatives Handeln voraus [...], [was] eine notwendige Bedingung für jedes Kollektiwerhalten und somit für jede Unterhaltung darstellt.12

Für unsere gegenwärtigen Zwecke können wir dieses Verständnis anderer als kooperative Akteure folgendermaßen aufgliedern: Es bedarf (1) der kognitiven Fertigkeiten zur Erzeugung gemeinsamer Intentionen und Aufmerksamkeit (und anderer Formen eines gemeinsamen begrifflichen Hintergrunds) mit anderen; und (2) sozialer Motivationen, anderen zu helfen und Dinge mit anderen zu teilen (und gegen1 1 Searle 1995/199 7. 12 Searle 1990, S. 414-415. 84

seitige Erwartungen hinsichtlich dieser kooperativen Motive zu bilden).

3.2.1 Kognitive Fertigkeiten: Die Erzeugung eines gemeinsamen Hintergrunds In allen bisher erwähnten Beispielen für Zeigegesten und Gebärdenspiel gibt es eine Person, die einfach die Aufmerksamkeit oder Vorstellungskraft einer anderen Person auf einen Bezugsgegenstand lenkt. Der Empfänger schaut daraufhin auf den bezeichneten Gegenstand oder stellt ihn sich vor und erkennt hieraus, was der Kommunizierende zu kommunizieren versucht - das kann alles sein von »Warten Sie vor der Toilette?« bis »Ich hätte meinen Käse gern in geriebener Form«. Wie machen wir das? Woher stammt die kommunikative Komplexität, wenn sie nicht »in« den ausgestreckten oder aneinander geriebenen Fingern steckt? Die Antwort lautet natürlich: aus dem »Kontext«. Aber damit kommen wir nicht besonders weit. So agieren Menschenaffen häufig in komplexen sozialen Kontexten, ohne den Anschein zu erwecken, daß sie auf so vielgestaltige Weisen miteinander kommunizieren. Eine mögliche Lösung wäre, daß erwachsene Menschen sich komplexere Kontexte vorstellen können als Menschenaffen. Im nächsten Kapitel werden wir jedoch anhand entsprechender empirischer Belege sehen, daß selbst vorsprachliche Kleinkinder auf viel komplexere Weisen durch Gesten kommunizieren als Affen, obwohl ihre begrifflichen Fertigkeiten vielleicht nicht viel größer sind. Statt dessen liegt nach der hier vertretenen Ansicht ein großer Teil der Erklärung für die einzigartig komplexen Weisen der gestischen Kommunikation beim Menschen darin, daß »Kontext« für Menschen etwas ganz Besonderes bedeutet. Der Kommunikationskontext erschöpft sich für uns nicht einfach 85

in dem, was zur unmittelbaren Umgebung gehört, von der Raumtemperatur bis zu den Geräuschen von Vögeln im Hintergrund; der Kommunikationskontext ist vielmehr das, was für die soziale Interaktion relevant ist, das heißt, was jeder Beteiligte als relevant einschätzt und wovon er weiß, daß der andere es ebenfalls als relevant betrachtet - und weiß, daß der andere das auch weiß usw. usw., potentiell ad infinitum. Diese Art von geteiltem, intersubjektivem Kontext können wir Clark zufolge den gemeinsamen Hintergrund oder manchmal auch (wenn wir den geteilten Wahrnehmungskontext hervorheben wollen) den gemeinsamen Aufmerksamkeitsrahmen nennen.13 Der gemeinsame Hintergrund beinhaltet alles, was wir beide wissen (und wissen, daß wir es beide wissen usw.), angefangen bei den Gegebenheiten der Welt über die Art und Weise, wie rationale Menschen in bestimmten Situationen handeln, bis hin zu den Dingen, die Menschen typischerweise auffällig und interessant finden.14 Ein gemeinsamer Hintergrund ist für den Empfänger sowohl notwendig, um zu bestimmen, worauf der Kommunizierende die Aufmerksamkeit lenkt (seine referentielle Intention), als auch dafür, warum er es tut (seine soziale Intention). So kann der Barkeeper in dem relativ einfachen ersten Beispiel angesichts der obenerwähnten Zeigegeste (ein Gast zeigt auf sein leeres Schnapsglas, um noch etwas Nachschub zu verlangen) ohne eine bestimmte Art von gemeinsamem Hintergrund nicht wissen, ob der Kunde auf das ganze Glas oder seine Farbe oder einen kleinen Sprung im Glas zeigt. Tatsächlich zeigt der Gast im vorliegenden Beispiel nicht auf das Glas selbst, sondern auf seine Leere (stellen Sie sich den Unterschied vor, wenn das Glas, auf das gezeigt wird, schon voll wäre - das vom Gast Gemeinte müßte dann etwas ganz 13 Clark 1996. 14 Levinson 1995. 86

anderes sein). Und selbst wenn der Bezugsgegenstand genau derselbe ist, kann die soziale Intention abhängig vom gemeinsamen Hintergrund variieren. Für gewöhnlich zeigt der Gast auf sein leeres Schnapsglas, um zu verlangen, daß es mit Schnaps gefüllt werde - was der Barkeeper versteht, weil sie beide wissen, daß Menschen, wie oben bemerkt, an der Bar stehen, weil sie trinken wollen, man aus einem leeren Glas nicht trinken kann, der Barkeeper etwas zum Trinken hat, wenn der Gast zahlen kann usw. Wenn jedoch der Gast und der Barkeeper sich in Wirklichkeit von regelmäßigen Treffen der Anonymen Alkoholiker her kennen, könnte der Kunde in diesem Fall auf die Leere seines Schnapsglases zeigen, um seinen Bekannten darauf hinzuweisen, daß er es nach einer ganzen Stunde an der Bar immer noch schafft, seinem Verlangen, etwas zu trinken, zu widerstehen. Der springende Punkt des gemeinsamen Hintergrunds ist, daß er es den Menschen ermöglicht, über ihre eigene egozentrische Perspektive auf die Welt hinauszugehen. Nehmen wir beispielsweise in Abwandlung eines Beispiels von Sperber und Wilson an, ich zeige in einem Park auf eine einige Meter entfernte Stelle, um Ihre Aufmerksamkeit darauf zu lenken.15 Dort befinden sich drei Leute: ein Eisverkäufer, ein Jogger, den Sie noch nie zuvor gesehen haben, und William, Ihr Liebhaber. Wenn Sie egozentrisch eingestellt sind, nehmen Sie an, daß ich Ihre Aufmerksamkeit auf William lenke, da er für Sie von großer Bedeutung ist, während die beiden anderen für Sie keine Bedeutung haben. Im Normalfall ist Ihre Suche nach Bedeutsamkeit jedoch nicht egozentrisch, sondern findet von vornherein innerhalb des Kontextes unseres geteilten, gemeinsamen Hintergrunds statt und berücksichtigt etwa von Anfang an, ob wir beide gemeinsam wissen, daß wir beide William kennen. Nehmen wir nun an, daß ich William nicht 15 Sperber und Wilson 1986. 87

kenne und Sie sich dessen sicher sind (er ist Ihr geheimer Liebhaber). Nehmen wir weiter an, daß sowohl Sie als auch ich wissen, daß wir beide eine Leidenschaft für Eiscreme haben (wir haben ausdrücklich darüber geredet). Wenn ich nun Ihre Aufmerksamkeit in die Richtung derselben drei Leute lenke, werden Sie, gleichgültig, wie wichtig William für Sie in der egozentrischen Perspektive ist, und auch dann, wenn Sie mich bezüglich der Eiscreme belogen haben, dennoch annehmen, ich weise Sie auf den Eisverkäufer hin, weil wir beide aus unserem vorherigen Gespräch »wissen«, daß wir beide Eiscreme mögen, und weil Sie denken, daß ich nichts über Sie und William weiß. In direkter Konkurrenz übertrumpft der geteilte gemeinsame Hintergrund stets die individuelle persönliche Bedeutsamkeit.16 Natürlich können Sie vermuten, daß ich doch irgendwie von William weiß, und auf der Grundlage dieser Annahme fortfahren. Aber im Grunde raten Sie dann hinsichtlich der Art des gemeinsamen Hintergrunds, der den Schlußprozeß autorisieren würde. Für gewöhnlich wollen Sie von Anfang an wissen, warum ich glaube, daß es für Sie von Bedeutung sein wird, wenn Sie in diese Richtung schauen, wobei vorausgesetzt ist, daß wir ein gemeinsames Wissen über den potentiellen Bezugspunkt und seine Bedeutsamkeit für Sie haben. Daher wird Ihnen das, was Bestandteil unseres gemeinsamen 16 Wenn wir wirklich etwas Verdrehtes annehmen wollen, können wir uns in Anlehnung an Clark und Marshall 1981 eine Situation vorstellen, in der ich, ohne Ihre Kenntnis, herausgefunden habe, daß William Ihr geheimer Liebhaber ist. Dann wissen wir beide, daß er von größter Bedeutung für Sie ist. Da Sie aber nicht wissen, daß ich das weiß, werden Sie nicht annehmen, daß ich auf ihn Bezug nehme. Diese Rekursion kann unendlich weitergehen, wobei eine erfolgreiche Bezugnahme bei jeder endlichen Anzahl von Iterationen nicht möglich ist. Es ist notwendig, daß wir beide gemeinsam wissen, daß es ein Teil unseres gemeinsamen Hintergrunds ist, daß William besondere Bedeutung für Sie hat. 88

Hintergrunds ist, am ehesten, sozusagen zuerst als Interpretation meiner Zeigegeste in den Sinn kommen (obwohl Sie auch Ihre eigenen persönlichen Interessen haben mögen). Eine weitere Variation sind Fälle, in denen wir zwar keinen direkten persönlichen, gemeinsamen Hintergrund haben, aber als Mitglieder einer bestimmten Kultur oder sozialen Gruppe Annahmen darüber machen, was der andere wissen sollte (und von dem er wissen sollte, daß ich es weiß usw.). So könnte ich Ihnen gegenüber aus dem Flugzeugfenster auf etwas Sehenswertes zeigen, obwohl wir uns nie zuvor begegnet sind, da ich annehme, daß Sie den Bezugsgegenstand aufgrund (vermutlich) geteilter Annahmen darüber, was Menschen typischerweise auffällig, schön usw. finden, identifizieren können. In diesen beiden Fällen - beim Raten und bei einem allgemeinen kulturellen, gemeinsamen Hintergrund ist jedoch zu beachten, daß der Empfänger versucht, den Kommunikationsakt zu verstehen, indem er sich wirklich eine bestimmte Form von gemeinsamem Hintergrund vorstellt oder annimmt, den er mit dem Kommunizierenden teilen muß, wenn die ganze Sache einen Sinn haben soll. Der Normalfall - mit dem kleine Kinder anfangen und den Erwachsene ohne Zögern verarbeiten - ist also der Fall, bei dem wir beide unseren gemeinsamen Hintergrund anerkennen, vor dem der Kommunikationsakt unmittelbar verständlich wird. Hieraus resultiert der Vorschlag einer Art von Typologie des gemeinsamen Hintergrunds, die auf drei Unterscheidungen beruht.17 Die erste betrifft die Frage, ob sich der gemeinsame Hintergrund auf unsere unmittelbare Wahrnehmungsumgebung stützt, was ich gemeinsame Aufmerksamkeit nennen werde (und was Clark (1996) gemeinsame Wahrnehmungsgegenwart nennt), oder ob er sich auf gemeinsame Erfahrungen in der Vergangenheit stützt. Zwei17 Siehe die leicht abweichende Typologie bei Clark 1996. 89

tens können wir auch zwischen einem gemeinsamen Hintergrund unterscheiden, der von Top-down-Prozessen erzeugt wird - wir verfolgen zum Beispiel ein gemeinsames Ziel und wissen daher gemeinsam, daß wir uns auf bestimmte Dinge konzentrieren, die für unser Ziel relevant sind - , und einem gemeinsamen Hintergrund, der von Bottom-up-Prozessen erzeugt wird - wir hören zum Beispiel ein lautes Geräusch und wissen gemeinsam, daß wir es gehört haben. Später werde ich dafür argumentieren, daß ein geteilter Hintergrund, der von Top-down-Prozessen in einer allen Beteiligten unmittelbar gegenwärtigen Wahrnehmungsumwelt erzeugt wird - insbesondere wenn die gemeinsame Aufmerksamkeit auf gemeinschaftliche Tätigkeiten gerichtet ist - , in gewissem Sinne primär ist, insofern er einen besonders hervorstechenden und stabilen gemeinsamen Hintergrund darstellt. Drittens schließlich kann sich der gemeinsame Hintergrund auf solche verallgemeinerten Dinge wie gemeinsames kulturelles Wissen stützen, das wir nie ausdrücklich anerkennen und das oft von kulturellen Markern verschiedener Art bezeichnet wird; oder er kann sich auf Dinge stützen, die offen anerkannt werden, etwa wenn wir einander beim Herannahen eines bekannten Freundes wissend anschauen. Ein ausdrücklich anerkannter gemeinsamer Hintergrund kann auch in manchen Kommunikationssituationen oder für Novizen, zum Beispiel Kinder, besonders prägnant und wichtig sein. Es ist wichtig zu sehen, daß die Beziehung zwischen dem beobachtbaren Kommunikationsakt und dem gemeinsamen Hintergrund - gleichgültig welchen Typs - für alle Arten von menschlicher Kommunikation, einschließlich der Sprache, eine komplementäre ist. Das heißt: Je mehr zwischen dem Kommunizierenden und dem Empfänger als geteilt vorausgesetzt werden kann, um so weniger muß offen ausgedrückt werden. Wenn ein hinreichend großer gemeinsamer Hintergrund geteilt wird, kann der offene Ausdruck des Motivs 90

oder des Referenten sogar völlig eliminiert werden, ohne daß dadurch die Botschaft geschmälert wird. Beispielsweise kann eine Zahnärztin in ihrer Zahnarztpraxis manchmal auf das Instrument zeigen, das sie haben möchte, ohne ihren eigentlichen Wunsch gegenüber der Assistentin zum Ausdruck zu bringen, da ihr Wunsch, das Instrument gereicht zu bekommen, in diesem wechselseitig bekannten Kontext wechselseitig vorausgesetzt wird (vgl. Wittgensteins Bauarbeiter). Umgekehrt könnte die Zahnärztin einfach ihre Hand ausstrecken und daraufhinweisen, daß sie ein Instrument haben will, und die Assistentin gibt ihr, gestützt auf ein geteiltes Wissen über die gegenwärtige Behandlung, das richtige (von den vielen, die auf dem Tisch liegen) in die Hand, ohne daß der intendierte Bezugsgegenstand je besonders bezeichnet wurde. Ein Beispiel, bei dem der Bezugsgegenstand, gestützt auf einen geteilten gemeinsamen Hintergrund, nicht bezeichnet, sondern vorausgesetzt wird, ist folgendes: Beispiel 12: In einem Flugzeug nehme ich am Mittelgang Platz. In meiner Reihe sitzt eine Frau am Fenster. Ein Mann setzt sich in die Reihe hinter uns und redet extrem laut und unausstehlich. Ich schaue die Frau an, rolle meine Augen und bringe eine Einstellung zum Ausdruck, die sich am besten folgendermaßen charakterisieren läßt: »Oh Gott, das wird eine lange Reise werden.« Ich brauchte ihr gegenüber den Referenten meiner Verzweiflung nicht anzugeben; er war uns beiden klar. Hätte der Mann sehr leise Platz genommen und wollte ich daraufhin meine Nachbarin auf ihn hinweisen, müßte ich ihn ihr gegenüber irgendwie ausdrücklich bezeichnen, da es dann keine Grundlage für eine gemeinsame Aufmerksamkeit gäbe. Wenn der gemeinsame Hintergrund oder die gemeinsame Aufmerksamkeit stark genug ist, wenn er beispielsweise 91

entweder zur Routine geworden oder gar institutionalisiert ist, ist es interessanterweise ebenfalls leicht, erfolgreich auf einen abwesenden Bezugsgegenstand hinzuweisen. Wenn ich etwa meine Tochter morgens oft daran erinnern muß, ihren Rucksack mitzunehmen, und sie ihn heute vergessen hat, kann ich im entscheidenden Augenblick einfach auf ihren oder meinen Rücken zeigen, und sie wird genau wissen, was ich meine. Ohne diese geteilte Routine könnte dieselbe Zeigegeste nicht auf den abwesenden Rucksack hinweisen. Obwohl ikonische Gesten und Sprache viel mehr referentiellen Inhalt »im« Signal zum Ausdruck bringen als Zeigegesten, hängen sie dennoch auf dieselbe grundsätzliche Weise vom gemeinsamen Hintergrund ab. Wenn etwa der Sicherheitsbeamte am Flughafen mit seiner Hand eine Kreisbewegung macht (Beispiel 8), setzt diese Geste einen wechselseitig bekannten Kontext bezogen auf Sicherheitsmaßnahmen am Flughafen für die angemessene Interpretation voraus, gleichgültig wie anschaulich die Handlung ist. Ohne diesen gemeinsamen Hintergrund - stellen Sie sich ein Kind vor, das zum ersten Mal in einem Flughafen ist - ist nicht klar, was sich in einer solchen Kreisbewegung dreht oder drehen soll. Die Alltagssprache ist natürlich voll von referentiellen Ausdrücken, Pronomen etwa, die im Hinblick auf ihre Interpretation schlechterdings von einem geteilten Kontext abhängen. Also nur weil Menschen in der Lage sind, zusammen mit anderen verschiedene Formen eines gemeinsamen begrifflichen Hintergrunds zu konstruieren, können sehr einfache ikonische und Zeigegesten verwendet werden, um auf komplexe Weisen zu kommunizieren; das geht weit über das hinaus, was Menschenaffen mit ihren Intentionsbewegungen und ihren Gesten der Aufmerksamkeitserheischung kommunizieren können. Wenn der gemeinsame Hintergrund besonders gut bestimmt ist, kann man in vielen Fällen mit einfachen Gesten durchaus so leistungsfähig kommunizieren 92

wie mit der Sprache. Damit grundsätzlich verbunden ist eine bestimmte Art von Perspektivenwechsel, was an den Beispielen, in denen sich der Referent der Zeigegeste mit dem gemeinsamen Hintergrund ändert, deutlich zu sehen ist - wenn etwa auf das Schnapsglas gezeigt wird, um entweder auf den Gegenstand selbst, seine Farbe, seine Leere oder seinen beschädigten Zustand hinzuweisen. Es ist somit möglich, daß diese Art von Referenzwechsel beim Gestikulieren - die erreicht wird, indem man auf verschiedene Weise eine Verbindung mit dem gemeinsamen Hintergrund von Kommunizierendem und Empfänger herstellt - sowohl phylogenetisch als auch ontogenetisch den Weg für perspektivische sprachliche Konventionen ebnet. Obwohl die Bezugnahme auf räumlich und zeitlich abwesende Dinge traditionell als das ausschließliche Aufgabengebiet der Sprache betrachtet wurde - und es gibt keinen Zweifel, daß die Sprache diese Aufgabe bei weitem am produktivsten bewältigt - , können Menschen zudem innerhalb eines entsprechend geteilten Kontextes ikonische oder Zeigegesten verwenden, um die Aufmerksamkeit auf das Nichtvorhandensein erwarteter Dinge (zum Beispiel auf einen fehlenden Rucksack) zu lenken oder gar um auf abwesende Dinge direkt hinzuweisen (zum Beispiel auf die gewünschte Kettensäge in Beispiel 10). Auch dies kann den Weg für die sprachliche Referenz auf abwesende Dinge ebnen. Das bedeutet, daß viele der besonders leistungsstarken Eigenschaften, die man oft der Sprache zuschreibt - einschließlich der Funktion, andere auf bestimmte Sichtweisen von Dingen und auf abwesende Referenten hinzuweisen - , tatsächlich auf elementarere Weise in der kooperativen Kommunikation von Menschen durch sehr einfache Gesten gegenwärtig sind. Das ist möglich aufgrund - und nur aufgrund - verschiedener Typen gemeinsamen begrifflichen Hintergrunds und gemeinsamer Aufmerksamkeit zwischen den Kommunizierenden. 93

3.2.2. Soziale Motivationen: Helfen und Teilen Die andere Seite der Medaille zeigt die ausgeprägt kooperativen sozialen Motivationen, die für Menschen so spezifisch sind. In seiner bahnbrechenden Analyse hob Grice hervor, daß Kommunizierende und Empfänger ganz grundlegend kooperativ interagieren, um die Botschaft zu übermitteln (das heißt, um den Empfänger von der sozialen Intention des Kommunizierenden in Kenntnis zu setzen), worin ihr gemeinsames Ziel besteht.18 Das bedeutet, daß der Kommunizierende sich bemüht, für den Empfänger verständlich zu kommunizieren, der sich seinerseits um ein Verständnis bemüht, indem er offensichtliche Schlüsse zieht, wenn nötig nach Erläuterungen fragt usw.19 Es ist unklar, ob andere Tierarten bei der Kommunikation auf diese Weise zusammenwirken; beispielsweise gibt es keine Belege dafür, daß andere Tiere einander je um eine Erläuterung bitten. Der kooperative Geist, in dem Menschen versuchen, ihre Botschaft zu übermitteln, hat seine eigentliche Grundlage in den einzigartigen kooperativen Motivationen zum Kommunizieren, über die nur unsere Spezies verfügt. Es handelt sich um evolutionär entstandene Motivationen, und daher brauchen wir eine phylogenetische Geschichte darüber, wie sie entstanden sind und die Kommunikation zu strukturieren in der Lage waren. Diese Geschichte, die wir in Kapitel 5 liefern werden, muß uns auch Auskunft darüber geben, wie sowohl der Kommunizierende als auch der Empfänger aus solcherart motivierten Interaktionen Nutzen ziehen. Fürs erste können wir mit der Feststellung beginnen, daß Kommunizierende diese Motive im Kommunikationsakt häufig emotional 18 Grice 1975/1979. 19 Siehe die Beschreibung der Referenz als einer gemeinsamen Tätigkeit bei Clark 1996. 94

offen zum Ausdruck bringen, um den Empfängern zusätzlich zum bezugnehmenden Akt Informationen zu geben, damit sie ihre besondere soziale Intention erschließen können. Ich könnte zum Beispiel Ihnen gegenüber mit einem fordernden oder flehenden Gesichtsausdruck auf einen Füller zeigen, um Sie zu bitten, ihn mir zu holen; oder mit überraschtem oder aufgeregtem Gebaren, um einfach meine Freude darüber mit Ihnen zu teilen, daß mein verlorener Füller wieder da ist; oder mit einem fragenden Ausdruck, um zu fragen, ob es sich um Ihren verlorenen Füller handelt; oder mit einem neutralen Ausdruck, um Sie einfach über die Anwesenheit des Füllers zu informieren. Obwohl es unzählig viele soziale Intentionen gibt, gibt es nur drei grundlegende menschliche Kommunikationsmotive, was durch die Tatsache begründet wird, daß sie in der Ontogenese am frühesten auftreten (siehe Kapitel 4) und daß sie in allgemeinerer Hinsicht plausible evolutionäre Wurzeln in der sozialen Interaktion des Menschen haben (siehe Kapitel 5). Das erste und offensichtlichste menschliche Kommunikationsmotiv ist das des Aufforderns - andere dazu zu bringen, das zu tun, was man von ihnen will - und es ist ein allgemeines Merkmal der intentionalen Kommunikationssignale aller Menschenaffen. Der Unterschied ist, daß Menschen, anstatt dem anderen zu befehlen, was er tun soll, oft etwas Milderes tun, wie zum Beispiel um Hilfe zu bitten (jemanden, der helfen möchte). Das heißt, die Imperative des Menschen können sich, anders als jene von Menschenaffen, von Befehlen über höfliche Bitten bis hin zu Vorschlägen und Hinweisen erstrecken, und zwar ganz grundsätzlich in Abhängigkeit vom Grad der kooperativen Einstellung, die vom Empfänger erwartet werden kann. Wenn Sie sich beispielsweise auf meinem Grundstück befinden, kann ich Ihnen befehlen, es zu verlassen, oder ich kann Sie einfach über meinen Wunsch informieren, daß Sie es verlassen (oder auch, daß es mein 95

Grundstück ist), wenn ich annehme, Sie werden sich bereitwillig fügen. Wir können den ersten Typ individuelle Imperative oder Aufforderungen nennen, da ich Ihnen direkt sage, was Sie tun sollen. Den zweiten Typ können wir kooperative Imperative oder Aufforderungen nennen, da ich Sie einfach über meinen Wunsch informiere und annehme, daß Sie sich entscheiden werden, mir dabei zu helfen, ihn zu erfüllen (das heißt, wenn ich Sie einfach über meinen Wunsch informiere, daß Sie mein Grundstück verlassen sollen, müssen Sie meinen Wunsch ernst nehmen, wenn die Aufforderung funktionieren soll).20 Aller Wahrscheinlichkeit nach sind die an Menschen gerichteten und auf gewünschtes Futter bezogenen Zeigegesten von Schimpansen keine kooperativen Imperative, da der Affe unmittelbar versucht, den Menschen dazu zu bewegen, etwas zu tun, anstatt ihn über seinen Wunsch zu informieren, da er nicht erwartet, daß der Mensch (und noch viel weniger ein anderer Schimpanse) sich darum scheren würde. Aber menschliche Empfänger scheren sich oft um solche Dinge. Aus eigenem Interesse erfüllen sie gerne die Bitten anderer, wenn das für sie nicht zu beschwerlich ist. Da sie das wissen, brauchen kommunizierende Menschen in vielen Situationen nur ihre Wünsche zur Kenntnis zu bringen. Das zweite grundlegende menschliche Kommunikationsmotiv, das anscheinend nur bei unserer Spezies vorkommt, ergibt sich aus der Tatsache, daß Menschen anderen häufig Hilfe anbieten wollen, ohne überhaupt darum gebeten zu werden, insbesondere indem sie andere über etwas infor20 Searle 1969/1994, 1999/2001 und anderen zufolge ist es am natürlichsten, Fragen einfach als Bitten um Information zu klassifizieren (und wieder könnte ich die Information entweder durch Folter oder Drohungen aus Ihnen herausbringen oder ich könnte einfach sagen, daß ich sie haben möchte, oder eine konventionalisierte Frage stellen). Man beachte ebenfalls: Einen Gegenstand zu erbitten heißt in Wirklichkeit, jemanden aufzufordern, diesen Gegenstand zu holen. 96

mieren, auch wenn sie selbst kein persönliches Interesse an dieser Information haben. Wenn ich Sie informiere, biete ich Ihnen eigentlich Hilfe an, da ich Sie typischerweise über Dinge informiere, von denen ich vor dem Hintergrund meines Wissens über Ihre Ziele und Interessen glaube, daß Sie (und nicht ich) sie hilfreich oder interessant finden (auch wenn ich auf einer höheren, individuellen Ebene andere eigennützige Motive dafür habe). Die Annahme ist also, daß ich hilfreich bin oder zumindest versuche, hilfreich zu sein, wenn ich auf den Zettel hinweise, den Sie gerade haben fallen lassen, oder Ihnen sage, daß der Chef heute schlechte Laune hat. Wenn wir eine bekannte Formel von Searle ins Soziale übertragen, können wir sagen, daß Aufforderungen eine Du-zu-mirAusrichtung haben, da ich von Ihnen will, daß Sie meinem Wunsch entsprechen, während informative Handlungen eine Ich-zu-Dir-Ausrichtung haben, da ich Ihren Wünschen und Interessen entsprechen will.21 Anderen zu helfen, indem man sie über Dinge informiert, die sie hilfreich und interessant finden werden - und auch Aufforderungen nachzukommen, indem man der auffordernden Person hilft - , beinhaltet offenbar altruistische Motive von einer Art, die eine besondere evolutionäre Erklärung verlangt (siehe Kapitel 5) - auch wenn ich Sie manchmal aus höheren, individuellen Motiven, die alles andere als altruistisch sind, über etwas informieren mag (oder Ihren Aufforderungen nachkomme). Zusätzlich zu diesen beiden elementarsten Motiven müssen wir noch ein drittes Kommunikationsmotiv postulieren, obwohl die Gründe dafür, es als elementares Motiv zu betrachten, erst klarwerden, nachdem wir die Dinge aus der ontogenetischen und phylogenetischen Perspektive betrachtet haben. Häufig wollen Menschen einfach Gefühle und Einstellungen mit anderen teilen. Ich werde das als Ausdrucks- oder 21 Searle 1999/2001. 97

Mitteilungsmotiv bezeichnen. Beispielsweise ist es an einem schönen Tag ganz üblich, zu Ihrem Kollegen im Büro zu sagen »Was für ein schöner Tag heute!« Dieses Verhalten ist nicht von einem imperativen oder informativen Motiv abgeleitet, bei dem es um Hilfe geht, sondern von einem rein sozialen. Diese Art von Kommunikationsakt besteht einfach im Teilen von Einstellungen und Gefühlen, so daß unser gemeinsamer Hintergrund erweitert wird. Dieses Mitteilungsmotiv liegt einem Großteil der Alltagsgespräche von Menschen zugrunde, wenn sie über alles mögliche tratschen und dabei Meinungen und Einstellungen zum Ausdruck bringen, von denen sie hoffen, daß der andere sie bis zu einem gewissen Grad teilen wird. Wie sich herausstellt, zeichnet sich dieses Motiv ontogenetisch sehr früh beim vorsprachlichen Zeigen von Kleinkindern ab, wenn sie beispielsweise gegenüber einem Elternteil auf einen farbenprächtigen Clown zeigen und dabei vor Freude quieken. Obwohl Kleinkinder manchmal auch einfach zeigen mögen, um die Mutter oder den Vater über die Gegenwart des Clowns zu informieren, zeigen sie auch dann häufig und quieken vor Freude, wenn der Erwachsene den Clown schon gesehen hat oder ihn gerade anschaut - weil sie wollen, daß der Erwachsene ihre Begeisterung gleichwohl teilt. Wir werden dieses Motiv in Kapitel 4 über die Ontogenese ausführlicher besprechen, und zwar anhand experimenteller Belege für seine grundlegend soziale Eigenart, und auch in Kapitel 5 über die Phylogenese wird davon die Rede sein. Dort betone ich seine Bedeutung für Individuen, die sich mit einer bestimmten Gemeinschaft Gleichgesinnter identifizieren (unter Ausschluß anderer Gemeinschaften von Menschen, mit denen man nicht tratscht und sich auf dieselbe Weise mitteilt). Wir können also von drei allgemeinen Typen von Kommunikationsmotiven ausgehen, die sich evolutionär entwikkelt haben. Sie werden durch die Art der Wirkung bestimmt, 98

die der Kommunizierende auf den Empfänger auszuüben versucht, und werden hier anhand der Motivationen geteilter Intentionalität des Helfens und Teilens mit anderen charakterisiert: Auffordern: Ich will, daß Sie etwas tun, um mir zu helfen (um Hilfe oder Information bitten); Informieren: Ich will, daß Sie von etwas Kenntnis nehmen, weil ich glaube, daß es Ihnen helfen oder Sie interessieren wird (Hilfe anbieten, einschließlich Information); Teilen: Ich will, daß Sie etwas Bestimmtes fühlen, damit wir Einstellungen/Gefühle miteinander teilen können (Teilen von Emotionen oder Einstellungen). Diese drei elementarsten menschlichen Kommunikationsmotive liegen einer nahezu unendlich großen Zahl einzelner sozialer Intentionen in bestimmten Kontexten zugrunde und werden sowohl in unserer ontogenetischen als auch in der phylogenetischen Darstellung der Entstehung kooperativer Kommunikation beim Menschen eine Schlüsselrolle spielen.22 22 Es gibt hier einige Entsprechungen zu den grundlegenden Sprechaktfunktionen, die von Theoretikern wie Searle 1999/2001 postuliert werden, obwohl die Zuordnung nicht völlig eindeutig ist. Wir sollten auch eine Reihe spezieller Motive für besondere Situationen festhalten, die früh in der Ontogenese auftreten und sehr wahrscheinlich kulturell universal sind: grüßen/sich verabschieden (»Hallo« und »Auf Wiedersehen«), Dankbarkeit ausdrücken (»Danke«) und Bedauern ausdrücken (»Es tut mir leid«). Diese Motive sind deshalb außergewöhnlich, weil sie nicht auf normale Weise referentiell sind und daher etwas anders funktionieren - und sie beziehen sich auf sehr spezifische und sozial bedeutsame Umstände, die für die soziale Evolution des Menschen entscheidend sind (siehe Kapitel 5). 99

3.2.3 Wechselseitige Annahmen der Hilfsbereitschaft und kooperatives Überlegen Die Tatsache, daß Kommunizierende diese Kooperationsmotive und Empfänger die Neigung haben, entsprechend zu reagieren (wenn alles andere konstant bleibt), ist Teil des gemeinsamen Hintergrunds kommunizierender Menschen. Tatsächlich werden sie dadurch überhaupt erst dazu motiviert, beim Übermitteln der Botschaft zu kooperieren - beide nehmen voneinander an, daß dies zu ihrem eigenen und wechselseitigen Nutzen sein wird. Da der Kommunizierende dies weiß, stellt er sicher, daß der Empfänger weiß, daß er einen Kommunikationsversuch macht, so als ob er sagen wollte: »Du wirst das wissen wollen« (das heißt, ich habe eine Bitte an dich, ich will dich über etwas informieren, ich will eine bestimmte Einstellung teilen). Diese zusätzliche Schicht von Intentionalität - »ich will, daß du weißt, daß ich etwas von dir will« - ist für den Prozeß absolut entscheidend und wird gewöhnlich die (Gricesche) kommunikative Absicht genannt. Wie Grice beobachtete, beinhalten Kommunikationsakte von Menschen eine spezifische Absicht bezüglich der Kommunikation selbst.23 Wenn ich etwa Ihnen gegenüber auf einen Baum zeige, will ich nicht nur, daß Sie Ihre Aufmerksamkeit auf den Baum richten (was häufig durch Augenkontakt usw. signalisiert wird sowie ganz oft implizit im Ausdruck des Motivs enthalten ist, und zwar als Zeichen dafür, daß diese Handlung »für dich« getan wird). Diese zusätzliche Schicht von Intentionalität ist nötig, um Sie zu motivieren, die entsprechenden Arten von Relevanz-Schlußfolgerungen zu ziehen, die wiederum erforderlich sind, um sowohl meinen Bezugsgegenstand als auch meine soziale Intention zu iden23 Grice i957/i977100

tifizieren.24 Wenn Sie beispielsweise sehen, wie ich auf einen Baum zeige und die deutliche Absicht habe, Sie wissen zu lassen, daß die Zeigegeste an Sie adressiert, möchten Sie natürlich wissen, warum ich das tue: was ich von Ihnen hinsichtlich des Baums zu tun, denken oder fühlen verlange. Wenn ich in dieser Weise auf den Baum zeige, nehmen Sie an, daß ich glaube, das werde für Sie irgendwie interessant oder relevant sein, vielleicht weil es ihr Lieblingsbaum ist und ich Sie über seine Präsenz an diesem Ort informieren will. Oder vielleicht, weil ich eine Bitte bezüglich des Baumes habe, von der ich glaube, Sie möchten ihr gerne nachkommen, oder vielleicht, weil ich will, daß Sie meine Begeisterung für ihn teilen. Um diesen Punkt vollkommen deutlich zu machen, vergleichen wir Fälle mit einer und ohne eine kommunikative Absicht.25 Nehmen wir also an, wir setzen uns während einer Wanderung auf einen Felsen im Wald und ich lehne mich zurück, weil ich müde bin, wodurch ein großer Baum in Ihrer Blickrichtung freigegeben wird. Es ergeben sich keine Schlußfolgerungen. Aber wenn ich mich zurücklehne und mit einem insistierenden Ausdruck auf den Baum zeige, versuchen Sie natürlich herauszufinden, warum ich das tue. Das heißt, Sie bemerken, daß ich mir einige Mühe gemacht habe, Ihnen den Baum zu zeigen und meine Beharrlichkeit auszudrücken, und das veranlaßt Sie dazu, nach etwas Relevantem zu suchen (typischerweise innerhalb unseres gemeinsamen Hintergrunds): Warum will er meine Aufmerksamkeit auf den Baum lenken? Da ich weiß, daß dieser Vorgang stattfindet, stelle ich sicher, daß Sie wissen, daß ich Ihnen gegenüber absichtlich auf den Baum zeige, damit Sie versuchen, den Grund für meine absichtliche Handlung zu entdecken: was ich von Ihnen zu tun, wissen oder fühlen verlange. Dies gehört natür24 Sperber und Wilson 1986. 25 Vgl. Sperber und Wilson 1986. 101

licherweise zum größten Teil menschlicher Kommunikation dazu, was durch die Tatsache belegt wird, daß in den meisten Situationen eine zusätzliche Anstrengung nötig ist, um diesen Prozeß zu umgehen. Wenn etwa ein Gast etwas mehr Wein in seinem Glas haben möchte, es aber für unhöflich hält, seine Gastgeberin direkt darum zu bitten, könnte er sein leeres Glas an einen auffälligen Ort stellen, so daß sie es sehen und (wie er hofft) auffüllen wird, ohne jedoch zu wissen, daß er das schon eine ganze Zeit im Sinn hatte. Der Gast will, daß die Gastgeberin das leere Glas zur Kenntnis nimmt, aber er will nicht, daß sie weiß, daß er das von ihr will. Solche Fälle von »verborgener Urheberschaft« - oder in manchen Fällen einfach Gleichgültigkeit bezüglich der Frage, ob der Empfänger die jeweilige Urheberschaft bemerkt signalisieren ein besonders tiefes Verständnis der Rolle, die kommunikative Absichten innerhalb des Kommunikationsakts als ganzen spielen. Dieser Prozeß, das ist das Entscheidende, findet deshalb statt, weil beide Beteiligte ein gemeinsames Wissen über und ein gemeinsames Vertrauen in die beteiligten kooperativen Motivationen haben. Prinzipiell wird also der Empfänger helfen wollen, wenn ein kommunizierender Mensch um Hilfe bittet (wenn alles andere konstant ist) - und beide wissen das und vertrauen darauf. Ähnlich sieht es aus, wenn der Kommunizierende eine Information anbietet. In diesem Fall können beide wechselseitig annehmen, daß der Kommunizierende denkt, die Information werde für den Empfänger nützlich oder interessant sein (und das bedeutet normalerweise, daß sie auch »wahr« ist), und deshalb wird sie der Empfänger akzeptieren. Wenn schließlich der Kommunizierende eine Einstellung mit dem Empfänger teilen möchte, unterstellen beide das prosoziale Motiv des Teilens, und der Kommunizierende kann erwarten, daß der Empfänger die Einstellung teilt, wenn keine guten Gründe dagegen sprechen. Der Kommunizie102

rende signalisiert daher offen seine Kommunikationsabsicht, und beide wirken zusammen, um den Erfolg des Kommunikationsaktes sicherzustellen. Es ist wichtig zu sehen, daß der offene Ausdruck der Griceschen kommunikativen Absicht den Kommunikationsakt selbst - die Geste oder die Äußerung - in den gemeinsamen Hintergrund der Beteiligten hineinstellt, und zwar insbesondere in den aktuellen Rahmen gemeinsamer Aufmerksamkeit, innerhalb dessen sie kommunizieren. Die genaueste Formulierung wäre für diesen Sachverhalt daher nicht nur: ich will, daß Sie wissen, daß ich Ihre Aufmerksamkeit auf etwas lenken will, sondern: ich will auch, daß wir dies gemeinsam wissen - ich will, daß mein Kommunikationsakt Teil unserer in der Wahrnehmung gegenwärtigen gemeinsamen Aufmerksamkeit ist (ich will, daß er, um mit Sperber und Wilson zu reden, wechselseitig manifest oder »gänzlich offen« ist). Da kommunizierende Menschen ihre kommunikative Absicht wechselseitig manifest machen, wird diese Absicht hierdurch in einem wichtigen Sinne öffentlich - was wiederum eine ganze Reihe anderer Prozesse auslöst.26 Insbesondere bringt die Tatsache, daß ich offen und öffentlich mit Ihnen kommuniziert habe, in Wirklichkeit nicht nur Kooperationserwartungen, sondern auch echte soziale Normen hervor, deren Verletzung inakzeptabel ist. Dabei geht es erstens um Normen auf der Ebene des Verstehens einer Botschaft: Wenn ich versuche, mit Ihnen zu kommunizieren - indem ich etwa »Hallo Ethel« sage und Sie mich ansehen und dann meine Geste oder Äußerung hervorbringe, können Sie mich nicht einfach ignorieren, als ob ich keinen Kommunikationsversuch gemacht hätte. Wer sich mitunter so verhält, wird Freundschaften zerstören, und wer sich ständig so verhält, wird irgendeine psychiatrische 26 Habermas 1995. 103

Diagnose heraufbeschwören und möglicherweise aus der etablierten Gesellschaft ausgeschlossen werden. Zumindest manchmal muß man selbst versuchen, mit anderen zu kommunizieren, sonst wird die Diagnose auf Katatonie lauten und die Einweisung in die Psychiatrie unmittelbar folgen. Zweitens geht es um Normen auf der Ebene der Einwilligung nach erfolgreichem Verstehen: Wenn ich beim Abendessen eine kleine Bitte äußere, »Reichen Sie mir bitte das Salz« oder dergleichen (entweder sprachlich oder durch eine Geste), können Sie nicht wirklich mit »Nein« antworten - es sei denn, Sie haben eine Entschuldigung dafür, warum Sie unter den gegenwärtigen Umständen meiner Bitte nicht nachkommen können (und da ich das weiß, bin ich verpflichtet, vernünftige Bitten zu äußern). Ähnlich ist es, wenn ich Sie über etwas informiere, das Sie interessant finden werden - »Haben Sie gehört, daß Bob Dylan heute abend in der Stadt ist?«. Sie können dann nicht wirklich mit »Ich glaube Ihnen nicht« antworten, ohne daß Sie auch hier einen guten Grund dafür haben, mich indirekt einen Lügner zu nennen. Wenn ich für meinen Teil etwas herausfinde, von dem wir beide wissen, daß Sie es gerne wissen würden (wir wissen beide, daß Bob Dylan Ihr Lieblingssänger ist, und daher würden Sie natürlich gerne wissen wollen, ob er in der Stadt ist), dann muß ich es Ihnen sagen. Wenn ich das nicht tue und Sie es später herausfinden, wird unsere Freundschaft ernsthaft gefährdet. Und wenn Sie mir gegenüber zum Ausdruck bringen, wie wichtig Religion in Ihrem Leben ist, und ich antworte, daß ich sie für töricht halte, laufe ich Gefahr, unsere Beziehung zu beschädigen, die auf gemeinsamen Einstellungen zur Welt aufgebaut ist. Von der aktiven Seite her betrachtet, müssen wir Menschen also mit anderen kommunizieren, um nicht als pathologisch zu gelten; wir dürfen nur Dinge, die nachvollziehbar sind, erbitten, oder wir werden für unverschämt gehalten; und wir müssen versuchen, andere auf relevante und angemessene 104

Weise zu informieren und Dinge mit ihnen zu teilen, oder wir gelten als soziale Sonderlinge und werden keine Freunde haben. Von der Seite des Verstehens aus gesehen müssen wir uns ebenfalls beteiligen, oder wir werden für pathologisch gehalten; und wir müssen helfen, angebotene Hilfe und Information akzeptieren sowie Gefühle mit anderen teilen, denn andernfalls laufen wir Gefahr, sozial isoliert zu werden. Wie in vielen Bereichen des menschlichen Soziallebens ist es einfach eine Tatsache, daß sich wechselseitige Erwartungen in kontrollierbare soziale Normen und Verpflichtungen wandeln, wenn sie die Bühne der Öffentlichkeit betreten. Die evolutionären Grundlagen dieser normativen Dimension menschlicher Kommunikation in Begriffen öffentlicher Reputation werden in Kapitel 5 weiter erläutert werden. Die hier beteiligten Kooperationsmotive und das wechselseitige Wissen um diese Kooperationsmotive, auch und gerade um Kooperationsnormen, zeigen an, daß die an menschlicher Kommunikation Beteiligten nicht nur praktisch, sondern auch kooperativ schlußfolgern müssen. Wenn beispielsweise Affen einen anderen Affen beobachten, der ihnen etwas signalisiert, versuchen sie durch individuelles praktisches Schließen bezüglich seiner Ziele und Wahrnehmungen herauszufinden, was er will. Sie versuchen aber nicht, die Botschaft zu verstehen, weil er will, daß sie sie verstehen, denn weder die eine noch die andere Seite geht davon aus, daß er versucht, behilflich zu sein. Der Kommunizierende signalisiert oder »gibt« seine Absicht nicht eigens »bekannt«, wie Menschen es beim Signalisieren ihrer kommunikativen Absicht tun. Und wenn sie eine Reaktion auswählen, reagieren Affen als Empfänger nicht deshalb auf eine bestimmte Weise, weil der andere es von ihnen will oder erwartet. Vielmehr versuchen sie einfach das zu tun, was für sie in der Situation am besten ist, und zwar auf der Grundlage dessen, was der Kommunizierende dem Augenschein nach will. Wenn im Gegensatz 105

dazu Menschen sehen, daß jemand versucht, mit ihnen zu kommunizieren, wollen sie wissen, was er zu kommunizieren versucht, zumindest teilweise, weil er das von ihnen will (und sie seinen Kooperationsmotiven vertrauen), und sie wählen eine Reaktion - beispielsweise einer Bitte nachzukommen, angebotene Informationen zu akzeptieren oder die Begeisterung über etwas zu teilen - , zumindest teilweise, weil das der andere von ihnen will. Da Menschen als Empfänger Kommunikationsangebote irgendwie verstehen und darauf reagieren, zumindest teilweise, weil der Kommunizierende das von ihnen will (wobei der Kommunizierende darauf vertraut) - und weil in der Tat diese Verfahrensweise, wenn alles öffentlich geschieht, normativ strukturiert ist - , nennen wir die Art von praktischem Schlußfolgern, die für die menschliche Kommunikation charakteristisch ist, kooperatives Schlußfolgern. Noch eine letzte Bemerkung zur Rekursivität, die bei all diesen Dingen eine Rolle spielt. Erstens erfordert, wie durchgehend bemerkt, die Schaffung eines gemeinsamen Hintergrunds und/oder gemeinsamer Aufmerksamkeit zwischen zwei Personen, daß jede von ihnen Dinge sieht, weiß oder ihre Aufmerksamkeit auf sie lenkt, von denen sie weiß, daß die andere sie ebenfalls sieht, weiß oder ihre Aufmerksamkeit auf sie lenkt - und weiß, daß der andere das von ihr ebenfalls weiß, und rekursiv potentiell immer so weiter bis ins Unendliche. Außerdem ist die Gricesche kommunikative Absicht ganz klar rekursiv - jedenfalls wenn man mehrere Ebenen in Betracht zieht. Der Darstellung von Sperber und Wilson zufolge27 will ich daher in einem deklarativen Sprechakt, daß Sie etwas wissen (zum Beispiel daß Ihr Freund sich nähert), aber meine kommunikative Absicht ist, Sie wissen zu lassen, daß ich dies will. Nach dieser Analyse sind kommunikative Absichten also Intentionen entweder dritter oder vierter Stufe 27 Sperber und Wilson 1986.

106

(je nachdem, wie man zählt): Ich will^ daß Sie wissen2, daß ich will,3 daß Sie wissen4, daß Ihr Freund sich nähert. Schließlich ist die motivationale Struktur menschlicher Kommunikation ebenfalls rekursiv, insofern wir beide gemeinsam wissen, daß wir beide hilfsbereit sind - Sie also von mir erwarten, daß ich von Ihnen erwarte (und so weiter mit weiteren Einbettungen bei Bedarf), daß Sie hilfsbereit sind. Klarerweise ist eine solche Rekursivität für Normen der Kooperation, bei denen jeder von jedem (einschließlich der kommunizierenden Person selbst) erwartet, daß jeder ein kooperativer Kommunikationspartner sein wird, absolut notwendig. Es gibt eine große Kontroverse über den gemeinsamen Hintergrund und verwandte Begriffe wie wechselseitiges Wissen und wechselseitige Offenheit, und zwar gerade wegen ihres rekursiven Charakters. Da Menschen in Echtzeit kommunizieren müssen, können unendlich viele Rechenschritte dieser Art in der wirklichen Praxis nicht vorkommen.28 Natürlich besteht die psychologische Wirklichkeit nicht ausschließlich in diesem Hin und Her zwischen dem Wissen, was die anderen wissen, daß ich weiß usw., sondern wir beide wissen einfach, daß wir etwas gemeinsam sehen, wissen oder unsere Aufmerksamkeit auf es lenken: Wir »teilen« es, und wir haben verschiedene Heuristiken, um einen gemeinsamen Hintergrund mit anderen zu identifizieren. Dennoch können die zugrundeliegenden rekursiven Ebenen zutage treten, wenn es eine Störung gibt, etwa wenn ich glaube, etwas mit jemandem zu teilen, und sich dann herausstellt, daß das nicht der Fall ist. Eine solche Störung kann potentiell auf jeder Iterationsebene auftreten. Wenn ich zum Beispiel »Wie schön!« zu Ihnen sage, dann wird dieser Sprechakt erstens nicht erfolgreich sein, wenn Sie glauben, daß ich einer Sache Beachtung schenke, ich das aber gar nicht tue, zweitens wenn ich glaube, daß 28 Clark und Marshall 1981. 107

Sie glauben, daß ich einer Sache Beachtung schenke, ich das aber gar nicht tue, drittens wenn Sie glauben, daß ich glaube, daß Sie glauben, daß ich einer Sache Beachtung schenke, ich das aber nicht tue usw. Die Tatsache, daß es Störungen auf verschiedenen Ebenen geben kann - und Menschen solche Störungen in jedem von diesen Fällen auf verschiedene Weisen beheben - , belegt die verschiedenen, zumindest implizit vorhandenen Iterationen im Verständnis der Beteiligten. Im großen und ganzen kann man mit all diesen Dingen vernünftig umgehen - jedenfalls werden wir hier so verfahren - , wenn man einfach sagt, daß die rekursive Spirale nicht unendlich, sondern nur unbegrenzt ist; wir berechnen sie so weit wie nötig oder möglich, was typischerweise nur mehrere Ebenen weit nach oben reicht, und sicherlich berechnen wir sie zum größten Teil überhaupt nicht, sondern stellen lediglich anhand einer Heuristik fest, ob wir etwas mit einem Interaktionspartner teilen oder nicht. Möglicherweise nehmen wir auch nur eine »Vogelperspektive« auf die Interaktion ein, was den unbegrenzten Perspektivenwechsel bei Bedarf ermöglicht (siehe die etwas ausführlichere Diskussion verschiedener Alternativen in Kapitel 7). Wir werden diese Fähigkeit - eine absolut entscheidende Fähigkeit, die an vielen Aspekten geteilter Intentionalität beteiligt ist - rekursives Erkennen geistiger Zustände bzw. rekursives Erkennen von Intentionen nennen.

3.2.4 Zusammenfassung Abbildung 3.1 stellt alle die verschiedenen Komponenten des Kooperationsmodells menschlicher Kommunikation sowie einige der Beziehungen zwischen ihnen dar. Wenn wir oben links anfangen und den Pfeilen folgen, sehen wir grob gesagt folgendes: Ich habe als Kommunizierender viele Ziele und 108

Werte, die ich in meinem Leben verfolge: meine individuellen Ziele. Ich habe den festen Eindruck, aus welchem Grund auch immer, daß Sie mich gegenwärtig bei einem oder mehreren dieser Ziele unterstützen können, indem Sie mir helfen oder mein Informationsangebot annehmen (das ich aus persönlichen Gründen machen möchte) oder Einstellungen mit mir teilen: meine soziale Intention. Der beste Weg, Ihre Hilfe zu erhalten oder Ihnen zu helfen oder in dieser Situation mit Ihnen eine bestimmte Einstellung zu teilen, ist der der Kommunikation; daher entscheide ich mich, einen Kommunikationsakt (innerhalb unseres gegenwärtigen gemeinsamen Aufmerksamkeitsrahmens) wechselseitig für uns beide kundzutun; dies ist meine kommunikative Absicht (die möglicherweise durch »Für dich«-Signale wie Augenkontakt oder durch das Ausdrücken eines Motivs markiert wird). Auf der Grundlage meines Signals einer kommunikativen Absicht lenke ich Ihre Aufmerksamkeit auf eine Bezugssituation in der Außenwelt - meine referentielle Intention. Zusammen mit einem Motivationsausdruck soll diese Intention Sie dazu führen, meine soziale Intention durch Prozesse des kooperativen Schlußfolgerns zu erschließen, da Sie natürlicherweise motiviert sind herauszufinden, warum ich mit Ihnen kommunizieren will (gestützt auf wechselseitige Annahmen oder Kooperationsnormen). Sie versuchen also zuerst, meinen Bezugsgegenstand zu identifizieren, und zwar typischerweise innerhalb des Raumes, den unser gemeinsamer Hintergrund absteckt, um von da aus meine zugrundeliegende soziale Intention zu erschließen, typischerweise ebenfalls dadurch, daß Sie sie auf unseren gemeinsamen Hintergrund beziehen. Falls Sie meine soziale Intention verstanden haben, entscheiden Sie dann, ob Sie so wie erwartet kooperieren oder nicht.

109

Abbildung 3.1: Zusammenfassung des Kooperationsmodells menschlicher Kommunikation (K = Kommunizierender; E = Empfänger). 110

Aufgrund dieses grundlegend kooperativen Prozesses unterscheidet sich die menschliche Kommunikation vollkommen von den Kommunikationstätigkeiten aller anderen Arten, die auf unserem Planeten leben. Die kommunikative Leistungsfähigkeit der in diesem Modell zusammengefaßten und zusammenwirkenden Prozesse läßt sich anhand einer berühmten Aussage John Searles erkennen. Die Macht der Sprache gegenüber Gesten betonend, stellt er fest:29 Es gibt allerdings einige sehr einfache Arten illokutionärer Akte, die unabhängig von irgendwelchen Konventionen vollzogen werden können [...]. Unter bestimmten Umständen kann man jemanden »auffordern«, den Raum zu verlassen, ohne daß man sich irgendwelcher Konventionen bedient. Aber man kann, ohne über eine Sprache zu verfügen, zum Beispiel nicht jemanden auffordern, ein Forschungsprojekt über das Problem der Diagnose und Behandlung der Mononukleosis bei Studenten an amerikanischen Universitäten zu übernehmen.

Wir können aber eine solche Aufforderung sehr wohl ohne die Verwendung einer Sprache machen. Das heißt, wenn sprachbegabte Individuen die Tatsache besprochen haben, daß »wir jemanden brauchen, der ein Forschungsprojekt zum Problem der Diagnose und Behandlung von Mononukleose bei Universitätsstudenten vor dem ersten Abschluß in Angriff nimmt«, dann könnte ich zum richtigen Zeitpunkt in unserem Gespräch auf Sie zeigen, und die Bedeutung dieser Zeigegeste wäre, daß »Sie ein Forschungsprojekt zum Problem der Diagnose und Behandlung von Mononukleose bei amerikanischen Universitätsstudenten in Angriff nehmen sollten«. Natürlich kann das nicht geschehen, ohne daß sprachbegabte Wesen den Kontext überhaupt sprachlich aufbauen - soviel ist klar. Die für den gegenwärtigen Zweck zentrale Einsicht lautet allerdings: Eine Zeigegeste kann sich auf beliebig kom29 Searle 1969, S. 38,1983, S. 61-62. 111

plexe Situationen beziehen, wenn der Kontext - der geteilte begriffliche Hintergrund - genügend Details enthält, wie auch immer das erreicht wird.

3.3 Kommunikationskonventionen Wie steht es nun um diejenigen Formen menschlicher Kommunikation, die nicht »natürlich«, sondern »konventionell« sind? Wie steht es um konventionalisierte Gesten (etwa des Grüßens und Abschiednehmens, des Drohens und Beleidigens, des Zustimmens und Widersprechens usw., die in den meisten Kulturen existieren) und außerdem um stimmliche Sprachen und Zeichensprachen? Sind sie »Codes«, mit denen sich die Notwendigkeit dieser ganzen komplizierten psychologischen Infrastruktur umgehen läßt? Funktioniert die sprachliche Kommunikation ganz anders?

3.3.1 Sprachliche Kommunikation und die Infrastruktur geteilter Intentionalität Mit einem Wort: nein. An erster und wichtigster Stelle steht die Tatsache, daß sprachliche und andere Formen konventioneller Kommunikation gleichermaßen wie natürliche Gesten grundlegend vom gemeinsamen Hintergrund und dem gegenwärtigen Rahmen gemeinsamer Aufmerksamkeit zwischen dem Kommunizierenden und dem Empfänger abhängen.30 So enthält die große Mehrheit von Äußerungen des alltäglichen Sprachgebrauchs Pronomina (er; sie (3. Pers. Sg. und PL), es) und andere kontextabhängige Ausdrücke, die einen gemeinsamen Hintergrund für die angemessene Inter30 Clark 1996. 112

pretation erfordern (dieser andere Typ, der Ort, zu dem wir zu gehen pflegten, usw.); selbst die einfachsten bezugnehmenden Ausdrücke wie Bill oder die Katze erfordern einen gemeinsamen Hintergrund, um zu bestimmen, welcher Bill oder welche Katze gemeint ist. Sprachliche Äußerungen hängen somit in grundsätzlich derselben Weise wie natürliche Gesten von einem gemeinsamen begrifflichen Hintergrund ab, und je »solider« der gemeinsame Hintergrund ist, desto weniger Sprache ist notwendig, wie die Kommunikation zwischen Zahnärzten und ihren Assistenten (siehe oben) hinreichend veranschaulicht. Ferner ist auch die kommunikative Absicht sowohl in der gestischen als auch in der sprachlichen Modalität grundsätzlich dieselbe, und die Suche des Empfängers nach etwas Relevantem wird in beiden Fällen ebenfalls von wechselseitigen Annahmen über die Hilfsbereitschaft gesteuert. Wenn ich Ihr Büro betrete und aus heiterem Himmel sage »Nirgendwo auf der Welt ist das Wetter so gut wie auf Kuba«, verstehen Sie selbstverständlich die Äußerung, aber Sie sind sich immer noch nicht im klaren darüber, warum ich glaube, diese Information sei für Sie nützlich oder interessant. Wenn wir jedoch gerade darüber gesprochen haben, wo wir unsere Sommerferien verbringen könnten, ist der Grund für meine Äußerung offensichtlich. Wie beim Zeigen steuert die Annahme, daß ich versuche, Sie über etwas zu informieren, von dem ich glaube, Sie werden es nützlich oder interessant finden, Ihre Suche nach kommunikativer Relevanz. Außerdem sind die allgemeinen Motive des Kommunizierens bei der gestischen und sprachlichen Kommunikation ebenfalls grundsätzlich dieselben: Auffordern, Informieren und Teilen (obwohl die sprachliche Kommunikation auch einige andere, weniger elementare Motive ermöglicht, wie in der Sprechakttheorie ausgeführt wird). So wie wir es bei natürlichen Gesten tun, arbeiten wir auch bei der sprachlichen Kommunikation 113

zusammen, um einen gemeinsamen Bezug herzustellen und eine Botschaft zu übermitteln.31 Die sprachliche Kommunikation hängt somit prinzipiell von genau derselben Infrastuktur geteilter Intentionalität ab, die wir herangezogen haben, um die frappierende Leistungsfähigkeit der Kommunikation durch Zeigegesten und Gebärdenspiel zu erklären. Der einzige wesentliche Unterschied, der zwischen natürlichen Gesten und Kommunikationskonventionen im gegenwärtigen Zusammenhang besteht, betrifft die referentielle Intention: das, was »in« das Signal gelegt wird, um die Aufmerksamkeit zu lenken. Aber selbst hier können auf einer sehr allgemeinen Ebene beide Fälle in gleicher Weise beschrieben werden. So kann sowohl bei der gestischen als auch bei der sprachlichen Kommunikation die Referenz aufgespalten werden, und zwar in den alten, vorgegebenen, gemeinsamen Teil - das Thema, das häufig vorausgesetzt oder nur kurz angezeigt wird - und in den neuen, berichtenswerten Teil - den Fokus, der typischerweise weiter entfaltet wird, weil er weniger geteilt wird. Wenn Sie und ich zusammen auf eine Wolke schauen (als Thema), kann ich, wenn sich die Form der Wolke verändert, entweder auf sie zeigen oder einen verbalen Kommentar abgeben, um den neuen Aspekt hervorzuheben. Nichtsdestotrotz ist unstrittig, daß sich mit sprachlichen Konventionen aufweisen, die einzigartig leistungsfähig sind, ein Bezug herstellen läßt, der weit über das hinausgeht, was bei natürlichen Gesten möglich ist. Das liegt hauptsächlich an der »Arbitrarität« der Kommunikationsmittel einer Sprache: Wir können ein Mittel schaffen, um im Prinzip jeden Aspekt der Erfahrung anzuzeigen, den wir begrifflich fassen können - solange wir beide wissen, daß wir diese Konvention gemeinsam verwenden.

31 Clark 1996. 114

3.3.2. Konventionen als geteilte Kommunikationsmittel Menschen schaffen Kommunikationskonventionen, indem jeder dasselbe Mittel zur Koordination von Aufmerksamkeit und Handeln verwendet, wobei andere Formen ebenfalls möglich wären, solange jeder sich nach ihnen richten würde.32 Diese »arbiträren« Konventionen sind also nur dann möglich, wenn alle Individuen über beträchtliche Fertigkeiten des kulturellen Lernens in Form von Imitationslernen verfügen, das auf intentionale Handlungen ausgerichtet ist und von einer Art ist, die für das Hervorbringen natürlicher Gesten nicht gebraucht wird.33 Für Kommunikationskonventionen wird insbesondere die sogenannte Imitation durch Rollentausch benötigt, bei der ein Individuum versteht, wie ein Kommunizierender ein bestimmtes Kommunikationsmittel ihm gegenüber verwendet und dann diese Verwendung bei seiner eigenen Kommunikation mit anderen entsprechend reproduziert.34 Dadurch wird das geschaffen, was de Saussure die Bidirektionalität des Zeichens35 nennt: Die tatsächliche Form des Kommunikationsmittels ist konventionell oder wird zwischen den Benutzern geteilt, insofern sie alle wissen, daß sie alle wissen, wie diese Mittel bei spezifischen Kommunikationszwecken zu verstehen und hervorzubringen sind. Bemerkenswerterweise hängt dieses Teilen von sprachlichen und gestischen Konventionen wiederum von einer Art von Rekursivität ab - wir wissen alle, daß wir alle die Konvention kennen - , in diesem Fall auf der Ebene des Kommunikationsvehikels oder -mittels selbst.36 Sprachliche Konventionen kodifizieren also im Grunde 32 33 34 35 36

Lewis 1969. Tomasello 1999/2002. Tomasello 1999/2002. De Saussure 1916/1959/2001. Lewis 1969/1975. 115

die Formen, die sich aus den Praktiken früherer Individuen der Gemeinschaft herauskristallisiert haben, als es darum ging, die Aufmerksamkeit und die Vorstellungskraft anderer auf bestimmte Art und Weise zu manipulieren. Der arbiträre Laut oder die arbiträre Geste an sich transportieren zwar keine Botschaft »auf natürliche Weise«, aber ihre Verwendung zu beobachten offenbart jenen, die über die geeigneten kognitiven Fertigkeiten und Motivationen verfügen, wie diejenigen, die die Konvention teilen, sie zur Lenkung der Aufmerksamkeit und Vorstellungskraft anderer einsetzen. Die geeigneten kognitiven Fertigkeiten und Motivationen sind natürlich keine anderen als erstens dieselbe Infrastruktur geteilter Intentionalität, die dem menschlichen Zeigen und Gebärdenspiel zugrunde liegt, und zweitens eine auf die Konvention bezogene gemeinsame Lerngeschichte, so daß wir alle (implizit) gemeinsam wissen, daß wir dieses Wissen teilen - eine Tatsache, die von diversen Arten kultureller Marker angezeigt werden kann (unter anderem gerade von der angemessenen Verwendung der Konvention selbst). Daß Menschen geteilte Kommunikationskonventionen schaffen und gebrauchen, bedeutet also, daß jetzt sogar die Kommunikationsformen selbst von Prozessen geteilter Intentionalität abhängen. Zu diesem Thema gibt es noch viel mehr zu sagen, und so werden wir es in den Kapiteln 4, 5 und 6 wiederaufnehmen. Dort werden wir ontogenetische und phylogenetische Erklärungen dafür liefern, wie menschliche Kommunikationskonventionen (und sogar grammatikalische Konstruktionen) aus natürlichen Gesten entstanden sein könnten. Insbesondere werde ich in Kapitel 5 dafür argumentieren, daß es aus evolutionärer Perspektive unmöglich gewesen wäre, von den Vokalisierungen und Gesten von Affen direkt zu arbiträren sprachlichen Konventionen zu springen, ohne ein dazwischenliegendes Stadium nichtkonventioneller, handlungsbasierter, von Natur aus bedeutungsvoller kooperativer Gesten 116

zu durchlaufen, das als eine Art natürlicher Verankerung dienen konnte. Mit Blick auf die Individualentwicklung werde ich in Kapitel 4 dafür argumentieren, daß der Spracherwerb erst dann möglich ist, wenn Kleinkinder über etwas verfügen, das der Infrastruktur vollkommen geteilter Intentionalität gleicht, die sich während der Evolution des Menschen als Grundlage für natürliche Gesten entwickelt hat.

3.3.3 Zusammenfassung Tabelle 3.1 faßt diejenigen Aspekte der psychologischen Infrastruktur menschlicher Kommunikation (sowohl der natürlichen als auch der konventionellen) zusammen, bei denen nach bisheriger Darstellung geteilte Intentionalität eine wichtige Rolle spielt. Die drei auf der linken Seite bezeichneten Dimensionen sind (a) Kommunikationsmotive; (b) die zugrundeliegende Intentionalität in Form des Verstehens von Intentionen, des Verstehens von Aufmerksamkeit und des praktischen Schlußfolgerns; und (c) die Art des Kommunikationsmittels. In der ersten Spalte (1) wird angegeben, was in jeder dieser drei Dimensionen für Menschenaffen gilt: Sie verlangen Dinge, indem sie ritualisierte Signale benutzen, des weiteren verstehen sie Intentionen und Wahrnehmungen und ziehen daraus praktische Schlüsse. In der zweiten Spalte (2) sind die beiden neuen Komponenten der menschlichen Kommunikation dargestellt, die hier im Mittelpunkt standen: die neuen Motive des Helfens und Teilens sowie die neue Fähigkeit, Handlungen nachzuahmen (und zwar auf viel geschicktere Weise, als Affen es tun, einschließlich der Fähigkeit, die Rollen zu tauschen), wodurch sowohl ikonische Gesten als letztendlich auch Kommunikationskonventionen ermöglicht werden. Die dritte Spalte (3) stellt die Art und Weise dar, wie rekursives 117

Tabelle 3.1 Die psychologische Infrastruktur menschlicher kooperativer Kommunikation: 1. In der ersten Spalte stehen die Dinge, die schon bei Affen vorkommen, 2. die zweite Spalte zeigt die neuen Komponenten, die beim Menschen hinzutreten, und 3. in der dritten Spalte ist dargestellt, wie die menschliche Version durch Rekursivität umgewandelt wird.

(1) Intentionale Kommunikation

(2) Erste Anzeichen von kooperativer Kommunikation

(a) Kommunikationsmotive

Auffordern

helfen; teilen

(b) Intentionalität in der Kommunikation

Ziele verstehen

• geteilte Ziele und kommunikative Absichten

Wahrnehmung verstehen

• gemeinsame Aufmerksamkeit und gemeinsamer Hintergrund

praktisches Schlußfolgern

• kooperatives Schlußfolgern

(c) Kommunikationsmittel

ritualisierte Signale

Imitation

(3) Rekursivität => vollständig kooperative Kommunikation • Kooperationsnormen

• Kommunikationskonventionen

Erkennen von Intentionen alles verändert: Aus Helfen und Teilen werden wechselseitige Erwartungen oder gar Kooperationsnormen; aus dem Verstehen von Zielen und Absichten werden gemeinsame Ziele und Gricesche kommunikative Absichten; aus dem Verstehen der Aufmerksamkeit wird eine gemeinsame Aufmerksamkeit und ein gemeinsamer Hintergrund; praktisches Überlegen wird zu kooperativem Überlegen, und imitierte Signale werden zu bidirektionalen, geteilten Konventionen. Wie wir bald sehen werden, vollzieht sich diese der Rekursivität geschuldete Transformation in der Ontogenese anders als in der Phylogenese.

3.4 Schlußfolgerung Es war mein Ziel in diesem Kapitel, die verborgene psychologische Infrastruktur menschlicher Kommunikation durch eine Betrachtung der natürlichen Gesten des Menschen und ihrer Funktionsweise offenzulegen. Gerade das Zeigen ist als vollständiger Kommunikationsakt so vollkommen einfach - ein ausgestreckter Finger - , daß es die Frage aufwirft, wie es auf so vielgestaltige Weise kommunizieren kann. Im richtigen Kontext kann eine Zeigegeste so reich kommunizieren wie die Sprache. Sie kann sogar die Aufmerksamkeit des Empfängers auf Perspektiven gegenüber Dingen und auf abwesende Gegenstände lenken, Fähigkeiten, die man oft ausschließlich der Sprache zuschreibt. Ikonische Gesten werden dazu verwendet, in spezifischerer Weise auf Gegenstände Bezug zu nehmen, besonders auf abwesende Gegenstände, und können ebenfalls zur Vermittlung hochkomplexer Botschaften verwendet werden. Diese beiden Typen natürlicher Gesten werden von allen Menschen benutzt - und nur von Menschen. Der »Mehrwert« von Zeigegesten und Gebärdenspiel er119

gibt sich auf die eine oder andere Weise aus der Infrastruktur geteilter Intentionalität. Daher nennen wir unser Modell das Kooperationsmodell menschlicher Kommunikation. Dieses Modell enthält folgende fünf Komponenten: (1) Kommunizierende und Empfänger erzeugen die gemeinsame Absicht, erfolgreich zu kommunizieren, und stellen sich je nach Bedarf aufeinander ein; (2) menschliche Kommunikationsakte sind in der gemeinsamen Aufmerksamkeit und in einem gemeinsamen Verständnis der gegenwärtigen Situation verankert; (3) menschliche Kommunikationsakte werden aus grundlegend prosozialen Motiven vollzogen, wie zum Beispiel andere auf nützliche Weise zu informieren und mit ihnen Gefühle und Einstellungen ungehindert zu teilen; (4) kommunizierende Menschen operieren bei allen diesen Dingen mit geteilten Erwartungen (und sogar mit Normen) bezüglich der Kooperation zwischen den Beteiligten; und (5) sprachliche Konventionen als krönende Spitze menschlicher Kommunikation werden grundsätzlich in dem Sinne geteilt, daß wir beide gemeinsam wissen, daß wir eine Konvention auf dieselbe Weise verwenden. Andere Primaten strukturieren ihre Kommunikation nicht auf dieselbe Weise durch gemeinsame Absichten, gemeinsame Aufmerksamkeit, wechselseitig vorausgesetzte Kooperationsmotive und Kommunikationskonventionen. Vielmehr versuchen sie schlicht, die individuellen Ziele, Wahrnehmungen und Handlungen anderer vorherzusagen oder zu manipulieren. Wie wir als nächstes sehen werden, beginnen bereits Kleinkinder ihre gestische Kommunikation kooperativ zu strukturieren, noch bevor sie mit dem Sprechen anfangen, und sie tun das in ihrer Entwicklung gleichzeitig mit dem Entstehen ihrer allgemeineren Fertigkeiten geteilter Intentionalität, die sich in anderen gemeinschaftlichen Tätigkeiten manifestieren. 120

4 Ontogenetische Ursprünge

Nicht die Farbe Rot tritt an Stelle des Wortes »rot«, sondern die Gebärde, die auf einen roten Gegenstand hinweist, oder das rote Täfelchen. Ludwig Wittgenstein, The Big Typescript

Die Komponenten komplexer Fähigkeiten zu identifizieren und zu sehen, wie sie zusammenwirken, ist oft am einfachsten, wenn wir ihre Entstehung in der frühen Entwicklung von Kindern untersuchen. Eine wichtige Belegquelle für das Kooperationsmodell menschlicher Kommunikation ist daher die ontogenetische Entwicklung. Außerdem sind Gesten, die (ohne Sprache) als vollständige Kommunikationsakte verwendet werden, viel intensiver an Säuglingen und kleinen Kindern (besonders in Studien) als an Erwachsenen erforscht worden. Es gibt Studien mit Kleinkindern, die für mehrere Schlüsselkomponenten unseres Modells des Kommunikationsprozesses unmittelbar relevant sind. Darüber hinaus können einige uns sogar dabei helfen, schwierige theoretische Fragen zu entscheiden, etwa bezüglich der Rolle der gemeinsamen Aufmerksamkeit und des gemeinsamen Hintergrunds. Die Ontogenese ist aber nicht nur deshalb von Interesse, weil wir an ihr unser Modell und seine verschiedenen Komponenten testen können; darüber hinaus wollen wir in diesem Kapitel drei spezifische Fragen stellen, die für die drei in Kapitel 1 vorgetragenen allgemeinen Hypothesen relevant sind. Die erste bezieht sich darauf, ob die vorsprachliche gestische Kommunikation von Kleinkindern Züge aufweist, die der vollständigen Struktur der kooperativen Kommunikation von Erwachsenen gleichen, welche im vorangehenden Kapitel skizziert wurde. Wenn das der Fall ist, würde das zeigen, daß 121

die kooperative Kommunikation des Menschen nicht direkt von einer Sprache abhängt (eine Tatsache, die wir nicht durch die Beobachtung von normal funktionierenden Erwachsenen allein feststellen können), und es würde die evolutionäre Hypothese plausibler machen, der zufolge sich die kooperative Kommunikation des Menschen zuerst im gestischen Modus entwickelt hat. Die zweite Frage ist, ob die Entstehung kooperativer Kommunikation in der menschlichen Ontogenese irgendwie mit dem Entstehen umfassenderer Fertigkeiten und Motivationen geteilter Intentionalität verbunden ist, die sich in anderen sozialen und kulturellen Tätigkeiten manifestiert, zum Beispiel in gemeinschaftlichen sozialen Interaktionen. Wenn dem so wäre, würde das die Analyse des vorangehenden Kapitels unterstützen, wonach menschenähnliche Fertigkeiten kooperativer Kommunikation in einem allgemeineren Sinn durch eine Infrastruktur sozio-kognitiver und sozio-motivationaler Fertigkeiten geteilter Intentionalität ermöglicht werden. Plausibilisiert würde dadurch auch die evolutionäre Hypothese, der zufolge menschliche kooperative Kommunikation sich als Teil einer umfangreicheren Anpassung zugunsten gemeinschaftlicher Tätigkeiten und generell eines Kulturlebens entwickelt hat. Die dritte Frage betrifft speziell die Sprache und dabei vornehmlich die Frage, wie wir uns den Übergang von vorsprachlicher gestischer Kommunikation zu sprachlicher Kommunikation in der Ontogenese des Menschen vorzustellen haben. Insbesondere würden wir gerne wissen, ob der frühe Erwerb und Gebrauch sprachlicher Konventionen von derselben Infrastruktur geteilter Intentionalität abhängt wie die frühe gestische Kommunikation von Kleinkindern. Würde sich das bewahrheiten, würde es die Vorstellung stützen, daß der Erwerb sprachlicher Konventionen entscheidend von sozio-kognitiven Fertigkeiten und Motivationen 122

abhängt, die bei der frühen gestischen Kommunikation eingesetzt werden. Interessant zu wissen wäre zudem, ob die beiden verschiedenen Typen von Gesten bei Kindern - Zeigen und ikonische Gesten - auf unterschiedliche Weise mit der frühen Sprache interagieren, da uns das Hinweise auf den evolutionären Übergang von eher natürlichen zu eher konventionalisierten Formen menschlicher Kommunikation geben könnte.

4.1 Zeigegesten bei Kleinkindern In den Monaten um ihren ersten Geburtstag herum, noch bevor sie ernsthaft mit dem Spracherwerb beginnen, fangen die meisten Kleinkinder in der westlichen Kultur an, Zeigegesten zu verwenden, wobei es einige Belege dafür gibt, daß es sich hier um ein über die Kulturgrenzen hinweg weitverbreitetes, wenn nicht gar universales Muster handelt.1 Unsere zentrale Frage bezieht sich zunächst darauf, bis zu welchem Grad und auf welche Weise die Zeigegesten von Kleinkindern sämtliche sozio-kognitiven Komplexitäten der Erwachsenenversion dieser Kommunikationsgeste, wie sie oben herausgearbeitet wurden, teilen. Ebenfalls von Interesse sind ikonische Gesten von Kleinkindern. Das Problem ist, daß es relativ wenige insbesondere experimentelle Untersuchungen zu der Frage gibt, wie Kleinkinder ikonische Gesten in der frühen Entwicklung erwerben und verwenden. Wir werden daher - und zwar ausdrücklich im Hinblick auf seine verschiedenen Komponenten - das Kooperationsmodell anhand der Zeigegesten von Kleinkindern untersuchen, da es auf diesem Gebiet viele relevante Forschungsarbeiten gibt. Später werde ich über die wenigen Befunde berichten, die es darüber gibt, wie Klein1 Butterworth 2003. 123

kinder ikonische Gesten erwerben und verwenden, nämlich vor allem bei der Untersuchung des Übergangs zur sprachlichen Kommunikation.

4.1.1 Zeigegesten von Kleinkindern im Kontext Klassischen Darstellungen zufolge verwenden Kleinkinder Zeigegesten zum Zweck der Kommunikation aus einem von zwei Motiven: Sie zeigen, um Dinge zu verlangen (imperative Gesten) und um Erfahrungen und Gefühle mit anderen zu teilen (deklarative Gesten), wobei es keinen Altersunterschied beim ersten Auftreten dieser beiden Typen gibt.2 Überraschenderweise weiß niemand, woher das Zeigen ontogenetisch stammt. Insbesondere weiß man nicht, ob Kleinkinder es im Ausgang von einem anderen Verhalten ritualisieren oder ob sie es von anderen durch Imitation lernen. In Anbetracht dessen, daß viele Affen irgendwie dazu in der Lage sind, Dinge von Menschen durch »Zeigegesten« zu fordern (und zwar ziemlich sicher nicht durch Imitation), und eine bestimmte Art von Zeigegesten sehr wahrscheinlich in allen menschlichen Gesellschaften verbreitet ist, lautet die plausibelste Hypothese derzeit, daß Kleinkinder ihre Zeigegesten nicht durch die Imitation anderer erwerben, sondern irgendwie auf natürliche Weise zum Zeigen gelangen - vielleicht durch eine nichtsoziale Orientierungshandlung, die in der Interaktion mit anderen sozialisiert wird. Hierüber gibt es jedoch keine einschlägigen Untersuchungen, und es könnte sein, daß sogar die vollsozialisierte Version kein Lernen erfordert. Möglich ist auch, daß die Imitation später eine Rolle spielt, wenn das Kind die Entsprechung seiner eigenen Zei2 Bates, Camaioni und Volterra 1975, Carpenter, Nageil und Tomasello 1998. 124

gegeste und der von anderen bemerkt, obwohl anfangs kein Lernen stattfindet. Wir wissen es einfach nicht. Die gegenwärtigen theoretischen Debatten über Zeigegesten und vorsprachliche Kommunikation von Kleinkindern kreisen um die Frage, ob die angemessenste Interpretation eine kognitiv reichhaltige oder abgespeckte ist. Insbesondere stellt sich die Frage, ob Säuglinge und sehr junge Kleinkinder mit ihrer vorsprachlichen Kommunikation versuchen, die intentionalen/geistigen Zustände anderer zu beeinflussen,3 oder ob sie einfach nur darauf abzielen, bestimmte Verhaltenseffekte bei anderen zu erreichen.4 Damit verbunden ist die Frage, ob Kleinkinder bei ihrer vorsprachlichen Kommunikation versuchen, andere auf hilfreiche Weise über etwas zu informieren und Erfahrungen emotional mit ihnen zu teilen, anstatt wieder nur zu versuchen, andere dazu zu bringen, diejenigen Dinge zu tun, die sie von ihnen wollen. Ich werde für die kognitiv reichhaltige und motivational altruistische Interpretation argumentieren und Belege dafür vorstellen. Es gibt überraschend wenige systematische Untersuchungen zu den Zeigegesten von Kindern im Alltagsleben. Die existierenden Studien bezogen sich in erster Linie auf die Sprachentwicklung der Kinder und haben daher das Zeigen und andere Gesten aus dieser Perspektive betrachtet5 - unter Vernachlässigung anderer interessanter und wichtiger Aspekte des Prozesses. Carpenter et al. ließen Eltern Tagebucheinträge zu den Zeigegesten von acht Kleinkindern im Kontext ihrer alltäglichen sozialen Interaktionen aufzeichnen.6 Es 3 Golinkoff 1986, Liszkowski 2005, Tomasello, Carpenter und Liszkowski 2007. 4 Shatz und O'Reilly 1990, Moore 1996, Moore und D'Entremont 2001. 5 Vgl. zum Beispiel Bates 1979. 6 Carpenter et al., in Vorbereitung. 125

folgen einige ziemlich interessante und aufschlußreiche Beispiele, die die Kinder größtenteils hervorbrachten, bevor sie im üblichen Sinn über eine Sprache verfügten (bis auf wenige Wörter wie nein und da in einigen Fällen): Beispiel 13: Im Alter von 1 1 Monaten zeigt J auf das geschlossene Fenster, wenn er will, daß es geöffnet wird. Soll heißen: Richte die Aufmerksamkeit auf das Fenster; öffne es. Beispiel 14: Im Alter von 11V2 Monaten zeigt J auf die Tür, wenn sein Vater sich bereitmacht, das Haus zu verlassen. Soll heißen: Richte die Aufmerksamkeit auf die Tür; bald wird Vater aus ihr hinausgehen. Beispiel 15: Im Alter von 11V2 Monaten zeigt J, einige Minuten nachdem die Mutter Wasser in Js Glas auf dem Essenstisch gegossen hat, auf sein Glas, um zu verlangen, daß sie ihm noch etwas mehr einschenken soll. Soll heißen: Richte die Aufmerksamkeit auf mein Glas; füll' es auf. Beispiel 16: Im Alter von 12 Monaten zeigt A vom Innern des Hauses durch ein Fenster in die Richtung des Geräuschs eines Flugzeugs (das nicht zu sehen ist). Soll heißen: Richte deine Aufmerksamkeit auf das (Geräusch des) Flugzeug(s); ist das nicht toll? Beispiel 17: Im Alter von 13 Monaten sieht J zu, wie Vater den Weihnachtsbaum aufstellt; als Großvater ins Zimmer kommt, zeigt J ihm gegenüber auf den Baum und vokalisiert. Soll heißen: Richte die Aufmerksamkeit auf den Weihnachtsbaum; ist er nicht großartig? Beispiel 18: Im Alter von 15V2 Monaten zeigt L nach dem Essen auf das Badezimmer in Antizipation des Händewaschens. 126

Soll heißen: Richte die Aufmerksamkeit auf das Badezimmer; es ist Zeit, dorthin zu gehen. Beispiel 19: Wahrend die Mutter nach einem verschwundenen Kühlschrankmagnet sucht, zeigt L im Alter von 13V2 Monaten auf einen Früchtekorb, in dem sich der Magnet (versteckt unter den Früchten) befindet. Soll heißen: Richte die Aufmerksamkeit auf den Früchtekorb; dort ist er. Beispiel 20: Im Alter von 14 Monaten passiert zwei Kindern, J und L, ein Unfall, während ein Elternteil nicht zusieht; als der Elternteil kommt, um nachzusehen, zeigt das Kleinkind auf den Gegenstand, der für den Unfall verantwortlich war (das heißt auf das Ding, an dem es seinen Kopf angestoßen hat, oder auf das Ding, das heruntergefallen ist). Soll heißen: Richte die Aufmerksamkeit auf diesen Gegenstand; er hat mich verletzt/fiel herunter. Beispiel 21: Als die Mutter den Kinderstuhl zum Tisch bringt, zeigt L im Alter von 14V2 Monaten auf die Stelle, wo der Stuhl hingehört. Soll heißen: Richte die Aufmerksamkeit auf diesen Ort; steir ihn da hin. Der zentrale Punkt an diesen Beobachtungen ist, daß das, was hier geschieht, dem sehr ähnlich ist, was bei Zeigegesten von Erwachsenen geschieht, obwohl die Einzelheiten stark variieren. (Man beachte insbesondere Js Zeigegeste auf das Glas, um zu verlangen, daß es aufgefüllt werden soll; das sieht genauso aus wie in unserer Barszene mit einem Erwachsenen in Beispiel 1 aus dem vorangegangenen Kapitel). Wie in den Beispielen mit Erwachsenen in Kapitel 3 gibt es auch hier eine große Vielfalt unterschiedlicher zugrundeliegender sozialer Intentionen. So zeigten diese Kleinkinder in den Situationen, die mit Aufforderungen zu tun haben, nicht nur auf 127

Gegenstände, die sie haben wollten - die klassische imperative Zeigegeste - , sondern auch auf einen beteiligten Gegenstand, wenn sie den Erwachsenen dazu bringen wollten, eine Handlung mit diesem auszuführen, etwa auf das zu öffnende Fenster oder auf das zu füllende Glas. Außerdem zeigten sie auf eine Stelle am Tisch, wenn sie wollten, daß die Mutter den Kinderstuhl dorthin stellen sollte. Das sind alles deutliche Aufforderungen, aber keine davon hat mit dem Erlangen von Gegenständen wie bei den klassischen Protoimperativen zu tun, und das Zeigen selbst weist manchmal auf den beteiligten Gegenstand (das Fenster) hin und setzt die auszuführende Handlung (das Öffnen) stillschweigend voraus; manchmal weist es aber auch auf einen Ort hin (den üblichen Platz am Tisch), und setzt sowohl den Gegenstand als auch die Handlung voraus (den Stuhl und das Verschieben des Stuhls). Darüber hinaus vollzogen diese Kleinkinder auch Zeigegesten aus anderen breitgefächerten sozialen Intentionen, die auf Motiven beruhen, welche nichts mit Aufforderungen zu tun haben. Beispielsweise zeigten sie auf die Tür, durch die der Vater gleich hindurchgehen würde, oder auf das Badezimmer, das sie gleich aufsuchen sollten, in die Richtung eines Flugzeuggeräuschs, auf einen Anblick, der für den Großvater (und nicht für das Kleinkind) neu und interessant war, auf den Ort, an dem ein verschwundener Gegenstand zu finden war, sowie auf den Ort, an dem kurz zuvor ein aufregendes Ereignis geschah. Diese Zeigegesten könnten zwar allesamt insofern als deklarative Gesten klassifiziert werden, als die Intention des Kleinkinds darin besteht, die Aufmerksamkeit auf etwas zu lenken oder sie zu teilen. Aber bei den verschiedenen Beobachtungen steuern und teilen die Kleinkinder die Aufmerksamkeit bezogen auf sehr unterschiedliche Aspekte der Zielereignisse - es ist hier alles vertreten, von einem Geräusch über einen Ort, an dem etwas versteckt ist, bis hin zu dem Ort, an dem zuvor etwas geschah - , und sie tun das aus 128

vielfältigen unterschiedlichen Gründen, unter anderem weil sie nicht (mehr) gegenwärtige Ereignisse vorwegnehmen oder sich an sie erinnern. Erneut unterscheiden sich diese Zeigegesten wesentlich von klassischen deklarativen Gesten, die sich typischerweise auf einen aufregenden, neuen, gegenwärtig wahrnehmbaren Gegenstand oder ein solches Ereignis beziehen. Die Bezugnahmen auf abwesende Gegenstände oder Ereignisse (das leere Glas, der verschwundene Kühlschrankmagnet, das gehörte Flugzeug, das vergangene Ereignis) sind vielleicht besonders bemerkenswert, weil sie belegen, daß die Kommunikation nicht nur auf der Wahrnehmungsebene stattfindet, sondern auf der geistigen Ebene kognitiv repräsentierter Entitäten (mehr dazu unten). All dies geschieht zum größten Teil, bevor der Spracherwerb ernsthaft angefangen hat. Trotz der oberflächlichen Ähnlichkeit mit den Beobachtungen von Zeigegesten bei Erwachsenen - auch hier gibt es eine relativ große Entfernung zwischen der sozialen Intention und der referentiellen Intention in einer Vielfalt von Kontexten, möglicherweise gestützt auf einen gemeinsamen Hintergrund - können wir allein durch Beobachtungen alltäglicher Situationen immer noch nicht die Spezifika der sozio-kognitiven Prozesse bestimmen, die an diesen interessanten Kommunikationsakten beteiligt sind. Wir müssen deshalb diese Beobachtungen durch Studien ergänzen, die die diversen involvierten sozio-kognitiven und sozio-motivationalen Prozesse erforschen: direkt durch Untersuchungen von Zeigegesten oder indirekt durch Untersuchungen verwandter Entwicklungsphänomene. Wir sehen uns daher im folgenden hauptsächlich experimentelle Belege an, und zwar für jede der Hauptkomponenten der Zeigehandlung, die im Kooperationsmodell menschlicher Kommunikation erläutert und anhand der frühesten Zeigegesten von Kleinkindern gewonnen wurden. 129

4.1.2 Kommunikationsmotive Die Zeigegesten von Kleinkindern wurden wie gesagt klassischerweise so aufgefaßt, daß sie sich aus zwei Kommunikationsmotiven ableiten: deklarativen und imperativen. Aus unserer Sicht ist die Situation etwas komplexer. Insbesondere glauben wir, daß das deklarative Motiv zwei wichtige Untertypen aufweist und das imperative Motiv tatsächlich als ein Kontinuum beschrieben werden muß, das von so etwas wie Befehlen (Erzwingen) bis zu so etwas wie Empfehlen oder Vorschlagen (eine Wahl beeinflussen) reicht. Um die Kommunikation in die weiteren kognitiven Tätigkeiten des Kleinkinds zu integrieren, halten wir es darüber hinaus für sinnvoll und zweckmäßig, die verschiedenen Motive etwas allgemeiner in Begriffen geteilter Intentionalität zu fassen, insbesondere in Begriffen der Fertigkeiten und Motivationen der Kleinkinder, anderen zu helfen und mit anderen zu teilen. In der ursprünglichen Formulierung von Bates, Camaioni und Volterra wurde das deklarative Zeigen als analog zu einem deklarativen Satz aufgefaßt, wie zum Beispiel »Die Katze ist auf der Matte«.7 Aussagen dieses Typs besitzen Wahrheitswerte, die anzeigen, wie gut sie zum wirklichen Zustand der Welt passen. In vielen nachfolgenden Analysen sieht der Prototyp des deklarativen Zeigens jedoch so aus, daß das Kleinkind beispielsweise auf ein entferntes, interessantes Tier zeigt, Gefühle ausdrückt und seinen Blick zwischen dem Tier und dem Erwachsenen hin und her wandern läßt. Das Kleinkind ist an dem neuen Tier interessiert oder von ihm gefesselt und will anscheinend seine Aufregung mit dem Erwachsenen teilen, indem es ihn dazu bringt, mit ihm gemeinsam das Tier zu betrachten und seine Gefühlsreaktion zu teilen. Das sieht nicht gerade nach einer deklarativen Aussage mit 7 Bates, Camaioni und Volterra 1975. 130

einem Wahrheitswert aus, da das Motiv der Zeigegeste ein ganz anderes zu sein scheint. Aus unserer Sicht sollten wir daher unterscheiden zwischen (1) deklarativen Zeigegesten als expressiven Gesten, mit denen das Kleinkind versucht, eine Einstellung hinsichtlich eines gemeinsamen Bezugsgegenstands mit einem Erwachsenen zu teilen, und (2) deklarativen Zeigegesten als informativen Gesten, mit denen das Kleinkind versucht, den Erwachsenen mit notwendigen oder wünschenswerten Informationen (die dieser gegenwärtig nicht besitzt) über einen Bezugsgegenstand zu versorgen. Experimentelle Untersuchungen haben beides als unabhängiges Motiv bei etwa einjährigen Kindern nachgewiesen. Zunächst lösten Liszkowski und Mitarbeiter Zeigegesten bei 12 Monate alten Kindern in einer Situation aus, in der ein deklaratives Motiv (des expressiven Untertyps) zu erwarten war (neue und interessante Gegenstände, die plötzlich in einiger Entfernung erscheinen, zum Beispiel).8 Dann manipulierten sie experimentell die Reaktion des Erwachsenen, um die Hypothese zu prüfen, der zufolge die soziale Intention der Kleinkinder in solchen Situationen tatsächlich darin besteht, ihre Einstellung zu dem neuen Ereignis mit dem Erwachsenen zu teilen, und nicht nur darin, den Erwachsenen dazu zu bringen, auf sie oder das Ereignis zu blicken. Konkret reagierte der Erwachsene auf die Zeigegeste des Kleinkinds in vier Varianten: (1) dadurch, daß er auf das Ereignis blickte, ohne das Kleinkind anzusehen - gemäß der Hypothese, daß das Kleinkind einfach die Aufmerksamkeit des Erwachsenen auf das Ereignis lenken will und weder Aufmerksamkeit noch Interesse mit ihm teilen möchte (die Ereignisbedingung); (2) dadurch, daß er gegenüber dem Kind positiv emotional reagierte, ohne auf das Ereignis zu sehen - gemäß der Hypothese, daß das Kleinkind einfach die Aufmerksamkeit des 8 Liszkowski et al. 2004. 131

Erwachsenen für sich selbst haben will (die Zuwendungsbedingung);9 (3) dadurch, daß er gar nichts tat - gemäß der Hypothese, daß das Kleinkind nur zum Selbstzweck zeigt oder überhaupt keinen Kommunikationsversuch unternimmt (die Ignoranzbedingung); und (4) dadurch, daß er abwechselnd auf das Kleinkind und das Ereignis blickte, während er positiv emotional reagierte - gemäß der Hypothese, daß das Kleinkind die Aufmerksamkeit des Erwachsenen auf den Bezugsgegenstand lenken will, damit beide ihre Aufmerksamkeit für das und ihr Interesse an dem Ereignis teilen können (die Bedingung gemeinsamer Aufmerksamkeit/geteilten Interesses). Die Reaktionen der Kleinkinder auf diese Reaktionen des Erwachsenen wurden dann aufgezeichnet, um das dem Zeigen zugrundeliegende Motiv des Kleinkinds zu bestimmen. Die Ergebnisse zeigten, daß zwei (bzw. drei) der vier Varianten Unzufriedenheit bei den Kleinkindern auslösten: Wenn der Erwachsene einfach nur auf den bezeichneten Bezugsgegenstand schaute und das Kleinkind ignorierte (Ereignisbedingung) oder wenn der Erwachsene einfach positive Emotionen gegenüber dem Kleinkind ausdrückte und den Bezugsgegenstand ignorierte (Zuwendungsbedingung). Im Vergleich mit der Bedingung gemeinsamer Aufmerksamkeit, unter der die Kleinkinder typischerweise eine einzige lange Zeigegeste machten, neigten sie unter diesen Bedingungen (sowie unter der Ignoranzbedingung) dazu, ihre Zeigegeste innerhalb der Testdurchgänge öfter zu wiederholen - wohl interpretierbar als beharrliche Versuche, gemeinsame Aufmerksamkeit und geteiltes Interesse herzustellen. Ferner machten Kleinkinder unter diesen Bedingungen (sowie unter der Ignoranzbedingung) weniger häufig Zeigegesten über mehrere Versuche hinweg als unter der Bedingung gemeinsamer Aufmerksamkeit - anscheinend zeigten sie dadurch 9 Moore und Corkum 1994, Moore und D'Entremont 2001. 132

ihre wachsende Unzufriedenheit mit diesem Erwachsenen als Kommunikationspartner, da er nicht mit dem Teilen ihrer Einstellung gegenüber dem Bezugsgegenstand reagierte. Noch deutlicher war dieses Ergebnis in einer Untersuchung mit demselben Grundaufbau von Liszkowski, Carpenter und Tomasello. Sie ließen den Erwachsenen auf den intendierten Bezugsgegenstand schauen, aber unter verschiedenen Bedingungen entweder (1) Interesse (»Toll!«) oder (2) Desinteresse (»Ach ...«) an dem Bezugsgegenstand ausdrücken.10 Brachte der Erwachsene Desinteresse zum Ausdruck, setzten die Kleinkinder ihre Zeigegesten innerhalb eines Durchgangs weder fort noch wiederholten sie sie, weil sie vermutlich verstanden, daß der Erwachsene ihre Begeisterung nicht teilte. Außerdem verwendeten sie über wiederholte Durchgänge hinweg weniger Zeigegesten gegenüber diesem Erwachsenen, anders als in der Situation, in der der Erwachsene ein Interesse ausdrückte. Diese Ergebnisse heben besonders das Motiv der Kleinkinder hervor, beim expressiven Untertyp des deklarativen Zeigens ihre Einstellung mit einem Erwachsenen zu teilen - ihr Motiv, daß der Erwachsene seine Aufmerksamkeit nicht bloß auf einen Bezugsgegenstand richten, sondern auch mit ihrer Einstellung zu diesem Gegenstand übereinstimmen soll. Zweitens liegt der informative Subtyp des deklarativen Zeigens dann vor, wenn das Kleinkind die Intention hat, dem Erwachsenen (uneigennützig) zu helfen, indem es ihn mit Informationen versorgt, die er braucht oder an denen er interessiert sein könnte. Dieses Motiv des Zeigens steht tatsächlich jenem viel näher, das sich hinter den meisten deklarativen Aussagen verbirgt, die sprachlich ausgedrückt werden. Um ein solches Motiv ausbilden zu können, müssen Kleinkinder erstens verstehen, daß andere wissend oder unwissend sein 10 Liszkowski, Carpenter und Tomasello 2007a. 133

können (siehe die Belege in Abschnitt 4.2.2), und zweitens müssen sie ein altruistisches Motiv haben, um anderen zu helfen, indem sie sie mit der nötigen oder wünschenswerten Information versorgen. Um zu prüfen, ob 12 Monate alte Kleinkinder aufgrund eines solchen Motivs zeigen, versetzten Liszkowski, Carpenter, Striano und Tomasello Kleinkinder in verschiedene Situationen, in denen sie beobachteten, wie ein Erwachsener einen Gegenstand verlegte oder sonstwie aus den Augen verlor und dann begann, nach ihm zu suchen.11 In diesen Situationen zeigten die Kleinkinder auf den fraglichen Gegenstand (häufiger als auf ablenkende Gegenstände, die auf dieselbe Weise verlegt wurden, die der Erwachsene aber nicht brauchte), und während sie dies taten, zeigten sie keinerlei Anzeichen, den Gegenstand für sich selbst haben zu wollen (kein Wimmern, Greifen nach dem Gegenstand usw.) oder auf den Gegenstand bezogene Gefühle oder Einstellungen teilen zu wollen. Diese Ergebnisse legen nahe, daß Kleinkinder manchmal, wenn sie deklarativ auf etwas zeigen, etwas anderes wollen als ihre Begeisterung über einen Bezugsgegenstand mit einem Erwachsenen zu teilen, wie es in den klassischen Fällen geschieht; manchmal wollen sie einfach dem Erwachsenen helfen, indem sie ihn mit der nötigen oder wünschenswerten Information versorgen - und diese beiden Motive sind verschieden. Mit Blick auf die imperativen Zeigegesten haben manche Forscher argumentiert, daß durch Zeigegesten ausgedrückte Imperative zumindest potentiell recht einfach sind und auf einem Verständnis anderer Personen als kausalen (vs. intentionalen oder geistigen) Akteuren beruhen, die etwas bewirken.12 Diese Sichtweise beruht zumindest teilweise auf der wohlbekannten Tatsache, daß autistische Kinder zwar im1 1 Liszkowski, Carpenter, Striano und Tomasello 2006. 12 Zum Beispiel Bates, Camaioni und Volterra 1975, Camaioni, 1993. 134

perativ, aber nicht deklarativ zeigen, so wie es manche Affen tun, wenn sie mit Menschen interagieren. Aber imperative Zeigegesten bilden in Wirklichkeit ein Kontinuum. Manche stützen sich auf individualistische Motive, den anderen als kausalen Akteur dazu zu bringen oder ihn gar dazu zu zwingen, das zu tun, was man von ihm will. Ein junges Kleinkind könnte beispielsweise auf ein Spielzeug zeigen mit dem Ziel, daß der Erwachsene es ihm holen soll, wobei der Erwachsene als eine Art von sozial-kausalem Werkzeug verstanden wird. Andere imperative Gesten beruhen eher auf kooperativen Motiven, nämlich dem anderen zu sagen, was man selbst will - wie bei sogenannten indirekten Aufforderungen - , und auf der Hoffnung, er werde sich als intentionaler/kooperativer Akteur dazu entschließen, zu helfen. Offenbar bringen Kleinkinder gelegentlich eher individualistische imperative Gesten hervor, um Erwachsene zu veranlassen, als soziale Werkzeuge etwas für sie tun. Aber manchmal bringen sie auch eher kooperative imperative Gesten hervor, bei denen sie versuchen, die intentionalen/geistigen Zustände des Empfängers zu berücksichtigen - sein Verständnis und seine Motivationen - , und zwar auf eine Weise, wie es bei eher individualistischen imperativen Gesten nicht der Fall ist. Es ist nicht völlig klar, welche Art von Belegen hinreichend überzeugend dafür wäre, daß Kleinkinder solche kooperativen imperativen Gesten mitunter verwenden. Ein indirekter Beleg besteht darin, daß Kleinkinder schon sehr früh auf andere Weisen zeigen, die eindeutig kooperativ sind und die die intentionalen/geistigen Zustände des anderen eindeutig berücksichtigen, das heißt, sie benutzen sowohl expressive als auch informative deklarative Zeigegesten (wie oben beschrieben) ebenso früh wie imperative Gesten.13 Obwohl es nur Belege für etwas ältere Kinder von 30 Monaten 13 Carpenter, Nageil und Tomasello 1998. 135

gibt, könnte man etwas direkter sagen: Wenn kleine Kinder von einem Erwachsenen etwas verlangen, der Erwachsene sie jedoch mißversteht, sie dann aber durch einen glücklichen Zufall doch bekommen, was sie wollen, versuchen sie immer noch, das Mißverständnis zu korrigieren.14 Demnach verstehen Kinder schon recht früh in ihrer Entwicklung, daß ihre Aufforderung nicht wirkt, indem der Erwachsene zu einer bestimmten Handlung gezwungen wird, sondern vielmehr indem sie ihn über ihren Wunsch informieren, er diesen dann versteht und entsprechend zur Kooperation bereit ist. Wann genau dieses Verstehen in der Kindesentwicklung zum ersten Mal auftritt, wissen wir nicht. Unsere Behauptung ist also, daß die jüngere Forschung zu Zeigegesten von Kleinkindern den Nachweis für drei allgemeine Klassen sozialer Intentionen oder Motive erbringt, wie wir sie exakt bei Erwachsenen vorfinden: (1) Teilen (sie wollen Gefühle und Einstellungen mit anderen teilen); (2) Informieren (sie wollen anderen helfen, indem sie sie über nützliche oder interessante Dinge informieren); und (3) Auffordern (sie wollen, daß die anderen ihnen beim Erreichen ihrer Ziele helfen). Wie bei Erwachsenen spielen bei allen drei Motiven in der einen oder anderen Weise die kooperativen Motive des Helfens und Teilens eine Rolle: die beiden zentralen Motivationstypen bei der geteilten Intentionalität. Im Zusammenhang mit jedem dieser Motive können Zeigegesten für endlos viele bestimmte soziale Intentionen verwendet werden, wie sehr deutlich aus den in Abschnitt 4.1.1 zitierten Tagebuchbeispielen hervorgeht.

14 Shwe und Markman 1997. 136

4.1.3 Die referentielle Intention Es gibt sehr gute Belege dafür, daß Kleinkinder, wenn sie Zeigegesten produzieren, die andere Person auffordern, ihre Aufmerksamkeit auf einen Bezugsgegenstand in ihrem gemeinsamen Hintergrund zu richten. Das ist jedoch keine ausgemachte Sache. Tatsächlich haben Moore und andere Zweifel daran geäußert, daß 12 Monate alte Kinder Gesten mit dem Ziel hervorbringen, die Aufmerksamkeit anderer auf äußere Dinge zu lenken. So behaupten etwa Moore und Corkum, daß frühe (deklarative) Zeigegesten hauptsächlich den Zweck haben, ein positives Gefühl des Erwachsenen gegenüber dem eigenen Selbst zu erreichen;15 Moore und D'Entremont behaupten, daß die Reaktion des Erwachsenen auf das Kleinkind, und nicht der äußere Gegenstand, als Verstärker des Zeigeverhaltens dient.16 Der Hauptbeleg für diese skeptische Interpretation ist, daß Kleinkinder manchmal auf Dinge zeigen, auf die der Erwachsene schon blickt, die Zeigegeste also kein Versuch sein kann, seine Aufmerksamkeit auf etwas Neues zu lenken, da beide ja ihre Aufmerksamkeit schon auf den Gegenstand gerichtet haben. Liszkowski et al. prüften genau diese Vermutungen, um herauszufinden, ob die deklarativen Zeigegesten 12 Monate alter Kleinkinder Versuche sind, die Aufmerksamkeit des Erwachsenen auf einen Bezugsgegenstand zu lenken, um dann ihre Einstellung dazu mit ihm teilen zu können.17 Wie oben beschrieben, wurden die Zeigegesten in einer Situation ausgelöst, in denen ein deklaratives Motiv wahrscheinlich sein würde, und die Reaktion des Erwachsenen wurde experimentell manipuliert. Der Hauptbefund im Hinblick auf die 15 Moore und Corkum 1994. 16 Moore und D'Entremont 2001. 17 Liszkowski et al. 2004. 137

Referenz war, daß Kleinkinder, wenn der Erwachsene auf ihre Zeigegeste so reagierte, daß er ihnen gegenüber lediglich spontan ein Gefühl ausdrückte und den Bezugsgegenstand ignorierte, Anzeichen von Unzufriedenheit zeigten, indem sie ihre Zeigegeste wiederholten und dadurch versuchten, der Botschaft Nachdruck zu verleihen. Außerdem produzierten sie über mehrere Durchgänge hinweg seltener Zeigegesten was ebenfalls auf eine Unzufriedenheit mit der Reaktion des Erwachsenen hindeutet, der den intendierten Bezugsgegenstand ignorierte. Noch direkter gingen Liszkowski, Carpenter und Tomasello vor, indem wir unter Verwendung derselben Grundmethode den Erwachsenen entweder den intendierten Bezugsgegenstand des Kleinkinds korrekt identifizieren oder dadurch falsch identifizieren ließen, daß er seine Aufmerksamkeit auf einen anderen Gegenstand in der Nähe richtete (in beiden Fällen mit positivem Gefühlsausdruck und hin- und hergehendem Blick).18 Wenn der Erwachsene den intendierten Bezugsgegenstand korrekt identifizierte, teilten die Kleinkinder einfach weiterhin die Aufmerksamkeit und das Interesse mit ihm. Wandte er sich jedoch dem falschen Bezugsgegenstand zu, wiederholten die Kleinkinder ihre Zeigegeste, um den Erwachsenen auf den intendierten Bezugsgegenstand zu lenken. Sie waren nicht damit zufrieden, Gefühle über etwas anderes als ihren ursprünglich intendierten Bezugsgegenstand zu teilen. Interessanter- und bemerkenswerterweise können 12 Monate alte Kleinkinder andere mit ihren Zeigegesten auch auf abwesende Dinge hinweisen. Das geht aus einigen der oben erwähnten Tagebuchbeobachtungen hervor, denen zufolge 12 und 13 Monate alte Kleinkinder sich auf Ereignisse beziehen, die in der nahen Vergangenheit geschahen oder in der nahen Zukunft geschehen werden. In einer systematischeren Unter18 Liszkowski, Carpenter und Tomasello 2007a. 138

suchung präsentierten Liszkowski, Carpenter und Tomasello den Kleinkindern Gegenstände, die mit hoher Wahrscheinlichkeit deklarative Zeigegesten auslösen.19 Nach einer Weile wurden die Gegenstände dann wieder entfernt. Die Mehrheit der Kleinkinder - sowohl die, die auf den sichtbaren Zielgegenstand zeigten, als auch die, die das nicht taten - zeigte gegenüber einem Erwachsenen auf den Ort, an dem sich der sichtbare Gegenstand zuvor befunden hatte, besonders dann, wenn dieser ihn zuvor noch nicht gesehen hatte. Zeigegesten auf abwesende Gegenstände sind deshalb wichtig, weil sie verdeutlichen, daß Kinder, wenn sie Zeigegesten verwenden, nicht etwas sehr Basales, Behavioristisches tun, wie zum Beispiel versuchen, die andere Person dazu zu bewegen, ihren Körper auf wahrnehmbare Dinge auszurichten. Vielmehr versuchen sie, die andere Person zu motivieren, sich mental auf ein nichtwahrnehmbares Ding einzustellen, das sie im Sinn haben.20 Im Alter von etwa 12 bis 14 Monaten zeigen Kleinkinder also ein Verständnis von Referenzhandlungen als intentionalen Handlungen, die den anderen motivieren sollen, seine Aufmerksamkeit auf ein bestimmtes externes Objekt, einen Aspekt eines Objekts oder gar auf ein abwesendes Objekt als Teil einer umfassenderen sozialen Handlung zu richten. Dieser Prozeß schließt deutlich mehr ein, als einfach nur dem Blick zu folgen, der Zeigegeste zu folgen oder Aufmerksamkeit auf sich selbst zu ziehen. Er umfaßt die Intention eines Kommunizierenden, die Aufmerksamkeit eines Empfängers auf einen bestimmten Bezugsgegenstand zu lenken, so daß der Empfänger durch seine Identifikation des intendierten Bezugsgegenstandes (und des Motivs) aufgrund einer bestimmten Beziehung zum gemeinsamen Hintergrund die unter dem 19 Liszkowski, Carpenter und Tomasello 2007b. 20 Siehe auch Saylor 2004. 139

Gesichtspunkt der Relevanz nötigen Schlußfolgerungen zieht und so die übergreifende soziale Intention versteht.

4.1.4 Der gemeinsame Hintergrund Wir könnten annehmen, daß der gemeinsame Hintergrund von Anfang an eine entscheidende Rolle bei den Zeigegesten von Kleinkindern spielt, wenn wir uns auf solche Indizien wie unsere Tagebuchbeobachtungen berufen, die viele verschiedene Kontexte umfassen, welche wiederum viele verschiedene Bedeutungen der Zeigegeste des Kleinkinds bestimmen. Um allerdings nachzuweisen, daß der gemeinsame Hintergrund eine Rolle spielt, muß gezeigt werden, daß der Kontext tatsächlich »geteilt« wird oder wechselseitig bekannt ist. Dies läßt sich (bzw. ließ sich) am leichtesten anhand des Verstehens bewerkstelligen, und zwar sowohl für die beteiligten sozialen Intentionen als auch für die referentiellen Intentionen. Im Hinblick auf soziale Intentionen ließen Liebal und andere 14 und 18 Monate alte Kleinkinder und einen Erwachsenen zusammen aufräumen, das heißt Spielzeuge aufsammeln und in einen Korb legen.21 Zu einem bestimmten Zeitpunkt hielt der Erwachsene inne und zeigte auf ein Spielzeug, das die Kleinkinder dann auflasen und in den Korb legten. Wenn das Kleinkind und der Erwachsene auf genau dieselbe Weise aufräumten, dann aber ein zweiter Erwachsener, der mit diesem Kontext nicht vertraut war, das Zimmer betrat und auf das betreffende Spielzeug in genau derselben Weise zeigte, legten die Kleinkinder das Spielzeug nicht in den Korb zurück- vermutlich weil der zweite Erwachsene das Aufräumspiel als gemeinsamen Hintergrund nicht mit ihnen teilte. Da sie aktuell nicht mit diesem neuen Erwachsenen in21 Liebal et al. 2009. 140

teragiert hatten, schienen sie vielmehr seine Zeigegeste in den meisten Fällen als eine einfache Aufforderung zu interpretieren, das Spielzeug wahrzunehmen und die Aufmerksamkeit darauf zu lenken (das heißt als eine expressive, deklarative Geste). In beiden Fällen wurden also die Kleinkinder auf dasselbe Spielzeug als Bezugsgegenstand gelenkt - sie verstanden die referentielle Intention in beiden Fällen auf dieselbe Weise - , aber ihre Interpretation der zugrundeliegenden sozialen Intention war jeweils verschieden. Am wichtigsten ist jedoch, daß diese Interpretation nicht von ihren eigenen, gegenwärtigen egozentrischen Interessen abhing, sondern vielmehr von ihrer kurz zuvor geteilten Erfahrung (gemeinsame Aufmerksamkeit, gemeinsamer Hintergrund) mit jedem der beiden Erwachsenen, die auf ein Spielzeug gezeigt hatten. Zur näheren Untersuchung der referentiellen Intention ließen Moll et al. einen Erwachsenen eine mehrdeutige Aufforderung an 14 Monate alte Kleinkinder richten: Er gestikulierte in die allgemeine Richtung dreier Gegenstände (des Zielgegenstands und zweier ablenkender Gegenstände) und bat das Kind, »ihn« ihm zu geben.22 Unter verschiedenen Experimentalbedingungen hatte das Kleinkind zuvor verschiedene Erfahrungen mit dem Erwachsenen gemacht. Somit war auch der gemeinsame Hintergrund, auf den es sich beziehen konnte, um den Bezugsgegenstand der Aufforderung zu identifizieren, jeweils ein anderer. Konkret hatten der Erwachsene und das Kleinkind unter der Experimentalbedingung vor der Aufforderung den Zielgegenstand begeistert geteilt, als er unerwartet an verschiedenen Orten in einem Flur wiederholt auftauchte (während sie mit den beiden anderen Gegenständen [den ablenkenden Objekten] auf gewöhnlichere Weise umgingen). Auf die Aufforderung des Erwachsenen reagierten die Kleinkinder unter dieser Bedingung derart, daß sie 22 Moll et al. 2008. 141

ihm den Zielgegenstand, den sie miteinander geteilt hatten, häufiger gaben als die ablenkenden Gegenstände - gestützt auf den gemeinsamen Hintergrund, den sie zuvor mit ihm erworben hatten. Bemerkenswerterweise taten sie das unter keiner der beiden folgenden Kontrollbedingungen: Äußerte ein zweiter Erwachsener die Aufforderung, mit dem das Kind keinen gemeinsamen Hintergrund hatte, so trafen die Kinder eine zufällige Wahl: hatte der Erwachsene, der die Aufforderung äußerte, die Gegenstände für sich allein wahrgenommen (mit derselben Begeisterung), während das Kleinkind einfach unbemerkt zuschaute, gab es ebenfalls keinen gemeinsamen Hintergrund, und die Kleinkinder trafen erneut eine zufällige Wahl. Konfrontiert mit einer Aufforderung, die sich auf einen nicht eindeutig bestimmten Bezugsgegenstand richtete, nahmen die Kleinkinder also weder an, daß der Auffordernde nach dem Gegenstand verlangte, für den das Kind sich begeisterte (sonst hätten sie den Zielgegenstand auch dann geholt, als der andere Erwachsene nach ihm verlangte), noch nahmen sie an, daß der Auffordernde nach dem Gegenstand verlangte, für den er sich selbst begeisterte (sonst hätten sie den Zielgegenstand auch unter jener Bedingung geholt, unter der sie einfach alleine zusahen, wie der Auffordernde sich für den Zielgegenstand begeisterte). Statt dessen nahmen die Kleinkinder an, daß der Erwachsene nach genau dem Gegenstand verlangte, für den beide sich innerhalb ihres vorherigen Hintergrunds begeistert hatten. Kleinkinder verwenden also ihren gemeinsamen Hintergrund, den sie mit einem Zeigegesten ausführenden Erwachsenen teilen - und nicht ihre eigenen egozentrischen Interessen um sowohl die referentielle Intention des Erwachsenen als auch sein zugrundeliegendes Motiv und seine soziale Intention zu interpretieren.

142

4.1.5 Wechselseitige Annahmen von Hilfsbereitschaft und kooperatives Schlußfolgern Im allgemeinen scheinen schon einjährige Kleinkinder von anderen zu erwarten, daß sie auf ihre Kommunikationsakte reagieren, indem sie zu verstehen versuchen; und sie erwarten von anderen, Hilfe zu leisten, wenn danach verlangt wird, oder angebotene Informationen anzunehmen bzw. bei Aufforderung zu teilen. Ob es sich dabei um wechselseitige Erwartungen handelt oder nicht, wurde nie gezielt untersucht. Kleinkinder scheinen jedoch Schlußfolgerungen unter dem Gesichtspunkt der Relevanz zu ziehen, indem sie sich auf kooperatives Schlußfolgern und den gemeinsamen Hintergrund stützen - beispielsweise in der Objektwahl-Studie von Behne et al. und in den Untersuchungen von Liebal et al. sowie von Moll et al., die oben beschrieben wurden23 - , und zwar in dem Sinne, daß sie sich zumindest teilweise deshalb kommunikativ verhalten, weil sie wissen, daß der Erwachsene das von ihnen will und erwartet. In schwierigen Fällen kooperieren Kleinkinder außerdem insofern mit Erwachsenen, als sie die beabsichtigte Botschaft durch Nachfragen und Verbesserungen der Botschaft selbst »aushandeln«.24 Diese Interpretation erhält vielleicht zusätzliche Glaubwürdigkeit durch Belege, denen zufolge einjährige Kleinkinder das Einmaleins der Grice sehen kommunikativen Absicht verstehen, daß »wir gemeinsam wissen« oder es »wechselseitig offenkundig« ist, daß ich etwas von einem anderen will. Dieses Modell beruht wesentlich auf gegenseitigen Erwartungen von Hilfsbereitschaft. Vor allem produzieren Kleinkinder etwa von ihrem ersten Geburtstag an in ihren natürlichen sozialen Interaktionen eindeutig Kommunikationsakte »für« 23 Behne et al. 2005, Liebal et al. 2009, Moll et al. 2008. 24 Golinkoff 1986. 143

eine andere Person, da sie sicherstellen, die Aufmerksamkeit des anderen zu haben, den Akt an den anderen richten, Augenkontakt herstellen usw.25 Außerdem scheinen sie solche augenfälligen (ostensiven) Hinweisreize, wenn sie von anderen produziert werden, als etwas zu erkennen, das »auf sie bezogene« Handlungen bezeichnet.26 Die stärksten Belege stammen jedoch aus zwei experimentellen Studien. Erstens gab es in der Objektwahl-Studie von Behne et al.,27 die in Kapitel 2 beschrieben wurde, nicht nur eine Experimentalbedingung, unter der Kleinkinder den Ort eines Spielzeugs aufgrund einer informativen Zeigegeste erschlossen, sondern auch eine Kontrollbedingung, unter der der Erwachsene seinen ausgestreckten Zeigefinger geistesabwesend auf einen der Eimer richtete, während er sein Handgelenk musterte. Er blickte auch zu dem Kind hin. Sein oberflächliches Verhalten entsprach also der Experimentalbedingung sowohl hinsichtlich der Bewegung seines Fingers als auch im Hinblick darauf, daß sein Blick zwischen dem Kleinkind und dem richtigen Eimer hin- und herwanderte. Der Unterschied zur Experimentalbedingung bestand darin, daß der Erwachsene unter dieser Kontrollbedingung keinen direkten Augenkontakt mit dem Kleinkind herstellte (zumindest keinen mit der spezifischen Absicht, das Kind erkennen zu lassen, daß es sich um einen Kommunikationsakt handelt); das Anschauen unter der Kontrollbedingung war eher beiläufig, so als ob es einfach darum ging, die Situation des Kindes zu überprüfen - anstatt die Zeigegeste als Hinweishandlung zu markieren. Die 14 Monate alten Kleinkinder erkannten den eher beiläufig ausgestreckten Finger und das Anschauen nicht als »für« sie be25 Liszkowski et al. 2008. 26 Siehe Csibra 2003 zu der Frage, wie Kleinkinder die auf sie gerichteten kommunikativen/pädagogischen Intentionen anderer erkennen. 27 Behne et al. 2005. 144

stimmten Kommunikationsakt und zogen deshalb auch nicht die passende Relevanz-Schlußfolgerung, das heißt, sie betrachteten den Erwachsenen nicht als jemanden, der sie über den Ort des versteckten Spielzeugs informiert, und konnten es daher auch nicht wie unter der Experimentalbedingung finden. Was auch immer die besonderen Hinweisreize in dieser Studie waren, so läßt sich doch prinzipiell feststellen, daß junge Kleinkinder einen ausgestreckten Finger völlig verschieden auffassen, je nachdem, ob der Erwachsene möchte, daß sie dieses Verhalten als intentionalen Kommunikationsakt ansehen oder nicht. Zweitens gibt es die obenerwähnte Untersuchung von Shwe und Markman an etwas älteren, nämlich 30 Monate alten Kindern.28 In dieser Studie verlangten Kleinkinder einen gewünschten Gegenstand von einem Erwachsenen. Unter den beiden Schlüsselbedingungen erhielten sie den Gegenstand, den sie haben wollten, aber im ersten Fall signalisierte der Erwachsene, daß er alles korrekt verstanden hatte, während er im zweiten Fall signalisierte, er nehme an, das Kind wolle einen anderen (falschen) Gegenstand, der daneben lag - von dem er sagte, das Kind könne ihn nicht haben, so daß er ihm tatsächlich denjenigen gab (sozusagen zufällig), den es wirklich haben wollte. Somit bekam das Kind unter dieser besonders interessanten Bedingung zwar letztendlich den gewünschten Gegenstand, aber seine Botschaft wurde de facto nicht korrekt verstanden. In diesem Fall korrigierten die Kinder die Mißverständnisse des Erwachsenen trotzdem. Das deutet darauf hin, daß sie sowohl das Ziel hatten, den Gegenstand zu bekommen (als soziale Intention), als auch die Absicht, als Mittel zu diesem Zweck mit dem Erwachsenen erfolgreich zu kommunizieren - was sie unabhängig von der sozialen Intention erreichen wollten. 28 Shwe und Markman 1997. 145

Wir müssen jedoch anerkennen, daß das Verstehen all dieser Dinge bei Kleinkindern noch nicht ganz dem von Erwachsenen entspricht. So enthält das voll entwickelte Verstehen Gricescher kommunikativer Absichten bei älteren Kindern und Erwachsenen ganz deutlich ein Verstehen von verborgener Urheberschaft und Verheimlichung - Handlungen etwa wie das geschickte Positionieren des eigenen Weinglases, so daß es ins Blickfeld des Gastgebers gerät (und aufgefüllt werden kann), ohne jedoch zugleich diesen Zweck zu offenbaren. Erwachsene setzen diese Art von verborgener Urheberschaft sehr häufig in Fällen ein, bei denen Höflichkeit oder andere Formen des Verschweigens geboten sind, während ein- und zweijährige Kinder ein solches Verhalten anscheinend überhaupt nicht zeigen. Wir glauben daher, daß Kleinkinder eine primordiale Version kommunikativer Absichten insofern verstehen, als sie begreifen, wenn ein Kommunizierender eine Handlung »zugunsten« von jemandem intendiert. Ein Verstehen der vollen intentionalen Struktur kommunikativer Absichten von Erwachsenen, die verborgene Urheberschaft, Verheimlichung und dergleichen enthält, entfaltet sich aber erst allmählich und nicht vor dem Alter von 3 oder 4 Jahren. Das hat vermutlich damit zu tun, daß es eines Lernprozesses des Verstehens und Steuerns jener spezifischeren Mittel bedarf, durch die eine anfangs undifferenzierte kommunikative Absicht ausgedrückt und verstanden werden kann. Dieser Prozeß muß möglicherweise auf die Entwicklung reiferer Fertigkeiten zur Differenzierung der verschiedenen Perspektiven warten, die bei Interaktionen aufgrund von gemeinsamer Aufmerksamkeit im allgemeinen beteiligt sind.29 Unklar ist auch, ob die Erwartungen von Kleinkindern im Hinblick auf Hilfsbereitschaft wirklich wechselseitig bzw. geteilt sind, das heißt, ob das Kind weiß, daß seine Kommunika29 Moll und Tomasello 2007b. 146

tionspartner das gleiche auch von ihm erwarten - und weiß, daß sie wissen, daß es diese Erwartungen ebenfalls hat usw. Eine Möglichkeit ist, daß Kleinkinder einfach so »gebaut« sind, daß sie im Sinne von Sperbers naivem Optimismus verfahren, indem sie zunächst aufgrund einer simplen Heuristik einfach von einer kooperativen Umgebung ausgehen und zudem annehmen, daß jeder andere dasselbe tut.30 Ab einem bestimmten Zeitpunkt fangen sie jedoch an, weitere Aspekte des Prozesses zu verstehen, insbesondere daß die andere Person sich kommunikativ beteiligen sollte und, wie verlangt, helfen sollte. Von nun an können sie beleidigt reagieren, wenn die andere Person nicht so handelt, wie es von ihr erwartet wird. Außerdem beginnen sie, nach Höflichkeitsnormen zu verfahren, die diese Dinge regeln sollen. In anderen Aktivitätsbereichen verhalten sich Kinder typischerweise erst in der Vorschulzeit nach diesen Normen,31 und deshalb verfahren sie zu Beginn vielleicht noch nicht genau nach Erwachsenennormen. Aber unser Wissen über alle diese Dinge ist sehr bruchstückhaft.

4.1.6 Zusammenfassung Die hier vorgestellten Daten sprechen stark dafür, daß Kleinkinder nahezu mit Beginn ihrer Verwendung von Zeigegesten die wichtigsten Aspekte der Funktionsweise kooperativer Kommunikation menschlichen Stils verstehen: Sie kommunizieren auf einer geistigen Ebene, im Kontext eines gemeinsamen begrifflichen Hintergrunds und aufgrund von kooperativen Motiven. Sie zeigen somit etwas, das der vollständigen sozio-kognitiven Infrastruktur ausgereifter kooperativer Kommunikation nahekommt. Die meisten Kinder 30 Sperber 1994. 31 Kagan 1981. 147

fangen um ihren ersten Geburtstag herum und noch bevor sie sprechen können an, Zeigegesten zu verwenden. Das deutet darauf hin, daß in der menschlichen Ontogenese die Infrastruktur kooperativer Kommunikation anfangs nicht die Sprache, sondern die Verwendung von Zeigegesten unterstützt. Da sich entwickelnde Kinder typischerweise von Geburt an in einer sprachdurchtränkten Umgebung aufwachsen, muß vielleicht auch festgehalten werden, daß gehörlose Kinder hörfähiger Eltern, die während des ersten Lebensjahrs oder auch darüber hinaus so gut wie keinen Kontakt mit einer konventionellen Sprache (weder mit einer gesprochenen noch mit einer Zeichensprache) haben, dennoch beginnen, Zeigegesten auf normale Weise zu verwenden, und zwar in etwa demselben Alter.32 Obwohl Kleinkinder in Ansätzen zu verstehen scheinen, daß Kommunizierende ihre soziale Intention erreichen, indem sie ihre kommunikative Absicht wechselseitig offenlegen, vollziehen sie keine solchen Handlungen wie die Urheberschaft zu verbergen, zu täuschen usw., sie verstehen daher höchstwahrscheinlich die innere Struktur dieser komplexen Absicht nicht auf dieselbe Weise wie Erwachsene. Ebenso gibt es keine Belege dafür, daß sie ein Verständnis irgendwelcher Normen hätten, die den Prozeß von vornherein steuern. Aber zu beiden Themen ist weitere Forschung nötig.

4.2 Quellen der Zeigegesten von Kleinkindern Alle Entwicklungsanalysen müssen sich grundsätzlich der Frage stellen, warum eine bestimmte Kompetenz zu einem bestimmten Zeitpunkt in der Ontogenese auftaucht - im Falle der Zeigegesten von Kleinkindern im Alter von etwa 1 1 bis 32 Lederberg und Everhart 1998, Spencer 1993.

148

12 Monaten. Die Beantwortung dieser Frage liefert nämlich oft wichtige Informationen darüber, welche zugrundeliegenden, kognitiven und motivationalen Fertigkeiten daran beteiligt sind und wie sie miteinander zusammenhängen. Daher wollen wir nun wissen, wo die Fertigkeiten zur kooperativen Kommunikation, wie sie der Zeigegeste innewohnen, ontogenetisch herkommen. Unsere Antwort wird die Form eines Modells dynamischer Systeme annehmen, in dem sich die verschiedenen Komponenten, die im vorangehenden Kapitel skizziert wurden, einigermaßen unabhängig voneinander entwickeln, dann aber synergetisch in der neuen Funktion der kooperativen Kommunikation zusammengeführt werden. Diese Darstellung stützt die Hypothese, daß Fertigkeiten und Motivationen geteilter Intentionalität für den Prozeß entscheidend sind, da sich herausstellt, daß kooperative Kommunikation ontogenetisch erst dann auftritt, wenn diese Fertigkeiten und Motivationen vorhanden sind, so wie es sich in den gemeinschaftlichen Tätigkeiten von Kleinkindern mit anderen im allgemeinen zeigt.

4.2.1 Warum vollziehen drei Monate alte Kinder keine Zeigegesten? Es überrascht vielleicht, daß die beobachtbare Verhaltensform menschlicher Zeigegesten im sensumotorischen Verhalten von Kleinkindern schon im Alter von drei Monaten zuverlässig auftritt.33 Kleinkinder in diesem zarten Alter halten oft ihre Hände in charakteristischer Form mit ausgestrecktem Zeigefinger, manchmal über längere Zeit, und zwar auf eine Weise, wie es andere Primaten anscheinend nicht tun.34 Die 33 Hannan und Fogel 1987. 34 Povinelli und Davis 1994. 149

Verhaltensform des Zeigens von Kleinkindern steht also entwicklungsmäßig im Alter von drei Monaten zur Verfügung. Soweit bekannt, verwenden Kleinkinder in diesem Alter diese Bewegung der Hände jedoch nicht für irgendeine soziale oder kommunikative Funktion. Man könnte argumentieren, daß so junge Kleinkinder nicht über die notwendigen sozialen Motivationen zur Kommunikation verfügen. Aber das stimmt nicht. Im vorigen und in diesem Kapitel postulierten wir drei elementare Kommunikationsmotive: Auffordern, Teilen und Informieren. Diese Motive stellen natürliche menschliche Motivationen für das Kommunizieren dar und haben jeweils ihren eigenen evolutionären Ursprung (siehe Kapitel 5). Wie sich herausstellt, haben alle auch ihren eigenen ontogenetischen Ursprung, und zumindest in zwei Fällen liegt dieser weit vor jeglicher intentionalen Kommunikation. Erstens bringen Kleinkinder innerhalb der ersten paar Lebensmonate Erwachsene regelmäßig dazu, das zu tun, was sie von ihnen wollen. Wenn junge Kleinkinder Nahrung oder Trost brauchen, weinen sie, und das hat typischerweise eine hilfreiche Reaktion seitens der Erwachsenen zur Folge. Das Kleinkind lernt, daß die Erwachsenen, sobald es zu weinen anfängt, darauf reagieren, und so wird das Weinen oft zu einer Art von beginnendem Weinen oder Wimmern ritualisiert - zu einer Art stimmlicher Intentionsbewegung. Dieses Wimmern stellt die Wurzeln des imperativen Aufforderns dar, allerdings versteht das Kleinkind natürlich nicht, wie es intentional funktioniert (zum Beispiel, daß der Erwachsene das Weinen wahrnehmen und ein Handlungsziel bilden muß). Wimmern als beginnendes Weinen ist die natürliche Grundlage der gestischen und sprachlichen Aufforderungen kleiner Kinder. Zweitens haben Kleinkinder innerhalb der ersten Lebensmonate auch sozialen Umgang mit anderen und teilen Ge150

fühle in einem persönlichen, dyadischen Austausch mit ihnen, der manchmal Protokonversation genannt wird.35 Stern beschreibt einen Prozeß affektiver Abstimmung, bei dem Kleinkinder und Erwachsene sich gleichzeitig in mehreren Modalitäten auf die Gefühle des anderen abstimmen.36 Dieser reichhaltige Gefühlsaustausch ist die Wurzel expressiver deklarativer Gesten, jedoch versteht das Kleinkind abermals nicht, wie diese intentional funktionieren. Die Gefühle, die bei diesem Austausch ausgedrückt werden, etwa Begeisterung und Überraschung, sind genau diejenigen, die Kleinkinder ausdrücken, wenn sie einige Monate später in ihren expressiven deklarativen Gesten mit Freude auf etwas zeigen. Drittens und im Gegensatz zu den Kommunikationsmotiven des Aufforderns und Teilens hat das Motiv des Informierens seine Wurzeln nicht in der frühesten Kindheit. Wenn, wie wir argumentiert haben, die grundlegende Motivation für informative Gesten darin besteht, anderen zu helfen, indem man sie mit Informationen versorgt, die sie brauchen oder wollen könnten, dann ist zumindest ein Verständnis der Ziele anderer und eines Begriffs von Wissen oder Information eine grundlegende Voraussetzung. Beim Stand der aktuellen Forschung erfüllen Kleinkinder diese beiden Voraussetzungen frühestens im Alter von 12 Monaten. Die Handlung des Helfens verstehen sie zum ersten Mal mit etwa 12 bis 14 Monaten, wenn sie die Ziele anderer erkennen, die sie unterstützen könnten,37 und im selben Alter verstehen sie auch den Unterschied zwischen jemandem, der über ein bestimmtes Wissen verfügt, und jemandem, der dieses Wissen nicht hat.38 Anders als bei den beiden anderen Motiven muß somit das Informa35 Trevarthen 1979, Rochat, 2001. 36 Stern 1985. 37 Kuhlmeier, Wynn und Bloom 2003, Warneken und Tomasello 2007. 38 Tomasello und Haberl 2003. 151

tionsmotiv bei Kleinkindern darauf »warten«, bis sich das Verstehen anderer als intentionale Akteure entwickelt hat, die sowohl helfen als auch Hilfe von anderen benötigen; das schließt auch die Weitergabe von Informationen an unwissende Empfänger ein. Hilfsangebote gegenüber anderen werden typischerweise nicht von irgendwelchen überschwenglichen Gefühlsausdrücken begleitet, weshalb diese bei informativen Zeigegesten und der Sprache gewöhnlich ebenfalls fehlen. Warum machen Kleinkinder anderen gegenüber keine Zeigegesten zu Kommunikationszwecken, wenn sie doch ihre Hand mit drei Monaten auf geeignete Weise formen können und im selben Alter über zumindest zwei geeignete Motive verfügen? Nun, weil sie über Rudimente der gesamten sozio-kognitiven, sozio-motivationalen Infrastruktur verfügen müssen, die für die ausgereifte menschliche Kommunikation charakteristisch ist, bevor sie damit beginnen können, die Aufmerksamkeit der anderen aus einem bestimmten Grund auf Gegenstände zu lenken. Außerdem besitzen Kleinkinder in diesem Alter noch nicht die notwendigen Fertigkeiten der individuellen oder geteilten Intentionalität.

4.2.2 Die Neunmonatsrevolution - in zwei Teilen Im Alter von etwa neun Monaten fangen Kleinkinder an, eine ganze Reihe neuer sozialer Verhaltensweisen zu zeigen, die darauf zurückzuführen sind, daß sie andere als intentionale und rationale Akteure sehen können (wie sie selbst es sind) sowie imstande sind, mit anderen an Interaktionen mitzuwirken, die gemeinsame Ziele, Intentionen und Aufmerksamkeit umfassen (geteilte Intentionalität). Im folgenden werden auf der Grundlage der besten verfügbaren Belege die Zeitpunkte für das Auftauchen einiger Schlüsselvoraussetzungen des Verstehens individueller Intentionalität dargestellt: 152

- Mit spätestens neun Monaten verstehen Kleinkinder, daß andere Ziele haben, daß sie bestimmte Dinge wollen39 und vielleicht verstehen das sogar jüngere Kleinkinder.40 - Mit spätestens 12 Monaten verstehen Kleinkinder, daß Akteure aktiv Mittel für die Verfolgung ihrer Ziele wählen, das heißt, daß sie Intentionen bilden. Außerdem sind sie sogar imstande, einige der rationalen Gründe zu erkennen, die einen Akteur dazu veranlassen, ein bestimmtes Mittel gegenüber einem anderen vorzuziehen.41 - Mit spätestens 12 Monaten, wenn nicht schon früher,42 verstehen Kleinkinder, daß andere Personen Dinge sehen43 und Akteure ihre Aufmerksamkeit absichtlich auf eine Teilmenge der Dinge richten, die sie wahrnehmen.44 - Mit spätestens 12 bis 15 Monaten können Kleinkinder feststellen, was andere wissen, im Sinne von »mit etwas vertraut sein«.45 Sobald Kleinkinder andere Personen auf diese Weisen verstehen, können sie damit anfangen, bestimmte Arten praktischer Schlußfolgerungen über die Handlungen anderer zu ziehen; insbesondere können sie von nun an Überlegungen darüber anstellen, warum jemand etwas Bestimmtes und nicht etwas anderes getan hat - und was das für das Handeln dieser Person in der unmittelbaren Zukunft bedeutet. Für die kooperative Kommunikation genügt das jedoch 39 Zum Beispiel Csibra et al. 1999, Behne, Carpenter, Call und Tomasello 2005. 40 Woodward 1998. 41 Gergely, Bekkering und Kiräly 2002, Schwier et al. 2006. 42 Woodward 1999. 43 Moll und Tomasello 2004. 44 Vgl. zum Beispiel Tomasello und Haberl 2003, Moll et al. 2006. 45 Vgl. zum Beispiel Tomasello und Haberl 2003; Onishi und Baillargeon 2005. 153

nicht. Wie in Kapitel 3 hervorgehoben wurde, müssen Kleinkinder auch in der Lage sein, mit anderen Personen gemeinsame begriffliche Räume oder einen gemeinsamen Hintergrund zu schaffen (eine elementare Fertigkeit der geteilten Intentionalität), damit die kooperative Kommunikation tatsächlich funktioniert. Im Normalfall entsteht dadurch ein eingeschränkter Bereich möglicher Bezugsgegenstände für die referentielle Intention und ein eingeschränkter Bereich möglicher Motivationen für die soziale Intention; beide sind für den Empfänger notwendig, um angemessene RelevanzSchlußfolgerungen zu ziehen (und für den Kommunizierenden, um einen Kommunikationsakt zu gestalten, der diese Schlußfolgerungen unterstützt). Im folgenden werden auf der Grundlage der besten verfügbaren Belege die Zeitpunkte für das Entstehen der Schlüsselvoraussetzungen geteilter Intentionalität dargestellt: - Mit spätestens 9 bis 12 Monaten fangen Kleinkinder an, sich mit anderen an Episoden triadischer Interaktion zu beteiligen, die gemeinsame Aufmerksamkeit beanspruchen; sie schaffen dadurch die Art von gemeinsamem Hintergrund, der für kooperative Kommunikation notwendig ist.46 - Damit zusammenhängend können Kleinkinder mit spätestens 12 bis 14 Monaten feststellen, welche Gegenstände sie und eine andere Person kurz zuvor in einer Episode gemeinsamer Aufmerksamkeit wahrgenommen haben und welche nicht; sie können also nicht nur ausmachen, was wir gemeinsam sehen (gemeinsame Aufmerksamkeit), sondern auch, was wir aus früherer Erfahrung gemeinsam wissen.47 46 Bakeman und Adamson 1984, Carpenter, Nageil und Tomasello 1998. 47 Tomasello und Haberl 2003, Moll und Tomasello 2007a, Moll et al. 2008. 154

- Mit spätestens 14 Monaten können Kleinkinder mit anderen gemeinsame Ziele und Intentionen aufbauen, zum Beispiel bei kooperativen Problemlösungstätigkeiten.48 Noch frühere Interaktionen, die gemeinsame Aufmerksamkeit beanspruchen, könnten sogar Belege für geteilte Ziele vor dem ersten Geburtstag sein.49 Kleinkinder verfügen also schon ab einem Alter von wenigen Monaten über einige der erforderlichen Fähigkeiten für Zeigegesten, einschließlich jener, ihre Hände auf geeignete Weise zu formen, und zumindest zweier geeigneter Motive. Sie beginnen jedoch erst viele Monate später mit kommunikativen Zeigegesten, weil sie andere noch nicht als rationale Akteure verstehen und noch nicht angefangen haben, die Art von gemeinsamem Aufmerksamkeitsrahmen und gemeinsamem Hintergrund aufzubauen, die es ihnen ermöglichen, sich gegenüber anderen Personen in sinnvoller Weise triadisch auf die Welt zu beziehen. Sobald sie jedoch im Alter von etwa 9 bis 12 Monaten beginnen, andere zu verstehen und mit ihnen auf diese Weise zu interagieren, fangen sie an, ihnen gegenüber zu Kommunikationszwecken auf Dinge zu zeigen. Zusammen mit den Belegen dafür, daß Zeigegesten, die denen von Erwachsenen ähneln, im Alter von 12 Monaten auftreten (wie im vorangehenden Abschnitt dargestellt), weist diese Gleichzeitigkeit in der Entwicklung daraufhin, daß frühe kommunikative Zeigegesten in der Tat auf genau diesen Fertigkeiten und Motivationen individueller und geteilter Intentionalität beruhen, wie es das hier präsentierte Kooperationsmodell menschlicher Kommunikation vorsieht. 48 Warneken, Chen und Tomasello 2006, Warneken und Tomasello 2007. 49 Ross und Lollis 1987, Ratner und Bruner 1978, Bakeman und Adamson 1984, Carpenter, Nageil und Tomasello 1998. 155

Leider läßt sich durch die Beobachtung des natürlichen Entwicklungsprozesses nicht bestimmen, ob das Auftauchen kommunikativer Zeigegesten bei Kleinkindern im Alter von etwa einem Jahr auf die Herausbildung der individuellen oder der geteilten Intentionalität oder auf beide zurückgeht, weil sie in der Ontogenese zusammen entstehen. Die Daten, die aus Vergleichen zwischen Menschen und Schimpansen stammen, deuten jedoch daraufhin, daß besonders die mit geteilter Intentionalität verbundenen Fertigkeiten entscheidend für die Unterstützung der einzigartigen Aspekte menschlicher kooperativer Kommunikation sind; ohne diese Fertigkeiten würden menschliche Kleinkinder, die andere als intentionale Akteure verstehen, zwar intentional, aber nicht kooperativ kommunizieren. Weitere diesbezügliche Belege stammen von autistischen Kindern, die anderen gegenüber zwar imperative Zeigegesten, aber keine deklarativen verwenden, ganz bestimmt jedenfalls keine expressiven, und vielleicht auch keine informativen (das wurde noch nie geprüft). Bemerkenswerterweise besitzen autistische Kinder einige Fertigkeiten zum Verstehen der Grundzüge intentionalen Handelns - daß andere Ziele haben und Dinge sehen - , wodurch imperative Zeigegesten, zumindest die individualistischeren, unterstützt werden können.50 Ihre Fertigkeiten auf dem Gebiet der gemeinsamen Aufmerksamkeit51 und der Zusammenarbeit52 sind dagegen nur sehr gering ausgeprägt, weshalb sie vermutlich keine deklarativen Gesten benutzen. Tatsächlich gibt es bei autistischen Kindern eine sehr starke Korrelation zwischen den Fertigkeiten der gemeinsamen Aufmerksamkeit und der Kommunikation, so daß autistische Kinder, denen es leichter fällt, sich an Verhaltensweisen gemeinsamer Aufmerksamkeit 50 Carpenter, Pennington und Rogers 2001. 51 Siehe den Überblick bei Mundy und Sigman 2006. 52 Liebal et al. 2008. 156

zu beteiligen - was üblicherweise durch die Koordination visueller Aufmerksamkeit operationalisiert wird auch diejenigen sind, die später raffiniertere Fertigkeiten gestischer und sprachlicher Kommunikation erwerben.53

4.2.3 Zusammenfassung Eine sehr vereinfachte Darstellung des Entwicklungsprozesses - ein wirklich nur grobes Modell eines dynamischen Systems - wird in Abbildung 4.1 gegeben. Unser Wissensstand ist hier noch sehr primitiv, und detaillierte Antworten auf die Frage, wie Kleinkinder ihre verschiedenen kommunikativen Tätigkeiten erwerben, werden auf weitere Forschung warten müssen, die dann genauer zu untersuchen hätte, welche zeitlichen Muster die verschiedenen beteiligten Fertigkeiten und Motivationen in der menschlichen Ontogenese aufweisen, wobei Studien nötig sind, um die Kausalrichtung zu bestimmen. Die wichtigsten Punkte sind zunächst nur die beiden folgenden. Erstens muß jedes der drei Hauptmotive der Zeigegesten von Kleinkindern für sich, in seiner eigenen Ontogenese, erklärt werden, da jedes einen grundlegenden Modus sozialer Interaktion darstellt, der seine eigene evolutionäre Grundlage hat und Vorteile sowohl für den Kommunizierenden als auch für den Empfänger bietet (siehe Kapitel 5). Zweitens beginnen junge Kleinkinder nicht mit der kooperativen Kommunikation durch Zeigegesten, bevor nicht ihre Fertigkeiten geteilter Intentionalität um den ersten Geburtstag herum entstanden sind (diese sind daher der »Kontrollparameter«, der das Entstehungsalter einschränkt), und dies, obwohl ihnen schon zu einem früheren Zeitpunkt ihrer Entwicklung viele andere Komponenten zur Verfügung stehen. 53 Siehe den Überblick bei Mundy und Burnette 2005. 157

In diesem Zusammenhang ist es ebenfalls wichtig, in der vorliegenden Darstellung 12 Monate alten Kindern nicht die vollständige Struktur der ausgereiften kooperativen Kommunikation zuzuschreiben. Insbesondere scheinen sie nicht alle Aspekte der Griceschen kommunikativen Absicht oder Kooperationsnormen völlig zu beherrschen. Es handelt sich hier um Aspekte geteilter Intentionalität, die auf anderen Gebieten der kognitiven Entwicklung von Kindern ebenfalls nicht vor dem Alter von drei bis vier Jahren auftauchen. Somit haben wir weitere Belege für die These, der zufolge die Fertigkeiten der Kinder zur kooperativen Kommunikation in einem allgemeineren Sinne entscheidend von ihren Fertigkeiten geteilter Intentionalität abhängen.

Alter in Monaten

Abbildung 4.1: Die Entstehung kooperativer Kommunikation bei Zeigegesten in der Kindesentwicklung 158

43 Frühes Gebärdenspiel Bisher haben wir es vermieden, über andere Gesten von Kleinkindern als Zeigegesten zu sprechen. Das hat seinen Grund hauptsächlich darin, daß es dazu viel weniger einschlägige Untersuchungen gibt, weshalb wir auch viel weniger über ihre Beschaffenheit und ihren Erwerb wissen. Für die Geschichte, die wir in diesem Buch erzählen wollen, sind sie aber dennoch von großer Bedeutung, vor allem mit Blick auf den Übergang zur Sprache. Von besonderer Bedeutung sind natürlich ikonische Gesten (Gebärdenspiel), da sie in gewissem Sinne als symbolisch oder repräsentational gelten können, was für Zeigegesten nicht zutrifft. Darüber hinaus sind ikonische Gesten kategorisch - der Kommunizierende will, daß der Empfänger sich etwas »wie dieses« vorstellt - , wie es Zeigegesten normalerweise nicht sind.

4.3.1 Konventionelle und ikonische Gesten Wie im vorangehenden Kapitel dargelegt wurde, ist es nicht nur möglich, die Aufmerksamkeit anderer zum Beispiel durch Zeigegesten deiktisch zu steuern; man kann auch versuchen, andere dazu zu bringen, sich etwas vorzustellen, indem man ikonische Gesten macht, das heißt durch Gebärdenspiel. Dazu bedarf es allerdings einer gewissen Kreativität. Viele menschliche Gesten sind lediglich konventionell. Beispielsweise sind die Gesten für »o.k.«, Gruß- und Abschiedsgesten, Gesten für verschiedene obszöne Botschaften usw. mit ihren Referenten in keiner offensichtlichen Weise ikonisch verbunden (obwohl sie es zu einer bestimmten Zeit historisch gewesen sein mögen). In Untersuchungen der frühesten gestischen Kommunikation von Kleinkindern während des zweiten Lebensjahrs sind die aufgeführten nichtdeiktischen 159

Gesten nahezu ausschließlich konventionalisierte Gesten, die durch Imitation von Erwachsenen gelernt werden. Beispielsweise berichten Iverson, Capirci und Caselli über solche Dinge wie Kopfschütteln »Nein«, Winken »Tschüß«, Hochheben der Handflächen »Weg«, Hochheben der Arme für »Groß«, Pusten für »zu heiß«, mit den Armen schlagen für »Vögelchen«, Hecheln für »Hund« usw.54 Acredolo und Goodwyn berichten über eine systematische Untersuchung solcher »Babyzeichen«, die ebenfalls im zweiten Lebensjahr durchgeführt und in der große individuelle Schwankungen festgestellt wurden.55 Im allgemeinen ist die Verwendung solcher konventionalisierten Gesten um mehrere Größenordnungen seltener als die Verwendung einer Zeigegeste allein.56 Vieles deutet daraufhin, daß Kleinkinder diese konventionalisierten Gesten im Grunde auf dieselbe Weise erwerben, wie sie sprachliche Konventionen erwerben und verwenden. Erstens erwerben Kleinkinder diese beiden Arten von Konventionen grundsätzlich im selben Alter,57 was nahelegt, daß sie von derselben sozio-kognitiven Infrastruktur abhängen, und Kleinkinder, die konventionalisierte Zeichensprachen erwerben, wie etwa die amerikanische Gebärdensprache (American Sign Language), lernen ihre ersten konventionellen Zeichen ebenfalls im selben Alter.58 Zweitens werden neue arbiträre Gesten für Gegenstände in Studien ebensoleicht erworben wie neue Wörter für Gegenstände.59 Und drittens beeinflußt die Häufigkeit, mit der Kinder solche Gesten erleben, und die Art ihrer Einführung durch den Erwachsenen bei Namensgebungsspielen den Erwerb dieser Gesten auf 54 55 56 57 58 59

Iverson, Capirci und Caselli 1994. Acredolo und Goodwyn 1988. Iverson, Capirci und Caselli 1994, Camaioni et al. 2003. Acredolo und Goodwyn 1988. Schick 2005. Namy und Waxman 1998, Woodward und Hoyne 1999.

160

ziemlich die gleiche Weise, wie dieselben Dinge den Erwerb sprachlicher Konventionen beeinflussen60 - was in beiden Fällen auf ähnliche Lernprozesse hinweist. Eine große Zahl konventionalisierter Gesten ist zwar in gewisser Weise ikonisch, es ist jedoch nicht klar, ob Kleinkinder das bemerken oder Gebrauch davon machen - was diese Gesten abermals mehr als arbiträre sprachliche Konventionen erscheinen läßt.61 So werden Kinder, die konventionelle Zeichensprachen lernen, sowohl mit ikonischen als auch mit willkürlichen Gesten (das heißt Zeichen) konfrontiert, es gibt aber keine Präferenz oder einen Altersvorteil in bezug auf das Lernen ikonischer Zeichen.62 Außerdem zeigen 18 Monate alte Kleinkinder in Studien keine Präferenz für das Lernen ikonischer Gesten gegenüber arbiträren, wenn es um das Bezeichnen von Gegenständen geht.63 Das Verstehen der Ikonizität von Gesten oder auch eines anderen Mediums bei ganz kleinen Kindern muß erst noch überzeugend nachgewiesen werden. Wie steht es nun mit wirklich kreativen ikonischen Gesten in diesem frühen Alter? Darüber liegen zwar kaum Untersuchungen vor, aber Carpenter et al. haben über Tagebuchbeobachtungen ikonischer Gesten berichtet, die von Kleinkindern in den Monaten unmittelbar nach dem ersten Geburtstag höchstwahrscheinlich spontan erzeugt wurden.64 Sie waren zwar selten, aber alle beobachteten Kinder brachten eine oder mehrere davon bei verschiedenen Gelegenheiten hervor. Beispiel 22: Im Alter von 13 Monaten imitiert A spielerisch ein Beißverhalten, um eine Handlung anzuzeigen, die er mit 60 61 62 63 64

Namy, Acredolo und Goodwyn 2000, Namy und Waxman 2000. Tomasello, Striano und Rochat 1999. Folven und Bonvillian 1991, Orlansky und Bonvillian 1984. Namy, Campbell und Tomasello 2004. Carpenter et al., in Vorbereitung. 161

einem bestimmten Gegenstand nicht tun sollte. Soll heißen: Richte die Aufmerksamkeit auf mein Beißen; das werde ich mit diesem Gegenstand tun. Beispiel 23: Im Alter von 14 Monaten kippt A seinen Kopf zur Seite, um seiner Mutter zu zeigen, was sie tun sollte, um einen Eimer von ihrem Kopf herunterzubekommen. Soll heißen: Richte die Aufmerksamkeit auf meine Handlung; mach' es so! Beispiel 24: Im Alter von 14 Monaten »befingert« A seine Brust, schaut und lächelt seine Mutter an, deren Hemd mit Bändern verziert ist, mit denen er gerne spielen würde. Soll heißen: Richte die Aufmerksamkeit auf meine Handlung; ich mag diese Bänder (oder möchte gern dies mit ihnen tun). Beispiel 25: Im Alter von 17 Monaten imitiert A das Zusammenknüllen eines Balls aus Papier, um zu verlangen, daß jemand das tun soll. Soll heißen: Richte die Aufmerksamkeit auf meine Handlung; mach' das! Gehörlose Kinder, die keinen Kontakt mit irgendeiner konventionellen Sprache haben, gleichgültig ob es sich um eine gesprochene oder um eine Gebärdensprache handelt, verwenden solche ikonischen Gesten ziemlich häufig, aber wie sie diese Gesten genau erwerben (das heißt das Ausmaß, in dem sie von erwachsenen Vorbildern übernommen werden), wurde nicht ausführlich untersucht.65 Um solche kreativen ikonischen Gesten hervorzubringen, benötigen Kleinkinder auf jeden Fall bestimmte Fertigkeiten der Imitation, Simulation, symbolischen Repräsentation oder der Vortäuschung in dem Sinne, daß sie eine vertraute Handlung nicht wirklich 65 Goldin-Meadow 2003b. 162

vollziehen müssen, um ihre übliche Wirkung zu erzielen, sondern vielmehr nur zum Schein, um etwas zu kommunizieren, das mit jener abwesenden Handlung in Beziehung steht. Um ikonisch zu gestikulieren, ist es wichtig, daß Kleinkinder auch die Fähigkeit, eine Handlung außerhalb ihres gewöhnlichen Zusammenhangs (Simulation, Vortäuschung, Darstellung) zu vollziehen, mit einem Verständnis der Griceschen kommunikativen Absicht verknüpfen, also ihre simulierende Handlung mit einem Hinweis auf eine kommunikative Absicht versehen. Das ist deshalb nötig, weil, wie wir in Kapitel 3 bemerkt haben, der potentielle Verstehende andernfalls einfach glauben könnte, der Gestikulierende verhalte sich seltsam oder vollführe ein vorgespiegeltes Spiel, anstatt etwas über eine abwesende Situation mitzuteilen (siehe wiederum Leslies Argument für die Notwendigkeit, vorgespiegelte Handlungen von wirklichen Handlungen zu »isolieren«66). Kreative ikonische Gesten beinhalten also eine bestimmte Art symbolischer Repräsentation, die zum Zweck der zwischenmenschlichen Kommunikation hervorgebracht wird und die bei Zeigegesten auf präsente Dinge nicht erforderlich ist. Es gibt fast keine Untersuchungen zum Verstehen ikonischer Gesten kleiner Kinder, die gerade mit dem Sprachlernen angefangen haben, aber vermutlich erfordert das die ganze Infrastruktur, die zur Interpretation von Zeigegesten verwendet wird, nämlich einen gemeinsamen Aufmerksamkeitsrahmen, drei Schichten von Intentionen und praktisches Schlußfolgern, Annahmen über Kooperativität, Gricesche kommunikative Absichten usw. sowie zusätzlich die Fähigkeit, eine bestimmte Art symbolischer Abbildung herzustellen. In aktuellen Untersuchungen haben wir festgestellt, daß kleine Kinder große Schwierigkeiten haben, diese kreativen ikonischen Gesten zu verstehen, und zwar nicht nur dann, 66 Leslie 1987. 163

wenn diese eingesetzt werden, um Gegenstände zu verlangen,67 sondern auch, wenn sie verwendet werden, um gegenüber Kleinkindern zu simulieren, welche Handlung sie vollziehen müssen, um ein Problem zu lösen.68 Die Forschung von DeLoache deutet darauf hin, daß kleine Kinder besondere Schwierigkeiten mit symbolischen Repräsentationen haben, wenn es sich um ein physikalisches Medium handelt, etwa um ein Maßstabsmodell der räumlichen Anordnung eines wirklichen Zimmers.69 Insgesamt ist es jedoch trotz des relativen Mangels an Untersuchungen klar, daß Kleinkinder im zweiten Lebensjahr konventionalisierte Gesten viel seltener als die Zeigegeste verwenden, und noch seltener spontan erfundene ikonische Gesten. Das bedeutet, daß Zeigegesten - das Lenken der Aufmerksamkeit auf einen wahrzunehmenden präsenten Gegenstand - für kleine Kinder ein viel einfacheres und natürlicheres Kommunikationsmittel als ikonische Gesten sind, und tatsächlich ähneln frühe konventionalisierte Gesten in vielerlei Hinsichten eher sprachlichen Konventionen als ikonischen Gesten. Eine mögliche Implikation dieser Tatsachen für die menschliche Evolution ist, daß die primitivste Form menschlicher kooperativer Kommunikation - im Sinne von »erste« oder »ursprüngliche« - die Zeigegeste ist, während ikonische und konventionalisierte Gesten zusätzliche Fertigkeiten erfordern, und zwar insbesondere Fertigkeiten der Imitation und symbolischen Repräsentation.

67 Wie in der oben erwähnten Untersuchung von Tomasello, Striano und Rochat 1999. 68 Haimerl et al., in Vorbereitung. 69 DeLoache 2004. 164

4.3.2 Ikonische Gesten, So-tun-als-ob und Sprache Eine entscheidende Entwicklungstatsache ist folgende: Über das zweite Lebensjahr hinweg sinkt die Häufigkeit nichtdeiktischer (konventionalisierter und ikonischer) Gesten im Vergleich mit den Zeigegesten.70 Die Erklärung, die meist dafür angeführt wird, besagt, daß Kinder während dieser Zeit mit dem Spracherwerb beschäftigt sind und konventionalisierte und ikonische Gesten mit den sprachlichen Konventionen in einer Weise konkurrieren, wie es Zeigegesten nicht tun - möglicherweise weil ikonische und konventionalisierte Gesten und Sprache, aber nicht Zeigegesten, eine bestimmte Art von symbolischer Repräsentation und sogar Kategorisierung eines Bezugsgegenstands beinhalten. Experimentelle Belege für diese Schlußfolgerung stammen aus mehreren Untersuchungen. Erstens stellten Bretherton et al. fest, daß Kleinkinder es in den ersten Abschnitten ihres zweiten Lebensjahrs vorziehen, auf Gegenstände mit einer Zeigegeste hinzuweisen, während sie später im selben Jahr eine sprachliche Konvention präferieren, nachdem sie mehr Sprache zu erwerben angefangen haben.71 Zweitens fanden Namy und Waxman heraus, daß Kleinkinder am Anfang des zweiten Lebensjahres arbiträre Gesten und Wörter für Gegenstände gleich gut lernen, daß sie aber um den zweiten Geburtstag herum viel leichter Wörter als arbiträre Gesten lernen, wiederum nachdem der Spracherwerb intensiv eingesetzt hat.72 Im Gegensatz zu dieser Abnahme ikonischer und konventionalisierter Gesten nimmt die Häufigkeit der Zeigegeste über das zweite Lebensjahr hinweg zu, und wenn die Kleinkinder mit dem Spracherwerb beginnen, werden 70 Iverson, Capirci und Caselli 1994, Acredolo und Goodwyn 1988. 71 Bretherton et al. 1981. 72 Namy und Waxman 1998. 165

die Zeigegesten in diesen Prozeß integriert. Beispielsweise enthalten viele der frühesten komplexen Mitteilungen von Kleinkindern Kombinationen eines konventionellen Wortes und einer Zeigegeste, von denen jedes Element einen unterschiedlichen Aspekt der referentiellen Situation anzeigt.73 Diese Daten legen nahe, daß die Zeigegeste eine wichtige Funktion erfüllt, die sich von der der sprachlichen Kommunikation unterscheidet, während ikonische und konventionalisierte Gesten mit der Sprache um dieselbe Funktion konkurrieren. Interessanterweise verwenden Kleinkinder während derselben Entwicklungsperiode aber auch weiterhin so etwas wie ikonische Gesten zu nichtkommunikativen Zwecken: Sie fangen an, sich immer häufiger mit So-tun-als-ob- oder symbolischen Spielen zu beschäftigen. Wenn beispielsweise ein kleines Kind so tut, als ob es aus einer leeren Tasse trinkt, repräsentiert es gewissermaßen die wirkliche Handlung ikonisch; es tut dies jedoch nicht zu einem kommunikativen Zweck. Es könnte also sein, daß die biologische Prädisposition des Menschen, abwesende Gegenstände und Handlungen in der gestischen Modalität zu Kommunikationszwecken ikonisch zu repräsentieren, von der stimmlichen Sprache im Verlauf der normalen Ontogenese ersetzt wird, diese Fähigkeit sich aber statt dessen in vorgespiegelten Tätigkeiten manifestiert, in denen die Kinder abwesende Gegenstände und Handlungen zu spielerischen Zwecken symbolisch repräsentieren. Wenn ein kleines Kind so tut, als ob es aus einer leeren Tasse trinken würde, und den Erwachsenen spielerisch anschaut, könnte man sagen, daß es sich hier nicht nur um das So-tun-als-ob-Spiel zu seinem eigenen Vergnügen handelt, sondern darüber hinaus auch um eine ikonische Geste, um diese Repräsentation mit dem Erwachsenen kommunikativ zu teilen. 73 Ozcaliskan und Goldin-Meadow 2005. 166

Kinder beschäftigen sich die gesamte Kindheit über mit dem So-tun-als-ob-Spiel und werden dann schließlich zu Erwachsenen, die sich allen möglichen Arten von künstlerischen Unternehmungen widmen wie zum Beispiel dem Theater und der darstellenden Kunst. Was nun die Kommunikation betrifft, scheinen jedoch die nichtdeiktischen Gesten älterer Kinder und Erwachsener ihre Funktionsweise zu ändern, insofern sie angepaßt werden, um ergänzende Funktionen gegenüber der Sprache auszuüben. So argumentieren sowohl McNeill als auch Goldin-Meadow dafür, daß bei sprachlicher Kommunikation mit Blickkontakt die Sprache für die eher propositionalen Aspekte kommunikativer Botschaften verwendet wird, während begleitende Gesten bei den eher bildhaften Aspekten herangezogen werden, etwa um die Form von etwas Benanntem zu skizzieren oder um in der Phantasie einen Weg zu beschreiten, über den man spricht.74 Interessanterweise verwenden sehr kleine Kinder (jünger als etwa 3 Jahre) diese Art ergänzender Gesten beim Sprechen meistens nicht - zumindest nicht so wie Erwachsene - , obwohl das nur sehr wenig untersucht wurde. Es könnte also sein, daß die entwickelten Fähigkeiten von Menschen, die Welt zum Zweck zwischenmenschlicher Kommunikation ikonisch durch Gesten darzustellen, sich heute in der Ontogenese als Ergebnis des Entstehens der stimmlichen Sprache auf mehrere verschiedene Weisen manifestieren. Kleinkinder bringen sehr früh einige ikonische Gesten zur Kommunikation hervor, aber wenn die Sprache auftaucht, wird die Verwendung dieser Fähigkeiten zu So-tun-als-obSpielen »umgeleitet«, die in der Hauptsache selbstbezogen sind, aber manchmal auch andere einschließen. Die Verwendung von Gesten als Ergänzungen zur Sprache in der Faceto-face-Kommunikation macht eine allmähliche und recht 74 McNeill 2005, Goldin-Meadow 2003a. 167

lange Entwicklung durch, in deren Verlauf die Kinder lernen müssen, ihre kommunikative Botschaft zwischen stimmlicher Sprache und ergänzenden Gesten aufzuteilen (hier kann es von Sprache zu Sprache Unterschiede geben).75 Aus einer evolutionären Perspektive sind dies alles äußerst wichtige Tatsachen, da sie uns unter anderem zeigen, daß Menschen, als sie begannen, stimmliche Konventionen zu verwenden, damit nicht Zeigegesten, sondern Gebärden ersetzten.

4.4 Geteilte Intentionalität und frühe Sprache In Kapitel 3 habe ich dargelegt, daß der Alltagsgebrauch der Sprache von der Infrastruktur geteilter Intentionalität grundsätzlich genauso abhängt wie das Zeigen und andere natürliche Gesten. Von besonderer Bedeutung ist eine bestimmte Art gemeinsamer Aufmerksamkeit oder gemeinsamen Hintergrunds zwischen dem Kommunizierenden und dem Empfänger, die die Grundlage geteilten Verstehens darstellt, auf der sprachliche Konventionen ausgewählt und verstanden werden. Die Notwendigkeit des gemeinsamen Hintergrunds ist sogar noch augenfälliger beim Spracherwerb: Wenn ein Erwachsener »Gavagai« äußert, wie soll das kleine Kind dann verstehen, ohne auf ihren geteilten gemeinsamen Hintergrund zurückzugreifen? Die entscheidende Rolle der Infrastruktur geteilter Intentionalität beim Spracherwerb und bei der Sprachverwendung, einschließlich der gemeinsamen Aufmerksamkeit und des gemeinsamen Hintergrunds, ist die zentrale Prämisse der sozial-pragmatischen Theorie des Spracherwerbs, die Bruner, Nelson und Tomasello vertreten.76 75 McNeill 2005. 76 Bruner 1983/1987, Nelson 1985,1996, Tomasello 1992b, 2003. 168

4-4-1 Der Erwerb sprachlicher Konventionen Bald nachdem Kleinkinder mit dem Zeigen beginnen und um ihren ersten Geburtstag herum ikonische und konventionalisierte Gesten verwenden, fangen sie auch an, sprachliche Konventionen zu verstehen und zu benutzen. So überraschend es auch sein mag, die meisten vorhandenen Theorien des Spracherwerbs haben keine systematische Erklärung dafür, warum Kleinkinder mit dem Spracherwerb genau in diesem Alter beginnen. In Blooms Worten: »Letztlich weiß niemand, warum das Lernen von Wörtern mit etwa 12 Monaten einsetzt, und nicht mit sechs Monaten oder drei Jahren.«77 Aber das gilt nur für Theoretiker, die meinen, daß der Spracherwerb in einer Assoziation von Wörtern mit Dingen oder vielleicht von Wörtern mit Begriffen besteht, ohne die kooperative Infrastruktur geteilter Intentionalität zu berücksichtigen.78 Wenn Kleinkinder nur zuverlässig einen bestimmten Laut mit einer Erfahrung assoziieren müßten (die typische Metapher ist »Abbildung«), um eine sprachliche Konvention zu lernen, dann sollten sie schon im Alter von sechs Monaten mit dem Spracherwerb beginnen - da sie in diesem Alter zur Herstellung solcher Assoziationen ohne weiteres in der Lage sind.79 Der sozial-pragmatischen Theorie des Spracherwerbs zufolge ist der enge zeitliche Entwicklungszusammenhang zwischen gestischer und sprachlicher Kommunikation jedoch durchaus zu erwarten, weil sowohl Gesten als auch Sprache innerhalb desselben zwischenmenschlichen Zusammenhangs geteilter Intentionalität gelernt werden - und dieser entsteht, wie dargelegt, im Alter zwischen etwa 9 bis 12 Monaten. 77 Bloom 2ooo, S. 45. 78 Tomasello 2004. 79 Haith und Benson 1997. 169

Quine erfaßte dieses Problem am deutlichsten in seiner berühmten Parabel (obwohl Quine selbst sich auf eine etwas anders geartete philosophische Frage bezog):80 Ein Fremder besucht eine unbekannte Kultur. Da läuft ein Hase vorbei. Ein Einheimischer der Kultur macht eine Äußerung, die vermutlich etwas Sprachliches darstellt: »Gavagai«. Unter der Annahme, daß der Fremde weiß, daß es sich um einen Kommunikationsakt handelt, stellt sich immer noch die Frage: Wie soll er wissen, ob der Einheimische versucht, seine Aufmerksamkeit auf den Hasen, sein Bein, seine Farbe, sein Fell, sein Laufen, ein mögliches Abendessen usw. zu lenken? Die Antwort ist, daß das ohne irgendwelche Formen geteilter Erfahrung oder eines gemeinsamen Hintergrunds mit dem einheimischen Sprecher (welche für den Zweck der Parabel eigens ausgeschlossen werden) einfach unmöglich ist. Quine sagt selbst: »Die Kunstfertigkeit der Sprache ist etwas Gesellschaftliches. Bei ihrem Erwerb müssen wir uns ganz und gar auf Anhaltspunkte verlassen, die intersubjektiv zugänglich sind und uns jeweils erkennen lassen, was wir wann sagen müssen.«81 Insbesondere beim Spracherwerb können sich Kinder den erforderlichen gemeinsamen Hintergrund auf eine von zwei möglichen Weisen aneignen. Zum einen über gemeinschaftliche Interaktionen mit anderen, die gemeinsame Ziele haben, welche eine abwärtsgerichtete gemeinsame Aufmerksamkeit erzeugen. Um das zu illustrieren, wollen wir uns eine Variation von Quines Parabel vorstellen. Angenommen, es gibt im Dorf des Einheimischen eine kulturelle Praxis, kleine Fische für das Abendessen auf bestimmte Weise zu fangen: Zuerst muß man einen Eimer (der sich üblicherweise in einer bestimmten Hütte befindet) und eine Stange holen (die sich 80 Quine 1960/1980. 81 Quine i960, S. ix, 1980, S. 13. 170

normalerweise außerhalb derselben Hütte befindet), dann muß man mit beidem zum Bach gehen. Jede Person muß sich nun auf eine Seite des Baches stellen und ein Ende der Stange halten, wobei der Eimer so in die Mitte der Stange gehängt wird, daß das Wasser in ihn hineinfließt usw. Nehmen wir außerdem an, daß der Fremde gerade dabei ist, mit dieser Praxis durch wiederholte Mitwirkung vertraut zu werden. Nun nimmt der Einheimische eines Abends zur Zeit der Essensvorbereitung die Stange, die vor der Hütte steht, und zeigt dem Fremden gegenüber durch die Tür auf das Innere der Hütte - vielleicht sagt er dabei »Gavagai«. In dem Maße, in dem der Fremde die Praxis versteht, wird er wissen, daß der Einheimische von ihm verlangt, den Eimer aus der Hütte zu holen, so daß sie zusammen fischen gehen können. Daher bedeutet das Wort gavagai höchstwahrscheinlich entweder »Eimer« oder »holen« oder vielleicht etwas Allgemeineres wie »dieses« oder »dort«. Wenn aber der Einheimische bei der Ankunft am Bach dem Fremden gegenüber zu verstehen gibt, daß er etwas anderes holen soll, er dabei ebenfalls das Wort gavagai verwendet und dieses Wort nicht benutzt, um auf Dinge Bezug zu nehmen, die nicht geholt zu werden brauchen, dann kann unser Fremder anfangen, die einheimische Sprache zu knacken. Ein Großteil des frühen Spracherwerbs bei Kindern folgt genau diesem Muster. Bruner stellte Belege dafür vor, daß nahezu die gesamte früheste Sprache von Kindern innerhalb von alltäglichen gemeinschaftlichen Interaktionen mit reifen Sprechern einer Sprache erworben wird.82 In der westlichen Kultur handelt es sich dabei um solche Dinge wie Essen im Kinderstuhl, mit dem Auto fahren, Windeln wechseln, Enten am Teich füttern, einen Turm aus Bauklötzen bauen, ein Bad nehmen, das Spielzeug aufräumen, den Hund füttern, Le82 Bruner 1983/1987. 171

bensmittel einkaufen usw. Bei jeder dieser Praktiken lernt das Kleinkind - so, wie unser Fremder - zuerst, an der jeweiligen Praxis mitzuwirken und mit dem anderen gemeinsame Ziele auszubilden, und das ermöglicht es ihm zu verstehen, was die andere Person tut (im Sinne ihrer Ziele und Absichten) und warum sie es tut (im Sinne dessen, warum in der gegenwärtigen Situation mit ihren besonderen Umständen ein bestimmter Plan gewählt wurde und nicht ein anderer). Das bestimmt wiederum in großem Maß den Bereich gemeinsamer Aufmerksamkeit und worauf sich die Aufmerksamkeit der anderen Person zu jedem Zeitpunkt der Tätigkeit konzentriert und daher auch das, worüber sie mit einem neuen Ausdruck sehr wahrscheinlich spricht. Zukünftige Verwendungen desselben Ausdrucks in anderen Kontexten dienen dann dazu, die Menge der möglichen intendierten Bezugsgegenstände und Botschaften noch stärker einzugrenzen. Schon bald erwerben Kinder die Fähigkeit, neue Wörter in allen Arten gemeinschaftlicher Interaktionen zu lernen. Beispielsweise ließen Tomasello, Strosberg und Akhtar einen Erwachsenen und ein 18 Monate altes Kleinkind ein Spiel spielen, bei dem ein Gegenstand gefunden werden sollte.83 Bei diesem Spiel verkündete der Erwachsene irgendwann seine Absicht, »das Torna zu finden«. Er suchte dann in einer Reihe von Eimern, die alle neue Gegenstände enthielten (wobei er einige mit schiefem Blick aussortierte und ersetzte), bis er denjenigen fand, den er haben wollte (was durch ein Lächeln und die Beendigung der Suche angezeigt wurde). Die Kinder lernten das neue Wort Torna für den Gegenstand, der durch das Lächeln des Erwachsenen angezeigt wurde, und zwar unabhängig davon, wie viele Gegenstände zuvor aussortiert wurden, wodurch ein einfacher Assoziationsprozeß, der auf raumzeitlicher Nähe beruht, ausgeschlossen wurde. Tatsäch83 Tomasello, Strosberg und Akhtar 1996. 172

lieh fanden wir heraus,84 daß 18 Monate alte Kleinkinder bei einem ähnlichen Spiel den vom Erwachsenen intendierten Gegenstand sogar dann identifizieren konnten, wenn sie ihn selbst nie sahen, weil es ein Gegenstand war, von dem sie wußten, daß er in einer Spielzeugkiste eingeschlossen war, in die der Erwachsene hineinzugelangen versuchte.85 Um das neue Wort in diesen Situationen zu lernen, mußte das Kind im Grunde die intentionale Struktur des gemeinsamen Suchspiels verstehen und praktische, ja sogar kooperative Schlußfolgerungen über die Handlungen des Erwachsenen in diesem Spiel anstellen. Der zweite Weg, um gemeinsame Aufmerksamkeit für das Lernen von Wörtern herzustellen, führt von unten nach oben. Beispielsweise könnte einfach ein fremdartiges Tier einem Vater und seinem Kind während ihres Spaziergangs im Park über den Weg laufen, und der Vater könnte es dann benennen. Man könnte annehmen, daß Kleinkinder in solchen Situationen einfach den Namen des neuen Tieres egozentrisch lernen und ihn mit dem verknüpfen, was für sie alleine auffällig ist. Aber das geschieht nicht. Schon sehr früh in ihrer Entwicklung verstehen kleine Kinder, daß der Erwachsene, wenn er einen neuen sprachlichen Ausdruck gebraucht, sie dazu auffordert, seinen Aufmerksamkeitsfokus zu teilen. So wartete Baldwin, bis ein 18 Monate altes Kind sich auf einen Gegenstand konzentrierte.86 Dann richtete sie ihren Blick auf einen anderen Gegenstand und benannte diesen. Die Kinder lernten das Wort nicht für den Gegenstand, auf den sie sich schon konzentriert hatten, sondern vielmehr für jenen, auf den der Erwachsene schaute und sie aufforderte, ihre Aufmerksamkeit auf ihn zu richten. Auf ähnliche und noch ein84 Ebd. 85 Siehe ähnliche Untersuchungen bei Tomasello 2001. 86 Baldwin, 1991. 173

drucksvollere Weise ließen Akhtar, Carpenter und Tomasello ein Kind, seine Mutter und einen Versuchsleiter mit drei neuen Gegenständen spielen.87 Anschließend verließ die Mutter den Raum. Ein vierter neuer Gegenstand wurde hervorgeholt, und das Kind und der Versuchsleiter spielten mit ihm. Als die Mutter in das Zimmer zurückkam, sah sie gleichzeitig auf die vier Gegenstände und rief dem Kind gegenüber aus »Oh, toll! Ein Modi! Ein Modi!« Da sie verstanden, daß die Mutter höchstwahrscheinlich über den Gegenstand, den sie zum ersten Mal sah, in Begeisterung geraten war, lernten 24 Monate alte Kinder das neue Wort für diesen Gegenstand (obwohl sie selbst mit allen vier Gegenständen gleich vertraut waren). Um das neue Wort in diesen Situationen zu lernen, mußten die Kinder nicht nur herausbekommen, was für den Erwachsenen hervorstach, sondern auch, was der Erwachsene meinte, was für sie hervorstechend war - eigentlich was der Erwachsene meinte, was sie denken würden, was der Erwachsene denken würde, was für sie hervorstechend war usw. Sie mußten sich den erforderlichen gemeinsamen Hintergrund vorstellen. Wenn gemeinsame Aufmerksamkeit sehr allgemein als gemeinsamer visueller Fokus auf potentielle Bezugsgegenstände gefaßt wird, stellt man fest, daß sie bei kleinen Kindern recht stark mit dem anfänglichen Erwerb von Wörtern korreliert.88 Insbesondere erleichtert die Art und Weise, wie Mütter Sprache innerhalb eines Rahmens gemeinsamer Aufmerksamkeit verwenden, ihren Kindern den Erwerb von Wörtern, während die Art und Weise, wie Mütter außerhalb eines solchen Rahmens Sprache verwenden, keine Wirkung hat. Wir kön87 Akhtar, Carpenter und Tomasello 1996. 88 Tomasello und Farrar 1986, Carpenter, Nageil und Tomasello 1998, siehe die Übersichten bei Tomasello 1988, 2003 über ähnliche Befunde. 174

nen uns also die Rahmen gemeinsamer Aufmerksamkeit als »kritische Punkte« des Spracherwerbs vorstellen. Interessanterweise scheint diese Korrelation jedoch über das zweite Lebensjahr hinweg abzunehmen.89 Das könnte aus zwei Gründen geschehen. Erstens könnten Kleinkinder den flexibleren Erwerb neuer Wörter durch das »Ablauschen« des Sprachgebrauchs Dritter untereinander erlernen90 - möglicherweise indem sie sich vorstellen, selbst an der Interaktion beteiligt zu sein, die sie, daran beteiligt oder nicht, aus einer »Vögelperspektive« verstehen.91 Zweitens kann es sein, daß die gemeinsame visuelle Aufmerksamkeit für den Spracherwerb weniger wichtig wird, sobald Kinder in der Lage sind, die Sprache selbst zu verwenden, um gemeinsame Aufmerksamkeit herzustellen. Ab einem bestimmten Punkt müssen sie beispielsweise nicht mehr herausfinden, worauf die visuelle Aufmerksamkeit des Erwachsenen fokussiert ist, wenn er zu ihnen sagt »Gib mir den Modi, mit dem du spielst«, weil sie die Bedeutung der Sprache um das unbekannte Wort herum kennen, und damit den Rahmen gemeinsamer Aufmerksamkeit, innerhalb dessen das neue Wort verstanden wird. Jedenfalls deuten diese theoretischen Betrachtungen und die empirischen Befunde sämtlich auf dieselbe Schlußfolgerung hin: Kleine Kinder lernen ihre ersten sprachlichen Konventionen nicht einfach, indem sie willkürliche Laute einfach individualistisch mit wiederkehrenden Erfahrungen assoziieren oder darauf abbilden. Sie erwerben ihre sprachlichen Konventionen vielmehr dadurch, daß sie versuchen zu verstehen, wie andere bestimmte Laute verwenden, um ihre Aufmerksamkeit innerhalb des Raums ihres derzeit gemeinsamen Hintergrunds zu lenken. Manchmal vollzieht 89 Carpenter, Nageil und Tomasello 1998. 90 Akhtar, Jipson und Callanan 2001. 91 Tomasello 1999/2002. 175

sich diese Steuerung von oben nach unten durch die gemeinsame, kollaborative Tätigkeit des Zusammenwirkens, an der sie gerade beteiligt sind, und manchmal auch durch andere Formen eines von unten nach oben gerichteten gemeinsamen Hintergrunds. Dies ist natürlich derselbe elementare Prozeß, der das anfängliche Verstehen von Zeigegesten und anderen Gesten bei Kleinkindern unterstützt. Ohne irgendeine Art von sinnvoller sozialer Interaktion mit dem Erwachsenen, der den neuen sprachlichen Ausdruck verwendet, hören Kinder nur Geräusche, die aus dem Mund anderer kommen; sie erleben andere nicht als Personen, die ihre Aufmerksamkeit sinnvoll lenken. Anschließend müssen sie die Konvention durch Nachahmung lernen, indem sie die Nachahmung durch Rollentausch vollziehen, bei dem sie den erworbenen sprachlichen Ausdruck anderen gegenüber auf dieselbe Weise verwenden, wie die anderen ihn ihnen gegenüber verwendet haben.

4.4.2 Der Gebrauch sprachlicher Konventionen Kleine Kinder produzieren ihre frühesten referentiellen Sprachäußerungen typischerweise im Alter von 14 bis 18 Monaten. In der überwiegenden Mehrheit der Fälle haben sie zuvor einige Wochen oder Monate durch Gesten kommuniziert. In der Untersuchung von Carpenter, Nageil und Tomasello hatten alle 24 Kleinkinder bereits irgendeine Art von kommunikativer Geste (typischerweise Zeigegesten) verwendet, bevor sie mit dem Gebrauch der referentiellen Sprache begannen.92 Obwohl es theoretisch möglich ist, daß Kinder Sprache im Kontext eines bestimmten gemeinsamen Hintergrunds verwenden, bevor sie irgendwelche Gesten hervor92 Carpenter, Nagell und Tomasello 1998. 176

bringen, ist es doch beachtlich, daß die große Mehrheit zuerst gestikuliert und damit die Infrastruktur geteilter Intentionalität der Sprache zum Zwecke des Gebrauchs vorsprachlicher Gesten errichtet. Die frühesten Motive von Kleinkindern für sprachliche Kommunikation sind dieselben wie für Zeigegesten: Informieren, Auffordern (einschließlich des Bittens um Information) und Einstellungen teilen.93 Oft verwenden Kleinkinder ihre ersten sprachlichen Ausdrücke genauso wie die Erwachsenen, indem sie in denselben oder ähnlichen Situationen einfach die Rollen mit ihnen tauschen. Beispielsweise beobachteten Ratner und Bruner ein kleines Kind kurz nach seinem ersten Geburtstag dabei, wie es mit seiner Mutter das Spiel »Puppenverstecken« spielte.94 In wiederholten Runden neigte die Mutter dazu, an derselben Stelle des Spiels »weg« zu sagen, gerade nachdem die Puppe verschwunden war. Es überrascht nicht, daß die erste Produktion von »weg« seitens des Kindes einfach in dem bestand, was die Mutter zuvor an derselben Stelle getan hatte. Kinder benennen auch Gegenstände gegenüber Erwachsenen, indem sie die Rollen im Benennungsspiel tauschen, mit dem der Erwachsene zuvor angefangen hatte. Allerdings lernen Kinder auch Teile der Sprache von Erwachsenen, mit denen man auf die Welt Bezug nehmen kann, um diese dann für andere Zwecke als die Erwachsenen zu verwenden. Beispielsweise fragen viele Eltern ihre Kinder im Hinblick auf Essen »Möchtest du noch mehr?«. Wenn die Kinder anfangen, Teile dieses Ausdrucks 93 Drei spezifischere Funktionen, die kleine Kinder ebenfalls recht häufig in einem frühen Stadium ihrer Sprachentwicklung erwerben und die typischerweise nicht zusammen mit Zeigegesten auftreten sind Äußerungen der Dankbarkeit (»Danke«), des Grüßens (»Hallo« und »Tschüß«) und des Sich-Entschuldigens (»Entschuldigung«), wie unvollkommen sie diese Funktionen auch verstehen mögen. 94 Ratner und Bruner 1978. 177

zu gebrauchen, dann verwenden sie ihn, um »Mehr!« zu verlangen. Das Kind lernt also den referentiellen Ausdruck vom elterlichen Vorbild, verwendet ihn dann aber für seine eigenen Zwecke. Die frühkindliche Verwendung sowohl von Zeigegesten als auch von Sprache weist dieselbe Komplementarität zwischen dem auf, was in der referentiellen Handlung selbst ausgedrückt werden muß, und dem, was im gemeinsamen Hintergrund implizit gelassen werden kann, das heißt, Zeigegesten und sprachliche Äußerungen haben dieselbe »Informationsstruktur«. So setzt das Zeigen den gemeinsamen Aufmerksamkeitshintergrund als »Thema« (alte oder geteilte Information) voraus, und die Zeigehandlung selbst ist in Wirklichkeit eine Prädikation oder ein Fokus, der den Empfänger über etwas Neues informiert, das der Aufmerksamkeit wert ist. In anderen Fällen dient das Zeigen dazu, ein neues Thema zu bestimmen, über das dann weitere Dinge mitgeteilt werden. Beides sind Funktionen, die in der sprachlichen Kommunikation von ganzen Äußerungen erfüllt werden können.95 Wenn Kleinkinder erstmals zu sprechen anfangen - wenn ihre sprachliche Kompetenz noch auf Ein-Wortoder Zwei-Wort-Äußerungen beschränkt ist - , beziehen sie sich meist auf komplexe Situationen, indem sie den »informativsten« Ausdruck verwenden, über den sie verfügen. Wenn beispielsweise ein neuer Gegenstand erscheint oder ein schon vorhandener Gegenstand in eine neue Tätigkeit eingebunden wird, neigen Sprachanfänger dazu, auf das neue Element in der Situation zu referieren.96 Belege aus jüngerer Zeit zeigen, daß Kinder schon vom zweiten Geburtstag an das neue Element wegen seiner Neuheit nicht für sich selbst, sondern für 95 Siehe Lambrechts Prädikatfokus- und Satzfokuskonstruktionen 1994. 96 Greenfield und Smith 1976. 178

den Hörer auswählen.97 Außerdem sind viele der frühen Äußerungen von Kindern Kombinationen aus Gesten (hauptsächlich Zeigegesten) und Wörtern, die die Funktionen des Themas und des Fokus verschieden aufteilen,98 was ebenfalls auf eine gemeinsame Infrastruktur für Gesten und Sprache hinweist.

4.4.3 Zusammenfassung Viele Tiere können Laute mit Erfahrungen assoziieren, und menschliche Kleinkinder können das schon im Alter von wenigen Monaten. Wenn die Assoziation oder »Abbildung« alles wäre, was beim Erwerb einer sprachlichen Konvention geschieht, dann würden wir überall im Tierreich Sprache antreffen, und Kinder würden mit drei Monaten zu sprechen beginnen. Tatsache ist jedoch, daß Tiere und junge Kleinkinder sprachliche Konventionen weder erwerben noch verwenden, weil »arbiträre« sprachliche Konventionen nur im Kontext eines gemeinsamen begrifflichen Hintergrunds mit reifen Sprechern erworben werden können, und zwar häufig bei gemeinschaftlichen Tätigkeiten mit gemeinsamen Zielen und gemeinsamer Aufmerksamkeit. Das wiederum wird in 97 Campbell, Brooks und Tomasello 2000, Wittek und Tomasello 2005, Matthews et al. 2006. Wenn kleine Kinder unangemessene referierende Ausdrücke verwenden, die zu Mißverständnissen fuhren, ist interessanterweise das nützlichste Mittel, ihnen beizubringen, angemessenere Ausdrücke im Hinblick auf die Perspektive des Empfängers auszuwählen, daß der Erwachsene sein Unverständnis auffallig signalisiert, anstatt einfach Beispiele angemessener Referenzhand. lungen vorzuführen. Solche Beispiele sind weniger hilfreich, weil sie nicht mit dem Mißverstehen der Kinder verbunden sind (Matthews, Lieven und Tomasello 2007). 98 Tomasello 1988, Ozcaliskan und Goldin-Meadow 2005, Iverson und Goldin-Meadow 2005. 179

der menschlichen Ontogenese erst um den ersten Geburtstag herum möglich und stützt sich auf für den Menschen einzigartige Fertigkeiten und Motive für geteilte Intentionalität.

4.5 Schlußfolgerung In diesem Kapitel habe ich versucht, Argumente dafür zu liefern, daß die gestische Kommunikation von Kleinkindern, insbesondere Zeigegesten, von einer Art ist, die sich auf die vollständig ausgebildete Erwachsenenstruktur zubewegt, wobei die eine oder andere Verfeinerung erst später hinzukommt. Zugleich habe ich damit empirische Belege für viele Bestandteile des Kooperationsmodells im allgemeinen und für drei spezifische Hypothesen geliefert. Erstens ist die vollständige kooperative Infrastruktur grundsätzlich schon ausgebildet, bevor der Spracherwerb ernsthaft beginnt, wie verschiedene experimentelle Untersuchungen der Zeigegesten von 12 Monate alten Kleinkindern zeigen, die hier vorgestellt wurden. Natürlich sind Kinder von Geburt an von Sprache umgeben, und man könnte vermuten, daß sie davon irgendwie beeinflußt werden, obwohl sie selbst noch nicht sprechen können. Aber die frühen Zeigegesten gehörloser Kleinkinder, die keiner systematischen stimmlichen Sprache oder Zeichensprache ausgesetzt waren, sind im wesentlichen dieselben wie die von hörbegabten Kleinkindern." Deshalb behaupten wir, daß die ersten Anzeichen einzigartig menschlicher Formen kooperativer Kommunikation ontogenetisch in der vorsprachlichen gestischen Kommunikation zu finden sind - insbesondere in der Zeigegeste - und daß sie nicht von der Sprachproduktion oder vom Sprachverstehen abhängen. 99 Lederberg und Everhart 1998, Spencer 1993.

180

Obwohl das Zeigen und andere Gesten typischerweise vor der Sprache auftauchen, treten sie zweitens erst nach den konstitutiven Fertigkeiten individueller und geteilter Intentionalität auf. Tatsächlich haben wir festgestellt, daß Kleinkinder schon sehr früh mindestens zwei Motive für Zeigegesten haben: etwas von Erwachsenen zu verlangen und Gefühle mit ihnen zu teilen. Außerdem können sie die Hände zum Zeigen formen. Aber die ersten Zeigegesten verwenden Kleinkinder erst dann, wenn sie andere als intentionale Akteure verstehen und sich mit ihnen an Interaktionen beteiligen, die gemeinsame Aufmerksamkeit beanspruchen. Dieses ontogenetische Muster - zusammen mit mehreren experimentellen Untersuchungen - bietet eine breite Unterstützung für viele der postulierten Bestandteile des Kooperationsmodells menschlicher Kommunikation, einschließlich der entscheidenden Rolle gemeinsamer Aufmerksamkeitsrahmen und anderer Formen gemeinsamen Hintergrunds. Drittens stützen der erstmalige Erwerb und die erstmalige Verwendung sprachlicher Konventionen von Kleinkindern das Kooperationsmodell. Das Problem der referentiellen Unbestimmtheit entsteht genau dann, wenn eine bezugnehmende Handlung aus den Kontexten geteilter Intentionalität, in denen sich der Spracherwerb normalerweise vollzieht, herausgenommen wird. Wenn Kinder erleben, wie ein Erwachsener eine sprachliche Konvention außerhalb solcher Kontexte verwendet, erwerben sie nämlich gar nichts. Aber wenn Kinder erleben, wie ein Erwachsener eine sprachliche Konvention innerhalb solcher intrinsisch bedeutungshaltigen Kontexte verwendet, sind sie sehr oft in der Lage, unabhängig von ihren sprachlichen Fähigkeiten zu verstehen, was mitgeteilt wird, und können daher einen produktiven Gebrauch dieser Konvention erwerben. Sie verwenden sie dann so, daß sie sich, funktional gesehen, nicht so sehr von ihrer Verwendung von Zeigegesten und ikonischen Gesten unterschei181

den. In der Tat werden Gesten und die frühe Sprache oft gemeinsam verwendet. In der Regel ersetzen frühe sprachliche Konventionen nicht das Zeigen, das oft die Sprache ergänzt, sondern vielmehr ikonische Gesten, die ähnlich wie die Sprache funktionieren, insofern sie sowohl symbolisch als auch kategorisch sind.

182

5 Phylogenetische Ursprünge

Wie ich ja auch, wenn ich jemandem den Weg weisen will, mit dem Finger in der Richtung weise, in der er gehen soll, und nicht in der entgegengesetzten.... Es liegt in der menschlichen Natur, das Zeigen mit dem Finger so zu verstehen. Und so ist die menschliche Gebärdensprache primär in einem psychologischen Sinne. Ludwig Wittgenstein, The Big Typescript

Wenn die Behauptung lautet, daß menschliche Kommunikation grundlegend kooperativ ist, haben wir ein Problem. Insbesondere haben wir ein Problem mit der Erklärung ihrer Entstehung, da in der modernen Biologie die Evolution der Kooperation bekanntlich eine spezielle Behandlung erfordert, wenn es überhaupt einen Hinweis darauf gibt, daß das Individuum seine eigenen Interessen denen von anderen altruistisch unterordnet, etwa in Hilfehandlungen. Wir müssen deshalb erklären, warum Menschen so sehr motiviert sind, ihren Artgenossen entgegenzukommen, die auf kommunikativem Wege Hilfe von ihnen verlangen, und warum menschliche Kommunizierende die Motivation haben, anderen wirklich Hilfe anzubieten, indem sie sie uneigennützig zu ihren Gunsten informieren. Warum hinterlassen Individuen, die sich auf diese Weise altruistisch verhalten, mehr Nachkommen? Wir glauben, daß die menschliche kooperative Kommunikation ursprünglich deshalb adaptiv war, weil sie im Kontext mutualistischer, gemeinschaftlicher Tätigkeiten entstand, bei denen Individuen, die anderen halfen, damit zugleich sich selbst halfen. Das ist nicht ganz so offensichtlich, wie es zunächst klingt, da kooperative Kommunikation heute für alle möglichen Arten von hinterlistigen, kompetitiven und sonstigen individualistischen Zwecken eingesetzt werden kann. 183

Daher könnten solche Zwecke theoretisch ebenfalls Kontexte gewesen sein, in denen die Kommunikation menschlichen Stils entstand. Der in diesem Buch unterbreitete Vorschlag lautet jedoch, daß Fertigkeiten kooperativer Kommunikation am Anfang ausschließlich in durch und durch gemeinschaftlichen Tätigkeiten entstanden sind und eingesetzt wurden (Tätigkeiten, die durch gemeinsame Ziele und Aufmerksamkeit strukturiert waren, wodurch der notwendige gemeinsame begriffliche Hintergrund hergestellt wurde). Erst später wurde die kooperative Kommunikation zum Gebrauch außerhalb gemeinschaftlicher Tätigkeiten und für nichtkooperative Zwecke, wie zum Beispiel Lügen, kooptiert. Die enge Beziehung zwischen gemeinschaftlichen Tätigkeiten und kooperativer Kommunikation läßt sich am leichtesten daran erkennen, daß beide auf derselben zugrundeliegenden Infrastruktur rekursiv strukturierter gemeinsamer Ziele und gemeinsamer Aufmerksamkeit, gemeinsamen Motiven und sogar Normen des Helfens und Teilens und anderen Manifestationen geteilter Intentionalität beruhen. Diese Infrastruktur zeigt sich am deutlichsten in der Tatsache, daß man bei Menschenaffen nichtkooperative Formen sowohl von Gruppenaktivitäten als auch von intentionaler Kommunikation findet, denen Fertigkeiten des Verstehens individueller Intentionalität zugrunde liegen, während menschliche Kleinkinder kooperative Formen der Zusammenarbeit und der Kommunikation entwickeln, die auf Fertigkeiten und Motivationen geteilter Intentionalität beruhen (und zwar vor dem Spracherwerb). Wir glauben daher, daß unsere evolutionäre Darstellung mehr als nur eine weitere Ad-hoc-Erklärung ist, weil uns die gemeinsame Infrastruktur geteilter Intentionalität, die sowohl den gemeinschaftlichen als auch den kommunikativen Tätigkeiten heute lebender Menschen zugrunde liegt, ein deutliches Indiz für ihren gemeinsamen evolutionären Ursprung liefert. 184

Wenn wir über kooperative Kommunikation in mutualistischen Kontexten hinausgehen wollen, müssen wir irgendwann auch Prozesse indirekter Reziprozität betrachten, bei denen Individuen sich um das Ansehen sorgen, das sie in der sozialen Gruppe genießen, schließlich trägt der Ruf, ein guter Helfer und Mitarbeiter zu sein, signifikant zum gesellschaftlichen Erfolg bei. Diese Prozesse müssen insbesondere auch deshalb unter die Lupe genommen werden, weil wir die menschliche Neigung erklären wollen, andere gerade nicht nur in Kontexten, in denen man selbst profitiert, einfach auf hilfreiche Weise über Dinge zu informieren. Später werden wir auch Prozesse der gesellschaftlichen Identifikation, Zugehörigkeit und Konformität in Betracht ziehen müssen, um das Motiv des Teilens zu erklären, dessen Funktion nach der momentanen Vermutung darin besteht, den gemeinsamen Hintergrund mit anderen und das Gefühl gesellschaftlicher Zugehörigkeit zu stärken. Dadurch wird jene Art von Homogenität innerhalb der Gruppe erreicht, die nötig ist, damit die natürliche Selektion auf der Ebene der kulturellen Gruppe wirken kann. Dieser Prozesse gesellschaftlicher Identifikation bedarf es außerdem, um die Tatsache zu erklären, daß die menschliche Kommunikation von sozialen Normen geregelt wird, die vorschreiben, wie etwas getan werden soll (vernünftigen Aufforderungen nachzukommen, nicht zu lügen usw.), wenn man ein voll funktionsfähiges Mitglied der sozialen Gruppe sein will. Schließlich beginnen wir in diesem Kapitel (und fahren im nächsten damit fort), eine Erklärung dafür zu liefern, wie sich menschliche Fertigkeiten sprachlicher Kommunikation auf diese schon vorhandene Plattform kooperativer Kommunikation evolutionär aufbauen, um Menschen mit der flexibelsten, ausbau- und leistungsfähigsten Form von Kommunikation auf diesem Planeten auszustatten. Dazu werden wir zusätzlich zur Infrastruktur geteilter Intentionalität Fertiges

keiten des kulturellen Lernens und der Imitation (einschließlich der Imitation durch Rollentausch) in Anschlag bringen müssen, die die Schaffung von Kommunikationskonventionen ermöglichen, die von der ganzen Gruppe geteilt werden. Wir werden dafür argumentieren, daß arbiträre Kommunikationskonventionen - zuerst gestische und dann stimmliche, wobei es eine Phase der Überschneidung gibt - nur dadurch entstanden sein können, daß sie auf handlungsbasierten Gesten (das heißt Zeigegesten und Gebärdenspiel) aufbauten, die schon »auf natürliche Weise« eine Bedeutung hatten.

5.1 Die Entstehung von Zusammenarbeit Unsere Hypothese lautet also, daß die menschliche kooperative Kommunikation als wesentlicher Bestandteil der Evolution der einzigartigen menschlichen Formen von Zusammenarbeit entstand. Wir können hier nicht den Versuch unternehmen, die Evolution der menschlichen Hyperkooperativität im allgemeinen zu erklären.1 Aber wir können zeigen, daß die gemeinschaftlichen Tätigkeiten von Menschen sich von den Gruppentätigkeiten der Menschenaffen genauso unterscheiden, wie die menschliche kooperative Kommunikation sich von der intentionalen Kommunikation der Menschenaffen unterscheidet. Insbesondere beruhen die gemeinschaftlichen Tätigkeiten und die kooperative Kommunikation des Menschen auf solchen Dingen wie dem rekursiven Erkennen von Absichten und der Tendenz, anderen aus freien Stücken Hilfe und Information anzubieten, was bei den Gruppentätigkeiten und der intentionalen Kommunikation von Menschenaffen nicht der Fall ist.

1 Siehe den ausgezeichneten Überblick bei Richerson und Boyd 2005. 186

5.1.1 Die Gruppenaktivitäten von Schimpansen Schimpansen - als Repräsentanten der Menschenaffen (und der Affenspezies, an der bei weitem die meisten Untersuchungen durchgeführt wurden) - sind sehr soziale Geschöpfe und beteiligen sich an einer Reihe komplexer Gruppenaktivitäten, etwa an der Jagd in Gruppen. Unsere Frage ist hier jedoch, ob sie sich auch an gemeinschaftlichen Tätigkeiten im engeren Sinn beteiligen, die dadurch definiert sind, daß mehrere Individuen ein gemeinsames Ziel mit untereinander zusammenhängenden und sich ergänzenden Rollen verfolgen, wobei alle gemeinsam wissen, daß sie das tun. Diese Art von Zusammenarbeit erfordert nach unserer Analyse Fertigkeiten und Motivationen geteilter Intentionalität, einschließlich der elementaren sozio-kognitiven Voraussetzung, dem rekursiven Erkennen geistiger Zustände. In ihren natürlichen Lebensräumen jagen Schimpansen manchmal in kleinen Trupps, um kleine Tiere, wie zum Beispiel Affen, zu fangen. Am beeindruckendsten ist die Tatsache, daß männliche Schimpansen im Tai Nationalpark in kleinen Gruppen rote Stummelaffen jagen.2 Der Darstellung der Boeschs zufolge haben die Tiere ein gemeinsames Ziel und übernehmen bei der Jagd komplementäre Rollen. Ein Individuum, der sogenannte Treiber, jagt die Beute in eine bestimmte Richtung, während die anderen, die sogenannten Blockierer, auf Bäume klettern und die Beute daran hindern, in eine andere Richtung auszuweichen. Ein weiterer Schimpanse bewegt sich dann aus dem Hinterhalt auf die Beute zu und schneidet ihr den Fluchtweg ab. Wenn das Jagdereignis mit diesem Vokabular komplementärer Rollen beschrieben wird, erscheint es natürlich als genuin gemeinschaftliche Tä2 Boesch und Boesch 1989, Boesch und Boesch-Achermann 2000, Boesch, 2005. 187

tigkeit: Komplementäre Rollen implizieren bereits, daß es ein gemeinsames Ziel gibt, das von den Individuen, die die Rollen einnehmen, geteilt wird. Die Frage ist jedoch, ob dieses Vokabular angemessen ist. Aus unserer Perspektive ist folgende Beschreibung dieser Jagdtätigkeit plausibler.3 Ein Schimpanse fängt an, den Affen zu jagen, vorausgesetzt, andere Schimpansen sind in der Nähe (wobei er weiß, daß das für den Erfolg notwendig ist). Jeder dieser anderen Schimpansen geht dann seinerseits im Verlauf der sich entwickelnden Jagd zur jeweils günstigsten räumlichen Position, die noch zur Verfügung steht. In diesem Prozeß versucht jeder Beteiligte, seine eigenen Chancen, die Beute zu fangen, zu maximieren, ohne daß es einen vorgängigen gemeinsamen Plan oder eine Übereinkunft über ein gemeinsames Ziel oder eine Rollenzuweisung gibt. Diese Art von Jagdereignis ist fraglos eine relativ komplexe Gruppenaktivität, bei der die Individuen wechselseitig auf die jeweilige räumliche Position der anderen reagieren, während sie die Beute einkreisen. Aber Wölfe und Löwen tun etwas sehr Ähnliches, und die meisten Forscher schreiben ihnen keinerlei gemeinsame Ziele und/oder Pläne zu.4 Ebenfalls von Bedeutung ist die Tatsache, daß in anderen Schimpansen-Gemeinschaften die Jagd in Gruppen viel weniger koordiniert zu sein scheint, was vielleicht mit Unterschieden in der jeweiligen lokalen Ökologie zu tun hat: wie leicht es ist, erfolgreich alleine zu jagen, alternative Nahrungsquellen zu finden usw. Diese kognitiv schlankere Interpretation wird von Studien gestützt, die die Fähigkeiten von Schimpansen zur Zusammenarbeit in einer experimentellen Situation untersucht haben. Die grundlegenden Befunde sind folgende:

3 Siehe Tomasello et al. 2005. 4 Cheney und Seyfarth 1990a/1994, Tomasello und Call 1997. 188

- In Crawfords klassischen Untersuchungen, die manchmal als Beweis für Zusammenarbeit zitiert werden, stimmten Paare von Schimpansen ihre Handlungen erst nach einem ausgedehnten Training durch Menschen aufeinander ab.5 Bei diesem Training wurden die Schimpansen voneinander getrennt und jeder für sich unterrichtet, auf Befehl zu ziehen, was danach, wenn die beiden wieder zusammengebracht wurden und auf den Befehl hin gewissermaßen durch Zufall gleichzeitig zogen, den Impuls für die Synchronisation der Handlungen gab. Als den Versuchstieren später eine leicht veränderte Übertragungsaufgabe gegeben wurde, fielen alle Paare wieder in unkooperatives Verhalten zurück.6 - In erfolgreicheren Studien, in denen weniger oder gar kein Training erfolgte, zeigt der größte Teil der Koordination zwischen Schimpansen, daß die Individuen lernen, eine Handlung zu unterlassen (das heißt zu warten), bis der andere da und handlungsbereit ist.7 - Es gibt keine veröffentlichten experimentellen Untersuchungen, in denen Schimpansen zusammenarbeiten, indem sie verschiedene und komplementäre Rollen spielen - statt dessen gibt es mehrere unveröffentlichte negative Ergebnisse (zwei davon von mir und Kollegen); Erfolge konnten nur bei Aufgaben mit identischen parallelen Rollen, wie zum Beispiel gleichzeitigem Ziehen, erzielt wer* den. - In den erfolgreichen Untersuchungen mit parallelen Rollen beobachtet man fast keine Kommunikation zwischen 5 Crawford 1937,1941. 6 Siehe die Untersuchung von Savage-Rumbaugh, Rumbaugh und Boysen 1978, die mit noch mehr Training durch Menschen arbeiteten. 7 Chalmeau 1994, Chalmeau und Gallo 1996, Melis, Hare und Tomasello 2006a,b. 189

den Partnern,8 obwohl es in Crawfords Untersuchung so etwas wie ein Zerren an einem widerspenstigen Partner gab.9 Wenn Schimpansen in der Wildnis in Gruppen jagen, beobachtet man ebenfalls selten, falls überhaupt, intentionale Kommunikation zwischen den Beteiligten (das heißt keine, von der irgend jemand behauptet hätte, daß sie eine koordinierende Funktion erfülle). Diese Ergebnisse deuten darauf hin, daß menschenähnliche gemeinschaftliche Tätigkeit - also Gruppenaktivitäten mit einer intentionalen Struktur, die sowohl ein gemeinsames Ziel als auch komplementäre Rollen umfassen - etwas ist, an dem sich Menschenaffen nicht beteiligen. Im allgemeinen ist es fast unvorstellbar, daß zwei Schimpansen spontan etwas so Einfaches tun können wie einen schweren Gegenstand gemeinsam tragen oder ein Werkzeug gemeinsam herstellen. Eine mögliche Erklärung dafür, warum Schimpansen und andere Affen nicht wie Menschen zusammenarbeiten, ist, daß sie die Ziele und Wahrnehmungen ihres Gegenüber als in der jeweiligen Situation individuell Handelnde nicht verstehen.10 Da die Ziele und Wahrnehmungen der anderen nicht unmittelbar beobachtet werden können und deshalb Schlußfolgerungen erfordern, haben wir selbst eine Zeitlang gedacht, daß nur Menschen sie verstehen und wissen, wie sie bei einer zielgerichteten Handlung zusammenwirken.11 Aber neuere Untersuchungen, von denen viele oben in Abschnitt 2.4.1 angeführt wurden, haben ein anderes Licht auf diesen Sachverhalt geworfen. Menschenaffen verstehen durchaus, daß andere Ziele und Wahrnehmungen haben und wie diese 8 Povinelli und O'Neill 2000, Melis, Hare und Tomasello 2006a,b, Hirata und Fuwa 2006. 9 Crawford 1937. 10 Povinelli und O'Neill 2000. 1 1 Tomasello und Call 1997. 190

bei intentionalen Handlungen, vielleicht sogar bei rationalen Handlungen, miteinander verbunden sind. Das ist also nicht der Grund dafür, daß sie nicht wie Menschen zusammenarbeiten. Vielmehr und wenig überraschend glauben wir nun, daß Menschenaffen zwar verstehen, was der andere als individueller intentionaler Akteur tut, daß sie aber weder über die Fertigkeiten noch über die Motivationen verfügen, mit anderen gemeinsame Ziele und gemeinsame Aufmerksamkeit auszubilden oder sich auf andere Weise mit anderen an geteilter Intentionalität zu beteiligen. Eine Studie aus jüngster Zeit stützt diese Interpretation. Warneken, Chen und Tomasello konfrontierten 14 bis 24 Monate alte Kinder und drei von Menschen aufgezogene Schimpansenjungen mit vier Kollaborationsaufgaben:12 mit zwei instrumenteilen Aufgaben, bei denen es ein konkretes Ziel gab, und zwei sozialen Spielen, bei denen es kein anderes konkretes Ziel gab, als das Spiel zusammen zu spielen (zum Beispiel benutzten die beiden Partner eine Art Trampolin, um gemeinsam einen Ball hochspringen zu lassen). Der menschliche erwachsene Partner wurde im voraus instruiert, zu einem bestimmten Zeitpunkt die Handlung zu unterbrechen, um festzustellen, ob der Affe oder das Kind die gemeinsame Tätigkeit dennoch fortsetzten. Die Ergebnisse waren eindeutig und konsistent. Bei den Problemlösungsaufgaben stimmten die Schimpansen ihr Verhalten relativ geschickt mit dem des Menschen ab, was aus der Tatsache ersichtlich ist, daß sie das gewünschte Ergebnis oft erfolgreich zustande brachten. Sie zeigten jedoch kein Interesse an den Gesellschaftsspielen und lehnten im Grunde die Mitwirkung daran ab. Insbesondere machte kein Schimpanse auch nur einen Kommunikationsversuch, wenn der menschliche Partner sein Handeln un12 Warneken, Chen und Tomasello 2006, siehe auch Warneken und Tomasello 2007. 191

terbrach, um ihn zur Fortsetzung des Handelns zu bewegen, selbst wenn sie anscheinend hoch motiviert waren, das Ziel zu erreichen. Das deutet darauf hin, daß sie kein gemeinsames Ziel mit dem Menschen ausgebildet hatten. Im Gegensatz dazu kooperierten die menschlichen Kinder sowohl bei den Gesellschaftsspielen als auch bei den instrumentellen Aufgaben. Manchmal verwandelten sie die instrumentellen Aufgaben sogar in Gesellschaftsspiele, indem sie die erhaltene Belohnung in den Apparat zurücklegten, um mit der Tätigkeit von neuem zu beginnen; die gemeinschaftliche Tätigkeit selbst war belohnender als das instrumenteile Ziel. Am wichtigsten war folgender Unterschied: Wenn der Erwachsene die Handlung unterbrach, ermunterten ihn die Kinder aktiv, sie fortzusetzen, indem sie mit ihm auf irgendeine Weise kommunizierten. Dies legt nahe, daß sie ein gemeinsames Ziel mit ihm ausgebildet hatten, auf das sie ihn nun wieder verpflichten wollten. Insgesamt schienen die Kinder nur um der Zusammenarbeit willen zusammenzuarbeiten, während die Schimpansen sich auf eine mehr individualistische Weise beteiligten. Weitere Bestätigung dieser Interpretation ergibt sich aus einer kürzlich durchgeführten Längsschnittuntersuchung, bei der drei von Menschen aufgezogene Schimpansen im Hinblick jeweils auf eine ganze Reihe sozio-kognitiver Fertigkeiten eingeschätzt wurden.13 Es stellte sich heraus, daß die Schimpansen bei den stärker individuell basierten soziokognitiven Fertigkeiten, die das Verstehen von Zielen und Wahrnehmungen beinhalten, sehr ähnlich wie menschliche Kleinkinder abschnitten. Wenn aber während einer Reihe einfacher Kooperationsaufgaben, bei denen ein Mensch eine bestimmte Rolle und der Schimpanse eine komplementäre Rolle spielte - der Mensch zum Beispiel ein Tablett präsen13 Tomasello und Carpenter 2005, siehe auch Tomonoga et al. 2004. 192

tierte und der Schimpanse ein Spielzeug darauf legte der Mensch versuchte, einen Rollentausch zu erzwingen, ließen sich die Schimpansen entweder nicht oder nur unzulänglich darauf ein oder sie vollzogen ihre Handlung ganz unabhängig vom Menschen. In einer ähnlichen Reihe von Aufgaben tauschten Kleinkinder nicht nur ihre Rollen, sondern schauten in diesem Fall auch erwartungsvoll den Erwachsenen an - das Spielen seiner neuen Rolle in ihrer gemeinsamen Aufgabe antizipierend.14 Unserer Interpretation zufolge verstehen menschliche Kleinkinder die gemeinsame Tätigkeit aus einer »Vogelperspektive«, wobei das gemeinsame Ziel und die komplementären Rollen alle in einem einzigen Repräsentationsformat dargestellt werden, was es ihnen ermöglicht, die Rollen bei Bedarf zu tauschen. Schimpansen hingegen verstehen ihre eigene Handlung aus einer ErstenPerson-Perspektive und die des Partners aus einer DrittenPerson-Perspektive, nicht aber aus der Vögelperspektive auf die Interaktion. Deshalb gibt es für sie in Wirklichkeit keine Rollen und keinen Sinn, in dem sie bei »derselben« Tätigkeit die Rollen tauschen können. Im Hinblick auf die gemeinsame Aufmerksamkeit ist die systematischste vergleichende Untersuchung die von Carpenter, Tomasello und Savage-Rumbaugh.15 Sie beobachteten 18 Monate alte Kinder sowie Schimpansen und Bonobos bei der Interaktion mit einem erwachsenen Menschen und einigen Gegenständen, wobei der Fokus auf objektiv definierten Blickmustern lag. In dieser Situation interagierten alle drei Spezies mit Gegenständen und überwachten dabei recht häufig das Verhalten des erwachsenen Menschen. Menschliche Kleinkinder verbrachten jedoch bei weitem mehr Zeit als 14 Carpenter, Tomasello und Striano 2005. 15 Carpenter, Tomasello und Savage-Rumbaugh 1995, siehe auch einige ähnliche Beobachtungen bei Bard und Vauclair 1984. 193

Affen damit, zwischen dem Gegenstand und dem Erwachsenen hin und her zu schauen, und ihre Blicke zum Gesicht des Erwachsenen waren im Durchschnitt fast doppelt so lang wie die der Affen. Zudem waren die Blicke der Kleinkinder manchmal auch von einem Lächeln begleitet, während Menschenaffen nicht lächeln. Diese Unterschiede erzeugten den Eindruck, daß die Blicke der Affen »prüfende« Blicke waren (um zu sehen, was der Erwachsene gerade tat oder wahrscheinlich als nächstes tun würde), während die Blicke der Kleinkinder »teilende« Blicke waren (um ein Interesse zu teilen); die Affen wußten, daß der andere Ziele und Wahrnehmungen hatte; sie hatten aber nicht die Fähigkeit oder den Wunsch, diese zu teilen. Diese Affen interagierten zwar mit anderen im Hinblick auf die Gegenstände, aber sie beteiligten sich nicht mit ihnen an gemeinsamen Unternehmungen mit gemeinsamen Zielen und Erfahrungen. Tomasello und Carpenter fanden etwas sehr Ähnliches, als sie einen Menschen auf verschiedene Weise versuchen ließen, drei von Menschen aufgezogene Schimpansen zu ermuntern, die Aufmerksamkeit mit ihm im Kontext eines Spiels mit Gegenständen zu teilen.16 Die Schimpansen blickten den mit ihnen interagierenden Menschen manchmal an, um zu prüfen, was er tat, aber sie schauten ihn nicht an, um mit ihm ein Interesse oder die Aufmerksamkeit bezüglich eines äußeren Gegenstands zu teilen. Sie versuchten auch nicht, gemeinsame Aufmerksamkeit durch gestische Kommunikation herzustellen, und in einer Studie nutzten sie die mit dem Menschen geteilte Erfahrung nicht, um zu bestimmen, was für ihr Gegenüber neu und daher überraschend war (was Kleinkinder tun).17 Aufgrund dieser und anderer Ergebnisse18 scheint klar zu 16 Tomasello und Carpenter 2005. 17 Moll et al. 2006. 18 Siehe die Übersicht bei Tomasello et al. 2005. 194

sein, daß menschliche Kleinkinder bei gemeinschaftlichen Tätigkeiten gemeinsame Ziele und komplementäre Rollen mit anderen kreieren, was unsere nächsten Primatenverwandten nicht tun. Die unabdingbare Voraussetzung gemeinschaftlicher Handlungen ist ein gemeinsames Ziel und eine gemeinsame Festlegung der Beteiligten darauf, dieses Ziel zu verfolgen, wobei alle wechselseitig verstehen, daß sie dieses gemeinsame Ziel und die Festlegung teilen.19 Gemeinsame Ziele strukturieren auch die gemeinsame Aufmerksamkeit: Mit einem Partner gemeinsam auf ein geteiltes Ziel hin zu handeln, wobei wir wechselseitig verstehen, daß wir das tun, führt auf ganz natürliche Weise zur gegenseitigen Beobachtung der Aufmerksamkeit. Ein wichtiger Grund dafür, daß sich nichtmenschliche Primaten an gemeinschaftlichen Tätigkeiten oder an Interaktionen, die gemeinsame Aufmerksamkeit beanspruchen, nicht auf menschenähnliche Weise beteiligen, ist daher die Tatsache, daß sie keine menschenähnlichen Fertigkeiten und Motivationen geteilter Intentionalität haben, obwohl sie menschenähnliche Fertigkeiten für das Verstehen individueller Intentionalität besitzen. Ein wesentlicher Befund für unsere Untersuchung ist folgender: Wenn Schimpansen sich an der Jagd in Gruppen beteiligen, kommunizieren sie nicht intentional über die fortlaufende Tätigkeit, und zwar weder um ein Ziel festzulegen noch um die Rollen zu koordinieren. In anderen Kontexten verwenden Schimpansen ihre intentionalen gestischen Signale, um andere dazu zu bringen, das zu tun, was sie von ihnen wollen, und sie machen auch Zeigegesten gegenüber hilfsbereiten Menschen, um sie dazu zu veranlassen, bestimmte Dinge für sie zu holen. Außerdem verstehen sie bis zu einem bestimmten Grad die Aufforderungen von anderen. Um Aufforderungen machen und sie interpretieren zu kön19 Bratman 1992, Gilbert 1989. 195

nen, muß man ein Verständnis individueller Intentionalität haben, das heißt, man muß fähig sein, praktische Schlüsse hinsichtlich eines intentionalen Akteurs zu ziehen, der Dinge wahrnimmt und Ziele hat. Wenn mehrere Schimpansen gleichzeitig versuchen, einen Affen zu fangen, verstehen sie demnach einander als intentionale Akteure und reagieren in diesem Sinne aufeinander. Aber da sie bei dieser Tätigkeit in einem wichtigen Sinne untereinander konkurrieren - oder sich zumindest individualistisch verhalten beteiligen sie sich in keiner Weise an intentionaler Kommunikation. Wenn es mein nächstliegendes Ziel ist, den Affen zu fangen, ohne daß ein anderer davon weiß, werde ich nicht ausgiebig kommunizieren. Grundsätzlich ist es die auf Konkurrenz ausgerichtete Natur der Schimpansen (und vermutlich auch anderer Menschenaffen), die es ihnen sehr erschwert, die Nahrung zu teilen, nachdem der Affe gefangen wurde. Aber wie soll ein gemeinsames Ziel, nämlich das Fangen eines Affen, möglich sein, wenn jeder weiß, daß am Ende ein Kampf um die Beute ausbrechen wird? Wenn eine Gruppe von Schimpansen einen Affen fängt und ihn tötet, erhalten alle an der Jagd Beteiligten Fleisch, und zwar mehr als jene Schimpansen, die später dazukommen und nicht an der Jagd beteiligt waren.20 Eine kürzlich durchgeführte Untersuchung von Gilby verdeutlicht jedoch die grundsätzlich individualistischen Mechanismen, die hinter diesem »Teilen« stehen.21 Zunächst stellt Gilby fest, daß Schimpansen, die nach erfolgreicher Jagd Fleisch bekommen haben, häufig versuchen, andere zu meiden, indem sie sich von dem Ort, an dem die Beute getötet wurde, wegstehlen und auf das Ende eines Astes klettern, um den Zugang anderer Schimpansen einzuschränken, oder indem sie 20 Boesch und Boesch-Achermann 2000. 21 Gilby 2006. 196

bettelnde Tiere verjagen.22 Trotzdem sind Tiere, die Fleisch haben, typischerweise von bettelnden Artgenossen umgeben, die an dem Fleisch herumzerren oder den Mund des Besitzers mit ihrer Hand bedecken und dergleichen. Gewöhnlich erlaubt der Besitzer den bettelnden Tieren, etwas von seinem Fleisch zu nehmen. Gilby weist jedoch quantitativ nach, daß das ein direktes Ergebnis des Betteins und der Belästigung ist: Je mehr ein Tier bettelt und drangsaliert, desto mehr Nahrung bekommt es. Hinter diesem Verhalten steckt folgende Logik: Bekämpft der Besitzer den Drangsalierer aktiv, wird er sehr wahrscheinlich alles oder einen Teil entweder an diesen oder an andere verlieren, die sich in der Nähe des Handgemenges befinden. Daher ist die beste Strategie für ihn, schnell soviel wie möglich aufzuessen und anderen zu erlauben, etwas von dem Fleisch zu nehmen, damit sie zufrieden sind (das sogenannte Modell des geduldeten Diebstahls oder der geduldeten Belästigung bei der Nahrungsteilung). Tomasello und Mitarbeiter weisen auf die weitere Möglichkeit hin, daß Jäger mehr Fleisch erhalten als später hinzukommende Tiere, weil sie als erste unmittelbar beim Kadaver sind und betteln können, während diejenigen, die später dazukommen, in die zweite Reihe verwiesen werden.23 Diese Darstellung der Gruppenjagd von Schimpansen wird auch von einer aktuelleren experimentellen Studie gestützt. Melis, Hare und Tomasello präsentierten einem Schimpansenpaar Futter, das außerhalb seiner Reichweite lag und an das dieses nur gelangen konnte, wenn beide gleichzeitig an einem von zwei vorhandenen Seilen zogen (die an einem Podest befestigt waren, auf dem sich das Futter befand).24 Zwei Befunde sind hier besonders erwähnenswert: Erstens, wenn 22 Goodall 1986, Wrangham 1975. 23 Tomasello et al. 2005. 24 Melis, Hare und Tomasello 2006a. 197

es zwei Portionen Futter gab, so daß sich vor jedem Schimpansen jeweils eine befand, wurde ein bescheidenes Maß von gleichzeitiger Anstrengung festgestellt. Wenn es jedoch in der Mitte des Podestes nur eine einzige Futtermenge gab, so daß es am Ende schwierig war, sie zu teilen, brach die Koordination fast völlig zusammen. Zweitens identifizierten Melis und Mitarbeiter bei Vortests einzelne Paare, die besonders tolerant miteinander umgingen und relativ friedlich zusammen fraßen. Diese Paare zogen viel häufiger gleichzeitig an den Seilen als weniger tolerante Paare. Diese Befunde zeigen besonders deutlich, daß Schimpansen nur dann synchronisierte Tätigkeiten koordinieren können, wenn es hinterher wahrscheinlich kein Gezänk um das Futter gibt. Es ist hier vielleicht ebenfalls von Bedeutung, daß Schimpansen, obwohl sie manchmal Menschen und einander helfen,25 andere in solchen Situationen nicht unterstützen, in denen sie selbst eine Chance haben, Futter zu erlangen, und zwar selbst dann, wenn sie dies ohne jeden Aufwand tun könnten.26 Womöglich könnten Schimpansen jedoch in der Lage sein, bei Tätigkeiten zusammenzuarbeiten, die nichts mit Nahrung zu tun haben. Es ist nicht leicht, sich vorzustellen, welche Arten von Tätigkeiten das sein könnten, da eine Zusammenarbeit nur bei solchen Dingen nützlich ist, bei denen man nur schwer alleine erfolgreich sein kann. Am ehesten noch scheinen Koalitionen und Allianzen bei Kämpfen innerhalb der Gruppe in Frage zu kommen, aber in der großen Mehrheit der Fälle ist es tatsächlich so, daß ein Kampf zwischen zwei Individuen beginnt und ihre Freunde erst später eingreifen, um ihnen zu helfen.27 Die beste Beschreibung dieser Tätigkeit ist daher Helfen, und nicht Zusammen25 Warneken, Chen und Tomasello 2006, Warneken et al. 2007. 26 Silk et al. 2005, Jensen et al. 2006. 27 Siehe den Überblick bei Tomasello und Call 1997. 198

arbeit, da es keine Belege dafür gibt, daß die Kämpfer desselben Teams ein gemeinsames Ziel und koordinierte Pläne und Rollen im Hinblick auf dieses Ziel vor Augen haben (obwohl sie jeder für sich »dasselbe« Ziel haben mögen). Die Gruppenjagd von Schimpansen scheint also kein sehr förderlicher Kontext für die Entstehung kooperativer Kommunikation zu sein, weil sie nicht wirklich ein gemeinschaftliches Unternehmen in jenem engen Sinn ist, in dem wir gemeinschaftliches Zusammenwirken hier definiert haben, nämlich als gemeinsame Ziele mit koordinierten Plänen bzw. Rollen.28 Wenn ein Schimpanse einem anderen helfen würde, seine »Rolle« während der Jagd zu erfüllen, etwa indem er ihn darüber informierte, daß der Affe auf ihn zukommt, würde der Kommunizierende sogar seinen wahrscheinlichen Fleischanteil am Ende der Jagd vermindern, da das informierte Individuum diese Information mit großer Sicherheit dazu nutzen würde, seinen eigenen Fleischanteil zu maximieren. Möglicherweise ist es auch von Bedeutung, daß Bonobos in der Wildnis nicht in Gruppen jagen, denn das könnte darauf hindeuten, daß die Version der Gruppenjagd bei Schimpansen und jene bei Menschen unabhängig voneinander entstanden sind und sich auf verschiedene psychologische Prozesse stützen (denn wenn der gemeinsame Vorfahr aller drei Arten kooperativ jagte - wenn die Jagd in Gruppen bei Pan und beim Menschen homolog wäre - , sollten es die Bonobos ebenfalls tun).

28 Siehe jedoch Boesch 2005 zur Verteidigung der Ansicht, daß die Gruppenjagd etwas genuin Gemeinschaftliches ist. 199

5.1.2 Die gemeinschaftlichen Tätigkeiten von Menschen Im Vergleich zu anderen Primaten beteiligen sich Menschen an einem äußerst breit gefächerten Katalog gemeinschaftlicher Tätigkeiten, von denen viele hauptsächlich mit nichtverwandten Personen stattfinden und unter der Herrschaft sozialer Normen im Kontext von Symbolen und formellen Institutionen stehen. Außerdem wirken unterschiedliche kulturelle Gruppen bei verschiedenen Tätigkeiten zusammen: manche beim Jagen, manche beim Fischen, manche beim Hausbau, manche beim Musikspielen, manche bei der Regierung usw., was die Flexibilität der zugrundeliegenden kognitiven Fertigkeiten belegt. Während also die meisten Primaten in sozialen Gruppen leben und an Gruppentätigkeiten teilnehmen, leben Menschen in Kulturen, die auf der Erwartung beruhen, daß ihre Mitglieder sich an vielen verschiedenen Arten gemeinschaftlicher Tätigkeiten beteiligen, die geteilte Ziele und eine Arbeitsteilung erfordern, wobei alle Beteiligten einen Beitrag leisten und die Beute am Ende unter all denen verteilt wird, die es verdient haben. Menschen schaffen sogar kulturelle Praktiken und Institutionen, deren Existenz einzig und allein in Praktiken und Institutionen der kollektiven Zustimmung aller Gruppenmitglieder besteht, daß es so sein soll. Diese können wiederum von sozialen Normen geleitet sein, die wirkliche sanktionierende Kraft besitzen. Ein Beispiel möge hier genügen: Während nichtmenschliche Primaten ein gewisses Verständnis von familiärer Verwandtschaft haben, gibt es bei Menschen die Zuweisung sozialer Rollen wie »Ehefrau« und »Elternteil«, die jeder anerkennt und die soziale und rechtliche Verpflichtungen beinhalten, auf bestimmte Weisen zu kommunizieren - oder ansonsten sanktioniert zu werden. Insbesondere im Hinblick auf das Jagen wurden viele Untersuchungen an verschiedenen Jäger- und Sammlergruppen 200

durchgeführt, um die verschiedenen Vorgehensweisen zu dokumentieren, wie diese Gruppen nach bestimmten Arten von Wild und/oder Pflanzen suchen, die von einzelnen Gruppenmitgliedern nicht so leicht erbeutet werden können (Großwild, bestimmte Fische, unterirdisch wachsende Pflanzen usw.).29 Bei diesen Tätigkeiten setzt eine kleine Gruppe das gemeinsame Ziel fest, ein bestimmtes Beutetier zu fangen oder eine bestimmte Pflanze auszugraben, und dann verteilen sie ihre verschiedenen Aufgaben und bestimmen, wie diese im voraus koordiniert werden sollen - oder aber diese Aufgabenverteilung gehört schon zum gemeinsamen Wissen, das auf einer gemeinsamen Geschichte der Praxis beruht. Die Beteiligten teilen ihren Fang fast immer mit anderen, und zwar nicht nur in ihren unmittelbaren Familien, sondern auch im größeren Umkreis der sozialen Gruppe. Tatsächlich unterliegt dieses Verhalten sozialen Normen, da diejenigen, die nicht teilen, streng sanktioniert werden. Diese Neigung, die Früchte der gemeinschaftlichen Arbeit »fair« zu teilen, ist bei Menschen besonders stark ausgeprägt; Menschen in fast allen Kulturen haben Normen des Teilens und der Fairneß verinnerlicht.30 So haben sowohl Menschen aus industrialisierten Gesellschaften als auch Jäger- und Sammlergruppen unter experimentellen Bedingungen das sogenannte Ultimatumspiel gespielt, und zwar immer anonym und nur ein einziges Mal.31 Kurz zusammengefaßt, sieht dieses Spiel folgendermaßen aus: Eine Person bekommt eine relativ große Summe Geld (die in einigen Untersuchungen in etwa einem Monatslohn entsprach). Man sagt ihr, daß sie einen Teil davon einer anonymen anderen Person aus derselben Gruppe anbieten kann. Diese Person hat dann die Mög29 Siehe die Übersicht bei Hill und Hurtado 1996. 30 Siehe die Übersicht bei Fehr und Fischbacher 2003. 31 Siehe Henrich et al. 2005. 201

lichkeit, entweder das Angebot zu akzeptieren, so daß jeder seinen Teil bekommt, oder es abzulehnen, so daß niemand etwas bekommt. Typischerweise bieten Menschen der anderen Person etwa die Hälfte des Geldes an. Zumindest teilweise tun sie das, um in einem allgemeinen Sinne »fair« zu sein, aber auch deshalb, weil sie richtigerweise vermuten, daß die andere Person unfaire Angebote (typischerweise weniger als 30 bis 40 Prozent) ablehnen wird. Die Einzelheiten variieren zwar von einer Kultur zur anderen, aber in allen Kulturen gibt es zumindest eine gewisse Verpflichtung, wichtige Güter mit anderen zu teilen (es gibt sogar manche Kulturen, in denen die Angebote viel mehr als die Hälfte betragen, und dennoch werden diese oft abgelehnt - vermutlich weil der Empfänger damit die Verpflichtung eingeht, später mit gleicher Münze zurückzuzahlen). Wird den Teilnehmern gesagt, daß sie gegen einen Computer spielen, spielen Fairneßerwägungen keine Rolle, sondern sie versuchen vielmehr, ihren eigenen Anteil zu maximieren. In bezug auf die tatsächliche soziale Koordination, die man bei gemeinschaftlichen Tätigkeiten findet, haben verschiedene Denker seit Schelling und Lewis bemerkt, daß die kooperative Koordination beim Menschen sehr häufig auf besonders entscheidende Weise von einem rekursiv verstandenen gemeinsamen Hintergrund abhängt.32 Wenn Sie und ich bei einer großen Versammlung im Freien getrennt werden, werden wir sehr wahrscheinlich wieder zusammenkommen, weil wir uns beide einen wahrscheinlichen Treffpunkt vorstellen können, zu dem der andere gehen würde, zum Beispiel zum Auto. Um das erfolgreich zu tun, muß ich mir vorstellen, wohin Sie vermutlich gehen würden, aber Sie stellen sich ebenfalls vor, wohin ich vermutlich gehen würde. Anschließend muß ich mir vorstellen, was Sie denken, wohin ich gehen werde usw., 32 Schelling 1960, Lewis 1969/1975. 202

ad infinitum. Mit anderen Worten, wir müssen beide wissen, daß das Denken des anderen das eigene Denken berücksichtigt, wenn wir unser gemeinsames Ziel, nämlich einander wiederzufinden, erreichen wollen. Wichtig ist, daß nach dem vorliegenden Ansatz jedesmal, wenn wir ein gemeinsames Ziel festlegen, ein gewisses Aushandeln stattfinden muß, das wesentlich eine solche geistige Koordination umfaßt, weil ich mich nur dann an der gemeinschaftlichen Tätigkeit beteiligen möchte, wenn Sie das ebenfalls tun (und wenn Sie dieselbe Einstellung mir gegenüber haben). Daher müssen wir beide die Neigungen des anderen einschätzen, die von dessen Einschätzung unserer Neigungen abhängen usw. Es gibt viele andere Arten sozialer Interaktionen - einschließlich konkurrenzieller - , die zwar irgendeine Form des Erkennens von Intentionen oder geistigen Zuständen beinhalten, aber nicht die rekursive Struktur dieser reinen Koordination besitzen. Zu etwa derselben Zeit, zu der sie mit der kooperativen Kommunikation anfangen, beginnen menschliche Kleinkinder unter Berücksichtigung gemeinsamer Ziele und koordinierter Pläne zusammenzuwirken. In der Untersuchung von Warneken und Tomasello schienen Kleinkinder von gerade einmal 14 Monaten gemeinsame Ziele zu bilden,33 und in der Untersuchung von Carpenter et al. tauschten Kleinkinder, die erst 12 Monate alt waren, bei einer einfachen gemeinschaftlichen Tätigkeit die Rollen.34 Gräfenhein, Behne, Carpenter und Tomasello fanden heraus, daß etwas ältere Kinder (im Alter von etwa drei Jahren) für die normative Dimension des Prozesses sensibel waren.35 Wenn der Erwachsene mit der Kooperation aufhörte, reagierten diese Kinder stark, falls sie und der Erwachsene die gemeinschaftliche Tätigkeit mit ei33 Warneken und Tomasello 2007, siehe auch Ross und Lollis 1987. 34 Carpenter, Tomasello und Striano 2005. 35 Gräfenhein, Behne, Carpenter und Tomasello, in Vorbereitung. 203

ner ausdrücklich anerkannten Festlegung begonnen hatten (»Laß uns nun dieses Spiel spielen, o.k.?«), jedenfalls stärker als in Situationen, in denen die Spieltätigkeit dadurch zustande kam, daß der Erwachsene sich ungefragt dem Kind hinzugesellte. In allen diesen Untersuchungen versuchten Kleinkinder und jüngere Kinder die gemeinschaftliche Tätigkeit durch Kommunikation zu regeln. Wie steht es nun mit der kooperativen Kommunikation? Wenn, wie ich dargelegt habe, die kooperative Kommunikation des Menschen »darauf angelegt« ist, bei mutualistischen gemeinschaftlichen Tätigkeiten eingesetzt zu werden und diese auch wirklich zu erleichtern, wie sollte sie dann aussehen? Was sollten ihre Konstruktionsmerkmale sein? Zunächst würde die kooperative Kommunikation sicherlich die Tatsache ausnutzen, daß die gemeinschaftlich Tätigen schon anhand gemeinsamer Ziele und gemeinsamer Aufmerksamkeit im Raum des gemeinsamen begrifflichen Hintergrunds zusammenwirken - was natürlich auch so ist. Ein anderes Merkmal wäre, daß kooperative Kommunikation häufig dazu verwendet wird, anderen zu helfen, indem man sie über interessante oder nützliche Dinge informiert (weil ihnen das hilft) - wozu sie natürlich auch verwendet wird. Auf der Grundlage der gemeinsamen Aufmerksamkeit und des gemeinsamen Hintergrunds, die durch die gemeinschaftlichen Tätigkeiten (einschließlich des rekursiven Erkennens geistiger Zustände) erzeugt werden, sollten die Beteiligten vom anderen tatsächlich erwarten, daß er hilfsbereit ist, und von anderen erwarten, daß dieser das von ihnen erwartet usw. - was sie natürlich auch tun. Im Gegensatz dazu umfaßt die Kommunikation von Menschenaffen fast ausschließlich Aufforderungen, die sich auf individualistische Ziele richten, für die andere als soziale Werkzeuge eingesetzt werden - was gut zu ihren grundsätzlich individualistischen Motiven bei Gruppenaktivitäten wie der Jagd paßt. Das heißt natürlich 204

nicht, daß moderne Menschen ihre Fertigkeiten kooperativer Kommunikation nicht für individualistische, konkurrenzbezogene und eigensüchtige Zwecke einsetzen können - sie können es und tun es auch. Aber sogar das Lügen erfordert Zusammenarbeit, um die täuschende Botschaft zu übermitteln, und ein Gefühl von Vertrauen seitens des Empfängers (andernfalls würde die Lüge niemals funktionieren), und deshalb sehen wir sogar hier die kooperative Infrastruktur. Interessanter- und bezeichnenderweise gibt es immer noch keine experimentellen Belege dafür, daß Schimpansen andere aktiv in die Irre führen können, obwohl sie sich vor anderen verbergen können36 - möglicherweise deshalb, weil, um es zu wiederholen, auch Täuschen und Lügen kooperative Kommunikation erfordert.

5.1.3 Zusammenfassung Die vorliegende Hypothese über die Ursprünge der kooperativen Kommunikation ist also mehr als nur eine weitere »Adhoc-Geschichte« darüber, was der »Zweck« eines bestimmten menschlichen Verhalten ist. Sie ist deshalb mehr, weil die kooperative Kommunikation tatsächlich eine Infrastruktur geteilter Intentionalität mit gemeinschaftlichen Tätigkeiten gemein hat. Es scheint in der Tat schwer vorstellbar, wie gemeinsame Ziele und gemeinsame Aufmerksamkeit, geschweige denn die wechselseitigen Annahmen der Hilfsbereitschaft und die kommunikative Absicht, in Kontexten hätten entstehen können, in denen wir alle nur zu unserem eigenen Nutzen oder konkurrenzbetont handeln. Wenn die menschliche kooperative Kommunikation ursprünglich entstanden wäre, um komplexere Formen der Konkurrenz und Täuschung zu 36 Melis, Call und Tomasello 2006. 205

ermöglichen, würden wir nicht erwarten, eine gemeinsame kognitive Infrastruktur mit gemeinschaftlichen Tätigkeiten vorzufinden. Außerdem würden wir nicht erwarten, daß ihre tiefste Motivation der Wunsch sei, anderen zu helfen, indem man ihnen die Information gibt, die sie brauchen (was, um es zu wiederholen, tatsächlich eine notwendige Voraussetzung ist, wenn Lügen den Empfänger täuschen soll).

5.2 Das Entstehen kooperativer Kommunikation Wir verfügen hier zwar nicht über eine spezifische und detaillierte evolutionäre Geschichte, es gibt jedoch gewisse logische oder zumindest plausibel arrangierte Beziehungen der Aufeinanderfolge zwischen den verschiedenen Bestandteilen menschlicher Kommunikation, wie wir sie bisher skizziert haben. Unsere nächste Aufgabe lautet daher, eine bestimmte Abfolge vorzuschlagen, die uns von der intentionalen Kommunikation der Menschenaffen, die auf dem Verstehen individueller Intentionalität beruht, zur kooperativen Kommunikation des Menschen führt, die auf Fertigkeiten und Motiven geteilter Intentionalität beruht, indem wir auf evolutionäre Prozesse Bezug nehmen, von denen wir wissen, daß sie an der Evolution der Kooperation beteiligt sind. Die Abfolge, die wir vorschlagen, ist um drei Grundprozesse herum angeordnet, durch die sich die Kooperation bekanntlich entwickelt und die mit unseren drei Grundmotiven der menschlichen kooperativen Kommunikation verbunden sind: - um das Erfüllen von Aufforderungen und das ursprüngliche Motiv des Helfens durch Informationen zu erklären, berufen wir uns auf den Mutualismus (der Aufforderung wird Folge geleistet oder die Information wird angeboten, weil uns das beiden hilft); 206

- um das Anbieten von Hilfe durch Informationen außerhalb mutualistischer Kontexte zu erklären, berufen wir uns auf Reziprozität und indirekte Reziprozität (Hilfe wird angeboten, weil das meinem Ruf zugute kommt, so daß andere mich als Kooperationspartner haben wollen und mir wiederum helfen); und - um das Teilen von Gefühlen und Einstellungen zu erklären, berufen wir uns auf kulturelle Gruppenselektion (Gefühle und Einstellungen werden geteilt, um den gemeinsamen Hintergrund zu vergrößern und die Gruppenmitgliedschaft zu stärken). Der vorliegenden Darstellung zufolge entwickelten sich - aus all den im vorangehenden Abschnitt skizzierten Gründen die meisten dieser Dinge innerhalb des Kontextes gemeinschaftlicher Tätigkeiten; und sie entwickelten sich im Rahmen der gestischen Modalität - aus all den in den Kapiteln 2 und 3 skizzierten Gründen obwohl wir auch ab einem bestimmten Punkt die kooperative Kommunikation außerhalb von Kontexten gemeinschaftlicher Tätigkeit und den Wechsel zur stimmlichen Modalität erklären müssen.

5.2.1 Mutualistische Zusammenarbeit und das Verlangen von Hilfe Unser Ausgangspunkt sind Gruppenaktivitäten von Menschenaffen, die, wie ich gerade dargelegt habe, nicht wirklich gemeinschaftlich sind in dem Sinne, daß sie durch gemeinsame Ziele strukturiert werden, und intentionale gestische Signale von Menschenaffen, die dazu genutzt werden, andere zu gewünschten Handlungen zu bewegen, die aber im allgemeinen nicht bei Gruppentätigkeiten eingesetzt werden. Unser globales Modell für den ursprünglichen Schritt in Richtung 207

menschlicher Zusammenarbeit und kooperativer Kommunikation ist das Zwei-Stufen-Modell, das Hare und Tomasello auf der Grundlage einer Analogie zu Domestikationsprozessen entwickelt haben.37 Da unsere nächsten Affenverwandten keine besondere Neigung haben, die Beute aus Gruppentätigkeiten oder überhaupt in irgendeiner Situation Futter bereitwillig zu teilen, ist der erste Schritt in Richtung menschenähnlicher Zusammenarbeit und kooperativer Kommunikation für die Individuen der, toleranter und großzügiger zu werden und weniger miteinander zu konkurrieren, vielleicht besonders in Kontexten, in denen es um Nahrung geht. Interessant ist, daß sich dieser erste Schritt an heute lebenden Menschenaffen zeigt, die mit kooperativen Menschen interagieren. In der Untersuchung von Hirata und Fuwa zum Beispiel baten Schimpansen, die andere Schimpansen nicht dazu aufforderten, sich an einer Gruppentätigkeit zu beteiligen, ganz bereitwillig einen vermutlich hilfsbereiteren Menschen.38 Erinnern wir uns daran, daß von Menschen aufgezogene Affen lernen, gegenüber diesen Menschen spontan auf etwas zu zeigen (und andere Dinge zu tun), um imperativ von ihnen bestimmte Dinge zu verlangen, was sie bei anderen Affen nicht tun (siehe Abschnitt 2.3). Selbst speziesintern fordern Schimpansen nur solche Individuen als Partner für Gruppenaktivitäten auf, von denen sie gelernt haben, daß sie hilfsbereiter und toleranter sind.39 All das deutet darauf hin, daß eine größere Toleranz unter Artgenossen in der menschlichen Evolution ausgereicht hätte, um eine Bewegung in Richtung auf echte Zusammenarbeit wie auch auf imperative Zeigegesten in Gang zu setzen, ohne daß weitere kognitive Fertigkeiten 37 Hare und Tomasello 2005. 38 Hirata und Fuwa 2006. 39 Melis, Hare und Tomasello 2006a. 208

notwendig gewesen wären, die diejenigen der heutigen Menschenaffen übersteigen. Im zweiten Schritt wären diejenigen Individuen, die ihre Handlungen miteinander regelmäßiger und toleranter koordinieren, dann ein mögliches Ziel der natürlichen Selektion - geeignete ökologische Bedingungen vorausgesetzt - , so daß kognitive und motivational Mechanismen begünstigt werden, die komplexere gemeinschaftliche Interaktionen unterstützen. Wie Bateson schreibt: Sobald die evolutionäre Stabilität des kooperativen Verhaltens erreicht war [...], hat es wahrscheinlich eine Tendenz zur Entwicklung von Merkmalen gegeben, die die Kohärenz des äußerst funktionalen Kooperationsverhaltens aufrechterhielten und förderten. Signale, die vorhersagten, was ein Individuum gleich tun würde, und Mechanismen für die angemessene Reaktion auf diese Signale hätten sich zum wechselseitigen Vorteil entwickelt.40

Was in diesen toleranten, friedlich zusammen fressenden Individuen selektiert worden sein könnte, ist die Fähigkeit, gemeinsame Ziele und gemeinsame Aufmerksamkeit zu erzeugen. Wenn also in Gruppen jagende Schimpansen zu einem bestimmten Zeitpunkt toleranter wurden und weniger um die Aufteilung der Nahrung konkurrierten, dann spielt es keine Rolle, wer den Affen fängt, weil die Nahrung hinterher in jedem Fall geteilt werden wird. Wenn wir alle erwarten, daß die Nahrung am Ende geteilt wird, und wir das alle gemeinsam wissen, dann können wir - falls sich die notwendigen kognitiven Fähigkeiten entwickelt haben - das wechselseitig bekannte Ziel haben, daß »wir« den Affen fangen. Und wenn Individuen ein gemeinsames Ziel verfolgen, weiß jeder, daß das, was für ihn oder sie relevant ist, auch für die anderen relevant ist - zumindest potentiell. Gemeinsame Aufmerksamkeit kann gewissermaßen auch von unten nach 40 Bateson 1988, S. 12. 209

oben entstehen, etwa wenn ein seltsames Tier am Horizont auftaucht, wir alle dieses Tier sehen und uns dann gegenseitig anschauen, um unser gemeinsames Interesse zu bestätigen, das sich hier nicht aus einer gegenwärtigen gemeinschaftlichen Tätigkeit ableitet (obwohl es in vielen Fällen von einer bestimmten gemeinsamen Tätigkeit oder Erfahrung in der Vergangenheit abgeleitet ist). Dem hier präsentierten Vorschlag zufolge entstand die gemeinsame Aufmerksamkeit bei gemeinschaftlichen Tätigkeiten mit gemeinsamen Zielen jedoch von oben nach unten (und entwickelt sich heutzutage bei menschlichen Kleinkindern auf diese Weise).41 Mutualistische Zusammenarbeit ist also die Geburtsstätte des gemeinsamen begrifflichen Hintergrunds, der notwendig ist für die inferentiell reichhaltige kooperative Kommunikation menschlichen Stils. Mit Blick auf die eigentliche Kommunikation ist es zu unser aller Vorteil, daß wir dem anderen helfen, wenn wir auf unser gemeinsames Ziel bei der mutualistischen Zusammenarbeit hinwirken. Zudem verstehen wir wahrscheinlich auch Versuche, durch Kommunikation Hilfe zu verlangen oder anzubieten, wenn wir auf dem gemeinsamen Boden der gemeinschaftlichen Tätigkeit stehen. In diesem Kontext könnten die Neigung des Kommunizierenden, Hilfe zu verlangen, und die Neigung des Empfängers, sie einfach zu geben, auf natürliche Weise als Mittel entstehen, das den Weg 41 Interessanterweise scheint es schwierig zu sein, irgendeine Art von rekursiven Prozessen im auditiven Bereich allein zu erhalten, da auditive Reize gleichzeitig an alle ausgesandt werden. Im visuellen Bereich sehe ich etwas, und um zu wissen, daß Sie es ebenfalls sehen, muß ich Sie (anders als beim Hören) anschauen. Ich muß Sie ebenfalls anschauen, um zu sehen, ob Sie sehen, daß ich den Gegenstand sehe usw. Nachtaktive Tiere, die keinen Gesichtssinn haben, würden gemäß dieser Überlegung niemals gemeinsame Aufmerksamkeit entwickeln. 210

hin zur Erreichung des gemeinsamen Ziels erleichtert. Man beachte, daß Schimpansen ihren Artgenossen gelegentlich Hilfe anbieten. Dem Evolutionsprozeß hätte also ein bestimmtes Verhalten als Ausgangspunkt für die Evolution des Verlangens von Hilfe von anderen als einem grundlegenden Kommunikationsmotiv zur Verfügung gestanden. Bei den meisten Gruppentätigkeiten bieten sie jedoch weder Hilfe an noch informieren sie andere unterstützend bei irgendwelchen Tätigkeiten. Für den Evolutionsprozeß bleibt also immer noch etwas zu tun übrig. Man beachte auch, daß bei mutualistischen gemeinschaftlichen Tätigkeiten der Unterschied zwischen dem Verlangen nach Hilfe und dem Angebot von Hilfe durch Information minimal ist. Wenn wir zum Beispiel mit einem gemeinsamen Ziel zusammen einen Baumstamm bewegen und ein Hindernis im Weg steht, kann ich von Ihnen verlangen, es zu entfernen, um uns zu helfen. Oder ich kann Sie über das Hindernis in Kenntnis setzen und davon ausgehen, daß Sie dadurch zu dem Wunsch gelangen, es zu entfernen, um uns zu helfen. Wenn wir uns außerhalb mutualistischer Kontexte bewegen, ist der Unterschied zwischen dem Verlangen nach Hilfe (ich möchte, daß Sie jenen Stein entfernen, weil mich das meinem Ziel näherbringt) und dem Helfen durch Information (ich möchte, daß Sie jenen Stein wahrnehmen, weil er Sie am Erreichen ihres Ziels hindert) viel größer. Eine Analogie mag hier lehrreich sein. Es ist eine interessante morphologische Tatsache, daß von allen Primaten nur die Menschen eine sehr gut sichtbare Ausrichtung der Augen aufweisen (wegen der weißen Sklera),42 und tatsächlich neigen menschliche Kleinkinder dazu, der Augenrichtung anstatt der Kopfrichtung der anderen zu folgen, während Menschenaffen eher der Kopfrichtung und nicht der Augenrichtung 42 Kobayashi und Koshima 2001. 211

anderer folgen.43 Warum sollte das so sein? Es muß mit irgendeinem Vorteil für das menschliche Individuum verbunden sein, für seine Augenrichtung anderen gegenüber »Reklame zu machen«, was dann der Fall ist, wenn es viele Situationen gibt, bei denen das Individuum auf andere zählt, indem es diese Information verwendet, um mit anderen zusammenzuarbeiten oder ihnen zu helfen, und nicht, um mit ihnen in Konkurrenz zu treten oder sie auszubeuten. Wir können uns kommunikative Verhaltensweisen, die dazu dienen, die inneren Zustände von Individuen auszudrücken, auf dieselbe Weise vorstellen. Beispielsweise können wir kooperative Aufforderungen als »Reklame« für meinen inneren Zustand des Wollens ansehen, was nur in Situationen adaptiv sein kann, in denen es mir nützt, wenn andere über mein Wollen Bescheid wissen, prototypisch wenn Sie ihre eigenen Gründe dafür haben, mir bei der Befriedigung meiner Wünsche zu helfen, wie bei der mutualistischen Zusammenarbeit. Es sind also diese Arten von Kontexten, in denen Menschen die Neigungen und Fertigkeiten entwickelt haben könnten, andere einfach über ihre Wünsche zu informieren oder sie über Dinge zu informieren, die für beide Parteien nützlich sein könnten. Was nun die Kommunikationsmittel selbst angeht, so ist der offensichtlichste Kandidat für das Verlangen von Hilfe und vielleicht auch für das Anbieten von Hilfe bei mutualistischen gemeinschaftlichen Tätigkeiten die Zeigegeste. Mutualistische gemeinschaftliche Tätigkeiten finden im Hier und Jetzt statt und sind durch gemeinsame Ziele und gemeinsame Aufmerksamkeit sehr robust von oben nach unten strukturiert. Zeigegesten sollten daher in den meisten Fällen ausreichen, um die Aufgabe zu erledigen. Wir könnten sogar über das fehlende Werkzeug erfolgreich kommunizieren, indem wir in die Richtung zeigen, in der es sich zur Zeit vermutlich 43 Siehe auch Tomasello et al. 2007. 212

befindet. Ikonische Gesten sind wahrscheinlich in diesem frühen Stadium noch nicht möglich, weil sie eine Gricesche kommunikative Absicht erfordern, um sie als etwas anderes denn als nichtssagende Handlungen im falschen Kontext zu markieren (siehe unten). Wenn Individuen an diesem Punkt jedoch über bestimmte Fertigkeiten der Imitation verfügten, könnten natürlich auftretende Intentionsbewegungen (jemanden zu der Stelle zu »schieben«, von der die gemeinsame Aktion ausgehen soll, zum Beispiel) nicht nur durch ontogenetische Ritualisierung (wie bei Affen) erzeugt, sondern auch imitiert werden. Daher lautet unser relativ unstrittiger Vorschlag, daß menschliche Zusammenarbeit anfangs mutualistisch war. Dieser Mutualismus selbst hing von einem ersten Schritt hin zu toleranteren und großzügigeren Individuen ab. Dem innovativeren Teil des Vorschlags zufolge ist die mutualistische Zusammenarbeit die natürliche Heimstatt kooperativer Kommunikation. Insbesondere entstanden Fertigkeiten des rekursiven Erkennens geistiger Zustände zunächst im Zuge der Bildung gemeinsamer Ziele; das führte dann zu einer gemeinsamen Aufmerksamkeit auf Dinge, die für das gemeinsame Ziel relevant sind (von oben nach unten) und schließlich zu weiteren Formen eines gemeinsamen begrifflichen Hintergrunds. Hilfemotive, die bis zu einem gewissen Grad bei nichtkommunizierenden Menschenaffen schon vorhanden sind, können im Kontext mutualistischer Zusammenarbeit gedeihen, in welchem meine Hilfe Ihnen gegenüber mir selbst hilft. Daher entstanden das kommunikative Verlangen nach Hilfe, und zwar entweder durch Handlungen oder durch Informationen, sowie das diesem Verlangen Entsprechen (möglicherweise auch so etwas wie das Anbieten von Hilfe durch Informationen) sehr wahrscheinlich im Kontext mutualistischer Zusammenarbeit. An diesem Punkt unserer Quasi-Evolutionsgeschichte stehen uns also zumindest Zei213

gegesten zur Verfügung, um Hilfe zu verlangen, sowie eine Neigung, solchen Aufforderungen Folge zu leisten (wobei vielleicht manche Hilfsangebote in der Form nützlicher Informationen daherkommen), und zwar auf dem unmittelbaren, gemeinsamen Boden mutualistischer, gemeinschaftlicher Interaktionen.

5.2.2 Indirekte Reziprozität und Hilfe durch Information Menschen helfen einander (unter anderem durch Informationen) und erbitten in vielen Situationen außerhalb mutualistischer Zusammenarbeit Hilfe voneinander. Daher müssen wir diese auf der ursprünglich adaptiven Situation aufbauende Ausweitung erklären. Das Anbieten von Hilfe und das positive Reagieren auf Bitten um Hilfe außerhalb mutualistischer Kontexte beinhalten so etwas wie Altruismus, wobei ein Individuum seine Interessen denen eines anderen Individuums unterordnet. Das erfordert eine besondere Erklärung. Erneut kann ich noch nicht einmal die Umrisse einer vollständigen Erklärung der Evolution des menschlichen Altruismus zeichnen, weshalb ich nur einige Gedanken darüber anbiete, wie es sich im Fall der kooperativen Kommunikation abgespielt haben könnte. Bereits Schimpansen helfen in manchen Fällen.44 Worauf dieses Verhalten beruht, ist nicht ganz klar, obwohl es Daten gibt, die auf eine direkte Reziprozität in den natürlichen Interaktionen der Schimpansen hindeuten: Sie helfen der Person, die ihnen hilft.45 Es ist jedoch unwahrscheinlich, daß diese direkte Reziprozität weitreichend oder stabil ist, und sie tritt mit 44 Warneken und Tomasello 2006, Warneken et al. 2007. 45 De Waal und Lutrell 1988. 214

ziemlicher Sicherheit nicht auf, wenn es um Nahrung geht. In einer Feldstudie stellten Gilby et al. fest, daß das Teilen von Fleisch nach einer Jagd nicht damit verbunden war, daß der Empfänger dem Spender dies später reziprok mit Sex oder Unterstützung bei Kämpfen »zurückzahlte«.46 Auch in den Untersuchungen von Silk et al. sowie Jensen et al. - obwohl hier die Reziprozität nicht direkt überprüft wurde - halfen die Affen den anderen nicht dabei, Nahrung zu bekommen, selbst dann nicht, wenn es sich um einen Elternteil, ein Kind oder einen Bundesgenossen handelte.47 Jedenfalls scheint für das Helfen außerhalb gemeinschaftlicher Interaktionen eine bestimmte Art von Reziprozität nötig. Eingedenk der Begrenztheit der direkten Reziprozität bietet sich die indirekte Reziprozität als Kandidat an. Nach dieser Logik entscheiden sich Individuen dafür, denjenigen zu helfen oder mit ihnen zu kooperieren, die im allgemeinen einen guten Ruf in dieser Hinsicht genießen.48 Belege dafür, daß Schimpansen tatsächlich Urteile über andere bilden, die mit deren Ansehen zusammenhängen, lieferten Melis, Hare und Tomasello.49 In dieser Untersuchung benötigten Schimpansen einen Partner, der ihnen helfen sollte, an Futter heranzukommen. Zwei potentielle Partner standen zur Verfügung (die für sie in diesem Kontext beide neu waren). Ein Partner stellte sich als ungeeignet heraus - ein dominantes Männchen, das gewöhnlich versuchte, die Situation an sich zu reißen während der andere sich als guter Partner erwies. Nach nur kurzer Erfahrung mit jedem dieser beiden Partner begannen die Schimpansen, fast ausschließlich den kooperativeren zu wählen. Das zeigt, daß nichtkooperierende Individuen einen 46 47 48 49

Gilby et al. 2006, siehe jedoch Watts und Mitani 2002. Silk et al. 2005, Jensen et al. 2006. Nowak und Sigmund 1998, Panchanathan und Boyd 2003. Melis, Hare und Tomasello 2006b. 215

Preis für ihre Selbstsüchtigkeit und ihr Konkurrenzgebaren zahlen, indem sie von attraktiven Gelegenheiten für mutualistische Zusammenarbeit ausgeschlossen werden (während den Individuen, die sie meiden, dadurch im Grunde kein Nachteil entsteht - es handelt sich nicht um eine aufwendige Bestrafungsaktion, und daher gibt es hier auch kein Altruismusproblem zweiter Stufe). Diese Tatsache, daß Individuen ihre Partner für mutualistische Zusammenarbeit ausgehend von deren Ansehen auswählen, bedeutet, daß Individuen, die dies verstehen, nun versuchen können, ihren Ruf durch öffentliche Hilfe- und Kooperationshandlungen zu verbessern, vorausgesetzt, sie verstehen, daß andere sie beobachten und einschätzen. Im Kontext von nichtmutualistischen Tätigkeiten, bei denen das Individuum überhaupt keinen Vorteil hat, könnte es daher den anderen dennoch Hilfe anbieten - unter anderem indem es ihnen Informationen anbietet, von denen es glaubt, daß sie hilfreich oder relevant für sie sein werden - , um seinen Ruf als hilfsbereite Person, mit der die anderen in Zukunft kooperieren wollen, aufzupolieren. Eine weitere mögliche Letztursache des Helfens durch das Anbieten von Informationen ist das sogenannte Prahlen (durch ein aufwendiges Fitneßsignal),50 bei dem ich im Kontext sexueller Selektion meine gesellschaftliche Macht zeige, indem ich mein Wissen über nützliche Dinge zur Schau stelle. In dieser Hinsicht könnte das Informieren anderer über Dinge, die für den Ruf der anderen in der Gruppe wichtig sind, von besonderer Bedeutung sein (Tratschen).51 Des weiteren könnte das Lehren insbesondere des eigenen Nachwuchses ein weiterer wichtiger adaptiver Kontext für das Informieren gewesen sein, da hierdurch Vorteile inklusiver Fitneß (Verwandtschaftsselektion) 50 Zahavi und Zahavi 1997. 51 Siehe Desalles 2006. 216

erwachsen.52 Obwohl es sich dabei vermutlich um wichtige abgeleitete Funktionen handelte, deutet doch die gemeinsame kooperative Infrastruktur menschlicher Zusammenarbeit und Kommunikation darauf hin, daß gemeinschaftliche Tätigkeiten die ursprüngliche Heimstatt menschlicher kooperativer Kommunikation waren. Sobald wir über Aufforderungen hinausgehen und zum Informieren gelangen, wird die Kommunikation über räumlich und zeitlich nicht gegenwärtige Dinge zu einem viel stärkeren Bedürfnis. Wenngleich menschliche Zeigegesten die Übermittlung viel komplexerer Botschaften ermöglichen als die Aufmerksamkeitsfänger von Affen, sind sie offensichtlich immer noch in mancherlei Hinsicht begrenzt. Entscheidend ist, daß der gemeinsame begriffliche Hintergrund, der die grundlegende Quelle der kommunikativen Kraft von Zeigegesten ist, für sie auch eine Begrenzung darstellt. Wenn Sie und ich beispielsweise reichlich gemeinsame Jagderfahrung an einem Wasserloch haben, wir dort manchmal eine Gazelle sehen und Sie mich heute aus dieser Richtung zurückkehren und aufgeregt nach hinten zeigen sehen, werden Sie wahrscheinlich annehmen, daß sich dort jetzt eine Gazelle befindet; ich habe also durch meine Zeigegeste erfolgreich auf eine abwesende Entität Bezug genommen. Wenn wir aber diese frühere Erfahrung nicht teilen, kann ich natürlich nicht auf den abwesenden Bezugsgegenstand zeigen. Zeigegesten sind notwendig wirkungslos in Situationen, in denen die Beteiligten nur wenig oder überhaupt keinen gemeinsamen Hintergrund haben, besonders dann, wenn lange Ketten von Schlußfolgerungen erforderlich sind. Zeigegesten werden daher keine sehr wirksame Form der Kommunikation sein, um Neulinge oder kleine Kinder zu unterrichten. Wenn ich mit einem komplexen Verfahren beschäftigt bin, beispiels52 Gergely und Csibra 2006. 217

weise versuche, mit Hilfe eines Stocks Wurzelknollen auszugraben, und Ihre Hilfe beim Entfernen der Erde brauche, kann ich einfach auf die Erde zeigen, die meine Zugangsstelle bedeckt, falls Sie schon vorher mit mir bei dieser Sache zusammengearbeitet haben. Wenn Sie diese Tätigkeit jedoch noch nie zuvor ausgeübt haben, ist es unwahrscheinlich, daß eine einfache Zeigegeste Ihnen sagt, was Sie tun sollen. Aus demselben elementaren Grund ist das Zeigen auch kein sehr wirksames Kommunikationsmittel unter Fremden. Die nahezu vollständige Abhängigkeit der Zeigegesten von einem gemeinsamen Hintergrund zwischen Kommunizierendem und Empfänger ist daher gleichermaßen ihre Stärke wie auch ihre Schwäche. Ikonische Gesten stützen sich grundsätzlich ebensosehr auf den gemeinsamen Hintergrund, hängen aber etwas weniger von ihm ab, weil in der Geste selbst mehr Informationen enthalten sind. Daher kann ich meinem uneingeweihten Partner durch ikonische Gesten zu verstehen geben, wie er die Erde wegschaufeln soll, auch wenn er das in diesem Kontext niemals zuvor getan hat (dennoch muß er meine Geste als Kommunikationshandlung und als relevant für unsere gegenwärtige Tätigkeit auffassen). Einem Freund gegenüber kann ich die Bewegungen und die Laute einer Antilope nachahmen, um ihre Gegenwart am Wasserloch anzuzeigen (vielleicht in Kombination mit einer Zeigegeste in die entsprechende Richtung), auch wenn wir niemals zuvor dort zusammen eine gesehen haben. Außerdem sollten ikonische Gesten bei Fremden in vielen Kontexten wirksamer sein als Zeigegesten. Es gibt jedoch einen Grund dafür, weshalb ikonische Gesten in der menschlichen Ontogenese später auftreten und bei Affen nicht vorhanden sind. Um eine ikonische Geste zu verwenden, muß man zunächst in der Lage sein, Handlungen in simulierter Form außerhalb ihres instrumentellen Zusammenhangs zu vollziehen, was Fertigkeiten zur Imitation, wenn nicht gar 218

zu Als - ob - Handlungen zu erfordern scheint. Noch wichtiger ist jedoch die Tatsache, daß man zuerst und jedenfalls bis zu einem gewissen Grad die Gricesche kommunikative Absicht verstehen muß, um eine ikonische Handlung als kommunikative Geste zu aufzufassen; andernfalls wird der Empfänger annehmen, der Kommunizierende verhalte sich einfach nur eigenartig und versuche merkwürdigerweise, wie eine Antilope zu laufen oder wirklich ein Loch zu graben, obgleich der Kontext eindeutig nicht angemessen ist (die Handlung muß deshalb von der Interpretation als eine wirkliche Handlung in einem Sinne »isoliert« werden, der dem von Leslie für Alsob-Handlungen vorgeschlagenen entspricht).53 Ikonische Gesten leiten sich also vermutlich von den Intentionsbewegungen der Affen ab - von den Anfangssequenzen wirklicher Handlungen - , fügen aber eine repräsentationale Dimension hinzu, die auf Simulation/Imitation und dem Verständnis der kommunikativen Absicht seitens des Empfängers beruht. Belohnt wird das Beherrschen ikonischer Gesten mit der Fähigkeit, effektiver über eine größere Bandbreite von Situationen mit Personen zu kommunizieren, mit denen man weniger Erfahrung teilt.54 Wenn Menschen anfangen, wirklich hilfsbereit sein zu wollen, um damit ihr Ansehen zu steigern, und sie damit rechnen können, daß andere auch hilfsbereit sein wollen, beginnen sie, funktional betrachtet, die anderen freimütig über Dinge zu informieren. Tatsächlich können sich sogar individualistische Imperative in kooperative Imperative verwandeln: Ich sage Ihnen nicht, was Sie tun sollen, sondern informiere Sie bloß über meinen Wunsch, weil ich weiß, daß Sie mir bei seiner Erfüllung werden helfen wollen. Bezeichnenderweise entsteht die Gricesche kommunikative Absicht 53 Leslie 1987. 54 Donald 1991. 219

in diesen extrem auf Hilfe ausgerichteten Kontexten. Die Reihenfolge könnte folgende sein (K=Kommunizierender, E=Empfängerin): - Das Ziel von K ist, daß E etwas zur Kenntnis nimmt: entweder eine hilfreiche oder interessante Information (bei einem informierenden Akt) oder seine eigenen inneren Zustände (bei einer kooperativen Aufforderung). - E versteht, daß K sie auf etwas hinweisen will, und E will kooperativ sein und diese Information akzeptieren, weil sie darauf vertraut, daß diese für sie entweder unmittelbar nützlich sein wird (wenn es sich um einen informierenden Akt handelt) oder ihr die Gelegenheit bietet, selbst hilfsbereit zu sein (wenn es sich um eine kooperative Aufforderung handelt) und ihren Ruf dadurch fördert, daß sie der Aufforderung von K Folge leistet. - K erkennt, daß E verstehen und auf seinen Hinweis reagieren will, und zwar zum Teil deshalb, weil er auf ihre Kooperativität vertraut. Über die Tatsache hinaus, daß K E zu verstehen gibt, daß er will, daß sie etwas zur Kenntnis nimmt, betont er nun ihr gegenüber, daß er will, daß sie weiß, daß er sie auf etwas hinweisen will - in der Erwartung, daß unter der Voraussetzung von Es Hilfsbereitschaft ihr Wissen, daß er dies will, dazu führt, daß sie sich mehr anstrengt, ihn zu verstehen und seinem Willen Folge zu leisten. Diese Art von Überlegung - ich habe sie kooperatives Schlußfolgern genannt - unterscheidet sich grundlegend vom praktischen Schließen in bezug auf eigene Handlungen oder die Handlungen anderer jeweils für sich betrachtet. Um mit Levinson zu sprechen: Es gibt eine außergewöhnliche Wende in unserem Denken, sobald wir Handlungen ausführen und beabsichtigen, daß die 220

anderen ihre Handlungen mit unseren koordinieren sollen - in diesem Fall müssen wir unsere Handlungen so gestalten, daß sie offensichtlich einleuchten.55

Man kann sich leicht vorstellen, daß die kommunikativen Handlungen, die im ersten Schritt dieser Reihenfolge beschrieben wurden (und die im wesentlichen Sperbers und Wilsons »informativer Absicht« entsprechen56), tatsächlich zu einem frühen Zeitpunkt der Evolution des Menschen auftraten - abermals insbesondere in mutualistischen Kontexten. Ich möchte, daß Du diese Nahrung siehst, damit Du sie bekommen kannst, da wir sie am Ende teilen werden (und mir ist es eigentlich gleichgültig, ob Du verstehst, daß ich Dich darauf hinweise); ich ziehe zum Beispiel einen Zweig mit Beeren für Dich herunter. Sobald aber der Kommunizierende zu der Einschätzung gelangt, daß es den Empfänger wirklich interessiert, was der Kommunizierende will, kann er das ausnutzen, indem er den Empfänger wissen läßt, daß er, der Kommunizierende, versucht, ihn entweder mit einer (für diesen) interessanten Information zu versorgen oder ihn über seine inneren Zustände zu informieren. Wenn Sie beispielsweise die Beeren vor Ihrem Gesicht nicht bemerken, könnte ich vokalisieren oder auf andere Weise Ihre Aufmerksamkeit auf mich und die Tatsache lenken, daß ich diese Beeren absichtlich und aus einem bestimmten Grund vor Ihr Gesicht heruntergezogen habe (von dem wir wechselseitig annehmen, daß es sich um einen kooperativen Grund handelt, Sie also versuchen sollten, ihn zu identifizieren). Nichts von all dem ist möglich, solange beide Beteiligten nicht gemeinsam wissen, daß sie beide hilfsbereit sein wollen. Es ist, wie oben erwähnt, äußerst unwahrscheinlich, daß sich diese Reihenfolge mit ikonischen Gesten ergeben hätte - eine wie ich 55 Levinson 1995, S. 411. 56 Sperber und Wilson 1986. 221

meine interessante Feststellung. Ich kann Ihre Aufmerksamkeit leicht auf etwas in der unmittelbaren Umgebung lenken, ohne dabei meine Urheberschaft derart in den Vordergrund zu stellen, wie es Affen etwa mit Zeigegesten tun, und dann auf den natürlichen Lauf der Dinge vertrauen, wenn Sie den Gegenstand sehen und auf ihn so reagieren, wie ich es vorhergesehen habe. Wenn ich aber Ihnen gegenüber gestikuliere, indem ich zum Beispiel eine Antilope nachahme, kann ich Sie nicht informieren, ohne Ihnen gleichzeitig zu verstehen zu geben* daß ich Sie informieren will - keine informierende Absicht ohne kommunikative Absicht - , weil Ihnen meine Handlung einfach nur seltsam vorkommen wird und nichts kommuniziert, wenn Sie meine kommunikative Absicht nicht erkennen. Dem Hilfeersuchen anderer nachzukommen und gerade auch das Anbieten von Hilfe für andere nahmen ihren Anfang also wahrscheinlich im Kontext mutualistischer Zusammenarbeit, in dem die Einwilligung immer adaptiv ist, weil sie für einen selbst vorteilhaft ist; sie wurden dann wegen der positiven Wirkungen auf das Ansehen des Helfenden auf nichtmutualistische Situationen ausgeweitet. Damit sind zwei bemerkenswerte Phänomene verbunden: Erstens drücken Menschen sehr häufig - und in bestimmten Situationen fast immer - ihre Dankbarkeit demjenigen gegenüber aus, der ihnen geholfen hat. Diese spezielle kommunikative Funktion hat sich entwickelt, weil sie für das Ansehen beider Beteiligter von Vorteil ist. Wenn ich Ihnen für einen Gefallen danke, zeige ich damit jedermann in der Umgebung, daß Sie eine hilfsbereite Person sind, und ich habe ebenfalls klargestellt, daß jeder, der mir hilft, erwarten kann, diese Art von positiver Werbung zu bekommen - Menschen wollen dankbaren Empfängern helfen, die ihren Altruismus anderen gegenüber bekannt machen. Eine weitere wichtige Dimension der Höflichkeit besteht zweitens darin, anderen Menschen nicht zu 222

befehlen, etwas zu tun (wie bei individualistischen Imperativen); vielmehr drückt man lediglich und vielleicht sogar sehr indirekt seinen Wunsch aus (wie bei kooperativen Imperativen) und läßt sie aus eigenen Stücken handeln. Anschließend kann man ihnen danken, weil sie aus eigenem freien Willen geholfen haben und nicht, weil es ihnen befohlen wurde.57 Einer Interpretation dieses Verhaltens zufolge ist ein von mir angebotener Anreiz, wenn ich Sie um einen Gefallen bitte, daß sie die Möglichkeit haben, es freiwillig zu tun (Ihre Hilfe Ihnen entsprechend als Willensakt angerechnet wird). Zum Ausgleich werde ich Ihnen öffentlich danken. Wenn man nur indirekt um einen Gefallen bittet und Dankbarkeit ausdrückt, stellt man in einem gewissen Sinne sicher, daß die Person, die der Bitte nachkommt, dafür den Vorteil einer Ansehenssteigerung erhält. In Verbindung mit gesellschaftlichen Normen führen solche Prozesse zu Gefühlen wie etwa Schuld, die öffentlich als Entschuldigungen ausgedrückt werden, wenn eine Person einer anderen nicht geholfen hat, wie sie es hätte tun sollen. In unserer Quasi-Evolutionsgeschichte sind wir nun bei Menschen angelangt, die auf Aufforderungen reagieren und anderen selbst außerhalb von mutualistischen Kontexten relativ freimütig hilfreiche und interessante Informationen anbieten, indem sie sowohl Zeigegesten als auch ikonische Gesten zu diesem Zweck verwenden. Eine entscheidende Frage lautet nun, wie solche Verhaltensweisen soziale Normen, die mit Sanktionen verbunden sind und diese Hilfsbereitschaft steuern, erzeugt haben könnten. Das ist eine sehr schwierige Frage, die weit über meine Kompetenz und meinen Bereich hinausgeht. Fürs erste kann ich jedoch zumindest auf die Tatsache verweisen, daß in einer Gruppe von Individuen, die zum rekursiven Erkennen geistiger Zustände in der Lage 57 Brown und Levinson 1978. 223

sind und sich zudem um ihren Ruf sorgen - so daß jeder vom anderen weiß, daß er sich um seinen Ruf sorgt leicht gegenseitige Erwartungen von Hilfsbereitschaft entstehen konnten. Wechselseitige Erwartungen sind keine Normen, weil sie keine sanktionierende Kraft haben, aber sie sind ein Schritt in diese Richtung. Daher können wir an dieser Stelle festhalten, daß diese Formen gegenseitige Erwartungen im Hinblick auf Hilfsbereitschaft postulieren, die für die Darstellung der eigenen kommunikativen Absicht und für deren Anerkennung durch geeignete Relevanz-Schlußfolgerungen seitens anderer entscheidend sind. Die normative Kraft kommt jedoch aus einer anderen Richtung, welcher wir uns nun zuwenden.

5.2.3 Kulturelle Gruppenselektion und das Teilen von Einstellungen Alle Untersuchungen des sozialen Lernens und der Imitation bei Menschenaffen, die menschliche Kinder als Vergleichsmaßstab einschließen, zeigen, daß Kinder quantitativ, wenn nicht gar qualitativ, auf viel detailliertere Weise von anderen lernen.58 Ein möglicher Grund dafür ist, daß Menschen sich in einem größeren Maß als Affen auf die tatsächlich vollzogenen Handlungen konzentrieren (anstatt auf die Ergebnisse in der Umgebung bzw. die erwünschten Ergebnisse). Dieser stärker handlungsbasierte Ansatz könnte möglicherweise aus dem Bedürfnis der Menschen hervorgegangen sein, von anderen durch Imitation in für Menschen spezifischen Situationen zu lernen, etwa beim Herstellen komplexer Werkzeuge, und hat vermutlich das Hervorbringen ikonischer Gesten unterstützt, die wirkliche Ereignisse simulieren. Es gibt jedoch noch eine andere Dimension, die in experi58 Siehe die Übersicht bei Whiten et al. 2004. 224

mentellen Untersuchungen typischerweise nicht hervortritt, nämlich die sogenannte soziale Funktion der Imitation.59 In der Sozialpsychologie ist es beispielsweise bekannt, daß eine mögliche Form, Solidarität mit anderen in der Gruppe auszudrücken, darin besteht, sich so wie sie zu verhalten, sich so zu kleiden, so zu sprechen, ähnliche Einstellungen auszudrücken und im allgemeinen wie sie zu sein. Die Quintessenz dieser Idee wird sehr schön von einer Szene aus dem Film ET erfaßt, in der die Kinder in ihrem Schlafzimmer dem kindgroßen Außerirdischen gegenüberstehen, das kleine Mädchen ihn anstarrt und langsam ihren Zeigefinger hebt. Als die freundliche Kreatur ihren Blick erwidert und langsam seinen eigenen Zeigefinger hebt, atmen die Kinder (und das Publikum) in der Erkenntnis auf: Er ist wie wir (und könnte daher potentiell einer von uns sein)! Die Kehrseite davon ist natürlich, daß Menschengruppen andere diskriminieren, die nicht so sind wie sie selbst. Dabei treiben wir großen Aufwand, um Möglichkeiten zu ersinnen, wie ausdrücklich gekennzeichnet werden kann, wer zu den anderen gehört und wer einer von uns ist. Am offensichtlichsten ist der Umstand, daß jeder, der nicht unsere Sprache spricht, nicht zu uns gehört, aber auch jeder, der sich nicht so kleidet wie wir oder ißt wie wir oder sein Gesicht anmalt wie wir oder dieselben Götter anbetet wie wir oder alle möglichen anderen Dinge anders tut. In einem nie zuvor dagewesenen Ausmaß kennzeichnen sich menschliche Gruppen selbst, um die Mitgliedschaft in der Gruppe abzusichern, wobei es sogar gruppenspezifische Grußformeln gibt - ein einzigartiger Sprechakt - , die teilweise dazu dienen, die Mitgliedschaft in der Gruppe zu stärken. Auf der psychologischen Ebene werden Kleinkinder mit diesem Ingroup/ Outgroup-Kontrast vertraut, indem sie die Menschen in ihrer Umgebung imitieren und sich ihnen sogar angleichen, damit 59 Uzgiris 1981, Carpenter 2006. 225

sie wie diese sind. Dies führt unter anderem auch zu den regionalen Akzenten der Sprachen. Mehr noch als bloß so zu sein wie die anderen, wollen Menschen auch von den anderen gemocht werden, und eine Möglichkeit, ihre Zugehörigkeit zu pflegen, besteht darin, Gefühle und Einstellungen zur Welt durch verschiedene Arten von Tratsch, Erzählungen und expressiven Sprechakten innerhalb der sozialen Gruppe zu teilen. Wenn man wie die anderen sein will, aber auch dann, wenn man von ihnen gemocht werden will, führen Mißerfolge zu negativen Gefühlen: Scham oder Schuld, wenn ich mich abweichend verhalte und eine soziale Norm verletze, sowie Einsamkeit oder Isolation, wenn mich niemand mag. Diese Gefühle haben sich vermutlich genau deshalb entwickelt, weil sie sowohl die Aufmerksamkeit für als auch die Einhaltung von soziale(n) Normen der Hilfsbereitschaft/Reziprozität sowie der Konformität/Solidarität/Zugehörigkeit zu gewährleisten helfen. Diese Dimension der Imitation/Konformität/Solidarität/ Zugehörigkeit hat zwei wichtige Konsequenzen für die Evolution der kooperativen Kommunikation des Menschen, die sehr verschiedene Aspekte dieses Prozesses betreffen. Erstens bildet der Wunsch, die Zugehörigkeit zu anderen zu pflegen, die Grundlage für eines der drei Grundmotive des Kooperationsmodells menschlicher Kommunikation: den Wunsch, Gefühle und/oder Einstellungen mit anderen zu teilen. Obwohl dieses Motiv sich vom Informationsmotiv im allgemeinen nicht scharf zu unterscheiden scheint - man könnte sagen, daß ich Sie einfach über meine Einstellung informiere, wenn ich meine Begeisterung für ein Gemälde ausdrücke - , zeigen Untersuchungen an Kleinkindern (die im vorangehenden Kapitel referiert wurden), daß mein Ziel beim Ausdrücken meiner Begeisterung nicht wie bei informativen Handlungen darin besteht, Sie mit Informationen zu versorgen, die Sie wollen oder brauchen, sondern vielmehr darin, bei Ihnen 226

eine Einstellungsexpression auszulösen, die mit meiner übereinstimmt. Wenn wir dasselbe Gefühl im Hinblick auf eine bestimmte gemeinsame Erfahrung haben, trägt das dazu bei, daß wir uns psychologisch einander näher fühlen. Um die Wichtigkeit dieses Prozesses einzuschätzen, braucht man sich nur vorzustellen, was geschehen würde, wenn Ihr Partner eines Tages anfinge, sich ausnahmslos verächtlich über Ihre besten Freunde und die von Ihnen am meisten geliebten Gegenstände und Tätigkeiten zu äußern. Und wenn Menschen aufgefordert werden, Liebesaffaren zu erklären, die ohne vorherigen persönlichen Kontakt im Internet begannen, ist eine verbreitete Antwort, daß »wir so viel gemeinsam haben«, »wir dieselben Dinge mögen« usw. Ein gut gesicherter Befund in der Sozialpsychologie ist die Tatsache, daß Menschen dazu neigen, sich mit anderen zusammenzutun, die ihre Perspektive und Einstellungen teilen.60 Ein großer Teil des Schwelgens in Erinnerungen, wie man es in persönlichen Gesprächen in der Familie oder unter Freunden häufig antrifft, die nach einer Trennung wieder zusammenfinden, dient auch dazu, die Beziehungen zu festigen. Dabei besteht ein besonders wichtiger Teil in den gemeinsamen Bewertungen der vergangenen Ereignisse (»Es war so toll, als wir...«, »Es war so traurig, als er.. .«61). Es ist also möglich, daß das Teilen von Gefühlen und Einstellungen eine Art von Gruppenidentitätsfunktion unterstützt und daß das eine für den Menschen einzigartige Funktion ist. Daher lautet der Vorschlag, daß expressiv-deklarative Handlungen, die für die frühe Kommunikation und die Bindung von Kleinkindern so wichtig sind, eine eigenständige soziale Intention darstellen, Gefühle mit anderen zu teilen; und in der Tat könnte man expressiv-deklarative Handlungen als besonders proaktive Bemühungen ansehen, den gemein60 Schachter 1959. 61 Bruner 1986. 227

samen Hintergrund mit anderen auszudehnen, um mit ihnen immer tiefere Bindungen einzugehen. Die zweite Konsequenz der Dimension der Imitation/Konformität/Solidarität/Zugehörigkeit für die Kommunikation betrifft die Begründung von Normen. Das Wesen sozialer Normen ist der Druck, der von der Gruppe auf das Individuum ausgeübt wird, damit dieses sich konform verhält; die äußerste Drohung ist die Verbannung oder der physische Ausschluß aus der Gruppe. Daher stellten wir weiter oben fest, daß Menschen in einer Gruppe auf der Grundlage eines gegenseitigen Verständnisses davon, daß jeder helfen möchte und sich ebenso um seinen Ruf im Hinblick auf Hilfsbereitschaft sorgt, gegenseitige Erwartungen in bezug auf die Hilfsbereitschaft in kommunikativen Situationen entwickelt haben. Wenn wir aber noch den Druck hinzufügen, mit den Erwartungen der Gruppe übereinzustimmen (wenn ich gebeten werde, muß ich einfach das Salz weiterreichen), erhalten wir ausgewachsene Normen, wie zum Beispiel Normen der Hilfsbereitschaft in Kommunikationssituationen und begleitende soziale Sanktionen für den Fall der Verletzung dieser Normen (Verlust des Ansehens, soziale Isolation und dergleichen). Zumindest mit Blick auf die Kommunikation setzt sich also unsere Formel für Normen aus gegenseitigen Verhaltenserwartungen, der Sorge um das eigene Ansehen und dem Druck, mit den Gruppenerwartungen übereinzustimmen - sonst! - zusammen. In diesem Zusammenhang ist die Feststellung interessant, daß es keine Normen für expressiv-deklarative Handlungen gibt, wohingegen Menschen Normen der Hilfsbereitschaft bei der Kommunikation haben - die sich in Verpflichtungen manifestieren, in bestimmten Situationen andere zu informieren (zum Beispiel Sie darüber zu informieren, daß die Scheinwerfer Ihres Wagens eingeschaltet sind, wenn ich das entdecke). Für Menschen, die ihre Gefühle anderen gegenüber nicht äußern oder mit 228

Äußerungen dieser Art nicht umgehen können, gibt es keine sozialen Sanktionen, sondern nur einen persönlichen Verlust: Sie tun sich wesentlich schwerer, Freundschaften zu schließen und Anschluß zu finden. Nichts dergleichen scheint es bei Menschenaffen zu geben, was aufschlußreich ist. Es gibt, mit anderen Worten, keine überzeugenden Belege dafür, daß Affen andere bloß aus Gründen der sozialen Konformität und/oder Solidarität imitieren; sie verwenden bei ihrer Kommunikation keine expressiv-deklarativen Handlungen (auch nicht gegenüber Menschen); und ihre Kommunikation scheint nicht von irgendwelchen sozialen Normen geleitet zu sein (ebensowenig wie irgendein anderer Aspekt ihres Lebens). Daher scheinen die soziale Funktion der Imitation und der daraus resultierende Druck, Gruppennormen zu erfüllen, für den Menschen einzigartig zu sein, obwohl Menschenaffen mit Menschen die Fähigkeit teilen, instrumenteile Handlungen von anderen sozial zu lernen, in manchen Fällen vielleicht sogar durch Imitation. Es ist sicherlich möglich, daß sich diese Dimension der Kommunikation auf dem normalen Weg entwickelte, nämlich durch die Einwirkung auf Individuen. Ich selbst bin jedoch davon überzeugt - aus Gründen, die uns zu weit wegführen würden -, daß Menschen diese Dimension des »Wie-die-anderen-seinWollens« als ein Mittel entwickelt haben, um die Konformität innerhalb der Gruppe und Unterschiede zwischen Gruppen im Kontext einer auf mehreren Ebenen stattfindenden und an der Gruppe als ganzer ansetzenden Selektion zu maximieren: die sogenannte kulturelle Gruppenselektion.62 Dieser überaus kontroverse Prozeß ist für unsere Geschichte hier wahrscheinlich nicht entscheidend, aber wenn Gruppen tatsächlich mögliche Einheiten der Selektion in der Evolution sind - insbesondere im Kontext kultureller Prozesse, die auf 62 Richerson und Boyd 2005. 229

Konformität innerhalb von Gruppen und Differenzierung zwischen Gruppen ausgerichtet sind -, würde er zu erklären helfen, warum Menschen, und nur Menschen, Systeme sprachlicher Kommunikation entwickelt haben, die nicht bei allen Mitgliedern ihrer Spezies effektiv sind, so wie es bei allen anderen Organismen der Fall ist, sondern nur bei denen, die in derselben Kulturgruppe aufgewachsen sind. Kehren wir schließlich zur Griceschen kommunikativen Absicht zurück. Weiter oben haben wir gesehen, daß die Funktionsweise der Griceschen kommunikativen Absicht nur im Lichte verschiedener Arten von wechselseitigen Verstehensakten und Erwartungen zwischen den Kommunizierenden verstanden werden kann, das heißt konkret, wenn alle gemeinsam wissen, daß jeder Hilfsbereitschaft und Kooperation erwartet, und alle gemeinsam wissen, daß jeder sich um seinen Ruf sorgt. Es gibt aber nicht nur Erwartungen, sondern auch wirkliche Normen, die den Vorgang steuern. Eine wichtige Funktion der Griceschen kommunikativen Absicht - jenseits dessen, daß der Kommunizierende den Empfänger darauf aufmerksam macht, daß er etwas von ihm will - , besteht darin, daß sie im Grunde alles öffentlich macht. Manche Theoretiker nennen das »vollständige Offenheit«. Das heißt: Die Normen gelten und können nicht vermieden werden. Wenn wir auf irgendeine Weise Dinge aus dem öffentlichen Raum herausnehmen, indem wir eine kommunikative Absicht nicht äußern, laufen die Normen ins Leere. Betrachten wir noch einmal unser Beispiel aus Kapitel 3, bei dem es um verborgene Urheberschaft ging. Wenn ich mein leeres Weinglas an einen auffälligen Ort stelle und hoffe, mein Gastgeber werde es sehen und auffüllen, jedoch außerdem (aus Höflichkeitsgründen) dafür sorge, daß er nicht bemerkt, wie ich es hinstelle, und er deshalb meine Handlung nicht als eine offene Aufforderung ansieht, kommen keine Normen zur Anwendung. Wenn mein Gastgeber mein lee230

res Glas sieht, auch wenn ich bemerke, daß er es sieht (selbst wenn er in den Spiegel schaut und bemerkt, daß ich bemerkt habe, daß er es sieht), kommen immer noch keine Normen zur Anwendung. Wenn ich ihm jedoch offen signalisiere, indem ich das leere Glas in seine Richtung schwenke, würde das in den meisten Fällen eine Norm auslösen. Wir wissen beide, daß er das leere Glas gesehen und vermutlich aus der auf ihn gerichteten Handlung des Schwenkens geschlossen hat, daß ich das Glas aufgefüllt haben möchte. Deshalb muß er damit auf irgendeine Weise umgehen oder zumindest vortäuschen, daß er meine Handlung tatsächlich nicht gesehen hat. Ein analoges Beispiel: Meine Kollegin und ich wissen wechselseitig, daß sie ihr Kind jeden Tag um 17:30 Uhr abholen muß, und zu etwa derselben Zeit sprechen wir im Flur miteinander. Sie schaut kaum wahrnehmbar auf ihre Armbanduhr. Ich sehe das. Wenn ich nicht auf diese Wahrnehmung eingehe, kann ich einfach weiterreden und das Gesehene ignorieren. Wenn sie jedoch demonstrativ auf ihre Armbanduhr blickt - und will, daß wir beide es bemerken - , kann ich es nicht ignorieren, sondern muß irgendwie damit umgehen. Eine Hauptfunktion der Griceschen kommunikativen Absicht ist es also, meinen Kommunikationsakt in den öffentlichen Raum einzubringen, so daß alle Normen anwendbar sind. Wenn ich Sie anrede (auch auf nichtsprachliche Weise) und Sie diese Anrede anerkennen, müssen Sie kommunikativ auf mich eingehen. Wenn ich Sie nicht anrede, sondern einfach hoffe, daß Sie etwas bemerken und auf eine bestimmte Weise handeln, müssen Sie nicht auf mich eingehen. Wenn Sie allerdings auf mich eingehen und ich Sie um einen Gefallen bitte oder über etwas öffentlich informiere, müssen Sie der Aufforderung nachkommen oder sie akzeptieren - oder einen Grund angeben, warum Sie das nicht tun werden. Natürlich könnten Sie vorgeben, Sie hätten die Botschaft nicht verstanden. Wenn jedoch das Verstehen im öffentlichen 231

Raum stattfindet, kommen die Normen der Hilfsbereitschaft zur Anwendung. Positiv ausgedrückt heißt das: Wenn etwas erst einmal im öffentlichen Raum ist, ist es auch für meinen guten Ruf relevant. Wenn ich Sie beispielsweise für etwas gewinnen möchte und Sie akzeptieren, bestätigen Sie, daß Sie dasselbe Spiel wie ich spielen. Wenn ich Sie um einen Gefallen bitte und Sie darauf eingehen, nützt das Ihrem Ruf. Wenn ich nützliche Informationen anbiete, nützt das meinem Ruf. Indem sie den Kommunikationsakt öffentlich macht, strukturiert die Gricesche kommunikative Absicht die menschliche Kommunikation insofern, als nun alle Normen und die damit verbundenen Sanktionen in Kraft treten. Jeder, der Zweifel an den Komplexitäten hat, die sich aus dieser Form öffentlicher Kommunikation ergeben können, braucht nur die unglaublichen Verwicklungen zu betrachten, die sich aus Höflichkeitsüberlegungen bei der kooperativen Kommunikation ergeben.63 Wiederum gilt all dies nahezu selbstverständlich ausschließlich für den Menschen. Es gibt keinerlei Belege dafür, daß nichtmenschliche Primaten so etwas wie einen öffentlichen Raum schaffen, in dem Überlegungen zum Ansehen und normative Sanktionen eine Rolle spielen. Ein weiterer interessanter Aspekt dieser normativen Dimension ist, daß er dazu dient, antisoziale Verwendungen des leistungsfähigen, neuen Werkzeugs kooperativer Kommunikation mit Sanktionen zu belegen. Mit anderen Worten: Fertigkeiten der kooperativen Kommunikation - und alle Annahmen von Kooperativst, die ihnen zugrunde liegen - schaffen die Möglichkeit des Lügens. Eine Lüge funktioniert gewöhnlich deshalb, weil die Empfänger dem Kommunizierenden Hilfsbereitschaft (und in diesem Rahmen auch Aufrichtigkeit) zuschreiben, wenn es nicht einen besonderen Grund gibt, vom Gegenteil 63 Siehe beispielsweise Brown und Levinson 1978. 232

auszugehen. Die soziale Gruppe versucht, diese »unbeabsichtigte Folge«, diesen Makel an einem ansonsten wunderbaren Werkzeug, zu korrigieren, indem sie strenge soziale Normen gegen das Lügen aufstellt, so daß jeder, der (ohne guten Grund) beim Lügen ertappt wird, eine bedeutende Einbuße seines Ansehens erleidet. Während Menschenaffen zwar Dinge vor anderen verbergen können,64 sind sie wohl nicht in der Lage, andere aktiv irrezuführen oder zu belügen, weil sie nicht mit der gegenseitigen Erwartung kooperativ kommunizieren, der zufolge beide Beteiligten versuchen, hilfsbereit und aufrichtig zu sein.

5.2.4 Zusammenfassung Wir haben hier die drei grundlegenden Prozesse in Anschlag gebracht, mit denen Evolutionsbiologen die Entstehung von Kooperation erklären (und die sich von der Verwandtschaftsselektion unterscheiden), und haben sie auf die drei Grundmotive der menschlichen kooperativen Kommunikation bezogen. Um das Befolgen von Aufforderungen zu erklären, beriefen wir uns auf den Mutualismus, das Anbieten von Hilfe durch Information erklärten wir mittels indirekter Reziprozität und das Teilen von Gefühlen und Einstellungen unter Rekurs auf kulturelle Gruppenselektion. Wir wollten zeigen, wie die Motivationen der Menschen zum Helfen und Teilen im Kontext der Kommunikation - die Grundmotive geteilter Intentionalität - als Bestandteil einer Anpassung für gemeinschaftliche Tätigkeiten im allgemeinen entstanden sein könnten. Daher schlugen wir vor, daß die grundlegende kognitive Fertigkeit der geteilten Intentionalität - das rekursive Erkennen geistiger Zustände - spezifisch als Anpassung 64 Melis, Call und Tomasello 2006. 233

für gemeinschaftliche Tätigkeiten entstand (auf der Grundlage einer anfänglichen adaptiven Entwicklung hin zu Toleranz und Großzügigkeit beim Freßverhalten). Dies führte zur Entstehung von gemeinsamer Aufmerksamkeit und eines gemeinsamen Hintergrunds. Aus der Kombination von Hilfsbereitschaft und dem rekursiven Erkennen geistiger Zustände entstanden als nächstes gegenseitige Erwartungen von Hilfsbereitschaft und die Gricesche kommunikative Absicht, durch die Relevanz-Schlußfolgerungen zum Gegenstand sozialer Normen werden konnten. Letztere wurden durch eine weitere auf den Menschen beschränkte Neigung erzeugt, nämlich den anderen in der jeweiligen sozialen Gruppe zu gleichen und von ihnen gemocht zu werden sowie sich von anderen Gruppen zu unterscheiden. In einem frühen Stadium dieses Szenarios scheinen mit größter Wahrscheinlichkeit Zeigegesten (und bestimmte Intentionsbewegungen) das ursprüngliche Kommunikationsmittel gewesen zu sein. Ikonische Gesten traten erst auf, nachdem die Entstehung der Griceschen kommunikativen Absicht sie von Fehlinterpretationen »isolieren« konnte. An welcher Stelle in diesem Prozeß die Menschen damit begannen, ihre Kommunikationsmittel zu konventionalisieren, wissen wir nicht.

5.3 Die Entstehung konventioneller Kommunikation Diese ziemlich komplizierte und trotzdem immer noch etwas skizzenhafte Darstellung bezog sich hauptsächlich auf die sozio-kognitive, sozio-motivationale Infrastruktur menschlicher kooperativer Kommunikation und darauf, wie sie sich entwickelte. Offenkundig sind wir aber immer noch weit von der Art und Weise entfernt, wie die heutigen Menschen miteinander kommunizieren, indem sie eine der über 6000 Sprachen gebrauchen. Aber in Wahrheit ist der Abstand gar nicht 234 (

mehr so groß, denn der wichtigste Punkt ist bereits genannt und lautet, daß der größte Teil von dem, was die menschliche Kommunikation so leistungsfähig macht, die psychologische Infrastruktur ist, die bereits in artspezifischen Formen des Gestikulierens, wie den Zeigegesten und dem Gebärdenspiel, vorliegt. Die Sprache entwickelt sich dann auf dieser Infrastruktur und ist völlig von ihr abhängig. Ohne diese Infrastruktur sind kommunikative Konventionen wie gavagai nur Laute, die nichts bedeuten. Während Zeigegesten und Gebärdenspiel als »natürliche« Kommunikation angesehen werden könnten, weil sie die Aufmerksamkeit und Vorstellungskraft in einer Weise lenken, die alle Menschen untereinander verstehen, auch wenn sie zuvor keinen Umgang miteinander hatten, werden in der »konventionellen« Kommunikation arbiträre Zeichen verwendet, die geteilte Erfahrungen sozialen Lernens bei allen Gruppenmitgliedern erfordern (die im Prinzip alle wissen, daß sie diese Lernerfahrungen teilen). Das hebt einen theoretischen Hauptpunkt hervor. Kommunikative Konventionen werden durch zwei unabhängige Merkmale definiert.65 Erstens und vor allem tun wir deshalb alle etwas auf dieselbe Art und Weise, weil es die Art und Weise ist, wie alle anderen es tun (außerdem wissen wir das wechselseitig): Es handelt sich um geteiltes Wissen. Zweitens hätten wir es anders tun können, wenn wir nur gewollt hätten: Es ist zumindest bis zu einem gewissen Grad arbiträr. Aber Arbitrarität ist ein relativer Begriff, der anhand eines Kontinuums dargestellt werden könnte. Sind bestimmte obszöne Gesten »arbiträr« oder sind sie ikonische Repräsentationen wirklicher Handlungen? Viele solcher Gesten waren zu einer bestimmten Zeit ikonisch und wurden dann im Laufe der Jahre arbiträrer. Sie waren jedoch die ganze Zeit über konventionell, insofern sie geteilt wurden. 65 Lewis 1969/1975. 235

Jedenfalls möchten wir behaupten, daß die geteilten Konventionen zuerst entstanden und es dann im historischen Verlauf eine Art von »Drift zum Arbiträren« gab. So gesehen hätten sich die arbiträrsten Formen konventioneller Kommunikation, das heißt die sprachliche Kommunikation in der stimmlichen Modalität, niemals de novo entwickeln können, sondern mußten sich aus oder in Überschneidung mit gestischen Konventionen entwickeln, die eine natürlichere Bedeutung hatten.

5.3.1 Die Drift zum Arbiträren An dieser Stelle, also vor dem Aufkommen kommunikativer Konventionen, könnte unser Modell so etwas wie ein heute lebendes 12 bis 14 Monate altes vorsprachliches Kleinkind sein, das regelmäßig durch Zeigegesten kommuniziert und gelegentlich ikonische Gesten verwendet, wenn erstere nicht zum Ziel führen. Vielleicht waren an einem bestimmten Punkt auch Kombinationen dieser Gesten möglich, wie die pantomimische Darstellung einer Antilope, während man auf den außer Sichtweite liegenden Ort zeigt, wo sie vermutlich grast. Für die Evolution der Sprache sind ikonische Gesten besonders wichtig, da sie symbolische Repräsentationen von typischerweise räumlich entfernten Bezugsgegenständen beinhalten. Tatsächlich haben wir ja im vorangehenden Kapitel Belege dafür geliefert, daß sprachliche Symbole in der Kindesentwicklung nicht das Zeigen, sondern ikonische Gesten ersetzen. Allerdings stoßen auch ikonische Gesten, ebenso wie Zeigegesten, auf Grenzen der Kommunikation, insbesondere im Vergleich zur Sprache. Wenn ich Ihnen gegenüber die Tätigkeit des Grabens pantomimisch darstelle, um Ihnen, einem Neuling, zu zeigen, was Sie jetzt tun sollen (voraus236

gesetzt, Sie verstehen mein Tun als Kommunikationsakt), hängt Ihr Verständnis zu einem bestimmten Grad von Ihrer Vertrautheit mit der Handlung des Grabens im allgemeinen und von Ihrer Einschätzung dessen ab, was jetzt in der gegenwärtigen Situation erforderlich ist. Wenn ich Ihnen einfach in konventioneller Sprache sagen könnte, was zu tun ist, könnte Ihr Verständnis immer noch bis zu einem bestimmten Grad von ihrer früheren Erfahrung und Ihrer gegenwärtigen Einschätzung der vorliegenden Situation abhängen. Die Abhängigkeit wäre aber viel geringer. Aber auch kommunikative Konventionen beruhen auf einer vorgängigen gemeinsamen Geschichte sozialen Lernens. Entsprechend ist es auch angemessen, darauf hinzuweisen, daß ikonische Gesten konventionellen Kommunikationsmitteln tatsächlich überlegen sind, wenn wir diese Geschichte sozialen Lernens nicht teilen, da letztere in einer solchen Situation keinen Nutzen haben - wie wenn beispielsweise zwei Menschen, die verschiedene Sprachen sprechen, miteinander zu kommunizieren versuchen. Auf jeden Fall gingen Menschengruppen an einem bestimmten Punkt über ikonische Gesten hinaus, die bei jeder Gelegenheit neu erfunden werden mußten, und bewegten sich auf Kommunikationskonventionen zu. Konventionen sind Handlungsmuster, die zwar in gewisser Weise arbiträr sind - sie könnten auch eine andere Gestalt haben - , aber es ist zu jedermanns Vorteil, wenn jeder sich an eine Gestalt hält und daher jeder genau das tut, was auch jeder andere tut, weil alle das tun.66 Diese Arbitrarität bedeutet, daß niemand eine Konvention alleine erfinden kann. Man kann zwar ikonische Gesten erfinden, die bei der Kommunikation effektiv sind, aber arbiträre Kommunikationskonventionen erfordern es, »geteilt« zu werden, so daß jeder sich auf jede andere Person in der Gruppe in dem Wissen verlassen kann, wie die Kon66 Lewis 1969/1975. 237

vention kommunikativ verwendet wird, was offensichtlich abermals zumindest teilweise ein Ergebnis des rekursiven Erkennens geistiger Zustände ist. Wir haben zuvor dafür argumentiert, daß die Form des sozialen Lernens, die hier nötig ist, sich nicht in der bloßen Imitation erschöpft, sondern in der Imitation durch Rollentausch, bei der jeder Kenner der Konvention versteht, daß er die Konvention anderen gegenüber so verwenden kann, wie diese sie ihm gegenüber verwendet haben, und umgekehrt, so daß die Rollen des Produzierenden und des Verstehenden sowohl bei der Produktion als auch beim Verstehen implizit gegenwärtig sind.67 Wir haben aber immer noch nicht die Frage beantwortet, wie Konventionen überhaupt erst wirksam werden. Sich auf einen Prozeß ausdrücklicher Übereinkunft zu berufen - wie in den verschiedenen Arten von Theorien des Gesellschaftsvertrags ist keine wirklich brauchbare Lösung, da die Übereinkunft ein schon vorhandenes Kommunikationsmittel zu ihrer Formulierung voraussetzt, das weitaus leistungsfähiger ist als das noch zu erfindende. Konventionen können jedoch »auf natürliche Weise« als Ergebnis der Kombination von geteilten und nichtgeteilten Erfahrungen unter Organismen entstehen, die die kooperative kommunikative Infrastruktur, die wir hier umrissen haben, bereits besitzen und die außerdem zur Zusammenarbeit und zur Imitation durch Rollentausch fähig sind. Im folgenden soll jene Art von Szenario dargestellt werden, die in der Frühzeit arbiträrer kommunikativer Konventionen der Fall gewesen sein muß. Am Anfang stand eine bestimmte Art kooperativer ikonischer Geste. Ein weibliches Mitglied der Gattung Homo will vielleicht nach Wurzelknollen graben. Um andere dazu zu bewegen, mit ihr zu kommen, stellt sie ihnen gegenüber auf übertriebene Weise die Handlung des Grabens durch Gebärden dar, und zwar 67 Tomasello 1999/2002. 238

in der Richtung, in der man normalerweise Wurzelknollen findet. Die Höhlengenossen verstehen diese Geste auf natürliche Weise, das heißt, sie verstehen, daß diese Geste des Grabens eine wirkliche instrumentelle Handlung des Grabens darstellen soll. Möglicherweise lernen einige von ihnen diese Geste durch Rollentausch-Imitation von ihr und schaffen dadurch ein geteiltes Kommunikationsmittel, das konventionell insofern ist, als es geteilt wird, und das zumindest teilweise insofern arbiträr ist, als für dieselbe Funktion gewiß andere Gesten hätten verwendet werden können. Nehmen wir nun folgende Erweiterung des Szenarios an. Einige Individuen, die mit dem Graben nicht vertraut sind, etwa Kinder, beobachten diese »Laßt-uns-graben-Gehen«Geste. Für sie ist die Verbindung zwischen der ritualisierten Geste des Grabens und der Handlung des Grabens nach Wurzelknollen undurchsichtig (obwohl sie sehen, daß sie als kommunikative Geste gemeint ist); sie denken, daß durch diese Geste die Leute allgemein zum Aufbruch bewegt werden sollen. Sie könnten dann die Geste durch Imitation lernen, um bei einer zukünftigen Gelegenheit zum Aufbruch zu veranlassen (das heißt, um etwas anderes zu tun als zu graben), so daß die ursprüngliche ikonische Verankerung der Geste nun völlig ausgelöscht ist. (Dieser Vorgang ähnelt der Art und Weise, wie manche motivierte sprachliche Formen, etwa Metaphern, über längere Zeiträume hinweg undurchsichtig werden, da diejenigen Individuen, die diese Formen neu lernen, keinen Kontakt mit der ursprünglichen Motivierung haben [»tote Metaphern«].) Möglicherweise kann man sich zu einem späteren Zeitpunkt zusätzlich noch eine bestimmte Art von allgemeiner Einsicht vorstellen, daß die meisten der kommunikativen Zeichen, die wir verwenden, nur arbiträre Verbindungen mit ihren intendierten Bezugsgegenständen und sozialen Absichten haben und wir daher bei Bedarf auch neue arbiträre Zeichen schaffen können, wenn wir wollen. 239

Ein weiteres wichtiges Ergebnis dieses Prozesses ist eine Art der Standardisierung von Zeichen. Wenn ikonische Gesten motiviert sind, wird »dieselbe« Handlung oder »dasselbe« Ereignis in Abhängigkeit vom Kontext verschieden dargestellt; das Öffnen einer Tür wird pantomimisch auf eine andere Weise dargestellt als das Öffnen eines Gefäßes. Das ist unter anderem typisch für individuell geschaffene »HomeSigns«.68 Wenn die Ikonizität jedoch für Individuen, die die Zeichen neu lernen, undurchsichtig wird, entsteht die Möglichkeit einer stilisierten Darstellung des Öffnens, die sehr abstrakt ist und keiner besonderen Art des Öffnens bestimmter Gegenstände entspricht. Das wiederum ist typisch für viele Zeichen in konventionalisierten Zeichensprachen und öffnet den Weg für die völlig arbiträren und abstrakten Zeichen, die für die stimmliche Modalität charakteristisch sind. Die ersten Verwendungen kommunikativer Konventionen fanden vermutlich in Gestalt von Holophrasen statt, ein Begriff, der in verschiedenen Bedeutungen verwendet wird.69 Wir meinen hier damit jedoch einfach einen Kommunikationsakt, der aus einer einzigen Einheit besteht. Vom Gesichtspunkt der Kommunikation aus betrachtet, geschieht jedoch sogar in diesem einfachsten aller Fälle tatsächlich mehr. Erstens - das sollte aus unserer vorangegangenen Argumentation klargeworden sein - kann die Bedeutung, die mit einer einteiligen Äußerung übermittelt wird, in Abhängigkeit vom Kontext gemeinsamer Aufmerksamkeit, in der sie verwendet wird, unbegrenzt komplex sein. Wenn wir zu dem Beispiel mit dem Fahrrad Ihres Freundes aus dem ersten Kapitel zurückkehren, so kommuniziere ich in einem solchen Kontext dieselbe Botschaft, ob ich zeige oder ob ich »Dort!« oder »Dort ist das Fahrrad Ihres Freundes!« sage. Auch wenn das Kom68 Goldin-Meadow 2003b, siehe das nächste Kapitel. 69 Siehe Wray 1998. 240

munikationssignal nur aus einer einzigen Einheit besteht, ist damit noch nichts über die Komplexität der kommunizierten Botschaft ausgesagt, da diese nicht nur davon abhängt, was explizit im Kommunikationssignal vorhanden ist, sondern auch davon, was implizit im gemeinsamen Hintergrund steckt. Die zweite wichtige Erwägung ist, daß Holophrasen in Wirklichkeit aus zwei Komponenten bestehen. Wie in Kapitel 3 skizziert wurde, umfaßt der Kommunikationsakt immer sowohl einen aufmerksamkeitslenkenden, referentiellen Aspekt als auch den potentiellen Ausdruck eines Motivs. Wenn ich beispielsweise will, daß Sie mir etwas Wasser geben, könnte ich mit einer auffordernden Betonung »Wasser« sagen; wenn wir dagegen Spazierengehen und ich Sie vor einer Pfütze warnen will, könnte ich mit einem überraschten und warnenden Ausdruck in der Stimme und/oder des Gesichts »Wasser!« sagen. Die Holophrase hat also wie die Zeigegeste immer diese beiden Bestandteile - die sich auf die Referenz und das Motiv beziehen - , selbst wenn in manchen Kontexten das Motiv vorausgesetzt und daher nicht mit einem charakteristischen Tonfall oder Gesichtsausdruck ausgedrückt wird. Die Tatsache, daß, funktional betrachtet, sogar Holophrasen intrinsisch zusammengesetzt sind, könnte als eine Art erster Einstieg in die Grammatik betrachtet werden. Die Bewegung hin zu kommunikativen Konventionen ist also paradoxerweise ganz natürlich. Niemand beabsichtigt, jedenfalls nicht am Anfang, irgendwelche Konventionen zu erfinden. Kommunikative Konventionen ergeben sich vielmehr auf natürliche Weise, wenn Wesen, die zur Imitation durch Rollentausch fähig sind und die schon wissen, wie man verhältnismäßig raffiniert kommuniziert - nämlich kooperativ durch Gesten - , die ikonischen Gesten des jeweils anderen durch Imitation lernen. Anschließend beobachten Individuen, die in die ikonische Beziehung nicht eingeweiht sind, die kommunikative Wirksamkeit der Geste und verwenden sie 241

allein aus diesem Grund, das heißt ohne jegliche ikonische Motivation, wodurch sie für diese neuen Benutzer arbiträr geworden ist. Dieser Vorgang wurde als »Prozeß der dritten Art« bezeichnet, ein soziologisches Ergebnis intentionaler Handlungen von Menschen, aber nichts, was irgend jemand wirklich beabsichtigt hätte.70

5.3.2 Der Wechsel zur stimmlichen Modalität Bisher haben wir uns recht neutral zu der Frage verhalten, ob die frühesten kommunikativen Konventionen - nach den nichtkonventionellen Zeigegesten und dem Gebärdenspiel in der gestischen oder der stimmlichen Modalität vollzogen wurden. Aber tatsächlich konnten die ersten Kommunikationskonventionen überhaupt nicht im Zusammenhang mit der stimmlichen Modalität entstanden sein, zumindest dann nicht, wenn man die Vokalisierungen nichtmenschlicher Primaten als Ausgangspunkt nimmt. Zwei wesentliche Punkte sind hier zu beachten. Der erste Punkt ist jener, der schon in Kapitel 2 ausführlich dokumentiert wurde. Die Vokalisierungen nichtmenschlicher Primaten sind sehr eng an Emotionen gebunden und werden daher nicht absichtlich hervorgebracht. Wie nahezu bei der gesamten Kommunikation unter Tieren handelt es sich hier um wesentlich »kodierte« Kommunikation in dem Sinne, daß Individuen mit artspezifischen Vokalisierungen und mit ebenso artspezifischen Reaktionen darauf geboren werden. Abgesehen von Empfängern, die lernen, bestimmte Ereignisse mit bestimmten Vokalisierungen zu assoziieren (daß zum Beispiel das Herannahen von Leoparden durch spezielle Warnschreie von Vögeln begleitet wird), hat Mutter Natur so 70 Keller 1994, mehr dazu in Kapitel 6. 242

gut wie keinen Raum für Intentionalität, Kooperation oder Schlußfolgerungen gelassen. Damit Vokalisierungen bei der intentionalen und letztlich kooperativen Kommunikation eine Rolle spielen konnten, mußten also die Individuen zuerst willentliche Kontrolle über sie erlangen. Menschen haben natürlich an einem bestimmten Punkt Kontrolle über ihre Vokalisierungen erlangt. Aber das führt uns zum zweiten Problem. Vokalisierungen sind kein so gutes Medium für die referentielle Kommunikation wie handlungsbasierte Gesten. Im Hinblick auf die Lenkung der Aufmerksamkeit ist es für Primaten, Menschen eingeschlossen, kein natürlicher Vorgang, die Aufmerksamkeit anderer durch eine Vokalisierung auf externe Gegenstände zu lenken. Was Primaten tatsächlich auf natürliche Weise tun, wenn sie jemanden vokalisieren hören, ist, den Vokalisierer selbst zu orten und seinen Gefühlszustand zu identifizieren, und außerdem vielleicht unter bestimmten Umständen umherzublicken, um die Ursache seines Gefühlszustands zu lokalisieren. Für einige Primaten, nämlich Menschen, ist es ganz natürlich, die Aufmerksamkeit der anderen visuell im Raum durch eine bestimmte Form des Handelns, etwa durch Blicke oder Zeigegesten zu steuern, was letztlich auf der Disposition aller Primaten beruht, der Blickrichtung anderer zu folgen. Im Hinblick auf die Lenkung der Vorstellungskraft auf abwesende Bezugsgegenstände sind nichtkonventionalisierte Vokalisierungen abermals äußerst begrenzt. Wir könnten bestimmte Geräusche aus der Umgebung, die mit wichtigen Bezugsgegenständen verbunden sind, nachahmen und so auf diese Gegenstände indirekt hinweisen (das Geräusch eines Leoparden oder ein Geräusch, das meine gewöhnliche emotionale Reaktion auf Leoparden imitiert, zum Beispiel). Aber auch das würde viel weniger natürlich und produktiv erscheinen als ein handlungsbasiertes Gebärdenspiel im visuellen Kanal. Es könnte eine interessante Übung sein, sich zwei Gruppen 243

von kleinen Kindern vorzustellen, die nie zuvor mit irgend jemand kommuniziert haben. Jede Gruppe ist auf ihrer eigenen einsamen Insel isoliert wie in dem Roman Herr der Fliegen. Einer dieser beiden Gruppen wird der Mund mit Isolierband zugeklebt, der anderen werden die Hände auf den Rücken gebunden. (Ich bitte alle Komitees zum Schutz menschlicher Versuchspersonen auf der Welt um Verzeihung und verspreche, daß die Kinder ansonsten sehr gut versorgt werden und ihre Eltern vor ihrer Fesselung eine Einverständniserklärung abgegeben haben). Was für Kommunikationsformen könnten in jeder der beiden Gruppen entstehen? Nun, wir wissen tatsächlich einiges darüber, was bei jenen Kindern geschehen könnte, die nicht in der Lage sind, ihren Mund zu benutzen, weil gehörlose Kinder, die bei Eltern aufwachsen, die keinerlei Zeichensprache beherrschen, mit ihren Eltern und Geschwistern ziemlich raffinierte Systeme handlungsbasierter Gesten entwickeln, die sich auf Zeigegesten und Gebärdenspiel stützen, was als Home-Sign bezeichnet wird.71 Wenn solche Kinder später zusammentreffen, entwickeln sie sogar noch ausgeklügeltere, konventionalisierte, gestische Zeichensysteme mit grammatikalischen Eigenschaften (wie in der NicaraguaZeichensprache; siehe nächstes Kapitel). Natürlich wissen wir nicht, was mit jenen Kinder geschehen würde, die nicht in der Lage sind, ihre Hände zu gebrauchen. Es ist jedoch schwierig, sich vorzustellen, daß sie ganz auf sich allein gestellt Vokalisierungen erfinden würden - außer vielleicht einige wenige, die an emotionale Situationen gebunden sind und/oder wenige Fälle von stimmlicher Nachahmung, um die Aufmerksamkeit oder die Vorstellungskraft anderer sinnvoll auf die Welt zu lenken. Der Grund hierfür ist, daß Menschen nicht auf eine natürliche Weise für die stimmliche Modalität veranlagt sind, die als natürlicher Ausgangspunkt dienen könnte - so 71 Goldin-Meadow 2003b. 244

wie sie etwa dazu veranlagt sind, der Blickrichtung zu folgen oder Handlungen in der gestischen/visuellen Modalität als intentionale zu interpretieren. Daher stellt sich die Frage nach der Konventionalisierung von bereits bedeutungsvollen Kommunikationsakten überhaupt nicht. Nach meiner eigenen Vermutung würden übrigens jene Kinder, deren Hände gefesselt sind, am Ende versuchen, die Aufmerksamkeit mit ihren Augen und/oder Köpfen zu steuern und die Dinge mit ihrem Körper nachzuahmen. Diese phantastische, wenn auch etwas groteske Übung sollte lediglich unterstreichen, daß es angesichts der Beschaffenheit des stimmlichen Mediums und insbesondere seiner Funktionen im Leben von Primaten im allgemeinen sehr schwierig ist, sich die ausschließlich in der stimmlichen Modalität stattfindende Entwicklung sinnvoller, menschenähnlicher kooperativer Kommunikation - geschweige denn von Kommunikationskonventionen - auch nur vorzustellen. Dagegen ist es ziemlich leicht, sich dasselbe im Bereich des Handelns vorzustellen, und tatsächlich brauchen wir es uns auch nicht vorzustellen, weil es, wie gesagt, bei gehörlosen Kindern, die in besondere Umstände hineingeboren werden, tatsächlich geschieht (es gibt auch eine Reihe von gut dokumentierten Fällen, in denen erwachsene Menschen in besonderen Situationen, wie lauten Fabriken oder bei der Kommunikation zwischen verschiedenen Sprachgemeinschaften, die Handel untereinander treiben, gestische Zeichensysteme erfunden haben).72 Der wesentliche Grund für diesen Unterschied besteht vielleicht darin, daß für Primaten im allgemeinen und für Menschen im besonderen gilt, daß sie automatisch der Blickrichtung folgen und Handlungen automatisch als intentional und wesentlich mit Sinn ausgestattet verstehen, auch jene, die an sie gerichtet sind. Wenn 72 Kendon 2004. 245

das Wesen der menschlichen Kommunikation ihre Intentionalität ist, dann ist menschliches Handeln die ursprüngliche Quelle ihrer Sinnhaftigkeit. Theoretisch könnte das bei anderen Organismen auch in der stimmlichen Modalität geschehen; aber aufgrund dessen, wie Vokalisierungen bei Primaten funktionieren - insbesondere aufgrund ihrer engen Bindung an Emotionen und ihrer Tendenz, die Aufmerksamkeit auf sich selbst, den Ursprung, und nicht auf äußere Bezugsgegenstände zu lenken - , ist so etwas nahezu unvorstellbar. Um zur menschlichen kooperativen Kommunikation mit all ihren kooperativen Eigenarten zu gelangen, müssen wir mit einer handlungsbasierten Infrastruktur anfangen, die letztlich ihrerseits auf drei spezifisch menschlichen Neigungen beruht: etwas mit dem Blick zu verfolgen, in eine bestimmte Richtung zu zeigen, um das Folgen des Blicks zu induzieren, sowie die Handlungen anderer in intentionalen Begriffen zu interpretieren (außerdem auch auf gemeinschaftlichen Handlungen als Hauptquelle der kooperativen Infrastruktur). Die Frage, warum die Menschen am Ende zur stimmlichen Modalität wechselten, stellt sich somit ganz von selbst. Wenn Menschen heute kommunizieren, verwenden sie am häufigsten sowohl Sprache als auch Gesten, aber die Sprache erledigt den Großteil der Referenz (eventuell in Verbindung mit Zeigegesten) und die Gesten ergänzen das durch bildhafte Zeichen, die sprachlich nicht einfach zu kodifizierende Informationen übermitteln.73 Es besteht jedoch kein Zweifel daran, daß die stimmliche Sprache vorherrscht und sogar eine grammatikalische Dimension aufweist (manchmal auch eine geschriebene Version), die natürlich auftretenden Gesten nicht zukommt. Wie gelangte die stimmliche Modalität zu dieser Vormachtstellung? Die Geschichte der dieser Frage gewidmeten Gedanken 73 McNeill 2005, Goldin-Meadow 2003a. 246

ist reich an Hypothesen - alle Theoretiker des klassischen Gestenursprungs hatten etwas dazu zu sagen. So wurde die Überlegenheit der stimmlichen Modalität beispielsweise deshalb postuliert, weil sie die Kommunikation über größere Entfernung ermöglicht; weil sie die Kommunikation in dichten Wäldern ermöglicht; weil sie die Hände freigibt, so daß man gleichzeitig kommunizieren und Dinge mit den Händen manipulieren kann; weil sie die Augen entlastet, um die Umgebung nach Raubtieren und anderen wichtigen Informationen abzusuchen, während die Kommunikation auditiv stattfindet; usw. usw. Einzelne oder alle diese Faktoren können eine Rolle gespielt haben. Wir möchten hier lediglich - in Einklang mit der Erklärung, die wir in diesem Kapitel gegeben haben - den Aspekt hinzufügen, daß die Kommunikation in der stimmlichen Modalität eher an ein öffentliches Publikum gerichtet ist als die Kommunikation in der gestischen Modalität. Als wir die Primatenkommunikation in Kapitel 2 diskutierten, stellten wir fest, daß die Vokalisierungen von Primaten undifferenziert gestreut werden, so daß jedermann in der Nähe sie hört, während Gesten an einzelne Individuen gerichtet sind. Nach einer Periode der Verwendung von Gesten, um Kommunikationsakte an einzelne Individuen zu richten, könnte der Wechsel zur stimmlichen Modalität bedeutet haben, daß Kommunikationsakte immer noch an einzelne Individuen gerichtet sind - die kommunikative Absicht kann durchaus als ein Metasignal dafür verstanden werden, daß diese Botschaft »für dich« ist - , aber zugleich ermöglicht das stimmliche Medium jedem, der sich in der Nähe befindet, sozusagen zu lauschen (was nur noch durch besondere Akte, etwa Flüstern, verhindert werden kann). Somit sind stimmliche Akte im Normalfall öffentlich und unter anderem deshalb relevant für die Etablierung bzw. Sicherung der Reputation und dergleichen. Schlußendlich lautet unsere Erklärung für den konkre247

ten Vollzug des Übergangs, daß die frühesten stimmlichen Konventionen zu Beginn emotionale Begleiterscheinungen oder vielleicht zusätzliche Lautwirkungen waren, die zu bereits bestehenden, sinnvollen, handlungsbasierten Gesten oder zumindest zu bereits bestehenden, sinnvollen, gemeinschaftlichen Handlungen hinzutraten. In dem, was der Kommunizierende mit den Gesten und den Vokalisierungen zu kommunizieren versuchte, gab es also zumindest einiges Redundantes, wenigstens vom Standpunkt des Empfängers aus betrachtet. Als die Menschen eine stärkere willentliche Kontrolle über ihre Vokalisierungen erlangten, konnten sie auch bestimmte stimmliche Bilder verwenden (etwa die Geräusche eines Leoparden nachahmen), obwohl diese wie visuelle Icons erst nach dem Entstehen der Griceschen kommunikativen Intention entstanden sein konnten. Aber zu einem bestimmten Zeitpunkt und in manchen Situationen wurde die Vokalisierung allein funktional - vielleicht unter dem Druck, über größere Entfernungen zu kommunizieren, oder zu dem Zweck, daß die Kommunikation im öffentlichen Raum stattfindet, usw. Beispielhaft für eine besonders interessante Klasse von Wörtern, die universal in allen Sprachen vorkommt, sind die sogenannten Demonstrativa, die häufig auch heute noch von Zeigegesten begleitet werden. Im Deutschen sind das solche Wörter wie dieses und jenes oder hier und dort. Die besondere Eigenart dieser Wörter läßt sich erfassen (wie Wittgenstein zum ersten Mal feststellte74), wenn man sich überlegt, wie Kinder diese Wörter lernen könnten. Bei Wörtern wie Nomina und Verben können wir unter Voraussetzung des geeigneten Rahmens gemeinsamer Aufmerksamkeit auf etwas zeigen und es einem Kind gegenüber benennen, so daß es den Namen lernen wird. Aber wie könnten wir Zeigegesten verwen74 Wittgenstein 1953. 248

den, um Kindern die Wörter dieses und jenes, hier und dort beizubringen? Die Antwort ist, daß wir das in Wirklichkeit gar nicht können. Wie zeigt man auf jenes oder dorthin? Das Problem ist folgendes: Versuchen wir, diese besonderen Wörter zu lehren, indem wir auf etwas zeigen, dann ist die Zeigegeste sowohl Teil der Hinweishandlung, die lehren soll (die Aufmerksamkeit auf den geeigneten Bezugsgegenstand zu lenken), als auch die Bedeutung selbst - das ist eine eigenartige Situation, die Kinder merkwürdigerweise überhaupt nicht zu verwirren scheint. Irgendwie scheinen sie die dabei auftretende Redundanz zu verstehen. Jedenfalls haben Demonstrativa eindeutig einen besonderen Status, weil sie in allen bekannten Sprachen vorkommen; sie beinhalten fast immer eine Komponente der räumlichen Distanz vom Sprecher (wie in dieses gegenüber jenem); sie werden sehr häufig von Zeigegesten begleitet; und sie scheinen in allen Fällen elementar zu sein, weil sie nicht von anderen Worttypen abstammen.75 Daher bilden Demonstrativa wahrscheinlich das Gerüst von Kommunikationsakten in der stimmlichen Modalität - sie werden von Kleinkindern oft ganz früh in ihrer Entwicklung verwendet sehr wahrscheinlich aufgrund ihrer Redundanz im Verhältnis zur Zeigegeste.76 Ikonische Gesten sind im Rahmen einer Kommunikationshandlung natürlich referentiell spezifischer als Zeigegesten. 75 Diessel 2006. 76 Es ist bemerkenswert, daß die entscheidende Unterscheidung zwischen Demonstrativa und inhaltstragenden Wörtern zuerst von Bühler (1934/1990) vorgeschlagen wurde, dessen Sprachtheorie die entscheidende Bedeutung des jeweiligen Interaktionskontextes, in dem wir sprechen, hervorhob, nämlich das »deiktische Zentrum«, und seine Beziehung zur Bühne der Referenz, über die wir jeweils sprechen. Sein Vorschlag war, daß Demonstrativa eine gesonderte, wenn auch kleine Klasse von Einheiten darstellen, weil sie sich auf dieses deiktische Zentrum grundlegend anders beziehen als die inhaltstragenden Sprachelemente. 249

Ohne Kontext könnte sich das Zeigen auf ein vorbeilaufendes Tier auf fast alles beziehen, während eine pantomimische Darstellung des Laufens oder eines Hasen die Dinge schon ziemlich stark einschränkt, obwohl sie ohne gemeinsamen Hintergrund im Grunde immer noch unbestimmt ist. Nur unter ganz besonderen Umständen kann ich auf einen Hasen, der gegenwärtig nicht wahrnehmbar ist, zeigen und auf ihn hinweisen. Mit derselben Intention kann ich jedoch einen abwesenden Hasen ganz leicht pantomimisch darstellen. Wie in Kapitel 3 festgestellt, werden ikonische Gesten typischerweise für zwei grundlegende Funktionen verwendet: erstens um eine Handlung anzuzeigen und zweitens um auf einen Gegenstand hinzuweisen, der mit der dargestellten Handlung verbunden ist (oder, allerdings seltener, um auf den Gegenstand hinzuweisen, der von einer statischen Darstellung angezeigt wird). Wir können daher davon ausgehen, daß die Sprachelemente, die den ikonischen Gesten entsprechen, die referentiell inhaltstragenden Wörter wie Verben (prototypisch für Handlungen) und Nomen (prototypisch für Gegenstände) sind. In fast allen theoretischen Darstellungen sind Verben und Nomen die grundlegendsten Typen inhaltstragender Wörter in einer Sprache, da sie als einzige Klassen wahrscheinlich universal sind, während die meisten anderen Worttypen einer bestimmten Sprache nachweislich historisch von Nomen und Verben abgeleitet (bzw. Demonstrativa) sind.77 Unsere Erklärung wäre also, daß Menschen ursprünglich einige wenige Vokalisierungen verwendeten, während sie Handlungen oder Gegenstände auf natürlich bedeutungsvolle Weise pantomimisch darstellten. Diese Vokalisierungen wurden konventionalisiert, indem andere sie sozial und als Konventionen lernten, wodurch die pantomimische Darstellung überflüssig wurde. Dabei weisen Vokalisierungen einige der 77 Heine und Kuteva 2002. 250

obengenannten Vorteile auf, wie zum Beispiel die Entlastung der Hände, Kommunikation über größere Entfernungen, Öffentlichmachen von Botschaften usw. Im Sinne unserer quasievolutionären Geschichte können wir nun die ganze Strecke bis zu den Aufmerksamkeitsfängern und den Intentionsbewegungen von Affen zurückgehen, dann zur menschlichen Verwendung von Zeigegesten und Gebärdenspiel als natürlichen Kommunikationshandlungen übergehen (die auf neuen Fertigkeiten und Motivationen geteilter Intentionalität beruhen), um schließlich bei den Kommunikationskonventionen des Menschen anzukommen, die die Lenkung der Aufmerksamkeit (Demonstrativa) zum Ziel haben und den Empfänger veranlassen sollen, sich die gemeinten Bezugsgegenstände vorzustellen (Inhaltswörter wie Nomen und Verben und ihre Ableitungen). Aufmerksamkeitsfänger von Affen

kooperative Zeigegesten von Menschen

Demonstrativa und deiktische Ausdrücke in einer Sprache

Intentionsbewegungen von Affen

ikonische Gesten von Menschen

Inhaltswörter (Nomina, Verben) in einer Sprache

Diese beiden Linien von Entsprechungen spiegeln einfach die Tatsache wider, daß es bei handlungsbasierten Gesten eigentlich nur zwei Dinge gibt, die Menschen tun können, um die Aufmerksamkeit anderer auf Gegenstände zu lenken, zumindest wenn dies auf natürliche Weise geschehen soll: Wir können ihre visuelle räumliche Aufmerksamkeit lenken (wie in der oberen Zeile), oder wir können etwas tun, um abwesende Gegenstände und Ereignisse in ihrer Vorstellungskraft wachzurufen (wie in der unteren Zeile). Die sprachlichen Konventionen der Menschen stellen für uns einfach nur besondere Formen dar, diese Dinge auf eine Weise zu tun, die sich weniger auf den jeweiligen gemeinsamen Hintergrund und stärker auf eine geteilte Geschichte sozialen Lernens stützt. 251

Wir haben uns hier überhaupt nicht auf die Frage konzentriert, zu welcher Zeit bestimmte Dinge in der Evolution des Menschen stattfanden, sondern uns dafür entschieden, unser Augenmerk einfach auf die Reihenfolge der Ereignisse zu richten. Aber eine weitere Tatsache im Hinblick auf die stimmlich-auditive Kompetenz des Menschen ist besonders bemerkenswert. Genetische Untersuchungen aus jüngerer Zeit haben festgestellt, daß eines der Schlüsselgene, die für die artikulierte menschliche Sprache verantwortlich sind (das FOXP2-Gen), in der menschlichen Population vor nicht mehr als 150000 Jahren praktisch zeitgleich mit dem modernen Menschen erstmals auftrat.78 Es ist schwierig, sich irgendeine andere Funktion als das artikulierte Sprechen, wie es in modernen Sprachen verwendet wird, für die unglaublich feinkörnige motorische Steuerung vorzustellen, die dieses Gen zu ermöglichen scheint. Deshalb könnte dieser späte Entwicklungsschritt vor gerade einmal 150000 Jahren (kurz bevor moderne Menschen sich über den ganzen Planeten auszubreiten begannen) als Hinweis auf einen Zeitpunkt in der Evolution des Menschen verstanden werden, zu dem gute Artikulationsorgane, die vermutlich die Verwendung einer stimmlichen Sprache erleichtern, einen Wettbewerbsvorteil hatten. Es geht uns hier nicht um eine konkrete Zeitleiste für alle diese Dinge. Der vorerst wichtige Punkt ist einfach, daß auch diese genetischen Daten belegen, wie spät in diesem Prozeß Menschen die stimmliche Modalität als ihre Hauptmodalität für die Kommunikation zu nutzen begannen.

78 Enard et al. 2002. 252

5.3.3 Zusammenfassung Einfach ausgedrückt, läuft das Argument darauf hinaus, daß man nicht geradewegs zur konventionellen Kommunikation springen kann. Wenn wir ein fremdes Land mit einer völlig anderen Sprache als der unseren besuchen, können wir eine Menge mit den »natürlichen« Kommunikationsakten des Zeigens und des Gebärdenspiels erreichen. Dies funktioniert besonders gut bei gemeinschaftlichen Tätigkeiten wie dem gemeinsamen Transport eines Gegenstands oder bei institutionalisierten Tätigkeiten, die in Läden oder auf Bahnhöfen stattfinden, wo es einen soliden gemeinsamen Hintergrund gibt. Im stimmlichen Medium vollziehen wir in solchen Situationen dagegen so gut wie gar keine Kommunikationshandlung, abgesehen vielleicht von ein paar wenigen emotionalen Reaktionen auf Dinge, und im Grunde erfinden wir nie neue stimmliche Kommunikationskonventionen. Theoretisch könnten wir mit unseren fremden Freunden zusammen auch neue und arbiträre Kommunikationskonventionen in der stimmlichen Modalität erfinden; dazu bedürfte es aber einer Übergangsperiode, in der diese arbiträren Kommunikationsmittel im Verhältnis zu anderen Kommunikationsmitteln, die eine natürlichere Bedeutung hätten, redundant verwendet werden würden. Wenn dafür genügend Zeit zur Verfügung stände, könnten vielleicht arbiträre Kommunikationskonventionen zwischen Fremden auch implizit über eine Übertragungskette hinweg entstehen, in der die Urheber dieser Kette Gesten mit natürlicher Bedeutung verwendeten und Personen, die diese Gesten später lernten, diese Verwendung reproduzierten, ohne ihre natürliche Basis zu verstehen (typischerweise deshalb, weil ein bestimmter Aspekt des gemeinsamen Hintergrunds fehlt). Dies sind tatsächlich die beiden einzigen Möglichkeiten des Ursprungs von Kommunikationskonventionen, und 253

beide beinhalten einen Zwischenschritt natürlicher Kommunikation. Unsere allgemeine Beschreibung gewinnt also die Form einer evolutionären Abfolge, in der wir von erstens gemeinschaftlichen Tätigkeiten zu zweitens »natürlicher«, handlungsbasierter, kooperativer Kommunikation (zunächst innerhalb der gemeinschaftlichen Tätigkeiten und dann außerhalb davon) und schließlich zu drittens konventioneller Kommunikation übergehen - wobei es möglicherweise bei den beiden letzten Schritten bestimmte Parallelentwicklungen gab, als natürliche Formen der Kommunikation allmählich konventionalisiert (und somit teilweise arbiträr) wurden und zudem eine Grundlage für völlig arbiträre stimmliche Konventionen lieferten.

5.4 Schlußfolgerung In sehr groben Umrissen ist es möglich, einen großen Teil des Sozialverhaltens von Tieren als kooperativ zu beschreiben, schließlich könnte man ja sagen, daß Herdentiere kooperieren, indem sie nahe zusammenbleiben und dadurch Raubtiere abschrecken. Die menschliche Art von Kooperation hat jedoch einzigartige Merkmale, die sich am deutlichsten in den kulturellen Institutionen des Menschen manifestieren, angefangen bei der Ehe über das Geld bis hin zur Regierung, die einzig wegen der kollektiven Praktiken und der Überzeugungen menschlicher Gruppen existieren.79 Die kognitiven Grundlagen dieser besonderen Typen kooperativer Tätigkeit sind die verschiedenen Fertigkeiten und Motivationen der geteilten Intentionalität.80 Daher ist unsere These, daß die 79 Searle 1995/1997. 80 Tomasello und Rakoczy 2003. 254

kooperative Struktur der menschlichen Kommunikation kein Zufall oder ein isoliertes Merkmal des Menschen ist, sondern vielmehr eine weitere Manifestation der extremen Form der Kooperativität des Menschen. In welchem Sinne genau das jedoch der Fall ist und wie sich diese Beziehung entwickelt hat, ist aber alles andere als offensichtlich. Unsere Geschichte war daher sowohl kompliziert als auch spekulativ. Eine graphische Zusammenfassung - von Affengesten zu Sprachkonventionen des Menschen - ist in Abbildung 5.1 dargestellt. Um es kurz zu rekapitulieren, verfügen die heutigen Menschenaffen, die uns als Ausgangspunkt dienen, über viele der notwendigen Komponenten für menschliche kooperative Kommunikation: Sie gestikulieren miteinander flexibel auf der Grundlage von Aufforderungsmotiven, sie verstehen intentionales Handeln und vollziehen diesbezüglich praktische Schlußfolgerungen; sie lenken die Aufmerksamkeit im Dienste sozialer Intentionen, sie haben bestimmte Motive, um anderen in manchen Kontexten zu helfen, und sie beteiligen sich an komplexen Gruppentätigkeiten. Sie scheinen jedoch weder Fertigkeiten noch Motivationen geteilter Intentionalität zu besitzen, und deshalb ist ihre Kommunikation nicht vollständig kooperativ und inferentiell: Der Empfänger versucht nicht, die Bedeutsamkeit der referentiellen Handlung des Kommunizierenden für dessen soziale Intention zu erschließen. Deshalb zeigt der Kommunizierende seine kommunikative Absicht gegenüber dem Empfänger auch nicht an. Zudem gibt es weder einen gemeinsamen begrifflichen Hintergrund noch gegenseitige Erwartungen oder Normen, die den Kommunikationsprozeß steuern.

255

Affen

Gruppentätigkeiten > Ziele / Intentionen verstehen > Wahrnehmung verstehen > Praktisches Schlußfolgern

Auffordern:

Informieren:

Teilen:

Mutualismus Homo

Indirekte Reziprozität früherer Sapiens

Kulturelle Gruppenselektion späterer Sapiens

Gemeinschaftlich© Tätigkeiten > Gemeinsame Ziele / Absichten > Gemeinsame Aufmerksamkeit / Gemeinsamer Hintergrund > Rekursives Erkennen geistiger Zustände

> Imitation von Handlungen

Aufmerksamkeitsfänaer

Intentionsbewegungen

> Wechselseitige Kooperationserwartungen > Kommunikative Intentionen

> Imitation durch Rollentausch

> Schlußfolgern und Normen

> Soziale Imitation

Zeigegesten

uebardenspiei (konventionell)

Arbiträre stimmliche Konventionen

Abbildung 5.1: Evolutionäre Grundlagen menschlicher kooperativer Kommunikation.

Menschliche Fertigkeiten und Motivationen geteilter Intentionalität entstanden ursprünglich innerhalb mutualistischer gemeinschaftlicher Tätigkeiten von Wesen, die wir einfach Homo nennen werden (zweite Spalte in Abbildung 5.1). Mutualistische gemeinschaftliche Tätigkeiten konnten jedoch nicht entstehen, bevor die Menschen zunächst toleranter und großzügiger bei der Teilung der Beute von Gruppenaktivitäten geworden waren (z. B. des bei einer gemeinsamen Jagd erbeuteten Fleisches) und sich dann ein neuer Bestandteil der kognitiven Maschinerie entwickelte: das rekursive Erkennen geistiger Zustände. Diese entscheidende Komponente erzeugte gemeinsame Ziele, die dann einen für das gemeinsame Ziel relevanten gemeinsamen Aufmerksamkeitsrahmen schufen, der wiederum als gemeinsamer begrifflicher Hintergrund diente und den Zeigegesten und anderen kooperativen Kommunikationsakten Bedeutung verlieh. Im Kontext der mutualistischen Zusammenarbeit auf ein gemeinsames Ziel hin konnte die Neigung, nach Hilfe zu verlangen und als Gegenleistung Hilfe anzubieten, als Initialmotiv menschlicher kooperativer Kommunikation aufblühen, weil ich in diesem Kontext mir selbst helfe, indem ich meinem Partner helfe. Anschließend konnte das Helfen aufgrund indirekter Reziprozität auf andere Kontexte ausgeweitet werden. Indirekte Reziprozität stellte das zweite kooperative Motiv des Anbietens von Hilfe durch Information dar. Durch dieses Verhalten sollte das eigene Ansehen, der Ruf, gefördert werden - , ein Verhalten, das für jenes Wesen charakteristisch ist, das wir den früheren Sapiens nennen (dritte Spalte in Abbildung 5.1). Wechselseitige Annahmen von Kooperativität und die daraus resultierende Gricesche kommunikative Absicht, durch die der Kommunikationsakt in die öffentliche Sphäre eingebracht wird, ergaben sich aus einer Kombination des rekursiven Erkennens geistiger Zustände mit diesen beiden Kooperationsmotiven des Aufforderns und des Anbietens von Hilfe und 257

Informationen. Das dritte Hauptmotiv, das Teilen von Einstellungen, stammt sehr wahrscheinlich aus einer völlig anderen Quelle, die mit solchen Motiven zu tun hat, wie den anderen Gruppenmitglieder gleichen zu wollen und von diesen gemocht werden zu wollen - und zwar bei jenem Wesen, das wir den späteren Sapiens nennen (vierte Spalte in Abbildung 5.1). Dieses Motiv führte in Kombination mit wechselseitigen Erwartungen zu Normen, die viele menschliche Tätigkeiten regeln, einschließlich der kooperativen Kommunikation. Im Kontext dieses Pfades der Evolution wurden die Aufmerksamkeitsfänger der Menschenaffen in menschliche Zeigegesten verwandelt (unterste Zeile in Abbildung 5.1). Nach diesem ersten Schritt konnten sich die Intentionsbewegungen der Menschenaffen zu den ikonischen Gesten der Menschen entwickeln, die in Situationen genutzt werden konnten, in denen der gemeinsame Hintergrund oder der gemeinsame Aufmerksamkeitsrahmen der miteinander Kommunizierenden etwaige Zeigegesten zu einem nicht mehr idealen Kommunikationsmodus werden ließen, vorausgesetzt, daß die ikonische Geste auf der Grundlage eines Verständnisses der Griceschen kommunikativen Absicht als kommunikativ interpretiert werden konnte. Kommunikationskonventionen entstanden dann, als Außenstehende die ikonischen Gesten zu jenen Zwecken nachahmten, die sie in ihnen erkannten, aber ohne über den gesamten gemeinsamen Hintergrund zu verfügen. Dies führte mit der Zeit zu einer Art von »Drift zum Arbiträren« und wurde dann zur Schaffung von Konventionen ausgeweitet. Der Wechsel zur stimmlichen Modalität vollzog sich wahrscheinlich aus vielerlei Gründen. Einer davon war wohl, daß Botschaften durch die stimmliche Kommunikation leichter in den öffentlichen Raum eingebracht werden können. Aber der Wechsel hatte auf handlungsbasierten Gesten mit natürlicher Bedeutung als einstweiliger Überbrückung zu beruhen, da »arbiträre« Kommunikationskonventionen nicht 258

entstehen können, ohne irgendwie auf dem Rücken bereits bedeutungshaltiger Kommunikationshandlungen transportiert zu werden.

259

6 Die grammatische Dimension

Und eine Sprache vorstellen heißt, sich eine Lebensform vorstellen. Ludwig Wittgenstein, Philosophische Untersuchungen

Wir haben unsere evolutionäre Darstellung menschlicher kooperativer Kommunikation um die Entstehung von drei daran beteiligten Hauptmotiven angeordnet: Auffordern, Informieren und Teilen. Wir haben auch Spekulationen über einige der Prozesse angestellt, durch die handlungsbasierte Gesten mit natürlicher Bedeutung, die für diese Zwecke eingesetzt werden, sich an einem bestimmten Punkt in ausgewachsene, kulturell geschaffene und gelernte Kommunikationskonventionen verwandelt haben. Bei jedem Schritt auf diesem Weg, sogar bei den spontanen Gesten der Menschenaffen, verwenden die Individuen aber auch Abfolgen von Gesten und/oder Konventionen, um zu kommunizieren, für die wir bisher keine systematische Erklärung gegeben haben. Wir brauchen eine Erklärung, die uns am Ende ermöglicht, nicht die Entstehung der Sprache (in der Einzahl), sondern von 6000 verschiedenen menschlichen Sprachen mit 6000 verschiedenen Gesamtheiten von Kommunikationskonventionen zu erklären, einschließlich grammatikalischer Konventionen zur Strukturierung von Äußerungen, die aus mehreren Einheiten bestehen, so daß sich kohärente Botschaften daraus ergeben. Natürlich wird es auch Gemeinsamkeiten geben - es handelt sich ja überall um dieselbe Spezies mit denselben kognitiven Werkzeugen, die viele derselben Dinge zu erreichen versucht -, aber es gibt auch Besonderheiten, und schon die Tatsache, daß Menschen nicht über ein einziges Kommunikationsmittel für alle Angehörigen der Spezies verfügen, ist eine evolutionäre Neuerung, die erklärt werden muß. 260

Unser allgemeiner Ansatz besteht wiederum darin, uns auf die drei Hauptmotive menschlicher kooperativer Kommunikation zu konzentrieren: Auffordern, Informieren und Teilen. Die Grundidee ist, daß der Kommunikationszweck bestimmt, welche Art und wieviel Information »im« Kommunikationssignal enthalten sein muß, und daher auch ganz allgemein, welche Art grammatikalischer Strukturierung nötig ist. Da Aufforderungen typischerweise nur Sie und mich im Hier und Jetzt sowie die Handlung betreffen, die Sie meinem Willen zufolge vollziehen sollen, erfordern Kombinationen natürlicher Gesten und/oder sprachlicher Konventionen keine wirklich syntaktische Markierung, sondern nur eine Art von »einfacher Syntax« in Form einer Grammatik des Aufforderns (obwohl wir mit den modernen Sprachen auch recht komplexe Aufforderungen formulieren können). Wenn wir jedoch Äußerungen hervorbringen, die andere über für sie hilfreiche Dinge informieren sollen, sind häufig verschiedenste Ereignisse und Beteiligte involviert, die weder räumlich noch zeitlich gegenwärtig sind. Dadurch wird ein funktionaler Druck erzeugt, solche Dinge zu tun, wie die Rolle der Teilnehmer und der Sprechaktfunktionen durch eine »ernstzunehmende Syntax« in Form einer Grammatik des Informierens zu kennzeichnen. Wenn wir schließlich im Modus der Narration mit anderen eine komplexe Abfolge von Ereignissen mit mehreren Beteiligten, die in verschiedenen Ereignissen verschiedene Rollen spielen, teilen wollen, brauchen wir sogar noch komplexere syntaktische Mittel, um die Ereignisse aufeinander zu beziehen und die Beteiligten über diese Ereignisse hinweg zu verfolgen. Das führt zur Konventionalisierung einer »extravaganten Syntax« in Form einer Grammatik des Teilens und der Erzählung. Obwohl die elementaren Schritte in dieser Sequenz aus verschiedenen Formen der grammatikalischen Strukturierung stattgefunden haben müssen, bevor die Menschen sich 261

über den Planeten ausbreiteten, konventionalisierten nach dieser Ausbreitung verschiedene Gruppen von Menschen verschiedene Ausformungen, um die funktionalen Anforderungen der einfachen, der ernstzunehmenden und der extravaganten Syntax zu erfüllen. Diese Strukturierung wurde in grammatikalischen Konstruktionen eingelassen - in komplexen Mustern von Äußerungen mit mehreren Einheiten - , die in verschiedenen Gruppen durch Grammatikalisierung und andere kulturgeschichtliche Prozesse konventionalisiert wurden. Die Funktionsweise dieser Prozesse hängt entscheidend von Prozessen geteilter Intentionalität und kooperativer Kommunikation ab, und zwar in Verbindung mit anderen kognitiven Prozessen und einschränkenden Bedingungen. Wie bei der Entstehung von Kommunikationskonventionen im allgemeinen reflektiert der Ursprung grammatikalischer Konventionen also die ständige Dialektik zwischen biologischer und kultureller Evolution. Im Hinblick auf die Modalität lautet die evolutionäre Hypothese erneut, daß selbst bei der Grammatik der größte Teil dieser Geschichte in der gestischen Modalität stattfand. Das wird von der Tatsache gestützt, daß konventionelle Zeichensprachen mit vollständigen Grammatiken sehr schnell und leicht zu entstehen scheinen, wenn bestimmte soziologische Bedingungen erfüllt sind (wenn Gehörlose in bestimmten Arten von Gemeinschaften miteinander interagieren, um ein Beispiel zu nennen). Die jüngsten Beispiele dafür, die einer größeren Öffentlichkeit bekannt wurden, sind die Nicaragua-Zeichensprache1 und die Beduinen-Zeichensprache,2 die jeweils in nur wenigen Generationen komplexe grammatikalische Strukturen entwickelt haben. Während die meisten Linguisten Zeichensprachen üblicherweise für einen unge1 Senghas, Kita und Özyürek 2004. 2 Sandler et al. 2005. 262

wohnlichen Ausdruck der menschlichen Sprachfähigkeit halten, ist es aus unserer Sicht ebensogut möglich, daß die menschliche Sprachfähigkeit sich lange Zeit im Dienste gestischer Kommunikation entwickelte und die stimmliche Modalität eigentlich eine sehr junge Überlagerung darstellt. Wenn Menschen tatsächlich für komplexe gestische Kommunikation angepaßt waren und die willentlich gesteuerte, artikulierte Rede eine jüngere evolutionäre Modifikation ist, würde das zu einem großen Teil die Selbstverständlichkeit komplexer menschlicher Kommunikation in der gestischen Modalität erklären.

6.1 Die Grammatik des Aufforderns Der in Kapitel 5 gegebenen Erklärung zufolge begannen Menschen, nachdem sie ihren eigenen evolutionären Pfad eingeschlagen hatten - der in Abbildung 5.1 als Homo-Stadium bezeichnet wurde - , mit mutualistischer Zusammenarbeit. Dadurch wurden bestimmte Rahmen gemeinsamer Aufmerksamkeit und ein gemeinsamer Hintergrund erzeugt, auf deren Grundlage sie andere zu bestimmten Dingen auffordern konnten, und zwar auf präzisere Weise, als es beispielsweise Affen in der gestischen Kommunikation mit Menschen möglich ist. Zudem kamen die Empfänger der Aufforderung wahrscheinlich nach. Zu diesem Zeitpunkt verfügten sie auch über bestimmte Fertigkeiten zur Imitation, weshalb einige ihrer Intentionsbewegungen möglicherweise ebenfalls gelernt waren. Unserer Hypothese zufolge war jedoch die menschliche Kooperation in dieser Phase der Evolution noch nicht vollständig ausgereift. Menschen in diesem evolutionären Stadium machten zwar Aufforderungen, aber sie informierten die anderen nicht. Es gab daher keine indirekten, kooperativen Aufforderungen, die von anderen verlangten, räum263

lieh und zeitlich nichtpräsente Dinge zu tun (so wie es voll entwickelte sprachliche Wesen tun können). In diesem Zusammenhang möchten wir gerne untersuchen, wie die Strukturierung der Kommunikation in diesem Stadium ausgesehen haben könnte, indem wir uns mehrere, heute noch bestehende Situationen ansehen, die mit Homo auf mehreren Ebenen vergleichbar sind - »sprachliche« Affen, gehörlose Kinder, die Zeichensprachen verwenden, und Personen, die eine Sprache zu lernen beginnen. Allerdings sollten wir von Anfang an betonen, daß keine dieser Situationen auf allen Ebenen vergleichbar ist. Unser Ziel wird die Beschreibung einer Art Grammatik des Aufforderns mit einer einfachen Syntax sein, die geeignet ist, andere zu veranlassen, bestimmte Dinge im Hier und Jetzt zu tun. Diese wird höchstens Kombinationen von Gesten in Anschlag bringen, jedoch ohne ein syntaktisches Kennzeichen, da ein solches keinerlei Funktion besitzt für eine Kommunikation, deren Referenz sich auf Mich und Sie im Hier und Jetzt sowie auf die Handlung, zu der ich Sie auffordere, beschränkt ist. (Um es nochmals zu sagen: Wir konzentrieren uns hier nur auf diese unmittelbaren Aufforderungen und nicht auf indirekte und andere, stärker kooperative Aufforderungen, die möglich werden, nachdem eine komplexe Sprache entwickelt worden ist.) Zuvor wollen wir jedoch ganz kurz auf unseren Ausgangspunkt eingehen, nämlich die Aneinanderreihung natürlicher Gesten von Menschenaffen, die überhaupt keine grammatikalische Struktur haben.

6.1.1 Gestensequenzen bei Menschenaffen Bei ihrer natürlichen Kommunikation untereinander bringen Schimpansen und andere Menschenaffen recht häufig Folgen von Gesten in einem einzigen Kontext und im Hinblick 264

auf ein einziges soziales Ziel hervor. In der systematischen Untersuchung von Liebal, Call und Tomasello enthielt etwa ein Drittel aller gestischen Kommunikationsakte von Schimpansen mehr als eine Geste.3 Diese Sequenzen enthielten so ziemlich alle möglichen Kombinationen von Intentionsbewegungen und Aufmerksamkeitsfängern der visuellen, auditiven und taktilen Modalitäten.4 Fast 40 Prozent dieser Gestensequenzen bestanden schlicht aus mehrfachen Wiederholungen derselben Geste. Der Rest waren Sequenzen verschiedener Gesten - wodurch sich die Möglichkeit einer bestimmten Art von grammatikalischer Struktur insofern abzeichnet, als neue Bedeutungen erzeugt werden, die mit einzelnen Gesten nicht auszudrücken sind, oder gar insofern, als verschiedene Gesten verschiedene Rollen im Kommunikationsakt spielen. Die systematische Analyse dieser Sequenzen erbrachte jedoch keine Belege für eine grammatikalische Struktur dieser Art. Auf der Grundlage mehrerer unterschiedlicher Analysen schien folgendes der Fall zu sein: Der Kommunizierende verwendete eine Geste, und wenn der Empfänger nicht auf die gewünschte Weise reagierte, brachte er direkt im Anschluß daran eine weitere Geste hervor - in einigen Fällen vielleicht sogar in Erwartung des Ausbleibens der Reaktion. Bei keiner Analyse konnten die Forscher irgendwelche neuen Botschaften entdecken, die durch eine Folge mehrerer Gesten übermittelt wurden und nicht auch durch eine der beiden einzelnen Gesten allein hätten übermittelt werden können. Wie in Kapitel 2 festgestellt wurde, gab es auch keine Strukturierung, die auf der Manipulation der Aufmerksamkeit des anderen beruhte. Das heißt, die Schimpansen verwendeten nicht vorzugsweise einen Auf3 Liebal, Call und Tomasello 2004. 4 Siehe ähnliche Befunde bei anderen Arten von Menschenaffen bei Call und Tomasello 2007. 265

merksamkeitsfänger als erste Geste, um die Aufmerksamkeit des Empfängers sicherzustellen, und vollzogen danach auch keine Intentionsbewegung einer bestimmten Art (das heißt, es gab auch nichts, das einer Thema-Fokus-Struktur ähnelte). Es ist natürlich möglich, daß die Forscher in den Gestensequenzen bei Menschenaffen nicht sorgfältig genug nach einer grammatikalischen Struktur gesucht haben. Nach allen verfügbaren Analysen zu urteilen, scheinen die Gestensequenzen der Menschenaffen jedoch im Grunde keinerlei relationale oder grammatikalische Strukturierung zu enthalten. Außerdem gibt es auch keine Berichte über irgend etwas, das einer grammatikalischen Struktur der stimmlichen Kommunikation irgendwelcher Arten von Menschenaffen gleichkäme. Wir verwenden daher den Begriff »Sequenz« und nicht »Kombination«, den wir Botschaften vorbehalten, die aus mehreren Einheiten bestehen und zumindest irgendeine Art von Strukturierung aufweisen, die eine neue Bedeutung erzeugt.

6.1.2 Wie Menschenaffen mit Menschen »sprechen« Es hat große Kontroversen über die Existenz oder Nichtexistenz einer grammatikalischen Struktur der zeichensprachlichen Äußerungen von sprachtrainierten Menschenaffen gegeben. (Wohlgemerkt, alle Versuche, Affen neue Vokalisierungen irgendeiner Art zu lehren, schlugen fehl.) Ein Gutteil dieser Kontroverse geht auf einen Mangel an systematischen, quantitativen Daten zurück. Mittlerweile gibt es aber zwei Untersuchungen der gestischen Äußerungen dieser besonderen Tiere, die die benötigte Art von Daten liefern: eine mit fünf Schimpansen, die eine Zeichensprache verwendeten, und eine mit einem Bonobo namens Kanzi, bei der ein künstlich geschaffenes System zum Einsatz kam. In beiden Untersuchungen wurden systematische Stichproben natürlich 266

vorkommender kommunikativer Interaktionen verwendet, wobei für einen bedeutenden Anteil dieser Stichproben zwei unabhängige Beobachter eingesetzt wurden, so daß quantitative Schätzungen der Reliabilität zwischen den Beobachtern möglich waren. Zunächst analysierte Rivas in einer kürzlich durchgeführten Untersuchung systematisch über sieben Jahre hinweg vier Korpora von fünf Schimpansen - bestehend aus der berühmten Washoe und ihren Freunden - , die von den Gardners, den Fouts und deren Mitarbeitern in so etwas wie der amerikanischen Zeichensprache (ASL) trainiert wurden.5 Insgesamt wurden 22 Stunden Interaktionen aufgezeichnet, an denen die verschiedenen Schimpansen mit einer von mehreren Pflegepersonen beteiligt waren (wobei verschiedene Typen von Schätzungen der Reliabilität zwischen den Beobachtern für die verschiedenen Maße berechnet wurden und alle hinreichend hoch waren). Abzüglich direkter Imitationen und unverständlicher Sequenzen gab es 2839 Kommunikationsakte. Die Affen verwendeten sowohl »Zeigegesten« (neben bestimmten anderen natürlichen Gesten, etwa Betteln) als auch ASL-Zeichen, manchmal in Kombination. Das erste Ergebnis war, wie in Kapitel 2 dargestellt, daß 98 Prozent der Handlungen, die eine klare kommunikative Funktion hatten (Antworten auf Fragen ausgeschlossen), Aufforderungen bezüglich Gegenständen oder zu Handlungen waren; die verbleibenden 2 Prozent wurden als »Benennungen« klassifiziert, die zum größten Teil im Kontext einer Art von Benennungs-/Wiedererkennungsspiel mit einem Bilderbuch auftraten. In einer Teilmenge von Äußerungen, die »spontan« genannt wurden, weil sie eine Interaktion einleiteten, waren 100 Prozent der Handlungen, also alle, Aufforderungen. Da fast alle Äußerungen Aufforderungen waren, be5 Rivas 2005. 267

zogen sich die Handlungswörter in den Äußerungen mit zwei und drei Einheiten nahezu ausschließlich auf sehr konkrete physische Handlungen, die die Tiere gerne taten, wie Essen, Trinken und das Spielen bestimmter Spiele, wie zum Beispiel sich jagen, während es sich bei den Gegenständen fast immer um Dinge handelte, die im Verfügungsbereich der Menschen lagen und von den Affen begehrt wurden. Diese erwünschten Handlungen bzw. Gegenstände wurden in einer Sequenz von Gesten normalerweise zuerst bezeichnet; dann folgte eine Art von »Joker« oder ein Zeichen der Aufforderung oder ein Hinweis auf die Person, die die Aufforderung erfüllen sollte. Wir erhalten also Äußerungen wie »BLUME dort(Zeigegeste)«, »ZAHNBÜRSTE gib mir(Bettelgeste), »BALL GUT«, »GUMMI SCHNELL« usw. - und zwar sämtlich als Aufforderungen. Rivas zieht daraus den Schluß, daß diese Anordnung am besten als »Ausdruck einer Erwerbsmotivation« zu interpretieren sei: »Die Zeichen für Gegenstände und Handlungen werden zuerst hervorgebracht, weil sie die wichtigeren oder auffälligeren Zeichen der Äußerungen sind (bei denen es sich gewöhnlich um Aufforderungen handelt) und angeben, was verlangt wird. Die Aufforderungsmarker DIESES / DORT / DU / GUT / SCHNELL werden am Schluß hervorgebracht, weil sie weniger wichtig sind (da sie nicht angeben, was verlangt wird) und die Funktion haben, der Aufforderung Nachdruck zu verleihen oder den Menschen zum Handeln anzuspornen.«6 Das zweite wichtige Ergebnis war, daß die Äußerungen keine wirkliche grammatikalische Struktur aufwiesen und in der Tat meistens sehr kurz waren: 67 Prozent bestanden aus einer einzigen Einheit, 20 Prozent aus zwei Einheiten und 13 Prozent aus mehr als zwei Einheiten. Da alle Äußerungen des Stichprobenzeitraums analysiert wurden, konnte man feststellen, daß es viele »beziehungslose Kombinationen« gab, die 6 Ebd., S. 413.

268

nicht sehr sinnvoll waren, wie z. B. »TRINKEN GUMMI« und »KLEIDER ESSEN«. Es gab jedoch auch andere Sequenzen, die jene Arten von semantischen Beziehungen zu verkörpern schienen, die charakteristisch für die Aufforderungen kleiner Kinder sind: »Handlung + Gegenstand« (»ESSEN KÄSE«), »Handlung + Ort« (»KITZELN dort(Zeigegeste)«) usw. Es ist möglich, daß die Schimpansen bei diesen Sequenzen einfach auf zwei verschiedene Aspekte einer einzelnen Aufforderungssituation hinwiesen, ohne sie ausdrücklich aufeinander zu beziehen. Wie bei kleinen Kindern scheint es jedoch plausibel zu sein, davon auszugehen, daß die Affen in der Situation zumindest auf mehr als ein Ding hinweisen und deshalb Bedeutungen ausdrücken, die gehaltvoller sind als jene, die sie mit einem einzelnen Zeichen allein hätten ausdrücken können. Wir sollten ihnen also zumindest eine minimale grammatikalische Kompetenz zugestehen, die einen ersten Schimmer auf dem Weg zur menschlichen Syntax wirft. Trotzdem gab es bei den Ergebnissen nirgends Sequenzen, in denen die Reihenfolge der Zeichen oder irgendein anderes syntaktisches Mittel tatsächlich einen systematischen Bedeutungsunterschied irgendwelcher Art oder eine besondere syntaktische Rolle in der Äußerung als ganzer markierten - das Kriterium, das die meisten Linguisten in bezug auf eine wirkliche grammatikalische Struktur anlegen würden. Wenn »ESSEN KÄSE« nicht etwas anderes bedeutet als »KÄSE ESSEN«, dann wird die Reihenfolge der Wörter nicht als maßgebliches syntaktisches Mittel verwendet. In der anderen Hauptuntersuchung, die auf quantitativen Daten der Gestensequenzen sprachtrainierter Affen beruhte, überprüften Greenfield und Savage-Rumbaugh Daten aus einem fünfmonatigen Zeitraum täglicher Beobachtungen des Bonobos Kanzi, als dieser fünf Jahre alt war.7 Das Korpus 7 Greenfield und Savage-Rumbaugh 1990. 269

bestand aus insgesamt 13691 Äußerungen, von denen 1422 (10,4 Prozent) Sequenzen waren, die entweder zwei Lexigramme (von einer Tastatur mit einem erfundenen Satz von Lexigramm-Symbolen) oder ein Lexigramm und eine Geste enthielten. Nach dem Ausschluß von Kommunikationsakten, deren Interpretation nicht eindeutig war (der zweite Beobachter war nicht zugegen, um Aufzeichnungen über den Kontext zu machen), und von Antworten auf Testfragen bestand das endgültige Korpus von Sequenzen aus 723 zweiteiligen Äußerungen (längere Äußerungen wurden ausgeschlossen, daher ist ihre Struktur unbekannt). Etwa 5 Prozent der Daten wurde auf Reliabilität zwischen den Beobachtern überprüft, mit recht guten Ergebnissen. Wie in der Untersuchung von Rivas8 war der Anteil von Aufforderungen extrem hoch und lag bei etwa 96 Prozent aller zweiteiligen Äußerungen (die Funktion der anderen 4 Prozent ist unbekannt). Wie in der Untersuchung von Rivas waren fast alle Handlungen, zu denen aufgefordert wurde, konkrete, dyadische Handlungen wie Beißen, Jagen, Tragen, Ergreifen, Verstecken, Umarmen, Schlagen, Kitzeln und »Fernhalten« (ein Spiel). Und wie Rivas konnten auch Greenfield und Savage-Rumbaugh beobachten, daß beinahe ein Viertel von Kanzis Produktionen wenig Struktur aufwies und als »Sonstiges«, »ohne Beziehung« oder aber als »verbundene Handlungen, Gegenstände oder Orte« klassifiziert wurde. Über ein Drittel der zweiteiligen Sequenzen bestand aus Zeigegesten und Benennungen. Interessanter ist jedoch die Tatsache, daß nahezu die Hälfte der Äußerungen so klassifiziert wurde, daß sie zwei der drei Elemente Akteur-Handlung-Objekt enthielten oder einen Gegenstand und ein Attribut bzw. einen Ort darstellten (man beachte, daß die Reliabilität dieser Klassifikation nicht analysiert wurde). Die Mehrheit dieser zuletzt genannten 8 Rivas 2005. 270

Typen bestand aus der Abfolge eines Lexigramms und einer Geste (hauptsächlich Zeigegesten oder verwandte Gesten, die eine Richtung anzeigen). Kanzis bevorzugte Reihenfolge, die nicht etwa das Verhalten der Pflegeperson widerspiegelte, war die folgende: zuerst Angabe des Lexigramms, dann eine Geste, wie in »FERNHALTEN dieses(Geste)« und »SAFT du(Geste)«. Diese Reihenfolge scheint jener von Washoe und ihren Freunden sehr ähnlich zu sein, in der ebenfalls zuerst der erwünschte Gegenstand oder die erwünschte Handlung angezeigt wird, gefolgt von einem weiteren Zeichen, das zum Handeln anregen soll. Die Lexigramm-Lexigramm-Sequenzen wiesen keine besondere Reihenfolgepräferenz auf. Von den sieben Handlungswörtern, die in diesen Sequenzen vorkamen, wurden fünf mit einer Reihenfolgepräferenz verwendet: Zwei gingen dem involvierten Objekt voraus, drei folgten ihm. Wiederum ist zu beachten, daß verschiedene Reihenfolgen nicht Verschiedenes bedeuteten, auch wenn sich eine Präferenz bezüglich der Reihenfolge ergeben haben sollte. Interessanterweise hat Kanzi eine beeindruckende Fähigkeit beim Verstehen vieler Typen englischer Sätze bewiesen, die als Aufforderungen verwendet wurden (seine Pflegepersonen sprachen normalerweise Englisch mit ihm, während sie Gesten und Lexigramme verwendeten). So konnte er etwa erkennen, daß verschiedene Reihenfolgen von Lexigrammen Aufforderungen zu verschiedenen Dingen anzeigen (alle Tests wurden im Hinblick auf Kanzis Reaktionen auf Aufforderungen durchgeführt).9 Es stellt sich jedoch heraus, daß eine Reihe von Nichtprimaten, zum Beispiel Delphine und Papageien, im wesentlichen dieselbe Fähigkeit gezeigt haben, Korrelationen zwischen der Reihenfolge von Zeichen und bestimmten Typen erbetener Handlungen zu erkennen.10 Die 9 Savage-Rumbaugh et al. 1993. 10 Herman 2005, Pepperberg 2000. 271

Fähigkeit, Mustern, die die Reihenfolge bei gelernten Zeichen betreffen, Bedeutung zuzuweisen, ist also nicht auf Affen beschränkt. Keines dieser Tiere hat eine entsprechende Kompetenz bezüglich der Zeichenreihenfolge bei der Produktion von Kommunikationsakten; daher könnten ihre Fertigkeiten beim Verstehen auf vielen verschiedenen Arten von kognitiven und/oder Lernfertigkeiten beruhen, von denen manche sehr wenig mit der Kommunikation im besonderen zu tun haben. Die kommunikativen Fähigkeiten dieser »sprachlichen« Affen sind wirklich erstaunlich: Sie lernen neue Kommunikationsgesten und -zeichen und setzen diese gegenüber einer anderen Spezies effektiv ein. Es handelt sich um die eindeutigsten und beeindruckendsten Beispiele solcher flexibler Fertigkeiten, die je dokumentiert wurden. Möglicherweise verwenden sie sogar Sequenzen, um auf raffiniertere Arten zu kommunizieren, als sie es mit einteiligen Kommunikationsakten allein tun könnten; vielleicht verfügen sie also über eine sehr einfache Art von Grammatik. Das könnte darauf hinweisen, daß diese Affen tatsächlich die Fähigkeit besitzen, eine begriffliche Situation in zwei verschiedene Elemente aufzugliedern, wie zum Bespiel Ereignis und Teilnehmer, ganz ähnlich dem Vorgehen von Menschen. Denkbar ist, daß sich diese Unterscheidung zwischen Ereignissen und Teilnehmern von Fertigkeiten der Nachahmung ableitet (die bei von Menschen aufgezogenen Affen nachweislich besser sind als bei freilebenden Affen und noch besser bei Kindern),11 da im Zuge der Nachahmung Ereigniskategorien aufgrund des Urteils gebildet werden, daß ich »dieselbe« Handlung vollziehen will, die ich gerade gesehen habe (das heißt: Nachahmung = dieselbe Handlung, anderer Teilnehmer). Diese Fertigkeiten sind allerdings nicht überwältigend, wie sich von einem i i Siehe Tomasello 1996. 272

strenger definierten syntaktischen Standpunkt aus mit Recht sagen läßt. Aus keiner der beiden systematischen, quantitativen Untersuchungen gingen Belege für eine grammatikalische Struktur hervor, der zufolge verschiedene Reihenfolgen von Zeichen (oder beliebigen anderen Einheiten) die Funktion hätten, Teilnehmerrollen zu markieren oder auf irgendeine Weise die Bedeutung zu ändern. »Sprachliche« Affen setzen also keine syntaktischen Hilfsmittel bei ihrer Kommunikation mit Menschen ein (selbst wenn sie den kontrastiven Gebrauch der Reihenfolge verstehen, wenn man mit ihnen spricht oder ihnen gegenüber Zeichen verwendet), wie sie - und das ist die einfache Erklärung- ihre gesamte Kommunikation an der Aufforderungsfunktion orientieren. Diese exklusive Fokussierung auf Aufforderungen im Hier und Jetzt der jeweiligen Interaktion hat zur Folge, daß es bei diesen Affen so gut wie keine funktionalen Erfordernisse hinsichtlich der Produktion von Zeichen oder Gesten für die syntaktische Markierung der Rollen gibt, die verschiedene Akteure in einem Ereignis spielen (syntaktische Markierung). Gleiches gilt für die explizitere Identifikation der verschiedenen beteiligten Akteure (wie bei Nominalphrasen), für die Angabe der Zeit eines Ereignisses (wie bei Tempusmarkern), für die Markierung eines Themas (wie bei Themamarkern), für die Angabe der Sprechaktfunktion (wie bei der Betonung oder bei besonderen Konstruktionen) oder für all die anderen Dinge, die wir etwas später als Charakteristika einer ernstzunehmenden Syntax in der Grammatik des Informierens präparieren werden. In dieser für die Spezies atypischen Umgebung haben sie also eine spezielle Grammatik des Aufforderns geschaffen, die an ihre besonderen Kommunikationsbedürfnisse recht gut angepaßt ist: Normalerweise bezeichnen sie das, was sie wollen, mit einem einzelnen Zeichen, worauf eine Angabe der Person folgt, die das, was sie wollen, tun soll, sowie eine Angabe des Ge273

genstands, auf den sich die Handlung beziehen soll, oder eine Art von Aufforderungsmarker, der als Platzhalter dient und den aufgeforderten Menschen anspornen soll.

6.1.3 Gehörlose Kinder, die Home-Sign-Gebärdensprache verwenden Für Greenfield und Savage-Rumbaugh12 ist das, was Kanzi mit seinen Gesten und Lexigrammen tut, mit dem vergleichbar, was gehörlose Kinder tun, die ohne irgendeine Art von konventionalisiertem Sprachmodell aufwachsen (weil ihre Eltern sie keine konventionelle Zeichensprache lernen ließen).13 Zusammen mit den Erwachsenen in ihrer Umgebung entwickeln diese Kinder eine Form der Kommunikation, die auf einer Kombination von Zeigegesten (und anderen deiktischen Gesten) und Gebärdenspiel beruht. Die Kinder lernen einen Teil ihrer Gebärden von ihren Eltern, andere jedoch erfinden sie (was in einer gesprochenen Sprache, die auf völlig arbiträren Zeichen beruht, interessanterweise nicht wirklich machbar ist). Alle diese Zeichen sollten darüber hinaus ikonisch sein, damit andere Menschen außerhalb der Familie sie ebenfalls verstehen können. Die aus mehreren Zeichen bestehenden Äußerungen, die die Kinder bei den Erwachsenen wahrnehmen, sind in verschiedenen Hinsichten degeneriert, und zwar hauptsächlich deshalb, weil die Eltern beim Gestikulieren sprechen und ihre Gesten durch das Sprechen nur für bestimmte Funktionen instrumentalisiert werden. Trotzdem bringen die Kinder schließlich aus mehreren Zeichen bestehende Äußerungen hervor, die zumindest eine gewisse grammatikalische Struktur aufweisen, und zwar nachweislich 12 Greenfield und Savage-Rumbaugh 1990. 13 Goldin-Meadow 2003b. 274

mehr als die ihrer Eltern und, wie wir noch zeigen werden, auch nachweislich mehr als die »sprachlicher« Affen. Da wir mit »zeichensprechenden« Affen und ihrer Grammatik des Aufforderns angefangen haben, ist als erstes festzuhalten, daß ein großer Teil der Sprache dieser Kinder aus Kommentaren zu Dingen besteht, die andere über etwas informieren, an dem sie vermutlich interessiert sind und das sie wissen wollen - dazu gehören auch Erzählungen über räumlich und zeitlich nichtpräsente Dinge. Obwohl keine genauen Prozentsätze verschiedener Äußerungsarten vorliegen, schienen bei einer systematischen Kodierung aller Äußerungen aus einer Stichprobe von zehn dieser Kinder (im Alter von zwölf Monaten bis vier Jahren) während der 30- bis 6ominütigen Dauer eines Spiels etwa ein Drittel ihrer aus mehreren Zeichen bestehenden Äußerungen einfache Kommentare (und keine Aufforderungen) zu sein, die mit Handlungen zu tun hatten, bei denen Gegenstände oder Menschen von einem Ort zum anderen bewegt werden sollten (zum Beispiel wegbewegen oder herkommen). Ein weiteres Viertel bezog sich auf die Veränderung von Gegenständen (zum Beispiel biegen oder brechen), viele andere hatten mit dem Transport von Gegenständen zu tun (zum Beispiel tragen); nur eine kleine Minderheit bezog sich auf das Spielen oder den Vollzug konkreter Handlungen.14 Das steht in einem ausgesprochenen Kontrast zur Fixierung der sprachtrainierten Affen auf das Auffordern zum Spielen und zu konkreten, dyadischen Tätigkeiten wie Jagen oder Umarmen. Aus Tabelle 6.1 läßt sich deutlich ersehen, wie wenig Überschneidungen es bei jenen Handlungen gibt, über die Affen und Kinder mit einer Home-Sign-Gebärdensprache sprechen. Von insgesamt beinahe 100 Handlungswörtern werden nur zwei (essen und gehen) von Individuen beider Spezies verwendet. Dieser Un14 Goldin-Meadow und Mylander 1984. 275

terschied kann klarerweise den unterschiedlichen sozialen Zielen zugeschrieben werden, die die beiden Spezies mit dem Gebrauch von Kommunikationsmitteln verfolgen. Trotzdem sind die Äußerungen dieser Kinder noch immer relativ kurz. Die Mehrheit besteht nur aus einer einzigen Geste, und etwa 85 Prozent ihrer aus mehreren Einheiten bestehenden Äußerungen enthalten nur ein ikonisches Zeichen, das meistens mit einer Zeigegeste kombiniert wird, wobei die durchschnittliche Anzahl von Gesten pro Äußerung für fast alle Kinder (es gab nur eine Ausnahme) zwischen 1 und 1,4 liegt (einschließlich der Zeigegesten) und es in dieser Hinsicht über einen mehrjährigen Beobachtungszeitraum nur eine schwache Entwicklung gibt. Goldin-Meadow liefert Belege dafür, daß diesen relativ bescheidenen Produktionen etwas zugrunde liegt, was sie Prädikat-Frames nennt, da Kinder bei verschiedenen Gelegenheiten ausdrücklich auf Gegenstände hinweisen, die bei einer bestimmten Handlung oder einem Ereignis verschiedene Rollen spielen.15 So weist dasselbe Kind beim ikonischen Zeichen für Schneiden bei verschiedenen Gelegenheiten entweder auf die Person hin, die schneidet, oder auf das Ding, das geschnitten wird, oder auf das dabei verwendete Instrument. Das scheint ein besonders klarer Hinweis auf eine sehr produktive Ereignis-Teilnehmer-Gliederung zu sein, die womöglich auf den besonders leistungsfähigen Fertigkeiten der Menschen zur Nachahmung von Handlungen oder gar zur Nachahmung durch Rollentausch beruht (auch hier gilt: Nachahmung = dieselbe Handlung, anderer Teilnehmer). Kinder, die diese Home-Sign-Gebärdensprache verwenden, strukturieren ihre Äußerungen auf einfache Weise. Besonders wichtig ist die Tatsache, daß sie manchmal ein Hilfsmittel verwenden, das in konventionellen Zeichensprachen recht verbreitet ist, um den »Patienten« einer Handlung an15 Goldin-Meadow 2003b. 276

Tabelle 6.1 Zeichen für Handlungen, die von Kindern mit Home-Sign-Gebärdensprachen (Goldin-Meadow und Mylander 1984), von Affen und von beiden verwendet werden (Anzahl der Individuen, aus einer Gesamtheit von 6, in Klammern). (Ich danke Esteban Rivas für seine Hilfe bei der Zusammenstellung der Schimpansenliste.) Zeichen, die Kinder für Handlungen verwenden

Fortsetzung

Zeichen, die Affen für Handlungen verwenden

Zeichen, die Affen für Handlungen/ Dinge verwenden

Zeichen, die Affen und Kinder für Handlungen verwenden

auf etwas einwirken (1) herausgehen (1)

schießen (2)

beißen (1)

bürsten (3)

gehen (2/3)

schlagen (3)

hochgehen (2)

nippen (1)

tragen (1)

kämmen (2)

essen (2/4)

hüpfen (1)

hämmern (1)

nach oben sprühen

jagen (4)

schmutzig (2)

kauen (2)

schlagen (2)

zusammendrücken

rufen (1)

trinken (4) Blume/riechen (3)

Fortsetzung

(1) (1) kreisen (2)

halten (2)

saugen (1)

gehen (3)

klettern (2)

halten/sprühen (1)

abnehmen (2)

dorthin-gehen (1)

Futter/essen (4)

wiegen (1)

springen (1)

herausnehmen (1)

du-gehen (1)

hören/zuhören (2)

schneiden (2)

durch etwas hindurch kippen (1) verschwinden (1)

fassen (1)

Licht (1)

tanzen (1)

lecken (1)

übertragen (1)

Öl (2)

herunterdrücken (1)

hineinheben (1)

heben (1)

Fellpflege betreiben (3) verstecken (1)

Farbe (1)

Zeichen, die Kinder für Handlungen verwenden

Fortsetzung

Fortsetzung

Zeichen, die Affen für Handlungen verwenden

Zeichen, die Affen für Handlungen/ Dinge verwenden

tauchen (1)

herausheben (1)

drehen (1)

umarmen (4)

sehen/schauen/Brille (1)

tun (1)

marschieren (1)

biegen (5)

fernhalten (1)

anziehen (2)

bewegen (6)

abschrauben (1)

Zimmer öffnen (1)

fahren (1)

hin und her bewegen

Spazierengehen (2)

Kuckuck! (2)

Zeichen, die Affen und Kinder für Handlungen verwenden

(1) essen (2)

strampeln (1)

waschen (1)

Kuckuck/riechen 1)

fallen (1)

hätscheln (1)

fliegen (1)

ohrfeigen (1)

schwimmen (1)

auf etwas blasen (1)

schlängeln (1)

riechen (2)

hochfliegen (2)

abziehen (1)

schlucken (1)

geben (6)

fahren (2)

kitzeln (3)

gehen (2)

brüllen (1)

herumgehen (2)

flitzen (1)

weggehen (1)

schöpfen (1)

hinuntergehen (1)

NB: Die Klassifikation der Zeichen von Affen wurde von den ursprünglichen Forschern vorgenommen (und nicht von Rivas, 2005) und könnte ein Artefakt der Entsprechung zu den menschlichen Zeichen sein.

zuzeigen, indem sie nämlich ihre Hände in seine Richtung bewegen, wenn sie das ikonische Zeichen für die Handlung machen - eine Art von ikonischer Darstellung der Relation des »Einwirkens auf«, um den Betroffenen zu markieren. Unklar ist, wie häufig dieses Hilfsmittel benutzt wird; Goldin-Meadow sagt nur: »Manchmal richten die Kinder ihre Gesten auf bestimmte Gegenstände im Zimmer.«16 Sprecher konventioneller Zeichensprachen tun so etwas natürlich obligatorisch, und sie verwenden darüber hinaus viele dieser Gesten für verschiedene Funktionen.17 Im Hinblick auf die Zeichenreihenfolge zeigen sich nur bei einigen Kindern konsistente Muster. Diese umfassen im wesentlichen zuerst eine auf einen Gegenstand gerichtete Zeigegeste und anschließend die Produktion einer ikonischen Geste für die Handlung (das einzige Kind, das hinreichend viele analysierbare transitive Handlungen produzierte, vollzog relativ konsistent zuerst die Handlungsgeste). Das ist im Grunde das Gegenteil des Anordnungsmusters, das die sprachlichen Affen bevorzugen. Es gibt jedoch nur wenige Belege dafür, daß verschiedene Reihenfolgen mit der Absicht hervorgebracht werden, irgendwelche Bedeutungsunterschiede kontrastiv zu bezeichnen. Eine weitere mögliche Manifestation grammatikalischer Struktur, die nur bei einem einzigen Kind systematisch untersucht wurde, ist, daß ein bestimmtes ikonisches Zeichen in abgekürzter Form hervorgebracht wird, wenn es anstatt einer Handlung benutzt zu werden scheint (zum Beispiel für den Gegenstand Bürste anstelle der Handlung bürsten); obwohl auch das immer noch nur auf eine Minderheit der Fälle beschränkt ist, legt es vermutlich einen bestimmten Begriff von Wortklassen im Sinne von Nomen und Verb nahe.18 16 Ebd., S. 1 1 1 . 17 Padden 1983. 18 Goldin-Meadow 2003b, S. 130. 279

Es ist richtig, daß sowohl der Bonobo Kanzi als auch kleine Kinder, die eine Home-Sign-Gebärdensprache verwenden, viele Äußerungen produzieren, die nur aus einem Element bestehen, sowie eine relativ große Anzahl, die aus zwei Elementen bestehen. Längere Äußerungen kommen nur in kleinem Umfang vor. In beiden Fällen ist die prototypische, aus mehreren Elementen bestehende Äußerung ein Zeichen (ein Lexigramm oder ein ikonisches Zeichen) und eine mehr oder weniger natürliche Geste, normalerweise eine Zeigegeste. Es gibt jedoch zwei grundlegende Unterschiede. Zum einen produzieren Kanzi (und die anderen Affen) fast ausschließlich Aufforderungen (die seltenen Kommunikationsakte, die keine Aufforderungen sind, gehören hauptsächlich zu einer Art von Benennungen oder Wiedererkennen), während die Verwender einer Home-Sign-Gebärdensprache darüber hinaus viele informative Äußerungen produzieren, das heißt, sie sprechen über eine ganze Bandbreite von Themen, etwa über Dinge und ihre Bewegungen und Eigenschaften, über die Affen normalerweise nicht sprechen. Möglicherweise erklärt diese Differenz den Unterschied in den bevorzugten Reihenfolgemustern. Da sie auffordern wollen, zeigen die Affen zuerst das gewünschte Objekt oder die gewünschte Handlung an, gefolgt von einer Angabe der Person, die diese Handlung tun soll, des Objekts, mit dem die Handlung ausgeführt werden soll, oder einer Art von Aufforderungsmarker, während die Benutzer von Home-Sign-Gebärdensprachen dazu neigen, zunächst anzugeben, worüber sie sprechen (etwa indem sie darauf zeigen) und dann etwas Interessantes darüber aussagen (hier haben wir vielleicht den Beginn einer Thema-Fokus-Struktur). Der zweite Unterschied ist, daß die Benutzer von Home-Sign-Gebärdensprachen den Raum nutzen können, um Bedeutungen systematisch zu modulieren, weil sie ihre Zeichen ikonisch im Raum realisieren. Einige von ihnen haben damit schon angefangen. In seinem Lexigrammsystem 280

hat Kanzi diese Möglichkeit nicht, und es ist unklar, ob solche Dinge für Affen in ASL entwickelt werden oder ob sie bei der Beobachtung von Affen, die ASL-artige Zeichen verwenden, eine Rolle spielen. Wenn man jedoch nichts anderes macht, als aufzufordern, gibt es wiederum kein großes Bedürfnis, das Subjekt oder das direkte Objekt einer Handlung anzuzeigen. Daher sind diese Kinder, die Home-Sign-Gebärdensprachen verwenden, nicht auf eine Grammatik von Aufforderungen beschränkt, sondern versuchen tatsächlich recht häufig, andere über nützliche Dinge zu informieren. Sie produzieren aber immer noch Äußerungen mit sehr einfacher Syntax, die in den meisten Fällen probabilistisch und nicht normativ ist. Da sie in allen anderen Hinsichten kognitiv auf dem normalen Stand sind - auch im Hinblick auf den Besitz von Fertigkeiten und Motiven geteilter Intentionalität stellt sich die Frage, warum ihre Grammatik dann nicht raffinierter ist. Der offensichtliche Grund ist, daß sie keine ausgereifte konventionelle Sprache lernen, die sich in einer Benutzergemeinschaft entwickelt hat. Auch stehen ihnen nicht einmal andere Menschen zur Verfügung, die wie sie ohne Sprache sind, auf natürliche Weise Home-Sign-Gebärdensprachen verwenden und mit denen sie einige Zeichen konventionalisieren könnten. Wie wir gleich sehen werden, beginnen solche Kinder, Äußerungen mit erheblich mehr grammatikalischer Struktur zu verwenden, wenn sie Teil einer derartigen Gemeinschaft sind.

6.1.4 Die früheste Sprache von Kindern Menschliche Kleinkinder, die sich normal entwickeln und sprechen, verwenden Zeigegesten und andere Arten von Gesten, bevor sie mit dem Erwerb ihrer gesprochenen Sprache beginnen. Wie in Kapitel 4 dokumentiert wurde, haben Kin281

der, die eine stimmliche Sprache auf herkömmliche Weise lernen, die Neigung, die Häufigkeit ihrer Zeigegesten während des Spracherwerbs zu erhöhen, ihre Verwendung von ikonischen und konventionellen Gesten aber zu reduzieren, vermutlich weil die Sprache deren Funktion übernimmt. Das bedeutet, daß viele der frühesten Ein-Wort-Äußerungen von Kindern, ihre Holophrasen, in Wirklichkeit Kombinationen aus Zeigegesten und Sprache sind (das Motiv wird zusätzlich noch durch die Betonung markiert). Scheinbar sind solche Kombinationen von Gesten und Wörtern die Vorläufer der frühen Syntax von Kindern. Zwei jüngere Untersuchungen dokumentieren, wie das geschieht. Unter der Annahme, daß die frühen sprachbegleitenden Zeigehandlungen von Kindern Gegenstände anzeigen, definierten Iverson und Goldin-Meadow zwei Typen von Gesten/Sprache-Kombinationen.19 In einem Fall, den wir den Typ redundanter Kombinationen nennen können, zeigt das Kind auf einen Gegenstand und benennt ihn gleichzeitig; in dem anderen, der als Typ ergänzender Kombinationen bezeichnet wird, zeigt das Kind auf einen Gegenstand und sagt gleichzeitig etwas über ihn aus: Es zeigt zum Beispiel auf einen Keks und sagt »essen«. Die Forscher stießen auf eine erstaunlich hohe Korrelation zwischen dem Gebrauch ergänzender Kombinationen aus Gesten und Wörtern und ihren frühen Kombinationen aus Wörtern (rs =.94), während es beim Gebrauch von redundanten Kombinationen aus Gesten und Wörtern überhaupt keine Korrelation gab. Ozcaliskan und Goldin-Meadow dehnten diese Befunde auf noch komplexere sprachliche Produktionen aus.20 Der interessante Punkt ist hier, daß ergänzende Kombinationen aus Gesten 19 Iverson und Goldin-Meadow 2005. 20 Ozcaliskan und Goldin-Meadow 2005, siehe auch Capirci et al. 1996. 282

und Wörtern so etwas wie ebenjene Art von einfacher Syntax aufweisen, die wir bei sprachlichen Affen und Kindern antreffen, die Home-Sign-Gebärdensprachen verwenden: Äußerungen, die aus einer auf einen Gegenstand bezogenen Zeigegeste und einer Art von ikonischem oder arbiträrem Zeichen für eine Handlung, eine Eigenschaft oder eine andere Art von Prädikat bestehen, ohne daß dabei irgendwelche syntaktischen Hilfsmittel verwendet werden (tatsächlich werden die Zeigegesten und die Wörter normalerweise gleichzeitig produziert, somit stellt sich die Frage nach der Reihenfolge nicht einmal). Bei ihren frühesten Mehrwort-Äußerungen tun kleine Kinder, die zu sprechen anfangen, ziemlich häufig etwas auf eine etwas unterschiedliche Weise - aber nicht völlig unterschiedlich. Ab etwa 18 Monaten produzieren die meisten Kinder Wortkombinationen, bei denen ein Element eine Konstante und das andere Element eine Variable ist. Meistens wird ein Beziehungs- oder Ereigniswort mit einer großen Vielfalt an Objektbezeichnungen verwendet (»Mehr Milch«, »Mehr Trauben«, »Mehr Saft« oder »Ball weg«, »Hund weg«, »Trauben weg« und dergleichen). Braine zufolge können wir diese Konstruktionen Pivotschemata nennen.21 Sie stellen eine weitverbreitete und produktive Strategie von Kindern dar, die viele der verschiedenen Sprachen der Welt erwerben, und beinhalten manchmal produktive Äußerungen, die nie zuvor von Erwachsenen gehört wurden, beispielsweise das berühmte »allgone sticky«. Obwohl das nicht annähernd im selben Umfang dokumentiert wurde, weisen die frühen grammatikalischen Kombinationen gehörloser Kinder, die eine konventionelle Zeichensprache lernen, viele derselben Eigenschaften auf.22 Diese frühen Pivotschemata und auch 21 Braine 1963. 22 Schick 2005. 283

die Prädikat-Frames von Kindern, die Home-Sign-Gebärdensprachen verwenden, lassen sich als ziemlich direkte Manifestationen ihrer zunehmenden Konzeptualisierung der Ereignis-Teilnehmerstruktur verstehen, mit dem Ergebnis, daß grundsätzlich jeder Teilnehmer grundsätzlich jede der verschiedenen Mitspielerrollen ausfüllen kann. Diese Konzeptualisierung von Ereignissen könnte von so etwas wie Imitation durch Rollentausch bei gemeinschaftlichen Tätigkeiten abhängen, bei denen das Kind das Ereignis, wie oben dargestellt, aus der Vogelperspektive mit allen Teilnehmerrollen, einschließlich seiner eigenen, im selben Repräsentationsformat konzeptualisiert. Daraus würde sich auch erklären, warum Affen dazu neigen, über einfache konkrete Handlungen in der Form von Aufforderungen zu sprechen: Sie verstehen Ereignisse nicht wirklich aus der Vogelperspektive und bilden daher nicht wirklich so etwas wie Pivotschemata oder Prädikat-Frames mit offenen Anschlußstellen aus. Aber auch wenn das richtig sein sollte, sind doch die Pivotschemata kleiner Kinder nicht im vollgültigen Sinn syntaktisch. Während es nämlich bei vielen frühen Pivotschemata ein konsistentes Muster der Reihenfolge von Ereigniswort und Teilnehmerwort gibt (z. B. Mehr oder weg), ist ein konsistentes Reihenfolgemuster, wie gesagt, nicht dasselbe wie eine produktive syntaktische Markierung, die kontrastiv verwendet wird, um anzuzeigen, welche Rolle ein Wort in einer größeren kombinatorischen Struktur spielt. Dieselbe grundsätzliche Einschätzung gilt auch für die früheste Periode des Erwerbs von Sprachen, die eine Kasusmarkierung aufweisen: Kinder erwerben ihre frühen Nomen in der einen oder anderen Kasusform, haben aber keine kontrastive Kontrolle über deren verschiedene Kasusformen. Somit können kleine Kinder, obwohl sie ihre frühen Pivotschemata dazu verwenden, Szenen durch verschiedene Wörter begrifflich zu gliedern, solche Dinge wie die Wortreihenfolge oder die 284

Kasusmarkierung nicht produktiv verwenden, um die verschiedenen Rollen anzuzeigen, die verschiedene Teilnehmer in dieser Szene einnehmen.23 Kleinkinder, die mit dem Sprechen beginnen - und ebenso gehörlose Kleinkinder, die eine konventionelle Zeichensprache lernen sind also nicht auf eine Grammatik des Aufforderns beschränkt, fangen aber dennoch ohne ernsthafte Grammatik an. In diesem Fall scheint das daran zu liegen, daß es einige Zeit braucht, um die grammatische Struktur zu erkennen, die in den einzelnen Äußerungen zu, finden ist, welche in einer normalen Sprachgemeinschaft zu hören sind. Das ist eine wichtige Tatsache für jede Debatte über den evolutionären Ursprung der Grammatik. Kinder, die eine gesprochene Sprache auf natürliche Weise erwerben, fangen nicht mit syntaktisch strukturierten Äußerungen an, obwohl sie alle nötigen kognitiven und sozio-kognitiven Fähigkeiten und Motivationen mitbringen und von einer reifen sprachlichen Gemeinschaft umgeben sind; vielmehr beginnen sie mit einer Art von einfacher Syntax, die noch keine produktiven syntaktischen Instrumente benutzt.

6.1.5 Zusammenfassung Von einem evolutionären Standpunkt betrachtet, ist außer der natürlichen Kommunikation von Affen keine der Situationen, die wir untersucht haben, für irgendein frühes Stadium der menschlichen Evolution repräsentativ. »Sprachliche« Affen wachsen in der Umgebung des modernen Menschen auf, und menschliche Kinder haben sämtlich kognitive Fähigkeiten, die die frühen Menschen wahrscheinlich nicht gehabt haben dürften, darunter insbesondere jene der Imitation durch Rol23 Siehe den Überblick bei Tomasello 2003. 285

lentausch und geteilter Intentionalität. Daher wird unser Modell der Evolution der Grammatik an seinem frühesten Punkt eine Kombination dieser verschiedenen Situationen annehmen müssen (was in Tabelle 6.2 skizzenartig dargestellt ist). Die Kommunikationsmittel, über die unser imaginärer Homo zu dieser Zeit im Sinne einer möglichen Kombination verfügt haben dürfte (siehe Kapitel 5), sind wahrscheinlich Zeigegesten und konventionalisierte Intentionsbewegungen gewesen (da ausgewachsene ikonische Gesten auf die Herausbildung der kommunikativen Absicht angewiesen sind - siehe Abschnitt 5.2.2). Was unsere Aufgabe etwas erleichtert, ist die Tatsache, daß Individuen jenseits der natürlichen Gestensequenzen von Affen in allen anderen Situationen echte Kombinationen produzieren, und zwar mit einer ähnlichen Art von einfacher Syntax, insofern sie die referentielle Situation in mehrere Elemente aufgliedern, häufig in Ereignisse und Teilnehmer. Obwohl Zeigegesten und Gebärdenspiel jeweils für sich alleine verwendet werden können, um auf Gegenstände oder Handlungen Bezug zu nehmen, verwenden alle Individuen, über die hier berichtet wurde, bei ihren Kombinationen typischerweise Zeigegesten, um auf Gegenstände (Teilnehmer), und Gebärdenspiel (oder Zeichen), um auf Ereignisse hinzuweisen. Wenn wir die Allgegenwart einer solchen Unterscheidung in den Zeichensprachen und den gesprochenen Sprachen der Welt in Betracht ziehen, können wir postulieren, daß die Ereignis-Teilnehmer-Anordnung (als eine Art von Grundlage für Verben und Nomen?) sowohl für Affen als auch für Menschen natürlich ist.24 Das führt uns zu der Ver24 Wenn die spontan produzierte Rede reifer Sprecher im Hinblick auf Betonungseinheiten untersucht wird - oft ist das die Rede zwischen Sprechpausen (die normalerweise vier oder fünf Wörter enthält und ein paar Sekunden andauert) - , stellt sich heraus, daß sie normalerweise einzelne Phrasen (Satzglieder) enthalten, die ein einzelnes Er286

Tabelle 6.2

Homo »Sprachliche« Affen

00

VI

Andere Zeichen

Motive

Sprechergemeinschaft

ja

Intentionsbewegungen

Auffordern

ja

ja

ASL/Lexigramme

Auffordern

ja

ja

Ikonische Zeichen

Alle

Wörter und ikonische Zeichen

AUe

Gemeinsame Aufmerksamkeit

Imitation

Zeigegesten

ja

ja ?



Benutzer von HomeSign

ja

ja

Kleinkinder

ja

ja

mutung, daß unser früher Homo nicht nur Gestensequenzen, sondern auch Gestenkombinationen produziert hat, die die referentielle Situation in verschiedene Elemente aufgliederte - typischerweise in Ereignisse und Teilnehmer -, jedoch ohne die Rolle dieser Elemente in der Äußerung als ganzer syntaktisch zu kennzeichnen.

6.2 Die Grammatik des Informierens Wenn wir Individuen der imaginären Gattung Homo betrachten, die über die notwendigen Voraussetzungen dafür verfugen, im Kontext gemeinschaftlicher Tätigkeiten und gemeinsamer Aufmerksamkeit Aufforderungen aneinander zu richten, was geschieht dann mit ihren Kombinationen mehrerer Gesten, wenn sie (das heißt der frühere Sapiens) über Aufforderungen hinausgehen und damit beginnen, sich gegenseitig auch außerhalb gemeinschaftlicher Tätigkeiten über nützliche Dinge zu informieren (aufgrund von Prozessen indirekter Reziprozität)? Die Handlung des Informierens schließt typischerweise weitere Ereignisse und Teilnehmer ein als nur die eigene und die angesprochene Person im Hier und Jetzt. Schließlich handelt es sich ja um Dinge, über die der Empfänger gegenwärtig nichts weiß. Wenn man über diesen größeren Bereich von Ereignissen und Gegenständen kommuniziert, stellen sich mindestens drei neue kommunikative Herausforderungen:

eignis oder einen Zustand sowie einen oder einige wenige Teilnehmer anzeigen (Chafe 1994, Croft 1995), was die Natürlichkeit einer einfachen Ereignis-Teilnehmer-Anordnung auch in der Sprachverwendung reifer Sprecher nahelegt. 288

Identifizieren: Jenseits von Aufforderungen muß der Kommunizierende über Mittel verfügen, auf abwesende oder unbekannte Gegenstände und Ereignisse Bezug zu nehmen, ja sogar mehrere Einheiten als einen einzelnen funktional kohärenten Konstituenten verwenden, zugleich aber den Referenzakt für den Empfänger im gemeinsamen Hintergrund verankern; Strukturieren: Jenseits von Aufforderungen muß der Kommunizierende über Mittel verfügen, solche Dinge wie, wer was wem gegenüber getan hat (dritte Parteien eingeschlossen), im angezeigten Ereignis oder Sachverhalt syntaktisch zu markieren; Ausdrücken: Wenn andere Motive als Aufforderungen möglich sind, muß der Kommunizierende diese (und möglicherweise auch andere Einstellungen des Sprechers) für den Empfänger unterscheiden.

6.2.1 Konventionelle syntaktische Hilfsmittel Jeder dieser Herausforderungen kann auf verschiedene Weise sowohl in der gestischen als auch in der stimmlichen Modalität begegnet werden. In modernen gesprochenen Sprachen und Zeichensprachen gibt es erstens viele Möglichkeiten, bestimmte Mitspieler und Ereignisse für den Empfänger zu identifizieren, wenn diese außerhalb des Hier und Jetzt der eigenen oder der angesprochenen Person liegen. Der springende Punkt in beiden Modalitäten ist jedoch, daß der Kommunizierende von der eigenen und der angesprochenen Person im Hier und Jetzt ausgeht - das heißt vom gegenwärtigen gemeinsamen Aufmerksamkeitsrahmen, gemeinsamen Hin289

tergrund, Bühlers deiktischem Zentrum25 um seine Referenzakte in dem zu verankern, was beide wahrnehmen oder wechselseitig wissen. Wenn er die Möglichkeit hat, wird der Kommunizierende daher auf etwas zeigen, was in der Wahrnehmung gegenwärtig ist, oder auf eine Entität mit einem Zeichen hinweisen, das für Dinge bestimmt ist, die sich schon innerhalb der gegenwärtigen gemeinsamen Aufmerksamkeit befinden (zum Beispiel mit sie oder es). Was abwesende Dinge und Ereignisse angeht, so sind die meisten inhaltstragenden Wörter/Zeichen in beiden Modalitäten Ausdrücke für Kategorien, die für sich allein nicht bestimmte Referenten herausgreifen können. Wenn ich »Katze« oder »beißen« sage oder entsprechende Zeichen mache, werden dadurch ohne weitere Angaben keine einzelnen Bezugsgegenstände aus unserem gemeinsamen Hintergrund oder sonst woher ausgezeichnet. Der Kommunizierende muß daher Suchanweisungen geben, damit die einzelnen Bezugsgegenstände aufgefunden werden können: Gegenstände müssen im allgemeinen im Raum (einschließlich des begrifflichen Raums), und Ereignisse müssen im allgemeinen in der Zeit (einschließlich der vorgestellten Zeit) lokalisiert werden.26 Ich sage also so etwas wie »die Katze« (diejenige, die Gegenstand unserer gemeinsamen Aufmerksamkeit ist) bzw. mache das entsprechende Zeichen, oder »meine Katze« oder »die Katze, die in dem leerstehenden Gebäude an der Ecke haust«, um eines von allen Mitgliedern dieser Kategorie herauszugreifen. Es gibt eine ganze referentielle Hierarchie, die davon abhängt, wie auffällig der intendierte Bezugsgegenstand innerhalb unseres gemeinsamen Hintergrunds ist.27 Daher sage ich so etwas wie »wird beißen« oder »hat gebissen« oder mache die entsprechenden Zeichen, 25 Bühler 1934/1990. 26 Langacker 1991, Croft 1991. 27 Siehe Chafe 1994, Gundel, Hedberg und Zacharski 1993. 290

um anzuzeigen, auf welches einzelne oder vorgestellte Ereignis ich Bezug nehme, indem ich es in der Zeit relativ zum Jetzt lokalisiere. Die Tatsache, daß mehrere Einheiten in einem bestimmten Muster zusammenwirken, um eine einzige kohärente kommunikative Funktion zu realisieren (um etwa auf einen einzelnen Gegenstand oder ein Ereignis Bezug zu nehmen), bedeutet, daß sie einen einzelnen Konstituenten in größeren Konstruktionen bilden - wodurch eine hierarchische Struktur erzeugt wird. Zweitens erlauben es die modernen Zeichensprachen, Dinge auf vielerlei Weisen zu strukturieren, um klarzustellen, wer was wem gegenüber getan hat. Die gebräuchlichste ist einfach die Reihenfolge28 - natürlich wird das Instrument der Reihenfolge sehr häufig auch in den gesprochenen Sprachen verwendet. In fast allen Sprachen der Welt, sowohl in den gestischen als auch in den stimmlichen, wird zuerst auf den Akteur/das Subjekt und dann auf den Adressaten/das Objekt in der Äußerung referiert, vermutlich deshalb, weil in der wirklichen Welt kausale Quellen sich typischerweise bewegen und gegenüber den Dingen, auf die sie einwirken oder die sie beeinflussen wollen, aktiv werden. Dieses Anordnungsprinzip hat also zumindest halbwegs natürliche Quellen. Um produktiv zu sein, muß es allerdings im Kontrast zu anderen Alternativen konventionalisiert werden. Darüber hinaus wird in Zeichensprachen manchmal für dieselbe Funktion auch der Raum verwendet. Um beispielsweise anzuzeigen, daß ich Ihnen etwas gebe, bewege ich das Zeichen für Geben ikonisch von mir zu Ihnen (und umgekehrt, wenn Sie mir etwas geben) - ein weiteres Hilfsmittel, das offensichtlich eine natürliche Quelle hat. Zeichenbenutzer können, wie oben bemerkt, den Adressaten einer bezeichneten Handlung anzeigen, indem sie die Handlung in Richtung auf einen gegenwärtig wahrge28 Liddell 2003. 291

nommenen Gegenstand durch eine Gebärde darstellen. Dieses Hilfsmittel wird manchmal Kongruenz genannt (um seine Verwandtschaft mit so etwas wie der Kongruenz von Subjekt und Verb in gesprochenen Sprachen hervorzuheben). Wenn sie anzeigen möchten, wer eine Handlung vollzieht, können die Benutzer von Zeichensprachen auch die Stellung ihres eigenen Körpers im Raum ändern, um aus der räumlichen Perspektive einer Person zu handeln, die in der Situation indexikalisch präsent ist. Erneut handelt es sich dabei um ein natürliches ikonisches Hilfsmittel. Beide Typen von Sprachen verwenden manchmal auch konventionelle Zeichen, Wörter oder Marker (zum Beispiel Präpositionen, Kasusmarker), um die Rolle anzugeben, die ein Teilnehmer in einem Ereignis spielt. Drittens verleiht der Kommunizierende in beiden Modalitäten seinem Motiv (und manchmal auch anderen Einstellungen) Ausdruck, und zwar als zusätzliche Information, um dem Empfänger zu helfen, seine soziale Intention zu erschließen. In beiden Modalitäten handelt es sich dabei hauptsächlich um den natürlichen Ausdruck von Emotionen, obwohl diese Expressionen zu diesem Zweck konventionalisiert werden müssen, um als kontrastive Marker dienen zu können. So stellt man etwa eine Frage mit einer bestimmten Art von Gesichtsausdruck (in Zeichensprachen) und/oder mit einer bestimmten Betonung (in gesprochenen Sprachen). In der Frühgeschichte war dies möglicherweise mit natürlichen Ausdrucksbewegungen von Verwirrung und/oder Überraschung verbunden. Weniger höfliche Aufforderungen können durch einen fordernden Gesichtsausdruck oder einen entsprechenden Ton in der Stimme realisiert werden, was in der Frühgeschichte möglicherweise mit dem Ausdruck von Ärger verbunden war. Diese Expressionen von Motiven, die sowohl bei gesprochenen als auch bei Zeichensprachen eine natürliche Grundlage in den menschlichen Gefühlsreaktio292

nen haben, wurden jeweils auf ihre eigene Weise in beiden Modalitäten kontrastiv konventionalisiert. Was wir im vorangehenden Kapitel natürliche Kommunikation genannt haben, war eine Form von Kommunikation, die auf handlungsbasierten Gesten beruht, welche an die natürliche Neigung des Menschen angepaßt sind, der Blickrichtung (das heißt der Zeigegeste) zu folgen und die Handlungen anderer (das heißt das Gebärdenspiel) intentional zu interpretieren. Menschen besitzen die Fähigkeit, diese Gesten ohne besondere Lerngeschichte zu verstehen (vorausgesetzt, sie verfügen über die Infrastruktur geteilter Intentionalität der kooperativen Kommunikation mit kommunikativen Absichten, über einen gemeinsamen Hintergrund usw.), genau wie man solche Gesten auf selbstverständliche Weise in einem Geschäft oder auf einem Bahnhof in einem fremden Land verstehen kann. Die Konventionalisierung hebt die Natürlichkeit auf und ersetzt sie sozusagen durch eine geteilte Lerngeschichte: Jeder, der in dieser Gemeinschaft aufwuchs, weiß, wofür diese arbiträre Kommunikationskonvention üblicherweise verwendet wird, weil alle ähnliche Lernerfahrungen mit ihr gemacht haben (und alle das wechselseitig wissen). Syntaktische Hilfsmittel und Konstruktionen funktionieren genauso, und zwar allen Versuchen zum Trotz, sie als inhaltsleere, algebraische »Regeln« erscheinen zu lassen.29 Jede der zahlreichen Sprachen der Welt, sowohl der gesprochenen als auch der Zeichen- und Gebärdensprachen, hat ihre eigenen syntaktischen und andere grammatikalische Konventionen zur Strukturierung von Äußerungen, um die verschiedenen Probleme zu lösen, die die informierende Kommunikation aufwirft. Tatsächlich enthält jede der zahlreichen Sprachen der Welt eine Vielzahl vorgefertigter Konstruktionen, die 29 Chomsky 1965/1987, Pinker 1999/2006. 293

verschiedene Typen von Zeichen bzw. Wörtern und grammatikalische Marker für den Gebrauch in wiederkehrenden Kommunikationssituationen miteinander kombinieren; beispielsweise ist die deutsche Passivkonstruktion (etwa »Der Hund wurde vom Auto verletzt«, wobei das Subjekt der Betroffene der Handlung ist) aus einer bestimmten Anordnung bestimmter Konstituenten (von denen jede ihrerseits wieder ein eigenes Konstruktionsmuster hat) für eine spezifische Kommunikationsfunktion zusammengesetzt. Diese stärker funktionale Auffassung der Grammatik leugnet nicht, daß es eine sehr allgemeine Verarbeitung oder komputationale Prinzipien geben könnte, die die Arten grammatikalischer Muster, die Menschen konventionalisieren können, auf gewisse Weise zu formen oder beschränken in der Lage wären, oder daß am Anfang möglicherweise »natürliche« Prinzipien stehen, wie etwa den Akteur einer Handlung zuerst anzugeben. Eine Grammatik besteht jedoch zuallererst aus einer Menge konventioneller Hilfsmittel und Konstruktionen - die in einzelnen Sprachen verschieden konventionalisiert werden. Diese erleichtern die Kommunikation, wenn man auf komplexe Situationen außerhalb des Hier und Jetzt Bezug nehmen will.

6.2.2 Die Nicaragua-Zeichensprache Eine äußerst interessante Illustration des Übergangs von einfacher zu ernstzunehmender Syntax - und des Beginns der Konventionalisierung der Grammatik - liefern uns verschiedene Benutzergenerationen der Nicaragua-Zeichensprache. Die Nicaragua-Zeichensprache entstand in einer Situation, in der gehörlose Kinder, von denen jedes eigenständig bestimmte Fertigkeiten mit einer bestimmten Ausprägung einer Home-Sign-Gebärdensprache entwickelt hatte, in einer schulischen Umgebung zusammengebracht wurden. Dort 294

entwickelten sie spontan bestimmte Formen der Kommunikation untereinander, indem sie eine gemeinsame Menge von Zeichen benutzten. Kinder, die neu in die Schule kamen, lernten diese gemeinsame Menge von ihnen. Diese Situation ist einzigartig, weil sie erst vor einigen Jahrzehnten entstanden ist und daher die erste Generation von Kindern noch lebt (als Erwachsene) und außerdem zwei weitere Generationen von Kindern und Erwachsenen zur Untersuchung zur Verfügung stehen. Der Hauptbefund ist, daß die jüngeren Benutzer der Zeichensprache mit den Zeichen fließender umzugehen scheinen. Verglichen mit den ursprünglichen Schöpfern, die von früheren Generationen repräsentiert werden, haben sie offenbar zudem eine zusätzliche grammatikalische Struktur hinzugefügt. Benutzer von Home-Sign-Gebärdensprachen sind, wie oben bemerkt, weitgehend auf das beschränkt, was sie und ihre Eltern erfinden können, wobei es einen gewissen Druck gibt, »natürlich« (ikonisch) zu bleiben, der dadurch entsteht, daß andere Personen beim Akt der Erfindung nicht dabei waren. Bei der Geburt einer neuen Sprache wie dieser setzt jedoch ein neuer Prozeß ein. Wenn mehrere Benutzer miteinander kommunizieren, werden neue Zeichen und Konstruktionen geschaffen, und wenn diese von Novizen durch Imitation erworben werden (ohne daß diese immer die jeweilige Natürlichkeit verstehen), findet wieder »eine Drift zum Arbiträren« statt. Wir können diesen Prozeß die Konventionalisierung der Grammatik nennen (oder »Grammatikalisierung«, obwohl dieser Begriff andere Nebenbedeutungen hat) und werden ihn weiter unten ausführlich behandeln. Die an dieser Stelle wichtigste Beobachtung ist, daß dieser zusätzliche Prozeß der Schöpfung und Weitergabe eine grammatikalische Struktur entstehen läßt, die weit über die hinausführt, die von Individuen erfunden wurde, welche ihre eigene idiosynkratische Home-Sign-Gebärdensprache benutzten. 295

Bei der Nicaragua-Zeichensprache wurde sowohl durch die Analyse spontaner Zeichenbenutzung als auch durch Studien zu initiierter Zeichenproduktion festgestellt, daß in sehr kurzer Zeit eine grammatikalische Struktur erzeugt wurde. Erstens haben spätere Generationen von Benutzern der Nicaragua-Zeichensprache gelernt, den Raum auf verschiedene sinnvolle Weisen zu verwenden, um ihre Äußerungen grammatikalisch zu strukturieren, und zwar in einer Art, die den Hilfsmitteln konventioneller Zeichensprachen ähnelt (während die Zeichenbenutzer der ersten Generation dies nicht gelernt hatten). Beispielsweise benutzen sie den Raum, um abwesende Bezugsgegenstände zu identifizieren, die womöglich mehrere zusammenwirkende Zeichen erfordert hätten (Konstituenz). So benutzen sie etwa einen gemeinsamen räumlichen Bezugspunkt, um Einheiten anzuzeigen, die auf eine bestimmte Weise gemeinsam einen Konstituenten bilden - was manchmal Kongruenz genannt wird so daß zum Beispiel ein Gegenstand und ein modifizierender Ausdruck am selben Ort bezeichnet werden, wodurch eine Modifikationsbeziehung angezeigt werden soll. Dasselbe gilt für einen Akteur und eine Handlung. Außerdem werden räumliche Hilfsmittel dazu verwendet, Bezugsgegenstände über die Zeit hinweg zu verfolgen: Wenn ein Zeichenbenutzer einmal mit einem Zeichen auf einen Gegenstand Bezug genommen hat, kann er anschließend einfach auf den Ort zeigen, an dem das Gegenstandszeichen ursprünglich produziert wurde, um diesen Gegenstand ein zweites Mal zu bezeichnen. Das ähnelt der Funktion der Pronomen in der gesprochenen Sprache. Damit wird im Grunde ein räumliches Hilfsmittel benutzt, um auf Dinge in einer Weise Bezug zu nehmen, die aus dem bereits etablierten Rahmen gemeinsamer Aufmerksamkeit Kapital schlägt. Eine weitere interessante Verwendung des Raums durch Zeichenbenutzer der zweiten Generation ist die Angabe eines perspektivischen Bezugspunkts vor dem Ge296

stikulieren. Ein Beispiel hierfür wäre das Produzieren eines Zeichens in Richtung auf einen Ort im Raum, der mit einem bereits etablierten Gegenstand verknüpft ist, aber aus der Perspektive einer anderen Person.30 Zweitens und im Hinblick auf die Zeichenreihenfolge als strukturierendes Hilfsmittel produzieren Zeichenbenutzer der ersten Generation in experimentellen Studien, in denen die Versuchspersonen erzählen, was in Filmen passiert, nur einen Teilnehmer pro Handlung (was bei Home-Sign-Gebärdensprachen meistens der Fall ist), so daß auch die Reihenfolge von ziemlich langen Erzählungen in einem Wechsel von Verb- und Teilnehmerzeichen besteht. Aber Zeichenbenutzer der zweiten Generation bevorzugen die Produktion von Äußerungen, bei denen das Verb am Ende steht, gleichgültig wie viele Teilnehmer beteiligt sind, wobei Akteure/Subjekte/Themen fast immer vor Betroffenen/Objekten/Fokussen stehen.31 Diese Reihenfolge, bei der das Verb am Ende steht, wurde auch bei einer anderen neu erfundenen Zeichensprache, der Beduinen-Zeichensprache, festgestellt, in der die Äußerungen, bei denen das Verb am Ende steht, andere Reihenfolgenvarianten von der Anzahl her übertreffen, und zwar im Verhältnis von sechs zu eins.32 Zudem bringen Benutzer dieser neu geschaffenen Systeme ebenso wie manche Benutzer von Home-Sign-Gebärdensprachen Zeichen für gegenstandsbezogene Handlungen hervor, um anzuzeigen, daß diese Gegenstände die Betroffenen oder direkten Objekte der Handlung sind. Benutzer der zweiten Generation der Nicaragua-Zeichensprache haben also damit begonnen, eine Reihe von Hilfsmitteln zur grammatikalischen Strukturierung zu verwenden, 30 Senghas und Coppola 2001, Senghas 2003. 31 Kegl, Senghas und Coppola 1999. 32 Sandler et al. 2005. 297

die eine ernstzunehmende Syntax darstellen - und zwar auf eine Weise, wie es die Benutzer von Home-Sign-Gebärdensprachen und die Benutzer der ersten Generation nicht tun. Da Zeichensprachen vielfach spontan entstanden sind und alle ausgereiften Zeichen- und Gebärdensprachen eine umfangreiche grammatikalische Struktur aufweisen, ist eine solche Konventionalisierung vermutlich der normale Prozeß, durch den eine Gemeinschaft eine ausgereifte Zeichensprache erzeugt.

6.2.3 Die früheste Grammatik sprachfähiger Kinder Kurz nachdem sich normal entwickelnde Kinder mit der Produktion von Äußerungen anfangen, die aus mehreren Wörtern bestehen - häufig innerhalb der oben beschriebenen Pivotschemata - , beginnen sie, ihre Äußerungen grammatikalisch zu strukturieren, wie es auch gehörlose Kinder tun, die eine Zeichensprache erwerben. Schon recht früh weisen ihre Äußerungen insofern eine hierarchische Struktur auf, als sie aus mehreren Einheiten bestehende Nominalphrasen und Verbalphrasen enthalten, die sich durch spezielle Konstruktionsmuster auszeichnen.33 Außerdem verwenden sie auch schon recht früh syntaktische Hilfsmittel zweiter Stufe zur Strukturierung der Rollen von Teilnehmern an Ereignissen, indem sie die Reihenfolge oder andere Formen syntaktischer Markierung, Kasusmarkierungen etwa, verwenden. Anfangs sind diese Hilfsmittel zumeist an bestimmte Ereignistypen gebunden. Es ist beispielsweise möglich, daß Kinder eine bestimmte Reihenfolge lernen, um Akteure und Betroffene in besonderen Arten von Ereignissen wie Geben oder Drücken anzuzeigen, dieselben Hilfsmittel jedoch nicht für andere 33 Siehe den Überblick bei Tomasello 2003. 298

Typen von Ereignissen verwenden. Diese sogenannten Verbinsel-Konstruktionen34 deuten darauf hin, daß die früheste syntaktische Markierung der Kinder lokal beschränkt ist und erst allmählich allgemein und abstrakt wird. Die für den gegenwärtigen Zweck wichtigste Einsicht daraus lautet schlicht, daß syntaktische Hilfsmittel - selbst konventionelle, die die Bedeutung kontrastiv verändern - entweder eher lokal auf bestimmte Wörter bzw. Zeichen angewendet werden können oder umfassender über ganze Kategorien von Wörtern bzw. Zeichen hinweg. Wenn wir über die Evolution dieser Fähigkeiten nachdenken, sollten wir also vernünftigerweise annehmen, daß in den frühen Stadien einer ernstzunehmenden Syntax der Grammatik des Informierens Menschen ihre Äußerungen vermutlich mit syntaktischen Hilfsmitteln strukturiert haben, die nicht kategorisch auf alle bekannten Wörter bzw. Zeichen, sondern nur lokal auf bestimmte Wörter bzw. Zeichen angewendet wurden.

6.2.4 Zusammenfassung Aus einer evolutionären Perspektive paßt keine der Situationen, die wir hier untersucht haben - die Nicaragua-Zeichensprache oder der Prozeß, in dem Kinder eine konventionelle Zeichensprache oder eine gesprochene Sprache erwerben -, mit irgendeinem früheren Stadium der Evolution des Menschen zusammen. Kinder, die die Nicaragua-Zeichensprache schaffen und erlernen, könnten zwar ziemlich nahe an ein früheres Stadium herankommen, sie verfügen jedoch über deutlich mehr kognitive und sozio-kognitive Fertigkeiten als jene Menschen an dem Punkt, den wir ins Auge zu fassen haben (das betrifft insbesondere Fragen des Teilens und der 34 Tomasello 1992a, 2003. 299

Normativität). Zudem fangen sie alle sehr früh in ihrem Leben damit an, Home-Sign-Gebärdensprachen in der Interaktion mit reifen, modernen, sprachfähigen Erwachsenen zu erlernen. Wir suchen hier jedoch nach etwas, das de novo geschaffen wird, das über die Grammatik des Aufforderns hinausgeht und eine raffiniertere grammatikalische Strukturierung beinhaltet, aber trotzdem weder sämtliche syntaktischen Hilfsmittel bereits einschließt, die für das Teilen von Erfahrungen bei Erzählungen nötig sind, noch die normative Dimension menschlicher kooperativer Kommunikation umfaßt. Die wichtigste Neuerung, auf die es uns bei der Grammatik des Informierens ankommt, ist die Verwendung konventioneller syntaktischer Hilfsmittel seitens des Kommunizierenden, um (1) die Bezugsgegenstände im gegenwärtigen Rahmen gemeinsamer Aufmerksamkeit zu verankern, einschließlich der darauf abzielenden Verwendung von aus mehreren Einheiten bestehenden Konstituenten; um (2) die Äußerung als ganze für den Empfänger durch die Angabe der verschiedenen Rollen zu strukturieren, die die betreffenden Teilnehmer in dem Ereignis spielen; und (3) um das Motiv und die Einstellung konventionell auszudrücken (was häufig noch emotional durch den Gesichtsausdruck und den Ton der Stimme geschieht). Diese Neuerungen sind durch eine neue Kommunikationsfunktion motiviert, gleichwohl diese Funktion offenbar keine bestimmten Hilfsmittel spezifisch festlegt, da verschiedene Sprachen sie auf sehr verschiedene Weisen realisieren. Bei der Grammatik des Aufforderns, die an die eigene und die angesprochene Person im Hier und Jetzt gebunden ist, wird keine dieser Komplexitäten benötigt; bei der Grammatik des Informierens werden sie dagegen alle gebraucht. Die ersten konventionellen syntaktischen Hilfsmittel, die in der Evolution Verwendung fanden, wurden vermutlich von »natürlichen« Prinzipien abgeleitet, das 300

heißt von solchen, die alle Menschen natürlicherweise auf der Grundlage ihrer allgemeinen kognitiven, sozialen und motivationalen Neigungen verwenden, wie zum Beispiel »Akteur zuerst« oder »Thema zuerst« oder ein fragendes Gesicht machen, wenn man um eine bestimmte Information bittet. Der Prozeß der Konventionalisierung verwandelte diese dann aber in kommunikativ signifikante, syntaktische Hilfsmittel für die kooperative Kommunikation des Menschen.

6.3 Die Grammatik des Teilens und der Erzählung Das Motiv des Teilens ist, wie von Anfang an bemerkt wurde, eng mit dem Informieren verwandt. Es betrifft die elementare menschliche Motivation, einfach Informationen - und, was am wichtigsten ist, Einstellungen zu diesen Informationen - mit anderen zu teilen. Wir haben die Vermutung angestellt, daß ein derartiges Teilen mit anderen dazu dient, den gemeinsamen Hintergrund mit anderen auszuweiten - wie andere in der Gruppe zu sein und möglichst von ihnen gemocht zu werden sowie in der Lage zu sein, mit ihnen inniger zu kommunizieren; Teilen heißt, sich sozial zu identifizieren und Bindungen aufzubauen. Dieses Teilungs-/ Identifikationsmotiv führte, wie ebenfalls bemerkt, letztlich auch zur Normativität vieler sozialer Verhaltensweisen, zu einem impliziten sozialen Druck, die Dinge so wie die anderen zu tun. Da die Sprache eine sehr starke normative Struktur aufweist, und zwar sowohl hinsichtlich der Art und Weise, wie wir mit bestimmten sprachlichen Konventionen auf Gegenstände Bezug nehmen, als auch in Form der Unterscheidung zwischen grammatischen und ungrammatischen Äußerungen, ist es möglich, daß dieses Motiv zumindest teilweise für unser Urteil verantwortlich ist, daß »man das so nicht sagt«. 301

Ein wichtiges Medium, durch das Menschen aller Kulturen der Welt Informationen und Einstellungen mit anderen in ihrer Gruppe teilen, sind Erzählungen. Im Grunde verfügen alle Kulturen über Erzählungen, die dazu beitragen, ihre Gruppe als kohärentes Gebilde über die Zeit hinweg zu definieren - Schöpfungsmythen, Volksmärchen, Parabeln und dergleichen und in der Tat werden diese von Generation zu Generation als Teil der kulturellen Matrix weitergegeben. (Interessanterweise scheinen sogar die Benutzer von Home-Sign-Gebärdensprachen, die über keine konventionelle Sprache verfügen, durch ihre ikonischen Gesten einfache Geschichten zu erzählen,35 ebenso wie Kinder, die die Nicaragua-Zeichensprache erwerben.)36 Aus sprachwissenschaftlicher Perspektive werfen Narrative, die eine längere Geschichte erzählen, eine Vielzahl von Problemen auf, die damit zu tun haben, wie mehrere Ereignisse und deren Teilnehmer über die Zeit hinweg miteinander verknüpft werden sollen. Diese Probleme werden durch eine Reihe verschiedener syntaktischer Hilfsmittel gelöst, die zu dem gehören, was wir eine extravagante Syntax nennen könnten; und in der Tat leiten sich viele der anscheinend überbordenden Komplexitäten moderner Grammatiken speziell von Hilfsmitteln ab, die der vorliegenden Hypothese zufolge geschaffen wurden, um mit jenen Problemen zurechtzukommen, die von Erzählungen und anderen Formen eines erweiterten Diskurses erzeugt werden. Tatsächlich wurde dadurch sogar die Grammatik von Konstruktionen auf der Ebene einzelner Äußerungen beeinflußt. Denn der sprachliche Ausdruck von Ereignisabfolgen in separaten Äußerungen oder sogar in Fällen, in denen die Rednerrolle bei einer Unterhaltung wechselt, kann in eine einzelne Konstruktion komprimiert und grammatikalisiert 35 Goldin-Meadow 2003b. 36 Senghas, Kita und Özyürek 2004. 302

werden. Eine solche Konstruktion umfaßt mehrere Ereignisse und wird mehr oder weniger innerhalb ein und derselben Intonationskontur produziert. All dies kann sowohl in Zeichensprachen als auch in gesprochenen Sprachen vorkommen (und kommt auch durchaus vor). Unserer Ansicht nach handelt es sich hierbei um das charakteristische Merkmal des späteren Sapiens.

6.3.1 Diskurs und Narrativ Um sich auf eine erzählende Rede einzulassen, bedarf es der Möglichkeit, über mehrere Ereignisse und Sachverhalte zu sprechen, die miteinander auf vielfältige Weisen verbunden sind; und wir brauchen Mittel, um unsere Rede weniger im unmittelbaren nichtsprachlichen Kontext als vielmehr im sprachlichen Kontext zu verankern, der von der vorangehenden Rede gebildet wird. Um ein versierter Erzähler zu werden, muß man daher eine Menge von Hilfsmitteln beherrschen, die einen Zusammenhang und Zusammenhalt zwischen Ereignissen herstellen. Nur dann kann man eine gute Geschichte erzählen. Zwei Hauptprobleme sind mit der erzählenden Rede verbunden: Ereignisse in der Zeit aufeinander zu beziehen und die Teilnehmer in diesen Ereignissen zu verfolgen, wenn es sich über verschiedene Ereignisse hinweg manchmal um dieselben und manchmal um verschiedene Teilnehmer handelt (und wenn dieselben Teilnehmer in verschiedenen Ereignissen verschiedene Rollen spielen). Das Verfolgen von Ereignissen durch die Zeit hindurch führt erstens zu unglaublich komplexen grammatikalischen Strukturen. Am einfachsten ist es natürlich dann, wenn ein Ereignis relativ zum Jetzt in der Zeit lokalisiert wird: Ich schliefe ine Stunde lang oder ich werde eine Stunde lang schlafen. Aber Erzählungen verlangen 303

auch von uns, Ereignisse zu situieren, die räumlich und zeitlich versetzt sind, so daß ich etwa folgendes sagen kann: Während ich schlief\ explodierte eine Bombe (ein vergangenes Ereignis geschieht innerhalb eines anderen vergangenen Ereignisses). Nachdem ich eine Stunde lang geschlafen hatte, kam meine Mutter (ein vergangenes Ereignis geschieht nach einem anderen vergangenen Ereignis). Nächsten Monat werde ich mein Buch abgeschlossen haben (ein zukünftiger Zeitpunkt, relativ zu dem ein anderes zukünftiges Ereignis vergangen ist). Wenn ich mein Buch abschließe, werde ich zehn Jahre in Australien gelebt haben (ein zukünftiges Ereignis, bei dem ein anderes, sich in die Zukunft erstreckendes Ereignis endet). Es ist schwierig, sich irgendeinen anderen Kommunikationskontext als die erzählerische Rede vorzustellen, der eine solche filigrane zeitliche Buchhaltung mittels verschiedener Verbtempora und -aspekte erfordern würde. Zweitens ist das Verfolgen von Bezugsgegenständen über Ereignisse hinweg ebenfalls recht kompliziert. In einigen Fällen braucht der Bezugsgegenstand im zweiten Ereignis nicht einmal identifiziert zu werden, wie etwa in »Bill fuhr in die Stadt und kaufte ein Hemd.« In anderen Fällen wird der Bezugsgegenstand durch ein Pronomen identifiziert. Das kann jedoch heikel sein, wenn es zwei zuvor erwähnte Teilnehmer gibt, die beide als Bezugsgegenstände des Pronomens gelten könnten, wie zum Beispiel in »Bill fuhr Sarah in die Stadt und kaufte ein Hemd«. In diesem Fall ist die Person, die ein Hemd kaufte (Bill), tatsächlich weiter vom Wort 304

kaufen entfernt als der andere benannte Referent (Sarah). Das kann jedoch außer Kraft gesetzt werden, wenn ein Pronomen verwendet wird, das auf bestimmte Weise markiert ist, wie in »Bill fuhr Sarah in die Stadt, und sie kaufte ein Hemd«. In diesem Fall setzt das weibliche Pronomen sie den Standardfall wie im vorherigen Beispiel außer Kraft. Sprachen, in denen alle Nomen zu verschiedenen Geschlechtern oder Klassen gehören, können diese Strategie viel produktiver einsetzen als beispielsweise das Englische. Diese einfachen Beispiele kratzen zwar nur an der Oberfläche der Komplexität der sogenannten Referenzverfolgung in einem Diskurs, aber sie illustrieren zumindest auf sehr übersichtliche Weise verschiedene Arten von Kommunikationsdruck, durch die sich entwickelnde Grammatiken geformt werden (zum Beispiel der Druck, Möglichkeiten zu finden, Bezugsgegenstände über Ereignisse hinweg zu verfolgen), die wiederum für eine Vielfalt verschiedener Formen von Pronomina, verschiedene Klassen von Nomen, bestimmte Arten der Kongruenzmarkierung usw. verantwortlich sein könnten. Wie bereits erwähnt, wird dieselbe Funktion in Zeichensprachen häufig dadurch vollzogen, daß der Zeichenbenutzer gegenüber einer anderen Person ein Zeichen für eine Person oder einen Gegenstand an einem bestimmten Ort macht und dann auf diese Person oder diesen Gegenstand zurückreferiert, indem er anschließend auf diesen Ort zeigt. Die zeitliche Verankerung von Ereignissen in einem erweiterten Diskurs und die Verfolgung von Referenten über Ereignisse hinweg sind viel komplexer, als die bescheidene Diskussion hier suggeriert; die sprachliche Differenzierung diesbezüglich ist immens. Als wichtigster Punkt läßt sich aber dennoch festhalten, daß die Kommunikationsfunktion den Prozeß steuert, so daß alle sprachlichen Gemeinschaften, die Geschichten erzählen und von anderen Formen des erweiterten Diskurses Gebrauch machen wollen, grammatikali305

sehe Konventionen des hier beschriebenen allgemeinen Typs schaffen müssen, um diese Ziele zu erreichen.

6.3.2 Komplexe Konstruktionen Diese Art von erweitertem Diskurs führt zu den komplexesten syntaktischen Konstruktionen auf der Äußerungsebene einer Sprache, das heißt zu denjenigen, die mehr als ein Ereignis umfassen. In einem Prozeß, der unten ausführlicher beschrieben wird, »gerinnen« längere Redesequenzen, die mehrere Ereignisse anzeigen - welche nur locker organisiert sind und über verschiedene Betonungseinheiten ausgedrückt werden - , über historische Zeiträume in der Diskursgemeinschaft zu mehr oder weniger straff organisierten grammatikalischen Konstruktionen, die innerhalb einer einzigen Intonationskontur ausgedrückt werden. Es gibt drei Grundtypen solcher Konstruktionen, die unsere Funktionen der Identifikation, der Strukturierung und des Ausdrucks auf noch komplexere Weisen erweitern. Bezüglich der Identifikation gibt es unzählige verschiedene Konstruktionen, die den Zweck haben, Bezugsgegenstände zu identifizieren, indem mehrere Elemente wie bei deutschen Nominalphrasen (»das große, grüne Auto«) und Verbkomplexen (»wird geschlafen haben«) verwendet werden. Die aufwendigsten dieser Konstruktionen sind Relativsätze, weil sie die Identifikation eines Referenten durch ein Ereignis beinhalten: Der Mann, der den grünen Mantel trug, brach früh auf. Da ist diese Frau, die gestern im Laden war.

306

Andere Konstruktionen ändern die Perspektive sowie die Betonung und identifizieren dadurch einen wichtigen Teilnehmer zugunsten des Empfängers, zum Beispiel: Es war der Mann, der ausgeraubt wurde (und nicht die Frau, wie du vermutest). Es war das Mädchen, das ihn ausgeraubt hat (und nicht der Junge, wie du vermutest). Die Einzelheiten der Funktionsweise solcher Konstruktionen sollten uns nicht ablenken, schließlich brauchen wir nur zu wiederholen, daß sie die Funktion haben, Bezugsgegenstände zu identifizieren und sich auf bestimmte Weisen von der erweiterten Rede ableiten, die unten etwas ausführlicher beschrieben werden. Was die Strukturierung betrifft, so enthalten alle Sprachen komplexe Konstruktionen, die Ereignisse auf komplexe, aber systematische Weise aufeinander und auf die Teilnehmer beziehen. Im Deutschen können wir beispielsweise Dinge sagen, die sich auf zwei Ereignisse beziehen, etwa: Sie beendetei ihre Hausaufgaben und ging2 dann in die Stadt. Sie zogx an der Tür, aber diese ließ sich nicht schließen2. Sie fuhrx mit dem Fahrrad, weil sie ihn schnell finden2 mußte. Solche nebeneinandergestellten Ereignisse, die durch ein Schlüsselwort verbunden werden, das ihre wechselseitige Beziehung angibt, sind in Diskursen und Narrativen weit verbreitet, und dies sind nur einige wenige Beispiele. Es gibt viele 307

andere Formen und zudem große Unterschiede zwischen den Sprachen im Hinblick auf diese Arten von locker organisierten komplexen Konstruktionen. Bei der Ausdrucksfunktion gibt es spezielle Konstruktionen, die die Aufgabe haben, verschiedene Sprechaktfunktionen (-motive) wie Fragen oder Befehle anzuzeigen: Schließ' die Tür! (Imperativ) Hast du die Tür geschlossen? (Frage) Er schloß die Tür. (Informierende Äußerung) Bei anderen Konstruktionen, die die Einstellung des Sprechers ausdrücken, wird über ein Ereignis im Rahmen des psychischen Zustands oder der Einstellung einer Person berichtet. Einige Konstruktionen dieser Art betreffen Wünsche und Willensakte, von denen viele, und zwar jene, die von Kindern zuerst erworben werden, die Einstellung des Kommunizierenden im Hier und Jetzt gegenüber dem Ereignis ausdrücken. Am einfachsten sind die folgenden: Ich will Batman spielen. Ich muß meine Hausaufgaben machen. Ich versuche Zugewinnen. Diese Konstruktionen können schließlich zu Berichten über die psychischen Zustände oder Einstellungen zu Ereignissen verallgemeinert werden, in denen andere sind bzw. die sie diesbezüglich haben. Weitere Konstruktionen in dieser Kategorie betreffen epistemische Zustände. Einige einfache Beispiele sind: 308

Ich weiß, daß ich es tun kann. Ich meiney daß er nach Hause ging. Ich glaube, daß sie zur Party kommen wird. Diese Konstruktionen können natürlich auch auf Berichte über die psychischen Zustände oder Einstellungen anderer, bezogen auf bzw. zu Ereignissen, verschoben werden. Bemerkenswerterweise müssen Kinder ihre frühesten komplexen Konstruktionen nicht aus den Redesequenzen heraus grammatikalisieren, weil sie die Konstruktionen in ihrer gegenwärtigen komplexen Form von den Erwachsenen hören.37 Darin manifestiert sich ein weiteres Mal die allgemeinere kulturelle Dialektik, mittels deren erfundene Kulturprodukte über einen historischen Zeitraum hinweg in der sozialen Interaktion und Zusammenarbeit immer komplexer werden, wohingegen spätere Generationen das neue Produkt einfach durch Imitation oder andere Formen kulturellen Lernens erwerben (der Wagenhebereffekt).38 Entscheidend ist hier einfach, daß viele, wenn nicht die meisten, der kompliziertesten grammatikalischen Konstruktionen einer Sprache historisch auf der Grundlage längerer Redesequenzen konventionalisiert werden, um die vielen Komplexitäten in den Griff zu bekommen, die sich ergeben, wenn man sich auf einen erweiterten Diskurs und eine Narration mit einer Struktur einläßt, die mehrere Ereignisse umfaßt - wie wir unten ausführlicher skizzieren werden.

37 Diessel und Tomasello 2000, 2001, Diessel 2005. 38 Tomasello, Kruger und Ratner 1993. 309

6.3.3 Grammatikalität als Normativität Warum erzählen alle Menschen in allen Kulturen überhaupt Geschichten? In Kapitel 5 haben wir eine evolutionäre Argumentation dafür präsentiert, wie Menschen Information, Gefühle und Einstellungen mit anderen teilen. Dieses Teilen ist im Grunde eine Art Erweiterung unseres gemeinsamen Hintergrunds und daher eine Erweiterung unserer Kommunikationsgelegenheiten. Außerdem werden wir dadurch den anderen ähnlicher und verbessern unsere Aussichten auf soziale Akzeptanz (bei Prozessen kultureller Gruppenselektion spielt die Konformität mit der Gruppe eine entscheidende Rolle). Das Erzählen von Geschichten trägt zu diesem Prozeß bei, da nur die Mitglieder unserer Gruppe unsere Geschichten kennen. Darüber hinaus stellen unsere geteilten Bewertungen der Charaktere und ihrer Handlungen beim Erzählen dieser Geschichten auch einen wichtigen Bindungsmechanismus dar.39 In Kapitel 5 haben wir auch dafür argumentiert, daß dieser Prozeß zu sozialen Normen führt. Menschen haben ein starkes Bedürfnis, einer sozialen Gruppe anzugehören, und Verhaltensnormen auf der Gruppenebene - die Normen, kooperativ zu sein, sich wie die anderen zu kleiden, wie sie zu essen und zu handeln - können nur entstehen, weil Personen für soziale Bewertung und Sanktionen empfänglich sind (und sie letzteren eigentlich durch Gefühle von Peinlichkeit, Schuld und Scham zuvorkommen). Entscheidend ist, daß sich die Normativität auch auf viele der alltäglichen Praktiken von Menschen in einer sozialen Gruppe ausdehnt, und zwar als Resultat eines allgemeinen Drucks, Mitglied einer Gruppe zu sein und sich dieser konform zu verhalten: So ernten wir, 39 Siehe Bruner 1986, der mit Blick auf Narrative »die Landschaft der Handlung« von der »Landschaft der Bewertung« unterscheidet. 310

die Mitglieder dieser Gruppe, Honig (wie es unsere Vorfahren seit Anbeginn der Zeit getan haben); so verwenden wir Stäbchen zum Essen, usw. Das Phänomen der Grammatikalität - daß bestimmte Äußerungen ungrammatisch klingen (»Das ist kein Deutsch«) scheint sehr weit davon entfernt zu sein, soziale Normen zu befolgen, um Scham und Schuld zu vermeiden. Wir würden jedoch geltend machen, daß sie in Wirklichkeit nur eine weitere Instantiierung sozialer Normen für alltägliches Verhalten ist - wie etwa die gruppenspezifische Art, Honig zu ernten oder mit Stäbchen zu essen. Eine solche Instantiierung von sozialen Normen wird jedoch durch die Tatsache verstärkt, daß gewöhnliche grammatische Äußerungen jeden Tag dutzende oder gar hunderte von Malen gehört werden, so daß ihr Muster in unseren Kommunikationstätigkeiten recht stark verankert ist (man beachte, daß grammatikalische Muster, die weniger häufig gehört werden, nicht so übel klingen, wenn sie verletzt werden, wie häufiger gehörte Muster).40 Interessanterweise scheinen die Kinder der zweiten Generation, die die Nicaragua-Zeichensprache erwerben, einen Sinn für Grammatikalität zu haben, der den Benutzern von HomeSign-Gebärdensprachen fehlt (das heißt, sie bemerken, daß die erste Generation es nicht immer »richtig« macht).41 Das legt nahe, daß zu Beginn des Konventionalisierungsprozesses bei Individuen, die über die kognitiven und sozialen Fertigkeiten des modernen Menschen verfügen und Mitglieder einer sprachlichen Gemeinschaft sind, der Eindruck erzeugt wird, die Dinge müßten auf diese Weise getan werden - und daß einige der anderen sie nicht richtig tun. Viele Sprachwissenschaftler und Philosophen haben sich über die Grammatikalität den Kopf zerbrochen: Wenn es sich 40 Brooks et al. 1999. 41 Senghas, Kita und Özyürek 2004. 311

nicht um explizite Regeln handelt, wie sie in der Schule gelehrt werden (also um eine bewußte, präskriptive Grammatik, die den Zweck hat, anderen die eigene Bildung und den eigenen Status zu signalisieren), sondern um etwas Elementares, was soll das dann sein? Meiner Ansicht nach handelt es sich nur um einen weiteren Fall der Normativität von Gruppenverhalten, ausgestattet jedoch mit der zusätzlichen Kraft von besonders häufig auftretendem, gewohnheitsmäßigem Verhalten, so daß Normverletzungen befremdlich klingen. Das ist zwar ein unerwarteter, aber äußerst wichtiger zusätzlicher Effekt des Motivs für das Teilen/die Konformität/die Identifikation mit der Gruppe in der Evolution menschlicher Kommunikation.

6.3.4 Zusammenfassung Linguisten werden, ich ahne es schon deutlich, vor den schrecklichen Simplifizierungen erschaudern, die diese kurze Darstellung komplexer Redekonstruktionen (und gerade auch der ernstzunehmenden Syntax) enthält. Meine Ziele waren hier jedoch sehr konkret und bescheiden. Ich habe einfach versucht zu zeigen, daß: - die Inanspruchnahme von erweiterter Rede und Erzählungen bestimmte funktionale Anforderungen erzeugt, wie zum Beispiel Ereignisse miteinander zu verknüpfen, Teilnehmer zu verfolgen und Perspektiven einzunehmen; - alle bekannten Sprachen grammatikalische Hilfsmittel besitzen, um diesen Anforderungen zu genügen, es aber viele verschiedene Weisen gibt, das zu tun, und diese Hilfsmittel sich daher stark von einer Sprache zur anderen unterscheiden; - wiederkehrende Redesequenzen, die mehrere Ereignisse 312

umfassen, die ultimative Quelle komplexer syntaktischer Konstruktionen sind (dazu weiter unten mehr). Individuen, die bloß damit beschäftigt sind, Dinge voneinander im Hier und Jetzt zu verlangen, oder auch einander über Dinge zu informieren, die vom Hier und Jetzt etwas entfernt sind, würden einfach für viele der extravaganten syntaktischen Hilfsmittel, die wir in modernen Sprachen antreffen und deren Funktion auf recht direkte Weise mit den funktionalen Anforderungen erzählender Rede über räumlich und zeitlich versetzte, strukturierte Ereignisfolgen zusammenhängt, keinen Bedarf haben. Immerhin können wir unsere evolutionären Stufen entlang der Grammatik des Aufforderns, des Informierens und des Teilens in Erzählungen wie in Abbildung 6.1 zusammenfassen. Diese Abbildung soll lediglich sehr allgemein jene grammatikalischen Eigenschaften darstellen, die die menschliche Kommunikation kennzeichneten, als die verschiedenen Kommunikationsmotive in einem evolutionären Zeitraum auftauchten. (In dieser Abbildung, ebenso wie in Abbildung 5.1, verwenden wir die Begriffe Homo, früherer Sapiens und späterer Sapiens nur als bequeme und evokative Bezeichnungen im Hinblick auf die evolutionäre Abfolge, ohne weitergehende Behauptungen damit zu verbinden.) Der Konventionalisierungsprozeß, der in einem kulturgeschichtlichen Zeitraum stattfindet, ist hier nicht dargestellt. Diesem wenden wir uns (nach einer kurzen wiederholenden Zusammenfassung) nun aber zu. Um unsere dreistufige evolutionäre Erklärung auf eine andere Art zusammenzufassen, betrachten wir die heutige Entwicklung von Pidgin- und Kreolsprachen unter besonderen sozialen Umständen, die durch Muttersprachler verschiedener stimmlicher Sprachen geschieht. Die Hypothese wäre folgende: Wenn diese Individuen - obwohl sie sich kognitiv von 313

Grammatik des Aufforderns Homo

Einfache Syntax > Aufgliederung der Erfahrung In Ereignisse und Teilnehmer > Kombination von Gesten zu einem einzigen Ziel

Grammatik des Informierens Früher Homo Sapiens

Ernstzunehmende Syntax > Syntaktische Markierung von Rotten in Ereignissen > Identifikation von Teilnehmern in einem Rahmen gemeinsamer Aufmerksamkeit > Verankert

Kombination von Zeigegesten und Intentionsbeweauna

Zeichen- und Intention

Abbildung 6.1: Evolutionäre Grundlagen der Grammatik in drei Stufen.

Grammatik des Teilens Später Homos Sapiens

Extravagante Syntax > Beziehung von Ereignissen innerhalb einer Erzählung > Verfolgen von Teilnehmern über Ereignisse hinweg

> Normativ grammatikalisch

Hauptsächlich stimmliche Sprac

den frühen Menschen stark unterscheiden - nur in so etwas wie einer Arbeitssituation interagierten, in der im Grunde die ganze Kommunikation auf Aufforderungen hinausliefe, um andere zur Ausführung bestimmter Dinge im Kontext der gemeinschaftlichen Arbeitstätigkeit zu ermuntern, würde die sich ergebende grammatikalische Struktur die meisten strukturierenden Hilfsmittel moderner Sprachen nicht aufweisen. Die Aufforderung, daß jemand jetzt an dieser Stelle graben möge, erfordert kein Plusquamperfekt und keine Relativsätze, und tatsächlich wissen wir, daß viele Pidgin-Sprachen in den frühesten Stadien eine sehr beschränkte grammatikalische Struktur haben (den sogenannten Jargon42). Wenn diese Menschen dann aber auf Stufe zwei das Bedürfnis hatten, einander über etwas Nützliches zu informieren - insbesondere über Dritte und räumlich und zeitlich nicht gegenwärtige Dinge dann führte dieser funktionale Druck zur Konventionalisierung bestimmter ernstzunehmender syntaktischer Hilfsmittel (zum Beispiel kontrastiver Wortreihenfolgen, syntaktischer Markierung, komplexer Nominalphrasen usw.) sowie komplexerer grammatikalischer Konstruktionen, wodurch ein »Pidgin« erzeugt wird. Auf der dritten Stufe erlangt eine Pidgin-Sprache allmählich den Status einer Kreolsprache oder gar einer normalen natürlichen Sprache, wenn die Sprecher sich selbst als kohärente kulturelle Gruppe zu identifizieren beginnen, und zwar zumindest teilweise auf der Grundlage ihrer gemeinsamen Sprache und vielleicht auch der Geschichten, die sie sich in dieser gemeinsamen Sprache erzählen können.

42 McWhorter 2005. 315

6.4 Die Konventionalisierung von Sprachkonstruktionen Die Funktionsweise moderner Sprachen ist also eine komplexe Mischung aus einerseits »natürlichen« Prinzipien der Kommunikation und Grammatik-Prozessen, die sich unmittelbar aus den Strukturen ableiten, mit deren Hilfe Menschen die Welt erkennen und sozial miteinander interagieren - und andererseits konventionalisierten Kommunikationsmitteln, die innerhalb spezifischer kultureller Gruppen erzeugt und weitergegeben werden. Natürlich sind die Prozesse, durch die Kommunikationsmittel konventionalisiert werden, keine Prozesse biologischer Evolution, sondern vielmehr solche der kulturgeschichtlichen Evolution. Der Schlüssel zum Verständnis dieser Prozesse heißt Phänomen des Sprachwandels. Um den Sprachwandel im Fall der Grammatik genauer zu verstehen, müssen wir zuerst begreifen, was genau geschaffen und weitergegeben wird (Antwort: Konstruktionen). Anschließend müssen wir nachvollziehen, warum sich grammatikalische Konstruktionen über historische Zeiträume hinweg wandeln. Dieser Wandel ist ziemlich rätselhaft, da es für die wirksame Kommunikation zwischen allen Mitgliedern einer Gruppe über Generationen hinweg auf den ersten Blick sinnvoll zu sein scheint, daß Kommunikationskonventionen, einschließlich der grammatikalischen Konventionen, konstant bleiben. Daher stellt sich die Frage, wer diese Konventionen ändert und warum (Antwort: Niemand tut das absichtlich), und in welcher Modalität dieser Wandel stattfindet (Antwort: sowohl bei gestischen als auch bei stimmlichen Sprachen).

6.4.1 Konstruktionen Menschen, die miteinander kommunizieren, müssen sich nicht bei jedem Sprechereignis zu kreativen Höchstleistun316

gen aufschwingen, um aus mehreren Einheiten bestehende Äußerungen zusammensetzen zu können. Außerdem greifen sie dazu nicht auf »Regeln« aus Grammatikbüchern zurück (was auch immer diese sein mögen). Sie besitzen also nicht bloß Wörter und isolierte grammatikalische Hilfsmittel, sondern verfügen als Mitglieder einer Sprachgemeinschaft schon über vorgefertigte, innerlich komplexe Kommunikationskonventionen, die als Sprachkonstruktionen bezeichnet werden. Sprachkonstruktionen sind im wesentlichen vorgefertigte, bedeutungstragende Strukturen, die in bestimmten wiederkehrenden Kommunikationssituationen verwendet werden können. Diese Konstruktionen beinhalten bestimmte Wörter und Phrasen, wie in »Wie gehts?«, »Bis später!« und »Keine Ahnung.«, oder sie können ein abstraktes Muster, und zwar nicht von bestimmten Wörtern, sondern von Worttypen enthalten, wie beispielsweise in der englischen Passivkonstruktion (X was VERBed by Y) oder der Past-Tense-Konstruktion (VERB + ed). Einer der großen theoretischen Fortschritte in der Sprachwissenschaft des 20. Jahrhunderts ist die Erkenntnis, daß konventionalisierte grammatikalische Konstruktionen unabhängig von den Bedeutungen der einzelnen Wörter eigenständige Gestalteigenschaften annehmen können und somit eine Art von Autonomie auf der Analyseebene der Grammatik erzeugt wird.43 Wenn ich beispielsweise zu Ihnen sage »Der Knork wurde vom Gruntel verzilcht«, wissen Sie - ohne die Bedeutung eines einzigen Inhaltsworts zu kennen - daß der Gruntel etwas mit dem Knork gemacht hat (nämlich ihn zu verzilchen) und daß wir dieses Ereignis aus der Perspektive des Knorks als Betroffenem eingeführt haben. Tatsächlich können die Gestalteigenschaften von Konstruktionen sich in vielen Fällen sogar über die Bedeutungen einzelner Wörter 43 Langacker 1987, Fillmore 1989, Goldberg 1995, 2006, Croft 2001. 317

»hinwegsetzen«. Beispielsweise sagen die Grammatikbücher, daß das Verb niesen ein intransitives Verb ist, das zusammen mit einem einzelnen Akteur verwendet wird, nämlich mit demjenigen, der niest. Ich kann jedoch so etwas sagen wie »Er nieste ihr den Tennisball« und Sie werden sich eine Szene ausdenken, in der sein Niesen einen Ball dazu veranlaßt, sich von ihm zu ihr zu bewegen. Diese Bewegung wird nicht durch das Verb niesen mitgeteilt, sondern vielmehr durch die Konstruktion als ganze (die ditransitive Konstruktion). Wir übertreiben also nicht, wenn wir sagen, daß die Konstruktion selbst - das abstrakte Muster - ein sprachliches Symbol ist, wenn auch ein komplexes, das eine innere Struktur besitzt.44 Mit anderen Worten: So wie Sprachgemeinschaften einzelne Wörter in ihrem Vokabular erzeugen und weitergeben, geben sie auch grammatikalische Konstruktionen weiter und erzeugen sie. Konstruktionen, die bestimmte Wörter und Phrasen enthalten, können auf übliche kulturelle Weise durch Imitation tradiert werden. Da jedoch abstrakte Konstruktionen im wesentlichen Gebrauchsmuster sind, lassen sie sich nicht direkt imitieren, sondern die Kinder müssen sie statt dessen über individuelle Lernerfahrungen hinweg anhand verschiedener Beispiele (re)konstruieren. Aber weder Wörter noch grammatikalische Konstruktionen werden originalgetreu weitergegeben. Man muß nur ein Werk von Chaucer zur Hand nehmen und als moderner Sprecher des Englischen versuchen, es zu lesen. Vieles davon ist unverständlich, obwohl erst ein paar hundert Jahre alt. Die moderne Sprachwissenschaft entstand ja mit der Entdeckung, daß fast alle europäischen Sprachen und einige andere, die bis nach Indien reichen, einen gemeinsamen Ursprung in einer gemeinsamen Vorfahrensprache haben (Proto-Indoeuropäisch) und daß die meisten der heutigen europäischen Sprachen in 44 Goldberg 1995. 318

nur wenigen tausend Jahren sich auseinander entwickelt und voneinander differenziert haben. Dieser Wandel betrifft nicht nur die Wörter; auch die grammatikalischen Konstruktionen dieser Sprachen haben sich radikal ausdifferenziert. Über einen Zeitraum von nur wenigen hundert Jahren wandelte sich das Englische beispielsweise von einer Sprache, die in erster Linie Kasusmarkierungen verwendete, um anzuzeigen, wer was wem gegenüber getan hat, zu einer Sprache, die zu diesem Zweck vor allem die Wortreihenfolge heranzieht (wobei Überbleibsel des Kasussystems immer noch in den Pronomina sichtbar sind: I-me, he-him, she-her usw.). Wenn wir verstehen wollen, wie Sprachkonstruktionen über Generationen hinweg erzeugt und tradiert werden, müssen wir also zunächst versuchen, Prozesse des Sprachwandels zu verstehen.

6.4.2 Spracherzeugung und Sprachwandel Alle Individuen aller sozialen Spezies - mit einer Ausnahme können wirksam kommunizieren, indem sie ihre entwickelten Kommunikationsdisplays und möglicherweise auch Signale gegenüber allen anderen Individuen ihrer Spezies verwenden (sogar Vögel mit anderen Dialekten erkennen noch den Gesang in einem anderen Dialekt und reagieren entsprechend darauf). Diese Displays und Signale ändern sich im Laufe der Generationen nicht merklich. Die Ausnahme sind natürlich die Menschen. Menschen besitzen über 6000 verschiedene Sprachen, deren Sprecher einander nicht verstehen können, und tatsächlich hätten sogar die Sprecher derselben Sprache zu verschiedenen historischen Zeitpunkten große Schwierigkeiten, einander zu verstehen (Chaucer und wir!). Die Erklärung dafür ist, daß menschliche Sprachgemeinschaften ihre Sprachen ständig neu erfinden - obwohl das nicht absichtlich geschieht. 319

Spracherzeugung und -wandel wurden als Erscheinungen der »dritten Art« (und im Anschluß an Adam Smith auch als Phänomene der unsichtbaren Hand) bezeichnet.45 Wie andere gesellschaftliche Phänomene, Inflation, Ressourcenerschöpfung und dergleichen, ergeben sie sich aus absichtlichen menschlichen Handlungen, obwohl kein einziges Individuum oder gar eine Gruppe von Individuen die Absicht hatte, daß dies geschieht. Zu Spracherzeugung und -wandel kommt es, weil die menschliche Kommunikation offen und dynamisch ist, wobei die Sprecher sich ständig aneinander anpassen, um effektiv zu kommunizieren und andere soziale Ziele zu erreichen. Dabei stützen sie sich den Umständen entsprechend in unterschiedlichem Ausmaß auf verschiedene Grade und Arten von gemeinsamem Hintergrund. Es gibt nicht viele Untersuchungen über die kognitiven Dimensionen dieses Prozesses. Im folgenden stellen wir eine Erklärung seiner Funktionsweise vor, die im allgemeinen mit den beobachteten Phänomenen der Sprachgeschichte übereinstimmt.46 Wenn Menschen miteinander sprachlich kommunizieren, versucht der Kommunizierende effizient zu sein, indem er so wenig wie möglich sagt, um die Botschaft zu übermitteln. Der Empfänger ist natürlich daran interessiert, genügend Informationen zu erhalten, um die Botschaft zu verstehen. Er stützt sich auf diese Informationen sowie auf den gemeinsamen Hintergrund, den er mit dem Kommunizierenden teilt. Wenn ich beispielsweise die Frage stelle »Wo ist Jeff?«, sind geeignete Antworten solche knappen Äußerungen wie »New York«, »schläft« und andere Wendungen, die nur die benötigte Information enthalten, während die bereits geteilte Information aus der Äußerung weggelassen wird (ich muß also nicht sagen »Jeff ist in New York« oder »Jeff schläft«). Wenn 45 Keller 1994. 46 Croft 2000, Dahl 2004, Deutscher 2005. 320

Sie mir eine Frage stellen, die ich nicht beantworten kann, ist meine Antwort in umgangssprachlichem Englisch üblicherweise etwas, was für einen Nichtmuttersprachler kaum verständlich ist, nämlich »I dunno« (I dont know). Ich nehme jedoch an, daß Sie diese Antwort verstehen, da mir nur wenige mögliche Antworten zur Verfügung stehen und diese komprimierte Äußerung daher wahrscheinlich ausreicht, die beabsichtigte Äußerung anzuzeigen. In besonderen Zusammenhängen, in denen Menschen über einen ausgeprägten gemeinsamen Hintergrund verfügen - wie zum Beispiel eine Zahnärztin und ihre Assistentin, die jahrelang zusammengearbeitet haben entsteht eine Art von abgekürztem Kode, in dem die Beteiligten schnell und effizient kommunizieren, indem sie ihre wechselseitige Erfahrung nutzen, um vieles ungesagt zu lassen. Wörter mit geringem Informationsgehalt, die in Kontexten mit hoher Vorhersagbarkeit auftreten, werden beim alltäglichen Sprechen oft kaum artikuliert; beispielsweise kann der faktische Ausdruck einer Ablehnung so etwas sein wie »bin beschäftigt« (»Ich bin beschäftigt«). Das allgemeine Prinzip lautet: Die tatsächlich produzierten Äußerungen sind um so reduzierter in der Form, je größer der gemeinsame Hintergrund und die Vorhersagbarkeit zwischen den Sprechern ist. Sprecher automatisieren und reduzieren also bestimmte Äußerungen und Phrasen innerhalb von Äußerungen aus Gründen der Effizienz - innerhalb der Grenzen der Verständnisfähigkeit des Empfängers. Die Äußerungen, die in bestimmten Situationen sprachlicher Kommunikation produziert werden, sind daher im Grunde Kompromisse zwischen dem Wunsch des Kommunizierenden, nur das zu sagen, was nötig ist, um die Botschaft zu übermitteln, und dem Wunsch des Empfängers, alle Informationen zu erhalten, die nötig sind, um die Botschaft zu verstehen. Das geschieht auf zwei Ebenen. Zunächst werden längere Redesequenzen, die sich über Intonationskonturen 321

hinweg erstrecken, zu Konstruktionen der Äußerungsebene reduziert, die hauptsächlich innerhalb einer einzigen Intonationskontur produziert werden. Es folgen einige Beispiele, die auf Untersuchungen von Givön beruhen:47 - Lockere Redesequenzen wie Er zog an der Tür; und sie öffnete sich können verkürzt werden zu Er zog die Tür auf (eine resultative Konstruktion). - Lockere Redesequenzen wie Mein Freund... Er spielt Klavier... Er spielt in einer Band können zu Mein Freund spielt Klavier in einer Band werden. Oder ebenso kann Mein Freund... Er reitet Pferde... Er wettet auf sie zu Mein Freund, der Pferde reitet, wettet auf sie werden (eine Relativsatzkonstruktion) . - Wenn jemand die Überzeugung ausdrückt, daß Mary John heiraten wird, könnte eine andere Person mit der Zustimmung antworten Ich glaube das, gefolgt von einer Wiederholung der ausgedrückten Überzeugung, daß Mary John heiraten wird - was zu der einzelnen Behauptung Ich glaube, daß Mary John heiraten wird verkürzt wird (eine Satzergänzungskonstruktion). - Komplexe Konstruktionen können sich auch aus Redesequenzen ursprünglich getrennter Äußerungen ableiten, wie in Ich möchte das... Ich kaufe es, was sich zu Ich möchte es kaufen entwickelt (eine Infinitivergänzungskonstruktion).

47 Givön 1979, obwohl in vielen Fällen die historischen Aufzeichnungen nicht detailliert genug sind, um sich auf die Einzelheiten verlassen zu können. 322

Auf der zweiten Ebene werden Wortketten mit vielen Silben auf eine kleinere Anzahl von Wörtern mit weniger Silben reduziert. Ein einfaches englisches Beispiel betrifft den Futurmarker gonna als Verschmelzung von going und to. Ursprünglich wurde going als Bewegungsverb verwendet, häufig in Kombination mit der Präposition to, um den Zielort anzuzeigen (Im going to the store), manchmal aber auch, um eine intendierte Handlung anzuzeigen, die das »going to« ermöglichte (Why are you going to London? I'm going to see my bride [Warum fährst du nach London? Ich werde (dort) meine Braut treffen]). Diese Konstruktion wurde später zu Im gonna VERB, wobei gonna nicht genau die Absicht ausdrückt, in der Zukunft etwas Bestimmtes zu tun, sondern nur die Zukünftigkeit (ohne daß dabei eine Bewegung oder eine Absicht notwendig wäre).48 Dieses zusätzliche Element - der Begriff einer Absicht, die in der ursprünglichen Konstruktion nur als mögliche Implikation enthalten war - kann nur dann aus dem gemeinsamen Hintergrund zwischen den Sprechern hervorgehen, wenn solche Dinge auf die übliche Weise gesagt werden. Andere bekannte Beispiele sind folgende: - Der wichtigste Futurmarker im Englischen stammt vom vollständig lexikalischen Verb will, wie in I will it to happen (Ich will, daß es geschieht). Dieser Ausdruck wurde dann an einem bestimmten Punkt zu so etwas wie It'll happen (wobei die volitionale Komponente von will »ausgebleicht« wurde). - Englische Phrasen wie on the top of und in the side of entwickelten sich zu on top of und inside o/und schließlich zu atop und inside. In einigen Sprachen können Beziehungswörter wie diese räumlichen Präpositionen auch als Kasus48 Siehe Bybee 2002. 323

marker an Nomen angehängt werden - in diesem Fall als mögliche Marker des Lokativs. - Im Französischen ist die wichtigste Verneinungspartikel der Ausdruck ne ... pas, wie in Je ne saispas. Gegenwärtig wird im gesprochenen Französisch das ne weniger häufig verwendet und pas wird zum wichtigsten Negationsmarker. Aber das Wort pas wurde zu einer bestimmten Zeit für »Schritt« verwendet, so daß der Ausdruck so etwas wie das deutsche »kein Stück« oder »keinen Schritt weiter« bedeutet. Ein entscheidender Teil dieses Prozesses ist die Verbreitung und Weitergabe solcher Änderungen in der Sprachgemeinschaft (etwa die Verbreitung einer Innovation aus Gründen des sozialen Prestiges usw.).49 Für unsere Darstellung ist jedoch die Tradierung über Generationen hinweg von besonderer Bedeutung. Erinnern wir uns, daß wir bei der Erklärung der Entstehung sprachlicher Konventionen in der Evolution des Menschen eine »Drift zum Arbiträren« postuliert hatten, ausgehend von der Tatsache, daß Außenstehende, denen ein Teil des gemeinsamen Hintergrunds als Basis für die »Natürlichkeit« fehlt, Schwierigkeiten haben, die kommunikativen Zeichen anderer zu verstehen und aufzugliedern. Bei der Grammatik scheint etwas Ähnliches zu geschehen. Kinder hören Äußerungen und wollen einfach lernen, die Dinge so zu tun wie die Erwachsenen; die »natürlichen« Wurzeln des Verhaltens der Erwachsenen sind ihnen gänzlich unbekannt bzw. gleichgültig. Wenn sie also Äußerungen hören, deren Bestandteile kaum zu vernehmen sind oder fehlen (oder wenn sie sie noch nicht kennen), verstehen sie die Funktionsweise einer Äußerung (das heißt, welche Teile der Äußerung wel49 Croft 2000. 324

chen Kommunikationsfunktionen dienen) womöglich anders als der Erwachsene, der sie produziert. Diesen Prozeß nennt man funktionale Reanalyse. Er ergibt sich aus der Tatsache, daß die Verstehenden üblicherweise zweierlei gleichzeitig tun. Einerseits versuchen sie die globale Bedeutung der Äußerung zu verstehen: Was soll ich, nach dem Willen des Sprechers, tun, wissen oder fühlen? Darüber hinaus beteiligen sie sich aber auch an einer Art von »Verantwortungszuweisung«: Welche Rolle spielt jeder der inneren Konstituenten der Äußerung in der globalen Bedeutung? Wenn beispielsweise ein Kind einen Erwachsenen sagen hört »I'd better go«, könnte es sein, daß es das -d nicht so gut hört und einfach annimmt, daß better ein bloßes modales Hilfswort wie must ist, so wie in »I must go« oder »I should go« oder »I can go«. Eine solche Verantwortungszuweisung unterscheidet sich von der des Erwachsenen, und daher wird better, wenn es viele sich ähnlich verhaltende Kinder gibt, zu einem bestimmten historischen Zeitpunkt ein modales Hilfswort wie must in der englischen Sprache insgesamt werden. Diese Art von Reanalyse geschieht ständig, und häufig breitet sie sich durch Analogie auf verwandte Konstruktionen aus.50 Der Zyklus, den wir beschrieben haben, sieht also in etwa so aus, wie in Abbildung 6.2 dargestellt. Automatisierung > Reduktion

Kombination von Konstruktionen in der Rede

Reanalyse bei der Weitergabe

Abbildung 6.2 50 Eine gründliche Diskussion dieser Prozesse findet sich in Croft 2000. 325

Wenn die Vorhersagbarkeit aufgrund eines soliden gemeinsamen Hintergrunds hoch ist, automatisieren und reduzieren die Sprecher Konstruktionen, was neuen Lernenden (die dann eine Reanalyse vornehmen können) manchmal Schwierigkeiten bereitet. Diese reduzierten, reanalysierten Formen werden dann in der Rede kombiniert, und der ganze Prozeß beginnt von neuem. Ebenso, wenn abstrakte Konstruktionen von Kindern anhand von Gebrauchsmustern der Erwachsenen (re)konstruiert werden müssen, kann es auch dann zu einer »Verschleifung« bei der Weitergabe kommen, wenn die Gebrauchsmuster der Erwachsenen sich wesentlich ändern - so daß die Kinder am Ende gegenüber den Erwachsenen leicht verschiedene Konstruktionen haben. Wenn beispielsweise englischsprachige Erwachsene ein unregelmäßiges Past-Tense eines Verbs weniger häufig verwenden (zum Beispiel sneak-snuck (schleichen) und dive-dove (tauchen)), tendieren die Kinder dazu, es zu einem regelmäßigen zu machen (zum Beispiel sneaked und dived), weil viele und häufige Beispiele nötig sind, um unregelmäßige Formen zu verankern, die vom vorherrschenden Muster abweichen. Mit der Zeit wird dies zu einem Wandel führen.51 Wie bei fast jedem Aspekt meiner hier vorgelegten Darstellung sprachlicher Kommunikation habe ich stark vereinfacht und wichtige Details ausgelassen. Der Grund hierfür ist, daß wir an dieser Stelle nur so viel von dem Prozeß verstehen müssen, um zwei wichtige Punkte hervorheben zu können, die für die gegenwärtige Darstellung, die sich auf Prozesse geteilter Intentionalität stützt, von besonderer Bedeutung sind. Erstens kann die Konventionalisierung der Grammatik, wie wir sie beschrieben haben, nur dann stattfinden, wenn Kommunizierende und Empfänger das gemeinsame Ziel erfolgreicher Kommunikation haben. Wir haben daher das Ergebnis 51 Bybee 1995. 326

der Grammatikalisierungsprozesse als eine Art von Kompromiß zwischen den Bedürfnissen des Kommunizierenden und denen des Empfängers beschrieben. Dieser Kompromiß ist nur möglich, wenn die beiden Beteiligten zusammen auf das gemeinsame Ziel hinarbeiten, daß der Empfänger die Botschaft des Kommunizierenden erfolgreich versteht und jeder der Beteiligten im Auge hat, was der andere tut, während sie auf dieses gemeinsame Ziel hinarbeiten, so daß beispielsweise der Empfänger jeweils Verständnis oder Unverständnis signalisieren und der Kommunizierende die Formulierung der Botschaft entsprechend anpassen kann. Dieser Prozeß unterscheidet sich von jener Art von Kompromiß zwischen Kommunizierendem und Empfänger, der für die Kommunikation von Menschenaffen charakteristisch ist und in Kapitel 2 beschrieben wurde. In dieser hat jedes Individuum sein eigenes individualistisches Ziel, und nur diejenigen Signale überleben, die beiden dieser individualistischen Ziele angemessen dienen. Als schlagenden Beleg dafür können wir noch einmal an die Tatsache erinnern, daß unserer Kenntnis nach keine nichtmenschliche Spezies jemals nach einer Erläuterung einer kommunikativen Botschaft fragt oder eine solche für einen Empfänger modifiziert. Zweitens hängen Etablierung und Wandel grammatikalischer Konstruktionen - insbesondere der über die Zeit hinweg stattfindende Prozeß der Reanalyse - entscheidend davon ab, wie der gemeinsame Hintergrund und die gemeinsame Aufmerksamkeit funktionieren. Insbesondere werden Aspekte sprachlicher Kommunikation, die aufgrund eines soliden gemeinsamen Hintergrunds vorhersagbar sind (und die offenkundig ikonisch oder kompositional sein könnten), in ihrer Form reduziert, da die Sprecher in der Lage sind, den gemeinsamen Hintergrund auch bei einem schwachen sprachlichen Signal zu verwenden, um die geeigneten Schlüsse bezüglich der intendierten Botschaft zu ziehen. Für die 327

Eingeweihten ist das eine gute Sache, aber für Außenstehende, wie etwa Kinder, werden dadurch die sprachlichen Formulierungen undurchsichtiger, und deshalb müssen sie einfach auf arbiträre Weise (und unvollkommen) Form-Funktionszuordungen lernen. Dabei vollziehen sie einen Prozeß der Verantwortungszuweisung - das heißt, sie bestimmen, welche Teile der Konstruktion welche Unterfunktionen ausüben der sich von dem reifer Sprecher unterscheiden kann. Dementsprechend lautet unser spezifischer Vorschlag, daß die Konventionalisierung grammatikalischer Konstruktionen - die Grammatikalisierung und ähnliche Prozesse - nur von solchen Spezies vollzogen werden kann, die über kognitive Fertigkeiten zur Konstruktion eines gemeinsamen Hintergrunds unter der Bedingung geteilter Aufmerksamkeit verfügen, und nur von solchen Gemeinschaften, die soziologisch gesehen komplex genug sind, so daß verschiedene Individuen jeweils einen anderen gemeinsamen Hintergrund miteinander haben.52 Das deutet auf folgendes hin: Wenn wir verschiedene »sprachliche« Affen zusammenbrächten und sie sogar einige ihrer »sprachlichen« Zeichen verwenden würden, um miteinander zu kommunizieren, würden diese Zeichen und ihre Kombinationen keinerlei historische Entwicklung aufweisen, weil Affen nicht die Art von gemeinsamem begrifflichem Hintergrund miteinander konstruieren, in dessen Rahmen dieser Prozeß stattfindet. Ohne Gefahr zu laufen, sich in Widersprüche zu verstrikken, läßt sich behaupten, daß die menschlichen Fertigkeiten sprachlicher Kommunikation vielfältig sind und sich aus mehreren Quellen speisen. Die grundlegenden Aspekte, die in der kooperativen Kommunikation eine Rolle spielen, sind hauptsächlich evolutionären Prozessen geschuldet, aber die tatsächliche Ausformung jener sprachlichen Konventionen und 52 Croft 2000. 328

Konstruktionen, die Menschen verwenden, um ihre Interaktionen in einzelnen Sprachen untereinander zu strukturieren, beruhen sowohl auf transindividuellen kulturgeschichtlichen Prozessen als auch auf psychologischen Prozessen während der Ontogenese des sozialen Lernens, der gemeinsamen Aufmerksamkeit, der Analogie usw. Die geteilte Intentionalität, die der Kommunikation mit einem gemeinsamen Ziel im Kontext eines gemeinsamen begrifflichen Hintergrunds inhärent ist, schafft - in Kombination mit verschiedenen menschlichen Dispositionen zur Informationsverarbeitung und Automatisierung - die Möglichkeit zur Spracherzeugung und zum Sprachwandel in einzelnen Sprachgemeinschaften über kulturgeschichtliche Zeiträume hinweg.

6.4.3 Sprachuniversalien und Sprachverschiedenheit Es ist eine empirische Tatsache, daß verschiedene kulturelle Gruppen sehr verschiedene Mengen sprachlicher Konventionen und Konstruktionen konventionalisiert haben, und zwar in manchen Fällen aufgrund sehr verschiedener grammatikalischer Prinzipien. Es ist möglich, alle diese verschiedenen sprachlichen Konventionen und Konstruktionen in einige Kategorien aus der klassischen und modernen formalen Sprachwissenschaft hineinzuzwängen. Es ist jedoch überhaupt nicht klar, ob das angemessen wäre. Alle Linguisten sind sich einig, daß es nicht mehr angemessen ist, alle europäischen Sprachen in die lateinische Grammatik hineinzuzwängen, wie wir es einst taten. Und ebensowenig angemessen ist es noch, alle unsere jüngst entdeckten »exotischen« Sprachen unter die Kategorien klassischer europäischer Grammatiken wie Subjekt und direktes Objekt, Relativsätze usw. bringen zu wollen. 329

Sprachwissenschaftliche Typologen untersuchen sprachliche Verschiedenheit, und diejenigen, die nicht darauf versessen sind, alle Sprachen in ein europäisches Prokrustesbett zu zwängen, berichten über eine unglaubliche Palette eigenartiger Hilfsmittel, die verschiedene sprachliche Gemeinschaften zur grammatikalischen Strukturierung ihrer Äußerungen verwenden.53 Ein Blick auf die allgemeinste Ebene reicht aus, um festzustellen, daß manche Sprachen viele kleine morphologische Wortendungen enthalten, während andere gar keine aufweisen. Manche Sprachen zergliedern komplexe Ereignisse und Ideen in viele kleine Einheiten, von denen jede durch ein separates Wort bezeichnet wird, andere drücken komplexe Ereignisse und Ideen in einem einzigen komplexen Wort aus. Eine Sprache verwendet die Kategorien des Subjekts und des direkten Objekts, eine andere nicht. In manchen Sprachen kommen ganz eindeutige Klassen von Nomen und Verben vor, andere hingegen beschränken sich mehr oder weniger auf eine einzige Klasse, deren Elemente beide Rollen spielen können (wie die englischen Wörter brush [Bürste, bürsten] und kiss [Kuß, küssen]). Manche Sprachen haben eine Vielzahl eingebetteter Strukturen, etwa Relativsätze, andere sehr wenige. Es gibt Sprachen mit Nominalphrasen, deren Bestandteile zusammenstehen (wie in »der große, grüne Fisch«), während in anderen die Bestandteile über den ganzen Satz verstreut sind. Manche enthalten die eine oder andere Klasse von Präpositionen, Hilfsverben, Modalverben, Konjunktionen, Artikeln, Adverbien, Interjektionen, Ergänzungen, Pronomen, bei anderen fehlen eine oder mehrere dieser Klassen. Schließlich haben wir Sprachen, die es den Sprechern ermöglichen, referentielle Ausdrücke einfach ungehindert auszulassen, wenn der Bezugsgegenstand im Kontext implizit enthalten ist (Ellipse), andere tun das nicht. 53 Croft 2003. 330

Diese Dinge kratzen nur im Vorbeigehen an der Oberfläche all der Wunder, die in den verschiedenen Sprachen der Welt im Überfluß vorhanden sind. Es gibt aber auch sprachliche Universalien, nur sind sie nicht so unkompliziert, wie man einst glaubte. Sie betreffen nämlich nicht spezifische syntaktische Hilfsmittel oder Konstruktionen, sondern vielmehr allgemeine Einschränkungen oder zu erfüllende Funktionen. Einer der Gründe für viele Sprachuniversalien ist beispielsweise, daß Menschen, die eine beliebige Sprache sprechen, die Welt auf ähnliche Weise konzeptualisieren, nämlich in Begriffen von so etwas wie Akteuren, die auf Dinge einwirken, Dingen, die sich von Orten weg- oder zu Orten hinbewegen, Ereignissen, die andere Ereignisse verursachen, Menschen, die Dinge besitzen, Menschen, die wahrnehmen, denken und fühlen, Menschen, die miteinander interagieren und kommunizieren. All dies beinhaltet eine elementare Ereignis-Teilnehmer-Unterscheidung. Ein anderer Grund ist, daß Menschen, die eine beliebige Sprache sprechen, auch eine große Menge von Kommunikationsfunktionen teilen, weil sie ähnliche soziale Intentionen und Motive haben: etwas von anderen zu verlangen, andere über etwas Nützliches zu informieren und Gefühle und Einstellungen mit anderen zu teilen, um nur die allgemeinsten Motivklassen zu nennen. Dazu kommt, daß Menschen, die eine beliebige Sprache sprechen, die Aufmerksamkeit der anderen auf ähnliche Weise manipulieren, indem sie zum Beispiel Dinge, die sich schon im Aufmerksamkeitsfeld befinden (Themen), anders behandeln als Dinge, die neu hinzukommen (Fokusse). Menschen auf der ganzen Welt lernen und verarbeiten Informationen zudem auf ähnliche Weise mittels visueller Wahrnehmung, Kategorisierung, Analogie, Automatisierung, Gedächtnisfunktionen und kulturellem Lernen, wodurch sich Beschränkungen für jegliche sprachliche Kommunikation, für die Konventionalisierung und den 331

Spracherwerb ergeben. Auch besitzen Menschen auf der ganzen Welt denselben stimmlich-auditiven Apparat und verarbeiten stimmlich-auditorische Informationen auf ähnliche Weise. Und im Hinblick auf die Dimensionen der Dinge, auf die wir uns hier konzentriert haben - Fertigkeiten und Motive individueller und geteilter Intentionalität - , sind sich die Menschen auf diesem Planeten ebenfalls ähnlich und haben eine gemeinsame Evolutionsgeschichte von Zeigegesten und Gebärdenspiel im Rahmen kooperativer Kommunikationshandlungen. In diesem Zusammenhang stellt sich die Frage, ob sich darüber hinaus spezifisch sprachliche und grammatikalische Prinzipien, die nicht auf allgemeinen Prozessen menschlicher Kognition und Kommunikation beruhen, in der menschlichen Spezies entwickelt haben. Der bekannteste Vorschlag dieser Art ist natürlich die Chomsky sehe Universalgrammatik. Ursprünglich war die Hypothese ziemlich übersichtlich, bestand die Universalgrammatik doch nur aus solchen rein sprachlichen Dingen wie Nomen, Verben und elementaren Regeln der europäischen Grammatik. Als jedoch deutlich wurde, daß dies zu vielen nichteuropäischen Sprachen nicht paßte, wurde sie abgeändert, um sehr abstrakte sprachliche Gegenstände einzubeziehen, die angeblich die universale komputationale Struktur der Sprache darstellten - Dinge wie die Subjazenz-Bedingung, das Prinzip der leeren Kategorien, das Theta-Kriterium, das Projektionsprinzip usw. Nachdem sich jedoch herausgestellt hatte, daß diese Dinge durch und durch theorieabhängig sind und die Theorie sich als falsch erwies, kam ein neuer Vorschlag auf den Tisch, dem zufolge es lediglich ein einziges, spezifisch sprachliches, komputationales Prinzip gibt - nämlich die Rekursion und daß dieses Prinzip möglicherweise nicht einmal spezifisch sprachlich ist.54 54 Hauser, Chomsky und Fitch 2002. 332

Die Chomsky sehe Hypothese einer angeborenen Universalgrammatik läßt sich daher derzeit nicht kohärent formulieren.55 Zweifellos gibt es allgemeine komputationale Beschränkungen dafür, wie Sprachen erzeugt, erworben und verändert werden können, und es gibt sogar konditionale Universalien dergestalt, daß eine Sprache, die die Funktion X auf diese Weise erfüllt, fast immer die Funktion Y auf jene Weise erfüllt.56 Die Frage ist jedoch, ob wir eine angeborene Universalgrammatik brauchen, um solche Tatsachen zu erklären. In jüngeren Untersuchungen wurde vielen dieser Beschränkungen und konditionalen Beziehungen durch die allgemeinen Bedingungen der menschlichen Informationsverarbeitung Rechnung getragen57 oder durch die Weise, wie sich Menschen bei verschiedenen Konstruktionen auf bestimmte Dinge konzentrieren, um Informationen zu gewinnen.58 Demnach spiegeln universale komputationale Beschränkungen, die für alle Sprachen gelten, allgemeine kognitive, soziale und stimmlich-auditive Prinzipien und Beschränkungen wider, die der psychologischen Funktionsweise des Menschen inhärent sind. Sprachen wurden innerhalb der Beschränkungen bereits existierender menschlicher Kognition und Sozialität geschaffen. Sind diese Beschränkungen erst einmal hinreichend gut verstanden, werden sie nach unserer Hypothese alles liefern, was nötig ist. Die Evolution einer bestimmten Art von angeborener syntaktischer Schablone, etwa einer Universalgrammatik, ist wohlgemerkt nicht unmöglich; es gibt nur gegenwärtig keine empirischen Belege dafür, keine präzise theoretische Formulierung dieser Grammatik und überhaupt 55 56 57 58

Tomasello 2004. Greenberg 1963. Hawkins 2004. Goldberg 2006. 333

keine Notwendigkeit für sie - wenn die Natur der Sprache angemessen verstanden wird. Obwohl viele Aspekte der sprachlichen Kompetenz des Menschen sich in der Tat biologisch entwickelten, ziehen wir also den Schluß, daß spezifische grammatikalische Prinzipien und Konstruktionen keine solche Entwicklung erfahren haben. Universalien in der grammatikalischen Struktur verschiedener Sprachen entstanden aus allgemeineren Prozessen und Beschränkungen der menschlichen Kognition, Kommunikation und stimmlich-auditiven Verarbeitung, die während der Konventionalisierung und Tradierung einzelner grammatikalischer Konstruktionen seitens einzelner Sprachgemeinschaften abliefen. Die Frage, warum Gruppen von Menschen jeweils ihre eigenen sprachlichen Konventionen schaffen, einschließlich der grammatikalischen, die sich so unglaublich schnell mit der Zeit verändern, ist nicht so leicht zu beantworten. Aber möglicherweise handelt es sich um ein Spiegelbild allgemeinerer Kulturprozesse - Menschen werden geboren, um nachzuahmen und den Mitmenschen in ihrer Umgebung ähnlich zu werden - , und die Sprache ist nur eine von vielen Manifestation davon. Die einleuchtendste Erklärung dieses allgemeinen Musters liefert das Bedürfnis von Menschengruppen, sich von anderen Gruppen zu unterscheiden, und tatsächlich ist die Sprache ein Haupthindernis für Außenstehende, später in ihrem Leben vollwertige Mitglieder einer Kulturgruppe zu werden (eine Art kultureller Isolationsmechanismus). Umgekehrt ist, wie oben dargelegt, die Sprachverwendung - einschließlich des Zusammenführens von individuellen Erfahrungen und Einstellungen zu gemeinsamen Erfahrungen in Erzählungen - eine grundlegende Strategie, mittels deren Kulturgruppen ihre eigenen inneren Gruppenidentitäten schaffen. Viele Veränderungen der grammatikalischen Struktur ergeben sich aus dem unvermeidlichen Durcheinander, wenn Kinder abstrakte Kon334

struktionen aus individuellen Fällen des Sprachgebrauchs rekonstruieren, da jedes Kind verglichen mit jedem anderen leicht unterschiedliche sprachliche Erfahrungen macht.59

6.4.4 Zusammenfassung Im modernen Diskurs der Kognitionswissenschaften gibt es eine fundamentale Zweideutigkeit bezüglich dessen, was wir meinen, wenn wir die Begriffe »Grammatik« oder »Syntax« verwenden. Tatsächlich gibt es eine ganze Reihe neuerer Untersuchungen, in denen menschliche Kleinkinder oder nichtmenschliche Primaten wiederkehrende Muster in Strömen von synthetisierten Lauten entdecken. Dies wird meistens als »Grammatiklernen« bezeichnet (vorsichtigere Forscher verwenden den Ausdruck »statistisches Lernen«), obwohl die Laute keinerlei Bedeutung oder kommunikative Signifikanz haben. Mein Gebrauch des Begriffs »Grammatik« ist ein anderer. Aus meiner Sicht setzt eine Grammatik allermindestens intentionale Kommunikation voraus, und dann strukturieren grammatikalische Hilfsmittel und Konstruktionen aus mehreren Einheiten bestehende Äußerungen auf funktional sinnvolle Weisen. Konventionelle grammatikalische Hilfsmittel und Konstruktionen sind genau wie einfache Konventionen zum Beispiel Wörter, kulturgeschichtliche Produkte, die von konkreten Kulturgruppen zur Erfüllung ihrer Kommunikationsbedürfnisse geschaffen werden. Sprachuniversalien werden von Gemeinsamkeiten im sozialen, kognitiven und stimmlich-auditiven Rohmaterial hervorgebracht, die den Konventionalisierungsprozeß sowohl ermöglichen als auch beschränken. Nach Bates gibt es Sprachuniversalien, weil Menschen auf der ganzen Welt ähnliche Kommunikations59 Croft 2000. 335

aufgaben bewältigen müssen und dafür ähnliche kognitive und soziale Werkzeuge verwenden.60 Für den Versuch, die Evolution der sprachlichen Kommunikation des Menschen im Rahmen seiner kooperativen Kommunikation im allgemeinen zu rekonstruieren, besteht die Herausforderung darin, daß es zwischen den Gruppen moderner Menschen sowohl Unterschiede als auch Universalien gibt. Dieser Umstand spiegelt vermutlich eine weit in der Vergangenheit liegende Situation wider, in der es irgendwo in Afrika eine Gruppe moderner Menschen gab, die einen ziemlich großen Schritt in Richtung moderner stimmlicher Sprachen machte. Wie groß dieser Schritt war, wissen wir nicht. Als dann aber Untergruppen dieser größeren Gruppe sich über die ganze Welt auszubreiten begannen, konventionalisierten sie ihre eigenen sprachlichen Konventionen und Konstruktionen. Alle diese Gruppen behielten natürlich dieselben kognitiven, sozio-kognitiven, kommunikativen und stimmlich-auditiven Fähigkeiten bei, und deshalb wurde der Konventionalisierungsprozeß auch für alle auf ähnliche Weise beschränkt.

6.5 Schlußfolgerung Woher kommt Grammatik? Die Antwort lautet: aus vielen Richtungen und Orten. Bereits Menschenaffen reihen Gesten in Sequenzen aneinander, um mit anderen zu kommunizieren. »Sprachliche« Affen produzieren sogar richtige Kombinationen, in denen sie ihre intendierte Botschaft in mehrere Elemente gliedern, häufig in Ereignisse und Teilnehmer. Die kognitive Maschinerie dazu - was wir einfache Syntax genannt haben - hat also sehr tiefreichende evolutionäre 60 Bates 1979. 336

Wurzeln. Und solange das beteiligte Kommunikationsmotiv bloßes Auffordern ist - ich will, daß du etwas hier und jetzt tust - , bedarf es keiner komplexeren grammatikalischen Strukturierung von Äußerungen. Sobald die kooperative Kommunikation und das Informationsmotiv entstanden - strukturiert durch einen gemeinsamen Hintergrund und kommunikative Absichten wurde die Kommunikationsweise der Menschen viel komplexer. Die Grammatik des Informierens erfordert zusätzliche Hilfsmittel, um die einzelnen Ereignisse und Teilnehmer zu spezifizieren, über die gesprochen wird (die eventuell in komplexen, aber kohärenten Konstituenten zusammengefaßt werden, welche im gegenwärtigen Rahmen gemeinsamer Aufmerksamkeit verankert sind), und um die Rollen zu markieren, die sie in dem Ereignis oder in der Situation spielen, über das oder über die gesprochen wird. Wenn ich eine ganze Ereignisfolge erzählen muß - um beispielsweise wiederzugeben, was mir gestern auf der Jagd passierte - , ist eine Grammatik des Teilens und der Erzählung erforderlich, die noch mehr grammatikalische Hilfsmittel beinhaltet, um Ereignisse aufeinander zu beziehen und die Teilnehmer über diese Ereignisse hinweg zu verfolgen. Die evolutionären Wurzeln der Grammatiken des Informierens und des Teilens in Erzählungen leiten sich von elementaren Kompetenzen kooperativer Kommunikation und ihrer komplexen Infrastruktur der geteilten Intentionalität ab. Jedoch werden die tatsächlichen grammatikalischen Konventionen natürlich nicht von evolutionären Prozessen geschaffen; sie sind das Produkt kulturgeschichtlicher Prozesse (der »unsichtbaren Hand«), die wir die Konventionalisierung grammatikalischer Konstruktionen genannt haben. Die grammatikalischen Konstruktionen moderner menschlicher Sprachen sind daher Produkte einer langen und komplexen Reihe von Ereignissen in der Geschichte des 337

Menschen, an der sowohl evolutionäre als auch kulturelle Prozesse beteiligt sind - die den Beschränkungen einer Vielfalt allgemeiner kognitiver und sozio-kognitiver Prozesse unterliegen. Ein Großteil davon vollzog sich in der gestischen Modalität, was erklärt, warum heutzutage Zeichensprachen so leicht entstehen. Die Schaffung und Modifikation grammatikalischer Konstruktionen ist nach meiner Auffassung nur deshalb möglich, weil Menschen miteinander im Sinne einer gemeinsamen Tätigkeit mit einem gemeinsamen Ziel kommunizieren und der Kommunizierende vieles ungesagt läßt, wenn angenommen werden kann, daß es zum gemeinsamen Hintergrund gehört und somit vom Empfänger durch praktisches Schließen erschlossen werden kann; daher gelangen Individuen, die außerhalb dieses Kokons gemeinsamer Aufmerksamkeit stehen, recht häufig zu neuen Analysen darüber, welche Teile der Äußerung welche Funktionen erfüllen. Selbst in den spätesten Stadien der Sprachentwicklung gehören die grundlegenden Fertigkeiten und Motive der geteilten Intentionalität, mit denen Menschen den Weg der kooperativen Kommunikation einschlugen, immer noch zum Kern dieses Prozesses.

338

7 Von Affengesten zur Sprache des Menschen

Unsere Rede erhält durch unsere übrigen Handlungen ihren Sinn. Ludwig Wittgenstein, Über Gewißheit

Ich habe angekündigt, daß es eine komplizierte Geschichte werden würde, und eine solche ist es nun auch geworden. Aber sehr markante und komplexe phänotypische Ergebnisse, wie die kooperative Kommunikation des Menschen, haben fast immer verwickelte und weitschweifige Evolutionsgeschichten. Und sehr markante und komplexe kulturelle Ergebnisse, wie die konventionellen menschlichen Sprachen, haben fast immer verwickelte und weitschweifige Kulturgeschichten, die darauf aufgebaut sind. Ich habe mich daher entschieden, diese ganze Komplexität der Wirklichkeit selbst zuzuschreiben, obwohl es natürlich gut möglich ist, daß wir einfach nicht alles hinreichend gut verstehen, um die verborgene Einfachheit zu entdecken. Jedenfalls versuche ich es nun ein letztes Mal mit der Einfachheit, indem ich zuerst das allgemeine Argument auf wenigen Seiten zusammenfasse und dann unsere drei Hypothesen aus Kapitel 1 erneut betrachte, um zu sehen, wie es um sie steht. Ich schließe mit einigen Gedanken über die Sprache als geteilte Intentionalität.

7.1 Zusammenfassung des Arguments Eine Zusammenfassung des allgemeinen Arguments dieses Buches (die sich ungefähr an den einzelnen Kapiteln orientiert) könnte folgendermaßen aussehen.

339

Der Weg zur kooperativen Kommunikation des Menschen beginnt mit der intentionalen Kommunikation der Menschenaffen, wie sie sich insbesondere in Gesten manifestiert. - Affen lernen viele ihrer Gesten (durch ontogenetische Ritualisierung) und setzen sie daher flexibel, ja absichtlich ein, einschließlich der Beobachtung der Aufmerksamkeit bestimmter anderer. Das steht in völligem Kontrast zu ihren ungelernten, unflexiblen, emotionalen Vokalisierungen, die unterschiedslos in die Welt ausgesendet werden. - Affen benutzen ihre gelernten, absichtlichen Gesten immer, um Handlungen von anderen, darunter auch Menschen, zu erbitten bzw. zu verlangen. Sie setzen ihre Intentionsbewegungen ein, um solche Handlungen direkt zu fordern, und ihre Aufmerksamkeitsfänger, um sie indirekt zu fordern, das heißt, sie verwenden sie, um die Aufmerksamkeit des anderen so zu lenken, daß er etwas Bestimmtes sehen und infolge dessen etwas Bestimmtes tun wird. Die gelernten Aufmerksamkeitsfänger von Affen sind möglicherweise die einzigen intentionalen Kommunikationsakte in der Tierwelt, die auf der Grundlage dieser zweigeteilten Intentionalität funktionieren: daß der andere etwas sieht und infolge dessen etwas tut. - Dem Verstehen und der Produktion dieser Gesten liegen Fertigkeiten des Verstehens individueller Intentionalität zugrunde - das Verstehen, daß andere Ziele und Wahrnehmungen haben - , und daraus ergibt sich eine Art von praktischem Schließen über die Handlungen anderer sowie möglicherweise auch darüber, warum sie etwas tun. Die Kommunizierenden und die Empfänger haben jeweils ihre eigenen, voneinander verschiedenen Ziele im Kommunikationsprozeß, es gibt keine gemeinsamen Ziele.

340

Die kooperative Kommunikation des Menschen ist komplexer als die intentionale Kommunikation von Affen, weil ihre zugrundeliegende sozio-kognitive Infrastruktur nicht nur Fertigkeiten des Verstehens individueller Intentionalität, sondern auch Fertigkeiten und Motivationen geteilter Intentionalität umfaßt. - Die grundlegende kognitive Fertigkeit geteilter Intentionalität ist das rekursive Erkennen geistiger Zustände. Wenn diese Fertigkeit bei bestimmten sozialen Interaktionen eingesetzt wird, erzeugt sie gemeinsame Ziele und gemeinsame Aufmerksamkeit, die den gemeinsamen begrifflichen Hintergrund bereitstellen, innerhalb dessen menschliche Kommunikation auf natürlichste Weise stattfindet. - Die grundlegenden Motive geteilter Intentionalität sind Helfen und Teilen. Wenn sie bei kommunikativen Interaktionen zum Tragen kommen, erzeugen sie die drei grundlegenden Motive menschlicher kooperativer Kommunikation: das Auffordern (Hilfe verlangen), das Informieren (Hilfe in Form nützlicher Informationen anbieten) und das Teilen von Gefühlen und Einstellungen (soziale Bindungen durch die Erweiterung des gemeinsamen Hintergrunds herstellen). - Wechselseitige Annahmen (und sogar Normen) der Kooperation und die Grice'sche kommunikative Absicht werden erzeugt, wenn das rekursive Erkennen geistiger Zustände auf die Kooperationsmotive angewendet wird: Wir wissen beide wechselseitig, daß wir kooperativ sind (und es vom Standpunkt der sozialen Gruppe auch sein sollten). Das führt miteinander interagierende Menschen dazu, auf das Ziel erfolgreicher Kommunikation hin zusammenzuarbeiten und nicht nur praktische, sondern auch kooperative Schlußfolgerungen vorzunehmen und dabei Schlüsse kommunikativer Relevanz zu ziehen. 341

- Nichtsprachlich kommunizieren Menschen, indem sie die Zeigegeste verwenden, um die visuelle Aufmerksamkeit anderer zu lenken; und sie verwenden ikonische Gesten (Gebärdenspiel), um die Einbildungskraft anderer zu steuern. Diese beiden Gestentypen können als »natürliche« Kommunikation betrachtet werden, da sie jeweils die natürliche Neigung des Empfängers ausnutzen, der Blickrichtung zu folgen und die Handlungen anderer als intentionale zu interpretieren. Diese einfachen Gesten übermitteln Botschaften auf komplexe Weise, da sie in zwischenmenschlichen Situationen verwendet werden, in denen die Beteiligten einen gemeinsamen begrifflichen Hintergrund als Interpretationszusammenhang haben sowie sich wechselseitige Kooperationsbereitschaft unterstellen. - »Arbiträre« Kommunikationskonventionen, einschließlich sprachlicher Konventionen, stützen sich auf dieselbe kooperative Infrastruktur wie »natürliche« menschliche Gesten. In der Tat leiten sie sich ursprünglich von diesen natürlichen Gesten durch eine »Drift zum Arbiträren« ab, wenn Neulinge den instrumentellen Gebrauch ikonischer Gesten erwerben, deren Ikonizität sie nicht voll erfassen. Die Ontogenese der gestischen Kommunikation von Kleinkindern, insbesondere der Zeigegesten, liefert Belege für die verschiedenen Komponenten der hypothetisch angenommenen kooperativen Infrastruktur und stellt eine Verbindung zur geteilten Intentionalität her, und zwar vor dem Beginn des Spracherwerbs. - Studien zu Zeigegesten von Kleinkindern demonstrieren die entscheidende Rolle der Infrastruktur geteilter Intentionalität: des Rahmens gemeinsamer Aufmerksamkeit und des gemeinsamen Hintergrunds; der drei grundlegenden Motive des Aufforderns, des Informierens und des 342

-

-

-

-

Teilens; und mit etwas geringerer Deutlichkeit der kommunikativen Absicht und kooperativen Normen. Die Zeigegeste von Kleinkindern tritt während ihrer Entwicklung erst mit ihren sich herausbildenden Fertigkeiten geteilter Intentionalität bei gemeinschaftlichen Tätigkeiten auf - und nicht vorher, obwohl viele andere Voraussetzungen schon früher vorliegen - , und das Auftreten dieser Gesten geht jeder wesentlichen Fertigkeit im Umgang mit einer konventionellen Sprache voraus. Die ikonischen Gesten von Kleinkindern folgen ihren ersten Zeigegesten unmittelbar nach und erfordern eine kommunikative Absicht, um wirksam zu sein (sonst erscheinen sie bloß als leere Handlungen); sie werden rasch durch die konventionelle Sprache ersetzt (während Zeigegesten durch die Entstehung der Sprache nicht ersetzt werden), weil sowohl ikonische Gesten als auch sprachliche Konventionen symbolische Weisen des Hinweisens auf Bezugsgegenstände sind. Der ontogenetische Übergang von Gesten zu konventionellen Formen der Kommunikation, einschließlich der Sprache, stützt sich ebenfalls wesentlich auf die Infrastruktur geteilter Intentionalität - insbesondere auf die gemeinsame Aufmerksamkeit bei gemeinschaftlichen Tätigkeiten - , um den gemeinsamen Hintergrund für das Erlernen von »arbiträren« Kommunikationskonventionen zu schaffen. Der ontogenetische Übergang von Gesten zur Sprache beweist die gemeinsame Funktion von (1) Zeigegesten und Demonstrativa (etwa dieses und jenes) und (2) von ikonischen Gesten und inhaltstragenden Wörtern (etwa Nomen und Verben).

Die menschliche kooperative Kommunikation entstand phylogenetisch als Teil einer umfassenderen Anpassung für gemeinschaftliche Tätigkeit und das Kulturleben im allgemeinen. 343

- Die Fertigkeiten und Motive der Menschen bezüglich geteilter Intentionalität entstanden anfangs innerhalb des Kontexts von mutualistischen gemeinschaftlichen Tätigkeiten, wobei Fertigkeiten des rekursiven Erkennens geistiger Zustände zur Bildung gemeinsamer Ziele führten, die dann die gemeinsame Aufmerksamkeit auf Dinge hervorbrachten, welche für diese gemeinsamen Ziele relevant waren. Menschenaffen beteiligen sich nicht an gemeinschaftlichen Tätigkeiten dieser Art und haben deshalb keine menschenähnlichen Fertigkeiten und Motive geteilter Intentionalität. - Zeigegesten und Gebärden entstanden zuerst als Mittel, um die gemeinschaftliche Tätigkeit effizienter zu koordinieren, und zwar ursprünglich durch Aufforderungen, daß der andere etwas Bestimmtes tun soll - die Einwilligung wurde dadurch gesichert, daß diese Handlung beiden Beteiligten einen Vorteil verschaffte. Anfangs wurden solche kooperativen Kommunikationsakte nur innerhalb des Kontexts von gemeinschaftlichen Tätigkeiten verwendet; daher war ihre intentionale Struktur durch und durch kooperativ. Der Einsatz von Fertigkeiten kooperativer Kommunikation außerhalb gemeinschaftlicher Tätigkeiten (zum Beispiel zum Zweck des Lügens) kam erst später hinzu. - Das Anbieten von Hilfe durch Informieren könnte tatsächlich durch Prozesse indirekter Reziprozität entstanden sein, in denen Menschen versuchten, einen Ruf als gute Kooperationspartner zu erwerben. Dadurch wurde ein öffentlicher Raum wechselseitiger Erwartungen bezogen darauf geschaffen, wie kooperative Kommunikation funktionieren sollte. - Das Teilen von Gefühlen und Einstellungen mit anderen könnte als ein Mittel zur Herstellung sozialer Bindungen und zur Erweiterung des gemeinsamen Hintergrunds innerhalb der sozialen Gruppe entstanden (und an kulturelle 344

Gruppenselektion gebunden) sein. Die tatsächlichen Normen, die die kooperative Kommunikation steuern, haben dabei ihren Ursprung in Gruppensanktionen für mangelnde Kooperation. - Fertigkeiten der Imitation ermöglichten es den Menschen, ikonische Gesten, die als Holophrasen gebraucht wurden, zu erzeugen und von anderen zu erwerben (was kommunikative Absichten erfordert, um überhaupt in Gang zu kommen). Diese ikonischen Gesten erfahren im Prozeß der Tradierung auf ganz natürliche Weise eine »Drift zum Arbiträren«, wenn Menschen beteiligt sind, die weniger in den gemeinsamen Hintergrund eingebunden sind. Auf diese Weise werden Kommunikationskonventionen geschaffen. - Der Wechsel zu völlig arbiträren stimmlichen Konventionen war schließlich nur möglich, weil diese Konventionen zuerst in Verbindung mit handlungsbasierten Gesten verwendet wurden (bzw. auf deren Rücken mittransportiert wurden), die auf natürlichere Weise eine Bedeutung hatten. Die grammatikalische Dimension der sprachlichen Kommunikation des Menschen besteht in der Konventionalisierung und kulturellen Weitergabe sprachlicher Konstruktionen - gestützt auf allgemeine kognitive Fertigkeiten sowie auf Fertigkeiten geteilter Intentionalität und Imitation um die funktionalen Anforderungen der drei grundlegenden Kommunikationsmotive zu erfüllen. Das führt zu einer Grammatik des Aufforderns, einer Grammatik des Informierens und einer Grammatik des Teilens und der Erzählung. - Affen verwenden Sequenzen von Gesten, und »sprachliche« Affen kombinieren tatsächlich Gesten auf ein einziges Kommunikationsziel hin und gliedern Erfahrungen in Er345

-

-

-

-

eignisse und Teilnehmer auf. Diese grundlegenden grammatikalischen Fertigkeiten sind somit als Ausgangspunkt für die Evolution der grammatikalischen Kompetenz des Menschen »gegeben«. Wenn »sprachliche« Affen - und daher vielleicht auch sehr frühe Menschen - Äußerungen mit mehreren Einheiten produzieren, verwenden sie diese fast immer für Aufforderungen, die typischerweise nur »dich und mich im Hier und Jetzt« betreffen; es gibt also keinen funktionalen Druck für ernstzunehmende syntaktische Markierungen. Diese Affen und die frühen Menschen verfüg(t)en demnach nur über eine Grammatik des Aufforderns. Mit der Entstehung der Informationsfunktion und bei Bezugsgegenständen, die räumlich und zeitlich entfernt sind, entsteht ein Bedürfnis nach grammatikalischen Hilfsmitteln, um (1) abwesende Referenten zu identifizieren, indem man sie im gegenwärtigen Rahmen gemeinsamer Aufmerksamkeit verankert (eventuell unter Verwendung von mehrteiligen Konstituenten), (2) die Rollen der Teilnehmer syntaktisch zu markieren und (3) um auffordernde von informierenden Kommunikationsmotiven zu unterscheiden. Diese funktionalen Anforderungen fuhren zu einer Grammatik des Informierens. Mit der Entstehung des Motivs des Teilens und dem Aufkommen von Äußerungen, die die Funktion haben, komplexe Abfolgen von Ereignissen zu schildern, die räumlich und zeitlich entfernt sind, entsteht ein Bedürfnis nach grammatikalischen Hilfsmitteln, um (1) Ereignisse mit einem zeitlichen Index zu versehen und sie aufeinander zu beziehen und um (2) Teilnehmer über verschiedene Ereignisse hinweg zu verfolgen. Diese funktionalen Erfordernisse fuhren zu einer Grammatik des Teilens und der Erzählung. Die besonderen grammatikalischen Konstruktionen ein-

346

zelner Sprachen werden durch einen Konventionalisierungsprozeß (Grammatikalisierung und andere Prozesse) in kulturgeschichtlichen Zeiträumen geschaffen und hängen entscheidend von gemeinsamen Zielen der Kommunikation, einem gemeinsamen begrifflichen Hintergrund und bestimmten elementaren Prozessen der Kognition und Informationsverarbeitung ab. Die hier beteiligten Prozesse auf der Gruppenebene erzeugen außerdem die Normativität von Konstruktionen als »grammatische« Konstruktionen.

7.2 Hypothesen und Probleme In Kapitel 1 habe ich drei Hypothesen über die Ursprünge der menschlichen Kommunikation vorgeschlagen: (1) Die menschliche kooperative Kommunikation entwickelte sich anfangs im Bereich der Gesten (Zeigegesten und Gebärdenspiel); (2) diese Entwicklung wurde durch Fertigkeiten und Motivationen geteilter Intentionalität potenziert, welche sich ihrerseits ursprünglich im Kontext von gemeinschaftlichen Tätigkeiten entwickelten; (3) völlig arbiträre sprachliche Konventionen konnten nur im Kontext von intrinsisch sinnvollen, gemeinschaftlichen Tätigkeiten entstehen, die durch »natürliche« Formen der Kommunikation wie Zeigegesten und Gebärdenspiel koordiniert wurden. Wir sind nun in der Lage einzuschätzen, wie es um diese drei Hypothesen steht. Was die Gesten betrifft, so hat eine Reihe von Theoretikern schon seit langem vorgeschlagen, daß in ihnen der erste Schritt der Menschen auf dem evolutionären Weg zur Sprache zu sehen ist.1 Diese Autoren haben eine Reihe von evolu1 Hewes 1973, Corballis 2002, Kendon 2004, Armstrong und Wilcox 2007. 347

tionstheoretischen Argumenten für diese These vorgetragen, die zum größten Teil mit verschiedenen Vorteilen der visuellmanuellen Modalität zu tun haben. Ebenfalls von Bedeutung sind die Tatsachen, daß Kleinkinder, bevor sie mit dem Sprechen anfangen, in sinnvoller Weise durch Gesten kommunizieren, und daß gehörlose Kinder, die keinen Kontakt mit einer Zeichensprache haben, schon früh auf komplexe Weise zu kommunizieren beginnen, indem sie erfundene Gesten benutzen. Außerdem fällt es Menschen, die keine Kommunikationskonventionen mit anderen teilen - angefangen bei Besuchern eines fremden Landes bis hin zu den Schöpfern der Nicaragua-Zeichensprache - , relativ leicht, mit der Kommunikation durch Gesten zu beginnen. Innerhalb weniger Generationen und unter den geeigneten sozialen Bedingungen können diese am Ende sogar zu etwas konventionalisiert werden, das wie eine ausgewachsene menschliche Sprache aussieht. Wären Menschen nur an eine stimmliche Sprache angepaßt, würde es sich bei diesen Erfindungen von Gesten um unglaubliche und nahezu unerklärliche Erweiterungen der Kernfähigkeit handeln. Wären Menschen dagegen zuerst für so etwas wie die gestische Kommunikation angepaßt worden und hätte die stimmliche Modalität erst später die Leitung übernommen, ließen sich diese Erfindungen von Gesten viel leichter erklären. Ich habe dem zwei weitere Argumente hinzugefügt, nämlich ein empirisches und ein theoretisches. Das empirische Argument lautet, daß alle vier Spezies von Menschenaffen Gesten auf sehr flexible Weise lernen und einsetzen. Das steht in bemerkenswertem Kontrast zu ihren ungelernten, unflexiblen Vokalisierungen. Sie verwenden ihre Gesten auch mit einer gewissen Sensibilität für den Aufmerksamkeitszustand bestimmter Empfänger und gebrauchen sogar bestimmte Aufmerksamkeitsfängergesten, die schon zwischen zwei Intentionsebenen unterscheiden - der referentiellen und der 348

sozialen Ebene. All dies kündigt eindeutig die ganze raffinierte Lenkung der Aufmerksamkeit an, die bei der menschlichen referentiellen Kommunikation stattfindet. Im Anschluß daran kann man sich leicht vorstellen, wie sich diese flexiblen Gesten zu menschlichen Zeige- und ikonischen Gesten entwickelt haben, die bereits vor der stimmlichen Sprache die grundlegendsten Merkmale menschlicher kooperativer Kommunikation verkörperten. Jedoch ist zu beachten, daß die Vokalisierungen von Menschenaffen nicht so gründlich untersucht worden sind - die große Mehrheit der Untersuchungen zu Vokalisierungen von Primaten konzentrierte sich auf kleine Affen; dieser Bereich verdient daher in Zukunft eindeutig mehr Aufmerksamkeit seitens der Forschung. Die Aufmerksamkeitsfänger von Menschenaffen, möglicherweise besonders diejenigen, bei denen es um externe Gegenstände geht (und die Zeigegesten gegenüber Menschen umfassen), müssen ebenfalls weiter erforscht werden. Das theoretische Argument besagt, daß nur sehr schwer zu sehen ist, wie Menschen direkt von affenähnlichen Vokalisierungen, die im Grunde mit den Emotionen des Kommunizierenden verbunden sind, zu eigens geschaffenen, gelernten und wechselseitig bekannten Kommunikationskonventionen hätten übergehen können, die von allen Mitgliedern einer Gruppe geteilt werden. Um diesen Punkt etwas drastischer darzustellen, verwendete ich ein etwas groteskes Gedankenexperiment nichtsprachlicher Kinder auf einer einsamen Insel, die entweder nicht vokalisieren oder nicht gestikulieren konnten. Die Kinder, die nicht vokalisieren konnten, würden beispielsweise einen heraufziehenden Sturm durch ihr Gebärdenspiel darstellen und ganz ordentlich kommunizieren; es ist jedoch schwierig, sich vorzustellen, daß die Kinder, die nicht gestikulieren konnten, ohne weiteres stimmliche Konventionen schaffen würden - zumal Vokalisierungen dazu tendieren, die Aufmerksamkeit auf das Subjekt und dessen 349

emotionalen Zustand und keineswegs auf äußere Bezugsgegenstände zu ziehen. Der Vorschlag lautete daher, daß der Pfad zu stimmlichen Konventionen des Menschen durch ein Zwischenstadium von auf natürliche Weise sinnvollen, handlungsbasierten Gesten hindurchgehen mußte, die sich auf die natürlichen Neigungen des Menschen stützen, der Blickrichtung anderer zu folgen und ihre Handlungen als intentionale zu interpretieren. Ja, ich habe sogar dafür argumentiert, daß stimmliche Konventionen kommunikative Bedeutung ursprünglich nur annahmen, weil sie auf dem Rücken von natürlich sinnvollen Gesten transportiert bzw. mit diesen zusammen redundant verwendet wurden. Für die zweite Hypothese - geteilte Intentionalität als Grundlage für menschliche kooperative Kommunikation gibt es zwei Stränge empirischer Belege und ein paar theoretische Argumente. Der erste Strang empirischer Belege ergibt sich aus dem Vergleich von Menschenaffen und Menschen. Experimentelle Untersuchungen, von denen ein Großteil in Abschnitt 2.4 rekapituliert wurde, zeigen, daß Menschenaffen individuelle Intentionalität verstehen. Manche Forscher glauben, unsere Einschätzung sei hier zu großzügig und daß Affen und andere nichtmenschliche Tiere nur über einfache Verhaltensregeln verfügen, um vorherzusagen, was die anderen in bestimmten Situationen tun werden.2 Unserer Ansicht nach sprechen die Untersuchungen jedoch für sich selbst, indem sie für alle wichtigen Punkte konvergierende Belege unter Verwendung mehrerer verschiedener Methoden liefern.3 Außerdem scheint unsere Analyse der gestischen Kommunikation von Affen auch im Einklang mit einem Verständnis individueller Intentionalität zu sein. Im Gegensatz 2 Povinelli und Vonk 2006. 3 Siehe ein systematischeres Argument dazu bei Tomasello und Call, im Druck. 350

zu diesen überzeugenden Belegen für ein Verständnis individueller Intentionalität gibt es jedoch keine experimentellen Belege dafür, daß Menschenaffen sich an kollektiver Intentionalität beteiligen, da ihre gleichzeitigen Tätigkeiten in Studien nicht die Struktur menschlicher Zusammenarbeit aufzuweisen scheinen und sie auch nicht auf menschenähnliche Weise an gemeinsamer Aufmerksamkeit teilhaben. In diesem Fall gibt es Forscher, die meine Einschätzung für zu negativ halten; beispielsweise glaubt Boesch, daß Beobachtungen des Jagdverhaltens von Schimpansen in der Natur dessen gemeinschaftliches Wesen nachweisen.4 Für den Nachweis zugrundeliegender kognitiver Prozesse sind jedoch Beobachtungen in der Natur nicht ausreichend; wir brauchen experimentelle Studien. Und die Studien, die durchgeführt wurden - fairerweise muß gesagt werden, daß es nicht besonders viele davon gibt - , haben zwar die Fähigkeit der Affen nachgewiesen, sich in Problemlösungssituationen mit anderen abzustimmen, nicht aber, im Zuge dessen gemeinsame Ziele, gemeinsame Pläne und gemeinsame Aufmerksamkeit mit ihnen auszubilden. Negative Ergebnisse aus Studien sind natürlich immer schwer zu interpretieren, und deshalb ist die experimentelle Untersuchung der Zusammenarbeit von Menschenaffen ein weiterer Bereich, der ganz dringend größerer wissenschaftlicher Aufmerksamkeit bedarf. Da Menschenaffen sich im allgemeinen nicht an wirklich gemeinschaftlichen Tätigkeiten beteiligen, ist ihre Kommunikation meiner Hypothese zufolge im Grunde ebenfalls individualistisch - genauso wie die Kommunikation anderer Säugetiere. Ihre intentionale Kommunikation richtet sich ausschließlich darauf, Aufforderungen zu machen. Es gibt einige Beobachtungen von Menschenaffen, die auf Weisen kommunizieren, die von prototypischen Aufforderungen 4 Boesch 2005. 351

abzuweichen scheinen. Beispielsweise berichten Forscher, die »sprachliche« Affen trainiert haben, typischerweise über einige Äußerungen, die verwendet werden, wenn der Affe anscheinend überhaupt nichts will. Hier sind jedoch experimentelle Untersuchungen nötig, da einer akzeptablen Alternativhypothese zufolge Affen ihre Fertigkeit einfach dadurch ausüben, daß sie etwas »benennen«, wenn sie es sehen - ohne irgendeinen prosozialen Wunsch zu haben, andere über etwas Nützliches zu informieren oder deklarativ mit ihnen Gefühle oder Einstellungen zu teilen. Ein weiteres Beispiel liefern die verschiedenen Studien, die zeigen, daß Affen auf den Ort eines verborgenen Werkzeugs zeigen, wenn sie Futter haben wollen und ein Mensch das versteckte Werkzeug finden muß, um das Futter für sie zu holen (siehe die Literaturhinweise in Abschnitt 2.3). Man könnte zwar sagen, daß sie den Menschen hier informieren, aber da Affen anscheinend solche Zeigegesten nicht benutzen, wenn der Mensch nur etwas für sich selbst will (die Forschung dazu ist noch nicht abgeschlossen) - und sie etwas Derartiges gewiß nicht für Artgenossen machen - , könnte man dies auch als so etwas wie »sozialen Werkzeuggebrauch« verstehen: zu verlangen, daß der Mensch das Werkzeug für den Affen holen und benutzen soll. Zudem ist nirgendwo belegt, daß Affen einen gemeinsamen Hintergrund oder wechselseitige Erwartungen von Hilfsbereitschaft benutzen oder etwa die Gricesche kommunikative Absicht verstehen, da sie regelmäßig daran scheitern, einfache Relevanz-Schlußfolgerungen in Studien zu ziehen, in denen ihr Verständnis der menschlichen Zeigegeste geprüft wird (siehe Abschnitt 2.3). Auf jeden Fall wird durch unsere Interpretation dieser beiden Datensätze über die Zusammenarbeit und Kommunikation von Menschenaffen nahegelegt, daß Menschenaffen sich nicht an wirklich gemeinschaftlichen Tätigkeiten oder echter kooperativer Kommunikation beteiligen. Da Menschen an beidem teilha352

ben und da von einem theoretischen Gesichtspunkt aus beide Tätigkeiten kooperative Fertigkeiten und Motive beinhalten, ist es eine plausible Hypothese, daß diese beiden Fertigkeiten eine gemeinsame psychologische Infrastruktur geteilter Intentionalität aufweisen. Diese gemeinsame Infrastruktur deutet auf einen gemeinsamen evolutionären Ursprung beider Fertigkeiten hin. Der zweite Strang von Belegen für die zentrale Rolle geteilter Intentionalität stammt aus der Ontogenese des Menschen. Kleinkinder sind physisch dazu in der Lage, mit ihren Händen und ihrem Körper schon recht früh in ihrer Entwicklung Zeigegesten und Gebärden zu machen. Außerdem scheinen sie zumindest über einige Motive zu verfügen, die die kooperative Kommunikation erfüllen könnte, zum Beispiel andere durch Aufforderungen dazu zu bringen, etwas Bestimmtes zu tun (und vielleicht auch, Gefühle zu teilen). Sie beteiligen sich jedoch nicht an kooperativer Kommunikation, bis sie beinahe ein Jahr alt sind; das ist nun wiederum genau dasselbe Alter, in dem sie Fertigkeiten geteilter Intentionalität bei ihren gemeinschaftlichen Tätigkeiten mit anderen Personen zu zeigen beginnen. Die zeitliche Übereinstimmung ist hier nicht so eindeutig, weil sich eine ganze Reihe von Dingen ungefähr um den ersten Geburtstag herum ereignet, aber dieses gleichzeitige Auftauchen in der Entwicklung gibt gewiß sehr zu denken. Ab dem ersten Geburtstag weisen außerdem die Zeigegesten und anderen Gebärden von Kleinkindern Anzeichen der Verwendung eines gemeinsamen Hintergrunds, kooperativer Motive und möglicherweise auch wechselseitiger Annahmen von Kooperativität und der Griceschen kommunikativen Absicht auf - obwohl hier sicherlich weitere Forschung nötig ist. Wie schon zuvor, als es um die Affen ging, kommen auch hier die Kritiker wieder aus beiden Richtungen. Obwohl sie diese Fragen nicht spezifisch behandeln, gibt es einige Klein353

kindforscher, die sehr wahrscheinlich glauben, daß Kleinkinder sich tatsächlich viel früher an so etwas wie kooperativer Kommunikation beteiligen, als sich an der Zeigegeste im Alter von einem Jahr ablesen läßt.5 Dagegen gibt es andere Theoretiker, die denken, daß wir zu großzügig sind, wenn wir die Zeigegesten von einjährigen Kindern so interpretieren, als manipulierten sie die geistigen Zustände anderer auf altruistische Weise.6 Aber wie im Fall der Menschenaffen handelt es sich hier hauptsächlich um Forscher, die sich stärker auf Beobachtungen in der Natur als auf experimentelle Studien konzentrieren, und wir glauben, daß die gegenwärtige experimentelle Forschung, wie sie in Kapitel 4 referiert wurde, unsere Position bezüglich der mentalistischen und altruistischen Struktur der frühen Kommunikation stützt. Es gibt gewiß keine experimentellen Untersuchungen, die gegen diese Schlußfolgerung sprechen. Die wichtigsten theoretischen Argumente für geteilte Intentionalität als Basis menschlicher kooperativer Kommunikation stammen aus den philosophischen Analysen der Kommunikation, die von Klassikern wie Wittgenstein, Grice und Lewis und zeitgenössischeren Denkern wie Sperber und Wilson, Clark, Levinson und Searle geliefert wurden.7 Ich beanspruche gewiß nicht, theoretisch irgend etwas geleistet zu haben, das über ihre Einsichten bedeutend hinausgeht. Ich habe lediglich versucht, anhand ihrer wegweisenden Ideen etwas Neues zusammenzubauen, indem ich sie auf die Kommunikationstätigkeiten von Menschenaffen, menschlichen Kindern und vielleicht unserer menschlichen Vorfahren angewandt habe. Der zentrale, vereinheitlichende Begriff dafür 5 Zum Beispiel Trevarthen 1979. 6 Carpendale und Lewis 2004. 7 Wittgenstein 1953/2008, Grice, 1957/1977, 1975/1979, Lewis 1969/ i975> Sperber und Wilson 1986, Clark 1996, Levinson 1995, 2006, Searle 1969/1983,1995/1997354

ist so etwas wie das rekursive Erkennen geistiger Zustände (wie beispielsweise in Tabelle 3.1 zusammengefaßt). Wir sehen also, daß sich das Verstehen von Intentionen und Aufmerksamkeit seitens der Menschenaffen in gemeinsame Intentionen, gemeinsame Aufmerksamkeit und kommunikative Absichten von Menschen verwandelt; wir sehen, daß sich die Kooperationsmotive der Menschen für das Kommunizieren in wechselseitige Annahmen und sogar Normen der Kooperation verwandeln; und wir sehen, daß sich die »natürlichen« Kommunikationsgesten der Menschen zu menschlichen Kommunikationskonventionen wandeln. Diese Wandlungen ergeben sich alle aus einer bestimmten Art von rekursiv strukturiertem, gegenseitigem Verstehen zwischen zwei oder mehreren Menschen, von denen jeder weiß, daß der andere weiß usw., wobei dieser Prozeß endlos hin- und her geht zumindest dann, wenn man ihn aus einer bestimmten Perspektive betrachtet. Der Begriff wechselseitigen Wissens wurde im Kontext der Kommunikation zuerst von Lewis bei seiner Analyse koordinierender Konventionen verwendet.8 Sperber und Wilson sind unzufrieden mit den Konnotationen wechselseitigen Wissens (da sie Gewißheit implizieren). Sie ziehen es deshalb vor, von wechselseitigen kognitiven Umgebungen und wechselseitiger Offenkundigkeit zu reden, um einige derselben Einsichten zu erfassen.9 Clark optiert für die Rede von einem gemeinsamen Hintergrund als neutralere Weise, das Phänomen zu beschreiben, und Searle spricht einfach von der kollektiven oder der Wir-Intentionalität.10 Es gibt eine umfangreiche Debatte darüber, ob der Begriff der Rekursivität bei alledem wirklich notwendig ist oder ob es nicht sinnvol8 Lewis 1969/1975. 9 Sperber und Wilson 1986. 10 Clark 1996, Searle 1995/1997. 355

ler wäre, die Wir-Intentionalität in all ihren verschiedenen Formen als etwas psychologisch nicht weiter Analysierbares ohne die ganze Hin- und Herbewegung zu beschreiben. Meine eigene Meinung dazu ist, daß es davon abhängt, was wir zu erklären versuchen: ob wir die Wir-Intentionalität als theoretischen Grundbegriff oder als etwas behandeln, das von einer Hin- und Herbewegung zwischen Individuen abgeleitet ist. Wenn wir erklären, wie derzeit lebende Menschen in Echtzeit vorgehen, ist es möglich, daß dabei tatsächlich kein Begriff von Rekursivität eine Rolle spielt, sondern daß Menschen einfach einen primitiven Begriff von Wir-Intentionalität besitzen. In der Tat glaube ich, genau das trifft für junge Kleinkinder zu; sie unterscheiden einfach Situationen, in denen wir die Aufmerksamkeit bezüglich einer Sache teilen, von Situationen, in denen wir das nicht tun. Mit fortschreitender Entwicklung werden jedoch die verschiedenen individuellen Perspektiven, die im Teilen verkörpert sind, explizit gemacht (vermutlich auf der Grundlage von holprigen Interaktionen, bei denen sich herausstellt, daß Dinge, die man zu teilen meinte, tatsächlich nicht geteilt werden), vielleicht so, wie es sich Barresi und Moore vorstellen.11 Zuvor habe ich als Beleg für die Rekursivität die Tatsache angeführt, daß bei dem Hin und Her auf verschiedenen Ebenen Störungen vorkommen können - und Menschen diagnostizieren diese auf verschiedene Weise und beheben sie dementsprechend ebenfalls verschieden aber die derzeit vorliegenden Daten für diese Hypothese sind nicht so zahlreich. Und wenn wir uns der Evolution zuwenden, halte ich es für äußerst unplausibel zu postulieren, daß die Wir-Intentionalität mit allem Drum und Dran als eine einmalige Neuerung entstand. Es ist vielmehr so gut wie sicher, daß es eine Zeit gab, in der Individuen so etwas wie »er sieht, daß ich es sehe« zu verstehen begannen i i Barresi und Moore 1996. 356

und sich die volle Rekursivität dieses Verstehens erst später manifestierte. Im Hinblick auf die dritte Hypothese über den Ursprung von Kommunikationskonventionen im besonderen habe ich schließlich behauptet, daß völlig arbiträre Kommunikationskonventionen wie diejenigen in der gesprochenen Sprache nur durch die Vermittlung von »natürlicheren«, handlungsbasierten Gesten innerhalb gemeinschaftlicher Interaktionen entstanden sein konnten: gemeinschaftliche Interaktionen, die durch gemeinsame Aufmerksamkeit strukturiert wurden und so die natürliche Neigung der Menschen, der Blickrichtung anderer zu folgen und Handlungen intentional zu interpretieren, ausnutzten. Die besten Belege hierfür stammen vielleicht aus der frühen Kindersprache. Obwohl junge Kleinkinder bereits mit wenigen Monaten vollkommen dazu in der Lage sind, Laute und Erfahrungen miteinander zu assoziieren (und sogar Vokalisierungen zu imitieren), fangen sie mit dem Erwerb sprachlicher Konventionen erst an, wenn sie um den ersten Geburtstag herum damit beginnen, sich mit anderen an gemeinschaftlichen Tätigkeiten zu beteiligen, die von gemeinsamer Aufmerksamkeit strukturiert werden. Tatsächlich korreliert die Beteiligung von Kleinkindern an solchen Tätigkeiten quantitativ sehr stark damit, wie schnell sie ihre ersten Kommunikationskonventionen erwerben.12 Für konventionelle Kommunikation sind natürlich ebenfalls solide Fertigkeiten der Handlungsimitation erforderlich - möglicherweise sogar Imitation durch Rollentausch - , um sicherzustellen, daß die Konventionen über Generationen hinweg tradiert werden und es ein wechselseitiges Wissen davon gibt, daß sie von allen geteilt werden, die an diesem kulturgeschichtlichen Prozeß teilhaben. Im Übergang zur Grammatik scheint der Gebrauch von 12 Siehe den Überblick bei Tomasello 2003. 357

Zeigegesten und anderen Gesten eine entscheidende Verbindung bereitzustellen, obwohl natürlich heute lebende Kinder sowohl kommunikative als auch grammatikalische Konventionen mit großem Eifer direkt erwerben, einfach um wie die anderen zu sein. Daher können sie diese ohne jegliche Unterstützung durch natürliche Gesten erwerben, wenn der Rahmen gemeinsamer Aufmerksamkeit stark genug ist. Gehörlose Kinder, die mit ihren Eltern idiosynkratische Kommunikationskonventionen in Form von Home-Sign-Gebärdensprachen erfinden, müssen bei Interaktionen gezwungenermaßen mit natürlichen Gesten auf der Basis gemeinsamer Aufmerksamkeit beginnen, ansonsten würde man sie nicht verstehen. Für jegliche Bewegung zum Arbiträren hin benötigen solche Zeichensysteme eine Gemeinschaft, in der sich eine wechselseitig bekannte, geteilte Lerngeschichte entwickeln kann (wie in der Nicaragua-Zeichensprache). Der Ursprung der Grammatik in der Evolution des Menschen war unserer Hypothese zufolge Teil eines einzigen Prozesses, in dem Menschen begannen, Kommunikationsmittel zu konventionalisieren. Es war also ein schrittweiser Prozeß, in dem neu entstehende Kommunikationsmotive des Informierens und Teilens bzw. Erzählens einen neuen funktionalen Druck auf Individuen ausübten, die voneinander bereits Dinge durch »natürliche« Gesten und dann durch holophrastische Konventionen verlangten. Als Reaktion darauf schufen Menschen konventionelle syntaktische Hilfsmittel zur grammatikalischen Strukturierung von mehrteiligen Äußerungen und erfüllten auf diese Weise die neuen Kommunikationsbedürfnisse, die durch das Informieren und Teilen angestoßen wurden. Diese Hilfsmittel wurden wiederum zu gestaltartigen Sprachkonstruktionen konventionalisiert: zu vorgefertigten Mustern sprachlicher Konventionen und syntaktischen Hilfsmitteln für wiederkehrende Kommunikationsfunktionen. Bemerkenswerterweise hängt der Prozeß, durch den 358

Sprachkonstruktionen konventionalisiert (grammatikalisiert) werden, entscheidend von Interagierenden ab, die ein gemeinsames Kommunikationsziel haben und in der Lage sind, miteinander die Form auszuhandeln, die die Äußerung annehmen soll, indem sie sich letztlich auf ihren gemeinsamen begrifflichen Hintergrund stützen. Die grammatikalische Dimension menschlicher kooperativer Kommunikation hatte ihren Ursprung sehr wahrscheinlich in Kombinationen von Zeigegesten und Gebärden innerhalb gemeinschaftlicher Tätigkeiten und bewegte sich aus diesem eingeschränkten Kontext auf dieselbe Weise heraus wie holophrastische Sprachkonventionen, nämlich durch eine »Drift zum Arbiträren«. Die Weitergabe grammatikalischer Konstruktionen über Generationen hinweg erfordert nicht einfach nur kulturelles Lernen und Imitation, sondern auch die Fähigkeit, Muster von Sprachverwendungen anhand von erlebten Handlungen sprachlicher Kommunikation zu (re)konstruieren. Insgesamt deutet die hier vorgelegte Analyse darauf hin, daß die menschliche Sprache am besten im Sinne von Bates als »eine aus alten Teilen gemachte, neue Maschine« verstanden wird.13 Obwohl es schwer ist, sich das im 21. Jahrhundert vorzustellen, hätte am Ende in der Tat eine andere Maschine stehen können, wenn sich einige ihrer Teile am Anfang anders entwickelt hätten. Es gibt nämlich viele Teile, und jedes Teil hat seine eigene kontingente Evolutionsgeschichte. Der vorliegenden Analyse zufolge verliehen Fertigkeiten zum Verstehen individueller Intentionalität Primaten-Individuen ursprünglich einen Wettbewerbsvorteil; Fertigkeiten zur Imitation von Handlungen entwickelten sich ursprünglich beim Werkzeuggebrauch und der Werkzeugherstellung des Menschen; gemeinsame Absichten und gemeinsame Aufmerksamkeit entwickelten sich ursprünglich im Kontext 13 Bates 1979. 359

menschlicher gemeinschaftlicher Tätigkeit; die Gricesche kommunikative Absicht entstand im Kontext wechselseitiger Kooperationserwartungen; menschliche Motive für das Informieren anderer über bestimmte Dinge entwickelten sich ursprünglich im Kontext der Sorge um den eigenen Ruf als hilfsbereites Mitglied der Gemeinschaft; menschliche Motive für das Teilen von Emotionen und Einstellungen entstanden ursprünglich im Kontext von Prozessen und Normen auf der Gruppenebene; menschliche Normen entstanden, um die Homogenität innerhalb der Gruppe im Kontext der kulturellen Gruppenselektion zu maximieren; menschliche Gesten haben zwar eine lange Geschichte bei den Menschenaffen, aber neue Gesten wie Zeigegesten und Gebärden entstanden in der Evolution des Menschen auf der Grundlage der natürlichen Neigung von Primaten, der Blickrichtung zu folgen und Handlungen als intentionale zu interpretieren; menschliche Kommunikationskonventionen entstanden in Situationen mit gemeinsamen Zielen, gestützt auf menschliche Fertigkeiten der Imitation durch Rollentausch und Kooperationsmotive, und werden auf der Grundlage von menschlichen Fertigkeiten zur sozialen Imitation weitergegeben; die stimmlichen Fertigkeiten des Menschen weisen zwar eine lange Geschichte bei den Menschenaffen auf, haben aber auch erst in jüngerer Zeit einzigartige Merkmale entwickelt, vermutlich um die konventionelle Kommunikation zu erleichtern (und damit vielleicht eingeborene Mitglieder unserer Gruppe zu identifizieren); menschliche Grammatikfertigkeiten haben tiefe Wurzeln in der Neigung von Primaten, Erfahrungen in Ereignisse und Teilnehmer aufzugliedern und Handlungen zu einem einzigen Ziel zu kombinieren; die Konventionalisierung grammatikalischer Konstruktionen findet oberhalb der Ebene von Individuen statt und hängt unter anderem von menschlichen Fertigkeiten geteilter Intentionalität, Nachahmung und stimmlich-auditiver Verarbeitung ab. Usw., usw. 360

Es ist ganz einfach so, daß sich die menschlichen Sprachen auch ganz anders hätten entwickelt können, wenn irgendwelche dieser Teile - aus irgendeinem der zahllosen evolutionären Gründe - signifikant anders gewesen wären. Vielleicht hätten wir uns so entwickeln können, daß wir nur Dinge von anderen durch den Gebrauch natürlicher Gesten verlangen könnten. Wir hätten Sprachkonventionen entwickeln können, aber nur, um Dinge zu verlangen, so daß wir nur eine einfache Syntax konventionalisiert hätten. Oder vielleicht hätten wir Sprachkonventionen und -konstruktionen entwikkeln können, um andere über nützliche Dinge zu informieren, aber nicht, um Ereignisse zu erzählen, die räumlich und zeitlich nicht gegenwärtig sind, so daß wir keine extravagante Syntax hätten, die komplexe Verbtempora und -aspekte oder Hilfsmittel zur Verfolgung von Bezugsgegenständen über Ereignisse hinweg enthalten. Noch spannender ist es, sich vorzustellen, wie die menschliche »Sprache« aussähe - falls wir sie dann überhaupt noch so nennen wollten - , wenn sie sich nicht im Kontext der Kooperation, sondern der Konkurrenz entwickelt hätte. In diesem Fall gäbe es keine gemeinsame Aufmerksamkeit und keinen gemeinsamen Hintergrund, und deshalb könnten Handlungen der Bezugnahme nicht auf menschenähnliche Weise vollzogen werden, jedenfalls nicht im Hinblick auf Perspektiven oder abwesende Gegenstände. Es gäbe keine kommunikative Absicht, die sich auf wechselseitige Annahmen der Kooperationsbereitschaft stützt, und daher auch keinen Grund für mich, herausfinden zu wollen, warum jemand mit mir zu kommunizieren versucht - und es gäbe keine Kommunikationsnormen. Es gäbe keine Konventionen, die nur entstehen können, wenn Personen ein gemeinsames, kooperatives Verständnis und Interesse haben. Und ohne die Motive des Informierens und Teilens könnte diese hypothetische kompetitive Form der »Sprache« nur für Zwang und Täuschung benutzt werden - und eigentlich nicht 361

einmal dafür, da die Kommunizierenden aus Mangel an Vertrauen nicht zusammenarbeiten könnten, um ihre Botschaft zu übermitteln. Daher könnte es im Grunde keine Sprache, wie wir sie kennen, auf der Grundlage von Konkurrenz geben. Und wenn die Kooperation sich anders entwickelt hätte, beispielsweise wie in den oben skizzierten Szenarien, wäre die Form der Sprache ebenfalls eine andere. In einfachen Worten: Wenn sich das menschliche Sozialleben in eine andere Richtung entwickelt hätte, hätten sich auch unsere Kommunikationsmittel anders entwickelt. Sich eine Sprache vorzustellen bedeutet, sich eine Lebensform vorzustellen, sagt Wittgenstein.

7.3 Sprache als geteilte Intentionalität Wenn man in einer Umfrage unter Wissenschaftlern und Laien fragen würde, was für die bemerkenswerte Komplexität der kognitiven Fähigkeiten, der sozialen Institutionen und der Kultur des Menschen verantwortlich ist, wäre die am häufigsten gegebene Antwort höchstwahrscheinlich: »Die Sprache«. Aber was ist Sprache? Da es geschriebene Sprache gibt, die angeschaut, immer wieder untersucht und dann in ein Regal gestellt werden kann, halten wir die Sprache, zumindest teilweise, intuitiv für eine Art von Gegenstand.14 Aber sie ist kein Gegenstand - zumindest nicht in irgendeinem interessanten Sinne - , jedenfalls nicht mehr als eine Universität oder eine Regierung oder ein Schachspiel ein Gegenstand in irgendeinem interessanten Sinne ist. In Searles Worten:15

14 Olson 1994. 15 Searle 1995, S. 36,1997, S. 46. 362

Im Fall gesellschaftlicher Gegenstände [...] [ist] der Prozeß früher als das Produkt. Gesellschaftliche Gegenstände werden immer [...] durch gesellschaftliche Handlungen konstituiert; und in einem bestimmten Sinn ist das Objekt genau die fortdauernde Möglichkeit der Aktivität.

Sprechhandlungen sind gesellschaftliche Handlungen, die eine Person absichtlich an eine andere richtet (und hervorhebt, daß sie dies tut), um deren Aufmerksamkeit und Vorstellungskraft auf bestimmte Weise zu lenken, so daß sie das tut, weiß oder fühlt, was die erste Person von ihr will. Diese Handlungen funktionieren nur dann, wenn beide Beteiligten mit einer psychologischen Infrastruktur von Fertigkeiten und Motivationen geteilter Intentionalität ausgestattet sind, die sich zur Erleichterung von Interaktionen mit anderen bei gemeinschaftlichen Tätigkeiten entwickelt hat. Die Sprache, oder besser die sprachliche Kommunikation, ist daher nicht irgendeine Art von formalem oder sonstigem Gegenstand; vielmehr ist sie eine Form gesellschaftlichen Handelns, konstituiert durch gesellschaftliche Konventionen, um gesellschaftliche Zwecke zu erreichen, welche zumindest auf einem gewissen geteilten Verstehen und geteilten Zielen der Benutzer beruhen. Menschliche Sprachen können, wie viele Kulturprodukte, ihrerseits zu weiteren Entwicklungen der ursprünglichen Fertigkeiten beitragen. Das gilt in wenigstens zwei grundlegenden Hinsichten. Erstens und ganz offensichtlich sind die moderne Zusammenarbeit zwischen Menschen und die moderne Kultur hauptsächlich deshalb so komplex, weil sie typischerweise über sprachliche Konventionen organisiert und tradiert werden. Die menschliche Zusammenarbeit beim Bau von Wolkenkratzern und bei der Gründung von Universitäten ist beispielsweise ohne konventionelle Formen der Kommunikation für das Setzen gemeinsamer Ziele und Unterziele sowie für die Formulierung der koordinierten Pläne zu ihrer 363

Verwirklichung nicht vorstellbar. Menschliche Zusammenarbeit ist zwar die ursprüngliche Heimstätte menschlicher kooperativer Kommunikation, aber dann erleichtert diese neue Form der Kommunikation in einer koevolutionären Spiralbewegung immer komplexere Formen der Zusammenarbeit. Zweitens und weniger offensichtlich führt die Beteiligung an konventioneller sprachlicher Kommunikation und anderen Formen geteilter Intentionalität die elementare menschliche Kognition in einige überraschende, neue Richtungen. Obwohl Kognitionswissenschaftler diese Tatsache als völlig selbstverständlich voraussetzen, sind Menschen die einzigen Wesen auf diesem Planeten, die die Welt anhand verschiedener potentieller Perspektiven auf ein und denselben Gegenstand konzeptualisieren, wodurch die sogenannten perspektivischen kognitiven Repräsentationen geschaffen werden.16 Der springende Punkt ist hier, daß diese einzigartigen Formen menschlicher Begriffsbildung entscheidend von geteilter Intentionalität abhängen, und zwar insofern, als der ganze Begriff der Perspektive einen Gegenstand voraussetzt, auf den wir uns gemeinsam konzentrieren und von dem wir wissen, daß wir ihn teilen, ihn aber auch aus verschiedenen Blickwinkeln betrachten.17 Perspektivische kognitive Repräsentationen, das ist von größter Wichtigkeit, sind kein Format menschlicher Begriffsbildung, das mit der Geburt gegeben ist, sondern werden vielmehr von Kindern konstruiert, wenn sie sich am Prozeß der kooperativen Kommunikation beteiligen - im Hin und Her verschiedener Arten von Diskursen, in denen verschiedene Perspektiven bezogen auf gemeinsame Themen ausgedrückt werden, die Teil des gemeinsamen begrifflichen Hintergrunds sind.18 Die kooperative Infrastruktur menschlicher Kommunikation, einschließlich 16 Tomasello 2002. 17 Perner, Brandl und Garnham 2003, Moll und Tomasello 2007b. 18 Tomasello und Rakoczy 2003. 364

der konventionellen sprachlichen Kommunikation, entsteht daher nicht nur aus der einzigartig kooperativen, kulturellen Weise des Lebens und Denkens der Menschen, sondern trägt auch zu ihr bei. Es gibt also viele Ursprünge der menschlichen kooperativen Kommunikation, und ihr Gipfelpunkt in Form von Fertigkeiten sprachlicher Kommunikation stellt ein weiteres Beispiel - vielleicht das grundlegende Beispiel - des Revolutionären Prozesses dar, durch den sich elementare kognitive Fertigkeiten phylogenetisch entwickeln. Dadurch wird historisch die Schaffung von Kulturprodukten ermöglicht, die dann sich entwickelnde Kinder mit den biologischen und kulturellen Werkzeugen versorgen, welche sie für ihre ontogenetische Entwicklung brauchen.

365

Literatur

Acredolo, L. P. & Goodwyn, S. W. (1988). Symbolic gesturing in normal infants. Child Development, 59,450-466. Akhtar, N., Carpenter, M. 8c Tomasello, M. (1996). The role of discourse novelty in early word learning. Child Development, 67, 635-645. Akhtar, N., Jipson, J., 8c Callanan, M. (2001). Learning words through overhearing. Child Development, 72,416-430. Armstrong, D., Stokoe, W. 8c Wilcox, S. (1995). Gesture and the Nature of Language. Cambridge: Cambridge University Press. Armstrong, D. 8c Wilcox, S. (2007). The Gestural Origin of Language. New York: Oxford University Press. Bakeman, R. 8c Adamson, L. (1984). Coordinating attention to people and objects in mother-infant and peer-infant interactions. Child Development, 55,1278-1289. Baldwin, D. (1991). Infants' contributions to the achievement of joint reference. Child Development, 62,875-890. Bard, K. 8c Vauclair, J. (1984). The communicative context of object manipulation in ape and human adult-infant pairs. Journal of Human Evolution, 13,181-190. Barresi, J. 8c Moore, C. (1996). Intentional relations and social understanding. Behavioral and Brain Sciences, 19(1), 107-129. Bates, E. (1979). The Emergence of Symbols: Cognition and Communication in Infancy. New York: Academic Press. Bates, E., Camaioni, L. 8c Völterra, V. (1975). The acquisition of performatives prior to speech. Merrill-Palmer Quarterly, 21,205224. Bateson, P. (1988). The biological evolution of cooperation and trust. In D. Gambetta (Hg.), Trust: Making and Breaking Cooperative Relations. Oxford: Blackwell. Behne, T., Carpenter, M., Call, J. 8c Tomasello, M. (2005). Unwilling versus unable? Infants' understanding of intentional action. Developmental Psychology, 41, 328-337. Behne, T., Carpenter, M. 8c Tomasello, M. (2005). One-year-olds comprehend the communicative intentions behind gestures in a hiding game. Developmental Science, 8,492-499. 367

Bergstrom, C. T. & Lachmann, M. (2001). Alarm calls as costly signals of anti-predator vigilance: The watchful babbler game. Ani-

mal Behavior, 6i(3), 535-543.

Bloom, P. (2000). How Children Learn the Meanings of Words. Cambridge, Mass.: MIT Press. Boesch, C. (2005). Joint cooperative hunting among wild chimpanzees: Taking natural observations seriously. Behavioral and Brain Sciences, 28, 692-693. Boesch, C. & Boesch, H. (1989). Hunting behavior of wild chimpanzees in the Tai Forest National Park. American Journal of Physical

Anthropology, 78(4)» 547-573-

Boesch, C. & Boesch-Achermann, H. (2000). The Chimpanzees of the Tai Forest: Behavioural Ecology and Evolution. Oxford: Oxford University Press. Boyd, R. & Richerson, P. (1985). Culture and the Evolutionary Process. Chicago: The University of Chicago Press. Braine, M. (1963). The ontogeny of English phrase structure. Language, 39,1-14. Bratman, M. (1992). Shared co-operative activity. Philosophical Review, 101(2), 327-341. Bräuer, J., Call, J. & Tomasello, M. (2005). All four great ape species follow gaze around barriers. Journal of Comparative Psychology, 119,145-154. Bräuer, J., Kaminski, J., Call, J. & Tomasello, M. (2006). Making inferences about the location of hidden food: Social dog—Causal ape. Journal of Comparative Psychology, 120, 38-47. Bretherton, L., Bates, E., McNew, S. & Shore, C. (1981). Comprehension and production of symbols in infancy. Developmental Psychology, 17, 728-736. Brinck, I. (2004). The pragmatics of imperative and declarative pointing. Cognitive Science Quarterly, 3(4), 1-18. Brooks, P., Tomasello, M., Lewis, L. & Dodson, K. (1999). Children's overgeneralization of fixed transitivity verbs: The entrenchment hypothesis. Child Development, 70,1325-1337. Brown, P. & Levinson, S. (1978). Universals in language usage: Politeness phenomena. In E. Goody (Hg.), Questions and Politeness. Cambridge: Cambridge University Press. Bruner, J. (1983). Child's Talk. New York: Norton; dt.: Wie das Kind sprechen lernt. Bern: Huber, 1987. 368

Bruner, J. (1986). Actual Minds, Possible Worlds. Cambridge, Mass.:

Harvard University Press. Bühler, K. (1934/1990). Theory of Language: The Representational

Function of Language. Übers, v. D. F. Goodwin. Amsterdam and Philadelphia: John Benjamins; dt.: Sprachtheorie. Jena: Fischer. Burling, R. (2005). The Talking Ape. Oxford: Oxford University Press. Buttelmann, D., Carpenter, M., Call, J. & Tomasello, M. (2007). Enculturated apes imitate rationally. Developmental Science, 10, F31-38.

Butterworth, G. (2003). Pointing is the royal road to language for babies. In: S. Kita (Hg.) Pointing: Where Language, Culture, and

Cognition Meet. Hillsdale, N.J.: Lawrence Erlbaum. Bybee, J. (1995). Regular morphology and the lexicon. Language and Cognitive Processes, 10,425-455.

Bybee, J. (2002). Sequentiality as the basis of constituent structure. In: T. Givön & B. Malle (Hg.), From Pre-language to Language. Amsterdam: John Benjamins. Call, J. (2004). Inferences about the location of food in the great apes (Pan paniscus, Pan troglodytes, Gorilla gorilla, Pongo pygmaeus). Journal of Comparative Psychology, 118, 232-241.

Call, J., Hare, B., Carpenter, M. & Tomasello, M. (2004). Unwilling or unable? Chimpanzees' understanding of intentional action. Developmental Science, 7,488-498.

Call, J. & Tomasello, M. (1994). The production and comprehension of referential pointing by orangutans. Journal of Comparative Psychology, 108, 307-317.

Call, J. & Tomasello, M. (1998). Distinguishing intentional from accidental actions in orangutans (Pongo pygmaeus), chimpanzees (Pan troglodytes), and human children (Homo sapiens). Journal of Comparative Psychology, 112(2), 192-206.

Call, J. & Tomasello, M. (2005). What chimpanzees know about seeing, revisited: An explanation of the third kind. In: N. Eilan, C. Hoerl, T. McCormack & J. Roessler (Hg.), Joint Attention: Communication and Other Minds. Oxford: Oxford University Press. Call, J. & Tomasello, M. (2007). The Gestural Communication of Apes

and Monkeys. Mahwah, N.J.: Lawrence Erlbaum. Camaioni, L. (1993). The development of intentional communication: A re-analysis. In: J. Nadel & L. Camaioni (Hg.), New Per3 69

spectives in Early Communicative Development New York: Routledge. Camaioni, L., Perucchini, F., Muratori, F., Parrini, B. & Cesari, A. (2003). The communicative use of pointing in autism: Developmental profiles and factors related to change. European Psychiatry, 18(1), 6-12. Campbell, A. L., Brooks, P. & Tomasello, M. (2000). Factors affecting young children's use of pronouns as referring expressions. Journal of Speech, Language, and Hearing Research, 43,1337-1349. Capirci, O., Iverson, J. M., Pizzuto, E. & Volterra, V. (1996). Gestures and words during the transition to two-word speech. Journal of Child Language, 23, 645-673. Caron, A. J., Kiel, E. J., Dayton, M. & Butler, S. C. (2002). Comprehension of the referential intent of looking and pointing between 12 and 15 months. Journal of Cognition and Development, 3(4), 445-464. Carpendale, J. E. M. & Lewis, C. (2004). Constructing an understanding of mind: The development of children's understanding of mind within social interaction. Behavioral and Brain Sciences, 27, 79-150. Carpenter, M. (2006). Instrumental, social, and shared goals and intentions in imitation. In: S. Rogers & J. Williams (Hg.), Imitation and the Development of the Social Mind: Lessons from Typical Development and Autism. New York: Guilford. Carpenter, M., Akhtar, N. & Tomasello, M. (1998). Fourteenthrough 18-month-old infants differentially imitate intentional and accidental actions. Infant Behavior and Development; 21, 315-330. Carpenter, M., Nagell, K. & Tomasello, M. (1998). Social cognition, joint attention, and communicative competence from 9 to 15 months of age. Monographs of the Society of Research in Child Development, 63(4). Carpenter, M., Pennington, B. F. & Rogers, S. J. (2001). Understanding of others' intentions in children with autism and children with developmental delays. Journal of Autism and Developmental Disorders, 31, 589-599. Carpenter, M., Tomasello, M. & Savage-Rumbaugh, S. (1995). Joint attention and imitative learning in children, chimpanzees, and enculturated chimpanzees. Social Development, 4(3), 217-237. 370

Carpenter, M., Tomasello, M. 8c Striano, T. (2005). Role reversal Imitation and language in typically-developing infants and children with autism. Infancy, 8, 253-278. Chafe, W. (1994). Discourse, Consciousness, and Time: The Flow and Displacement of Conscious Experience in Speaking and Writing. Chicago: The University of Chicago Press. Chalmeau, R. (1994). Do chimpanzees cooperate in a learning task? Primates, 35(3)» 385-392. Chalmeau, R. 8c Gallo, A. (1996). What chimpanzees (Pan troglodytes) learn in a cooperative task. Primates, 37, 39-47. Cheney, D. L. 8c Seyfarth, R. M. (1990a). How Monkeys See the World: Inside the Mind of Another Species. Chicago: The University of Chicago Press; dt.: Wie Affen die Welt sehen. München: Hanser, 1994. Cheney, D. L. 8c Seyfarth, R. M. (1990b). Attending to behaviour versus attending to knowledge: Examining monkeys' attribution of mental states. Animal Behaviour, 40, 742-753. Chomsky, N. (1965). Aspects of the Theory of Syntax. Cambridge, Mass.: MIT Press, dt.: Aspekte der Syntaxtheorie, 4. Aufl., Frankfurt/M.: Suhrkamp, 1987. Clark, A. P. 8c Wrangham, R. W. (1994). Chimpanzee arrival panthoots: Do they signify food or Status? International Journal of Primatology, 15,185-205. Clark, H. (1996). Uses of Language. Cambridge: Cambridge University Press. Clark, H. & Marshall, C. R. (1981). Definite reference and mutual knowledge. In: K. Joshi, B. L. Webber 8c I. A. Sag (Hg.), Elements of Discourse Understanding. Cambridge: Cambridge University Press. Clark, H. H. (1992). Arenas of Language Use. Chicago: The University of Chicago Press. Corballis, M. C. (2002). From Hand to Mouth: The Origins of Language, Princeton: Princeton University Press. Crawford, M. P. (1937). The cooperative solving of problems by young chimpanzees. Comparative Psychology Monographs, 14,1-88. Crawford, M. P. (1941). The cooperative solving by chimpanzees of problems requiring serial responses to color cues. Journal of Social Psychology, 13, 259-280. Crockford, C. 8c Boesch, C. (2003). Context-specific calls in wild 371

chimpanzees, Pan troglodytes verus: Analysis of barks. Animal Behaviour; 66,115-125. Croft, W. (1991). Syntactic Categories and Grammatical Relations: The Cognitive Organization of Information. Chicago: The University of Chicago Press. Croft, W. (1995). Intonation units and grammatical units. Linguistics, 33(5), 839-882. Croft, W. (2000). Explaining Language Change: An Evolutionary Approach. London: Longmans. Croft, W. (2001). Radical Construction Grammar: Syntactic Theory in Typological Perspective. Oxford: Oxford University Press. Croft, W. (2003). Typology and Universals, 2. Aufl., Cambridge: Cambridge University Press. Csibra, G. (2003). Teleological and referential understanding of action in infancy. Philosophical Transactions of the Royal Society, London B, 358,447-458. Csibra, G., Gergely, G., Biro, S., Koos, O. & Brockbank, M. ( 1 9 9 9 ) . Goal attribution without agency cues: The perception of »pure reason« in infancy. Cognition, 72, 237-267. Dahl, O. (2004). The Growth and Maintenance ofLinguistic Complexity. Studies in Language Companion Series. Amsterdam/Philadelphia: John Benjamins. Darwin, C. R. (1872). The Expression of the Emotions in Man and Animals. London: Murray; dt.: Der Ausdruck der Gemütsbewegungen bei dem Menschen und den Tieren, 6. Aufl., Stuttgart: Schweizerbart, 1910. Dawkins, R. & Krebs, J. (1978). Animal Signals: Information or manipulation. In: J. Krebs and N. Davies (Hg.), Behavioral Ecology: An Evolutionary Approach. Oxford: Blackwell. DeLoache, J. S. (2004). Becoming symbol-minded. Trends in Cognitive Sciences, 8y 66-70. de Saussure, E (1916/1959). Course in General Linguistics. New York: Philosophical Library; dt.: Grundfragen der allgemeinen Sprachwissenschaft, 3. Aufl., Berlin: de Gruyter, 2001. Dessalles, J.-L. (2006). The Evolutionary Origins of Language. Cambridge: Cambridge University Press. Deutscher, G. (2005). The Unfolding of Language. London: William Heinemann; dt.: Du Janey ich Goethe: eine Geschichte der Sprache. München: Beck, 2008. 372

de Waal, F. B. M. (1986). Deception in the natural communication of chimpanzees. In: R. W. Mitchell & N. S. Thompson (Hg.), Deception: Perspectives on Human and Nonhuman Deceit Albany: SUNY Press. de Waal, F. B. M., & Lutrell, L. M. (1988). Mechanisms of social reciprocity in three primate species: Symmetrical relationship characteristics or cognition? Ethology and Sociobiology, 9 , 1 0 1 - 1 1 8 . Diessel, H. (2005). The Acquisition of Complex Sentences. Cambridge: Cambridge University Press. Diessel, H. (2006). Demonstratives, joint attention, and the emergence of grammar. Cognitive Linguistics, 17,463-489. Diessel, H. & Tomasello, M. (2000). The development of relative constructions in early child speech. Cognitive Linguistics, 1 1 , 131-152. Diessel, H. & Tomasello, M. (2001). The acquisition of finite complement clauses in English: A usage based approach to the development of grammatical constructions. Cognitive Linguistics, 12, 9 7 - 1 4 1 .

Donald, M. (1991). Origins of the Modern Mind. Cambridge, Mass.: Harvard University Press. Enard, W., Przeworski, W., Fisher, S., Lai, L., Wiebe, V., Kitano, T., Monaco, A. & Pääbo, S. (2002). Molecular evolution of FOXP2, a gene involved in speech and language. Nature, 418, 869-872. Fehr, E. & Fischbacher, U. (2003). The nature of human altruism. Nature, 425, 785-791. Fillmore, C. (1989). Grammatical construction theory and the familiar dichotomies. In: R. Dietrich & C. F. Graumann (Hg.), Language Processing in Social Context North Holland: Elsevier. Folven, R. & Bonvillian, J. (1991). The transition from nonreferential to referential language in children acquiring American Sign Language. Developmental Psychology, 27, 806-816. Gardner, R. A. & Gardner, B. T. (1969). Teaching sign language to a chimpanzee. Science, 165, 664-672. Gergely, G., Bekkering, H. & Kiraly, I. (2002). Rational imitation in preverbal infants. Nature, 415,755. Gergely, G. & Csibra, G. (2006). Sylvias recipe: The role of imitation and pedagogy in the transmission of cultural knowledge. In: N. J. Enfield & S. C. Levinson (Hg.), Roots of Human Sociality: Culture, Cognition, and Interaction. Oxford: Berg Press. 373

Gilbert, M. (1989). On Social Facts. International Library of Philosophy series. Princeton: Princeton University Press. Gilby, I. C. 2006. Meat sharing among the Gombe chimpanzees: Harassment and reciprocal exchange. Animal Behaviour, 71 (4), 953-963. Gilby, I. C., Eberly, L. E., Pintea, L. & Pusey, A. E. (2006). Ecological and social influences on the hunting behaviour of wild chimpanzees, Pan troglodytes schweinfurthii. Animal Behaviour, 72(1), 169-180. Givön, T. (1979). On Understanding Grammar. New York: Academic Press. Givön, T. (2001). Syntax, Bd. 2. Amsterdam: John Benjamins. Goldberg, A. (1995). Constructions: A Construction Grammar Approach to Argument Structure. Chicago: The University of Chicago Press. Goldberg, A. (2006). Constructions at Work. Oxford: Oxford University Press. Goldin-Meadow, S. (2003a). Hearing Gesture: How Our Hands Help Us Think. Cambridge, Mass.: Harvard University Press. Goldin-Meadow, S. (2003b). The Resilience of Language: What Gesture Creation in Deaf Children Can Tell Us about How All Children Learn Language. New York: Psychology Press. Goldin-Meadow, S. & Mylander, C. (1984). Gestural communication in deaf children: the effects and non-effects of parental input on early language development. Monographs of the Society for Research in Child Development, 49,1-151. Golinkoff, R. M. (1986). »I beg your pardon?«: The preverbal negotiation of failed messages. Journal of Child Language, 13, 455476. Gomez, J. C. (1990). The emergence of intentional communication I as a problem-solving strategy in the gorilla. In: S. T. Parker & c K. R. Gibson (Hg.), »Language« and Intelligence in Monkeys and Apes. Cambridge: Cambridge University Press. Gomez, J. C. (2004). Apes, Monkeys, Children, and the Growth of \ Mind. Cambridge, Mass.: Harvard University Press. Goodall, J. (1986). The Chimpanzees of Gombe. Patterns of Behavior. Cambridge, Mass.: Harvard University Press. Gouzoules, H., Gouzoules, S. & Ashley, J. (1995). Representational signalling in nonhuman primate vocal communication. In: E. 374

Zimmermann, J. Newman 8c U. Jürgens (Hg.), Current topics in primate vocal communication. New York: Plenum Press. Greenberg, J. (1963). Some universals of grammar with particular reference to the order of meaningful elements. In: J. Greenberg (Hg.), Universals of Language. Cambridge, Mass.: MIT Press. Greenfield, P. M. 8c Savage-Rumbaugh, E. S. (1990). Grammatical combination in Panpaniscus: Processes of learning and invention in the evolution and development of language. In: S. T. Parker 8c K. R. Gibson (Hg.), »Language« and Intelligence in Monkeys and Apes. Cambridge: Cambridge University Press. Greenfield, P. M. 8c Savage-Rumbaugh, E. S. (1991). Imitation, grammatical development, and the invention of protogrammar by an ape. In: N. A. Krasnegor, D. M. Rumbaugh, R. L. Schiefelbusch 8c M. Studdert-Kennedy, Biological and Behavioral Determinants of Language Development. Hillsdale, N.J.: Lawrence Erlbaum. Greenfield, P. M. 8c Smith, I. H. (1976). The Structure of Communication in Early Language Development. New York: Academic Press. Grice, H. P. (1957). Meaning. Philosophical Review, 64, 377-388; dt.: Bedeuten, Meinen, Intendieren. Trier: L.A.U.T., 1977. Grice, P. (1975). Logic and conversation. In: P. Cole 8c J. Morgan (Hg.), Syntax and Semantics, Bd. 3: Speech Acts. New York: Academic Press; dt.: Logik und Konversation. In: G. Meggle (Hg.), Handlung> Kommunikation, Bedeutung, Frankfurt/M.: Suhrkamp, 1979. Gundel, J., Hedberg, N. & Zacharski, R. (1993). Cognitive Status and the form of referring expressions in discourse. Language, 69,274307. Habermas, J. (1995). Theorie des kommunikativen Handelns. Frankfurt/M.: Suhrkamp. Haith, M. 8c Benson, J. (1997). Infant cognition. In: D. Kühn 8c R. Siegler (Hg.), Handbook of Child Psychology, Bd. 2, New York: Wiley. Hannan, T. 8c Fogel, A. (1987). A case study assessment of »pointing« in the first three months of life. Perceptual and Motor Skills, 65, 187-194. Hare, B., Brown, M., Williamson, C. 8c Tomasello, M. (2002). The domestication of social cognition in dogs. Science, 298,1634-1636. Hare, B., Call, J., Agnetta, B. 8c Tomasello, M. (2000). Chimpanzees 375

know what conspecifics do and do not see. Animal Behaviour, 59, 771-785. Hare, B., Call, J. & Tomasello, M. (1998). Communication of food location between human and dog (Canis familiaris). Evolution of Communication 2,137-159. Hare, B., Call, J. & Tomasello, M. (2001). Do chimpanzees know what conspecifics know? Animal Behaviour, 6i( 1), 139-151. Hare, B., Call, J. & Tomasello, M. (2006). Chimpanzees deceive a human by hiding. Cognition, 101,495-514. Hare, B. & Tomasello, M. (2004). Chimpanzees are more skillful in i competitive than in co-operative cognitive tasks. Animal Behav1 iour, 68, 571-581. * Hare, B. & Tomasello, M. (2005). Human-like social skills in dogs? ^ Trends in Cognitive Science, 9,439-444. Hauser, M. D., Chomsky, N. & Fitch, W. T. (2002). The faculty of language: What is it, who has it, and how did it evolve? Science, 298,1569-1579. Hauser, M. D. & Wrangham, R. W. (1987). Manipulation of food calls in captive chimpanzees: A preliminary report. Folia Primatologica, 48, 207-210. Hawkins, J. (2004). Efficiency and Complexity in Grammars. Oxford: Oxford University Press. Heine, B. & Kuteva, T. (2002). On the evolution of grammatical forms. In: A. Wray (Hg.), The Transition to Language. Oxford: Oxford University Press. Henrich, J., Boyd, R , Bowles, S., Gintis, H., Fehr, E., Camerer, C, McElreath, R , Gurven, M., Hill, K., Barr, A., Ensminger, J., Tracer, D., Marlow, F., Patton, J., Alvard, M., Gil-White, F. & Henrich, N. (2005). »Economic Man« in cross-cultural perspective: Ethnography and experiments from 15 small-scale societies. Behavioral and Brain Sciences, 28, 795-855. Herman, L. (2005). Intelligence and rational behavior in the bottlenosed dolphin. In: S. Hurley & M. Nudds (Hg.), Rational Animals?. Oxford: Oxford University Press. Herrmann, E. & Tomasello, M. (2006). Apes' and children's understanding of cooperative and competitive motives in a communicative situation. Developmental Science, 9(5), 518-529. Hewes, G. W. (1973). Primate communication and the gestural origins of language. Current Anthropology, 14,9-10. 376

Hill, K. & Hurtado, A. M. (1996). Ache Life History: The Ecology and Demography of a Foraging People. Glenside, Penn.: Aldine Press. Hirata, S. 8c Fuwa, K. (2006). Chimpanzees (Pan troglodytes) learn to act with other individuals in a cooperative task. Primates, 48(1), 1 3 - 2 1 . Iverson, J., Capirci, O. 8c Caselli, M. C. (1994). From communication to language in two modalities. Cognitive Development, 9, 23-43. Iverson, J. 8c Goldin-Meadow, S. (2005). Gesture paves the way for language development. Psychological Science, 16, 367-373. Jensen, K., Hare, B., Call, J. 8c Tomasello, M. (2006). Chimpanzees are self-regarding maximizers in a food acquisition task. Proceedings of the Royal Society, 2 7 3 , 1 0 1 3 - 1 0 2 1 . Kagan, J. (1981). The Second Year: The Emergence of Self Awareness. Cambridge, Mass.: Harvard University Press. Kaminski, J., Call, J. 8c Tomasello, M. (2004). Body orientation and face orientation: Two factors controlling apes begging behavior from humans. Animal Cognition, 7, 216-223. Kegl, J., Senghas, A. & Coppola, M. (1999). Creation through contact: Sign language emergence and sign language change in Nicaragua. In: M. DeGrafF (Hg.), Language Creation and Language Change: Creolization, Diachrony, and Development. Cambridge, Mass.: MIT Press. Keller, R. (1994). On Language Change: The Invisible Hand in Language. New York: Routledge. Kendon, A. (2004). Gesture: Visible Action as Utterance. Cambridge: Cambridge University Press. Kita, S. (Hg.) (2003). Pointing: Where Language, Culture, and Cognition Meet. Mahwah, N. J.: Lawrence Erlbaum. Kobayashi, H. 8c Koshima, S. (2001). Unique morphology of the human eye and its adaptive meaning: Comparative studies on external morphology of the primate eye. Journal of Human Evolution, 40,419-435. Kuhlmeier, V., Wynn, K. 8c Bloom, P. (2003). Attribution of dispositional states by 12-month-olds. Psychological Science, 14(5), 402408. Lambrecht, K. (1994). Information Structure and Sentence Form. Cambridge: Cambridge University Press. Langacker, R. (1987). Foundations of Cognitive Grammar, Bd. 1. Stanford, Calif.: Stanford University Press. 377

Langacker, R. (1991). Foundations of Cognitive Grammar; Bd. 2. Stanford, Calif.: Stanford University Press. Leavens, D. A. & Hopkins, W. D. (1998). Intentional communication by Chimpanzees: A cross-sectional study of the use of referential gestures. Developmental Psychology, 34,813-822. Leavens, D. A., Hopkins, W. D. & Bard, K. A. (2005). Understanding the point of chimpanzee pointing: Epigenesis and ecological validity. Current Directions in Psychological Science, 14,185-189. Lederberg, A. & Everhart, V. (1998). Communication between deaf children and their hearing mothers: The role of language, gesture, and vocalization. Journal of Speech, Language, and Hearing Research, 41, 887-899. Leslie, A. (1987) Pretense and representation: The origins of »theory of mind.« Psychological Review, 94,412-426. Levinson, S. (2006). On the human interactional engine. In: N. Enfield & S. Levinson (Hg.), Roots of Human Sociality. New York: Berg Publishers. Levinson, S. C. (1995). Interactional biases in human thinking. In: E. Goody (Hg.), Social Intelligence and Interaction. Cambridge: Cambridge University Press. Lewis, D. (1969). Convention. Cambridge, Mass.: Harvard University Press; dt.: Konventionen: eine sprachphilosophische Abhandlung. Berlin: de Gruyter, 1975. Liddell, S. K. (2003). Grammar, Gesture, and Meaning in American Sign Language. Cambridge: Cambridge University Press. Liebal, K., Behne, T., Carpenter, M. & Tomasello, M. (2009). Infants use shared experience to interpret a pointing gesture. Developmental Science, 12 (2), 264-271. Liebal, K., Call, J. & Tomasello, M. (2004). The use of gesture sequences by chimpanzees. American Journal of Primatology, 64, 377-396. Liebal, K., Columbi, C., Rogers, S., Warneken, E & Tomasello, M. (2008). Cooperative activities in children with autism. Journal of Autism and Developmental Disorders, 38, 224-238. Liebal, K., Pika, S., Call, J. & Tomasello, M. (2004). To move or not to move: How apes adjust to the attentional state of others. Interaction Studies, 5,199-219. Liebal, K., Pika, S. & Tomasello, M. (2006). Gestural communication in orangutans. Gesture, 6,1-38. 378

Liszkowski, U. (2005). Human twelve-month-olds point co-operatively to share interest with and provide information for a communicative partner. Gesture, 5 , 1 3 5 - 1 5 4 . Liszkowski, U., Albrecht, K., Carpenter, M. & Tomasello, M. (2008). Infants' visual and auditory communication when a partner is or is not visually attending. Infant Behavior and Development, 31 (2), 157-167. Liszkowski, U., Carpenter, M., Henning, A., Striano, T. & Tomasello, M. (2004). 12-month-olds point to share attention and interest. Developmental Science, 7, 297-307. Liszkowski, U., Carpenter, M., Striano, T. & Tomasello, M. (2006). 12- and 18-month-olds point to provide information for others. Journal of Cognition and Development, 7 , 1 7 3 - 1 8 7 . Liszkowski, U., Carpenter, M. & Tomasello, M. (2007a). Reference and attitude in infant pointing. Journal of Child Language, 3 4 , 1 20. Liszkowski, U., Carpenter, M. & Tomasello, M. (2007b). Pointing out new news, old news, and absent referents at 12 months of age. Developmental Science, 10, F1-F7. Maestripieri, D. (1998). Primate social organization, vocabulary size, and communication dynamics: A comparative study of macaques. In: B. King (Hg.), The Evolution of Language: Assessing the Evidence from Nonhuman Primates. Santa Fe: School of American Research. Matthews, D., Lieven, E. V., Theakston, A. L. & Tomasello, M. (2006). The effect of perceptual availability and prior discourse on young children's use of referring expressions. Applied Psycholinguistics, 27, 403-422. Matthews, D., Lieven, E. & Tomasello, M. (2007). How toddlers and preschoolers learn to uniquely identify referents for others: A training study. Child Development, 34, 381-409. Maynard Smith, J. & Harper, D. (2003). Animal Signals. Oxford: Oxford University Press. McNeill, D. (1992). Hand and Mind: What Gestures Reveal about Thought. Chicago: The University of Chicago Press. McNeill, D. (2005). Gesture and Thought. Chicago: The University of Chicago Press. McWhorter, J. (2005). Defining Creole. Oxford: Oxford University Press. 379

Melis, A., Call, J. 8c Tomasello, M. (2006). Chimpanzees conceal visual and auditory information from others. Journal of Comparative Psychology, 120,154-162. Melis, A., Hare, B. 8c Tomasello, M. (2006a). Engineering cooperation in chimpanzees: Tolerance constraints on cooperation. Animal Behaviour, 72, 275-286. Melis, A., Hare, B. 8c Tomasello, M. (2006b). Chimpanzees recruit the best collaborators. Science, 31,1297-1300. Meltzoff, A. (1995). Understanding the intentions of others: Reenactment of intended acts by 18-month-old children. Developmental Psychology, 31,1-16. Menzel, C. (1999). Unprompted recall and reporting of hidden objects by a chimpanzee after extended delays. Journal of Comparative Psychology, 113,426-434. Millikan, R. G. (2005). Language: A Biological Model. Oxford: Oxford University Press. Mitani, J. C. 8c Nishida, T. (1993). Contexts and social correlates of long-distance calling by male chimpanzees. Animal Behaviour, 45 > 735-746. Moll, H., Koring, C., Carpenter, M. 8c Tomasello, M. (2006). Infants determine others' focus of attention by pragmatics and exclusion. Journal of Cognition and Development, 7,411-430. Moll, H., Richter, N., Carpenter, M. 8c Tomasello, M. (2008). 14month-olds know what »we« have shared in a special way. Infancy, 13,90-101. Moll, H. 8c Tomasello, M. (2004). 12- and 18-month-olds follow gaze to hidden locations. Developmental Science, 7, FiF9. Moll, H. 8c Tomasello, M. (2007a). How 14- and 18- month-olds know what others have experienced. Developmental Psychology,

43*309-517.

Moll, H. 8c Tomasello, M. (2007b). Co-operation and human cognition: The Vygotskian intelligence hypothesis. Philosophical Transactions of the Royal Society, 362, 639-648. Moore, C. (1996). Theories of mind in infancy. British Journal of Developmental Psychology, 14,19-40. Moore, C. 8c Corkum, V. (1994). Social understanding at the end of the first year of life. Developmental Review, 14, 349-372. Moore, C. 8c D'Entremont, B. (2001). Developmental changes in 380

pointing as a function of parent's attentional focus. Journal of Cognition and Development, 2,109-129. Mundy, P. & Burnette, C. (2005). Joint attention and neurodevelopment. In: F. Volkmar, Klin 8c R. Paul (Hg.), Handbook of Autism and Pervasive Developmental Disorders, Bd. 3. Hoboken, N.J.: John Wiley. Mundy, P. 8c Sigman, M. (2006). Joint attention, social competence, and developmental psychopathology. In D. Cicchetti 8c D. Cohen (Hg.), Developmental Psychopathology; Bd. 1: Theory and Methods, 2. Aufl., Hoboken, N.J.: John Wiley. Namy, L. L., Acredolo, L. 8c Goodwyn, S. (2000). Verbal labels and gestural routines in parental communication with young children. Journal of Nonverbal Behavior, 24,63-79. Namy, L. L., Campbell, A. 8c Tomasello, M. (2004). Developmental change in the role of iconicity in symbol learning. Journal of Cognition and Development, 5, 37-56. Namy, L. L. 8c Waxman, S. R. (1998). Words and gestures: Infants' interpretations of different forms of symbolic reference. Child Development, 69, 295-308. Namy, L. L. 8c Waxman, S. R. (2000). Naming and exclaiming: Infants' sensitivity to naming contexts. Journal of Cognition and Development, 1,405-428. Nelson, K. (1985). Making Sense: The Acquisition of Shared Meaning. New York: Academic Press. Nelson, K. (1996). Language in Cognitive Development. New York: Cambridge University Press. Nowak, M. A. 8c Sigmund, K. (1998) Evolution of indirect reciprocity by image scoring. Nature, 393, 573-577« Okamoto-Barth, S., Call, J. 8c Tomasello, M. (2007). Great apes' understanding of others' line of sight. Psychological Science, 18, 462-468. Olson, D. (1994). The World on Paper: The Conceptual and Cognitive Implications of Writing and Reading. New York: Cambridge University Press. O'Neill, D. K. (1996). Two-year-old children's sensitivity to a parent's knowledge state when making requests. Child Development, 67, 659-677. Onishi, K. H. 8c Baillargeon, R. (2005). Do 15-month-old infants understand false beliefs? Science, 308, 255-258. 381

Orlansky, M., and Bonvillian, J. D. (1984). The role of iconicity in early sign language acquisition. Journal of Speech and Hearing Disorders, 49, 287-292. Owings, D. H. & Morton, E. S. (1998). Animal Vocal Communication: A New Approach. Cambridge: Cambridge University Press. Owren, M. J. & Rendell, D. (2001). Sound on the rebound: Bringing form and function back to the forefront in understanding nonhuman primate vocal signaling. Evolutionary Anthropology, 10, 58-71. Ozcaliskan, S. & Goldin-Meadow, S. (2005). Gesture is at the cutting edge of language development. Cognition, 96, B 1 0 1 - 1 1 3 . Padden, C. A. (1983). Interaction of morphology and syntax in American Sign Language. Dissertation. University of California, San Diego. Panchanathan, S. & Boyd, R. (2003). A tale of two defectors: The importance of standing for the evolution of indirect reciprocity. Journal of Theoretical Biology, 224,115-126. Pepperberg, I. M. (2000). The Alex Studies: Cognitive and Communicative Abilities of Grey Parrots. Cambridge, Mass.: Harvard University Press. Perner, J., Brandl, J. & Garnham, A. (2003). What is a perspective problem? Developmental issues in understanding belief and dual identity. Facta Philosophical 5, 355-378. Pinker, S. (1999). Words and Rules. New York: Morrow Press; dt.: Wörter und Regeln. Paderborn: Voltmedia, 2006. Pollick, A. & de Waal, E (2007). Ape gestures and language evolution. Proceedings of the National Academy of Sciences, 104, 81849189. Povinelli, D. J. & Davis, D. R. (1994). Differences between chimpanzees (Pan troglodytes) and humans (Homo sapiens) in the resting state of the index finger: Implications for pointing. Journal of Comparative Psychology, 108,134-139. Povinelli, D. J. & Eddy, T. J. (1996). What young chimpanzees know about seeing. Monographs of the Society for Research in Child Development, 61(3). Povinelli, D. J. & O'Neill, D. (2000). Do chimpanzees use their gestures to instruct each other? In: S. Baron-Cohen, H. Tager-Flusberg 8c D. Cohen (Hg.), Understanding Other Minds: Perspectives 382

from Developmental Cognitive Neuroscience, 2. Aufl. Oxford: Oxford University Press. Povinelli, D. J. & Vonk, J. (2006). We don't need a microscope to explore the chimpanzee's mind. In: S. Hurley (Hg.), Rational Animals. Oxford: Oxford University Press. Quine, W. V. (i960). Word and Object, Cambridge, Mass.: MIT Press; dt.: Wort und Gegenstand. Stuttgart: Reclam, 1980. Ratner, N. & Bruner, J. (1978). Games, social exchange, and the acquisition of language. Journal of Child Language, 5, 391-401. Richerson, R & Boyd, R. (2005). Not by Genes Alone. Chicago: The University of Chicago Press. Rivas, E. (2005). Recent use of signs by chimpanzees (Pan Troglodytes) in interactions with humans. Journal of Comparative Psychology, 119(4), 404-417Rochat, P. (2001). The Infants World. The Developing Child series. Cambridge, Mass.: Harvard University Press. Ross, H. S. & Lollis, S. P. (1987), Communication within infant social games. Developmental Psychology 23(2), 241-248. Sandler, W., Meir, L, Padden, C. & Aronoff, M. (2005). The emergence of grammar: Systematic structure in a new language. Proceedings of the National Academy of Science, 102(7), 2661-2665. Savage-Rumbaugh, S., McDonald, K., Sevcik, R., Hopkins, W. & Rupert, E. (1986). Spontaneous symbol acquisition and communicative use by pygmy chimpanzee (Pan paniscus). Journal of Experimental Psychology, 115, 211-235. Savage-Rumbaugh, S., Murphy, J., Sevcik, R., Brakke, K., Williams, S. & Rumbaugh, D. (1993). Language comprehension in ape and child. Monographs of the Society for Research in Child Developments 58(3-4). Savage-Rumbaugh, E. S., Rumbaugh, D. M. & Boysen, S. (1978). Linguistically mediated tool use and exchange by chimpanzees (Pan troglodytes). Behavioral and Brain Sciences, 4, 539-554. Saylor, M. (2004). 12- and 16-month-old infants recognize properties of mentioned absent things. Developmental Science, 7, 599611. Schachter, S. (1959). The Psychology of Affiliation. Stanford, Calif.: Stanford University Press. Schelling, T. C. (i960). The Strategy of Conflict. Cambridge, Mass.: Harvard University Press. 383

Schick, B. (2005). Advances in the Sign Language Development of Deaf Children. Oxford: Oxford University Press. Schwier, C., van Maanen, C., Carpenter, M. & Tomasello, M. (2006). Rational Imitation in 12-month-old infants. Infancy; 10, 303311. Searle, J. R. (1969). Speech Acts: An Essay in the Philosophy of Language. Cambridge: Cambridge University Press; dt.: Sprechakte, 6. Aufl., Frankfurt/M.: Suhrkamp, 1994. Searle, J. R. (1983). Intentionality. Cambridge: Cambridge University Press; dt.: Intentionalität, 2. Aufl., Frankfurt/M.: Suhrkamp, 1996. Searle, J. R. (1990). Collective intentions and actions. In: P. Cohen, J. Morgan & M. Pollack (Hg.), Intentions in Communication. Cambridge, Mass.: MIT Press. Searle, J. R. (1995). The Construction of Social Reality. New York: Free Press, dt.: Die Konstruktion der gesellschaftlichen Wirklichkeit. Hamburg: Rowohlt, 1997. Searle, J. R. (1999). Mind, Language, and Society: Philosophy in the Real World. New York: Basic Books; dt.: Geist, Sprache und Gesellschaft: Philosophie in der wirklichen Welt. Frankfurt/M.: Suhrkamp, 2001. Senghas, A. (2003). Intergenerational influence and ontogenetic development in the emergence of spatial grammar in Nicaraguan Sign Language. Cognitive Development, 18, 5 1 1 - 5 3 1 . Senghas, A. & Coppola, M. (2001). Children creating language: How Nicaraguan Sign Language acquired a spatial grammar. Psychological Science, 12(4), 323-328. Senghas, A., Kita, S. & Özyürek, A. (2004). Children creating core properties of language: Evidence from an emerging sign language in Nicaragua. Science, 305, 5691,1779-1782. Seyfarth, R. M. & Cheney, D. L. (2003). Signalers and receivers in animal communication. Annual Review of Psychology, 54, 145-

173.

Shatz, M. & O'Reilly, A. (1990). Conversation or communicative skill? A re-assessment of two-year-olds behavior in miscommunication episodes. Journal of Child Language, 17,131-146. Shwe, H. L & Markman, E. M. (1997). Young children's appreciation of the mental impact of their communicative signals. Developmental Psychology, 33(4), 630-636. 384

Silk, J. B., Brosnan, S. F., Vonk, J., Henrich, J., Povinelli, D. J., Richardson, A. S., Lambeth, S. P., Mascaro, J. 8c Schapiro, S. J. (2005). Chimpanzees are indifferent to the welfare of unrelated group members. Nature, 437,1357-1359« Spencer, P. (1993). Communication behaviors of infants with hearing loss and their hearing mothers. Journal of Speech and Hearing Research, 36, 3 1 1 - 3 2 1 . Sperber, D. (1994). Understanding verbal understanding. In J. Khalfa (Hg.), What Is Intelligence?. Cambridge: Cambridge University Press. Sperber, D. 8c Wilson, D. (1986). Relevance: Communication and Cognition. Cambridge, Mass.: Harvard University Press. Stanford, C. B. (1998). Chimpanzee and Red Colobus: The Ecology of Predator and Prey. Cambridge, Mass.: Harvard University Press. Stern, D. N. (1985). The Interpersonal World of the Infant: A View from Psychoanalysis and Developmental Psychology. New York: Basic Books. Sugiyama, Y. (1981). Observations on the population dynamics and behavior of wild chimpanzees at Bossou, Guinea, 1979-1980. Primates., 22,432-444. Tanner, J. E. 8c Byrne, R. W. (1993). Concealing facial evidence of mood: Perspective-taking in a captive gorilla? Primates, 34, 451457. Tanner, J. E. 8c Byrne, R. W. (1996). Representation of action through iconic gesture in a captive lowland gorilla. Current Anthropology, 37, 162-173. Tinbergen, N. (1951). The Study of Instinct. New York: Oxford University Press; dt.: Instinktlehre: vergleichende Erforschung angeborenen Verhaltens, 6. Aufl. Berlin: Parey, 1979. Tomasello, M. (1988). The role of joint attentional process in early language development. Language Sciences, 10, 69-88. Tomasello, M. (1992a). First Verbs: A Case Study of Early Grammatical Development. Cambridge: Cambridge University Press. Tomasello, M. (1992b). The social bases of language acquisition. Social Development, 1(1), 67-87. Tomasello, M. (1995). Joint attention as social cognition. In: C. Moore 8c P. J. Dunham (Hg.) Joint Attention: Its Origin and Role in Development. Hillsdale, N.J.: Lawrence Erlbaum. 385

Tomasello, M. (1996). Do apes ape? In: C. M. Heyes 8c B. G. Galef (Hg.) Social Learning in Animals: The Roots of Culture. San Diego: Academic Press. Tomasello, M. (1998). Reference: Intending that others jointly attend. Pragmatics and Cognition, 6, 229-244. Tomasello, M. (1999). The Cultural Origins of Human Cognition. Cambridge, Mass.: Harvard University Press; dt.: Die kulturelle I Entwicklung des menschlichen Denkens. Frankfurt/M.: Suhrkamp, 2002. Tomasello, M. (2001). Perceiving intentions and learning words in the second year of life. In: M. Bowerman 8c S. Levinson (Hg.), Language Acquisition and Conceptual Development. Cambridge: Cambridge University Press. Tomasello, M. (2003). Constructing a Language: A Usage-Based Theory of Language Acquisition. Cambridge, Mass.: Harvard University Press. Tomasello, M. (2004). What kind of evidence could refute the UG hypothesis? Studies in Language, 28, 642-644. Tomasello, M. 8c Call, J. (1997). Primate Cognition. Oxford: Oxford University Press. Tomasello, M. 8c Call, J. (2006). Do chimpanzees know what others see - or only what they are looking at? In: M. Nudds 8c S. Hurley (Hg.) Rational Animals? Oxford: Oxford University Press. Tomasello, M. 8c Call, J. (im Druck). Chimpanzee social cognition. In: E. Londsdorf 8c S. Ross (Hg.), Chimpanzee Minds. Chicago: The University of Chicago Press. Tomasello, M., Call, J. 8c Gluckman, A. (1997). The comprehension of novel communicative signs by apes and human children. Child Development, 68,1067-1081. Tomasello, M., Call, J., Nagell, K., Olguin, R. 8c Carpenter, M. (1994). The learning and use of gestural signals by young chimpanzees: A trans-generational study. Primates, 37,137-154. Tomasello, M., Call, J., Warren, J., Frost, T., Carpenter, M. 8c Nagell, K. (1997). The ontogeny of chimpanzee gestural signals: A comparison across groups and generations. Evolution of Communication, 1, 223-253. Tomasello, M. 8c Carpenter, M. (2005). The emergence of social cognition in three young chimpanzees. Monographs of the Society for Research in Child Development, 70(279). 386

Tomasello, M., Carpenter, M., Call, J., Behne, T. 8c Moll, H. (2005). Understanding and sharing intentions: The origins of cultural cognition. Behavioral and Brain Sciences, 28, 675-735. Tomasello, M., Carpenter, M. 8c Liszkowski, U. (2007). A new look at infant pointing. Child Development, 78, 705-722. Tomasello, M. 8c Farrar, J. (1986). Object permanence and relational words: A lexical training study. Journal of Child Language, 13, 495-506. Tomasello, M., George, B., Kruger, A., Farrar, J. 8c Evans, A. (1985). The development of gestural communication in young chimpanzees. Journal of Human Evolution, 14,175-186. Tomasello, M., Gust, D. 8c Frost, T. (1989). A longitudinal investigation of gestural communication in young chimpanzees. Primates, 30, 35-50. Tomasello, M. 8c Haberl, K. (2003). Understanding attention: 12and 18-month-olds know what is new for other persons. Developmental Psychology; 39(5), 906-912. Tomasello, M., Hare, B. 8c Agnetta, B. (1999). Chimpanzees, Pan troglodytes, follow gaze direction geometrically. Animal Behaviour, 58(4), 769-777. Tomasello, M., Hare, B., Lehmann, H. 8c Call, J. (2007). Reliance on head versus eyes in the gaze following of great apes and human infants: Hie cooperative eye hypothesis. Journal of Human Evolution, 52, 314-320. Tomasello, M., Kruger, A. 8c Ratner, H. (1993). Cultural learning. Behavioral and Brain Sciences, 16,495-552. Tomasello, M. 8c Rakoczy, H. (2003). What makes human cognition unique? From individual to shared to collective intentionality. Mind and Language, 18(2), 121-147. Tomasello, M., Striano, T. 8c Rochat, R (1999). Do young children use objects as symbols? British Journal of Developmental Psychology> 17, 563-584. Tomasello, M., Strosberg, R. 8c Akhtar, N. (1996). Eighteen-monthold children learn words in non-ostensive contexts. Journal of Child Language, 23,157-176. Tomasello, M. 8c Zuberbüler, K. (2002). Primate vocal and gestural communication. In: M. Bekoff, C. Allen 8c G. Burghardt (Hg.) The Cognitive Animal: Empirical and Theoretical Perspectives on Animal Cognition. Cambridge, Mass.: MIT Press. 387

Tomonaga, M., Myowa-Yamakoshi, M., Mizuno, Y., Yamaguchi, M., Kosugi, D., Bard, K., Tanaka, M. & Matsuzawa,T. (2004) Development of social cognition in infant chimpanzees (Pan troglodytes): Face recognition, smiling, gaze and the lack of triadic interactions. Japanese Psychological Research, 46, 227-25. Trevarthen, C. (1979). Instincts for human understanding and for cultural cooperation: Their development in infancy. In: M. von Cranach, K. Foppa, W. Lepenies, and D. Ploog (Hg.) Human Ethology: Claims and Limits of a New Discipline. Cambridge: Cambridge University Press. Uzgiris, I. C. (1981). Two functions of imitation during infancy. International Journal of Behavioral Development, 4 , 1 - 1 2 . Vygotskij, L. (1978). Mind in Society; The Development of Higher Psychological Processes. Hg. v. M. Cole. Cambridge, Mass.: Harvard University Press; dt.: Geschichte der höheren psychischen Funktionen. Münster u. a.: Lit, 1992. Warneken, F., Chen, F. & Tomasello, M. (2006). Cooperative activities in young children and chimpanzees. Child Development, 77, 640-663. I Warneken, F., Hare, B., Melis, A., Hanus, D. & Tomasello, M. (2007). I Roots of human altruism in chimpanzees. PLOS: Biology, 5(7): ei.84. Warneken, F. & Tomasello, M. (2006). Altruistic helping in human J\ infants and young chimpanzees. Science, 31,1301-1303. Warneken, F. & Tomasello, M. (2007). Helping and co-operation at 14 months of age. Infancy, 11, 271-294. Watts, D. & Mitani, J. C. (2002). Hunting behavior of chimpanzees at Ngogo, Kibale National Park, Uganda. International Journal of Primatology, 23,1-28. Whiten, A., Horner, V., Litchfield, C. & Marshall-Pescini, S. (2004). How do apes ape? Learning and Behaviour, 32, 36-52. Wittek, A. & Tomasello, M. (2005). German-speaking children's productivity with syntactic constructions and case morphology: Local cues help locally. First Language, 25,103-125. I Wittgenstein, L. (1953). Philosophical Investigations. Oxford: Basil I Blackwell; dt.: Philosophische Untersuchungen. Frankfurt/M.: ^ Suhrkamp, 2008. Wittgenstein, L. (1969). On Certainty. Oxford: Basil Blackwell; dt.: Über Gewißheit. Frankfurt/M.: Suhrkamp, 1992. 388

Wittgenstein, L. (2005). The Big Typescript: TS 213. Oxford: Basil Blackwell. Woodward, A. (1998). Infants selectively encode the goal object of an actor's reach. Cognition, 69,1-34. Woodward, A. (1999). Infants' ability to distinguish between purposeful and non-purposeful behaviors. Infant Behavior and Development, 22(2), 145-160. Woodward, A. L. & Hoyne, K. L. (1999). Infants' learning about words and sounds in relation to objects. Child Development; 70, 65-77. Wrangham, R. W. (1975). The behavioural ecology of chimpanzees in Gombe National Park, Tanzania. Dissertation, University of Cambridge. Wray, A. (1998). Protolanguage as a holistic system for social interaction. Language and Communication, 18,47-67. Zahavi, A. & Zahavi, A. (1997). The Handicap Principle: A Missing Piece in Darwins Puzzle. New York and Oxford: Oxford University Press; dt.: Signale der Verständigung: das Handicap-Prinzip. Frankfurt/M.: Insel, 1998. Zuberbühler, K. (2000). Causal cognition in a non-human primate: Field playback experiments with Diana monkeys. Cognition, 76, 195-207. Zuberbühler, K. (2005). The phylogenetic roots of language: Evidence from primate communication and cognition. Current Directions in Psychological Science, 14(3)» 126-130.

389

Namenregister

Acredolo, L. P. 160f., 165, 367, 381 Adamson, L. 154, 367 Agnetta, B. 51, 59, 375, 387 Akhtar, N. 5 8 , 1 7 2 , 1 7 4 f . , 367, 370 Armstrong, D. 71, 347> 367 Ashley, J. 29,374 Baillargeon, R. 1 5 3 , 3 8 1 Bakeman, R 154 f., 367 Baldwin, D. 173, 367 Bard, K. 193,367,388 Bard, K. A. 378 Barresi, J. 356, 367 Bates, E. 124f., 1 3 0 , 1 3 4 , 335 f., 359, 367fBateson, P. 209, 367 Behne, T. 1 0 , 1 8 , 52, 58,143 f-, 153, 203, 367, 378, 387 Bekkering, H. 59,153, 373 Benson, J. 169, 375 Bergstrom, C. T. 29, 368 Bloom, P. 1 5 1 , 1 6 9 , 368, 377 Boesch, C. 2 7 , 1 8 7 , 1 9 6 , 368, 371 Boesch, H. 187, 368 Boesch-Achermann, H. 187, 196, 368 Bonvillian, J. 161, 373, 382 Boyd, R. 2 1 , 1 8 6 , 2 1 5 , 2 2 9 , 3 6 8 , 376, 382 f. Boysen, S. 189, 383 Braine, M. 283, 368 Brandl, J. 364,382 390

Bratman, M. 1 7 , 1 9 5 , 368 Bräuer, J. 51,59,368 Bretherton, L. 165, 368 Brooks, P. 179, 3 1 1 , 370 Brown, E 223,232,368,375 Bruner, J. 1 5 , 1 5 5 , 1 6 8 , 1 7 1 , 177, 227,310, 368 f., 383 Bühler, K. 249, 290, 369 Burling, R. 66, 369 Burnette, C. 1 5 7 , 3 8 1 Buttelmann, D. 62, 369 Butterworth, G. 123,369 Bybee, J. 323,326,369 Byrne, R.W. 38 f., 385 Call, J. 1 0 , 1 8 , 31, 35, 37, 41-44, 4 7 , 5 1 , 5 3 , 55,58-60, 62,153, 188,190,198, 205, 233, 265, 350, 367fr., 375-381, 386f. Callanan, M. 175,367 Camaioni, L. 1 2 4 , 1 3 0 , 1 3 4 , 160,367, 369 f. Campbell, A. L. 1 6 1 , 1 7 9 , 370, 381 Capirci, O. 160,165, 282, 370, 377 Caron, A. J. 60, 370 Carpendale, J. E. M. 354, 370 Carpenter, M. 1 0 , 1 8 , 50, 52, 58, 124 f., 133 fr., 138 f., 153-156,

161,174fr., 1 9 2 f r . , 203, 225, 370f., 378ff., 384, 386f. Caselli, M. C. 160,165, 377 Chafe, W. 288,290,371 Chalmeau, R. 189,371

Chaucer, G. 318 f. Chen, F. 1 5 5 , 1 9 1 , 1 9 8 , 3 8 8 Cheney, D. L. 26 f., 29 f., 188, 37i, 384 Chomsky, N. 21, 293, 332f., 371,376 Clark, A. P. 3 0 , 3 7 1 Clark, H. 1 5 , 1 7 , 86, 88 f., 94, 1 0 7 , 1 1 2 , 1 1 4 , 354f.> 371 Coppola, M. 297, 377, 384 Corballis, M. C. 66, 347, 37i Corkum, V. 1 3 2 , 1 3 7 , 3 8 0 Crawford, M. P. i 8 9 f . , 3 7 i Crockford, C. 27, 371 Croft, W. 10, 288, 290, 317, 320, 324f., 328,330, 335,372 Csibra, G. 1 4 4 , 1 5 3 , 217, 372 f. Dahl, O. 320,372 Darwin, Ch. 33,372 Davis, D. R. 149,392 Dawkins, R. 24, 372 DeLoache, J. S. 164,372 D'Entremont, B. 1 2 5 , 1 3 2 , 1 3 7 , 380 De Saussure, F. 1 1 5 , 3 7 2 Dessalles, J.-L. 216, 372 Deutscher, G. 320,372 De Waal, F. B. M. 3 9 , 4 5 , 2 1 4 ,

373, 382

Diessel, H. 249,309,373 Donald, M. 219, 373 Everhart, V. 148,180,378 Farrar, J. 174, 387 Fehr, E. 201, 373, 376 Fillmore, C. 317, 373 Fischbacher, U. 201, 373

Fitch, W. T. 332,376 Fogel, A. 149,375 Folven, R. 161, 373 Fuwa, K. 190, 208, 377 Gallo, A. 189,371 Gardner, B. T. 48,267,373 Gardner, R. A. 48, 267, 373 Garnham, A. 364, 382 Gergely, G. 59,153, 217, 372f. Gilbert, M. 17, 83,195, 374 GilbyJ. C. 196 f., 215, 374 Givön, T. 322,369,374 Gluckman, A. 51,386 Goldberg, A. 10, 317f., 333, 374 Goldin-Meadow, S. 71, 8 1 , 1 6 2 , 166 f., 179, 240, 244, 246, 274-277, 279, 282, 302, 374, 382 GolinkofF, R. M. 1 2 5 , 1 4 3 , 374 Gomez, J. C. 48 ff., 374 Goodall, J. 28,197, 374 Goodwyn, S. W. 160 f., 165, 367, 381 Gouzoules, H. 29, 374 Gouzoules, S. 29, 374 Gräfenhein, M. 10, 203 Greenberg,J. 333, 375 f. Greenfield, P. M. 50,178, 269 f., 274, 375 Grice, H. P. 9 , 1 7 , 9 4 , 1 0 0 , 375 Gundel, J. 2 9 0 , 3 7 5 Haberl, K. 1 5 1 , 1 5 3 f., 387 Habermas, J. 103,375 Haimerl, F. 47,164 Haith, M. 169, 375 Hannan, T. 149, 375 391

Hare, B. 51-55» 59 ff» 189 f.» 197, 208,215,269, 375 ff-> 380, 387 f. Harper, D. 24,379 Hauser, M. D. 27, 332, 376 Hawkins, J. 333» 376 Hedberg, N. 290, 375 Heine, B. 250, 376 Henrich, J. 1 1 , 2 0 1 , 3 7 6 , 3 8 4 Herman, L. 271, 376 Hewes, G. W. 347» 376 Hill, K. 201, 376f. Hirata, S. 208, 377 Hopkins, W.D. 46 f., 378,383 Hoyne, K. L. 160,389 Hurtado, A. M. 201, 377 Iverson, J. 160,165,179, 282, 377 Jensen, K. 198,215,377 Jipson, J. 175» 367 Kagan,J. 147» 377 Kaminski, J. 43,60, 368, 377 Kegl, J. 297,377 Keller, R. 242, 320, 377 Kendon, A. 72, 245» 347» 377 Kiraly, L. 153» 373 Kita, S. 74,262,302,311,369, 377» 384 Kobayashi, H. 2 1 1 , 3 7 7 Koshima, S. 2 1 1 , 377 Krebs, J. 24,372 Kruger, A. 21,309,387 Kuhlmeier, V. 1 5 1 , 3 7 7 Kuteva, T. 250, 376

392

Lachman, M. 29, 368 Lambrecht, K. 178, 377 Langacker, R. 290, 317, 377 fLeavens, D. A. 46 f., 378 Lederberg, A. 148,180, 378 Leslie, A. 80,163, 219, 378 Levinson, S. 17, 223, 232, 368, 378, 386 Levinson, S. C. 17, 86, 221, 354, 373 Lewis, C. 354» 370 Lewis, D. 1 1 5 , 202, 235, 237, 354f-> 378 Liddell, S. K. 7 1 , 2 9 1 , 3 7 8 Liebal, K. 10 f., 40 f., 44,60,140, 143,156, 265,378 Lieven, E. 10,179, 379 Liszkowski, U. 1 0 , 1 2 5 , 1 3 1 , 133 f., 137fr., 144» 379» 387 Lollis, S. R 155,203,383 Lutrell, L. M. 214, 373 Maestripieri, D. 45, 56, 379 Markman, E. M. 136,145, 384 Marshall, C. R. 88,107, 371 Matthews, D. 1 1 , 1 7 9 , 3 7 9 Maynard-Smith, J. 24,379 McNeill, D. 7 1 , 1 6 7 f., 246, 379 McWhorter, J. 315, 3 79 Melis, A. 60,189 f., 197 f., 205, 208,215,233,380,388 MeltzofF, A. 58,380 Menzel, C. 47, 380 Mitani, J. C. 30, 215, 380, 388 Moll, H. 10,18, 59,141,143» 146,153 f-» 194» 364»38o, 387 Moore, C. 1 2 5 , 1 3 2 , 1 3 7 , 356, 367» 380, 385

Morton, E. S. 28,382 Mundy, P. 156f., 381 Mylander, C. 275,277,374 Nagell, K. 1 2 4 , 1 3 5 , 1 5 4 ^ 174ffo 370, 386 Namy, L. L. 160f., 165, 381 Nelson, K. 168,381 Nishida, T. 30, 380 Nowak, M. A. 2 1 5 , 3 8 1

Rendell, D. 29,382 Richerson, P. 2 1 , 1 8 6 , 229, 368,

383 Rivas, E. 1 1 , 50, 267, 270, 277 f., 383 Rochat, P. 1 5 1 , 1 6 1 , 1 6 4 , 383, 387 Rogers, S. J. 156,370,378 Ross, H. S. 155,203,383 Rumbaugh, D. M. 189, 375, 383

Okamoto-Barth, S. 60, 381 Olson, D. 362,381 O'Neill, D. 190, 381 f. Onishi, K. H. i53>38i O'Reilly, A. 125,384 Orlansky, M. 1 6 1 , 3 8 2 Owings, D. H. 28,382 Owren, M. J. 29, 382 Ozcaliskan, S. 166,179, 282, 382 Özyürek, A. 2 6 2 , 3 0 2 , 3 1 1 , 3 8 4

Sandler, W. 262, 297, 383 Savage-Rumbaugh, E. S. 50, 189, 269, 274, 3 7 5 Savage-Rumbaugh, S. 46,193, 271, 370, 383 Saylor, M. 139, 383 Schachter, S. 383 Schelling, T. C. 202,383 Schick, B. 160, 283, 383 Schwier, C. 153,384 Searle, J. R. 17, 84, 96 f., 9 9 , 1 1 1 ,

Padden, C. A. 279, 382 f. Panchanathan, S. 215,382 Pennington, B. F. 156,370 Pepperberg, I. M. 271, 382 Perner, J. 364,382 Pika, S. 60,378 Pinker, S. 293, 382 Pollick, A. 45, 382 Povinelli, D. J. 42 f., 57,149, 190,350,382fr.

Senghas, A. 2 6 2 , 2 9 7 , 3 0 2 , 3 1 1 , 377, 384 Seyfarth, R. M. 26 f., 29 f., 188,

254,354^362,384

371,384 Shatz, M. 125, 384 Shwe, H. L. 136,145, 384 Sigman, M. 156,381 Sigmund, K. 215, 381 Silk, J.B. 198,215,384 Smith, A. 320 Smith, I . H .

Quine, W. V. O. 70,170,383 Rakoczy, H. 10, 254, 364, 387 Ratner, H. 21,309,387 Ratner, N. 1 5 5 , 1 7 7 , 3 8 3

178,375

Spencer, P. 148,180, 385 Sperber, D. 1 0 , 1 7 , 8 7 , 1 0 1 , 1 0 3 , 1 0 6 , 1 4 7 , 2 2 1 , 354f., 385

Stanford, C. B. 385 Stern, D. N. 1 5 1 , 3 8 5 393

Stokoe,W. 71, 367 Striano, T. 1 3 4 , 1 6 1 , 1 6 4 , 1 9 3 » 203, 371, 379, 387 Strosberg, R. 172, 387 Sugiyama, Y. 39, 385

Vonk, J. 57, 35°, 383 fVygotskij, L. 21,388

Uzgiris, I. C. 225,388

Zacharski, R. 290, 375 Zahavi, A. 216, 389 Zuberbühler, K. 26f., 30, 387,

Warneken, F. 5 8 , 1 5 1 , 1 5 5 , 1 9 1 , 198, 203, 214, 378,388 Watts, D. 215,388 Waxman, S. R. 160,165, 381 Tanner, J. F. 3 8 ^ 3 8 5 Whiten, A. 224,388 Tinbergen, N. 33, 385 Wilcox, S. 71, 347, 367 Tomasello, M. 18, 21, 27, 31, Wilson, D. 17, 8 7 , 1 0 1 , 1 0 3 , 35,37, 40-44» 47, 50-53» 55> 106, 221, 354f., 385 58 ff., 6 2 , 1 1 5 , 1 2 4 f . , 133 ff., Wittek, A. 179,388 138 f., 1 4 6 , 1 5 1 , 1 5 3 ff, 161, 164,168 f., 1 7 2 - 1 7 6 , 1 7 9 , 1 8 8 , Wittgenstein, L. 5 , 1 2 , 1 5 , 24, 68 f., 9 1 , 1 2 1 , 1 8 3 , 248, 260, 190-194, 197 fo 203, 205, 208, 339, 354, 388f. 212, 214f., 233, 238,254, Woodward, A. 153,160, 389 265, 272, 285, 298f., 309, Wrangham, R. W. 27, 30,197, 333, 350, 357, 364, 367-371, 371, 376, 389 373,375-381,384-388 Wray,A. 240,376,389 Tomonaga, M. 192,388 Wynn, K. 1 5 1 , 377 Trevarthen, C. 1 5 1 , 3 8 8

Vauclair, J. 193, 367 Volterra, V. 1 2 4 , 1 3 0 , 1 3 4 , 367, 370

394

389

Sachregister Hinweis: Seitenzahlen, hinter denen ein A oder T steht, verweisen jeweils auf Abbildungen bzw. Tabellen. Abschiednehmen 99 Anm. 22 abwesende Gegenstände - Gebärdenspiel und 77 f., 80, 93 So-tun-als-ob und 166 Zeigegesten von Kleinkindern und 128 f., 13 8 f. Affen, und Rufe 27 f. Altruismus - Evolution und 18 f., 183 f., 214 - bei Kleinkindern 133 f. Amerikanische Zeichensprache (ASL) 250 Armhebegeste 3 3 f. Auffordern - Grammatik des 261, 263288 - als Grundmotiv 96 f. - Menschenaffen und 267-274, 279 f. - Mutualismus und 207-214 - ontogenetische Ursprünge des 149 f. - sprachliche Kommunikation von Kleinkindern und 177 - Zeigegesten von Kleinkindern als 127 f., 136 Aufmerksamkeit, Überwachung der 42 ff. Aufmerksamkeitsfänger 33, 64A - Beispiele 3 5 f. T, 3 8 f. -

-

Definition 3 8 f. Indirektheit von 40 f. Interpretation von 62 ff. Lernen von 37 fr. im Vergleich zu menschlicher Kommunikation 40 f. - Zeigegesten und 73 aufmerksamkeitslenkende Gesten siehe Zeigegesten Augenkontakt 48 f. Augenrichtung 2 1 1 f. siehe auch Folgen der Blickrichtung Autismus 134 f., 156 f. Bedauern 99 Anm. 22 Beduinen-Zeichensprache 262, 297 Blätterschneideverhalten 39 Dankbarkeit 99 A, 177 A, 222 f. deiktische Gesten siehe Zeigegesten deiktisches Zentrum 249 Anm. 76, 290 Deklarativa - Menschenaffen und 50 - Zeigegesten von Kleinkindern als 1 2 8 - 1 3 4 , 1 3 7 f. Demonstrativa 248 f., 249 Anm. 76 »Drift zum Arbiträren« - Entstehung konventioneller 395

Kommunikation und 235242 - in der Grammatik 295, 324 einfache Syntax 261, 264, 284 f., 336f. Emotionen - Motivationen, die durch E. kommuniziert werden 94 - Teilen von 227 f. - Vokalisierungen von Primaten und 27 ff. Entschuldigungen 177 Anm.93, 223 Ereignis-Mitspieler-Anordnung - in Erzählungen 302-309 - in der Kommunikation von Menschenaffen 272 - in der Sprache von Kleinkindern 283 f., 298 f. - Universalität der 330 f. - in Zeichensprachen 279, 296 f., 305 Erkennen geistiger Zustände 14 siehe auch rekursives Erkennen geistiger Zustände Erkennen von Intentionen 15 Erläuterung, Bitten um 94, 327 ernstzunehmende Syntax 261, 297 f. Erzählungen - Ereignis-Mitspieler-Anordnungin 302-309 - evolutionäre Bedeutung von 309 - Grammatik von 301-309 - komplexe Konstruktionen in 306-309 396

- kulturelle Verwendung von 302 ET (Film) 225 Evolution siehe auch Evolution des Menschen; Evolution menschlicher Kommunikation - gestische Kommunikation von Menschenaffen und 45 f. - Intentionsbewegungen und 3 2 f. - Rufe und 28 f. Evolution des Menschen siehe auch Evolution menschlicher Kommunikation - Kooperation in der 18 f., 183 f., 206 f. Evolution menschlicher Kommunikation - Genetik und 252 - Grammatik und 262 f., 312ff., 314 A, 333 f., 336f., 358 f. - Hypothesen über 22 f., 122 f., 347-359 - Kontingenz der 361 f. - kulturgeschichtliche Aspekte der 21, 262, 316, 328f., 336, 338 - psychologische Infrastruktur der 1 1 8 T - Sprache und 20 f. - Überblick über die 254-259, 339-347, 359f- Ursprünge der 1 3 , 1 8 - 2 3 , 256A, 336 Expressiva - fehlende soziale Normen für 229

-

Grammatik und 292, 308 f. Gruppenzugehörigkeit und 227 f. - Zeigegesten von Kleinkindern als 130-134 extravagante Syntax 261, 301309 Fairneß 201 f. Folgen der Blickrichtung 38 f., 73, 246 siehe auch Augenrichtung Fragen 96Anm.20 funktionale Reanalyse 325 f., 325 A Gebärdenspiel siehe auch Gebärdenspiel bei Kleinkindern - abwesende Gegenstände und 77 f., 80,94 - als Ergänzung zur sprachlichen Kommunikation 167 - Funktion des 71, 249 f. - Gegenstände als Referenten des 81 - gemeinsamer begrifflicher Hintergrund für 218 - Grenzen des 218, 236 - in Home-Sign-Gebärdensprachen 274-285 - Intentionsbewegungen und 73 - Interpretation von 77 - Kommunikation durch 1 2 f. - Konventionalisierung des 237-242 - Natürlichkeit des 20 - soziale Kognition und 13 - soziale Motivation und 13

- Überblick über 77-82 - als ursprüngliche menschliche Kommunikation 13 - als vorsprachliche Kommunikation 81 - Verwendungendes 78 - Vorteile von 218 f., 236 - Zeigegesten vs. 80 f. Gebärdenspiel bei Kleinkindern 81,159-168 - Gebrauch von 164 f. - kommunikative Absicht bei 163 - notwendige Bedingungen für 162 f. - So-tun-als-ob und 166 - sprachliche Kommunikation vs. 165 f., 281 f. gehörlose Personen siehe auch Home-Sign-Gebärdensprache; Nicaragua-Zeichensprache; Zeichensprache - Gebärdenspiel bei 8 1 , 1 6 2 - gestische Kommunikation bei 244 - Zeigegesten von Kleinkindern bei 147,180 geistige Feinabstimmung 68 ff. gemeinsame Aufmerksamkeit siehe auch gemeinsamer begrifflicher Hintergrund - Bedeutung von 15 - Definition 86,89 - Entstehung von 208 f. - Kleinkinder und 154 f., 156 - Menschen vs. Affen im Hinblick auf 193 ff. - Spracherwerb und 168, 1 7 1 ff. 397

- imperative 46-50 - kommunikative Wirksamkeit von 12 f. - konventionelle 159 f., 165 f. - obszöne 235 - praktisches Schlußfolgern und 61 - Schwäche von G. bei der Kommunikation 13 - Typen von 32-42, 35 f. T, 72f. - Überwachung der Aufmerksamkeit und 42 f. - Untersuchungen von 71 - Ursprung der Sprache in 72, 92 f., 1 1 6 , 1 7 6 f., 234f., 337, 348 ff. - Ursprünge von 21 - Vokalisierungen vs. 242 fr., 247 f., 349 f. - des Wiedererkennens 51 geteilte Intentionalität - Bedeutung von 84 - Definition 83 - Evolution des Menschen und 19 f. - fehlend bei Menschenaffen 1 1 9 > i95>35i - Kleinkinder und 153-159, 181, 343 f. - Kooperation und 18 ff., 83 f. - kooperative Kommunikation und 1 2 2 , 1 5 3 ff., 159, 205, 341 f., 350-357 - psychologische Bedingungen der 84 274 - Sprache als 362 f. - von Affen 19 f., 31-42,62-67, - Spracherwerb und 122 f., 264-274» 348 168-180

- Wahrnehmungsmodi und 210 Anm.41 - Zeigegesten von Kleinkindern und 132 fr. gemeinsame Gegenwart in der Wahrnehmung siehe gemeinsame Aufmerksamkeit gemeinsamer begrifflicher Hintergrund - abwärtsgerichtete Prozesse und 89 f. - aufwärtsgerichtete Prozesse und 89 - für Gebärdenspiel 218 - Grundlagendes 89f. - Kleinkinder und 140 ff., 153 f. - Kommunikation als komplementär zum 90 f. - für kooperative Kommunikation 85-93 - kulturelles Wissen und 90 - Spracherwerb und 169 ff. - für sprachliche Kommunikation 15 f., 68 ff., 1 1 2 - Sprachwandel und 327 f. - unmittelbare Wahrnehmungsumgebung und 89 - für Zeigegesten 14 f., 76, 217 f. Genetik 252 f. Geste des Rückenberührens 34> 36 Gesten 31-45 siehe auch Gebärdenspiel; Zeigegesten - Abfolgen von 42,43 f., 264-

398

-

sprachliche Kommunikation und 1 1 2 ff. - Universalität der 331 Grammatik - des Aufforderns 261, 263288 - und Ausdruck 292 - Definition 335 f. - Differenzierung der 261 - »Drift zum Arbiträren« in der 295,324 - Entwicklung der 294-298 - Evolution und 262 f., 3 1 2 ff, 314A, 333,336f.,358f. - fehlend bei der Kommunikation von Primaten 42 - im frühen Sprachgebrauch 281-285, 298f., 358 - Holophrasen und 241 - in Home-Sign-Gebärdensprachen 274f., 279-285 - des Informierens 261, 288301 - bei der Kommunikation von Menschenaffen 264 ff, 268274, 336f. - komplexe Konstruktionen in der 306-309 - Konventionen in der 293 fr., 316-336, 346f. - kulturelle Verschiedenartigkeit der 329 f. - der Nicaragua-Zeichensprache 294-298 - Normender 310-312 - und Sprachdifferenzierung 21 - Struktur in der 291 f., 297299, 307

- des Teilens 261 f. - des Teilens und der Erzählung 301-315 - Universalgrammatik 332 f. - Ursprünge der 285, 287 T, 336f., 345-347 Grammatikalität 310-312 Gricesche kommunikative Absicht siehe kommunikative Absicht Grüne Meerkatzen 28 f. Grüßen 99 A, 177 A Gruppenselektion 224-233, 334 f. Handlung - menschliche Kommunikation und 245 f. handlungsbasierte Gesten siehe Gebärdenspiel; Zeigegesten Helfen siehe auch informative Gesten - und Dankbarkeit 222 f. - als Grundmotiv 96 f. - indirekte Reziprozität und 215-223 - Mutualismus und 207-214 - Schimpansen und 2 1 1 , 214 f. - Zeigegesten von Kleinkindern als 133-135 Höflichkeit 102,145 f., 223, 230, 232 Holophrasen 240 f. Home-Sign-Gebärdensprachen 244, 274-281, 295, 302 Homostadium 257, 263 f., 286 Hunde und die ObjektwahlAufgabe 5 4 f.

399

Identifikation (von Ereignissen, Gegenständen und Mitspielern) 289-291, 306 f. ikonische Gesten siehe Gebärdenspiel ikonisches Verhalten 38 Imitation - Lernen von Affen kein Imitationslernen 3 6 f. - menschliche Fertigkeiten der 2 1 , 1 1 5 f. - durch Rollentausch u s f . , 236-239 - soziale Funktion der 225 f., 229 Imperative siehe auch Zeigegesten - von Affen 46-51 - Bedeutungen von 96 - individualistische vs. kooperative 134 f. - Zeigegesten von Kleinkindern als 130 f., 134 f. indirekte Reziprozität - kooperative Kommunikation und 185 - Rufund 216 - Schimpansen und 215 Indirektheit in der Kommunikation 41,46,65 siehe auch referentielle Intentionen; triadische Kommunikation individualistische Imperative 134 individuelle Intentionalität - Affen und 1 9 1 , 1 9 5 , 3 5 0 - Kleinkinder und 152f., 156 - Universalität der 331 f. 400

individuelle Ziele 108 f. informative Gesten siehe auch Helfen; Informieren - Benutzer von Home-SignGebärdensprachen und 280 f. - Menschenaffen und 51 - ontogenetische Ursprünge von 1 5 1 f. - Zeigegesten von Kleinkindern als 130 f., 134 f. Informieren siehe auch Helfen; informative Zeigegesten - als Grundmotiv 97 f. - Grammatik des 261 - Herausforderungen der Kommunikation beim 289 - sprachliche Kommunikation von Kleinkindern und 177 - Teilen vs. 226 f. Inhaltswörter 249 Anm.76, 250 intentionale Kommunikation - Definition 25 - Gesten 31-44 - von Menschenaffen 56-65,

35if.

-

und Objektwahl-Aufgabe

5if.

zwischen Primaten und Menschen 44-56 - im Reich der Biologie 25 f. Intentionalität siehe auch kommunikative Absicht; individuelle Intentionalität; geteilte Intentionalität - Handeln und 245 - bei der Kommunikation von Menschenaffen 56-65 - ontogenetische Ursprünge der 152-157

- Verstehen von 57-62 Intentionsbewegungen 63 f. A - Bedeutung von 38,65 - Beispiele von 3 4 * 3 5 ^ , 3 6 - Definition 33 - Gebärdenspiel und 73 - Interpretation von 63 - Lernen von 33 f., 37 f. - Menschen und 200 f. - Schimpansen und 187 f., 195-199,215 Intonationseinheiten 286 Anm. 24

kation 159 f., 165 f., 281-285,

298f., 357f. - Teilen bei 98 f. - und die Wahrnehmungen anderer 60 f. - und Ziele anderer 5 8 ff. - Zusammenarbeit von 204 f. kognitive Fertigkeiten - kooperative Kommunikation und 85-93,364 Kommentare 275 f. Kommunikation siehe auch Evolution menschlicher Jargon 315 Kommunikation; Gesten; Sprache; Gebärdenspiel; Kanzi 266, 269 f., 271 Zeigegesten Kasusmarkierung 284, 298, - biologische 24 f. - Kompromisse bei der 326 f. 3i9f. - kooperative Infrastruktur der Kleinkinder siehe auch Gebär18 denspiel von Kleinkindern; - kooperative Natur der 17 ff. Zeigegesten von Kleinkin- soziale Motivation für 15 f. dern - Bedeutung der Untersuchung Kommunikationsdisplays 25 Kommunikationshandlung, der Kommunikation von Hervorhebung der 100 f., 121 103 f., 143 f. - und gemeinsamer begriffKommunikationskonventionen licher Hintergrund 15 3 f. - »Drift zum Arbiträren« und - und geteilte Intentionalität 235-242 1 5 3 - 1 5 8 , 1 8 1 , 342f., 354f. - Infrastruktur der Kommuni- - Eigenschaften von 235 kation bei 180 ff. - Entstehung von 234-254, - konventionelle Gesten 357 ffvon 159 f., 164 f. - geteilte Intentionalität und - und kooperative Kommuni1 1 2 ff. kation 1 2 2 , 1 4 7 , 354 - als geteilte Kommunikations- praktisches Schlußfolgern bei mittel 1 1 5 ff. 153 - Grammatik und 293 f., - und sprachliche Kommuni345 ff401

-

natürliche Kommunikation vs. 1 1 2 ff. - für Sprachkonstruktionen 316-336 - stimmliche Modalität und 242-254 - Syntax und 289-294 - Ursprünge von 238 f., 241 f. Kommunikationssignale 25 f. kommunikative Absicht - Gebärdenspiel und 218 f. - Helfen und 219 fr. - Kleinkinder und 143-146, 163 - kooperative Kommunikation und 100-107 - soziale Normen, die die k. A. leiten 230 fr. - bei der sprachlichen Kommunikation 1 1 3 Kompromiß, kommunikativer 326 f. Konkurrenzexperimente 51 f.,

59 f. Kontext siehe gemeinsamer begrifflicher Hintergrund Konventionen siehe Kommunikationskonventionen; Sprachkonventionen Kooperation siehe Kooperationsmodell menschlicher Kommunikation; Zusammenarbeit und Kooperation Kooperationsmodell menschlicher Kommunikation 831 1 2 siehe auch kooperative Kommunikation - evolutionäre Ursprünge des 183 f. 402

-

Gebärdenspiel von Kleinkindern und 159-168 - geteilte Intentionalität und 83 f. - Infrastruktur für 180 ff, 183 ff - Rekursivität bei 106 ff - Spracherwerb und 168-180 - wechselseitige Annahmen bei 100-108 - Zeigegesten von Kleinkindern und 123-158 - zugrundeliegende kognitive Fertigkeiten 85-94 - zugrundeliegende soziale Motivationen 94-99 - Zusammenfassung des 108 ff, 1 1 0 A , 1 1 9 f. kooperative Imperative 134 f. kooperative Kommunikation 68-120 siehe auch Kooperationsmodell menschlicher Kommunikation - Eigenschaftender 25f. - Entstehung von (siehe Ursprünge der) evolutionären Vorteile von 183 f. - Gebärdenspiel und 77-82 - Gesten und 71 ff. - geteilte Intentionalität als Grundlage von 122, 153 ff, 159, 205, 341 f., 350357 - gestische Kommunikation bei Kleinkindern und 122, 147f-> 354 - indirekte Reziprozität und 214-223

-

Infrastruktur für 18, 203 fF., 341 f. kognitive Fertigkeiten für 85-93 Konventionen und 1 1 2 - 1 1 7 kulturelle Gruppenselektion und 224-233 Mißbrauch der 204, 232 f. Modelider 83-112 Mutualismus und 207-214 psychologische Infrastruktur der 1 1 ST soziale Motivationen für 94-

99 - Teilen und 226 ff. - Ursprünge der 19,148, 158 A, 1 6 4 , 1 8 1 , 1 8 3 f., 205234, 343 ff- wechselseitige Annahmen bei 100-108 - Zeigegesten und 73-77 - Zusammenarbeit und 203 ff. kooperatives Schlußfolgern 105 f. Kopfrichtung 2 1 1 Kreolensprachen 315 f. Kultur - evolutionäre Entwicklungen, die von der K. abhängen 21, 261 f., 316, 328f., 335 f-> 337 - gemeinsamer begrifflicher Hintergrund in einer 90 - menschliche Zusammenarbeit und 200 f. kulturelle Gruppenselektion siehe Gruppenselektion kulturelles Lernen 2 1 , 1 1 5 , 224 f. siehe auch soziales Lernen

Lebensformen 15, 3 6 2 f. siehe auch gemeinsamer begrifflicher Hintergrund Lernen - von Aufmerksamkeitsfängern 39-40 - einfaches vs. komplexes 57 - durch Imitation 3 6 f. - von Intentionsbewegungen 32 f., 36f. - Interaktion zwischen Affen und Menschen und 46 - ontogenetisches 3 2 f., 3 6 f. Linguistik 318 Lügen - Grundlage des 19, 205, 232 - soziale Normen und 232 f. Makaken 29 Menschen - Jagdverhalten von 200 f. - und Menschenaffen als Kommunikationspartner 266-274 - und Tiere als Kommunikationspartner 12 - Zusammenarbeit und Kooperation von 200-205 Menschenaffen siehe auch Affen, Schimpansen; Primaten - und Aufforderungen 267274, 279 f. - Benutzer von Home-SignGebärdensprachen im Vergleich zu 279 ff. - und das Erkennen von Rationalität 5 8 f. - fehlende kooperative Kommunikation bei 49, 64 f.

403

-

-

fehlende soziale Imitation und Konformität bei 229 flexible Kommunikation von 56 f., 348 f. Gesten von 19 f., 31-41, 6267, 264-274, 348 Gruppentätigkeiten von 207 f. intentionale Kommunikation von 56-65, 351 f. und Kommunikation mit Menschen 46-53, 56 menschliche Kommunikation abgeleitet von 46,67, 339 ff. menschliche Kommunikation mit 266-274 menschliche Kommunikation im Vergleich zu 72 f. und die Objektwahl-Aufgabe 5iff. referentielle Intentionen von

41,49,63 -

»sprachliche« 272f., 352 Überwachung der Aufmerksamkeit von 42 ff. - und die Wahrnehmung anderer 59 f., 189,194 - Zeigegesten von 46-50 - und Ziele von anderen 57 ff., 189,194 - Verstehen von Rufen bei 26 f. - Vokalisierungen von 19, 26 f. menschliche Kommunikation siehe auch kooperative Kommunikation; Evolution der menschlichen Kommuni404

kation; Sprache; sprachliche Kommunikation - Einzigartigkeit der 1 1 1 - gemeinsamer Hintergrund komplementär zu 90 f. - Gesten von Affen als Vorläufer der 45, 67, 340 f. - Handlungen als Grundlage für 245 f. - Kommunikation von Affen im Vergleich zu 7 2 f. - Kommunikation von Primaten im Vergleich zu 30 f., 41, 64 f. - Kooperationsmodelider 83112 - Normen, die den produktiven Aspekt der m. K. steuern 103-105 - Normen, die den Verstehensaspekt der m. K. steuern 103-105 - praktisches Schlußfolgern bei 105 f. - psychologische Infrastruktur der 1 1 8 T - soziale Normen bezüglich der 103-105,146 f. - Ursprünge der 68-70 Mißverständnisse 179 Anm. 97 Motivation siehe soziale Motivation Mutualismus 142-147 natürliche Kommunikation - Definition 293 f. - in fremden Situationen 253 - handlungsbasierte Gesten als 186, 2 3 5 , 2 5 0 t , 3 5 4 ^ 2 5 5

- konventionelle vs. 186,235, 250f., 294 Neues - Denken von Affen über 60 f. - Kommunikation über 178 Nicaragua-Zeichensprache 244, 262, 294-299, 302, 3 1 1 Nomina 250 Normen siehe soziale Normen; soziale Normen der Kommunikation Objektwahl-Aufgabe 51-55, 143 f. obszöne Gesten 235 öffentlicher Raum - Erzeuger von 230 ff. - kommunikative Absicht als Vökalisierung und 247 ontogenetische Ritualisierung 33 f-> 36 f. ontogenetische Ursprünge menschlicher Kommunikation 1 2 1 - 1 8 2 - Auffordern 148 f. - frühe Sprache 168-180 - Gebärdenspiel von Kleinkindern 159-168 - Informieren 149 f. - Intentionalität 152-157, -

342f.,352f.

Teilen 149 Zeigegesten von Kleinkindern 1 2 3 - 1 5 9 , 1 5 8 A , 342f.

Pädagogik 216 perspektivische kognitive Repräsentationen 364

Phänomene der unsichtbaren Hand 320, 337 phylogenetische Ursprünge menschlicher Kommunikation - konventionelle Kommunikation 234-254 - kooperative Kommunikation 206-234 - Zusammenarbeit 186-205 Pidginsprachen 315 Pivotschemata 283 f. Prahlen 216 praktisches Schlußfolgern - und Gesten 61 - Kleinkinder und 153 f. - bei Menschenaffen 60 f. - bei menschlicher Kommunikation 106 - soziale Interaktion, gestützt auf 61 Primaten siehe auch Menschenaffen; Schimpansen; Affen - fehlende soziale Motivation für die Kommunikation bei 16 - Gesten von 31 -45, 66 f. - und Kommunikation mit Menschen 46-53 - stimmliche Displays von 2631, 65 f. Primatenkommunikation - im Vergleich zu menschlicher Kommunikation 64 f. Prozesse der dritten Art 242, 320

405

Rationalität, das Verstehen von R. - bei Menschenaffen 5 8 f. Raum (in der NicaraguaZeichensprache) 277 f. referentielle Intentionen - von Menschenaffen 40,49, 63 - bei menschlicher Kommunikation 108 - in der sprachlichen Kommunikation 1 1 4 - bei Zeigegesten 74 ff. - Zeigegesten von Kleinkindern und 137 ff., 1 4 1 f. referentielle Kommunikation 39 rekursives Erkennen geistiger Zustände 108, 202 f., 213, 237, 34 1 » 355 fRekursivität (bei kooperativer Kommunikation) 106 ff., 1 1 5 Relativsätze 306 f. Reziprozität, indirekte siehe indirekte Reziprozität Ritualisierung - ontogenetische 32 ff., 36f. - phylogenetische 3 2 f. Ruf 215 f., 223, 232 Schimpansen siehe auch Menschenaffen; Primaten - Gestensignale von 34, 35 T, 36-40 - Gruppentätigkeiten von 187-199,211 - Hilfeverhalten bei 2 1 1 , 214 f. - Jagdverhalten von 187 f., 195-199, 214f406

-

Rufe von 30 Untersuchung der Zusammenarbeit von 191-195 - und Zeichensprache 267 Schlüsse 5 5 f. So-tun-als-ob 166 soziale Identifikation 185 soziale Intention - bei menschlicher Kommunikation 108 f. - Universalität der 331 - bei Zeigegesten 73 ff. - Zeigegesten von Kleinkindern und 140 f. soziale Kognition 13 soziales Lernen 237 siehe auch kulturelles Lernen soziale Motivation siehe auch Kooperation - Auffordern als 96 f. - emotionale Kommunikation von 94 f. - Gebärdenspiel und 13 - Grundtypender 96-99 - Helfen als 97 f. - zur Kommunikation 16 f., 94-99 zur sprachlichen Kommunikation 1 1 2 - Teilen als 98 f. - Universalität der 331 - Zeigegesten und 13 - Zeigegesten von Kleinkindern und 130-136 soziale Normen siehe auch soziale Normen der Kommunikation - Entstehung von 224,310 - Grammatikalität und 310 f. -

-

Zusammenhalt der Gruppe verstärkt durch 226, 228 soziale Normen der Kommunikation - Entstehung von 228 - Expressiva fallen nicht unter 229 - Kleinkinder und 146 f. - und kommunikative Absicht 230 ff. - wechselseitige Erwartungen und 104 sozial-pragmatische Theorie des Spracherwerbs 168 ff. Sprache siehe auch Menschliche Kommunikation; Sprachliche Kommunikation - als Aktivität und nicht als Gegenstand 362 f. - Arbitrarität von 20 - Differenzierung der 21, 260, 318f., 329 t , 333 f. - geistige Feinabstimmung und 68 ff. - als geteilte Intentionalität 362 f. - Konventionalisierung der 316-336 - normative Struktur und 301 f., 310 f. - unkodierte Kommunikation und 68 ff. - Universalien in der 330-336 - Ursprünge der 20 f., 72,92 f., 1 1 6 , 1 7 5 f., 234£» 338, 347359 - Wandel der 316,318-329 Spracherwerb

- Erwerb von Konventionen und 169-176 - Gebärdenspiel vs. 165 f. - Gebrauch von Konventionen und 176-179 - geteilte Intentionalität und 122 f., 168-180 - Zeigegesten und 177 f. sprachliche Kommunikation siehe auch Sprache - gemeinsamer begrifflicher Hintergrund für 15,68 ff., 112 - Kleinkinder und 160 f., 165 f., 177f., 281-285, 298 f. - kommunikative Absicht bei 113 - Motive für 1 1 3 , 1 7 7 - referentielle Intentionen bei 114 - als soziales Handeln 363 Sprachkonstruktionen 316-319 Sprachkonventionen - Erwerb von 168-176 - Gebrauch von 176-179 Sprachuniversalien 330-334 Sprachwandel 316,318-329 - gemeinsamer begrifflicher Hintergrund und 327 f. - Gruppenselektion und 334 f. - kognitive Dimension des 320-324 - Quellen des 319 f., 328 f. - Weitergabe des S. zwischen den Generationen 324 fr.,

325A

Strategie des Herumgehens 44 f. Struktur, grammatikalische 291 f., 297 ff., 307

407

Syntax - einfache 260, 263, 284f., 336 - ernstzunehmende 260, 298 f. - extravagante 261,302-310 - komplexe 306-309 - konventionelle Hilfsmittel bei 289-294 Täuschung siehe Lügen Teilen - Grammatik des 261 f., 301-

315 -

als Grundmotiv 97 f. Gruppenzugehörigkeit und 226 ff. - Informieren vs. 226 f. - von Kleinkindern 97 f., 130134,177 - Konventionen und 237 - kooperative Kommunikation und 226 ff. - ontogenetische Ursprünge des 1 5 1 Tiere - menschliche Kommunikation mit 12 - Sozialverhalten von 254 tote Metaphern 239 Tratsch 216 triadische Kommunikation 39 siehe auch referentielle Intentionen Ultimatum-Spiel 201 f. Verantwortungszuweisung (im Verstehensprozeß) 325 f., 327 Verben 250 408

Verbinselkonstruktionen 299 verborgene Urheberschaft 102, 146, 230 f. Verfolgen der Referenz 304 f. Verhaltensweisen des »Anbietens« 39 Verstehen - von Intentionalität 57-62 - von Rufen 26 f., 29 - Sprachwandel und 3 24 f. - von Zeigegesten 26 f., 29 »Vogelperspektive« 108,193, 264 Vokalisierungen - Demonstrativaals 248f. - Emotionen gebunden an 28 ff. - evolutionäre Selektion von 28 f., 250 ff. - flexibles Verstehen von 26 f., 29 - Gebärdenspiel und 250 - Gesten vs. 242-245 - Grenzender 242f. - kommunikative Konventionen und 242-254 - Mangel an Flexibilität von 27 ff. - menschliche Kommunikation im Vergleich zu 30 f. - Öffentlichkeit der 247 - referentielle Kommunikation und 242 f. - Übergang zu 241 ff., 251 f., 262 f. - ein mit V. verbundenes Gen 251 f. - Vorteile von 246 f. - Zuhörerschaft von 29 f.

WagenheberefFekt 309 Wahrnehmungen, das Verstehen von W. anderer bei Menschenaffen 59 f., 190, 194

Warnrufe 26-29 Washoe 267, 271 wechselseitige Annahmen - kooperative Kommunikation und 100-108 - Zeigegesten von Kleinkindern und 143-147 wechselseitige Offenkundigkeit 106,355 wechselseitiges Wissen 106,355 Wir-Intentionalität 3 5 5 f. Wortreihenfolge - Benutzer von HomeSign-Gebärdensprachen und 279 f. - bei der Ereignis-MitspielerAnordnung 319 f. - im frühen Sprachgebrauch 284 - Menschenaffen und 268, 271 - in Zeichensprachen 291 f., 297 ff. Zeichen für Handlungen 277 f. T Zeichensprache siehe auch Beduinen-Zeichensprache; Home-Sign-Gebärdensprache; Nicaragua-Zeichensprache - Ereignisstruktur in einer 291 f., 297 f. - grammatikalische Entwicklung der 262 f.

- Komplexität der 71 - Menschenaffen und 48, 267 - Ungeeignetheit einer Z. für die Erforschung von Gesten

71 Zeigegesten siehe auch Zeigegesten bei Kleinkindern - Aufmerksamkeitsfänger und 73 - Beispiele von 74 f. - deklarative 51 - Demonstrativa und 248 f. - Flexibilität von 47 - Funktion von 72 - Gebärdenspiel vs. 80 f. - gemeinsamer begrifflicher Hintergrund für 15 f., 76, 217 f. - Grenzen von 217 f. - informative 51 - Kommunikation durch 12 f. - Komplexität der Kommunikation bei 15 ff., 75 - Lernen von 47 - Menschenaffen und 46-50 - Mutualismus und 212 - Natürlichkeit von 20 - soziale Intention bei 74 ff. - soziale Kognition und 13 - soziale Motivation und 13 - Überblick über 73-77 - referentielle Intention bei 74 ff. - als ursprüngliche menschliche Kommunikation 13 - des Wiedererkennens 51 - Verschiedenartigkeit der Kommunikation bei 75 - Verstehen von 5 i f f . 409

-

als vorsprachliche Kommunikation 76 f. Zeigegesten bei Kleinkindern 77,123-148 - abwesende Gegenstände und 129 f., 138 f. - als Aufforderung 128 f., 145 - Beginn der 1 2 3 , 1 4 9 f. - als deklarative Handlung 129-134, i 3 7 f . - Erforschung der 124 f. - bei Gehörlosen 147 f., 180 - gemeinsamer begrifflicher Hintergrund für 140 ff. - geteilte Intentionalität und 153-158,342 f. - als Hilfe 133 f. - als Imperativ 130 f., 134 f. - Interpretationen von 125 - kommunikative Absicht bei 143-147 - Motive für 1 2 4 , 1 3 0 - 1 3 6 - sprachliche Kommunikation und 178 f., 281 f. - referentielle Intentionen und 137 ff., 141 f. - als Teilen 130-134 - Ursprünge der 124 f., 148158,158 A - Vielfalt der Bedeutungen von 128 f. - Vorherrschen von 164 f. - wechselseitige Annahmen u n d

1 4 3 - 1 4 7

Ziele - gemeinsame 191-195, 208 f. - individuelle vs. gemeinschaftliche 191-195 - Verstehen der Z. anderer bei Affen 57ff„ 190,194 Zusammenarbeit und Kooperation siehe auch Kooperationsmodell der menschlichen Kommunikation; soziale Motivation - Entstehung von 186-205 - geteilte Intentionalität als Grundlage von 17 ff., 83 ff., 183 f. - bei Kleinkindern 203 - Kommunikation beruhend auf 17 ff. - Kommunikation unter Menschenaffen und 49,64 f., 332 f. - kooperative Kommunikation und 203-206, 343 ff., 363 f. - Menschen vs. Menschenaffen im Hinblick auf 191-195, 207 f. - menschliche 17 ff., 183 f., 200-205, 254f. - mutualistische 207-214 - Schimpansen und 187-199 - bei Tieren 254