Dans le labyrinthe du langage: Langage et philosophie dans les grammaires de Chomsky 2745355457, 9782745355454

La pensée de Noam Chomsky sur le langage ne se réduit pas aux innovations théoriques qui ont fait la réputation de leur

336 111 103MB

French Pages 274 [265] Year 2021

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Dans le labyrinthe du langage: Langage et philosophie dans les grammaires de Chomsky
 2745355457, 9782745355454

Citation preview

Alain Rouveret







an a e et p 1 osop te • ans es rammatres e oms

,

HONORE CHAMPION PARIS

BIBLIOTHÈQUE DE GRAMMAIRE ET DE LINGUISTIQUE Collection dirigée par Olivier Soutet

64

DANS LE LABY THE DU LANGAGE

DÉCOUVREZ TOUS LES TITRES DE LA COLLECTION ET DES ÉDITIONS HONORÉ CHAMPION SUR NOTRE SITE

www.honorechampion.com

Alain ROUVERET

Langage et philosophie dans les grammaires de Chomsky

PARIS HONORÉ CHAMPION ÉDITEUR 2021 www.honorechampion.com

Ouvrage publié avec le soutien du Labex Empirical Foundations ofLinguistics (ANR-10-LABX-0083) de 1'Université de Paris

,

Diffusion hors France: Editions Slatkine, Genève www.slatkine.com © 2021. Éditions Champion, Paris. Reproduction et traduction, même partielles, interdites. Tous droits réservés pour tous les pays. ISSN: 1278-3889 ISBN: 978-2-7453-5545-4 e-ISBN: 978-2-7453-5546-1

Pour Alice et Aurélien

REMERCIEMENTS

Ma reconnaissance va tout d'abord à Olivier Soutet pour avoir bien voulu accueillir ce livre dans la collection Bibliothèque de grammaire et de linguistique qu'il dirige chez Honoré Champion. Le texte publié a considérablement bénéficié de son expertise de linguiste et de ses commentaires critiques et constructifs sur différentes versions de ce travail. Je remercie également pour leurs précieux commentaires les amies et amis, linguistes, philosophes ou archéologues, qui ont bien voulu échanger avec moi sur les thèmes abordés dans ce livre ou qui, après lecture du manuscrit, rn' ont suggéré des modifications souvent décisives : Nora Boneh, Henri-Paul Francfort, Robert Freidin, Matthieu Haumesser, Jean Lowenstamm, Airton Pollini, Patrie Sauzet, Benjamin Spector, George Tsoulas et Christine Tellier. Ils ne partagent pas nécessairement toutes les positions défendues dans ce livre. Je suis bien sûr seul responsable des erreurs qui peuvent subsister. Outre les textes de Chomsky lui-même, j'ai largement utilisé les interviews réalisées par McGilvray et réunies sous le titre The Science of Language et les échanges de Chomsky avec plusieurs philosophes de l'esprit et philosophes des sciences dans le recueil Chomsky and his Critics, édité par Louise Antony et Norbert Homstein. Ce livre doit également beaucoup à l'Introduction à une science du langage de Jean-Claude Milner, à l'ouvrage de Neil Smith, Chomsky: Ideas and Ideals, qui poursuit un objectif en partie analogue au mien, et à l'essai de Delphine Blitman, Le langage est-il inné ?, qui aborde les questions soulevées par l'innéisme chomskyen dans une perspective philosophique. La publication de ce livre a bénéficié du soutien financier du Labex Empirical Foundations of Linguistics (ANR-10-LABX-0083). Que le Labex EFL et le Laboratoire de Linguistique Formelle (UMR 7110 du CNRS) qui est l'une de ses composantes trouvent ici l'expression de ma reconnaissance. •

REPÈRES BIOGRAPHIQUES

1

Avram Noam Chomsky est né à Philadelphie le 7 décembre 1928. Il est le fils d'Elsie Simonofsky et de Zeev William Chomsky. Ce dernier avait fui la Russie tsariste au début du siècle dernier pour échapper à la conscription. Après des débuts difficiles à Baltimore, William et sa femme déménagent à Philadelphie où ils enseignent à l'école religieuse de la congrégation Mikveh Israel, école dont William devient ensuite le directeur. Nommé professeur au collège universitaire de Gratz, la plus ancienne école normale des Etats-Unis, puis président de ce collège, il devient un spécialiste renommé de l'hébreu et des études sémitiques. Il est en particulier l'auteur de Hebrew: the Eternal Language (1958). Chomsky semble être venu à la linguistique par le biais de la philologie classique apprise de son père. La mère de Noam, plus à gauche que son mari, a éveillé très tôt chez son fils un intérêt pour les questions sociales et politiques. Chomsky, pendant son enfance et son adolescence, a pu observer les effets sociaux dévastateurs de la grande dépression et a été confronté dans son quartier à l'antisémitisme des communautés d'immigrés catholiques. Il est scolarisé très jeune à l'école Oak Lane Country Day School, un établissement qu'il devait fréquenter jusqu'à sa douzième année et dont 1' enseignement était organisé suivant les principes philosophiques de John Dewey, favorisant la créativité et l'épanouissement intellectuel. En 1939, à 10 ans, il publie dans le journal de l'école un éditorial sur la chute de Barcelone. Son expérience de l'enseignement secondaire dans un établissement favorisant la compétition et l'esprit de collège est beaucoup moins satisfaisante. Il lit Dickens, Dostoïevski, Hugo, Twain, Zola, puis Animal Farm d'Orwell, et plus tard Hamage to Catalonia. A la fin de son adolescence, il découvre Bertrand Russell, qui sera pour lui le modèle de l'intellectuel engagé et s'intéresse de plus en plus aux positions anarchistes et libertaires. En 1945, à 16 ans, Chomsky entre à l'Université de Pennsylvanie (UPenn). Déçu par la rigidité et le conservatisme du monde académique, ?

1

Toutes les informations biographiques concernant le jeune Chomsky sont empruntées à Lyons (1991) et Barsky (1997).

12

DANS LE LABYRINTHE DU LANGAGE

il pense partir en Israël dans un kibboutz. Mais, comme beaucoup d'in, tellectuels, il est opposé à la création d'un état juif en Palestine. A UPenn, il rencontre Zellig Harris, fasciné tout autant par son ouverture d'esprit et ses idées politiques socialistes et libertaires que par sa théorie linguistique. Harris présente Chomsky à quelques grandes figures de la psychanalyse et l'incite à s'inscrire au cours de philosophie de Nelson Goodman. En 1951, grâce à Nelson Goodman, il accède au statut de Junior Fellow of the Society ofFellows de l'Université d'Harvard à Cambridge dans le Massachusetts. Il y reste jusqu'en 1955 et rencontre Yehoshua Bar-Hillel, Eric Lenneberg, Willard van Orman Quine, Roman Jakobson, Morris Halle. En 1953, Noam et Carol Chomsky passent six semaines dans le kibboutz Ha-Zorea en Israël. Chomsky, considéré comme sans qualification, est employé comme ouvrier agricole. Il est gêné par le « conformisme idéologique», le «racisme institutionnalisé» et surtout par le fait que «ces juifs allemands, buberistes de gauche, très cultivés et fins, ne le 2 voyaient même pas». En 1954, soutenu par Zellig Harris, il rejoint au Massachusetts Institute ofTechnology (MIT) un projet de traduction automatique, dirigé par Victor Yngve. En 1955, il obtient son doctorat à UPenn sur la base d'un seul chapitre de thèse. La même année, Jakobson le fait entrer au MIT, où il commence par enseigner la philosophie en premier cycle, cherchant à contribuer, selon ses dires, à la formation d'un département de philosophie réputé. La fin des années 50 est marquée par trois événements fondateurs dans la carrière de Chomsky. En 1957, Syntactic Structures, son premier livre édité, paraît chez Mouton. En 1959, il publie dans la revue Language un compte-rendu destructeur du livre Verbal Behavior du psychologue béhavioriste Burrhus Skinner. La même année, un programme de 3è cycle en linguistique est créé au MIT. De 1964 au début des années 70, Chomsky déploie une intense activité de publication: voient le jour deux livres fondamentaux de la linguistique contemporaine, Aspects of the The ory of Syntax ( 1965) et Sound Pattern of English (1968), synthèse de la phonologie générative, co-écrit avec Morris Halle, des recueils qui reposent sur des cycles de conférences, Current Issues in Linguistic Theory (1964), Tapies in the 2

Voir Barsky 1997 : 107. Les expressions et le passage entre guillemets reprennent les mots de Chomsky.

REPÈRES BIOGRAPHIQUES

13

Theory of Generative Grammar (1966), Language and Mind (1968, 1972), et un livre sur 1'histoire de la pensée rationaliste sur le langage, Cartesian Linguistics (1966). C'est aussi la période qui voit les débuts de la carrière militante de Chomsky. En 1965, il participe à la première grande manifestation publique contre la guerre du Vietnam sur le Boston Common. Il est coorganisateur avec Norman Mailer et d'autres de la marche du Pentagone à Washington, le 20 octobre 1967, destinée à soutenir les objecteurs de conscience. Mais il s'interroge sur les objectifs des mouvements étudiants et critique les manifestations de Berkeley ( 1966) et de ' Columbia (1968). A la fin des années 60 et au début des années 70, il anime des débats contre la guerre du Vietnam dans des églises, dans des lieux de plein air. En 1969, il publie American Power and the New Mandarins, critique vigoureuse de la politique extérieure américaine. Ce d'autres, des années 70 à aujourd'hui, livre a été suivi de beaucoup , portant sur l'implication des Etats-Unis en Amérique centrale, au MoyenOrient, au Cambodge, dans la guerre du Golfe. Les années 1967-1972 ont aussi été marquées par le débat suscité par la sémantique générative, une approche transformationnelle qui considère la représentation sémantique d'une phrase comme sa structure syntaxique sous-j acente et où les règles de la syntaxe s'appliquent à ces représentations pour dériver les structures de surface. Cette approche, à laquelle s'opposait la sémantique dite interprétative de Ray Jackendoff, était défendue par George Lakoff, James McCawley, Paul Postal et John Robert Ross. Chomsky, qui à l'époque était totalement accaparé par son activité militante contre la guerre du Vietnam, a assisté à 1' émergence de ce mouvement avec un immense déplaisir. Les articles qu'il a écrits contre la sémantique générative ou en faveur de l'approche concurrente sont réunis dans Studies on Semantics in Generative Grammar. C'est aussi au début des années 70 qu'il écrit l'un des articles majeurs de la grammaire transformationnelle, «Conditions on transformations», qui pose les fondements d'une théorie de la localité (l'article circulait à MIT à l'automne 1971 et est paru dans un recueil collectif en 1973). C'est en 1975, vingt ans après avoir été écrite, qu'est publiée sa thèse de doctorat The Logical Structure ofLinguistic Theory (575 pages). La réflexion de Chomsky s'étend désormais à des questions fondamentales qui intéressent la linguistique générale. Elle est exposée dans plusieurs livres non techniques. Après Language and Mind (1968), on peut citer Problems of Knowledge and Freedom (1972), Rejlections on Language (1975), Rules and Representations (1980), Knowledge of

14

DANS LE LABYRINTHE DU LANGAGE

Language. Its Nature, Origin, and Use (1986), Language and Problems ofKnowledge. The Managua Lectures (1988), ainsi que les publications reprenant ses échanges avec d'autres linguistes, Dialogues avec Mitsou Ronat (1977), The Generative Enterprise (1982), entretiens avec Riny Huybregts et Henk van Riemsdijk. En avril 1979, il donne un cycle de conférences à la Scuola Normale Superiore de Pise, présentation systématique du nouveau modèle des principes et paramètres. Les nombreux linguistes qui assistaient à l' événement ont eu le sentiment de se trouver pour la première fois confrontés à une théorie englobant l'ensemble du champ grammatical. Le livre issu de ces conférences, Lectures on Government and Binding, inaugure une période particulièrement intense et fructueuse de la recherche, pendant laquelle ont été caractérisées formellement et comparées les structures syntaxiques de langues de familles diverses (indo-européenne, sémitique, de l'Asie du sud-est), aboutissant à un accroissement considérable des connaissances empiriques sur ces langues. La même année, persuadé de défendre la liberté d'expression et la liberté académique, Chomsky se laisse convaincre de signer une pétition, puis d'écrire un essai prenant la défense de Faurisson, porte-drapeau du négationnisme en France. Ce texte a été utilisé ensuite, sans son accord, comme préface d'un livre publié à la Vieille Taupe, où Faurisson met en doute 1'existence des chambres à gaz pendant la deuxième guerre mondiale. Cette incursion malheureuse dans le débat sur le négationnisme heurte profondément l'opinion française. En engageant ainsi sa personne morale, Chomsky n'a clairement pas mesuré la gravité des enjeux associés à cette prise de position dans les contextes français et européen. Il a par la suite toujours refusé d'admettre la moindre erreur de jugement de sa part. Reconnu désormais comme une figure majeure du savoir contemporain et comme un intellectuel engagé, Chomsky est invité à donner des conférences dans les plus grandes institutions universitaires du monde, souvent reprises sous forme de livres. Language and Problems of Knowledge reprend le texte de conférences données à l'Université de Managua au Nicaragua en mars 1986; The Architecture of Language reproduit un exposé présenté à Delhi en janvier 1996. Au cours de ses déplacements, il partage en général son temps entre des conférences proprement linguistiques et d'autres portant sur la politique américaine. 1993 voit la publication du premier article esquissant ce que Chomsky appelle le programme minimaliste («A minimalist pro gram for linguistic theory»), suivi en 1995 par celle du livre The Minimalist Program et par

REPÈRES BIOGRAPHIQUES

15

un grand nombre d'articles et quelques livres depuis. Ce changement de perspective est vécu comme un tremblement de terre par les linguistes habitués à travailler dans le cadre du modèle des principes et paramètres. Les nouvelles contraintes imposées par les exigences minimalistes forcent à reprendre sur de nouveaux frais certaines questions empiriques que l'on croyait définitivement résolues et qui se trouvaient brusquement sans solution, à renoncer à des outils formels acquis souvent dans la douleur et patiemment confrontés aux données, à développer une autre façon de penser syntaxiquement. Ont été successivement reconstruits par Chomsky et les autres linguistes engagés dans l'aventure minimaliste la théorie de la structure syntagmatique, celle du mouvement, celle de la localité, suivant à peu près 1' agenda qui avait été celui du modèle précédent. Des questions nouvelles sont posées, celle de la dérivation phasale, celle, corrélée, de l'épellation multiple, celle de l'étiquetage des projections, celle de la vraie nature de l'opération de déplacement. Chomsky a aussi dans les années 2000 élargi la base épistémologique de la Grammaire Générative, reprenant des questions qui intéressent la théorie de la connaissance, la philosophie des sciences et la philosophie de l'esprit, voir New Horizons in the Study of Language and Mind (2000a), Chomsky and his Critics (2003), The Science of Language. Interviews with James McGilvray (2012), What Kind of Creatures are We? (20 16). Il considère aussi désormais qu'on ne peut ignorer la question de l'origine et de l'évolution du langage quand on cherche à isoler les facteurs qui ont façonné ou qui façonnent cette faculté chez les humains. Une partie de sa réflexion sur le sujet est présentée dans Why Only Us (2016), un livre en collaboration avec Robert Berwick. Depuis l'automne 2017, Chomsky, désormais retraité du MIT, a rejoint l'Université d'Arizona à Tucson, où il est professeur à temps partiel au département de linguistique et occupe également une chaire consacrée à 1' environnement et à la justice sociale. Ses séminaires continuent à attirer un public considérable.

CHAPITRE I

INTRODUCTION

Structures syntaxiques, le premier livre de Noam Chomsky, a été publié au début de l'année 1957 par une petite maison d'édition de La Haye, Mouton, promise à un grand avenir, dans la collection Janua Linguarum, dirigée par Cornelis van Schoonefeld. Ce dernier avait accepté le manuscrit, après que Chomsky, jeune professeur au Massachusetts Institute of Technology, lui avait montré ses notes de cours. Il s'agissait en fait d'une présentation, sous forme abrégée, des résultats d'un travail beaucoup plus vaste et nettement moins accessible, intitulé The Logical Structure ofLinguistic Theory, écrit de 1955 à 1957, mais publié en 1975 seulement, sous une forme tronquée, et qui constituait la thèse de doctorat de Chomsky. Le petit livre de 1957, dont il est difficile aujourd'hui de mesurer l'impact, a fait de Chomsky, du jour au lendemain, un linguiste célèbre et suscité sur la côte est des Etats-Unis de vives discussions dans les cercles linguistiques et philosophiques. L'avant-dernier livre de Chomsky, publié en 2016, est un travail en collaboration avec Robert Berwick, Why On/y Us, qui s'intéresse à l'origine et à l'évolution du langage et à la question de savoir pourquoi tous les humains, quel que soit leur niveau d'intelligence ou de culture, mais pas les représentants des autres espèces animales, ont la capacité de parler, c'est-à-dire de créer et de comprendre des énoncés nouveaux. Son dernier livre, What Kind of Creatures are We ?, paru également en 20 16, est une réflexion sur la nature du langage (Chomsky pose la question« qu'est-ce que le langage?» et lui apporte une réponse), sur les capacités cognitives des humains et leurs limites, sur les mystères de la nature. La carrière académique de Chomsky, qui n'est pas achevée, est donc exceptionnellement longue, d'autant que plusieurs articles et certains travaux académiques (qui devaient être publiés plus tard) avaient précédé la publication de Structures syntaxiques. Sa thèse de master Morphophonemics of Modern Hebrew date de 1951. Structures syntaxiques marque le début officiel de la Grammaire Générative; c'est l'événement fondateur de ce que l'on a appelé la ?

18

D ANS LE LABYRINTHE DU LANGAGE

«révolution chomskyenne ». Cette expression apparaît pour la première fois dans le titre d'un livre de Neil Smith et Deirdre Wilson publié en 1979. Et l'on peut se demander s'il est légitime de mobiliser, à propos du surgissement du programme chomskyen, la catégorie de «révolution». La réponse dépend pour une large part de la position que 1' on adopte touchant les révolutions scientifiques. On peut choisir de réserver le terme de révolution aux bouleversements majeurs. Copernic, Darwin, Einstein ont chacun en leur temps et dans leurs domaines respectifs initié une révolution scientifique. On peut inversement admettre, au risque de faire apparaître l'histoire de la Grammaire Générative comme une sorte de révolution permanente, que même une découverte mineure peut être en soi révolutionnaire. On peut enfin, comme le fait Popper, distinguer des périodes plus ou moins révolutionnaires avec 1' idée que «toutes ne le sont pas au sens où l'on peut parler de révolution copernicienne» (voir R. Bouveresse 1978: 87). Quelle que soit l'option choisie, il ne fait pas de doute que la séquence Structures syntaxiques - Aspects de la théorie syntaxique, lorsque Chomsky a posé que la phrase était l'unité linguistique basique, en opposition avec la tradition grammaticale et les travaux structuralistes centrés sur le mot, et qu'il a affirmé la possibilité de modéliser les langues naturelles en recourant aux outils formels dérivés de 1' étude des langages artificiels, constitue un moment révolutionnaire dans l'étude du langage. On a bien affaire à un changement de paradigme, marqué par une reconceptualisation en profondeur de l'objet d'étude, par la redéfinition du cadre de référence, par l'invention de notions nouvelles (ou la réinterprétation de notions anciennes), par la réévaluation de ce qui compte comme argument, caractéristiques qui vont de pair avec le regroupement d'une communauté autour d'un noyau thématique partagé, qui se trouve confronté, comme chaque fois qu'un nouveau paradigme apparaît, à la force d'inertie considérable des tenants des approches antérieures. Surtout, ce modèle est «incommensurable» avec les modèles structuralistes, signe infaillible auquel, selon Kuhn, on reconnaît le changement de paradigme. Mais si l'on adopte un point de vue plus souple, celui de Popper par exemple, on verra dans l'émergence du modèle des principes et paramètres un autre moment héroïque de l'histoire de la grammaire générative. Pour beaucoup de linguistes, dont je suis, c'est là que se situe la véritable révolution chomskyenne. Or il n'est pas vrai que le modèle des principes et paramètres et la théorie standard étendue qui le précède ou, plus tard, le programme minimaliste et le modèle des principes et paramètres auquel il se substitue soient incommensurables. Il est parfaitement

INTRODUCTION

19

possible de les comparer. Et dans aucun de ces deux cas, il ne s'agit de réfuter le modèle précédent, seulement d'en renforcer les fondements, même si cette exigence rend nécessaire la re formulation ou 1' abandon de plusieurs hypothèses antérieurement admises. Dans le cas du minimalisme, en particulier, c'est un élargissement de la perspective générale sur le langage qui impose d'opérer des changements théoriques de grande ampleur, tout en conservant l'essentiel des acquis du modèle des prin. ' c1pes et parametres. On ne peut qu'être frappé par le fait que Chomsky, qui a fait une entrée fracassante dans le champ linguistique il y a un peu plus de 60 ans, continue à être aussi actif et productif aujourd'hui qu'il l'était au tout début de sa carrière de chercheur et de professeur. La créativité et la virtuosité technique dont il fait preuve dans ses articles des premières années de ce siècle consacrés à la notion de phase sont aussi impressionnantes que celles qui se manifestaient dans les travaux des années 60 et 70 du siècle dernier. On doit ajouter que le citoyen Chomsky ne consacre qu'une partie de son activité intellectuelle à la linguistique. Après avoir été à la fin des années 60 et au début des années 70 un opposant majeur à la guerre du Vietnam, héros de la Nouvelle Gauche, adepte de la contestation non violente, qui risquait à tout instant d'être arrêté, emprisonné et traduit en justice, il a continué à développer une critique acerbe de la politique extérieure américaine en Amérique centrale ou au Proche-Orient, publiant de nombreux livres qui ouvraient toujours des perspectives nouvelles pour la compréhension du monde contemporain. Enseignant lui -même, il s'est également attaché, dans le sillage de Bertrand Russell, à définir les contours d'une «éducation humaniste», reflétant son engagement socialiste libertaire. Ses dernières conférences parisiennes en mai 2010 et novembre 2016, ont été suivies par plusieurs centaines de personnes dans des amphithéâtres bondés de la Rue de l'Ecole de Médecine, du Collège de France et de la Bibliothèque Nationale de France. Comment la créativité et la séduction intellectuelle d'un chercheur peuvent-elles se maintenir aussi longtemps dans un milieu aussi versatile que celui des sciences humaines (entendues au sens large), régulièrement parcouru par des tremblements qui se font passer pour d'authentiques révolutions, mettant toujours en avant l'ambition d'élever la discipline au rang de science de plein droit (la linguistique, bien sûr, ne fait pas exception)? La même question pourrait être posée à propos d'autres grandes figures du savoir contemporain, comme Bertrand Russell, Roman Jakobson, Georges Dumézil, Willard van ?

20

DANS LE LABYRINTHE DU LANGAGE

Orman Quine, Claude Lévi-Strauss. Dans le cas de Chomsky, la réponse doit bien sûr être cherchée dans 1' originalité des questions qui soustendent sa recherche et des réponses qu'il leur apporte, mais aussi dans un programme scientifique dont les contours ont été définis très tôt et qui s'est développé au cours des années dans une absolue cohérence, chaque modification du modèle étant imposée par l'intégration à l'agenda d'une interrogation nouvelle, enfin dans la relative stabilité des fondements philosophiques et épistémologiques qui constituent le socle de la Grammaire Générative, stabilité qui accentue encore l'impression d'un développement continu. Quand en effet on survole l'activité scientifique de Chomsky, en faisant abstraction du fait qu'elle a été fréquemment interrompue par des engagements étrangers à la recherche sur le langage, une évidence se fait jour. Il apparaît que, par-delà les innovations et les aménagements techniques donnant régulièrement naissance à des variantes théoriques nouvelles, la plupart des grandes idées directrices autour desquelles sa recherche s'organise sont présentes dès le début de son parcours scientifi que. On peut en citer ici quelques-unes (chacune sera, à un moment ou à un autre, discutée et justifiée dans ce livre). (i)

une meilleure compréhension de la nature du langage ouvre la voie à une meilleure connaissance de la nature de 1' esprit; (ii) le langage est inné; (iii) le langage est biologiquement fondé; c'est un objet du monde de la nature; (iv) il n'y a qu'un langage et chaque langue particulière n'est qu'une instanciation spécifique d'un pattern général, identique pour toutes les langues; (v) le langage peut être modélisé comme un dispositif doté d'une architecture interne ; (vi) on ne peut construire la science du langage qu'en prenant en compte les facultés cognitives avec lesquelles le langage est en relation d'interface, le système de la signification et le système du son ; la syntaxe doit ellemême être conçue comme un système cognitif permettant d'établir la connexion entre la signification des énoncés linguistiques et leur forme sonore; (vii) il est souhaitable, dans 1' étude du langage, de faire abstraction de sa fonction de communication; il faut le concevoir comme un système de connaissance qu'il s'agit de modéliser.

Le travail de Chomsky est traversé par des interrogations et ses recherches abordent des difficultés auxquelles il semble s'être confronté tout au long de son parcours. Il est vrai que le domaine de réalité que la

INTRODUCTION

21

théorie linguistique se donne pour tâche de couvrir s'est considérablement élargi depuis le Cours de linguistique générale de Saussure, d'autant que l'enquête sur la nature des systèmes cognitifs intègre désormais aussi bien l'étude de leur évolution au sein de l'espèce que celle de leur croissance chez l'individu. Deux questions de fond semblent avoir guidé la recherche de Chomsky depuis 1' origine, celle de la possibilité d'une science du langage et celle de la meilleure stratégie pour la constituer. Il faut bien admettre qu'il n'est pas toujours facile de faire la distinction entre ces deux dimensions. Théorique et formelle, la révolution chomskyenne est aussi méthodologique. Elle récuse comme formellement inadéquats les modes d'explication en usage dans les approches antérieures aux problèmes du langage et propose en même temps une nouvelle stratégie pour les aborder. On sait que le chemin qui va des données de l'expérience à leur interprétation et de leur interprétation à leur compréhension est infiniment complexe. Les sciences cognitives se donnent pour tâche d'éclairer ce problème d'un jour nouveau, en abandonnant l'étude des dispositions et des comportements humains, pour mettre au premier plan les processus et les états mentaux (qui ne donnent pas nécessairement lieu à des comportements observables). Or le langage est un système cognitif parmi d'autres. L'approche chomskyenne du langage, en ciblant un système particulier, mais relativement bien circonscrit, ouvre la voie à une théorie générale de la cognition humaine, en introduisant des hypothèses plus ou moins complexes sur le fonctionnement de l'espritcerveau et en rendant disponibles des modèles de description nouveaux et sophistiqués. Chacune des grandes périodes de la Grammaire Générative - elles sont détaillées au chapitre VII - peut être vue comme une étape supplémentaire dans la caractérisation du langage, ou plutôt de la syntaxe, comme une faculté cognitive permettant de connecter la forme et le sens linguistiques. ' A la lumière de ces développements, il est possible de comprendre pourquoi la contribution de Chomsky constitue une avancée majeure dans la recherche sur le langage, pourquoi il n'est pas exagéré d' employer à son propos 1'expression de «révolution». Mais la Révolution française ne s'est pas arrêtée à la prise de la Bastille. Si la publication de Structures syntaxiques marque bien le début de la révolution chomskyenne, celle-ci s'est poursuivie tout au long des années pour aboutir à l'approche minimaliste développée aujourd'hui. Il arrive que la réponse donnée aux questions qui se posent ne soit pas satisfaisante, qu'on ait affaire à un «mystère» (c'est-à-dire à un puzzle sans solution, relevant

22

DANS LE LABYRINTHE DU LANGAGE

encore, dans 1' état actuel de nos connaissances, de la métaphysique) plutôt qu'à un «problème» (c'est-à-dire à un puzzle qui entre dans le champ de nos capacités cognitives et peut être résolu si l'on prend les 1 choses par le bon bout de la raison). Même quand c'est le cas, le seul fait d'avoir posé la question fait bouger les lignes et est source de ' pro gres. Il est temps maintenant de préciser l'objet de ce livre. Ce sont les propositions sur le langage et la linguistique, énumérées en (i)-(vii), qu'il s'agit de présenter et de justifier. Certaines peuvent 1' être de façon interne à la langue, d'autres font appel à des considérations générales sur la nature et le fonctionnement des systèmes cognitifs. Pour remplir ce programme, on dispose de plusieurs sources. On peut distinguer deux types d'ouvrages dans la production linguistique de Chomsky: d'une part, des articles ou des livres d'une haute technicité, souvent assez courts, qui mettent en place une théorie nouvelle ou affinent une théorie en cours de construction, en discutant des questions laissées ouvertes ou non résolues dans les publications précédentes (Barriers appartient à cette catégorie); d'autre part, des livres généralistes, théoriques mais non techniques, destinés à un public plus large, où sont abordées des questions de fond sur le langage, sur la connaissance, sur la nature humaine, et dans lesquels Chomsky justifie ses choix théoriques et méthodologiques majeurs. Appartiennent à cette catégorie La linguistique cartésienne, Language and Mind, Réflexions sur le langage, Règles et représentations, Knowledge of Language, Language and Problems of Knowledge, New Horizons in the Study of Language and Mind, Why Only Us, What Kind of Creatures Are We? et plusieurs autres ouvrages (qui contiennent aussi, cela va de soi, des propositions techniques; Aspects de la théorie syntaxique combine de façon exemplaire les deux dimensions). L'objet n'est pas ici de familiariser le lecteur avec les procédés de description et les mécanismes complexes inventés par le syntacticien formel et exposés dans les articles et les livres techniques, mais plutôt, en faisant fond sur les travaux de linguistique générale précédemment cités, de l'intéresser au Chomsky philosophe versé dans l'histoire des idées et au Chomsky psychologue qui, à travers l'étude du langage, pense accéder à une meilleure compréhension des processus mentaux et du fonctionnement de l'esprit-cerveau des humains. Ce parcours permettra d'explorer les origines intellectuelles de la 1

Chomsky introduit la dichotomie entre «problème» et «mystère» dans Réflexions sur le langage.

INTRODUCTION

23

Grammaire Générative, de mieux comprendre les enjeux et les raisons de son évolution, de préciser son incidence sur la théorie de la connaissance, la philosophie des sciences et la philosophie de l'esprit, de s'interroger sur la relation de la linguistique aux autres sciences. J'ai délibérément choisi de privilégier dans cette étude les livres et les articles de Chomsky lui-même et n'ai discuté d'autres travaux que dans la mesure où ils illustraient ou prolongeaient sa pensée ou étaient à l' origine de l'une de ses propositions. J'ai conscience que ce choix restreint laisse supposer que le développement de la Grammaire Générative est intégralement déterminé par la pensée d'un seul, l'initiateur de la Grammaire Générative lui-même. Ce parti pris est en partie injuste, dans la mesure où bien d'autres chercheurs ont joué et continuent à jouer un rôle important dans le projet. Il est d'autre part contraire aux voeux de Chomsky lui-même qui souhaite absolument présenter la mouvance générativiste comme une entreprise de recherche collective, c'est-à-dire comme un milieu scientifique. Mais il peut s'appuyer sur deux considérations. La plus évidente est que le milieu des linguistes générativistes reste, qu'on le veuille ou non, aimanté par la figure incontournable de Chomsky, fondateur du programme et, aujourd'hui comme hier, caution exclusive des modifications qui lui sont apportées. La seconde est qu'il faut soigneusement distinguer entre les questions générales posées par le générativisme, dont Chomsky est, sans conteste, 1' initiateur, et les différentes grammaires génératives qui ont été proposées depuis que le programme a été défini. Une dernière observation pour conclure. La phonologie est laissée de côté dans ce livre, bien que la redéfinition des buts et des méthodes de la linguistique opérée par Chomsky dans les années 50 ait également induit un bouleversement majeur dans l'étude des systèmes phoniques et des processus phonologiques. François Dell, dans l'introduction de son livre Les règles et les sons (1973), énumère les apports de cette démarche nouvelle dans le champ phonologique: «la notion de règle a pris le pas sur celle d'opposition distinctive, la ligne de clivage entre phonologie et morphologie s'est déplacée, 1' interaction entre phonologie et syntaxe occupe enfin la place centrale qui lui revient». Doivent également être mentionnés les schémas de règles, le principe cyclique et 1' ordre disjonctif appliqués aux dérivations phonologiques ... Or, après la publication en 1968 de The Sound Pattern ofEnglish (SPE), en collaboration avec Morris Halle, Chomsky n'a plus écrit sur la phonologie, ce qui justifie en partie la décision de ne pas 1' évoquer ici, bien que les processus phonologiques aient autant à nous apprendre sur les opérations

24

D ANS LE LABYRINTHE DU LANGAGE

mentales que les processus syntaxiques. Dès les années 70, des approches nouvelles ont vu le jour, visant à l'élaboration d'une théorie des représentations phonologiques corrigeant certains défauts conceptuels et techniques de la théorie définie dans SPE. Certaines de ces contributions peuvent être vues comme des tentatives de définir une syntaxe de la phonologie : la phonologie métrique introduit la constituance dans les représentations (voir Liberman & Prince 1977); la phonologie autosegmentale pose que les objets manipulés par les processus phonologiques ont une géométrie plus complexe que celle d'une simple séquence de phonèmes et mettent enjeu un ensemble de niveaux parallèles et connectés (voir Goldsmith 1976). Enfin, Kaye, Lowenstamm & Vergnaud (1990) proposent une version explicite de la rection en phonologie. Le travail de ces derniers illustre de façon exemplaire la position des chercheurs qui ne se sont pas résolus au divorce entre les deux disciplines, ont continué à placer au centre de leur enquête les parallélismes et les convergences qui se vérifient entre les domaines phonologique et syntaxique, à chercher un formatage commun aux opérations qu'ils utilisent.

CHAPITRE II

LE PREMIER MODÈLE TRANSFORMATIONNEL : STRUCTURES SYNTAXIQUES

La syntaxe est 1' étude des principes et des processus qui permettent la construction des phrases dans les langues particulières. La recherche syntaxique sur une langue donnée a pour objet la construction d'une grammaire qui peut être considérée comme un procédé particulier permettant de produire les phrases de la langue soumise à analyse ... Le résultat ultime de ces recherches devrait être une théorie de la structure linguistique dans laquelle les procédés descriptifs utilisés dans les grammaires particulières sont présentés et étudiés de façon abstraite, sans aucune référence spécifique aux langues particulières. L'une des fonctions de cette théorie est de fournir une méthode générale pour sélectionner une grammaire pour chaque langue, étant donné un corpus de phrases de cette langue (Structures syntaxiques, p. 13).

1.

AVANT STRUCTURES SYNTAXIQUES

On doit à l'école structuraliste l'idée fondamentale que le langage naturel peut être étudié comme un système formel, indépendamment de sa fonction de communication, c'est-à-dire indépendamment du sens des phrases qui constituent le corpus soumis à analyse. Pour identifier dans un corpus donné les unités fondamentales qu'il contient, unités phonologiques, morphologiques, syntaxiques, les linguistes structuralistes ont défini des procédures explicites et rigoureuses, en s'interdisant tout recours à la signification ou à l'intuition. Une seule opération va permettre de segmenter un objet complexe, c'est-à-dire d'isoler ses parties constitutives, et d'en préciser les propriétés définitoires: la commutation. Puisque dans cette procédure, rien ne doit être supposé connu touchant les langues, pas même les notions les plus élémentaires léguées par la tradition grammaticale, on doit conclure que les structuralistes croient en la possibilité d'observations brutes, indépendantes de toute théorie. Cette position radicale est celle de Zellig Harris, par exemple, dans son livre majeur, Methods in Structural Linguistics, publié

26

DANS LE LABYRINTHE DU LANGAGE

en 19 51, qui pousse très loin cette conception de la linguistique comme se limitant à définir des procédures taxinomiques explicites et rigoureuses, comme la segmentation et la classification, pour découvrir dans 1 un corpus brut les unités fondamentales qui le composent. Et ceci sans 2 faire appel au sens. Pour le linguiste structuraliste, la situation idéale est celle dans laquelle le chercheur est confronté à une langue dont il ignore tout, pour laquelle n'existe aucune description grammaticale préalable et dont il est le premier observateur. Ce choix théorique et cette attitude méthodologique sont directement liés à la pratique ethnographique. C'est en effet dans la position de premier observateur que se trouvaient les anthropologues américains lorsqu'ils étaient confrontés à une langue amérindienne inconnue. Et de fait, la linguistique a longtemps fonctionné aux Etats-Unis comme une science auxiliaire de l'anthropologie. On sait que Boas, qui passe pour être le père de l'anthropologie américaine, est l'auteur du Handbook ofAmerican Indian Languages (1911). On sait aussi que dans les années 20 et les années 30 du siècle dernier, à une époque où la linguistique se professionnalisait, des figures majeures comme Edward Sapir, anthropologue autant que linguiste, et Leonard Bloomfield, linguiste de métier et anthropologue occasionnel, ont consacré un partie importante de leur temps à effectuer des travaux de terrain, le premier auprès des communautés amérindiennes du nord de la Colombie britannique, le second sur diverses langues algonquines, le menominee, le cree, le fox, l' ojibwa. C'est en grande partie contre les idées et les méthodes structuralistes que 1' entreprise générative s'est construite. La rupture avec 1'approche précédente est clairement marquée dans Structures syntaxiques, le premier livre de Chomsky, publié en 1957. Mais d'autres travaux avaient précédé, qui nous éclairent sur le parcours de Chomsky pendant ses années de formation et sur les origines intellectuelles de la grammaire générative. On peut citer, outre la thèse de master Morphophonemics of ?

1

Dans Methods in Structural Linguistics, le livre qui a servi à Chomsky de manuel d'introduction à la linguistique, Harris opère une distinction entre théorie et méthode, mais ne développe pas le volet théorique. Chomsky, dès ses premiers travaux, entend construire une théorie de l'analyse structurale. Voir Freidin 2007. 2 Sur ce point, on peut se reporter aux réserves de Benveniste (1954) sur Bloomfield et Harris: «Il y est admis par principe que 1' analyse linguistique, pour être scientifique, doit s'abstraire de la signification et s'attacher uniquement à la définition et à la distribution des éléments. Les conditions de rigueur imposées à la procédure exigent qu'on élimine cet élément insaisissable, subjectif, inclassable, qu'est la signification ou le sens» (Benveniste 1954, repris dans Benveniste 1966 : 11).

LE PREMIER MODÈLE TRANSFORMATIONNEL

27

Modern Hebrew (1951 ), deux articles importants, «Systems of Syntactic Analysis » ( 195 3) et « Three Models for the Description of Language» (1956). Tomalin (2006) établit qu'au cours de cette période, la conception que Chomsky se faisait de 1' objet et des buts de la théorie linguistique a sensiblement évolué. Le premier article, qui s'inscrit clairement dans la tradition d'analyse initiée par Leonard Bloomfield, poursuivie et considérablement précisée par Zellig Harris, fondée sur le recours à des procédures de découverte contraignantes, explore la possibilité de donner à 1' analyse grammaticale un caractère automatique en utilisant le calcul des individus de Nelson Goodman et sa théorie des systèmes construction3 nels, dans laquelle la notion de simplicité joue un rôle déterminant. Chomsky se montre soucieux de développer un système de ce type pour l'analyse linguistique, permettant d'assigner automatiquement les morphèmes contenus dans un corpus à des catégories syntaxiques, sur la base de leurs propriétés distributionnelles. Pour élaborer cette approche mécanique, il a recours à des concepts, à une méthodologie et à des techniques empruntés à un autre domaine que la linguistique, la philosophie empiriste. Mais l'expérience ne porte que sur un langage formel très simple et, de l'aveu même de Chomsky, rien n'indique que les mêmes méthodes pourraient être appliquées à l'analyse des langues naturelles. Le second article a une portée toute différente. Sont comparés trois modèles qui rendent disponibles des descriptions différentes d'une langue naturelle, l'anglais étant pris comme exemple: les grammaires à états finis, les grammaires syntagmatiques, les grammaires transformationnelles. Chomsky établit que seules les troisièmes ont la capacité de dériver toutes les séquences grammaticales de cette langue et de leur associer divers types d'information concernant leur structure ou les relations entre elles, une conclusion qui sera reprise et développée dans

3

Chomsky a insisté très tôt sur le rôle essentiel des considérations de simplicité et d'économie dans la description grammaticale. Freidin (2007: 290) cite le passage suivant tiré de Morphophonemics ofModern Hebrew: «Dans le cas général, de telles considérations [les considérations de simplicité et d'économie] ne sont pas triviales, et ne se réduisent pas à des considérations esthétiques. On a reconnu à propos des systèmes philosophiques, et cela vaut tout autant selon moi pour les systèmes grammaticaux, que les motivations sous-jacentes à 1' exigence d' économie sont par beaucoup d'aspects identiques à celles qui sont sous-jacentes à l'exigence qu'il y ait un système, cf. Goodman 1943 »,(Chomsky 1951). Freidin conclut que, pour Chomsky, dès le début des années 50, une grammaire ne se réduit pas à la simple description d'une langue: elle doit aussi proposer une théorie explicative de la structure de cette langue, et c'est là qu'interviennent les considérations de simplicité et d'économie.

28

D ANS LE LABYRINTHE DU LANGAGE

Structures syntaxiques. Il met également en avant l'idée que le meilleur parti pour le linguiste est d'abandonner les procédures de découverte structuralistes et de se concentrer sur la définition de procédures d' évaluation permettant de choisir entre grammaires concurrentes. Cette évolution, qui marque un éloignement progressif vis-à-vis des préoccupations empiristes de Bloomfield et des linguistes post-bloomfieldiens et de la philosophie de Goodman aboutit à la définition de la première grammaire générative transformationnelle dans Structures syntaxiques. On voit que la position de Chomsky sur les buts et les méthodes de la théorie linguistique se différencie très tôt de celle des structuralistes. Pour lui, il est clair que la linguistique ne peut se limiter à fournir des procédures mécaniques pour la découverte des grammaires. Il faut renoncer à définir de telles procédures et se contenter de mettre en place des procédures d'évaluation, un objectif plus modeste, mais légitime, puisque, après tout, seul le résultat compte et que ce résultat peut être justifié sans tenir aucun compte des moyens utilisés pour y parvenir. Rien ne s'oppose d'autre part à ce que soient reprises des notions et des concepts forgés par la tradition grammaticale. Un reproche récurrent adressé à Chomsky par les structuralistes et par tous ceux pour qui la linguistique ne peut se construire que sur les décombres du savoir grammatical traditionnel est précisément d'avoir repris, sans examen, 1' inventaire classique des catégories grammaticales. C'est que pour lui, l'objectif ultime de la syntaxe n'est pas de définir des classes d'éléments, mais de proposer pour toute langue naturelle une grammaire, c'est-à-dire «un procédé particulier permettant de produire les phrases de la langue soumise à analyse», et plus généralement de construire une théorie générale formalisée de la structure linguistique et d'explorer les fondements d'une telle théorie. Le passage de Structures syntaxiques placé en exergue à ce chapitre, auquel est empruntée la citation ci -dessus, révèle que le projet théorique de Chomsky, tout en étant moins rigide que celui de l'école structuraliste, est en réalité beaucoup plus ambitieux. Ajoutons que ce projet peut être mené à bien sans recours à un corpus prédéfini. L'une des facettes les plus originales de Structures syntaxiques et qui reste, à ce jour, l'une des contributions les plus impressionnantes de Chomsky est la caractérisation mathématique et 1' évaluation formelle des différents systèmes de description grammaticale possibles. Considérer en effet les langues naturelles comme des ensembles de séquences bien formées permet d'intégrer leur étude à celle, plus générale, des propriétés mathématiques des langages formels. La nécessité de générer toutes les phrases d'une langue Let seulement ces phrases revient, si l'on pense

29

LE PREMIER MODÈLE TRANSFORMATIONNEL

mathématiquement, à se demander quelles séquences d'objets appartienfont pas partie. Cette question peut revevoir une nent à L, lesquelles n'en ,... formulation précise. Etant donné un vocabulaire, c'est-à-dire une collection finie d'objets, et un langage L, c'est-à-dire un ensemble de séquences d'objets définies à partir de ce vocabulaire, le problème qui se pose est celui de définir le mécanisme fini qui permet d'obtenir L. Plusieurs options se présentent. Une possibilité est de recourir à un axiome et à une collection de règles de réécriture qui, en prenant 1' axiome pour point de départ, s'appliquent de façon réitérée pour former des séquences nouvelles. Un système de ce type est appelé «système de réécriture». Chomsky montre qu'un tel système est nécessaire, mais non suffisant pour la description du langage et des langues.

2.

TROIS MODÈLES DE DESCRIPTION

4

Dans Structures syntaxiques, Chomsky, reprenant l'essentiel de la démonstration initiée dans « Three models », propose une caractérisation mathématique de trois modèles de description, les grammaires à états finis, les grammaires syntagmatiques et les grammaires transformationnelles. Le but de cette démarche est de déterminer quel type de langage sont les langues naturelles, à quel point, dans la hiérarchie des langages formels elles se situent, et de quelle capacité générative doit être dotée la grammaire qui les produit. Ce progamme est entièrement nouveau, même si les instruments utilisés pour le mener à bien ne sont pas tous originaux. On doit savoir que 1' étude des propriétés et de la capacité générative des systèmes formels avait droit de cité en mathématiques et en logique avant l'avènement de la Grammaire Générative et que les règles et les systèmes de formalisation exploités par Chomsky étaient déjà en usage dans ces disciplines. Sa présentation des grammaires à états finis est dérivée du livre de Shannon et Weaver (1949), dont il ne retient pas les aspects qui, comme le calcul des probabilités distributionnelles, sont cruciaux pour la théorie de l'information, mais ne présentent que peu d'intérêt pour les linguistes. Pour la construction d'une théorie de la structure en constituants, Chomsky utilise la théorie des ensembles de Post (1944), qui employait

4

Il existe plusieurs présentations du premier modèle transformationnel. Outre celle, relativement claire, de Chomsky (1957) lui-même, on peut se reporter à Ruwet (1967) et aussi à la contribution de Gilles Fauconnier dans le recueil Le langage, édité par Bernard Pottier en 1973, à laquelle cette section emprunte largement.

30

DANS LE LABYRINTHE DU LANGAGE

le terme «générer» pour décrire la façon dont un ensemble récursivement énumérable est obtenu à partir de la fonction récursive associée. Cette technique pouvait être adaptée pour construire une théorie de la syntaxe, dette conceptuelle et terminologique que Chomsky reconnaît explicitement. Son mérite est d'avoir acclimaté ces règles et ces mécanismes hors de leur domaine propre, pour les appliquer à l'étude des langues naturelles. Il a aussi repris le terme de transformation utilisé par Harris, mais, 5 il est vrai, dans un sens différent, comme je le montre plus bas. Ce parcours à travers les techniques de description lui permet de conclure que les grammaires transformationnelles sont les mieux à même de représenter les propriétés des langues naturelles. 2.1. GRAMMAIRES À ÉTATS FINIS

Les grammaires à états finis sont des grammaires non contextuelles contenant des règles de la forme (1) A ) aB

C

)C

où A et B sont des éléments non terminaux, a et c des symboles terminaux.

La production de séquences par ce type de grammaire est analogue au fonctionnement d'un automate passant par un nombre fini d'états internes A, B, C et pour lequel les règles ci-dessus équivaudraient à des changements d'états. De 1' état A, la machine passe à 1' état B, en émettant le symbole a. Les séquences du langage défini par la grammaire (1) sont formées par la concaténation des symboles générés. En bref, une grammaire à états finis engendre des séquences au moyen d'une série de choix locaux de gauche à droite. Il est difficile d'imaginer un système formellement plus simple pour produire un langage. Or on peut montrer qu'il existe des langages, c'est-à-dire des structures syntaxiques, qui ne peuvent être engendrés par des grammaires à états finis. C'est le cas des «langages-miroirs». Les séquences suivantes appartiennent à ce type: aa, bb,abba, baab,aaaa, bbbb,aabbaa,abbbba. Le langage considéré inclut toutes les phrases consistant en une suite X suivie par l'image miroir de X, et seulement ces phrases. Pour décider si les langues naturelles peuvent être engendrées par des grammaires à états finis, il suffit donc de vérifier si elles instancient des séquences qui 5

La différence entre les deux notions de transformation est examinée section 2.3.

LE PREMIER MODÈLE TRANSFORMATIONNEL

31

ont pour 1' essentiel la forme en miroir évoquée ci-dessus, ce qui signifierait qu'elles manifestent des propriétés qui sont hors d'atteinte de ces grammaires. Or la réponse est positive, comme le montrent (2i) et (2ii). (2) (i) (ii)

ou bien spou bien s2 où il existe une dépendance entre les mots des deux côtés de ou. si S 1, alors S2 où il existe une dépendance entre si et alors.

En (2ii), par exemple, la proposition S 1 pourrait en effet elle-même contenir des structures de la forme « s1ou s2 »' produisant une phrase manifestant la propriété image-miroir évoquée plus haut. On a par exemple deux dépendances en miroir dans la période suivante : (3) si ou bien Sp ou bien S2, alors S3

Une grammaire à états fmis qui, par définition, produit des symboles dans les transitions d'un état à un autre, ne peut donc définir une grammaire de l'anglais ou du français, puisqu'on rencontre dans ces langues des relations de dépendance entre mots non contigus et que ces derniers peuvent eux-mêmes être séparés par une proposition contenant des mots mutuellement dépendants et non contigus. Les langues naturelles ne sont donc pas des langages à états finis. 2.2.

GRAMMAIRES SYNTAGMATIQUES

Le second des trois modèles de description du langage est la grammaire syntagmatique (phrase structure grammar) ou grammaire de réécriture. Une grammaire syntagmatique peut être formellement caractérisée comme suit: A

Etant donné un système de règles de réécriture I: et un vocabulaire Voc, le langage L engendré parI: sur Voc est l'ensemble des séquences d'éléments de Voc, qui peut être obtenu par 1' application répétée des règles de réécriture de I: à partir de 1' axiome Z. 6

Ce type de système hiérarchique, non linéaire, est particulièrement bien adapté à la description de la structure en constituants des séquences 6

Il faut en réalité admettre que Voc est 1'union de deux sous-ensembles, un vocabulaire non terminal et un vocabulaire terminal. Un symbole terminal est un symbole qui ne peut être réécrit par aucune règle de la grammaire et qui n'est en général rien d'autre qu'un item lexical. La séquence produite au terme du processus de réécriture ne peut être constituée que d'éléments du vocabulaire terminal.

32

D ANS LE LABYRINTHE DU LANGAGE

linguistiques, une procédure à laquelle les linguistes structuralistes référaient sous l'étiquette d'« analyse en constituants immédiats». (i)-(vi) est 7 un système de ce type. (4)

(i) (ii) (iii) (iv) (v) (vi)

s NP VP D N

v

)NP+VP )D+N ) V+NP ) la ) fille, bague, ... ) achètera

Une règle de la forme X ) Y doit être interprétée comme l'instruction de réécrire X sous la forme de (la séquence) Y. Le système ci-dessus permet de dériver la phrase la fille achètera la bague. La dérivation correspondante est donnée ci-dessous. (5) Phrase NP+VP D+N+VP D+N+V+NP la+ fille+ V+ NP la+ fille+ achètera+ NP la+ fille+ achètera+ D + N la+ fille+ achètera+ la+ N la + fille + achètera + la + bague

On appelle dérivation un ensemble ordonné de séquences, tel que (i) la première séquence développe le symbole initial du système de réécriture, que l'on appelle habituellement l' «axiome» du système parce qu'il n'est le résultat d'aucune règle antérieure; (ii) chaque séquence dans la suite est dérivée de la précédente par l'application d'une règle du système, consistant à remplacer un symbole unique par la séquence de symboles en laquelle il peut être réécrit; (iii) la séquence finale qui marque la fin de la dérivation ne peut être réécrite par aucune règle du système et se compose exclusivement d'éléments terminaux. La fille achètera la bague est une séquence terminale dérivée par le système (4). La collection des séquences terminales produites par un système de réécriture est un langage terminal. Il est clair que les règles d'un système de réécriture ne peuvent opérer dans un ordre arbitraire. Un élément du vocabulaire non 7

Je reprends ici les symboles catégoriels utilisés dans les textes originaux: N = nom, V= verbe, D =déterminant, NP= syntagme nominal, VP = syntagme verbal, S =phrase. Pour un échantillon plus large, voir la liste des abréviations.

LE PREMIER MODÈLE TRANSFORMATIONNEL

33

terminal ne peut être réécrit par une règle (n) que s'il a été au préalable introduit dans la dérivation par la règle (n- 1). Aucun symbole, à l' exception de l'axiome du système, ne peut figurer à la gauche de la flèche de réécriture s'il n'a pas figuré à la droite de la flèche dans une règle précédente. Les symboles qui apparaissent à la gauche de la flèche sont des symboles non terminaux. Ceux qui apparaissent exclusivement à la droite de la flèche sont des symboles terminaux. Cette présentation extrêmement simplifiée doit être complétée sur un point important. Les règles (4i)-(4vi) ci-dessus ont été formulées comme des règles indépendantes du contexte, au sens où elles ne spécifient pas l'environnement catégoriel dans lequel la substitution de Y à X est opérée. Il est parfois nécessaire de prendre en compte le contexte de gauche et/ou de droite dans lequel figure l'élément réécrit et d'utiliser des règles dépendantes du contexte. (6) illustre ce type de règle. (6) X

)Y/ U

W

Il est clair par exemple que si la phrase à dériver avait été (7) Le garçon achètera la bague

il aurait fallu spécifier que D est réécrit le si le nom suivant est garçon, mais la si le nom suivant est bague. Ce résultat peut être obtenu en complexifiant le système de réécriture et en introduisant des règles dépendantes du contexte pour la réécriture de D : (8)

N N mas c N fém

D

----+)

{

N masc, N fém }

garçon ) bague ) le 1 N 1nas c la 1 N fém )

On doit aussi recourir à des règles dépendantes du contexte pour représenter le phénomène de l'accord entre un verbe fini et son sujet (les filles achèteront les bagues vs. la fille achètera la bague). Les systèmes dont les règles sont dépendantes sont appelés grammaires contextuelles. Formellement, les règles non contextuelles sont des règles contextuelles d'un type particulier, celles où les séquences U et W en ( 6) sont nulles. Les grammaires non contextuelles peuvent être considérées comme une sous-classe des grammaires contextuelles. Il est maintenant possible de préciser les propriétés formelles des grammaires syntagmatiques. Ces grammaires ont plusieurs avantages.

34

DANS LE LABYRINTHE DU LANGAGE

,

Etant donné un langage terminal et sa grammaire, on peut aisément reconstruire la structure en constituants de chaque phrase du langage en traçant un arbre ou en ayant recours à des parenthèses étiquetées. Une autre propriété de ces grammaires est de pouvoir associer à certaines séquences plusieurs dérivations, et donc plusieurs analyses structurales. Ce phénomène que Chomsky appelle «homonymie constructionnelle» dans Structures syntaxiques et que l'on a désigné par la suite sous l' étiquette d' «ambiguïté structurale», est illustré par des séquences comme Le 8 magistrat juge les enfants coupables ou la secrétaire et l'amie de Pau/. Il indique que deux séquences peuvent présenter le même ordre linéaire, mais instancier des structures hiérarchiques différentes. Les deux exemples cités sont à la portée d'une grammaire de réécriture et suggèrent que la théorie linguistique doit se fixer un objectif plus ambitieux que le simple partage entre phrases grammaticales et phrases agrammaticales. Il est temps maintenant de reprendre la question générale posée précédemment à propos des grammaires à états finis : à quel niveau les langues naturelles se situent-elles dans la hiérarchie des systèmes formels? Les grammaires syntagmatiques ont-elles une capacité générative suffisante pour caractériser les langues naturelles de façon appropriée? Adoptant une perspective mathématique, Chomsky a pu démontrer qu'il existe des langages qui ne peuvent pas être engendrés par des grammaires à états finis, mais peuvent l'être par des grammaires syntagmatiques. C'est précisément le cas des langages-miroirs évoqués précédemment, qui peuvent être générés par des grammaires non contextuelles très simples. Linguistiquement, il apparaît que les grammaires non contextuelles constituent une formalisation adéquate des modèles structuralistes classiques, qui ont pour objet d'opérer une segmentation systématique des phrases en unités toujours plus petites, contenues les unes dans les autres, les syntagmes, les mots, les morphèmes, les phonèmes. Si les règles de réécriture sont interprétées comme des règles de formation d'arbres, plus précisément d'arbres étiquetés, on peut dire qu'elles livrent la description 8

Dans le premier exemple, coupables peut être construit comme un adjectif épithète du nom enfants et être inclus dans le groupe nominal ayant enfants pour élément pivot Il peut aussi avoir le statut d'un attribut, la phrase signifiant alors «le magistrat juge que les enfants sont coupables»; dans ce cas, coupables n'est pas inclus dans le groupe nominal. Dans le second exemple, le complément génitif de Paul peut n'être dépendant que de amie ou inclure 1' ensemble de la coordination dans sa portée, ce qui suppose une structure différente. Par contre, la séquence la secrétaire et amie de Paul n'est pas ambiguë, de Paul étant nécessairement dépendant de la coordination secrétaire et amie, une caractéristique qui suppose que la coordination des deux noms forme un sous-constituant auquel est adjoint le dépendant génitif.

LE PREMIER MODÈLE TRANSFORMATIONNEL

35

structurale de la phrase considérée, c'est-à-dire son« indicateur syntagmatique». Ces grammaires enfin, dans la mesure où elles rendent explicites les relations entre constituants et sous-constituants, fournissent des représentations naturelles de 1' ambiguïté structurale. Qu'en est-il des grammaires dépendantes du contexte, dont je n'ai rien dit jusqu'ici? Il existe des langages qui peuvent être engendrés par des grammaires contextuelles, mais pas par des grammaires non contextuelles, et des phénomènes linguistiques qui sont hors de portée de ces dernières. On peut citer le langage redoublé formé sur {a, b}, contenant les séquences a a, ab ab, aabab aabab, etc. Un exemple concret de ce type de situation est fourni par les constructions contenant 1' adverbe respectivement, qui illustrent des relations de dépendance entre le nième terme d'une séquence A et le nième terme d'une séquence B. (9)

a. Pierre et Paul ont lu respectivement L'étranger et Le sursis. b. Pierre, Julie et Paul étaient respectivement courageux, entreprenante et nonchalant.

(9b) montre qu'en français, ce type de dépendance est également manifesté par l'accord, chaque adjectif devant s'accorder avec le groupe nominal qui lui correspond. Les phénomènes d'accord sont naturellement représentés par une grammaire contextuelle, mais ne peuvent l'être que de façon très artificielle si 1' on raisonne dans le cadre d'une grammaire non contextuelle. Il apparaît donc que les grammaires dépendantes du contexte sont intrinsèquement plus puissantes que les grammaires indépendantes du contexte. Mais, contextuelles ou non, les grammaires syntagmatiques ne semblent pas pouvoir rendre compte de tous les cas d'ambiguïté, simplement parce qu'à première vue, certains ne peuvent être résolus dans les termes d'une analyse basée exclusivement sur les règles syntagmatiques. Cette situation est illustrée par des expressions nominales comme the shooting of the hunters (discutée par Chomsky) ou la condamnation du juge ou par des phrases comme Julie aime mieux Paul que Lucie ou L'ogre a fait manger les enfants, dont on supposait à l'époque qu'elles admettaient, dans leurs différentes interprétations, la même représenta9 tion structurale, c'est-à-dire la même structure en constituants. Un autre phénomène absolument hors de portée des grammaires syntagmatiques et qui a fourni à la notion de transformation sa motivation 9

En fait, les recherches ultérieures ont établi que les exemples cités dans ce paragraphe sont tous structuralement ambigus.

36

DANS LE LABYRINTHE DU LANGAGE

initiale est 1' existence de relations systématiques entre certains types de phrases. C'est le cas de la relation entre une construction active et la construction passive correspondante ou entre les phrases contenant le verbe sembler ou l'adjectiffaci/e dans leur version impersonnelle et dans leur version personnelle. (10) a. Cette lettre a été écrite par Cicéron en 52. b. Cicéron a écrit cette lettre en 52. (11) a. Pierre semble parler le chinois couramment. b. Il semble que Pierre parle le chinois couramment. (12) a. Ce livre est facile à lire. b. Il est facile de lire ce livre.

Ce type de relation échappe à une grammaire syntagmatique qui ne peut que générer séparément les différents types de phrase impliqués, ce qui impose une répétition inélégante dans la formulation des règles des restrictions communes aux deux structures et échoue à représenter l'étroite parenté entre elles, détectée par les locuteurs. L'existence de constituants discontinus, le fait que l'auxiliaire être et la marque participiale -é en français doivent être introduits conjointement dans la dérivation des constructions passives par exemple, font également problème pour les règles syntagmatiques. Une fois apportée la preuve de l'insuffisance des grammaires syntagmatiques dans la description et 1' explication de certains phénomènes, il était naturel de chercher à construire une théorie qui évitait les écueils rencontrés par le modèle syntagmatique, mais en conservait les avantages. 2.3.

GRAMMAIRES TRANSFORMATIONNELLES

Les règles syntagmatiques rencontrent donc plusieurs difficultés qu'elles ne sont pas à même de surmonter: l'existence de constituants discontinus, les phénomènes d'ambiguïté non structurale, 1' impossibilité d'accorder un statut différent aux constructions basiques - les phrases actives - et aux autres - les passives ... La conclusion de Chomsky est que les règles syntagmatiques sont nécessaires et pleinement adéquates pour générer un sous-ensemble de phrases basiques, illustrant un nombre limité de types propositionnels - phrases indicatives déclaratives, affirmatives -, et que les autres phrases, plus complexes, sont produites par des opérations d'un type différent, les transformations, s'appliquant aux structures produites par les règles syntagmatiques.

LE PREMIER MODÈLE TRANSFORMATIONNEL

37

Il est facile de vérifier qu'une phrase active (lOb) et son correspondant passif (1 Oa) partagent plusieurs propriétés. Une phrase passive n'est bien formée que si la phrase active l'est également. Une séquence active dans laquelle les restrictions de sélection ne sont pas observées (*La sincérité admire Paul) aura pour contrepartie passive une suite mal formée (*Paul est admiré par la sincérité). Il est vrai que les structures discursives des séquences actives et des séquences passives ne sont pas identiques : dans les deux constructions, le terme réalisé dans la position de sujet grammatical fonctionne comme le topique de l'énoncé. Mais le contenu cognitif et la valeur de vérité des deux phrases sont identiques. Tentons de décrire les effets de la «transformation passive». Tous les éléments lexicaux contenus dans la phrase active se retrouvent dans la phrase passive. Mais la transformation passive introduit dans la phrasenoyau active plusieurs modifications majeures. L'auxiliaire être est inséré. La position des deux expressions nominales est inversée: le sujet grammatical de la phrase active est réalisé comme complément de la préposition par, l'objet direct du verbe de la phrase active occupe la position de sujet grammatical dans la phrase passive. On en arrive à la (première) formulation de la transformation passive, donnée dans Structures syntaxiques (adaptée ici au français). ( 13) Transformation passive - facultative NP 1 -Aux - V- NP 2 analyse structurale: changement structural : NP 2 - être + -é - V - par NP 1

Une transformation est définie par l'analyse structurale des séquences auxquelles elle s'applique et par le changement structural qu'elle effectue sur ces séquences. La raison pour laquelle les transformations sont formellement plus complexes que les règles syntagmatiques est facile à percevoir: ce ne sont pas, comme ces dernières, des règles de construction de la structure, introduisant progressivement les différents éléments d'une phrase. Elles sont assimilables à des opérateurs intervenant sur des structures déjà construites, les modifiant de façon complexe et convertissant un indicateur syntagmatique en un autre. Mais pas plus que les règles syntagmatiques, les transformations ne peuvent s'appliquer dans un ordre arbitraire. Il faut s'assurer par exemple que 1' affixe participial s'attache à la droite de la racine verbale qu'il précède quand le contexte d'application de la règle est satisfait. Ce processus obligatoire ne s'observe pas seulement dans les constructions passives, mais dans toutes les structures contenant un complexe verbal avec participe. Il va de soi que la transformation correspondante, qui est une opération essentiellement morpholo-

38

DANS LE LABYRINTHE DU LANGAGE

gique, ne peut prendre effet avant que être ... é ... ait été inséré dans la position Aux. Notons que, dans cette présentation, les transformations affectent indifféremment les syntagmes, les mots et les morphèmes, une conception qui fait d'elles des opérations endossant plusieurs fonctions. On observe également que, dans le cas du passif, il faut placer plusieurs restrictions sur l'analyse structurale des séquences affectées. Leur description indique qu'une séquence V- NP doit être présente, condition qui est satisfaite si V est transitif, mais on sait que certaines séquences analysables comme V- NP n'autorisent pas le passif, celles par exemple 10 qui contiennent les verbes peser, mesurer, ou devenir. La relation qui existe entre ( 11 b) et ( 11 a) ou celle qui se vérifie entre ( 12b) et ( 12a) peut également être abordée en termes transformationnels. Aux yeux de Chomsky, l'existence de relations entre phrases est un objet pour la recherche en syntaxe et l'hypothèse transformationnelle est mieux à même qu'aucune autre de représenter et expliquer de façon élégante et naturelle ces relations. A supposer en effet que les grammaires syntagmatiques puissent générer toutes les phrases grammaticales d'une langue et seulement ces phrases, elles ne sont pas en position de leur assigner des descriptions structurales qui révèlent les relations formelles pouvant exister entre elles. L'avantage d'intégrer les transformations au dispositif grammatical tient à ce qu'elles permettent une simplification considérable de la grammaire. Elles ouvrent également la voie à une analyse simple et rigoureuse de certaines ambiguïtés, désormais traitées comme des cas d'homonymie d'origine transformationnelle parce que leur résolution, hors de portée des seules règles syntagmatiques, impose le recours à des opérations d'une autre nature. C'est le cas de l'expression the shooting of the hunters, mentionnée en 2.2., qui peut résulter de la transformation de deux structures sous-jacentes différentes, the hunters shoot x et x shoots 11 the hunters. C'est aussi le cas de l'exemple célèbre Flying planes can be dangerous, que Chomsky analyse comme un cas d'ambiguïté transformationnelle puisque à deux dérivations transformationnelles distinctes 10

Bien que peser à 1' actif soit construit directement avec un complément nominal, il n'existe pas de tournure passive dans laquelle ce complément serait le sujet grammatical de 1' énoncé, cf Cette thèse pèse trois kilos/* Trois kilos sont pesés par cette thèse. 11 Dans Structures syntaxiques, la nominalisation est un processus transformationneL Et 1' ambiguïté de cette construction est prise comme un argument en faveur de 1' approche transformationnelle. Les développements ultérieurs de la théorie, en particulier 1' abandon des transformations généralisées dans Aspects et la définition d'une approche lexicaliste des nominalisations dans Remarks, ont rendu cet argument inopérant

39

LE PREMIER MODÈLE TRANSFORMATIONNEL

12

correspondent des séquences linéaires identiques. Chomsky évoque dans une note la possibilité qu'une fois développée une grammaire transformationnelle adéquate, il n'y ait plus aucun cas d'homonymie constructionnelle au niveau syntagmatique (voir Chomsky 1957: 95, note 2). Maintenant que le contenu de la notion de transformation a été précisé, il est possible d'indiquer en quoi exactement la conception de Chomsky se distingue de celle de Harris. Comme on l'a rappelé plus haut, le terme a son origine dans les travaux de ce dernier. Et il y a là plus qu'un emprunt terminologique, une forme de recyclage, peut-être même de détournement par un disciple suprêmement doué. On ne peut échapper à cette impression quand on lit un texte de Harris, publié en français en 1990 dans la revue Langages, avant la version originale anglaise, où il cherche à défmir 1' environnement intellectuel qui a conduit à la défmition des transformations. Il rappelle qu'à l'arrière-plan de toute sa recherche, il y a les fondements des mathématiques et de la logique et l'analyse des formalismes, en particulier le développement des méthodes récursives par Gôdel et Tarski et la syntaxe de la logique de Quine dans Mathematical Logic. Il fait aussi référence au constructivisme dominant à 1' époque, présent dans la théorie des types de Russell, dans le travail de Post et dans la procédure de la machine de Turing. Il dit avoir trouvé par la suite un support philosophique dans l'approche nominaliste de Goodman, développée dans son livre The Structure of Appearance. En bref, le cadre conceptuel dans lequel s'est inscrite la recherche initiale de Chomsky était aussi celui que Harris avait mis en place dans les années 40 et dans lequel il menait son 13 enquête distributionnaliste et transformationnelle. 12

Mais cet exemple n'a cependant pas toute la clarté souhaitable, puisque son ambiguïté ne peut pas être traitée en termes exclusivement transformationnels. Elle résulte avant tout de la possibilité de deux emplois différents des formes gérondives V-ing en anglais. Dans un emploi, on a affaire à une forme verbale authentique, sélectionnant un argument direct (ici planes), le constituant gérondif en position sujet ayant un statut propositionnel. Dans 1' autre emploi, la forme V-ing fonctionne comme un modificateur adjectival épithète de planes etflyingplanes a le statut d'un groupe nominal. Il s'agit donc d'une ambiguïté lexicale et catégorielle, induite par les propriétés morpho-syntaxiques de -ing, imposant dans la dérivation de cette expression de poser des structures sous-jacentes différentes et de suivre des parcours transformationnels différents. Ce sont ces deux dernières caractéristiques qui permettent à Chomsky de parler d'homonymie constructionnelle. Je remercie Robert Freidin pour la discussion de ce point. 13 Zellig Harris précise avoir eu, dans les années 50, des discussions sur les transformations avec Rudolf Carnap et son élève Yehoshua Bar-Hillel, Jean Piaget, Henry Hiz, Maurice Gross, le mathématicien Marcel-Paul Schützenberger et le logicien André Lentin, et avec ses étudiants, en particulier N oam Chomsky, «qui a développé la recherche dans le sens d'un système génératif transformationnel étendu» (voir Harris 1990).

40

DANS LE LABYRINTHE DU LANGAGE

L'intuition de départ sous-jacente aux deux conceptions de la transformation est la même : il peut exister entre phrases des relations significatives, par exemple entre les phrases actives et les phrases passives mettant enjeu la même collection d'items lexicaux. Mais des divergences apparaissent dans les points de vue adoptés. Pour les caractériser, Milner (1973) propose de reprendre l'opposition familière en logique contemporaine entre «intension» et «extension». Harris caractérise les relations entre phrases de façon extensionnelle : les transformations sont définies comme des classes d'équivalence entre phrases; la relation entre les différents membres d'une classe n'est pas orientée. Chomsky au contraire raisonne en termes intensionnels: les transformations sont des règles grammaticales. Comme cela a été indiqué plus haut, une transformation est caractérisée par (i) une transformation élémentaire et (ii) une condition structurale exprimée à partir du prédicat« analysable en». Ce qui est défini, c'est une entité spécifique, la règle de transformation, et non une classe de paires de phrases; le fait que deux phrases soient en relation est envisagé comme une propriété de la paire, qui est distincte de la paire elle-même, et dont la règle ... est le symbole (Milner 1973: 192).

Cette différence de point de vue est à 1' origine de nombreuses divergences empiriques. La théorie de Harris implique qu'une phrase déclarative peut former une classe d'équivalence avec la construction emphatique correspondante (Jean est venu/C'est Jean qui est venu), car l'une peut être vue comme une paraphrase de l'autre. Cette option n'est pas disponible quand on raisonne en termes intensionnels. Dans un modèle syntaxique formellement contraint, aucune règle ne peut permettre le passage de la phrase déclarative à la phrase emphatique. Une deuxième différence est que la description structurale d'une transformation grammaticale chez Chomsky peut contenir des éléments abstraits, la structure propositionnelle de départ étant elle-même une structure 14 abstraite qui peut ne pas être réalisable comme telle. Cette option n'est pas disponible si 1' on raisonne en termes de classes. On a donc clairement affaire à deux théories distinctes qui opèrent des groupements de données différents et donnent lieu à des prédictions empiriques différentes. 14

C'est le cas de la structure sous-jacente à une construction passive dans le modèle des principes et paramètres. Dans le cas de (i), cette structure est (ii). (i) Cette lettre a été écrite par Cicéron (ii) [NP [Ta] [VP été [vPécrit [NP cette lettre] [PP par Cicéron]]]] Le symbole NP désigne une catégorie nominale qui n'est remplie que dérivationnellement

LE PREMIER MODÈLE TRANSFORMATIONNEL

3.

41

L'APPORT DE STRUCTURES SYNTAXIQUES

Lorsqu'on cherche à caractériser 1' apport de Structures syntaxiques, il 15 convient d'éviter un malentendu. On croit souvent que la contribution majeure de Chomsky dans ce livre est d'avoir établi, en s'appuyant sur une notion de structure en constituants rigoureuse et axiomatisée et en la confrontant avec des phénomènes empiriques indiscutables, l'insuffisance des grammaires syntagmatiques pour la description des langues naturelles. Chomsky a bien fait la démonstration que les langues naturelles ne sont pas des langages à états finis. Mais, en ce qui concerne les grammaires syntagmatiques, Structures syntaxiques ne contient aucune démonstration formellement valide que ces grammaires n'ont pas une capacité générative suffisante, seulement un ensemble d'observations particulièrement suggestives, touchant la coordination, la relation actif/passif et, bien sûr, la structure des séquences d'auxiliaires en anglais et sa dérivation (une réussite incontestable, dont je n'ai rien dit, et qui a largement contribué à la notoriété du jeune Chomsky). Personne, dans les années qui ont suivi, n'a tenté d'établir formellement le bien-fondé de l'assertion que les grammaires syntagmatiques n'ont pas une capacité générative suffisante. Ce n'est que plus tard, en 1976, que Bresnan a démontré que la relation entre l'actif et le passif pouvait très bien être caractérisée en termes syntagmatiques, en recourant à des règles lexicales. Gazdar, Klein, Pullum & Sag (1985) ont ensuite établi qu'en se dotant d'une théorie plus sophistiquée des traits syntaxiques et en concevant les catégories syntaxiques comme des matrices de traits, il devenait possible de décrire les dépendances interrogatives à distance sans recourir aux transformations et, plus généralement, de rendre compte des relations jugées problématiques par Chomsky. La question initialement posée par Chomsky retrouvait alors toute son importance: les grammaires syntagmatiques ont-elles une capacité générative suffisante? Ce n'est qu'en 1985 que Shieber a fait la démonstration que ce n'est pas le cas, fournissant à l'argumentation de Chomsky les preuves formelles qui lui faisaient défaut. On sait qu'aujourd'hui encore, les linguistes intéressés à la syntaxe et à la formalisation des langues naturelles sont partagés quant au recours au mécanisme des transformations et à l'adoption de modèles 16 dérivationnels plutôt que représentationnels. La seule caractéristique 15

Je suis redevable à Philip Miller pour le contenu de ce paragraphe, qui reprend, avec quelques modifications, un passage de Rouveret 2015 (voir p. 16). 16 Un modèle dérivationnel est un modèle dans lequel la structure syntaxique d'une phrase ou d'un constituant est le produit d'une dérivation, c' est-à-dire d'un processus dans

42

DANS LE LABYRINTHE DU LANGAGE

qui permet de regrouper plusieurs théories syntaxiques des années 70 et 80 sous le label unifiant de «grammaires d'unification» est précisément que toutes dénient à la notion de transformation une quelconque utilité et choisissent de raisonner dans les termes d'un modèle représentationne!, tantôt à plusieurs niveaux, comme la Grammaire LexicaleFonctionnelle de Bresnan, tantôt monostratal, comme la grammaire HPSG (Head-Driven Phrase Structure Grammar, Grammaire syntag17 matique guidée par les têtes). Aux yeux de Chomsky, certaines au moins de ces théories concurrentes ne sont rien d'autre que des variantes notationnelles de son propre système. Il faudrait, pour en apporter la preuve, montrer qu'elles sont «fortement équivalentes» au modèle génératif, une démonstration qui est malheureusement hors d'atteinte parce qu'il est difficile de décider si deux grammaires concurrentes assignent la même description structurale aux phrases qu'elles génèrent. La question de fond est la suivante: est-il préférable de formuler les restrictions sur le fonctionnement grammatical comme des conditions de bonne-formation sur les représentations rendues disponibles par la théorie ou comme des contraintes sur les mécanismes dérivationnels qui produisent ces représentations? Or on observe que la plupart des modèles dérivationnels sont aussi représentationnels (1' inverse n'est évidemment pas vrai), puisqu'une dérivation produit des représentations et qu'on peut distinguer, dans la séquence dérivationnelle, des objets syntaxiques, c'est-à-dire des niveaux de représentation, qui sont spécialisés dans la représentation d'une propriété spécifique. L'approche minimaliste (voir chapitres VII et VIII) est fondée sur l'idée qu'il est nécessaire de recourir à un système hybride, faisant usage de deux types de conditions, des contraintes dérivationnelles, consistant par exemple à sélectionner les déplacements les plus courts, et des contraintes représentationnelles, directement formulées sur les représentations de la forme (PF) et du sens (LF). lequel des objets syntaxiques de plus en plus complexes sont construits progressivement par une séquence ordonnée d'opérations syntaxiques. Un modèle représentationnel est un modèle dans lequel une ou plusieurs représentations sont associées à une phrase donnée, sans que soit posée la question de leur origine, ni, si plusieurs représentations sont impliquées, celle de savoir comment est établi le lien entre elles. Sur 1' opposition entre modèles dérivationnels et modèles représentationnels, voir Smith 2004, en particulier p. 76-78, Rouveret 2015, p. 60-62. 17 Ces différentes grammaires ont été développées, à partir des années 70 et 80, avec des succès divers, par des chercheurs qui étaient parfois des disciples directs de Chomsky (c'est le cas de Joan Bresnan, de Ivan Sag). Sur ces «nouvelles syntaxes», voir Abeillé 2007.

LE PREMIER MODÈLE TRANSFORMATIONNEL

43

L'usage des outils mathématiques en linguistique semble d'autre part devoir être relativisé. Il est sans commune mesure avec son emploi en physique, où les explorations mathématiques permettent de prédire des phénomènes importants. Maurice Gross comparait plutôt le recours à 1' outil mathématique en linguistique à celui des accélérateurs de particules, les machines qui permettent aux physiciens de découvrir des faits entièrement nouveaux sur le noyau et de ce fait de poser des questions de fond sur la nature du monde physique. De même, en linguistique, 1' exploitation de 1' outil mathématique et 1' emploi des méthodes formelles permettent de découvrir des contraintes sur le langage inaperçues jusqu'alors et de poser à son sujet des questions nouvelles. Chomsky a cessé de s'intéresser à ce type de recherche au début des années 60. Et, pour être pleinement honnête, il n'est pas facile de décider à quel type de langage appartient l'ensemble des séquences générées par une grammaire générative, de déterminer où ces séquences se situent dans la hiérarchie des grammaires formelles. Chomsky n'aborde la question que dans son travail avec George Miller (1963). On pense aujourd'hui que les grammaires génératives sont «faiblement dépendantes du contexte». C'est du moins ainsi que les caractérise Joshi (1985). Les insuffisances et les défauts du modèle mis en place dans Structures syntaxiques sont immédiatement repérables aujourd'hui, surtout à la lumière des développements ultérieurs qui les ont corrigés. Une question délicate, qui ne reçoit pas dans le livre de réponse satisfaisante, est celle de la non-génération. Il s'agit bien de définir un mécanisme capable de «générer toutes les séquences grammaticales d'une langue et aucune des séquences agrammaticales». Mais cette formule peut s'entendre de deux façons. La grammaire est-elle simplement un procédé destiné à engendrer directement les phrases non déviantes d'une langue? Ou doit-elle être aussi en mesure d'assigner une description structurale et une interprétation aux phrases déviantes, en indiquant pourquoi elles sont mal formées? Dans Structures syntaxiques, c'est la première option qui semble avoir la préférence: les phrases non grammaticales sont exclues du processus génératif. Mais la seconde option est clairement la seule compatible avec la nécessité de distinguer des degrés de grammaticalité. C'est aussi pour l'essentiel celle qui est adoptée dans Aspects (voir Chomsky 1965: 204, note 2). La position finalement retenue par Chomsky est que les séquences grammaticales sont générées par le mécanisme génératif, les séquences agrammaticales ne sont pas générées, et c'est à la théorie qu'est laissé le soin de décider pour les cas

44

DANS LE LABYRINTHE DU LANGAGE

18

intermédiaires. La question de la non-génération reste présente dans le programme minimaliste, où certaines structures syntaxiques produites librement atteignent les niveaux d'interface C-I et SM et sont filtrées à ces niveaux, alors que d'autres structures ne sont pas générées du tout parce qu'elles violent l'un des principes d'efficacité computationnnelle (dans Aspects, Chomsky parle de la fonction filtrante des transformations). Ce modèle ne permet pas non plus de spécifier que les noeuds syntagmatiques comme NP sont eux-mêmes décomposables en catégories plus petites et donc de capturer l'observation qu'un NP contient toujours un N, un VP un V (c'est-à-dire, en termes contemporains, que NP est la projection de N, VP la projection de V) ... Le composant syntagmatique est d'autre part spécifié comme libre par rapport au contexte, ce qui rend la représentation de différences lexicales comme l'opposition transitif/ intransitif extrêmement peu naturelle. Ces limitations ont été corrigées dans Aspects de la théorie syntaxique par la mise en place d'un lexique autonome et d'un système de règles d'insertion lexicale, puis plus tard par la définition de la théorie X-barre, assignant une structuration interne identique à tous les syntagmes, quelle que soit 19 leur identité catégorielle. L'effet de ces innovations est de réduire la redondance entre les propriétés lexicales et les règles syntagmatiques et de permettre la formulation de ces dernières sous la forme la plus simple possible, c'est-à-dire comme des opérations indépendantes du contexte. Ces règles seront entièrement éliminées par la suite, mais la formulation de la théorie X-barre pointait déjà dans cette direction. De même, la forme donnée au composant transformationnel contenant de très nombreuses transformations spécifiques, ordonnées et caractérisées comme obligatoires ou facultatives, paraît archaïque aujourd'hui que le modèle n'inclut plus qu'une ou deux opérations transformationnelles très générales. Lasnik (20 18), à qui sont dues certaines des observations précédentes, note cependant que bien des notions fondatrices de la Grammaire Générative, déjà présentes dans Structures syntaxiques, sont encore actives aujourd'hui, parfois sous une forme différente: structure, dérivation, structure sous-jacente, opposition entre transformations 18

Pour une mise au point récente, voir Freidin 2020. Il me fait observer que Structures syntaxiques ne contient qu'une seule représentation arborescente et que 1' accent est mis presque exclusivement sur 1' ordre linéaire des mots dans 1' énoncé, établissant une équivalence entre la déviance et la non-génération de séquences au niveau phonologique. Il s'agit là d'une simplification excessive qui peut donner lieu à malentendu dans un livre qui établit l'importance décisive des structures hiérarchiques en syntaxe. 19 Sur ces notions, voir chapitre VII.

45

LE PREMIER MODÈLE TRANSFORMATIONNEL

20

singulaires et transformations généralisées . . . C'est la raison pour laquelle il a paru souhaitable de présenter le premier modèle transformationnel de façon relativement détaillée.

4.

CoNCLUSION '

A l'origine de la grammaire transformationnelle, il y a la découverte des insuffisances du modèle syntagmatique dans la description et 1'explication de certains phénomènes linguistiques et la nécessité de construire un modèle plus adéquat, inévitablement plus complexe, permettant de les intégrer. Mais il y a aussi le souci, qui se manifestera plus clairement dans les articles et les livres des années 60, de renouer avec les préoccupations des grammairiens et philosophes des XVIIe et XVIIIe siècles, qui avaient une claire conscience de la distinction entre le langage et les langues, distinction nécessaire, selon eux, dans toute approche rationnelle du langage. Chomsky, dans La linguistique cartésienne, cite le texte suivant de Du Marsais, datant de 1729. Il y a dans la grammaire des observations qui conviennent à toutes les langues; ces observations forment ce qu'on appelle la grammaire générale ... Outre ces observations, il y en a qui ne sont propres qu'à une langue particulière ; et c'est ce qui forme les grammaires particulières de chaque langue (cité dans La linguistique cartésienne, p. 86).

La notion de «grammaire générale» apparaît également dans l'extrait suivant de Beauzée, datant de 1767. La Grammaire Générale est... la science raisonnée des principes immuables et généraux du Langage prononcé ou écrit, dans quelque langue que ce soit. Une Grammaire Particulière est l'art d'appliquer aux principes immuables et généraux du Langage prononcé ou écrit les institutions habituelles et usuelles d'une langue particulière. La Grammaire Générale est une science, parce qu'elle n'a pour objet que la spéculation raisonnée des principes immuables et généraux du Langage. Une Grammaire Particulière est un art, parce qu'elle envisage l'application pratique des institutions arbitraires et usuelles d'une langue particulière aux principes généraux du Langage. 20

Par définition, les transformations singulaires opèrent sur des propositions simples, alors que les transformations généralisées construisent une structure complexe en combinant deux propositions. Cette distinction est discutée au chapitre VII, section 2.1.

46

DANS LE LABYRINTHE DU LANGAGE

La science grammaticale est antérieure à toutes les langues, parce que ses principes ne supposent que la possibilité des langues, qu'ils sont les mêmes que ceux qui dirigent la raison humaine dans ses opérations intellectuelles; en un mot, qu'ils sont d'une vérité éternelle (cité dans La linguistique cartésienne, p. 87).

Or on peut dire que le structuralisme linguistique s'est précisément construit sur le rej et de ce que les générations précédentes appelaient «grammaire générale». Alors que la seconde défend une forme d'universalisme grammatical, les sources de variation entre les langues sont pour le premier quasiment infinies. Mais en se limitant aux études distributionnelles et à la définition de procédures rigoureuses, les structuralistes américains ont occulté les questions que l'on posait sur le langage dans les siècles précédents. Ils ont aussi rejeté le savoir grammatical traditionnel, remontant à Panini, aux philosophes médiévaux intéressés au langage et aux messieurs de Port-Royal (l'idée de récursion est tout à fait explicite dans la Grammaire générale et raisonnée d'Arnauld et Lancelot, celle de grammaire transformationnelle affleure dans plusieurs passages et l'opposition entre extension et intension est utilisée comme principe explicatif). Ce savoir considérable, qui se réduisait parfois à des observations relevant du sens commun, s'est perdu au XIXe et au XXe siècle. Il a été complètement ignoré par les linguistes structuralistes comme Bloomfield, par les philosophes béhavioristes comme Quine, par les psychologues du comportement comme Skinner. Pour la Grammaire Générative, la formalisation ne saurait se faire aux dépens des aperçus et des analyses de la grammaire traditionnelle, qui doivent au contraire être scrupuleusement pris en compte Il s'agit donc à la fois d' emichir le modèle syntagmatique de façon à lui permettre d'aborder et d'expliquer certains phénomènes hors d'atteinte des techniques de description structuralistes habituelles et de définir un cadre méthodologique et technique suffisamment riche et flexible pour intégrer les perspectives générales ouvertes par la tradition 21 grammaticale. 21

On ne peut ici passer sous silence le développement de la grammaire comparée des langues inde-européennes en Allemagne et en France dans la deuxième moitié du XIXe siècle et dans la première moitié du xxe, qui constituait alors le noyau dur de 1' étude scientifique du langage et a atteint, avant le structuralisme, un haut niveau de rigueur, d'exactitude et de scientificité. Le projet de la grammaire comparée retrouve en partie, de façon inattendue, 1'universalisme de la grammaire générale. Son ambition était en effet de reconstruire les systèmes grammaticaux des langues anciennes à partir de leur morphologie et de restituer les formes perdues de 1' indo-européen en s'appuyant sur des chaînes d'arguments formels, fondés sur une batterie de lois phonétiques et quelques principes généraux. On sait que deux des plus grands linguistes du siècle dernier, Saussure et

LE PREMIER MODÈLE TRANSFORMATIONNEL

47

Il ne s'agit donc nullement pour Chomsky de «recommencer» la linguistique, mais au contraire de reprendre sur de nouveaux frais le programme de la grammaire générale, de repenser des questions anciennes en s'appuyant sur un modèle opératoire ouvrant la voie à la formulation d'hypothèses explicites et empiriquement vérifiables.

Benveniste, ont été comparatistes avant d'être généralistes et que c'est la nécessité de définir les conditions rendant la comparaison possible qui les a amenés à poser des questions générales sur le langage. Il y a de fait entre le raisonnement comparatiste et le raisonnement du premier générativisme une certaine analogie, soulignée à plusieurs reprises par Milner (voir par exemple Milner 1989a: 148). Dans les deux disciplines, la démonstration débouche sur un objet abstrait non attesté. Une deuxième convergence concerne la nature de la reconstruction elle-même. En grammaire comparée, c'est une chose de conclure par le raisonnement à 1' existence des laryngales, autre chose de leur associer une substance, c'est-à-dire une prononciation. Le raisonnement comparatif ne permet d'accéder qu'à la forme de l'objet reconstruit, pas à sa substance. La situation n'est pas fondamentalement différente dans la démarche générative.

CHAPITRE III

QU'EST-CE QUE LE LANGAGE?

Il est étrange de penser que le langage a une fonction. Les langues ne sont pas des outils créés par les humains, mais des objets biologiques, comme le système visuel, le système immunitaire ou le système digestif (What Kind of Creatures are We? p. 14).

Au début de «Problems of projection», un article de 2013, Chomsky 1 revient sur ce qui fait la spécificité de l'entreprise générative. Brossant à grands traits un tableau du paysage intellectuel du début des années 50 aux Etats-Unis, âge d'or des sciences du comportement, il rappelle les idées sur le langage contre lesquelles cette entreprise s'est construite (voir Chomsky 2013: 33-34). Si l'on admet, à la suite de Quine, que le langage n'est rien d'autre qu' «une fabrique de phrases associées de façon variable les unes aux autres et à des stimuli non verbaux par le mécanisme des réponses conditionnées», donc, poursuit Chomsky, «un objet construit accidentellement, dépendant du cours de 1'expérience individuelle», si l'on partage la conviction d'autres philosophes et psychologues de 1' époque que des mécanismes généraux d'apprentissage suffisent à rendre compte de son acquisition, sans qu'il soit nécessaire d'invoquer quelque faculté de langage que ce soit, la recherche sur le langage se réduit à peu de choses : «organiser les données de langues diverses, raffiner les techniques d'analyse des données et découvrir des généralisations valides de grande portée». Les positions de Bloomfield et de Sapir, qui considèrent respectivement le langage comme «la totalité des énoncés produits dans une communauté linguistique» et comme «une méthode purement humaine et non instinctive pour communiquer [ ... ] au moyen d'un système de symboles produits volontairement», laissent peu de place à la recherche sur des questions fondamentales, comme 1' acquisition du langage, son emploi, son évolution, son implantation neuronale. Selon ?

1

L'introduction de ce chapitre reprend, avec quelques modifications, un développement de Rouveret 2015, p. 21-22.

50

DANS LE LABYRINTHE DU LANGAGE

Chomsky, Saussure n'était pas dans une position plus favorable, lui qui considérait la langue comme «la somme des images verbales emmagasinées chez tous les individus [ ... ] appartenant à une même communauté, qui n'est complète dans aucun [individu]; elle n'existe parfaitement que dans la masse [ ... comme] un objet bien défini dans l'ensemble hétéroclite des faits de langage ... ». L'idée défendue par Joos (1957) et, en France, par Martinet (1960) que la double articulation est la seule propriété universelle des langues qui, par ailleurs, peuvent «différer les unes des autres sans limite et de façon non prédictible » va de pair avec la restriction du champ à la phonologie et à la morphologie, domaines dans lesquels la variation linguistique est considérable et en apparence aléatoire. Simpliste et rudimentaire, cette conception condamne à l'avance toute tentative visant à poser des questions de fond sur le langage. C'est pour aborder ces questions dans un cadre approprié que la grammaire générative a abandonné 1' approche taxinomique de la linguistique structurale et s'est attachée à «développer un concept de langage suffisamment concret pour guider 1' étude de ses propriétés essentielles » (Chomsky 2 0 13 : 3 5).

1.

L'OBJET DE LA THÉORIE LINGUISTIQUE

Si la linguistique est, comme on la définit habituellement, 1' étude scientifique du langage humain, il faut savoir ce que 1' on veut dire lorsqu'on parle de langage. Il faut aussi, pour reprendre une formulation de 2 Milner (1989a), «poser la question de la science à propos du langage». Or, quand on examine la position chomskyenne sur le langage et la science, on se rend compte très vite que la définition inaugurale de la linguistique rappelée ci-dessus ne peut être maintenue. S'interroger sur le contenu à donner à la notion de langage, c'est s'interroger sur l'objet même de la théorie linguistique. Dans Aspects de la théorie syntaxique, la caractérisation de ce dernier s'inscrit dans des limites très étroites. On s'intéresse à un locuteur-auditeur idéal, appartenant à une communauté linguistique complètement homogène, qui connaît parfaitement sa langue et qui, lorsqu' il applique sa connaissance de la langue dans une performance effective, n'est pas affecté par des considérations grammaticalement non pertinentes, telles que limitations de mémoire, distractions, déplacements d'intérêt ou d'attention, erreurs (fortuites ou caractéristiques) ... (Chomsky 1965: 12). 2

Ce deuxième point est abordé dans le chapitre IV.

51

Q u' EST-CE QUE LE LANGAGE ?

Il est nécessaire d'établir «une distinction fondamentale entre la compétence (la connaissance que le locuteur-auditeur a de sa langue) et la performance (1' emploi effectif de la langue dans des situations concrètes)» (Chomsky 1965: 13). C'est la première, la connaissance mentale tacite qu'un sujet adulte a de sa langue maternelle, que le linguiste se donne pour tâche de caractériser formellement et cette caractérisation passe nécessairement par la construction d'une grammaire. «La grammaire d'une langue se propose d'être une description de la compétence intrinsèque du locuteur-auditeur idéal. » Dans la mesure où elle s'attache à caractériser le langage dans l'esprit des locuteurs et à découvrir la réalité mentale sousjacente à leur comportement langagier, la théorie linguistique peut être dite mentaliste. Elle s'oppose donc frontalement à une approche béhavioriste du langage, qui réduirait ce dernier à un comportement humain parmi d'autres. Stowell (2015: 249) a raison de souligner que c'est la conception mentaliste de la théorie linguistique qui est responsable du changement de perspective touchant la place du domaine dans le paysage intellectuel, qui l'a fait passer du statut de science auxiliaire de l'anthropologie à celui de discipline pilote parmi les sciences cognitives. En posant que ce qu'il s'agissait de modéliser n'était rien d'autre en réalité qu'un système de connaissance, Chomsky affirmait en effet l'appartenance de la linguistique au champ cognitif. Et en considérant la grammaire comme un attribut de l'esprit humain, il jetait les fondations d'une conception de la linguistique comme science de la nature. Le passage célèbre qui vient d'être cité pose que, pour accéder à l'objet d'étude, c'est-à-dire à la compétence du locuteur-auditeur, il faut faire un détour par une forme d'idéalisation et d'abstraction. Cette façon de procéder n'est pas spécifique à la linguistique chomskyenne. Toute approche scientifique s'efforce d'exclure du champ de l'observation les facteurs qui, dans l'objet étudié, ne sont pas pertinents pour la recherche entreprise. C'est ce que faisait Galilée lorsque, étudiant la chute des corps, il choisissait d'ignorer les effets de résistance induits par le vent ou les frottements, non pertinents pour la généralisation qu'il cherchait à établir. Chomsky observe que la distinction qu'il établit entre compétence et performance est à mettre en relation avec la dichotomie entre langue et parole introduite par Saussure dans le Cours, adoptée par les structuralistes 3 européens, rejetée par les linguistes bloomfieldiens aux Etats-Unis. Mais il précise immédiatement qu'il ne souscrit pas à la conception saussurienne ?

3

Pour Saussure, l' objet de la linguistique n 'est pas le langage, mais la langue, qui seule constitue un ensemble homogène.

52

DANS LE LABYRINTHE DU LANGAGE

de la langue comme un «inventaire systématique d'éléments» et lui préfère celle de Humboldt, qui «fait de la compétence sous-jacente un système de processus génératifs». D'autre part, contrairement à la compétence chomskyenne qui renvoie à une réalité psychologique ou mentale, composante de l'esprit des individus, langue chez Saussure caractérise le système linguistique comme un fait social, non individuel. Vingt ans plus tard, dans Knowledge ofLanguage, Chomsky introduit une seconde distinction qui, pour une part, recoupe la première, celle entre le E-langage (E-language) et la !-langue (!-language), où E est 1' abréviation d'« externalisé » et I renvoie tout à la fois à 4 « intemalisé/inteme », «individuel» et « intensionnel ». La notion de Elangage réfère à l'ensemble des événements de parole qui peuvent se produire au sein d'une communauté linguistique. Il est parfaitement possible de construire la grammaire d'unE-langage, mais elle se réduira sans surprise à un ensemble de propositions descriptives, linguistiquement peu significatives et ne faisant aucune référence à 1' esprit ou au cerveau. Comme exemple de ce type d'approche, Chomsky cite Bloomfield (1933) qui posait qu'une grammaire est «l'arrangement signifiant des formes dans une langue». Il lui oppose le point de vue de Jespersen (1924), pour qui il existe dans l'esprit du locuteur une «notion de structure, suffisamment précise pour le guider dans la formation de phrases de son cru», en particulier« d'expressions libres», qui peuvent être nouvelles pour le locuteur et ceux qui 1' entourent. Chomsky propose de référer sous 1' étiquette de I -langue à 1' état mental atteint au cours de l'apprentissage d'une langue particulière par l'intermédiaire de cette structure. Connaître une langue, c'est maîtriser une I -langue particulière et avoir atteint, en passant par plusieurs états eux-mêmes assimilables à des !-langues, l'état mental correspondant qui, par définition, diffère d'une langue à l'autre, mais aussi d'un locuteur à l'autre. C'est de la langue interne, composante de l'esprit de la personne qui connaît une langue particulière, que la théorie linguistique doit s'occuper. Si cette perspective est adoptée, une grammaire générative n'est pas un ensemble de propositions sur des objets externalisés construits d'une certaine façon. Elle se propose de dépeindre exactement ce que 1' on sait quand on sait une langue, c'est-àdire ce que 1' on a appris par la mise en oeuvre de principes innés (Knowledge ofLanguage, p. 24). 4

On peut aussi, pour simplifier, parler de «langue interne», une étiquette qui sera aussi occasionnellement utilisée dans le texte.

Q u' EST-CE QUE LE LANGAGE ?

53

On observe que, comme précédemment la notion de performance, la notion de E-langage est mal définie et renvoie à plusieurs réalités distinctes. Elle désigne non seulement la performance, c'est-à-dire le recours effectif à la connaissance linguistique dans des actes de parole spécifiques, mais réfère aussi globalement à tout ce qui, dans les langues, ne relève pas de la !-langue, c'est-à-dire à leur statut comme systèmes de communication, comme entités sociales, ethnologiques ou psychologiques. Le concept est donc plus flou que celui de performance, qui renvoie exclusivement à 1' emploi effectif de la compétence pour produire et comprendre des énoncés. C'est aller un peu vite en besogne, me semble-t-il, que de regrouper sous une notion relativement mal défmie, le E-langage, tous les aspects du langage qui ne relèvent pas de la langue interne telle que Chomsky la conçoit, c'est-à-dire d'une notion idéalisée, délibérément abstraite et théoriquement restreinte de compétence linguistique, composante de 1' esprit du locuteur. La décision de ne s'intéresser qu'à la !-langue, de n'étudier que les systèmes de computation et de représentation mentales qui la définissent a pour effet de restreindre assez considérablement l'objet d'étude, même si c'est cet objet qui, étant le seul accessible à une enquête de type scientifique, est aussi le seul qui puisse mener à une meilleure compréhension des processus mentaux. Il est légitime de voir dans cette attitude réductionniste de Chomsky une manifestation de son naturalisme, qui impose d'exclure du champ d'étude toute dimension du langage qui ne serait pas susceptible d'être approchée et étudiée en recourant aux méthodes des sciences de la nature 5 et qui se trouverait de ce fait hors science. La notion de !-langue est elle-même relativement complexe. On se souvient que le « I » marque le caractère à la fois interne, individuel, et intensionnel de la conception du langage qui est adoptée. Dans la perspective internaliste, c'est la structure interne de l'esprit qui rend compte à la fois du design du langage et de son emploi, l'environnement externe ne ' jouant aucun rôle dans les computations. A cette dimension interne de la langue s'en ajoutent deux autres: la langue est individuelle ; la langue est intensionnelle. Elle est individuelle parce qu'elle a pour siège l'espritcerveau de chaque locuteur considéré isolément. Elle est intensionnelle, parce qu'il ne s'agit pas de proposer une dérivation extensionnellement correcte, parmi beaucoup d'autres, d'un ensemble infini de séquences, mais d'avancer une caractérisation en intension de la procédure générative

5

Les notions de « naturalisme » et d' « internalisme » sont discutées au chapitre V.

54

DANS LE LABYRINTHE DU LANGAGE

récursive interne représentée dans 1' esprit du locuteur. C'est la I -langue des locuteurs que les grammaires cherchent à décrire et c'est leur capacité générative forte, non leur capacité générative faible, qui détermine le 6 choix entre grammaires concurrentes. L'objet de l'enquête syntaxique n'est donc pas leE-langage, mais la !-langue, élément du monde naturel qui peut être abordé par les mêmes méthodes que celles que l'on utilise pour analyser le système de la vision. On rencontre, dans plusieurs textes, une troisième distinction sur laquelle il convient de s'arrêter brièvement, la distinction entre langage et grammaire. Pour les linguistes structuralistes, l'objet d'étude était le langage. Il était naturel de poser que sa nature pouvait être approchée à travers un examen systématique des propriétés des langues naturelles dans leur considérable diversité. C'est aussi du reste le point de vue sousjacent aux premiers travaux de Chomsky dans les années 50, Structures syntaxiques en particulier. Il s'agissait exclusivement pour lui alors, dans une perspective très harrisienne, de définir un mécanisme capable de «générer toutes les phrases grammaticales d'une langue et seulement ces phrases», sans référence aucune à d'autres réalités telles que l'esprit ou le cerveau ou à la façon dont le langage est acquis. Mais, dans les années qui ont suivi, le point de vue a radicalement changé et c'est encore celui qui prévaut aujourd'hui. Ce sont les grammaires, non le langage entendu au sens large, qui constituent le véritable objet de la théorie linguistique. Contrairement au langage, qui se réduit à un épiphénomène, les grammaires mentales existent dans le monde, elles sont réelles dans l'espritcerveau des individus, chacune étant un ensemble de propositions concernant la langue interne des locuteurs, ce qui fait d'elles «des propositions sur les structures du cerveau, formulées à un certain niveau d' abstraction, indépendamment des mécanismes spécifiques impliqués» (Chomsky 1986a: 23). Le centre d'intérêt s'est donc déplacé du langage vers les grammaires, de l'étude des comportements langagiers observables «vers le système de connaissance sous-jacent à l'emploi et à la compréhension du langage et, plus profondément, vers l'équipement inné qui permet aux humains d'atteindre une telle connaissance» (Chomsky 1986a: 24). Ce déplacement doit, sans aucun doute, être compté au

6

Chomsky distingue deux notions de capacité générative, celle de capacité générative faible qui considère l'ensemble des suites linéairement ordonnées que génère une grammaire associée à une langue L, celle de capacité générative forte qui prend en compte 1' ensemble des descriptions structurales que cette grammaire associe aux phrases de L et qui incluent 1' information nécessaire pour les interpréter.

Q u' EST-CE QUE LE LANGAGE ?

55

nombre des choix théoriques audacieux qui constituent la révolution chomskyenne. De façon significative, Chomsky précise qu'il a introduit la notion de !-langue pour éviter un emploi systématiquement ambigu du mot« grammaire», qui, depuis la fin des années 50, réfère à la fois à l'état interne de la Faculté de Langage du locuteur et à la théorie de cet état construite par le linguiste. Il est préférable à ses yeux de réserver le terme de grammaire, qu'il s'agisse de la Grammaire Universelle ou de grammaires particulières, aux théories construites par le linguiste et de référer sous 1' étiquette de I -langue à 1' état mental que les grammaires cherchent à 7 décrire. Deux autres notions sont fréquemment sollicitées dans les textes chomskyens, celle de Faculté de Langage et celle de Grammaire Universelle. Il convient de les situer par rapport à celles qui viennent d'être introduites. Chomsky fait l'hypothèse qu'un enfant humain possède à la naissance un équipement inné, des structures mentales spécifiques, parties intégrantes du patrimoine génétique de 1' espèce humaine, qui vont lui permettre d'acquérir une compétence dans sa langue maternelle. En d'autres termes, c'est parce que le bébé humain dispose d'une Faculté de Langage hautement structurée, faculté qui évolue au cours de l'apprentissage, que l'acquisition est possible et débouche sur une langue interne stable. Une langue n'est rien d'autre qu'un état de la Faculté de Langage. Et dire qu'un individu connaît une langue, c'est dire simplement que sa Faculté de Langage a atteint l'état correspondant. Dans un article coécrit avec Hauser et Fitch, Chomsky distingue deux conceptions 8 de la Faculté de Langage. Entendue au sens large, elle inclut tous les mécanismes qui font la capacité linguistique, non seulement le système computationnel interne, mais aussi les deux systèmes de performance avec lesquels il est en relation d'interface, le système conceptuel-intentionnel, qui exploite la représentation du sens et de la signification livrée par la computation, et le système sensorimoteur, qui a affaire à la représentation du son. Entendue au sens étroit, la notion renvoie exclusivement à ce qui est spécifiquement linguistique et spécifiquement humain dans cette faculté, c'est-à-dire au système computationnel abstrait qui crée des structures hiérarchiques récursives sur des domaines non bornés. Ce système, dont la cheville ouvrière dans le programme minimaliste est

7 8

Voir Chomsky 2003 : 270. Voir Hauser, Chomsky & Fitch 2002.

56

DANS LE LABYRINTHE DU LANGAGE

l'opération Merge («Fusionner», «Combiner»), est indépendant des 9 autres systèmes avec lesquels il est en relation d'interface. La Grammaire Universelle (Univers al Grammar, UG), qui a plus à voir avec la grammaire qu'avec le langage, est, dans les termes de Berwick & Chomsky (20 16 : 90), «la théorie du composant génétiquement déterminé de la Faculté de Langage, la capacité qui rend possible l'acquisition et l'emploi de I-langues particulières». Elle représente la contribution de la biologie au système mental exclusivement humain qu'est la Faculté de Langage. UG détermine donc à la fois les traits défmitoires des atomes qui entrent dans les computations et la nature des procédures génératives qui capturent les propriétés basiques du langage humain. Elle peut donc être définie comme «la théorie générale des I -langues». La grammaire générative associée à chaque langue particulière est la théorie d'une seule Ilangue. Elle est donc distincte de UG, qui caractérise la dimension génétiquement déterminée de l'aptitude des humains à la connaissance grammaticale et englobe l'ensemble des grammaires possibles. Il est temps de préciser ce qu'il faut entendre par «universel», une notion qui a suscité de vifs débats philosophiques à l'époque médiévale et qui, depuis sa résurgence dans la linguistique contemporaine, a donné lieu à de multiples malentendus. Deux emplois de ce terme doivent être distingués. Joseph Greenberg (1966) est célèbre pour avoir initié une recherche systématique sur les patterns syntaxiques et morphologiques récurrents à travers les langues. Il s'agit, dans une perspective typologique, de construire des universaux d'implication du type: «si une langue a la propriété P, alors elle a la propriété Q». Il s'agit aussi de découvrir quels sont les patterns de surface les plus représentés dans les langues humaines, quelles sont les tendances dominantes (le fait par exemple que les sujets sont généralement placés devant les objets, plutôt 10 que l'inverse). La notion d'universel utilisée par Chomsky est toute 9

L'opération Merge est présentée et discutée dans les chapitres VII et VIII. 10 L'article de Greenberg est à 1' origine du renouveau des études typologiques dans la seconde moitié du XXe siècle. La typologie, qui ne se réduit pas à la formulation d'universaux implicationnels, se fixe comme objectif la classification des langues sur la base de leurs traits structuraux: il s'agit d'identifier des types linguistiques. Mais cette recherche ne peut aboutir que si elle est menée en parallèle avec une quête des invariants du langage, comme Gilbert Lazard 1' a souligné. Les articles de syntaxe générale de Benveniste, pour la plupart antérieurs à la contribution de Greenberg, réunis dans les Problèmes de linguistique générale, les deux volumes de Creissels (2006), 1' ouvrage de Lazard (2006), ainsi que les livres et les articles de Croft, en particulier Typology and Universals (1990), témoignent de la richesse de la discipline. Parallèlement à la quête des invariants syntaxiques et morphologiques, qui avait occupé Greenberg, un axe de

Q u' EST-CE QUE LE LANGAGE ?

57

différente, puisqu'elle renvoie à des contraintes absolues, formulées à un haut niveau d'abstraction et concernant la forme que peuvent prendre les grammaires des langues naturelles (universaux de forme) et les dimensions cognitives, les concepts grammaticaux qu'elles peuvent coder, tels que la distinction entre les noms et les verbes, celle entre le singulier et le pluriel ou entre les trois personnes (universaux de substance). Ce sont les universaux de forme qui jouent un rôle déterminant dans les grammaires chomskyennes et ce sont eux précisément qui, pris ensemble, déterminent l'armature de ce que Chomsky appelle la Grammaire Universelle. Ils ne concernent pas les patterns superficiels récurrents dans 1' ordre des mots, mais s'adressent directement à la capacité de construire les structures sous-jacentes aux séquences superficielles, c'est-à-dire de déterminer l'architecture de la linéarité. L'hypothèse de la Grammaire Universelle n'implique donc pas que toutes les langues se ressemblent. Elle signifie par contre que ce sont les mêmes principes abstraits, les mêmes concepts, les mêmes mécanismes qui sont cooptés par les grammaires de toutes les langues, lorsqu'il s'agit d'associer une structure hiérarchique à une séquence linguistique, produite ou perçue. Et elle laisse ouverte la possibilité que certaines similarités soient observables entre des langues non reliées génétiquement. Les observations qui précèdent font apparaître à quel point la notion de langage utilisée par Chomsky est abstraite et complexe. La définition de la linguistique comme 1' étude scientifique du langage est de ce fait inappropriée. Elle est également en grande partie vide puisqu'elle ne définit pas les voies que la science devra emprunter pour aborder son objet. Chomsky n'a pas seulement ravivé la conception du langage comme objet mental, présente à l'état embryonnaire chez Descartes et les philosophes rationalistes du XVIIe siècle (voir chapitre V); il a aussi, dès les années 50, introduit des concepts et des mécanismes permettant de représenter de façon précise les propriétés des opérations mentales impliquées dans la syntaxe des langues naturelles. recherche nouveau s'est ajouté à l'agenda typologique depuis plusieurs décennies : l' étude des structures sémantiques et lexicales qui peuvent fournir des indications, précieuses d 'un point de vue cognitif, sur la façon dont les humains se représentent leur position dans 1'univers et les phénomènes qui s'y déroulent (catégorisation des prédicats verbaux, propriétés des constructions réfléchies, classification des termes de couleur ... ). Il reste que, malgré son ambition universaliste, la typologie, telle qu'elle est pratiquée habituellement, se signale surtout par le rejet systématique de toute abstraction, descriptive ou explicative, et par le refus persistant de postuler des entités abstraites qui ne seraient pas directement accessibles à l'observation. Cette posture met quasiment hors d' atteinte l'objectif qu'elle s'est fixé.

58

2.

DANS LE LABYRINTHE DU LANGAGE

QUELQUES PROPRIÉTÉS INCONTOURNABLES

C'est grâce aux progrès accomplis par les sciences formelles dans les recherches sur les fondements des mathématiques et à un appareillage technique nouveau permettant de formaliser les systèmes récursifs que 1' on peut désormais espérer atteindre «une compréhension réelle de la façon dont une langue peut, selon l'expression de Humboldt, "faire un usage infini de moyens finis"» (Chomsky 1965 : 18). Cet aperçu de Humboldt est indissociable de la notion de Faculté de Langage que la théorie linguistique se donne pour tâche de caractériser. Si en effet une langue est un ensemble potentiellement infini de séquences bien formées, 1' être humain qui les produit n'a à sa disposition que des moyens finis, d'une part parce que les unités de la langue ne sont pas en nombre infini et que les structures syntaxiques attestées constituent dans chaque système un ensemble relativement restreint, mais aussi parce que le cerveau humain est un objet organique fini. C'est donc bien de la F acuité de Langage qu'il s'agit de faire la théorie et faire cette théorie, c'est expliciter la nature et le fonctionnement des mécanismes sous-jacents à la production de cet ensemble infini. L'une des conditions nécessaires pour atteindre ce but est de se faire une idée relativement précise de l'objet à décrire et de ses propriétés «incontournables», celles qui, à un niveau préthéorique, définissent des traits avérés du langage humain, celles en dehors desquelles il n'y a pas de langage possible, ni de langage utilisable. Quelles propriétés exactement ont ce statut? On peut sans trop de risque avancer que les propositions descriptives suivantes ont la caractéristique requise. A. B. C. D. E.

les phrases associent du son (ou des gestes) et de la signification; les phrases sont potentiellement infinies; les phrases sont les unités linguistiques basiques; les langues naturelles semblent différer les unes des autres de façon illi. , mitee; un petit enfant exposé à une langue L acquiert nécessairement cette langue.

(A)-(E) énoncent des propriétés qui ne relèvent pas de la connaissance d'une langue particulière, mais de la connaissance des langues naturelles dans leur globalité, donc de la connaissance du langage. (A) enregistre 1' idée que le langage est en relation d'interface avec d'autres facultés cognitives. (B) énonce qu'il n'y a aucune limite sur la longueur des phrases dans les langues: on peut toujours former une phrase plus longue à partir d'une phrase donnée, en l'enchâssant, par exemple, sous Je crois que ... ; le nombre des phrases possibles est donc potentiellement infini.

Qu'EST-CE QUE LE LANGAGE?

59

(C) est une hypothèse naturelle si l'on admet avec Frege que la phrase, non le mot, est 1'unité de signification minimale, puisque, contrairement 11 au mot, elle est susceptible d'être vraie ou de ne pas l' être. Quant aux propriétés (D) et (E), elles énoncent des caractéristiques qui concernent la relation des langues entre elles ou la relation des langues avec les locuteurs qui les acquièrent. Il va donc s'agir, pour la théorie linguistique, de définir un programme de recherche permettant d'intégrer les propriétés (A)-(E) dans un ensemble cohérent, où se trouveraient posées de façon articulée les questions majeures en attente de solution. Une observation est nécessaire à ce point, concernant la notion de niveau. Le structuralisme nous a appris que le langage est un système 12 articulé sur plusieurs niveaux. Si l'on segmente une phrase en unités de plus en plus petites, on rencontre d'abord le niveau des syntagmes, puis celui des mots, puis celui des morphèmes, puis celui des phonèmes. Si 1' on substitue à la segmentation une autre procédure, la substitution, on isole à partir des phonèmes les traits distinctifs, unités non segmentables. Chaque unité linguistique ne peut donc être identifiée que dans une unité de niveau supérieur. La nature articulée du langage, le caractère discret des éléments impliqués comptent certainement au nombre des propriétés universelles des langues naturelles. Mais l'usage spécifique que la Grammaire Générative fait de la notion de niveau est très différent. On observe que les propriétés (A)-(C) concernent exclusivement la phrase, c'est-à-dire «l'unité de niveau supérieur». C'est dire que la phrase manifeste des propriétés qui ne se rencontrent pas aux niveaux inférieurs. Le principe de définition des niveaux en Grammaire Générative n'est plus le rang des différentes unités dans une hiérarchie de complexité. Dans le dispositif architectural qui est défini, chaque niveau est spécialisé dans la représentation de 1'une des propriétés basiques des phrases : leur syntaxe, 13 leur interprétation, leur prononciation.

11

Il va de soi que, pour qui s'intéresse à la dimension créatrice du langage - un aspect dont Descartes a souligné le caractère fondamental -, il est naturel de faire porter l'effort sur la syntaxe de la phrase. L'étude de la syntaxe est donc le terrain de recherche privilégié pour le linguiste génératif, aux côtés de la morphologie et de la phonologie qui avaient les faveurs des structuralistes. 12 Voir l'article de Benveniste, Les niveaux del'analyse linguistique, publié en 1964. Si Benveniste décrit les procédures de segmentation et de substitution en usage dans les analyses structuralistes, il insiste également sur la façon dont le sens intervient dans ces démarches. Voir aussi note 2, chapitre IL 13 Pour plus de détails, voir chapitres VII et VIII.

60 3.

DANS LE LABYRINTHE DU LANGAGE

LA PROPRIÉTÉ BASIQUE

Pour caractériser les buts de l'enquête rationnelle sur le langage, 14 Chomsky, on le sait, choisit de raisonner en termes de connaissance. Structures syntaxiques donne, au milieu des années 50, l'une des premières réponses (et une réponse parmi d'autres possibles a priori) à la question de savoir comment caractériser la connaissance du langage. On ne peut en préciser la nature, à partir d'une langue donnée, que si l'on dispose d'une description adéquate des structures grammaticales possibles de la langue en question, description qui, aux yeux de Chomsky, doit prendre la forme d'une grammaire générative. Une grammaire générative est un système computationnel qui génère, c'est-à-dire énumère, un ensemble infini de descriptions structurales sur un domaine non borné. Le langage naturel, comme les langages artificiels, est donc conçu, au sens technique du terme, comme un ensemble de séquences structurées. Chomsky, anticipant les recherches cognitives contemporaines, défend, pour décrire les mécanismes impliqués dans les processus mentaux, en particulier dans le langage, une «conception computationnelle-représentationnelle »,dans laquelle des systèmes de règles expli15 cites construisent, modifient et interprètent des représentations. Cette conception, déjà mise en place pour l'essentiel dans Structures Syntaxiques, ouvre la voie, selon Chomsky, à des généralisations significatives et à des argumentations fructueuses, hors de portée des approches exclusivement représentationnelles. Plusieurs points doivent être signalés, qui seront plus amplement discutés dans les chapitres qui suivent. Chomsky a toujours mis en garde contre les analogies trompeuses qu'il est tentant d'établir entre la computation linguistique et le fonctionnement des ordinateurs. La différence se marque de plusieurs façons. Les entités et les symboles qui interviennent dans les computations et apparaissent dans les représentations arborescentes, tels que Nom, Verbe, Groupe Nominal, Groupe Verbal, Déterminant, Complémenteur, ont une 14

Il faut cependant garder présent à l'esprit que 1' expression «connaissance du langage» renvoie, chez Chomsky, à la grammaire interne du locuteur, c'est-à-dire à l'ensemble des représentations mentales qui correspondent à la modélisation de cette grammaire. Comme 1' observe Blitman (20 15 : 81 ), elle ne signifie pas que «le langage est, pour le locuteur, un objet de connaissance au sens scientifique ou philosophique du terme». Cette connaissance, si connaissance il y a, ne renvoie pas à «une relation épistémique entre un sujet, le locuteur, et un objet, sa langue». 15 Voir Smith 2004: 142, qui introduit ce labeL Sur le couple dérivation/représentation, voir chapitre II, note 16.

Qu'EST-CE QUE LE LANGAGE?

61

certaine réalité ou, du moins, sont représentés dans 1' esprit du locuteurauditeur, sous une forme qui, il est vrai, reste à découvrir. L'état interne de la Faculté de Langage dont le linguiste construit la théorie est luimême un langage, plus précisément une langue interne, une !-langue («Problems of projection», p. 35). C'est cette hypothèse qui fait du langage un objet «suffisamment concret pour guider 1' étude de ses propriétés essentielles». Elle vient compléter et préciser la conception computationnelle-représentationnelle du langage évoquée précédemment, qui se distingue ainsi nettement du fonctionnement informatique. La généralisation que les phrases associent des formes et de la pensée, du son et de la signification, reproduite en (A), peut recevoir des représentations variées. L'architecture du dispositif grammatical dans le modèle le plus récent, dit programme minimaliste, est construite sur l'idée que (A) enregistre l'existence de relations d'interface du langage avec deux autres facultés qu'il est relativement facile d'identifier (comme cela a été fait dans les sections précédentes) : un système sensorimoteur (ou acoustique-articulatoire), intéressé à la production et à la réception des actes de parole, et un système conceptuel-intentionnel, prenant en charge 1' interprétation des processus internes à la pensée. Ces relations d'interface sont des propriétés définitoires du langage et des langues. Chomsky (20 16) réfère à cette caractérisation comme à «la propriété basique» (the Basic Property) du langage humain. Et dans la mesure où 1' on a affaire à une propriété biologique unique, spécifique à 1' espèce humaine, il est légitime d'accoler 1' étiquette de bio linguistique au programme de recherche qui tente de déterminer quel est le système computationnelle mieux à même de représenter et d'expliquer de façon optimale cette propriété. Cette caractérisation de l'objet langage est celle qui se dégage des textes minimalistes des années 90 et 2000. Mais elle peut être présentée comme la poursuite naturelle de 1' entreprise générative initiée dans les années 50. Structures syntaxiques ne contient, il est vrai, aucune référence aux interfaces de la Faculté de Langage. Mais la volonté de hisser la théorie linguistique au niveau des sciences physiques, en s'inscrivant dans la tradition de la construction des théories scientifiques, est déjà explicite. Et le problème fondamental que la théorie linguistique doit aborder et résoudre est bien celui de délimiter l'espace des grammaires possibles, «puisque nous nous intéressons non seulement aux langues particulières, mais aussi à la nature générale du Langage» (Chomsky 1957: 14). Il s'agit d'expliquer comment les locuteurs d'une langue sont capables de produire et de comprendre un nombre indéfini de phrases

62

D ANS LE LABYRINTHE DU LANGAGE

différentes avec des sens différents, ce qui suppose qu'ils réussissent la projection du langage, qui est infini, à partir du corpus fini constitué par les énoncés livrés par l'expérience. Cet objectif, explicitement posé par Chomsky dans les années 50 du siècle dernier garde aujourd'hui toute sa pertinence.

CHAPITRE

IV

LA QUESTION DE LA SCIENCE '

A PROPOS DU LANGAGE

Une théorie de la science ne peut être que théorie de l'unité de la science (Jean Cavaillès, Sur la logique de la théorie de la science, cité par Laugier-Rabaté, 1992, p. 147).

On trouve dans les livres et les articles de Chomsky une réflexion continue sur la façon de faire de la science et, en particulier, sur les voies qui permettront éventuellement de parachever la construction d'une authentique science du langage. Chomsky a rencontré au cours de son parcours de recherche et continue à rencontrer des questions qui relèvent classiquement de la théorie de la connaissance, ainsi que certains des problèmes qui constituent le fond commun de la philosophie des sciences. Sa réflexion porte en particulier sur la falsification des théories scientifiques, sur la mathématisation de la nature, sur la relation des sciences entre elles et leur unification éventuelle, sur la réalité psychologique des représentations postulées, sur le fonctionnement et les limites des capacités cognitives de l'homme et la théorisation qui peut en être donnée. Elle croise ,aussi inévitablement les interrogations des philosophes de l'esprit. A toutes, Chomsky tente d'apporter des réponses originales, fondées sur sa pratique de savant et de linguiste. Il engage volontiers le débat avec les philosophes professionnels, comme le montre par exemple le recueil Chomsky and his critics, publié en 2003 par Louise Antony et Norbert Homstein, dont un bon tiers est constitué par les réponses détaillées de Chomsky aux objections qui lui sont faites. Ce qui fait sa force dans ces échanges est qu'il occupe la position du savant, faiseur de théories, en prise directe avec la recherche scientifique «normale» (au sens que Kuhn 1970 donne à cette expression), face aux propositions des philosophes qui n'ont pas accès à 1' expérimentation et ne peuvent s'appuyer, pour étayer leur position, que sur des résultats établis par d'autres et sur la puissance du raisonnement. Ce qui donne aussi tout leur prix à ces confrontations, c'est qu'on a affaire à une théorie

64

DANS LE LABYRINTHE DU LANGAGE

linguistique en train de se faire et sûre d'elle-même, face à une recherche philosophique souvent prisonnière d'une scolastique interne au champ philosophique et préoccupée par les problèmes de démarcation entre disciplines et entre spécialités.

1.

L'ABSENCE D'OBSERVATOIRE

L'un des aspects fondamentaux de la révolution chomskyenne réside dans le projet d'aligner la linguistique sur les sciences de la nature et de retrouver en l'homme le prolongement des lois qui régissent le monde naturel. Cela suppose que 1'on adopte le «style galiléen», c'est-à-dire que 1' on se conforme, en traitant du langage, à 1' idéal de rigueur et d'exactitude des sciences de la nature et que l'on suive le parcours que la construction de tout savoir sur les objets de la nature doit emprunter: construction d'hypothèses falsifiables, vérification empirique de ces hypothèses, formalisation mathématique. Dans la préface de Structures syntaxiques, Chomsky est très explicite sur l'importance de la formalisation dans le recherche sur le langage. Des modèles de la structure linguistique construits avec précision peuvent jouer un rôle important, à la fois négatif et positif, dans le processus de découverte. En poussant une formulation précise mais inadéquate jusqu'à une conclusion inacceptable, on peut souvent mettre en lumière la source exacte de 1' inadéquation et, en conséquence, atteindre une meilleure compréhension des données linguistiques. De façon plus positive, une théorie formalisée peut apporter de façon automatique des solutions à beaucoup de problèmes autres que ceux pour lesquels elle a été initialement conçue (Chomsky 1957: 7).

Un second aspect, qui découle en partie du premier, est la certitude que cette démarche visant à caractériser la connaissance du langage, les processus computationnels qu'il déploie et les représentations qu'il construit, si elle est engagée de façon appropriée, ne peut que déboucher sur une meilleure compréhension du fonctionnement de l'esprit abstrait et du cerveau physique des humains. Ces deux idées fondatrices prennent une importance décisive lorsqu' ons 'attache à définir l'objet de la linguistique. Elles impliquent en particulier que la recherche linguistique, science empirique comme toutes les sciences galiléennes, se trouve sous la dépendance de l'épistémologie habituellement admise en philosophie des sciences. Il s'agit, pour affronter théoriquement le réel linguistique, de se doter d'outils de description et d'un langage suffisamment abstrait pour représenter les propriétés

LA QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

65

récurrentes des langues naturelles et en même temps couvrir des réalités linguistiques superficiellement très différentes, de garantir 1' empiricité des résultats en construisant des protocoles expérimentaux et surtout de définir un programme de recherche qui rende accessibles certaines questions, en exclue d'autres, et qui puisse se décliner comme une collection de problèmes spécifiques que la théorie se donne pour tâche de résoudre. C'est bien l'objectif du programme présenté au chapitre VI. Or Milner a bien montré que des difficultés apparaissent immédiatement si 1' on admet que la linguistique est une science empirique au même titre que les sciences galiléennes. La première est liée à l'absence d'observatoire, idée qui est développée dans les citations suivantes. Jamais une propriété de langue ne se trouve à 1'état isolé (Milner 1989a: 129) . ... [on ne peut jamais] construire un appareillage propre à ne faire intervenir que les seules données pertinentes pour le test en cause (Milner 1989a: 129). En linguistique, il y a des expérimentations, mais il n'y a pas d'observatoire - ou, ce qui revient au même, ce qui passe pour observatoire inclut toujours un fragment de théorie linguistique, qui ne peut être rendu totalement indépendant de la donnée soumise à expérimentation (Milner 1989a: 130).

Dans les termes de Milner, «un exemple est à lui seul une expérimentation». Tout exemple présenté à l'appui d'une proposition linguistique particulière suppose un raisonnement linguistique préalable. La seconde difficulté est liée aux deux traits qui définissent les sciences galiléennes, la mathématisation de 1' empirique et la réfutabilité des propositions linguistiques. Il apparaît nécessaire d'apporter des précisions nouvelles concernant ces deux traits, d'une part parce que la mathématisation, préoccupation dominante pour Chomsky dans les années 50, semble avoir perdu à ses yeux une part de sa pertinence, d'autre part parce que la question de la réfutabilité des propositions se pose dans des termes particuliers lorsqu'on s'occupe de langage. 2.

LA QUESTION DE LA MATHÉMATISATION

Touchant la mathématisation de la théorie linguistique, on peut se demander pourquoi elle a cessé à un moment donné d'intéresser Chomsky. Le meilleur moyen de découvrir la réponse à cette question est peut-être de se demander, en premier lieu, pourquoi le souci de

66

DANS LE LABYRINTHE DU LANGAGE

mathématisation a été une dimension essentielle du programme chomskyen à ses débuts. Précisons d'emblée que c'est bien de mathématisation du langage qu'il s'agit ici, et non de l'application éventuelle de méthodes statistiques ou de modèles probabilistes à la résolution des problêmes linguistiques. Chomsky a développé une critique de ces modèles dès Structures syntaxiques et sa position n'a pas varié depuis. Selon lui, le défaut majeur des analyses statistiques est qu'elles ne jettent aucune lumière sur les structures syntaxiques dont elles calculent la probabilité d'occurrence. Elles s'attachent à définir une notion de «probabilité» pour les phrases, qui peut avoir une certaine utilité quand on s'intéresse à la façon dont les locuteurs utilisent la parole, c'est-à-dire aux phénomènes de performance, bref au langage externe, mais pas quand on se concentre sur la langue interne, sur la dérivation des structures et leur interprétation, sur la recherche des principes explicatifs fondamentaux. La grammaticalité ne peut être expliquée sur la base de la probabilité d'occurrence, pas plus 1 qu'elle ne peut 1' être par des considérations sémantiques. Dans ses premiers travaux, Chomsky s'est efforcé de développer un formalisme capable de réduire la complexité apparente des langues particulières et de les placer sous la portée d'un petit nombre de principes qui mettaient à disposition un nombre infini de possibilités à partir d'un nombre fini de moyens. Il faut dire que les procédés techniques nécessaires à une telle entreprise n'avaient été introduits que de façon relativement récente: on pense à la théorie des ensembles formellement énumérables développée par Post (1947), aux travaux de Gôdel, Turing, Church sur la théorie de la computation, au livre de Shannon et Weaver (1949), qui développe la théorie des automates finis et se donne pour une théorie mathématique de la communication, et bien sûr aux travaux de Harris sur les structures mathématiques du langage. Ce sont ces outils qui ont permis à Chomsky, au début des années 50, d'entreprendre les recherches en grammaire générative avec une idée assez claire des buts à atteindre. Il s'agissait en particulier de caractériser mathématiquement les propriétés des différents systèmes de description syntaxique et de les classer en fonction de leur capacité générative (voir chapitre II).

1

On pourrait objecter au point de vue chomskyen que les probabilités, si elle ne jouent aucun rôle dans la construction et la formalisation des grammaires, interviennent inévitablement quand ils' agit de statuer sur la grammaticalité ou non-grammaticalité des énoncés. Les jugements d' aceptabilité qui sous-tendent les décisions de grammaticalité sont de façon inhérente des jugements probabilistes.

L A QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

67

L'établissement de cette hiérarchie est à ce jour le résultat le plus impressionnant de l'approche mathématique du langage. Mais l'évolution de la théorie syntaxique a considérablement réduit sa pertinence, au point que 1' on peut douter désormais de 1' intérêt pour la linguistique de développer une théorie axiomatisée proposant des analyses formalisables en termes mathématiques. Après tout, les langues naturelles partagent relativement peu de propriétés avec les langages formels. Les tentatives de formalisation rigoureuse que l'on trouve dans les articles de Peters & Richie (1971) et Lasnik & Kupin (1977) ne contribuent pas à éclairer une théorie dans laquelle les règles syntagmatiques ont disparu et les transformations se réduisent à une opération élémentaire unique. Le divorce constaté entre la Grammaire Générative et le souci de mathématisation apparaît donc comme le réflexe d'un changement majeur intervenu progressivement au cours des années 60 et 70, marqué par un déplacement d'intérêt de grammaires fondées sur les règles vers des grammaires fondées sur les principes. L'effet de ce déplacement est d'imposer sur les grammaires génératives des langues particulières des restrictions si strictes que pour chaque langue n'est disponible qu'un nombre extrêmement restreint de grammaires, un nombre évidemment fini. C'est bien ainsi que Chomsky caractérise le divorce. Selon lui, la plupart des résultats de la linguistique mathématique sont «virtuellement dépourvus de tout contenu empirique, puisqu'ils traitent des propriétés d'ensemble des grammaires». La même chose est vraie pour la théorie mathématique de l'acquisition, dans la mesure où« ses résultats dépendent de l'infinité supposée des classes de grammaires. La question de la capacité générative ... n'a pas grand sens pour des ensembles finis de grammaires». Les résultats que l'on peut obtenir en s'intéressant à la structure spécifique et détaillée des éléments de ces ensembles sont incomparablement plus importants que ceux qui sont livrés par l'étude de la capacité générative ou de l'apprenabilité des grammaires. Mais il ne faut pas s'y tromper. Même si Chomsky n'a pas poursuivi l'étude des propriétés mathématiques des grammaires formelles, il a toujours supposé qu'un modèle linguistique devait être tel qu'il soit 2 possible de le mathématiser. Les mathématiques demeurent aux yeux de Chomsky un outil privilégié pour expliquer les réalités du monde naturel. •

2

Cela reste vrai pour le programme minimaliste dont Collins & Stabler (20 16) viennent de proposer une formalisation mathématique.

68

DANS LE LABYRINTHE DU LANGAGE

3

Les références à Galilée, à D'Arcy Thompson sont là pour en témoigner. Et ce qu'il écrivait dans la préface de Structures syntaxiques concernant la nécessité pour la linguistique de rechercher des formulations précises conserve aujourd'hui toute sa force, voir le passage reproduit dans la section 1.

3.

LA QUESTION DE LA FALSIFICATION

L'ambition d'élever la linguistique au statut de science galiléenne suppose qu'elle soit identifiable comme une science empirique, expérimentale même. Or les propositions qu'émet une science empirique doivent pouvoir être falsifiées. Pour Popper, une théorie ne peut être dite scientifique que si, dans l'ensemble cohérent des énoncés qui la constituent, il est possible d'en identifier certains qui autorisent la construction d'épreuves empiriques susceptibles de les réfuter. Jean-Claude Milner observe que l'épistémologie construite par la Grammaire Générative est assez particulière puisqu'elle concerne une science empirique qui ne dispose pas d'un observatoire, comme cela a été dit plus haut, mais est 4 néanmoins clairement de type falsificationniste. Les propositions qu'elle avance, on le sait, reposent en général sur des collections d'exemples grammaticaux ou agrammaticaux que la théorie proposée est censée intégrer et expliquer. Elles ne peuvent être falsifiées que par d'autres données, fonctionnant comme contre-exemples, pour lesquelles la théorie 5 fait des prédictions erronées. Mais Chomsky a constamment rappelé qu'une phrase brute ne saurait à elle seule constituer un contre-exemple à une proposition ou à une théorie grammaticale particulière, seule une phrase pourvue d'une analyse, c'est-à-dire qui a déjà fait l'objet d'un traitement théorique, le peut. Il insiste aussi sur le fait que l'on doit nécesairement procéder de façon indirecte. Les principes linguistiques qui ont une certaine portée traitent généralement des propriétés des systèmes de règles, pas des phénomènes obser3

Selon Freidin & Vergnaud (2001 : 648), le message principal de D'Arcy Thompson est que «la vie est fondée sur les patterns mathématiques du monde physique». L'un des rôles de la biologie théorique est d'identifier ces patterns mathématiques et d'élucider la façon dont ils fonctionnent dans les organismes. 4 Milner 1989b. Voir aussi section 1. 5 La mise en oeuvre d'une telle procédure est compliquée par la nécessité de distinguer différents« niveaux de grammaticalité» (pour une discussion, voir Chomsky 1965 : 201-208) et par le fait que l'acceptabilité est considérée comme un tenant-lieu de la grammaticalité.

LA QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

69

vables, et ne peuvent donc être confmnés ou réfutés que de façon indirecte à travers la construction des grammaires, une tâche qui va bien audelà d'une accumulation même substantielle et d'une organisation des observations (Chomsky 1980b: 2).

Il reste que, dans l'un des seuls passages où il mentionne Popper, Chomsky prend nettement ses distances vis-à-vis de l'approche falsificationniste. On parle du concept de falsification dû à Popper, comme si c'était une proposition significative permettant d'abandonner une théorie: le savant essaie de trouver des données qui réfutent une hypothèse, et s'illes trouve, alors la théorie est abandonnée. Mais les choses ne fonctionnent pas ainsi. Si les chercheurs s'en tenaient à ces conditions, nous n'aurions pas de théorie du tout, parce que toute théorie, même la physique élémentaire, est réfutée par quantité d'observations, semble-t-il (Chomsky 2002: 124).

Dans l'esprit de Chomsky, le minimalisme, pas plus que les autres modèles théoriques intéressés aux sciences de la nature, ne doit s' embarrasser de conditions aussi contraignantes que celles que propose Popper. Bien au contraire, adopter le style galiléen, c'est être «prêt à accepter 1' existence de données contraires à des hypothèses théoriques ayant atteint un certain degré de puissance explicative dans un domaine donné» (Chomsky 1980a: 219). On ne doit pas se tromper sur ce que Chomsky rejette dans 1' approche falsificationniste. Plus qu'aucun autre, il sait qu'une théorie n'a de réalité que si elle offre des possibilités d'être réfutée, qu'elle est d'autant plus prometteuse qu'elle est improbable, que l'activité scientifique suppose une prise de risque, que les réfutations succèdent inévitablement aux conjectures, qu'une hypothèse réfutable n'a pas plus de chance d'être vraie qu'une hypothèse non réfutable. Ce qu'il récuse, ce n'est pas la théorie poppérienne de la connaissance, mais bien plutôt une certaine façon de conduire le travail scientifique. Et bien sûr, ce rejet ne vaut pas que pour la recherche linguistique, il affecte toutes les sciences de la nature, un alignement qui permet à Chomsky de maintenir la prétention de la linguistique à figurer parmi les sciences galiléennes. Pour progresser, le savant doit en quelque sorte adopter, à chaque étape, une morale provisoire et choisir d'ignorer les questions qu'il ne peut encore résoudre. C'est bien le parti pris de Galilée qui ne s'émouvait pas outre mesure de ne pas pouvoir expliquer de façon cohérente le fait que les objets ne s'envolaient pas de la surface de la terre, mais au contraire y tombaient. On ne construit pas d'autre part une théorie par tâtonnements et retouches

70

DANS LE LABYRINTHE DU LANGAGE

successives, puisque la réfutation d'une seule proposition particulière impose de définir une théorie nouvelle. On comprend mieux ainsi pourquoi la linguistique chomskyenne s'est développée en construisant successivement, puis en abandonnant plusieurs théories et plusieurs modèles. Aux yeux de Milner (1989b: 410), loin d'être une marque d'incertitude et d'indécision, comme on la présente souvent, cette façon de procéder résulte d'un choix épistémologique réfléchi et assumé. 4.

LA QUESTION DE L'UNIFICATION DES SCIENCES

4 .1. COEXISTENCE, UNIFICATION OU RÉDUCTION?

Si la linguistique est une discipline qui mérite le nom de science, si, en particulier, elle appartient à l'ensemble des sciences galiléennes, on ne peut éviter de considérer son articulation aux autres sciences galiléennes, celles avec lesquelles elle semble entretenir une relation privilégiée, telles que la psychologie, la biologie, les neurosciences. Cette relation peut a priori prendre deux formes bien distinctes: ou bien la linguistique constitue un département particulier d'une autre discipline scientifique, la biologie par exemple, à laquelle elle emprunte ses thèmes majeurs, ses méthodes, peut-être son langage; ou bien elle possède une multiplicité de caractères propres qui en font une science autonome, sa relation aux autres disciplines se réduisant à une simple cohabitation dans la famille des sciences galiléennes. Il semble que Chomsky ait successivement adopté les deux points de vue qui viennent d'être évoqués. Jusque dans les années 90, il défendait une position que l'on peut dire réductionniste, défmissant successivement la linguistique comme une branche de la psychologie, puis comme une branche de la biologie, plus précisément de la biologie théorique du développement. Le terme de «bio linguistique», associé au programme chomskyen depuis une trentaine d'années, signale un changement de point de vue et marque sans ambiguïté que la Faculté de Langage doit être considérée comme un domaine de recherche pleinement 6 autonome, qui n'a été jusqu'ici unifié avec aucun autre. On pourrait en effet imaginer que ce terme renvoie à l'idée qu'il y a un chevauchement 6

Le terme est utilisé par Massimo Piattelli-Palmarini dans la présentation d'un colloque international interdisciplinaire sur le langage et la biologie, qui s'est tenu en 1971 au MIT sous le patronage du Centre Royaumont pour une science de 1'homme et auquel participaient Salvador Luria et Noam Chomsky (voir Piattelli-Palmarini 1974). Il refait surface en 2000 dans le titre du livre de Lyle Jenkins, Biolinguistics et n'a cessé d'être repris depuis.

LA QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

71

dans les domaines de deux disciplines, au sens où il existerait un sousdomaine relevant conjointement de la science du langage et de la biologie. Mais ce n'est pas le sens qu'on lui donne habituellement. On ne doit pas comprendre non plus qu'il marque la nécessité pour la linguistique de soulever à propos du langage les questions que pose habituellement la biologie sur son objet d'étude, touchant sa forme et sa fonction, son développement, son évolution, ou d'incorporer les méthodes de la génétique dans ses argumentations, ou encore de reprendre dans cette perspective nouvelle les questions traditionnellement abordées par la grammaire générative, celles qui engagent la computation, l'acquisition, le changement 7 diachronique, auxquelles s'ajoute désormais le problème de l'évolution. On aurait alors affaire à une forme de réduction de la linguistique à la biologie. Il s'agit en réalité simplement d'affirmer que «l'étude de la Faculté de Langage, dans la mesure où la connaissance grammaticale dérive du génome humain, a ses racines dans la biologie» (Roberts 8 2019). Le programme biolinguistique, dont on trouve une première formulation dès 1967 dans le livre d'Eric Lenneberg, se donne donc pour objet l'étude des «des fondements biologiques du langage». Ce projet ne peut être abordé que dans une perspective interdisciplinaire, combinant les apports de la linguistique et ceux des disciplines connexes (biologie de ' l'évolution, génétique, neurologie, psychologie ... ). A la question «Quel type de relation la linguistique entretient-t-elle avec les autres sciences?», le programme biolinguistique répond sans détour que cette relation, si elle est avérée, ne peut être que 1'unification, mais que cette unification reste à ce jour purement programmatique. La question de l'unification, entendue au sens large, est un thème central de la philosophie des sciences. Pour comprendre ses enjeux, on peut rappeler brièvement la position de Descartes touchant la configuration des savoirs, bien que la disposition des connaissances s'offrant à un esprit éclairé de la première moitié du XVIIe siècle soit très différente de celle qui se présente à nous aujourd'hui. Pour lui, les diverses sciences ne doivent pas être considérées comme des disciplines séparées, chacune 7

Cette conception est sous-jacente à certaines présentations de l'agenda biolinguistique, voir di Sciullo & Boeckx 20 11. 8 La pratique courante des linguistes peut donner 1' impression que c'est une interprétation plus large du terme qui est adoptée et que la recherche en syntaxe se développe sans prendre en compte cet objectif (voir chapitre IX). Mais on ne doit pas oublier que la définition du programme minimaliste, la recherche d'une solution au problème logique de l'évolution et d'un au-delà de l'adéquation explicative sont directement suscitées par le projet bio linguistique.

72

DANS LE LABYRINTHE DU LANGAGE

avec ses méthodes et ses exigences, comme dans la conception aristotélicienne, mais bien comme les parties intégrantes d'un continuum, qui manifeste 1'unité essentielle de la connaissance. Il ne peut y avoir qu'une science et qu'une méthode pour la construire, parce que l'esprit humain est un. S'il est possible de déduire et d'expliquer tous les états de la matière, c'est que les vérités mathématiques structurent à la fois le monde et la raison. En faisant de cette dernière l'unique pôle de référence du savoir, Descartes introduit déjà la condition formelle permettant de penser l'unité des sciences ou plutôt l'unité de la science. Pour figurer cette unité, affirmée dans la Lettre-préface des principes de la philosophie, il a recours à l'analogie de l'arbre de philosophie. De cet arbre, il dit que «les racines sont la métaphysique, le tronc est la physique, et les branches qui sortent de ce tronc sont toutes les autres sciences, qui se réduisent à trois principales, à savoir la mécanique, la médecine et la morale». Deux aspects remarquables de cette représentation doivent être soulignés. (i)

Les mathématiques ne figurent pas en tant que telles dans cet arbre, probablement parce qu'elles ne définissent qu'un outil. Pourtant, c'est à la démontration de la validité des mathématiques et de la physique que Descartes s'attache prioritairement, plutôt qu'à l'étude des propriétés de l'esprit. Son projet est d'étendre à toute science le caractère certain des mathématiques. La psychologie est également absente, en partie pour 9 une raison analogue. (ii) Du point de vue de l'architecture des savoirs ainsi représentée, la position de la métaphysique à la racine de 1' arbre a une signification bien précise. C'est une façon pour Descartes de manifester sa conviction qu'il existe une racine métaphysique du savoir et que la connaissance doit être construite «de bas en haut», en partant des principes fondamentaux pour atteindre les phénomènes particuliers. Il procède donc de la métaphysique à la physique, contrairement à Aristote qui procédait de façon inverse. Il s'agit de partir des causes premières de la nature et de là dériver tout le reste. On peut parler chez Descartes d'un réductionnisme ontologique, fondé sur l'idée que l'unité des sciences renvoie à l'unité du réel et à l'unité de la raison.

9

L'emploi de ce terme à propos du cartésianisme peut surprendre. Pour certains, Fraisse (1988: 88) par exemple,« l'histoire de la psychologie a été ouverte par Descartes, lorsqu'il a posé la condition dualiste de l'homme ... ». Selon Michel Foucault, c'est aux postcartésiens qu'il faut attribuer l'invention de la discipline. Il est vrai qu'au XVIr siècle, elle se réduit à l'étude de la faculté logique ou épistémique de l'esprit, ce n'est pas encore une discipline pouvant donner lieu à une recherche de type expérimental. Quant à 1' idée d'une science de l'esprit, comme l'observe Engel (1996: 28), elle a été formée plus tard, sous l'impulsion des empiristes britanniques, tentant, comme Hume, d'étendre le programme de Newton sur la matière à l'étude de l'esprit humain.

L A QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

73

La question de l'unification se trouve également au coeur de la réflexion philosophique contemporaine. On sait que l'un des principaux objectifs des philosophes du Cercle de Vienne, était précisément de montrer que la science est fondamentalement unitaire. Cela ne signifie pas que toutes les disciplines scientifiques poursuivent les mêmes objectifs et adoptent les mêmes méthodes, mais que, prises ensemble, les connaissances scientifiques constituent un ensemble cohérent et unifié. Une version de cette approche est la thèse de Carnap, selon laquelle les énoncés de toutes les sciences peuvent être traduits dans un langage unique et que ce langage est celui de la physique. Si cette entreprise réussit, si toutes les propositions scientifiques sont exprimables dans un langage unique, on aura réalisé une sorte d'unification des différentes branches de la science. On a là une forme de réductionnisme qui, il est vrai, ne concerne que le langage de la science, pas ses lois. Il existe une forme beaucoup plus radicale de réductionnisme, consistant à «réduire» une théorie à une autre, comme la chimie a été réduite à la physique. Chomsky (20 16 : 36) rappelle cependant que cette réduction n'a réussi que parce que la physique elle-même avait été radicalement révisée à la suite de la révolution induite par la théorie quantique, si bien que «réduction» n'est pas le terme approprié. On ne peut parler de réduction que lorsqu'il est possible d'expliquer comment les découvertes et les généralisations significatives dans une discipline peuvent être expliquées en recourant aux méthodes et aux principes d'une autre discipline plus basique. C'est ce qui a été fait pour les mathématiques, dont une partie importante a pu être expliquée dans les termes de la théorie des ensembles. Mais les exemples réussis de réduction sont extrêmement rares. Il est douteux que l'on puisse de façon analogue réduire les concepts de la psychologie à ceux de la biologie ou ceux de la biologie à ceux de la physique. Touchant la science du langage, Chomsky rejette clairement désormais la possibilité d'une réduction de celle-ci à une autre science. Réduire la Faculté de Langage à la physique supposerait que l'on utilise pour traiter des phénomènes langagiers le vocabulaire et la syntaxe des atomes et des particules élémentaires. Chomsky ne reprend pas à son compte le physicalisme de Carnap, ni bien sûr le réductionnisme ontologique de Descartes. Il souligne également la non-représentativité de la relation entre la physique et la chimie. Il reste que la recherche sur le langage se trouve inévitablement confrontée à un problème d'unification majeur, celui de 1'unification entre les approches mentalistes des propriétés computationnelles de la Faculté de Langage et l'enquête expérimentale

74

DANS LE LABYRINTHE DU LANGAGE

menée par les neurosciences sur l'organisation et le fonctionnement du cerveau humain. De ce fait, elle contribue potentiellement au débat sur l'unification éventuelle entre les théories portant sur divers aspects du monde de la nature. L'unification de la linguistique avec la biologie est aux yeux de Chomsky une perspective désirable, un projet beaucoup plus réaliste que la réduction, même si, jusqu'ici, il n'a pas été couronné de 10 succès. Précisons qu'il s'agit clairement pour lui d'une position méthodologique, fort éloignée de tout réductionnisme ontologique. 4.2. LINGUISTIQUE ET PSYCHOLOGIE: UNE RELATION DIFFICILE

Maintenant que ces points ont été précisés, il n'est pas inutile de porter un regard rétrospectif sur la relation entre la linguistique et la psychologieu. Cette relation a toujours été difficile, sinon ouvertement conflictuelle. L'origine de la difficulté doit être cherchée non pas tant dans la théorie psychologique en elle-même, que dans le spectre explicatif qui lui est prêté. Elle est illustrée par ce que 1' on a appelé à la fin du XIXe et au début du xxe siècle le «psychologisme». Ce dernier consiste à faire des catégories de la pensée des dispositions naturelles de l'esprit ou, dans les termes de Engel (1996: 33), à «réduire l'objectif au subjectif et les contenus de pensée à des contenus de représentation». Contre John Stuart Mill, Wilhelm Wundt et William James, Edmund Husserl a dénoncé les effets du psychologisme dans l'approche du problème de la connaissance et a même vu en lui son principal adversaire, concluant que dans la recherche de la vérité scientifique, les lois de la logique doivent absolument être séparées de la science des faits psychiques qui ne peut en aucune façon leur servir de fondement. Dans la même veine, Gottlob Frege n'avait cessé quelques années auparavant de mettre en garde contre la confusion possible entre la description des conditions psychologiques qui interviennent dans la conscience que nous avons d'une proposition et les preuves confmnant la vérité de cette proposition. On ne peut non plus se dispenser 12 de faire référence au psychologisme dans le domaine linguistique. 10

La question est reprise au chapitre IX. 11 Le terme est en réalité plus ancien et renvoie à l'idée que l'introspection est la méthode principale d'investigation philosophique. C'est au milieu du XIXe siècle qu'il a commencé à être associé à un courant particulier de la logique, représenté par Stuart Mill. 12 De Palo & F ormigari (20 10 : 6) précisent à quelles conditions une théorie linguistique peut être qualifiée de «psycho logiste». Elle doit poser que «la théorie d'une langue naturelle présuppose une théorie des capacités et des états mentaux des locuteurs enjeu» et admettre que «le domaine de l'enquête psychologique est un domaine ... procédural,

LA QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

75

Au tournant du siècle, Saussure l'a ouvertement rejeté et ce rejet allait pour lui de pair avec la définition de la langue comme un système d'oppositions permettant de construire à la fois l'objet de la linguistique, de faire la théorie de cet objet et de définir les méthodes d'étude appropriées. Pour de Palo et Formigari, le Cours de linguistique générale est pour une bonne part à l'origine de la position antipsychologique dans les sciences du langage, même si, selon certains commentateurs, une partie des concepts introduits alors conservent des traces de psychologisme: c'est le cas de la dichotomie langue/parole, ou de 1' opposition entre concret et 13 abstrait. Au début du siècle dernier, à 1' époque où la linguistique naissante affirmait son autonomie, la psychologie revendiquait de son côté son indépendance, abandonnait l'étude intemaliste des propriétés mentales qui avait prévalu jusqu'alors pour une posture empiriste radicale, se concentrant sur l'étude des comportements, seule susceptible à ses yeux d'une approche authentiquement scientifique. L'approche béhavioriste se donnait pour tâche, sans faire intervenir 1' étude des structures ou des processus neuronaux, sans recours à la conscience ou à 1' instinct, de ramener tous les comportements relevant selon elle de la psychologie à une configuration de type stimulation/réaction ou, pour reprendre le vocabulaire couramment utilisé, stimulus/réponse, ce qui pouvait peutêtre se justifier pour 1' étude du comportement des rats ou des pigeons, mais n'avait que peu de sens lorsqu'on abordait le langage des humains. Il va de soi que 1' extrême difficulté qu'il y a à caractériser ce dernier comme un comportement limitait considérablement la contribution éventuelle de la psychologie à son étude. Cette orientation de la psychologie n'est cependant pas restée sans effet sur la science du langage et a contribué pour une large part à façonner le structuralisme américain. Avant

intermédiaire entre le niveau cérébral et le niveau comportemental» et qu'à ce niveau sont produites «des représentations en grande partie inconscientes, mais dont l'élaboration prépare (ou constitue ... ) la pensée verbale». 13 A ce propos, Saussure fait 1' observation suivante : «réduire la langue à un système d'abstractions, ce serait perdre de vue 1' objet propre de la linguistique pour dévier vers la logique ou la psychologie.» (Godel 1957). De Palo & Formigari (2010: 7) qui citent ce passage interprètent «concret» comme «représentant ce qui est dans la conscience du sujet parlant», en opposition à «abstrait», qui désigne «ce qui n'a de valeur que pour le grammairien, une langue sans sujet». Dans le Cours (voir p. 191), Saussure écrit à propos de 1' ordre des mots, entité incontestablement abstraite, que «ce serait une erreur de croire qu'il y a une syntaxe incorporelle en dehors de ces unités matérielles [concrètes] distribuées dans 1' espace». La position de Chomsky est sur ce point on ne peut plus éloignée de celle de Saussure.

76

D ANS LE LABYRINTHE DU LANGAGE

Skinner, psychologue de profession, Bloomfield a cru possible de réduire le processus d'acquisition du langage à un système d'habitudes. La situation change dans la seconde moitié du siècle, période où, dans la présentation qu'en fait Tiberghien (1999), deux révolutions cognitives affectent successivement la psychologie. La première, qui intervient au début des années 50, est marquée par l'apparition d'un objet nouveau pour la science, les représentations mentales. Le comportement n'est plus désormais qu'un moyen d'accéder aux propriétés des états mentaux et de permettre leur reconstruction. «Le psychisme [est désormais] considéré comme un système de traitement de 1' information composé de modules autonomes spécialisés et agencés dans une architecture ... ». La seconde révolution cognitive, qui trouve son origine à la fin des années 50 et au début des années 60 dans 1' essor de 1' informatique et dans le travail même de Chomsky, introduit l'hypothèse que les représentations mentales peuvent être décrites comme des suites de symboles, physiquement inscrits dans le cerveau et constituant l'équivalent d'un langage formel. Le cerveau est lui -même «assimilé à une machine 14 computationnelle », assignant une syntaxe à ces représentations. Ces deux révolutions rompent de façon radicale avec l'affirmation béhavioriste que la psychologie se réduit à l'étude du comportement dans des configurations stimulantes. Il est possible désormais de définir une psychologie cognitive, traitant effectivement des propriétés et des processus mentaux dans une perspective intemaliste. C'est évidemment ce type d'approche que Chomsky a en tête lorsqu'il pose dans Aspects que la linguistique est une branche de la psychologie, que la Faculté de Langage est psychologiquement fondée. Elle permet de réduire l'étude du processus d'acquisition à l'analyse des structures syntaxiques du langage enfantin, à partir de corpus constitués ou de productions expérimentalement contrôlées, et qui cadre parfaitement avec 1' idée que 1' on doit linguistiquement distinguer entre compétence et performance. Il reste que si le terme «psycholinguistique» a pu servir un temps à accréditer la possibilité d'un mariage heureux entre les deux disciplines, 1' écart entre la linguistique générative et la psychologie dite scientifique 15 n'a cessé de croître. Les raisons qui expliquent cet état de fait engagent aussi bien les psychologues que Chomsky lui-même. Dans les années 60 et 70, les premiers avaient pensé trouver dans la Grammaire Générative

xxe

14

Voir Tiberghien 1999. 15 Le terme « psycholinguistique » est ancien, puisqu'il est apparu dans la première moitié des années 50.

L A QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

77

un ensemble d'hypothèses permettant d'éclairer les mécanismes et les procédures en jeu dans la production et la compréhension des énoncés linguistiques. Cet espoir a été déçu parce que l'entreprise générative se propose de caractériser la connaissance mentale que les locuteurs ont de leur propre langue et ne s'intéresse nullement à 1' emploi effectif de cette connaissance dans les actes de parole. Plus concernés par le phénomène que par l'essence, les psychologues sont pour la plupart restés loyaux à l'approche expérimentale, à la culture de laboratoire opérante dans la psychologie traditionnelle et aussi, pour certains, au fonctionnalisme sans nuance qui la caractérise. Après tout, si les linguistes pensent pouvoir tout résoudre en se contentant de consulter les intuitions grammaticales de quelques sujets parlants, sans recourir à des expériences contrôlées, libre à eux ! Enfin, ils ont perçu le courant psycholinguistique à base générative comme coupé du reste du domaine, plus attiré par les spéculations théoriques que par les recherches empiriques. Les psychologues ont aussi été vite rebutés par les modifications incessantes affectant le modèle, qui, sur le moment, apparaissaient comme des innovations formelles sans nécessité réelle et parfois comme des excentricités techniques totalement 16 gratuites (ce qui était évidemment faux). Chomsky quant à lui, s'il se donne pour objet premier la découverte des principes et des mécanismes qui permettent de convertir 1' expérience linguistique initiale en connaissance du langage, reste persuadé que les recherches sur le langage devraient déboucher sur des aperçus nouveaux touchant le fonctionnement mental et 1' architecture de 1' esprit. Les mots «langage» et «esprit» sont du reste constamment associés dans les titres de ses articles et de ses livres. Le second est la condition du premier et Smith et Wilson (1979: 10) n'ont pas tort d'écrire que Chomsky est probablement le premier chercheur à tirer des arguments détaillés sur la nature de l'esprit à partir de la nature du langage, plutôt que l'inverse. Malheureusement, comme le souligne Fortis (2016: 76), l'association entre la linguistique et la psychologie n'a pas eu les retombées attendues. Les tentatives de validation expérimentale des hypothèses de la Grammaire Générative n'ont pas donné les résultats escomptés. Il paraît difficile par exemple, comme cela a été tenté dans les années 60 et 70, et malgré l'affinement progressif du concept de complexité grammaticale,

16

Ils ont aussi peut-être été lassés par le penchant de Chomsky pour la polémique, consistant à présenter la position de l' adversaire comme ridicule ou dépourvue d' intérêt et à "ne pas faire de quartiers" (Goldsmith 1998 parle joliment à ce propos d'un take-noprisoners debating style).

78

DANS LE LABYRINTHE DU LANGAGE

d'établir une corrélation simple et directe entre la complexité transformationnelle d'un énoncé- c'est-à-dire le nombre et le type des transformations impliquées dans sa dérivation - et le temps nécessaire au cerveau 17 pour traiter cet énoncé. Cet échec relatif explique probablement, en partie du moins, pourquoi Chomsky, après avoir soutenu dans les années 60 et 70 que la linguistique était une branche de la psychologie, a par la suite mis 1' accent sur les fondements biologiques de la Faculté de Langage. D'autres considérations ont probablement joué un rôle. Chomsky a certainement été très sensible aux progrès spectaculaires des techniques d'imagerie cérébrale qui donnaient en apparence un accès plus direct au fonctionnement du cerveau. Il a peut-être également été soucieux de serrer au plus près la réalité humaine en la définissant par sa nature physique plutôt que mentale (même si à ses yeux, cette distinction est sans objet) ou, simplement, d'assurer à la linguistique un statut de respectabilité en 1' associant étroitement à une science indiscutablement galiléenne. On doit surtout observer que, dans une approche où les propriétés de 1' esprit sont conçues comme des propriétés du cerveau, il est pleinement naturel de se référer à la biologie, le domaine de recherche le plus inclusif, celui qui englobe l'étude de ces deux objets, plutôt qu'à la psychologie, dont le domaine est plus restreint. Ce changement est important. Il signifie entre autres qu'il est inutile de poser, dans l'étude du langage, un niveau intermédiaire de représentation ou de connaissance psychologique entre le 18 niveau linguistique et le niveau biologique. Mais un point commun à la perspective psychologique et à l'ancrage dans la biologie doit être souligné: l'une et l'autre font de la linguistique une branche particulière d'une autre discipline. Le point de vue change à nouveau, me semble-t-il, avec le développement de l'approche biolinguistique dans les années 90 et 2000, puisqu'il s'agit désormais de 17

Sur cette question, la littérature psychologique est considérable, voir par exemple Fodor, Bever & Garrett 1974. 18 Il faut se garder de croire que Chomsky établit entre la biologie et la psychologie une opposition tranchée. La biologie est présente très tôt dans sa réflexion sur le langage humain. Dans Aspects, il fait référence au livre de Lenneberg (voir Lenneberg 1967) et aux contraintes biologiquement données sur la nature du langage. Mais dans la même note, il écrit que «c'est un problème important pour la psychologie que de déterminer en quelle mesure d'autres aspects de la connaissance ont les mêmes propriétés que l'acquisition et 1' emploi du langage et de tenter de cette façon de développer une théorie de 1' esprit plus riche et plus étendue» (Chomsky 1965: 82, note 32). Touchant l'acquisition du langage et les composants qu'elle implique, il ne se sent pas tenu de choisir entre « 1' esprit abstrait» et le« cerveau physique», qu'il met sur le même plan.

L A QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

79

réaliser, dans une perspective interdisciplinaire, 1'unification de la linguistique avec les autres sciences également intéressées au langage, sans lui retirer son statut d'autonomie.

5.

LA QUESTION DU RÉALISME

Une question qui concerne directement le programme biolinguistique et ses fondements est celle de la réalité psychologique des entités, des concepts, des opérations mis enjeu dans la computation linguistique. Selon Chomsky, ces entités et ces concepts, ainsi que la théorie linguistique dans son ensemble, ont affaire à des aspects réels du monde naturel. En d'autres termes, la théorie linguistique doit être interprétée en termes réalistes; la grammaire, à la différence du langage (cf. chapitre III, section 1), doit être tenue pour une réalité substantielle. La même chose est vraie pour les 19 entités et les concepts utilisés par la physique, la chimie ou la biologie. Mais on sait que, touchant le réalisme des théories scientifiques et la 20 légitimité des hypothèses de substance, deux positions s'affrontent. Selon Russell ( 1948), la science doit se contenter de proposer des descriptions spécifiant la structure formelle des objets, puisqu'elle se trouve dans 1' incapacité absolue de dire quoi que ce soit de la réalité physique de ces objets. Duhem (1914) ne disait pas autre chose de la théorie physique, « construction symbolique et artificielle», faite de relations mathématiques, n'ayant rien de commun avec les véritables relations des faits entre eux. Puisque la substance réelle des objets ne peut être connue, autant n'en rien dire. Au phénoménisme de Pierre Duhem s'oppose la position réaliste de Jean Perrin qui repose sur la certitude que des progrès interviendront nécessairement dans le futur, qui permettront de trancher entre les diverses hypothèses engageant la substance du réel (voir Perrin 1911 ). La linguistique n'échappe pas à ce débat, d'autant que l'absence d'observatoire rend la question de la légitimité des hypothèses de substance encore plus complexe. Il semble que Chomsky, à qui la question de la 19

Selon Jerrold Katz, qui développe une perspective essentialiste sur le langage, dans laquelle les langues sont des objets abstraits au sens de Platon, la position de Chomsky ne peut être dite réaliste, parce que les réalités postulées n' ont pas d ' existence autonome et, en particulier, n' existent pas indépendamment de l' esprit humain (voir par exemple Katz 1981, 1996). Pour Smith (2004: 150), c'est là un faux procès. Il est vrai que les langues internes sont des propriétés exclusives de l' esprit-cerveau, mais l'esprit-cerveau lui-même est un objet du monde naturel, qu'il est possible de soumettre à une enquête empirique. 20 Sur ce point, voir en particulier Milner 1989a: 161-165.

80

DANS LE LABYRINTHE DU LANGAGE

réalité de la grammaire et des processus computationnels a souvent été posée, adopte une position qui relève à la fois du conventionnalisme de Pierre Duhem et du réalisme de Jean Perrin. et qui est pour une large part imposée par 1' impossibilité d'accéder directement à la représentation physique de la Faculté de Langage dans le cerveau. C'est même cette impossibilité, quelle que soit la nature de la réalité impliquée, qui justifie le caractère abstrait des propositions linguistiques, comme le confirme le passage suivant de Réflexions sur le langage. Avec les progrès de la science, nous arriverons peut-être à savoir quelque chose de la représentation physique de la grammaire et de la Faculté de Langage ... Actuellement, on ne peut caractériser les propriétés des grammaires et de la Faculté de Langage qu'en termes abstraits (Chomsky 1975: 49-50).

Le linguiste n'a d'autre choix que de situer sa recherche à un haut niveau d'abstraction et d'idéalisation, en apparence fort éloigné de tout réalisme. C'est pourtant à ce niveau abstrait, qui est celui de 1' esprit plutôt que du cerveau, que 1' on peut justifier la réalité de la grammaire. Le point important ici est que, dans le réalisme que défend Chomsky, la réalité de certaines entités et de certaines opérations comme éléments des langues internes ne peut être déterminée que de façon empirique. Elles ne sont réelles en effet que si elles sont «vraies» et elles ne sont vraies que si elles sont réfutables et si la théorie qui les contient passe le test de la falsification. On peut alors dire de façon informelle qu'elles sont «représentées» dans le cerveau, en donnant à ce terme le sens qu'il a dans l'usage courant. Pour la plupart des philosophes et pour beaucoup de linguistes et de psychologues, on ne saurait ainsi conclure de la vérité de la théorie à la réalité des objets qu'elle postule. Une fois admise la réalité de la grammaire, la question se pose de 21 savoir à quel type de réalité on a affaire. On sait que la position de 2 Chomsky a changé avec le temps.Z Dans les années 60 et 70, il pose que 21

La question est ancienne et n'a cessé d'occuper les linguistes. L'un des articles les plus célèbres de Sapir, La réalité psychologique des phonèmes, écrit en français en 193 3, la pose à propos des unités de la phonologie: selon lui, l'étude des erreurs d'analyse de locuteurs natifs qui ont un contrôle pratique absolu de leur langue, mais n'en ont aucune connaissance rationnelle consciente conduit à la conclusion que ce sont les phonèmes, ' non les éléments phonétiques, que les locuteurs «entendent» vraiment A 1' époque où il a défendu cette thèse, Sap ir ne disposait pas de 1' appareillage expérimental qui lui aurait permis de confirmer ou d'infirmer cette conclusion. 22 Je suis ici de près la mise au point de Chomsky dans Replies (voir Chomsky 2003: 282-283).

LA QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

81

la réalité dont il s'agit est avant tout psychologique et mentale. Pour lui, cette réalité est une réalité comme une autre, qui n'a pas un statut différent de celui d'autres réalités, comme la réalité chimique, la réalité optique ou la réalité neuronale. Définir l'objet d'étude, la grammaire intemalisée dans l'esprit-cerveau du locuteur, comme une réalité mentale signifie qu'on ne doit pas l'aborder comme une entité transcendante, hors d'atteinte de l'expérience sensible, mais comme une réalité dont on peut ignorer la base physique éventuelle. Le passage suivant d'Aspects est pleinement explicite sur ce point. La linguistique mentaliste n'est autre que la linguistique théorique qui prend la performance comme une donnée ... pour la détermination de la compétence, cette dernière étant l'objet premier de sa recherche. Le mentalisme, en ce sens traditionnel, n'a pas à faire d'hypothèses touchant la base physiologique possible de la réalité mentale qu'il étudie. En particulier, il n'a pas à nier l'existence d'une telle base (Chomsky 1965: 13, note 1).

L'interprétation psychologique de la grammaire a d'autres facettes que 1' on peut expliciter brièvrement. Dans cette conception, la théorie de la grammaire est une théorie de la Faculté de Langage. La construction des grammaires doit donc observer une contrainte supplémentaire: elle ne peut se contenter d'analyser les phénomènes linguistiques, elle doit aussi satisfaire à un critère d' apprenabilité. Le système de règles postulé doit être tel qu'il puisse être acquis de façon plausible par un enfant au cours de l'apprentissage de sa langue maternelle, quand il est exposé aux structures primaires de cette langue. Mais Chomsky prend également soin de préciser à maintes reprises qu'il ne faut pas confondre la théorie 23 élaborée par le linguiste et la grammaire intériorisée par le locuteur. On ne peut donc pas considérer les opérations postulées dans les dérivations comme les réflexes des processus mentaux impliqués dans les actes de parole, mais on ne peut pas non plus exclure que ces opérations aient quelque rapport avec les mécanismes psychologiquement réels en jeu dans ces actes de parole. On se trouve devant une difficulté d'un autre ordre quand on s'intéresse à une autre réalité que la réalité psychologique, celle que 1' on peut appeler biologique ou neuronale, à laquelle Chomsky réfère les entités et les mécanismes linguistiques à partir des années 80. Alors que la psychologie s'occupe de façon prioritaire des opérations mentales, et que la 23

Voir aussi chapitre III, section 1.

82

DANS LE LABYRINTHE DU LANGAGE

psycholinguistique s'intéresse plus particulièrement à 1'usage de la connaissance du langage dans des performances effectives, la biologie se donne comme la science des organes physiques et mentaux, la science du vivant et des codes génétiques. Dire que la linguistique est une branche de la biologie, c'est, en accord avec la conception du langage comme un organe mental, poser que la langue a une inscription dans le code génétique, affirmer l'existence d'un substrat biologique/neuronal sous-jacent à la Faculté de Langage (plus généralement, on peut supposer qu'un substrat physique sous-tend tous les processus qui relèvent traditionnellement de la psychologie). Mais force est d'admettre que, dans l'état actuel de nos connaissances, nous ne savons pas expliquer comment les structures linguistiques postulées par la grammaire sont reliées aux structures neuronales qui sous-tendent l'utilisation du langage. C'est déjà ce qu'affirme le passage de Réflexions sur le langage cité plus haut. Selon Gallistel (1997), un spécialiste reconnu de neurologie cognitive, il est clair qu'on ne comprend pas comment le système nerveux compute, [ni même] les fondements de la capacité à computer, [même] pour l'ensemble restreint d'opérations mathématiques et logiques qui sont fondamentales dans toute computation.

Berwick & Chomsky (20 16: 50) observent de leur côté qu' on a une compréhension très limitée de la façon dont même les opérations computationnelles les plus basiques sont effectuées dans le réseau neuronal ... La première chose qu'un informaticien voudrait savoir sur un ordinateur, c'est comment il écrit dans la mémoire et lit dans la mémoire ... Mais nous ne savons pas comment cet élément computationnel fondamental est implémenté dans le cerveau.

Cette difficulté se résume à l'unification programmée, mais infructueuse, de deux théories portant sur des aspects du monde naturel; elle est discutée au chapitre IX.

6.

LES LIMITES DE LA SCIENCE

Chomsky s'est toujours interrogé sur les limitations inhérentes à l'activité scientifique, plus particulièrement sur celles que peut rencontrer la construction d'une théorie scientifique du langage. Certaines de ces limitations tiennent, selon lui, à la linguistique elle-même, une discipline qui s'est construite beaucoup plus tardivement que les sciences reconnues, et qui est encore dans 1'enfance. Notre connaissance actuelle, malgré des progrès considérables, est encore partielle et inachevée. Autre difficulté

LA QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

83

potentielle, qui, contrairement à la précédente, n'est pas un accident de l'histoire: on ne peut tout à fait exclure que le langage n'ait pas les propriétés que nous lui prêtons, ce qui condamnerait par avance toute tentative d'unifier la linguistique avec les autres sciences. D'autres restrictions ont une portée beaucoup plus générale, puisqu'elles trouvent leur origine dans le cerveau et reflètent des limitations de 1' équipement cognitif des humains, impliquant qu'il existe des problèmes qu'ils ne sont 24 tout simplement pas équipés pour poser et résoudre. Le thème de la limitation de nos facultés intellectuelles, restreignant notre accès à la connaissance, est déjà présent dans la philosophie classique. On connaît le passage célèbre de la sixième partie du Discours de la méthode, où Descartes exalte les pouvoirs nouveaux que la maîtrise du savoir et la construction de la science pourraient assurer aux hommes, les rendant «comme maîtres et possesseurs de la nature» (le comme, il est vrai, atténue en partie le triomphalisme de cette déclaration). Il reste que, malgré 1' extraordinaire réussite de la physique et de la biologie contemporaines, bien peu de scientifiques y souscriraient aujourd'hui. Sur ce point, Chomsky adopte sans réserve les conclusions de Locke, de Hume et de la science post-newtonienne, posant que «les objectifs ambitieux de la première révolution scientifique de l'époque moderne ne peuvent pas être atteints» et que, «dans un sens fondamental, le monde est inintelli25 gible pour nous». Hume a résumé le statut de la science post-newtonienne dans un passage célèbre. Alors que Newton semblait lever le voile sur certains des mystères de la nature, il montrait en même temps les imperfections de la philosophie mécaniste; et de ce fait, renvoyait ses secrets ultimes à 1' obscurité où ils se trouvaient et où ils resteraient pour toujours.

C'est également aux limites de la science et de notre pouvoir de connaître que s'intéresse Kant dans la Critique de la raison pure, tentant de démêler ce à quoi peut légitimement prétendre la connaissance humaine et ce qui lui demeure à jamais inaccessible. Seuls les phénomènes, par 24

Voir aussi la section 4 de ce chapitre. 25 Voir Chomsky 2003: 263. Ailleurs, il propose d'adopter dans la recherche scientifique un« scepticisme mesuré» (mitigated scepticism), ce qui est une façon d'admettre que le monde n'est pas pleinement intelligible. On se souvient aussi de la distinction qu'il établissait, il y a une quarantaine d'années, entre les problèmes et les mystères. C'est essentiellement sur cette distinction que repose 1' attitude que ses détracteurs appellent aujourd'hui le «mystérianisme» (voir What kind of creatures are we ?, chapitre II). On peut interpréter cette attitude « mystérianiste » comme une conséquence de son naturalisme méthodologique.

84

DANS LE LABYRINTHE DU LANGAGE

définition objets de l'expérience, sont susceptibles de devenir des objets pour la science. Mais, pour Kant, la connaissance est restreinte aux «objets d'une expérience possible». Cette référence au «possible» est essentielle parce qu'elle permet d'un même mouvement de mieux cerner ce qui est propre à l'objet étudié et de délimiter l'étendue de notre pouvoir de connaître. C'est que la science doit savoir qu'elle ne peut espérer dégager la connaissance à partir des seuls contenus d'expérience. Elle doit aussi compter avec la structure interne de la raison, préalable à toute connaissance, immuable et indépassable parce qu'inhérente à notre condition. La connaissance est donc toujours à la fois sensible et intellectuelle et doit mobiliser conjointement deux facultés distinctes, la « sensibilité» et 1' «entendement». Il s'agit de distinguer ce qui relève de 1'une ou de 1'autre et la tâche n'est pas triviale. En bref, il ne peut y avoir de connaissance sans une conscience et une science des limites de la connaissance, etc' est une critique de la raison qui rend disponibles cette conscience et cette science. On voit immédiatement quelles peuvent être les implications de la réflexion kantienne pour la science du langage. Selon Russell (1948), la science doit enregistrer ces limitations et donc se contenter de construire des descriptions spécifiant la structure formelle des objets. Pour Chomsky, sur ce point très proche de Russell, le progrès scientifique est étroitement dépendant de notre constitution mentale et, plus généralement, de 1' entendement humain. L'esprit, précisément parce qu'il est richement structuré, ne peut construire la théorie de n'importe quel objet. Le passage suivant, tiré de Problems of Knowledge and Freedom, est particulièrement éclairant. ... notre constitution mentale nous permet d'atteindre la connaissance du monde pour autant que notre capacité innée à créer des théories se trouve coïncider avec un aspect de la structure du monde. En explorant diverses facultés de 1' esprit, on pourrait, en principe, comprendre quelles théories nous sont plus accessibles que d'autres, quelle forme de connaissance scientifique peut être atteinte, si le monde consent à avoir les propriétés requises ... (Chomsky 1972a: 25).

Pour mener à bien cette entreprise, on ne peut qu'explorer des domaines spécifiques de la connaissance humaine. Un système de connaissance résulte de l'interaction de mécanismes innés, de processus de maturation génétiquement déterminés, et de l'interaction avec 1' environnement social et physique. Le problème est de rendre compte du système construit par 1' esprit au cours de cette interaction (Chomsky 1972a: 25).

LA QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

85

Or, pour Chomsky, le système de connaissance qui se prête le mieux à une approche de ce type est le langage. Si 1' on adopte ce qui dans les 6 termes de Gallistel, repris par Chomsky/ apparaît aujourd'hui comme la norme dans les neurosciences, la conception modulaire de l'apprentissage, qui considère le cerveau comme un complexe d'organes spécialisés, on peut supposer que la Faculté de Langage constitue un système aux propriétés spécifiques. La connaissance du langage ne peut être acquise que par un organisme qui est programmé pour cette tâche. En termes kantiens, on peut dire que cette disposition innée constitue une restriction, une précondition de l'expérience linguistique et joue un rôle déterminant dans le processus d'apprentissage. Elle permet aussi de comprendre pourquoi le langage est configuré comme ill' est, pourquoi il manifeste les propriétés qu'on lui connaît. C'est que le cerveau humain affronte par ses propres biais la tâche de décoder 1' information linguistique à laquelle il est exposé, segmentant le donné en catégories discrètes, imposant une structure hiérarchique sur le flux continu du discours, faisant intervenir des principes universels réglant le fonctionnement des computations. Si 1' on raisonne dans ces termes, on comprend que la recherche sur la Faculté de Langage puisse contribuer à déterminer la 27 forme et la nature de certains des principes de l'entendement humain. Poussant plus avant cette conception modulaire, Chomsky a souvent évoqué la possibilité qu'il existe dans le cerveau une faculté spécialisée dans la construction des théories scientifiques (science-forming faculty), qui «met à disposition [de l'esprit humain] une collection restreinte d'hypothèses admissibles qui constituent le fondement de la recherche scienti28 fique humaine». De quoi s'agit-il? La simplicité continue à guider le savant dans la construction de la science. Mais il dispose également, comme tout être humain, d'une «capacité à construire la science», inscrite dans sa nature biophysique, donc innée, un don lui permettant, «dans certaines situations problématiques, de concevoir des constructions théoriques et de sélectionner des données qui peuvent être interprétées comme

26

Voir Gallistel 1997, 1999, cité par Chomsky 2003 : 318. 27 La conception modulaire permet aussi de mieux comprendre pourquoi certaines espèces animales s'acquittent mieux que les humains de certaines tâches, en faisant usage d'une capacité cognitive dont ces derniers sont dépourvus. On pense par exemple au système de navigation magnétique dont sont dotées plusieurs espèces. 28 Voir Chomsky 2016: 28. Aussi Chomsky 2003 : 323 et les références données dans ce passage. McGilvray propose de voir dans la science-forming faculty de Chomsky une version contemporaine de ce que Descartes appelait les «lumières naturelles», voir McGilvray dans Chomsky 2012: 246.

86

DANS LE LABYRINTHE DU LANGAGE

de 1' évidence empirique portant sur elles», en bref d'exercer ce que Charles Sanders Pierce, grand logicien, père célébré de la sémiotique et de la pragmatique et critique vigoureux du système cartésien, appelait l'abduction.29 L'homme ne dispose pas d'un procédé de solution automatique pour aborder les problèmes scientifiques, mais d'un flair qui lui permet de deviner la meilleure explication, celle qui va se révéler la plus féconde, 30 face à 1' infmité des hypothèses improductives concurrentes. Pierce résume son modèle canonique par la formule suivante : Le fait surprenant C est observé. Mais si A était vrai, C irait de soi. Ainsi y a-t-il quelque raison de suspecter que A est vrai. Supposons que nous soyons au travail, en train d'examiner un grand nombre de faits, mais sans discerner de principes généraux. Mais il nous vient brusquement à 1' esprit que si nous devions admettre pour vrai un certain principe, alors les faits s'organiseraient de façon lumineuse. Ce processus est l'abduction ... (Pierce 1903).

L'abduction est une dynamique inférentielle distincte de 1' induction et de la déduction. L'abduction cherche une théorie. L'induction cherche des faits. Dans l'abduction, la considération des faits suggère l'hypothèse. Dans l'induction, 1' étude des faits suggère 1' expérimentation par laquelle sont éclaircis les 31 faits mêmes que 1'hypothèse avait révélés.

Elle consiste donc à sélectionner une hypothèse explicative, c'est-à-dire à poser une hypothèse qui n'est pas déductible de ce qui est observé, mais permet au contraire de déduire ce qui est observé. Pour Pierce, les limites de l'intelligence humaine sont plus étroites qu'on ne le croit habituellement. Son originalité, aux yeux de Chomsky, est d'avoir insisté sur la nécessité d'isoler les règles innées qui limitent la classe des théories 29

Il semble même que Pierce ait forgé le concept d'abduction pour bien marquer, en opposition au cartésianisme, que le raisonnement hypothético-déductif et la vérification expérimentale ne constituaient pas les étapes initiales de la démarche scientifique, mais étaient précédés par une phase d'étonnement, dans laquelle l'abduction joue un rôle décisif 3 ° Chomsky (20 16 : 28) rapproche cette position de Peirce de celle de Hume, pour qui «la plus grande part de la connaissance humaine» dépend d'«une forme d'instinct naturel», qui «dérive de la main originelle de la nature», soit, en termes contemporains, de l'équipement génétique. Sur Hume, voir chapitre V, section 4. 31 Le terme d'abduction est, par exemple, tout à fait approprié pour désigner le raisonnement par présomption pratiqué par le Dr. Gideon F ell, le détective Hercule Poirot et le commissaire Maigret dans les romans de Dickson Carr, d'Agatha Christie et de Georges Simenon.

LA QUESTION DE LA SCIENCE À PROPOS DU LANGAGE

87

possibles. Pierce soutenait en effet que la recherche des principes d' abduction mène à l'étude des idées innées, qui fournissent la structure instinctive de l'intelligence humaine. Pour Chomsky, le concept d'abduction a un fort parfum kantien et dérive tout entier de la psychologie rationaliste qui s'intéressait à la forme, aux limites et aux principes qui fournissent «les nerfs et les connexions» de la pensée humaine, qui sont sous-jacents à «la masse infinie de connaissance» dont nous ne sommes pas toujours conscients ... (Chomsky 1968 : 81-82).

On perçoit mieux, à 1' issue de cette discussion, ce qui constitue, aux yeux de Chomsky, une science linguistique se conformant à l'idéal de rigueur et d'exactitude des sciences de la nature. Le linguiste, comme le physicien, le biologiste ou le neurologue, doit s'attacher à produire dans son domaine une théorie qui satisfasse aux exigences d'adéquation descriptive et d'adéquation explicative - la première ne saurait en aucun cas suffire -, qui avance des propositions formalisables et mathématisables, ayant un certain contenu de réalité, et qui soit telle qu'elle autorise sa mise en relation, voire son unification avec des théories portant sur d'autres domaines. Il semble que, pour atteindre ce but, l'homme soit doté d'une capacité à construire de la science. C'est cette capacité qui lui permet de pratiquer ce que Pierce appelait 1'«abduction» et le conduit aussi à prendre la recherche de la simplicité pour guide.

CHAPITRE

v

LA GRAMMAIRE GÉNÉRATIVE, LA TRADITION RATIONALISTE ET LA PHILOSOPHIE EMPIRISTE

L'une des raisons d'étudier le langage - et la raison qui pour moi personnellement a le plus de poids- est qu'il est tentant de considérer le langage, si l'on reprend l'expression traditionnelle, comme «un miroir de l'esprit» (Réflexions sur le langage, p. 12).

Comme l'a établi le chapitre précédent, la Grammaire Générative a cherché à asseoir ses propositions empiriques et théoriques sur un socle épistémologique solide, en tentant d'intégrer au dispositif les questionnements et les avancées de la théorie de la connaissance et de la philosophie des sciences. Ce chapitre élargit la perspective en s'interrogeant sur le lien très étroit entre les problèmes abordés par la Grammaire Générative et les questions soulevées par la philosophie de 1' esprit. Chemin faisant, on constate que les relations entre la linguistique chomskyenne et la philosophie sont à double sens. D'une part, il ne fait aucun doute que les discussions philosophiques du début des années 50 aux Etats-Unis sur les propriétés des systèmes constructionnels, sur la notion de simplicité, sur 1' indétermination de la traduction et la sous-détermination des théories scientifiques par l'expérience ont contribué, de concert avec l'héritage structuraliste, à façonner le premier modèle génératif, celui qui est présenté dans Structures syntaxiques. D'autre part, en se donnant pour tâche de décrire et comprendre un aspect bien délimité du fonctionnement de l'esprit, la recherche sur le langage jette une lumière nouvelle sur certaines questions philosophiques de grande portée, telles que 1' oppositi on entre le rationalisme et 1' empirisme, le dualisme et le problème corps-esprit, la portée et les limites des capacités cognitives de 1'homme. Les résultats obtenus, qui concernent au premier chef la relation étroite que le langage entretient avec la pensée, fournissent des indices précieux sur la structuration de 1' esprit et éclairent le fonctionnement de certains mécanismes qui peuvent être considérés comme des traits distinctifs des ?

90

D ANS LE LABYRINTHE DU LANGAGE

phénomènes mentaux. Il est légitime de penser qu'ils inaugurent un chapitre nouveau de la philosophie de 1' esprit.

1.

NATURALISME, MENTALISME, INTERNALISME

Toute 1' entreprise générative depuis Aspects peut être vue rétrospectivement comme une tentative d'aborder et de caractériser le langage humain en se conformant à l'exigence explicative, aux modes de compréhension et aux méthodes en usage dans les sciences de la nature, la physique en particulier. Ce programme défend la possibilité d'étendre à l'étude d'une dimension de l'esprit -le langage- un mode d'enquête à la fois rationaliste et expérimental, analogue à ce qui se pratique dans les sciences confirmées. Dans New Horizons in the Study of Language and Mind, Chomsky qualifie de naturaliste la méthodologie qu'il adopte dans la recherche sur le langage. Il s'attache parallèlement à définir une perspective intemaliste sur le langage et l'esprit. Blitman (20 10) montre très bien que, dans la pensée de Chomsky, le naturalisme conduit au mentalisme, que le mentalisme conduit à l'innéisme et que l'ensemble n'est pleinement compatible qu'avec une perspective intemaliste. Pour déployer ce réseau de notions et montrer comment elles s'articulent les unes aux autres, précisons d'abord ce qu'il faut entendre par «naturalisme». Chomsky précise d'emblée que «naturalisme» peut être entendu en deux sens, l'un métaphysique/ontologique, l'autre méthodologique/épistémologique. D'un point de vue ontologique, le naturalisme consiste à n'admettre comme existantes que les entités de la nature, celles qui sont étudiées par les sciences. En bref, il revient à «ne reconnaître sur le plan ontologique que les êtres naturels» (Blitman 201 0). Du point de vue méthodologique, le naturalisme consiste à rejeter toute notion théorique et toute démarche qui ne seraient pas susceptibles d'être intégrées aux sciences de la nature (physique, chimie, biologie ... ), à adopter la méthode des sciences de la nature dans 1'étude de tous les phénomènes, quels qu'ils soient. Chomsky fait résolument sien le naturalisme méthodologique, même s'il donne parfois l'impression d'endosser également le naturalisme ontologique. L'adoption d'une méthode naturaliste, qui signifie que les phénomènes mentaux et en particulier le langage doivent être étudiés comme tous les autres phénomènes naturels, revient à rejeter la dualité entre sciences de la nature et sciences de 1' esprit. La démarche naturaliste s'oppose donc frontalement à une attitude que 1'on pourrait qualifier de dualiste, posant en principe qu'on

LA GRAMMAIRE GÉNÉRATIVE

91

ne peut appliquer au traitement des processus mentaux les mêmes outils et les mêmes principes explicatifs qu'aux phénomènes du monde physique. Chomsky rejette vigoureusement la position de ceux qui, comme la plupart des philosophes empiristes de sa génération, adoptent tacitement la thèse de la «bifurcation» et défendent 1' idée que 1' étude du langage devrait être soumise à des critères et des conditions différentes 1 de celles qui valent dans les sciences de la nature. Pour le naturalisme, il n'est pas question d'abandonner 1' exigence de rationalité scientifique quand on prend pour objet ce qu'il y a de mental dans l'humain. Chomsky consacre également deux chapitres de New Horizons in the Study of Language and Mind à définir ce qu'il appelle la perspective intemaliste sur l'esprit et le langage. Selon lui, la seule stratégie envisageable dans la construction d'une science de l'esprit consiste à étudier les systèmes mentaux innés, à chercher à comprendre les états internes des organismes en ignorant leur relation avec le monde extérieur et en concentrant au contraire 1' attention sur leurs relations avec d'autres systèmes internes. La position internaliste est, selon McGilvray (dans Chomsky 2012: 296), à mettre en relation avec la conception modulaire de 1' esprit, mais aussi avec les thèses cartésiennes concernant 1' innéité et 1' aspect créateur de 1' emploi du langage. Dans cette perspective, qui est celle de la linguistique chomskyenne et s'oppose autant à la croyance commune qu'aux philosophies de l'esprit qui optent pour une approche extemaliste, c'est la structure interne de 1' esprit qui rend compte à la fois de la façon dont le langage est façonné, de son acquisition et de son emploi, une hypothèse qui a évidemment partie liée avec la notion de ' langue interne introduite au chapitre III. A ce titre, l'étude du langage peut fournir des indices précieux sur la structuration de 1' esprit. Mais on ne sait pas a priori quel type d'évidence peut porter sur ces questions. Chomsky observe qu'au sens strict, le choix d'une méthodologie naturaliste n'implique pas en soi l'adoption d'une position intemaliste. Mais, à ses yeux, aucune combinaison concurrente n'est envisageable: il ne peut exister d'approche adoptant le naturalisme méthodologique, mais refusant la position internaliste, ni d'approche rejetant le naturalisme méthodologique, mais endossant la position intemaliste. Le projet d'étudier le langage comme un objet de la nature, une fois qu'on le combine à la position internaliste, va de pair avec 1' adoption 1

Chomsky (20 16) parle à ce propos d'un «nouveau dualisme» méthodologique, qu'il qualifie de pernicieux et oppose au dualisme ontologique de Descartes,« qui était de la science respectable», même s'il a été réfuté par la suite.

92

DANS LE LABYRINTHE DU LANGAGE

d'une perspective mentaliste: on se donne comme objet l'étude des structures mentales cognitives dédiées au langage dans l'esprit du locuteur. La théorie linguistique est mentaliste au sens technique du mot, puisqu'elle s'attache à découvrir une réalité mentale sous-jacente au comportement effectif (Chomsky 1965: 13).

Par contre, l'idée que l'adoption d'une perspective intemaliste mentaliste conduit naturellement à 1'hypothèse de 1' innéisme ne va pas de soi. L'on peut certes chercher à asseoir une théorie scientifique, en particulier l'étude du langage, sur un fondement empirique solide, sans adopter une 2 position empiriste. Mais, comme l'observe Matthieu Haumesser, ce choix méthodologique ne fait pas pour autant de l'innéisme une hypothèse nécessaire. Pour Kant, par exemple, les facultés ou les conditions de possibilité de 1' expérience sont a priori, mais elles ne sont en aucun cas innées. La justification avancée par Chomsky en faveur de l'innéisme est en fait de nature différente. Elle est indissolublement liée à la critique de 1' empirisme. Blitman (20 15 : 117-119) rappelle que 1' innéisme n'est pas pour lui une proposition générale aux contours flous, mais un ensemble d'« hypothèses explicatives particulières» concernant « 1' état 3 initial génétiquement déterminé pour l'apprentissage du langage». C'est un équipement génétique qui permet aux humains de grandir et de se développer jusqu'à la maturité, d'atteindre un certain état, dont il fixe aussi les limites. Il en va de même pour les facultés mentales d'ordre supérieur comme le langage et les autres capacités cognitives. Puisque les humains font partie du monde organique, on doit supposer qu'un équipement génétique inné est sous-jacent au développement de chacune de ces facultés. Chomsky a la conviction que seul un cadre innéiste permet de formuler sur la Faculté de Langage des propositions dotées de contenu empirique, donc réfutables, et que c'est au contraire l'empirisme contemporain qui, par son rejet du naturalisme méthodologique et par son refus d'étudier les processus mentaux sous-jacents à l'usage du langage, 4 constitue un obstacle à toute étude scientifique. Et il se fait de l'empirisme une conception assez peu restrictive, puisqu'il considère comme appartenant à cette famille non seulement les psychologues béhavioristes 2

Sur ce point, voir Chomsky 1975: 156-157. 3 Ces passages cités par Blitman (20 15 : 118) sont extraits de la réponse de Chomsky aux commentaires de Putnam dans le livre Théories du langage, théories de l'apprentissage, édité par Piattelli-Palmarini (1979: 445). 4 Ce reproche ne vaut pas pour 1' empirisme classique, celui de Hume en particulier, qui adoptait au contraire une position naturaliste.

LA GRAMMAIRE GÉNÉRATIVE

93

comme Burrhus Skinner, mais aussi les figures majeures de la philosophie analytique, Tyler Burge, Donald Davidson, Michael Dummett, Hilary Putnam, Willard van Orman Quine, John Searle et les linguistes structuralistes comme Leonard Bloomfield, en bref tous ceux qui rejettent l'innéisme et qu'il suspecte de souscrire au dualisme méthodologique. Cette discussion confirme également que si Chomsky embrasse une position rationaliste, il est avant tout soucieux de proposer touchant le langage des hypothèses testables empiriquement, prêtes à affronter le tribunal de l'expérience. Les conséquences de cette perspective naturaliste intemaliste sont multiples. Elle exclut tout d'abord la possibilité qu'il y ait, au dessus de la science, une notion théorique destinée à la réguler, à lui imposer des normes, ainsi que toute prise en compte dans l'étude scientifique du langage de notions telles que celles de langue publique, langue commune, langue sociale. Hinzen (2006) observe d'autre part avec raison que la Grammaire Générative et la perspective naturaliste internaliste qu'elle adopte ont permis d'identifier un aspect jusqu'alors inaperçu du monde naturel et ont en même temps enrichi la philosophie de l'esprit d'une idée entièrement nouvelle: l'idée que des questions précises de design peuvent être posées à propos des systèmes cognitifs humains. L'enquête intemaliste s'attache en effet à montrer que les systèmes cognitifs, tels que le langage, sont soumis à des contraintes et des principes proches de ceux qui façonnent les systèmes physiques, confirmant que l'esprit humain est enraciné dans la loi de la nature, que le langage est un authentique objet de la nature. On a soulevé à 1' encontre de cette conception de 1'esprit une réserve importante. Chomsky utilise la notion de connaissance en l'appliquant au langage, pour référer de façon relativement informelle à une réalité qui est représentée dans l'esprit-cerveau du locuteur. Assigner à cette réalité le statut d'une connaissance mentale interne est une autre façon de dire que le langage n'est pas un «complexe de dispositions au comportement verbal», comme le maintient Quine, mais relève de la présence dans 1'esprit d'une «certaine structure de règles, de principes et de représentations ... » (Chomsky 1980a: 89). Or, pour Quine, Searle, Dummett, Nagel et beaucoup d'autres philosophes, on ne peut parler de connaissance quand on a affaire à un type de savoir dont le locuteur n'est pas conscient, constitué de représentations auxquelles il n'a pas accès. Ils en concluent que la prétention de la Grammaire Générative à constituer une science du mental est de ce fait absolument sans fondement. Pour Chomsky, au contraire, le fait d'être conscient d'un savoir n'est pas ' une condition nécessaire à la connaissance. A ses yeux, la notion

94

DANS LE LABYRINTHE DU LANGAGE

d'accessibilité à la conscience n'a pas le poids suffisant pour justifier une distinction de principe entre connaissance consciente et connaissance tacite. Pour désigner la connaissance tacite et désamorcer une querelle terminologique selon lui sans contenu, il propose d'utiliser le 5 verbe cognize plutôt que know. Il reste que 1' idée que les locuteurs ont une connaissance tacite de leur propre langue soulève effectivement des problèmes philosophiques importants. Davies (1989) observe par exemple que celui qui raisonne en termes de connaissance tacite va très vite se trouver confronté à la di fficuité soulevée par Quine (1972): il existera toujours des systèmes de règles grammaticales (ou d'axiomes) extensionnellement équivalents dont on pourra dériver le même ensemble de phrases (ou les mêmes théorèmes). Pour Quine, si deux grammaires sont équivalentes au sens où elles produisent les mêmes effets sur le comportement linguistique des locuteurs, on ne peut attribuer à ces derniers une préférence inconsciente 6 pour une grammaire plutôt que pour l'autre. Davies poursuit: Quel sens empirique cela peut-il avoir de supposer qu'un locuteur standard se trouve dans une relation psychologique particulière avec un ensemble d'axiomes, plutôt qu'avec un ensemble concurrent, extensionnellement équivalent? (Davies 1989: 131 ).

Pour que la notion de connaissance tacite ait un sens, il faut également supposer que les règles de la grammaire ne se donnent pas pour des descriptions des opérations psychologiques ou des états du cerveau. On a affaire à deux ordres de réalité différents, qui doivent être soigneusement distingués, éventuellement en admettant 1' existence de plusieurs niveaux d'abstraction.

2.

LE STATUT DE LA SÉMANTIQUE

Sa position internaliste conduit Chomsky à défendre une conception extrêmement restrictive du sens et de la signification. La question est de savoir si le sens doit être considéré comme un aspect du langage qui ne peut être abordé que de façon externe, comme le pense le sens commun, ou s'il est, pour une large part, déterminé de façon interne et invoque des

5

Un locuteur du gallois, par exemple, « cognizes » que, dans sa langue, le verbe conjugué précède l'argument sujet dans les propositions à temps fini. 6 Sur la position de Quine et la réaction de Chomsky, voir la section 5.2.2 de ce chapitre.

LA GRAMMAIRE GÉNÉRATIVE

95

entités mentales, c'est-à-dire repose prioritairement sur le fonctionnement et 1' équipement cognitif de 1' esprit-cerveau, comme le soutient Chomsky. Cette question, qui n'est autre que celle de la relation du langage au monde, est particulièrement complexe et mérite que l'on s'y arrête brièvement. Dans les années 60, Chomsky défendait une position extrêmement prudente touchant la place de la signification dans 1' entreprise générative. Il écrit dans Aspects de la théorie syntaxique qu'« il ne faudrait pas prendre pour acquis que l'on puisse rigoureusement distinguer considérations syntaxiques et considérations sémantiques» (Chomsky 1965: 111) et aussi que «la question de la délimitation entre syntaxe et sémantique restera en suspens jusqu'à ce que ces champs soient bien mieux connus qu'aujourd'hui» (Chomsky 1965: 216). 7 Sa position actuelle est beaucoup plus tranchée. Il s'oppose avec force aux philosophies du langage modernes et contemporaines qui posent comme allant de soi que les mots réfèrent aux choses et les phrases à des états de choses et qui placent la référence et la vérité au coeur du fonctionnement langagier. Dans l'usage philosophique courant, le renvoi à une réalité extra-langagière est ce qui définit la référence ou la dénotation d'une expression linguistique. Chomsky rejette cette conception, selon laquelle le coeur de la sémantique réside dans un appariement entre les mots et les choses, entre les termes du langage et les objets du monde. Par eux-mêmes, les mots ne réfèrent pas à des entités externes. Ce sont les locuteurs qui accomplissent des actes référentiels en mettant les mots à contribution. Dans les actes de parole, l'usage des mots dépend de facteurs externes comme la constitution matérielle, l'emploi projeté, la visée institutionnelle ou communautaire, les conventions sociales ... Chomsky multiplie les exemples montrant selon lui que les mots n'isolent pas des entités spécifique dans le monde réel ou dans notre univers de croyance. Les traits sémantiques associés à un mot peuvent être traités de diverses façons et renvoyer, parfois dans le même énoncé, au composant concret ou au composant abstrait du sens lexical, comme c'est le cas dans les exemples suivants: (1)

7

a. Le livre qu'il projette d'écrire pèsera au moins deux kilos, si jamais ill' écrit. b. Son livre est dans toutes les librairies du pays.

Voir Tsoulas 2019 pour une analyse intéressante de la position présente de Chomsky sur la sémantique.

96

D ANS LE LABYRINTHE DU LANGAGE

On sait aussi que, dans la conception défendue par Frege, la signification des propositions est considérée comme indistinguable de leurs conditions de vérité. Or, aux yeux de Chomsky, une théorie de la sémantique fondée sur les conditions de vérité la place d'emblée hors de la Faculté de Langage. Ces catégories dénotationnelles, la référence et la vérité, sont problématiques précisément parce qu'elles sont définies pour des entités et des situations externes au langage et à la pensée. De fait, comme 1' observe Tsoulas (20 19), il paraît à première vue difficile de concilier la préoccupation dominante des sémanticiens formels, qui est la définition de conditions de référence et de vérité, et l'ambition des linguistes chomskyens, qui est de proposer des outils formels permettant de construire la structure en constituants ainsi que les relations de dépendance entre expressions, afin de définir l'état initial de la Faculté de Langage et de caractériser les langues internes. Il faut bien admettre que 1' identité référentielle de 1' entité désignée par telle ou telle expression et la valeur de vérité de la proposition qui la contient ne semblent jouer aucun rôle dans le fonctionnement du système computationnel. Critiquer la notion de référence ne peut suffire. Il faut aussi se demander s'il est possible de développer une conception internaliste de la sémantique, qui ne ferait pas référence à des réalités et à des situations externes. Que serait une sémantique internaliste? Elle ignorerait par exemple la référence des entités, mais s'intéresserait au contenu lexical intrinsèque des mots et des expressions et à la façon dont ils se combinent, à la coréférence entre expressions, et déciderait de la valeur de vérité d'une proposition sur des critères purement formels. Cela suppose que 1' on distingue soigneusement entre la part du sens des énoncés qui est directement déterminée par leur structure syntaxique et, d'autre part, la signification, au sens le plus large du terme, qui n'est pas (exclusivement) sensible aux configurations structurales. Nous savons que les relations structurales entre expressions jouent un rôle crucial dans la détermination du sens des énoncés mettant enjeu des relations d'anaphore et de coréférence et des interactions de portée entre quantificateurs. Dans l'architecture de tous les modèles génératifs qui se sont succédé depuis la fin des années 70, ces relations sont prises en compte par un niveau spécialisé, dévolu à la représentation de celles des propriétés sémantiques qui sont déterminées exclusivement par des aspects structuraux et par des principes linguistiques, la Forme Logique. Il faut bien percevoir que la critique continue de la notion de référence et la tentative de défmir une sémantique internaliste ont des conséquences directes sur le statut de la sémantique comme discipline autonome.

LA GRAMMAIRE GÉNÉRATIVE

97

Chomsky rejette l'idée que la référence puisse servir d'argument en faveur d'une telle autonomie. Il va même jusqu'à suggérer que la grammaire des langues naturelles pourrait se réduire à un composant syntaxique et un composant pragmatique, ne mettant à disposition aucun espace dédié pour le fait sémantique majeur que le langage est utilisé pour représenter le monde et aussi pour communiquer. Cette idée va de pair avec l'observation que, comme la syntaxe, la sémantique, dans sa version internaliste, s'occupe des propriétés et des arrangements des objets symboliques, laissant ouverte la possibilité de considérer la sémantique des langues naturelles comme une forme de syntaxe, orientée vers une interface différente et vers des aspects différents de 1' emploi du langage. Chomsky reconnaît lui-même avec un brin de malice qu'il préfère caractériser comme syntaxiques des phénomènes que l'on consi8 dère habituellement comme sémantiques. C'est le cas des phénomènes illustrés plus bas, l'anaphore, la coréférence, le contrôle (voir chapitre VI, section 1.1. et chapitre VIII, section 5.3. ). Il est clair que si elle ne retient que les aspects de la signification qui peuvent être abordés syntaxiquement et représentés configurationnellement, 1' approche intemaliste passe à côté de ce qui pour les philosophes et les sémanticiens constitue le sens, ce qui explique en grande partie leur scepticisme face aux propositions de Chomsky. Mais, si on ne peut pas dire que l'approche intemaliste rende accessible une théorie intégrée du sens et de la signification, les questions sémantiques demeurent une composante importante de l'entreprise générative. Et on admettra que sur un point fondamental, Chomsky ne peut avoir tort: il est impossible que la théorie sémantique soit exclusivement externaliste.

3.

UNE LINGUISTIQUE CARTÉSIENNE?

3 .1. LIRE DESCARTES EN «AMATEUR D'ART»

La référence au cartésianisme est absente des premières contributions de Chomsky, celles du début des années 50, où, comme l'ont bien montré Lyons (1981) et Tomalin (2006), l'influence des philosophes empiristes comme Goodman et Quine est dominante. Elle apparaît dans les publications du milieu des années 60, dans le premier chapitre d'Aspects en particulier. Elle figure surtout dans le titre d'un livre de 1966 qui marque la première incursion importante de Chomsky dans le débat philoso8

Voir Chomsky 2003: 317-318.

98

DANS LE LABYRINTHE DU LANGAGE

phique et l'histoire des idées, La linguistique cartésienne, un chapitre de ' l'histoire de la pensée rationaliste. A cette date, Structures syntaxiques, le livre qui exposait la première version du modèle génératif, avait été publié depuis dix ans et les implications cognitives et philosophiques de la grammaire proposée n'y étaient pas abordées. La philosophie de Descartes ne semble donc avoir joué aucun rôle dans la construction de ce premier modèle et dans l'invention de la grammaire générative ellemême. Cette conclusion pourrait cependant être remise en question par une révélation que fait Chomsky dans ses entretiens de 1982 avec Huybregts et van Riemsdijk: le premier chapitre d'Aspects a été écrit dans les années 1958-1959. On peut donc supposer que Chomsky avait dès la fin des années 50 une connaissance pleine et entière de la pensée 9 de Descartes. Le décalage manifeste entre Structures syntaxiques et Aspects peut recevoir une explication assez simple: alors que la publication d'Aspects intervient à un moment où la stature de Chomsky est désormais reconnue et que ce livre se donne comme un ouvrage ambitieux qui combine considérations épistémologiques et méthodologiques générales, hypothèses théoriques et propositions techniques, et discute de données empruntées à des langues diverses, Structures syntaxiques est un traité relativement succinct, sorte de ballon d'essai de la théorie nouvelle, qui met 1' accent sur les propriétés combinatoires du langage, qui ne traite que de syntaxe anglaise et dans lequel on ne s'attend pas à trouver de référence philosophique, ni de réflexions sur la base psychologique ou 10 biologique des grammaires. Chomsky a par la suite constamment revendiqué cette filiation rationaliste, affirmant son ambition d'étudier le langage en combinant la méthodologie rigoureuse des sciences de la nature contemporaines avec les perspectives ouvertes par le cartésianisme et la pensée rationaliste des XVIIe et XVIIIe siècles. On retrouve la référence à la pensée cartésienne dans de nombreux passages du corpus chomskyen. Il y revient de façon

9

Une remarque analogue à celle qui a été faite à propos de Descartes vaut en effet aussi pour 1' interprétation psychologique de la théorie linguistique, qui n'est pas mentionnée par Chomsky avant Aspects. Dans la préface de la version publiée de LSLT, Chomsky indique que cette question occupait déjà sa pensée dans les années 50, mais qu'il n'en a pas fait état parce qu'illa jugeait trop audacieuse. Elle est par contre mentionnée par Robert Lees, parallèlement au problème de l'acquisition, dans son compte-rendu de Structures syntaxiques en 1957. Voir Freidin 2007 pour plus de précisions. 10 Le mode de présentation adopté dans Structures syntaxiques pourrait aussi n'être qu'un choix pédagogique et refléter le fait que, comme le rappellent Boeckx & Grohmann (2007), le cours dont est issu le livre était destiné à un public d'ingénieurs.

LA GRAMMAIRE GÉNÉRATIVE

99

étendue dans Language and Mind, Règles et représentations et Language 11 and Problems of Knowledge. Il convient donc de s'interroger sur les raisons de cette revendication d'héritage, de décider si elle est fondée ou hors de propos et si elle joue un rôle effectif dans la construction des modèles qui ont suivi. En invoquant une filiation conceptuelle avec Descartes, Chomsky s'engageait sur l'un des terrains favoris des historiens des sciences, dénoncé comme un travers de l'épistémologie contemporaine par Koyré et Canguilhem: la recherche des précurseurs. Selon Canguilhem, le «virus du précurseur» est «le symptôme le plus net d'inaptitude à la 12 critique épistémologique ». Il est selon lui erroné de voir en Aristarque de Samos un précurseur de Copernic, en Maupertuis un précurseur de Mendel. «Faire de Lamarck un précurseur de Darwin, c'est se condamner à ne comprendre ni 1' originalité de Darwin, ni la cohérence de Lamarck ... » Est-il plus légitime de voir en Descartes un précurseur de Chomsky? La référence à Descartes a paru inappropriée à la plupart des philosophes professionnels et a suscité, en France et ailleurs, des critiques acerbes. Les commentateurs ont fait valoir que Descartes a fort peu écrit sur le langage et que 1' on chercherait en vain dans le corpus cartésien 1' amorce d'une théorie linguistique. Ils ont souligné le fait que Descartes n'était pas en France, à l'époque classique, l'unique représentant de la pensée rationaliste et ont accusé Chomsky d'avoir ignoré les sources 13 précartésiennes de Port-Royal, dont Chomsky se réclame également. Ce

11

Voir Chomsky 1968: 5-7, Chomsky 1980a: 36-38,209, et Chomsky 1988: 138147, 151-152. 12 Voir Canguilhem 1994: 21 pour ces citations. Voir aussi Lecourt 2016 : 52. 13 La question de la relation de Port-Royal au cartésianisme est trop complexe pour être sérieusement abordée ici. Je me bornerai à reprendre deux observations tout à fait éclairantes de Miel (1969). La première est que Descartes n'a intéressé les "solitaires" de Port-Royal que dans la mesure où ils voyaient en lui le seul rationaliste qui avançait des preuves convaincantes de 1' existence de Dieu et de 1' immortalité de 1'âme. La seconde est que Blaise Pascal, dont 1'hostilité à Descartes est connue, comme le sont les jugements sans appel qu'il a portés sur sa pensée, semble avoir contribué de façon décisive aux livres de Port Royal, à la Logique ou l'art de penser d'Arnauld et Nicole, qui reprend largement la théorie du langage développée dans L'esprit géométrique (comme le souligne Des cotes 2005), mais aussi à la Grammaire générale et raisonnée d'Arnauld et Lancelot, dont il aurait écrit le chapitre VI (cf. Miel1969: 262, n. 7). Les mérites que Chomsky attribue à la Grammaire (récursion, structure profonde, intension/extension) n'ont en fait rien de spécifiquement cartésien et pourraient tout aussi bien trouver leur origine dans la pensée de Pascal sur le langage. Dans les deux cas, le lien de Port-Royal au cartésianisme apparaît , comme assez tenu.

100

DANS LE LABYRINTHE DU LANGAGE

dernier a pourtant pris soin de souligner l'influence de la grammaire de la Renaissance et de Sanctius sur la théorie du langage de Port-Royal. Observons cependant que 1' approche générative est sur un point essentiel relativement éloignée de la démarche des messieurs de Port-Royal et de celle des nombreuses grammaires générales qui ont suivi, qui enseignent que la grammaire est enracinée dans la structure logique de la pensée, qui 14 impose à la construction de la phrase un ordre nécessaire. Chomsky ne peut que récuser ce point de vue, qui revient à caractériser 1' ordre des mots manifesté par les énoncés du français comme 1' ordre normal et celui du latin ou de l'allemand comme un ordre dérivé. Dans certains cas, la reconstruction que Chomsky propose de la pensée de Descartes n'est pas adéquate à son objet. Ainsi, la dimension créatrice du langage invoquée par le philosophe et que Chomsky considère comme une découverte fondamentale ne saurait en aucune façon être représentée par le recours à des règles récursives. Ces dernières, il est vrai, capturent ce qu'il y a d'utile dans la formule célèbre de Humboldt dans 1'Introduction à 1'oeuvre sur le kavi, selon laquelle le langage «fait un usage infini de moyens finis», ce qui est assez différent. Il arrive souvent dans La linguistique cartésienne que le texte de Descartes soit sollicité dans un sens qui n'est pas le sien. C'est le cas par exemple pour la notion d' «idée innée», pierre de touche de l'opposition entre empirisme et rationalisme. Chez Descartes, 1' idée est une chose mentale, «cette forme de chacune de nos pensées, par la perception immédiate de laquelle nous avons conscience de ces mêmes pensées». Les idées innées diffèrent des autres, factices ou adventices, par la façon dont elles se forment dans 1' esprit: elles sont «nées avec notre esprit» et se distinguent donc de tout ce que nous recevons des sens ou par les sens. Elles constituent une connaissance immédiatement disponible, imprimée par Dieu dans 1' esprit. C'est le cas du concept de triangle, des couleurs primaires, de la notion d'étendue, de l'idée de Dieu ... Chez Chomsky, les idées innées sont tout autre chose: des capacités cognitives qui sont activées lorsqu'elles rencontrent la stimulation appropriée, un ensemble de prédispositions qui permettent à l'enfant de développer une théorie pour l'information dont il dispose, capables en particulier de convertir l'expérience linguistique en connaissance du langage. Par la référence aux idées innées, Chomsky entend signifier qu'à ses yeux, quand un savoir riche et complexe peut être construit de façon uniforme et 14

Mais Foucault (1969) met en garde contre une assimilation trop hâtive de la grammaire classique à la logique.

LA GRAMMAIRE GÉNÉRATIVE

101

homogène à partir de l'expérience, comme c'est le cas de la connaissance du langage, il doit exister un équipement génétique préalable imposant un ensemble de contraintes déterminant la forme du système cognitif ainsi construit. C'est peut-être la raison pour laquelle, selon certains commentateurs, Chomsky aurait été mieux inspiré, pour caractériser sa position, de faire référence au transcendantalisme de Kant, plutôt qu'au rationalisme de Descartes. Les deux positions ont en commun de s'opposer à 1' empirisme. Mais c'est l'originalité de Kant que d'avoir fondé la connaissance objective non pas seulement sur les contenus qui nous viennent de la réalité externe et nous sont livrés par 1' intuition sensible, mais aussi sur des «formes pures a priori» qui ont leur siège dans le sujet de conscience lui-même. Dans sa philosophie, une affirmation est transcendantale si elle renvoie non pas à un contenu d'expérience, mais aux conditions de l'expérience possible, qui transcendent 1' expérience et d'une certaine manière la précèdent. Ce sont ces conditions qui rendent possibles la perception et la conception par le sujet du monde sensible comme système d'objets. En termes kantiens, on peut dire que c'est une réflexion dialectique de type transcendantal qui rend légitime 1' application du concept de Faculté de Langage ou de Grammaire Universelle à l'expérience linguistique concrète du locuteur, dont elle définit une condition de possibilité. Comme l'observe Matthieu Haumesser, une différence fondamentale sépare donc la position de Kant de celle de Descartes : «L'approche transcendantale de Kant se situe en amont de toute référence à la nature. Les facultés y sont considérées d'un point de vue qui n'est ni génétique, ni naturaliste.» Or sur ce point essentiel, Chomsky est beaucoup plus proche de Descartes que de Kant. La référence à Descartes est donc pleinement justifiée. Selon d'autres commentateurs, Chomsky aurait dû considérer plus attentivement la contribution majeure de Leibniz à la pensée linguistique (Aspects et La linguistique cartésienne ne contiennent que de brèves allusions à ce philosophe). J. Bouveresse (1979: 424) s'étonne enfin de l'absence de toute référence à Condillac, d'autant plus surprenante qu'il a exercé une influence considérable sur Humboldt. On peut surtout objecter à Chomsky que le rationalisme, qui pose que la raison humaine a une précédence absolue sur les autres façons d' accéder à la connaissance ou est même l'unique voie d'accès à la connaissance, ne saurait à lui seul épuiser la complexité du langage. En particulier, on ne voit pas immédiatement quelle relation peut être établie entre le rationalisme entendu au sens classique et les hypothèses sur la

102

DANS LE LABYRINTHE DU LANGAGE

Faculté de Langage que Chomsky situait à l'époque dans un cadre psychologique et inscrit aujourd'hui dans un cadre biologique et neuronal. Ces objections et quelques autres sont de grande portée et ne 15 sauraient être ignorées. Mais elles ne signifient aucunement que la référence faite par Chomsky à Descartes est sans fondement. ' A ces objections, Chomsky répond en partie dans le débat de 1971 avec Michel Foucault, puis dans ses entretiens de 1977 avec Mitsou 16 Ronat. Il précise qu'il n'a pas abordé la pensée rationaliste en historien des sciences ou des idées philosophiques, mais en adoptant le point de vue rétrospectif de quelqu'un qui défend certaines idées de nature scientifique et que cela intéresse de voir comment, dans le passé, d'autres esprits ont rencontré, par tâtonnements successifs, les mêmes idées. Il s'agit donc non pas de faire oeuvre d'« antiquaire», mais d'adopter le point de vue d'un «amateur d'art» et, dans une perspective inévitablement contemporaine, de voir comment s'est mis en place une approche rationnelle du langage et de 1' esprit dans la première moitié du 17 XVIIe siècle. C'est qu'avec le Discours, se profile 1' armature des questions sur lesquelles s'édifieront toutes les théories de la connaissance, qui s'interrogent sur l'origine et la nature des facultés et des structures que le sujet doit solliciter pour expliquer les données auxquelles il est confronté. Pour les empiristes, toute connaissance a ses racines dans 1' expérience sensible, c'est l'expérience qui joue le premier rôle dans le façonnement de l'esprit humain, c'est d'elle que viennent tous les contenus mentaux. La position de Chomsky, comme celle de Descartes, est à l'opposé résolument rationaliste. 15

Pour une critique de La linguistique cartésienne, voir Aarsleff 1970, Percival1972, J. Bouveresse 1979, Auroux 1998, parmi beaucoup d'autres. Il faut admettre que certains commentaires de 1' époque ont de quoi surprendre. Un historien de la linguistique, spécialiste de la pensée scolastique, fait grief à Chomsky d'avoir pris Descartes trop au sérieux, en le considérant comme le fondateur d'un nouvel esprit scientifique, alors que sa réputation comme savant et comme épistémologue est totalement usurpée. 16 Dans Chomsky et Foucault 2006: 10 et dans Chomsky 1977a: 94. 17 Les quelques lignes de Foucault (1969: 733) sur La linguistique cartésienne dans son introduction à la Grammaire de Port-Royal représentent parfaitement la position de Chomsky. «En étudiant la "linguistique cartésienne", Chomsky ne rapproche point la grammaire des classiques et la linguistique d'aujourd'hui: il entreprend plutôt de faire apparaître, comme leur avenir et leur futur lieu commun, une grammaire où ... le système de la langue ne serait pas séparable de 1' élaboration rationnelle qui permet de 1' acquérir. La grammaire cartésienne n'est plus seulement pour la linguistique actuelle une préfiguration étrange et lointaine de ses objets et de ses procédures: elle fait partie de son histoire spécifique; elle s'inscrit dans 1' archive de ses transformations. »

103

LA GRAMMAIRE GÉNÉRATIVE

C'est bien en effet la tradition rationaliste, plutôt que le cartésianisme en lui-même, que Chomsky reprend à son compte. J. Bouveresse (1979: 423) fait observer que Du Marsais, adversaire de Descartes et disciple de Locke, rejetait explicitement les idées innées. Chomsky souligne luimême que tous les esprits qu'il regroupe sous la bannière de la linguistique cartésienne ne se sentaient pas de dette particulière envers Descartes et n'adhéraient pas nécessairement aux principes du cartésianisme (La linguistique cartésienne, p. 16, note 3). Cette observation s'applique au premier chef aux grandes figures du romantisme allemand, telles que Herder, Humboldt et A.W. Schlegel, dont les théories sur le langage, surtout celles de Humboldt, tiennent une grande place dans La linguistique cartésienne. Or Humboldt était certainement plus kantien que cartésien. Chomsky précise que, par cette étiquette, il cherche surtout à caractériser «une constellation d'idées et d'intérêts, apparue d'abord dans la tradition de la "grammaire universelle" ou "philosophique", initiée par la Grammaire générale et raisonnée de Port-Royal. .. ». Le discours de Chomsky n'a de sens que si l'on admet que, dans le titre du livre, «cartésien» ne réfère pas exclusivement à Descartes et recouvre également deux autres prédicats : rationaliste et mentaliste. La résistance des philosophes américains contemporains de Chomsky, pour qui 1' empirisme est la seule philosophie scientifique respectable, à 1' approche rationaliste et naturaliste du langage et de 1' esprit s'est mani18 festée très tôt et s'exprime aujourd'hui encore avec force. On doit se souvenir aussi qu'avant eux, les membres du Cercle de Vienne et les représentants du positivisme logique, dont le projet initial était d'aligner sur le même modèle les sciences de la nature et les sciences de 1' esprit et de réaliser l'unité de la science en épurant son langage, se sont rangés sans réserve sous la bannière du béhaviorisme naissant aux Etats-Unis, après avoir critiqué le recours à l'introspection en psychologie. Il va de soi que la grammaire générative, naturaliste dans l'âme, ne pouvait non plus se recommander des philosophies de la fin du XIXe siècle, en particulier de la philosophie analytique de tradition fregéenne, clairement antinaturaliste. C'est bien à la tradition rationaliste des XVIIe et XVIIIe siècles qu'elle devait se référer quand elle se cherchait des précurseurs et une légitimité épistémologique. Aux yeux de Chomsky, les rationalistes de la période classique ont développé sur la structure et le contenu de l'esprit humain des aperçus qui sont plus éclairants que les ?

18

1974.

Voir les articles de Searle, Quine, Putnam dans le recueil publié par Harman en

104

DANS LE LABYRINTHE DU LANGAGE

thèses défendues par les empiristes et conservent encore aujourd'hui 19 toute leur pertinence philosophique et scientifique. ,....

3.2.

ETRE RATIONALISTE APRÈS DESCARTES

Il peut être intéressant de rouvrir le dossier de la linguistique cartésienne, en ne se limitant pas au livre de 1967, mais en prenant également en compte les observations parfois très développées de Chomsky sur la perspective ouverte par le cartésianisme et l'usage contemporain de Descartes, publiées dans des livres ultérieurs. On doit convenir que Descartes n'a pas lui-même tenté de construire une science naturelle du langage- etc' est certainement là l'origine de l'un des malentendus concernant La linguistique cartésienne. C'est un «petit cartésien», Géraud de Cordemoy, qui a jeté les bases d'une telle approche. Descartes n'a jamais mentionné un «organe du langage», la distinction désignée par le couple langue/parole lui est étrangère, tout comme bien sûr l'opposition entre compétence et performance. Mais, bien qu'il se soit relativement peu exprimé sur le sujet, il en dit assez, dans la cinquième partie du Discours de la méthode, pour que l'on aperçoive, à partir des observations éparses qu'il présente, ce que pourrait être une science cartésienne du langage. Descartes veut avant tout rendre compte du fait que le langage, tel qu'il est employé ordinairement dans la parole, est dégagé de tout contrôle par des stimuli externes ou des états physiologiques internes et permet d'exprimer ses pensées de façon créatrice, emploi qui ne peut être redupliqué par une machine. Est du même coup affmnée une différence irréductible entre 1'homme et 1' animal : les «bêtes», parce qu'elles sont privées de pensée, ne parlent pas et ne disposent pas d'un langage propre à forger et à exprimer des idées. C'est bien au niveau du langage et de la créativité qu'il illustre que se situe la différence entre l'homme et l'animal. Car c'est une chose bien remarquable qu'il n'y a point d'hommes si hébétés et si stupides, sans en excepter même les insensés, qu'il ne soient capables d'arranger ensemble diverses paroles, et d'en composer un discours par lequel ils fassent entendre leurs pensées; et qu'au contraire, il n'y a point d'autre animal, tant parfait et tant heureusement né qu'il puisse être, qui fasse le semblable ... Et ceci ne témoigne pas seulement

19

Mais, contrairement à ce qu'écrit W. Keith Percival (1972), je ne crois pas que Chomsky ait essayé de «démontrer l'existence d'un mouvement intellectuel qu'il a proposé d'appeler "linguistique cartésienne"». Loin de constituer un «mouvement», les figures qu'il évoque sont plutôt des phares dans le parcours rationaliste.

LA GRAMMAIRE GÉNÉRATIVE

105

que les bêtes ont moins de raison que les hommes, mais qu'elles n'en ont point du tout (Discours de la méthode, cinquième partie, cité dans La linguistique cartésienne, p. 19).

C'est cette dimension créatrice qui force Descartes à faire référence, à côté des états physiques, à une autre substance, le «mental», c'est-à-dire 1' esprit ou la pensée ou la raison ou 1' entendement. Pour résoudre la difficuité, il faut s'intéresser à la res cogitans, c'est-à-dire à l'esprit en fonctionnement, qui s'oppose à la res extensa, qui peut être intégralement expliquée de façon mécaniste, par les figures et le mouvement, mais ne peut par elle-même rendre compte de la flexibilité et de la créativité manifestes dans l'emploi du langage. Aux yeux de Descartes- et c'est là un point de vue que la science contemporaine a définitivement réfuté seule une substance immatérielle le peut. Sur la question du dualisme, Chomsky défend une position originale. Ce qui, selon lui, donne aujourd'hui une légitimité nouvelle au projet d'une linguistique cartésienne, c'est que l'hypothèse du dualisme corpsesprit n'a plus lieu d'être. La question ontologique de la relation entre le corps et l'esprit ne peut même pas être posée, non pas parce que notre compréhension de ce qu'il faut entendre par esprit ou «mental» est encore trop limitée, mais au contraire parce qu'on ne sait pas ce qui définit une entité corporelle, c'est-à-dire la matière, le «physique». En fait, on ne le sait plus, depuis que la notion cartésienne de corps a été réfutée par la théorie deN ewton et ses découvertes sur 1' action à distance qui ont ruiné la mécanique des contacts de Descartes. On le sait d'autant moins que Newton n'a pas lui-même proposé de notion nouvelle de corps ou de matière et qu'aucune ne l'a été depuis. Il n'y a donc plus de place pour une seconde substance destinée à rendre compte de ce qui paraissait aller au-delà des bornes du mécanisme. La position de ceux qui pensent que les théories mentalistes doivent être réduites à des théories physiques pour être pleinement légitimes doit également être rejetée parce qu'elle représente une forme cachée de dualisme. En fait, contrairement à ce que soutiennent certains de ses détracteurs, la question de la réduction de l'esprit à la matière n'a, selon Chomsky, aucune place dans le débat. Les phénomènes mentaux sont des propriétés de la matière, un terme sans contenu positif défini avant examen, seulement le terme général utilisé pour référer aux composants de... 1' ensemble de la réalité concrète (Chomsky 2003: 258).

Il est donc légitime aujourd'hui de raisonner dans les termes d'un cartésianisme «modernisé», purgé de la métaphysique qui lui était originellement

106

DANS LE LABYRINTHE DU LANGAGE

associée. ° C'est bien la position exprimée par Jacques Monod à propos de la «forme» commune à toutes les langues, qui est la manifestation de principes structuraux innés, caractéristiques de 1' espèce, comme en témoigne le passage suivant cité par Chomsky (1972a). 2

Cette conception a scandalisé certains philosophes ou anthropologistes ' qui y voient un retour à la métaphysique cartésienne. A condition d'en accepter le contenu biologique implicite, cette conception ne me choque nullement (Monod 1966 : 167-168).

Raisonner dans les termes d'un cartésianisme modernisé, c'est aussi ce que fait Chomsky dans La linguistique cartésienne et dans ses écrits ultérieurs. Quelques-uns avant lui, beaucoup d'autres après lui, dans le champ de la philosophie de l'esprit et dans celui du cognitivisme, ont fait de même, bien souvent avec une rigueur moindre (il y a des usages contemporains de Descartes, dans lesquels le Descartes originel est à peine reconnaissable). Chomsky rejoint le cartésianisme sur plusieurs points. Ces convergences sont intéressantes pour nous, dans la mesure où elles nous aident à mieux comprendre pourquoi Chomsky a trouvé dans la philosophie de Descartes un écho à ses propres préoccupations. Comme je l'ai indiqué précédemment, il range lui aussi la créativité manifestée dans 1'usage de la parole au nombre des caractéristiques défmitoires du langage. Il partage avec Descartes la conviction qu'aucune autre espèce animale ne possède quoi que ce soit de comparable au langage humain, même s'il peut arriver qu'elle dispose d'un système de communication. D'un point de vue général, il admet, comme le fait 1' approche rationaliste classique, que la forme de la connaissance acquise est déterminée par des principes et des idées innées qui ne sont pas tirés de 1' expérience, n'ont pas à être appris et ont toute chance d'être universels et il s'emploie à donner du problème de la connaissance et de son acquisition une formulation très précise. Clarke (2003 : 173) observe qu'il existe un parallélisme formel entre 1' argument de Descartes appuyant l'hypothèse du dualisme ontologique et l'argument développé par Chomsky en faveur des structures linguistiques innées. Chomsky fait l'hypothèse de l'innéisme parce que, en 1' absence d'équipement préalable, on ne peut tout simplement pas expliquer comment 1' enfant humain, exposé à des stimuli limités et fragmentaires, parvient à acquérir une langue interne. Descartes fait l'hypothèse de la res cogitans parce qu'on ne peut expliquer le caractère créateur du comportement 20

Sur les usages contemporains de Descartes, on peut consulter Kolesnik-Antoine 2013.

LA GRAMMAIRE GÉNÉRATIVE

107

linguistique des humains en termes purement mécanistes. On doit donc postuler une substance d'une autre nature que la res extensa, dont les propriétés ne sont pas accessibles à une explication de type mécaniste. Mais, outre l'opposition esprit/corps et la question du dualisme, d'autres aspects du cartésianisme demandent à être amendés ou abandonnés. Chomsky souligne lui-même certains d'entre eux. Descartes, selon qui il est plus facile de connaître 1' esprit que le corps, introduit 1' idée, absolument nouvelle au XVIIe siècle, que tout ce qui pour nous aujourd'hui relève du mental peut faire l'objet d'une observation quasi-scientifique par un oeil interne, situant ainsi la théorie de la connaissance au coeur de l'interrogation philosophique. Chomsky réalise une partie de ce programme, parfois contre Descartes lui-même, en concentrant son effort sur un domaine en apparence facile à circonscrire. Mais, contrairement à Descartes, il ne croit pas possible de construire une théorie explicative des phénomènes mentaux sans que soit établie une «distance psychique» avec les faits qu'il s'agit de décrire. Le plus grand défaut de la philosophie classique de l'esprit, qu'elle soit rationaliste ou empiriste, me semble être la conviction enracinée que les propriétés et le contenu de l'esprit sont accessibles à l'introspection ... Les études linguitiques poussées qui ont été menées dans le sillage du rationalisme cartésien ont pâti de ne pas avoir mesuré le caractère abstrait des structures «présentes dans 1' esprit» quand un énoncé est produit ou compris ou la longueur et la complexité de la chaîne d'opérations qui relient les structures mentales exprimant le contenu sémantique de l'énoncé à sa réalisation physique (Chomsky 1968: 22).,

Descartes présente également l'ensemble des facultés mentales comme la manifestation d'une disposition unique de la res cogitans. Pour Descartes, 1' esprit ne relève pas du monde biologique et il semble qu'il lui apparaissait uniforme et indifférencié. «Car il n'y a en nous qu'une seule âme, et cette âme n'a en soi aucune diversité de parties» Les passions de l'âme, article 47. «L'esprit, ou l'âme de l'homme, ne se peut concevoir que comme indivisible» Abrégé des six méditations (Chomsky 1980a: 32).

Il s'agit en fait pour lui d'opposer l'unité et l'indivisibilité de l'esprit à la divisibilité de la matière, une position que partagent tous les philosophes «spiritualistes» depuis Saint Augustin. Or ce que nous apprennent les neurosciences contemporaines, c'est d'une part que les rapports entre processus mentaux et structures cérébrales sont beaucoup plus complexes qu'on ne le supposait jusqu'alors, d'autre part que l'esprit-cerveau

108

DANS LE LABYRINTHE DU LANGAGE

humain est, dans un sens qui reste à préciser, «divisible». On peut, à la suite de Changeux & Dehaene (1991), parler, pour le langage comme pour les autres systèmes biologiques, d'une pluralité de «niveaux d'organisation fonctionnelle», constitués de couches superposées, articulées les unes aux autres, reposant chacune sur une base anatomique particulière ou, comme Gallistel (1999), concevoir l'esprit-cerveau comme un complexe modulaire d'organes spécialisés. Ces deux positions ne sont ni totalement incompatibles, ni pleinement équivalentes. Chomsky reprend la seconde. Il considère l'esprit-cerveau comme un «système biologique spécifique, pourvu de composants et d'éléments divers, justiciable du même traitement que les autres aspects du monde naturel». Il existe en particulier selon lui une compétence cognitive innée, spécialisée dans 1' acquisition et le maniement du langage.

3.3.

PARENTÉ

Il existe entre la pensée de Descartes et les conceptions de Chomsky une parenté plus profonde, qui se marque par une attitude générale vis-àvis de la science et de son rapport à la métaphysique. Descartes, Pascal, Leibniz appartiennent à cette famille d'esprits relativement restreinte dans laquelle les mêmes individus étaient à la fois mathématiciens et physiciens et s'intéressaient de surcroît au fonctionnement de 1' esprit et à 1' origine de la connaissance. De fait, plusieurs oeuvres majeures de la philosophie classique ont été écrites par des chercheurs de haut niveau qui participaient eux-mêmes directement à la création de savoirs nouveaux. Tous les scien21 tifiques de l'époque n'avaient pas cette double appartenance. Touchant la relation entre science et métaphysique chez Descartes, les avis des commentateurs diffèrent. Pour certains, la métaphysique a la première

21

Galilée, s'il a inventé la notion de loi de la nature, a peu écrit sur 1' esprit et sur le langage, à l'exception d'un passage du Dialogo sopra i due massimi sistemi del monda de 1632, où il se dit à la fois étonné et émerveillé que la pensée puisse être transmise dans 1' espace et dans le temps par le simple recours à un alphabet. Chomsky (20 17) met en parallèle ce texte avec un passage de la Grammaire de Port-Royal (début du chapitre premier de la seconde partie), écrite un peu moins de 30 ans plus tard, qui contient une observation analogue. Avec plusieurs différences importantes, cependant: la référence n'est plus à l'alphabet, mais, de façon insistante, aux sons qu'il représente et qui permettent la création d'une «infinie variété de mots»; ces mots, précisent les auteurs, n'ont «rien de semblable en eux-mêmes à ce qui se passe dans notre esprit. » Il y a là sous forme embryonnaire l'amorce de plusieurs concepts linguistiques contemporains : existence d'un système phonétique, créativité, arbitraire du signe. Chomsky choisit d'ignorer ces différences quand il parle de « Galilean challenge.»

LA GRAMMAIRE GÉNÉRATIVE

109

place dans son oeuvre. Pour d'autres, Descartes a été avant tout un savant, un physicien, et il ne s'est occupé de métaphysique que pour faire entrer sa pensée scientifique, en particulier sa théorie du mouvement, dans les cadres conceptuels et spirituels de son époque. En fait, même si le Descartes philosophe doit aujourd'hui être dissocié du Descartes savant, on peut admettre qu'à l'époque, et aux yeux de Descartes lui-même, le savant avait la préséance sur le philosophe. On a souvent le sentiment, en lisant Chomsky, qu'il se considère comme appartenant à cette famille d'esprits, celle des savants qui sont aussi philosophes. Même s'il n'a à aucun moment pensé prendre place parmi les philosophes de son temps, il n'écarte jamais l'enquête ontologique comme une recherche qui serait sans objet, il engage volontiers le débat avec les philosophes et les psychologues pour défendre sa position contre les points de vue empiristes et extemalistes et il n'exclut pas la possibilité que l'étude du langage, quand elle aura suffisamment progressé, puisse conduire à une modification radicale ou à l'abandon de certaines positions courantes en philosophie. Mais c'est bien sur la science contemporaine qu'il entend imprimer sa marque. En conclusion. Même si un écart considérable subsiste entre les deux pensées, encore accentué par la différence inévitable entre les cadres de référence dans lesquels elles s'inscrivent, la revendication d'héritage que représente La linguistique cartésienne n'est pas déplacée. Il y a beaucoup plus que de simples traces de cartésianisme dans la pensée de Chomsky. Il propose d'étendre le cartésianisme à un domaine minoré et marginal dans le système de Descartes, celui de l'étude du langage et de la grammaire. Cette extension s'accompagne inévitablement d'aménagements et d'altérations de la pensée originelle du savant-philosophe. La nécessité d'adopter un cartésianisme modernisé tient aussi au fait que, depuis le XVIIe siècle, des progrès considérables ont été accomplis dans les sciences de la nature. Bien sûr, une fois mis hors jeu le problème corpsesprit et éliminé l'obstacle épistémologique que représente le dualisme pour un traitement naturaliste du langage, rien n'exclut de privilégier l'esprit dans l'explication des phénomènes psychologiques et mentaux. C'est bien la stratégie poursuivie par Chomsky. En écrivant La linguistique cartésienne, Chomsky a donc fait doublement oeuvre de novateur: il a remis au goût du jour le rationalisme, en discrédit depuis le milieu du XIXe siècle, totalement ignoré de la philosophie anglo-saxonne de 1' époque, et il a rappelé, avec plusieurs décennies d'avance, la pertinence de la pensée cartésienne et son originalité dans la construction d'une philosophie de la connaissance et d'une philosophie de 1' esprit. Ce faisant, il a assuré à la linguistique une position privilégiée

110

D ANS LE LABYRINTHE DU LANGAGE

dans l'ensemble des sciences que l'on désigne aujourd'hui sous l' étiquette de «sciences cognitives». En même temps, sa recherche montre que les voies par lesquelles le projet de Descartes peut être réalisé sont radicalement différentes de celles que ce dernier avait imaginées.

4.

L'EMPIRISME DE DAVID HUME

Rationaliste paradoxal, Chomsky se réfère à plusieurs reprises dans ses écrits au philosophe qui, à l'époque moderne, a poussé l'empirisme et le 2 scepticisme jusqu'à leurs plus extrêmes limites: David Hume? Qu'est-ce qui a séduit Chomsky dans cette «oeuvre extrêmement difficile et subtile», pour reprendre les termes de Gilles Deleuze? Une première indication est fournie par l'observation que Chomsky est beaucoup moins sévère à l'égard de l'empirisme classique qu'à l'égard de l'empirisme contemporain, celui de Goodman et de Quine, pour ne rien dire du béhaviorisme de Skinner. Ce qui suggère que, de façon générale, Chomsky s'oppose moins à 1' empirisme en tant que tel, qu'à ses variantes antimentalistes et béhavioristes. Ni l' antimentalisme, ni le béhaviorisme ne sont des composantes dominantes de la pensée de Hume. On peut aussi observer que l'empirisme de Hume dépasse l'opposition entre empirisme et rationalisme et recouvre d'autres questionnements tout aussi fondamentaux. Puisque expliquer scientifiquement un phénomène, c'est selon lui l'interpréter comme l'effet d'une cause ou comme la cause d'un effet, Hume s'interroge sur la causalité. Or «la causalité pose bel et bien à 1' empiriste le problème de savoir comment il est possible de dépasser ainsi le strict plan de l'observationpuisqu'on ne voit jamais ni une cause ni un effet, mais seulement des phénomènes contigus ... » (voir Besnier 2005: 39-40). Et poussant plus loin son questionnement, Hume se demande comment est acquise la connaissance de la cause et de l'effet. Puisque, d'un point de vue empiriste, c'est nécessairement 1' expérience qui donne la réponse, on doit aussi se demander d'où vient la crédibilité qu'on lui accorde. Ces questions se posent à 1' empiriste, mais elles ne peuvent être ignorées du rationaliste. C'est à des questionnements de ce type, plutôt qu'aux réponses que Hume leur apporte, que Chomsky semble être sensible, et c'est en eux qu'il trouve un écho de ses propres préoccupations. Il semble que les deux conjectures qui viennent d'être avancées- (i) il existe plusieurs versions de l' empirisme ; (ii) 1' empirisme soulève des questions qui intéressent aussi le rationalisme- aient l'une et l'autre leur part de vérité. 22

Voir Chomsky 1975: 22, 265-267, Chomsky 1977a: 98, Chomsky 1980a: 187.

LA GRAMMAIRE GÉNÉRATIVE

111

De fait, on constate que par beaucoup d'aspects, le point de vue de Chomsky ne s'écarte pas dramatiquement de la perspective ouverte par Hume. Quatre points peuvent être retenus. (i)

Tout d'abord, Hume s'intéresse à la nature de l'esprit et aux principes mentaux qui le structurent. Il a construit une théorie d'une remarquable cohérence touchant« les sources cachées et les principes qui fondent les opérations de 1' esprit humain». Selon lui, des principes spécifiques existent qui sont dérivés «de la main originale de la nature» et constituent une «sorte d'instinct naturel», «un instinct ou une tendance 23 mécanique ». C'est certainement là l'aspect de la pensée de Hume qui a le plus séduit Chomsky, même s'il reconnaît qu' Il n'y a aucune raison de croire aujourd'hui que les principes de Hume ... sont adéquats pour rendre compte de 1' origine de nos idées ou de nos savoirs et croyances, ni de croire qu'ils aient une quelconque pertinence (Chomsky

1977a: 98)? 4

(ii) Dans le Traité de la nature humaine (1739-1740), Hume présente la philosophie comme la science de la nature humaine, science capitale jusqu'ici négligée selon lui, au bénéfice des sciences de la nature. La connaissance de 1'homme doit elle aussi se fonder entièrement sur «l'expérience et l'observation», en empruntant la méthode expérimentale, typique des sciences de la nature depuis Bacon. Hume considère que son projet s'inscrit directement dans la lignée de celui de Newton. Chomsky présente lui-même son travail comme relevant d'un projet post-newtonien.

23

Hume cherche à mettre en évidence ce qui, dans le jugement, ne relève pas de la seule faculté de juger et fait jouer à l'imagination, à l'habitude et à l'instinct un rôle plus décisif qu'à la raison. Ces capacités, selon lui, sont aussi puissantes chez l'homme que chez l'animal, qui acquiert lui aussi une grande partie de ce qu'il sait par l'expérience et l'observation et partage avec l'homme le raisonnement expérimental. On sait que l'éthologie cognitive non seulement attribue aujourd'hui des croyances aux animaux, mais admet aussi l'existence d'une connaissance animale. 24 On ne doit pas oublier non plus la phrase par laquelle Chomsky commence sa contribution au recueil Words and Objections, qui est une critique vigoureuse du Words and Objects de Quine. «Le développement le plus clair et le plus explicite de ce qui apparaît être une théorie étroitement humienne de l'acquisition du langage dans la philosophie récente est peutêtre celui de Quine dans les chapitres introductifs de Ward and Object», voir Chomsky

1969: 53. Ailleurs, il insiste sur un trait qui distingue radicalement 1' innéisme de Descartes de 1' empirisme de Hume. Si 1' on suit Descartes, un enfant à qui 1' on présente un triangle plus ou moins grossièrement dessiné perçoit immédiatement dans cet objet la figure géométrique parfaite que l'on désigne sous l'étiquette de «triangle» et qui fait partie des connaissances innées. Si 1' on suit Hume, il n'existe pas dans 1' esprit de concept de triangle ou de ligne droite. L'enfant ne perçoit rien d'autre que l'objet imparfait que lui livre l'expérience sensible.

112

DANS LE LABYRINTHE DU LANGAGE

(iii) Une autre proposition fondatrice de Hume est 1' affmnation que le matériau originel à partir duquel pourront être dégagés les principes de la science de 1'homme sont les impressions simples et les idées, non pas leur base matérielle, quelle qu'elle soit. (iv) L'adoption de la méthode naturaliste et expérimentale va enfm de pair avec le rejet de la métaphysique. L'existence de Dieu, l'immortalité de 1' âme sont des questions qui se trouvent exclues du domaine du raisonnement a priori, que Hume refuse, mais aussi de celui du raisonnement par inférence a posteriori, dépourvues qu'elles sont à la fois de nécessité logique et de bien-fondé expérimentaL Le scepticisme de Hume rejoint le hypotheses nonfingo de Newton qui s'est toujours refusé à spéculer sur les principes, les essences, l'absolu et s'est contenté de faire oeuvre de science en recherchant et en découvrant ce qui est vérifiable et reproductible.

En bref, dans sa recherche des lois de la pensée, Hume s'est constamment attaché à montrer que 1' essentiel de 1' explication concernant les principes permettant la construction de la connaissance et 1' acquisition des savoirs est à chercher non pas dans les objets eux-mêmes, dans la structure du monde, mais dans celle de l'esprit. Origine des principes dérivés de la «main originale de la nature», primauté des impressions et des idées sur leur base matérielle, insuffisance du raisonnement par inférence, importance de la méthode expérimentale et méfiance vis-à-vis de la métaphysique: il n'y a rien là à quoi Chomsky ne pourrait souscrire. Il faut se garder cependant des rapprochements artificiels et exagérément simplificateurs. L'instinct naturel auquel Hume fait référence ne se confond pas avec les idées innées, ni avec l'équipement génétique. D'autre part, là où Descartes voyait deux substances, là où Chomsky affmne 1' existence d'une substance unique, Hume ne distinguait qu'une série mouvante de perceptions, «un amas ou une collection de perceptions différentes ... », un point de vue qui peut intéresser les chercheurs travaillant sur la nature de la conscience, mais qui est totalement étranger à la recherche linguistique. On sait enfin qu'aux yeux de Chomsky, il est nécessaire, pour progresser, de bannir toute conception a priori de l'uniformité du cerveau, que l'on trouve aussi bien chez Descartes que chez Hume, et d'étudier séparément les diverses structures cognitives développées par les humains, en isolant les principes qui règlent le fonctionnement de chacune, avant de tenter de comprendre les fondements de leur acquisition. Rappelons que pour Chomsky, le cerveau, loin d'être unitaire, est constitué de plusieurs 25 organes mentaux, spécialisés et parfaitement différenciés. 25

Voir la section 3.2 de ce chapitre. Ce point est affirmé dans Chomsky 1977a.

LA GRAMMAIRE GÉNÉRATIVE

5.

113

CHOMSKY ET L'EMPIRISME CONTEMPORAIN

Dans un passage de The Logical Structure ofLinguistic Theory (désormais abrégé en LSLT), Chomsky fournit lui-même des indications précieuses sur le rôle de la philosophie dans son développement intellectuel. C'est à l'instigation de Harris que j'ai suivi des cours de logique, de philosophie et des enseignements portant sur les fondements des mathématiques, alors que j'étais étudiant de doctorat à 1'Université de Pennsylvanie et, ensuite, à Harvard. J'ai été particulièrement impressionné par le travail de Nelson Goodman sur les systèmes constructionnels. Par son caractère général, ce travail était dans une certaine mesure semblable à celui de Harris. et m'a semblé fournir l'arrière-plan intellectuel approprié pour l'investigation des procédures taxinomiques que je considérais alors comme centrales pour la théorie linguistique. Mais la critique de Goodman sur l'induction semblait pointer dans une direction assez différente, suggérant 1' inadéquation en principe des approches inductives. La critique de Quine de 1' empirisme logique donnait à penser que cette voie d'approche était plausible. Quine soutenait que les principes d'une théorie scientifique sont confrontés à 1'expérience comme un ensemble complexe, avec des ajustements possibles en divers points, gouvernés par des facteurs tels que la simplicité (LSLT, p. 33).

Tentons de préciser ce qui a pu susciter l'intérêt du jeune Chomsky pour ces deux philosophes, l'un et l'autre ses aînés d'une quinzaine d'années et déjà figures majeures de la philosophie américaine. 5 .1.

CHOMSKY ET GooDMAN

Nelson Goodman, que Chomsky a rencontré à 17 ans, alors qu'il n'avait aucune formation philosophique, et qu'il qualifiera plus tard d'« empiriste austère», a introduit la notion de système constructionnel dans son livre le plus célèbre, La structure de l 'apparence (1951 ). En simplifiant à 1'extrême, on peut dire qu'un système constructionnel est une théorie dont les théorèmes sont formulés dans les termes d'un vocabulaire de base et d'un appareil logique minimal, qui vise à cartographier un domaine de connaissance, un savoir scientifique par exemple, en isolant les relations structurelles entre les éléments qui le constituent. Cette reconstruction méthodique et rigoureuse des assertions antérieures rend le système accessible à la réfutation. L'essentiel est que «la reconstruction soit non pas vraie, en correspondance avec une réalité extérieure, mais correcte» (Morizot & Pouivet 2011: 93-94), au sens où tout doit être transparent et justifié. Et ce qu'il s'agit de retrouver finalement, ce

114

DANS LE LABYRINTHE DU LANGAGE

n'est pas le monde, mais «les apparences, c'est-à-dire l'organisation ordonnée de nos représentations». Les qualités premières d'un système constructionnel sont la consistance logique, la clarté et la simplicité. Selon les commentateurs, «simplicité» désigne ici «une valeur ontologique consistant à développer un système n'affirmant pas l'existence de plus de types d'entités qu'il n'est nécessaire, c'est-à-dire encourageant à respecter un principe d' économie ontologique» (Morizot & Pouivet 2011). Rejetant la multiplication indue des entités autorisées par la théorie des ensembles, refusant la possibilité d'une ontologie des classes, Goodman propose, dans le même livre, de substituer au calcul des classes un calcul des individus, et construit une logique extensionnelle des touts et des parties, dans laquelle tous les prédicats impliqués s'inscrivent dans un seul type logique, la relation être une partie de. On peut, dans un premier temps, reprendre la conclusion de Tomalin sur la relation entre Goodman et Chomsky au début des années 50 et retenir qu'à cette époque, Chomsky percevait un lien étroit entre la méthodologie suivie par la théorie des systèmes constructionnels initiée par Goodman et les techniques distributionnelles employées par Harris dans l'analyse syntaxique et morphologique. Face au «nihilisme théorique» de ce dernier et à son indifférence touchant l'économie interne des théories, Chomsky a tenté dans un premier temps d'introduire dans un cadre analytique de type harrisien des critères de simplicité, tels que Goodman les concevait, s'attachant à combiner la méthodologie de la linguistique structurale avec les techniques dérivées de la théorie des systèmes constructionnels. Cette démarche, illustrée par son article de 1953 dans le Journal ofSymbolic Logic, témoigne de son exceptionnelle facilité à importer dans un domaine les techniques de description en usage dans un autre. Cette importation, il est vrai, n'a été possible que parce qu'il avait acquis dans le maniement des systèmes logiques et des langages artificiels une grande virtuosité. Mais Chomsky se persuade ensuite que cette tentative ne mène nulle part. Et, avec l'article de 1956, il inaugure une nouvelle stratégie de recherche, dans laquelle ne subsiste de la philosophie de Goodman que la recherche de la simplicité dans la construction des systèmes. Dans ses entretiens avec McGilvray, Chomsky (2012: 86-92) revient sur sa relation avec Goodman et sur le parti qu'il a tiré de son projet intellectuel pour la construction d'une théorie de la syntaxe. Un trait remarquable de ce projet, on s'en souvient, est le rejet des entités abstraites comme les ensembles. Cette décision a pour résultat qu'une structure,

LA GRAMMAIRE GÉNÉRATIVE

115

aussi étendue soit elle, doit être analysée exclusivement sur la base des éléments qui la constituent. Les phrases d'une langue doivent donc être manipulées comme des suites finies de symboles. Plus précisément, les entités linguistiques, dans le système de Goodman, se réduisent à des inscriptions particulières, c'est-à-dire à des événements de durée plus ou moins longue. Chomsky regrette que Goodman n'aitjamais été très explicite sur la façon de représenter ces inscriptions. Surtout, il est resté, tout au long de sa carrière, fidèle à la théorie des ensembles que Goodman rejetait, tout en étant conscient que, d'un point de vue biologique, les phénomènes pour lesquels la théorie des ensembles est invoquée doivent pouvoir être traduits en des termes susceptibles d'avoir une réalisation neurologique (puisque «nous n'avons pas d'ensembles dans la tête»). Un autre trait du projet de Goodman est la recherche, dans les phénomènes ou les systèmes, de la simplicité (ou de 1' élégance, ou de 1' austérité ... ), dimension essentielle de la recherche dans les sciences de la nature. Cette vertu cardinale des systèmes constructionnels est intervenue directement dans la construction des premières théories syntaxiques de Chomsky. Goodman, selon lui, était à la recherche d'une notion absolue de simplicité, opérante dans tous les domaines du savoir, avec l'idée que «la recherche de la simplicité dans la théorie n'est pas différente de la recherche de la théorie elle-même». Mais Chomsky souligne que parallèlement à cette notion, il en existe une seconde, qui équivaut à une mesure de simplicité interne à la théorie et impose au linguiste de montrer que «le système grammatical particulier qui est développé est un minimum relatif en termes de simplicité». Cette notion, qui n'est absolument pas celle défendue par Goodman, est néanmoins inspirée par son concept de simplicité absolue. Elle est en réalité très proche de la conviction de Galilée que la nature est simple. Plus généralement, il semble qu'aux yeux de Chomsky, aussi bien touchant la notion de simplicité que le rejet de la notion d'ensemble, le niveau d'exigence imposé par les critères de Goodman était trop élevé et qu'il était nécessaire de 1' abaisser pour progresser. 5.2.

CHOMSKY ET QUINE

Dans le passage précédemment cité de LSLT, Chomsky cite le philosophe Willard van Orman Quine comme l'une de ses premières inspirations. Bien qu'elle ne puisse être comparée à celle de Goodman, l'influence de Quine dans l'élaboration de la Grammaire Générative est bien réelle. Il ne fait guère de doute, comme Chomsky le confirme lui-

116

DANS LE LABYRINTHE DU LANGAGE

même dans l'extrait de LSLT cité plus haut, que son rejet de l'empirisme logique a été favorisé par l'assaut mené par Quine contre ce mouvement de pensée dans l'article fondateur Two Dogmas ofEmpiricism publié en 26 1953. Vont de pair avec ce rejet une interrogation sur la validité des procédures de découverte taxinomiques en usage chez les successeurs de Bloomfield et leur abandon au profit de procédures d'évaluation. Dans le même texte, Quine déplorait les méthodes «inutilement et intolérablement restrictives» requises par les formes les plus extrêmes de 1' empirisme logique, un grief qui, selon Tomalin (2006 : 15 5), a sans aucun doute trouvé un écho dans la pensée du jeune Chomsky. Les deux personnalités semblent avoir éprouvé un grand respect mutuel, même si leurs échanges ont souvent été entravés par de grossiers malentendus. Mais leurs posi27 tions respectives étaient et sont inconciliables. On peut dégager, pour amorcer la discussion, quelques points de divergence majeurs. (i)

(ii)

(iii)

(iv)

(v)

26

Chomsky s'attache à théoriser le langage comme une réalité mentale, donc comme un objet du monde naturel et la Faculté de Langage comme un aspect de la cognition humaine; Quine promeut un empirisme certes fortement amendé, mais qui maintient la thèse que 1' expérience sensible du monde est la seule source ultime de connaissance, une position clairement incompatible avec le mentalisme et avec 1' essentiel des thèses cognitivistes. Chomsky admet la possibilité de postuler des objets mentaux internes, atomes de la computation, semblables à des mots; Quine exlut absolument cette possibilité, comme celle de représentations mentales en général. Pour Chomsky, un équipement inné est ce qui rend possible et explique 1' apprentissage du langage; pour Quine, 1' apprentissage des normes linguistiques est le résultat de 1' apprentissage lui-même. Chomsky cherche constamment à démarquer la science du langage des autres sciences, même si elle en adopte les méthodes, ne manquant jamais d'insister sur les problèmes spécifiques qu'elle pose; Quine considère que toutes les sciences sont mutuellement imbriquées. Selon Quine, la science est un prolongement du sens commun, et elle reprend à son compte la tactique du sens commun de gonfler 1' ontologie 28 pour simplifier la théorie (Quine 1953: 45)

Sur ce point, voir Tomalin 2006: 151-152. 27 Sur la controverse entre Quine et Chomsky, voir Chomsky 1969, Quine 1969, Quine 1972, Chomsky 1975: 215-243. Les philosophes de langue française se sont intéressés au débat entre Quine et Chomsky, voir en particulier J. Bouveresse 1971, Gochet 1978, Jacob & Pollock 1979, Jacob 1989, Laugier 1992, 2002, 2004. Cette section doit beaucoup à leurs observations. 28 La pagination est celle de la deuxième édition américaine de From a Logical Point of view, New York, Harper et Row, 1961.

LA GRAMMAIRE GÉNÉRATIVE

117

Pour Salanskis, qui commente la position de Quine, un constituant essentiel du regard analytique sur les sciences est en effet l'idée que les sciences contemporaines ne sont jamais que la complication, la sophistication et la professionnalisation d'un déchiffrement du monde par le langage dont le sens commun est le dépositaire (Salanskis 2016: 87).

A l'inverse, dans la conception de la science défendue par Chomsky, la rupture avec le sens commun apparaît comme un trait nécessaire et définitoire de la science contemporaine.

5.2.1. Holisme méthodologique Sandra Laugier souligne que les différentes thèses de Quine «forment un véritable système dans lequel elles dérivent les unes des autres et au sein duquel elles forment une circularité qui est, pour Quine, la preuve de la solidité du système» (voir Laugier-Rabaté 1992). Cela signifie que l'ordre dans lequel on les expose importe peu. Cela signifie aussi qu'il est difficile de se référer à une thèse sans évoquer les autres. Ces thèses philosophiques sont célèbres. Nous concernent plus particulièrement la sous-détermination des théories scientifiques par 1' expérience, 1' indétermination de la traduction, la naturalisation de l'épistémologie, le holisme méthodologique. Il faut bien admettre que sur un point fondamental, la distance entre Quine et Chomsky est tout sauf considérable. Les conceptions qu'ils se font l'un et l'autre du rapport de la science à la vérité et à la réalité ne sont pas si éloignées qu'elles paraissent. Quine s'oppose au dogme du réductionnisme qui pose qu'à chaque proposition d'une théorie scientifique peut être associée une méthode de vérification. Les propositions ne sont pas vraies individuellement, mais collectivement. Dans Deux dogmes de l 'empirisme, il écrit que «nos assertions sur le monde extérieur affrontent le tribunal de l'expérience non pas individuellement mais collectivement» 9 (voir p. 41 )? L'unité de signification empirique est donc la science prise comme un tout. Quine généralise ici une thèse de Duhem qui écrivait au début du siècle dernier qu'une proposition de la physique ne peut être validée ou invalidée isolément et n'affronte pas seule le tribunal de l'expérience. Cette critique de 1' expérience cruciale, son holisme ont fait dire à Lakatos que Duhem était le premier à avoir compris que «nous ne pouvons ni prouver les théories, ni les réfuter». Bref, la seule unité qui, 29

Voir la note précédente.

118

DANS LE LABYRINTHE DU LANGAGE

aux yeux de Duhem et de Quine, ait une signification empirique, c'est la science ou la connaissance dans son entier. Chomsky partage pleinement ce point de vue. Il n'a cessé de répéter qu'une théorie linguistique, pas plus que les théories portant sur d'autres objets du monde naturel, ne peut être falsifiée par une observation isolée: elle doit être réfutée par une théorie concurrente, intégrant les données traitées par la théorie antérieure et rendant compte de données nouvelles.

5. 2. 2. Sous-détermination des théories et indétermination de la traduction Deux des thèses de Quine ont une incidence directe sur plusieurs questions essentielles touchant la façon d'aborder le langage et de construire des grammaires : 1' indétermination de la traduction et la sous-détermination des théories par 1' expérience. Comme y insiste Laugier, il y a deux versions de la seconde, une version modérée, qui n'est que «l'expression de la distance qui sépare 1' expérience et la formulation théorique», et une version théorique selon laquelle, «au système du monde que nous avons adopté, correspondraient des théories ou systèmes rivaux, empiriquement compatibles, mais logiquement incompatibles» (Laugier 2002 : 731 ). Or c'est sur la possibilité de choix entre modèles extensionnellement équivalents que les deux pensées divergent fortement. Dans Règles et représentations, Chomsky présente la position de Quine comme suit: Quine ... affirme que si deux grammaires produisent la même langue (sont « extensionnellement équivalentes» dans sa terminologie), il n'y a aucun sens à considérer l'une comme juste et l'autre comme fausse. Peut-être y a-t-il à l'origine de cette position ... , hormis le poids de l'empirisme, le fait qu'à une langue donnée peut correspondre un grand nombre (en fait un nombre infini) de grammaires, d'où l'on peut croire, à tort, que choisir une grammaire est plus difficile (voire infiniment plus difficile, c'est-àdire impossible) que choisir une langue. Mais ... c'est là une erreur (Chomsky 1980a: 84).

Selon Quine, il n'y a pas de base conceptuelle ou empirique appuyant la décision de choisir une grammaire plutôt qu'une autre pour une langue donnée, aussi longtemps que ces grammaires sont extensionnellement équivalentes, c'est-à-dire génèrent exactement le même ensemble de phrases. Si plusieurs systèmes de règles sont compatibles avec le comportement linguistique d'un individu, on ne peut décider quel système est effectivement employé par lui. Il n'y a dans ce cas no fact of the matter. Chomsky ne peut admettre cette position, qui n'est rien

LA GRAMMAIRE GÉNÉRATIVE

119

d'autre qu'une version de l'approche extemaliste du langage qu'il rejette et qui suppose que les langues se réduisent à des ensembles de phrases et les phrases à des séquences de mots (il convient en effet de vérifier que les grammaires concurrentes génèrent bien le même ensemble de ' séquences). A ses yeux, c'est une question de fait que de savoir si la connaissance de la grammaire est représentée dans l'esprit de la façon qu['il a] esquissée, ou autrement, ou pas du tout; ou bien si cette connaissance résulte d'une espèce d' apprentissage, ou d'une réaction différenciée à tels stimuli, ou d'autre chose ... (Chomsky 1980a: 100).

Il existe bien, selon lui, des données permettant de trancher entre des systèmes extensionnellement équivalents. C'est même cette possibilité qui est sous-jacente à la distinction entre capacité générative forte et capacité 30 générative faible. On ne peut d'autre part identifier une langue avec un ensemble infini de séquences. Pour Chomsky, une langue est un système de l'esprit qui a la capacité de générer un ensemble infini de paires son/sens. Ce qui est produit par un individu au cours de son existence est tout à fait différent. Ce n'est pas une collection de séquences pouvant faire l'objet d'une approche scientifique naturaliste, mais un épiphénomène qui relève duE-langage. En fait, Quine ne semble pas faire de distinction entre langage et théorie: les deux termes sont utilisés de façon quasiment inter31 changeable dans Ward and Object. C'est ce que Chomsky (1969) reproche à Quine (1969) et que Quine, dans sa réponse, admet dans une certaine mesure, invoquant, pour expliquer cette tendance, son rejet de la distinction entre énoncés analytiques et énoncés synthétiques. On retrouve dans l'argument de Quine une autre de ses thèses les plus fameuses, celle de « 1' indétermination de la traduction». Par indétermination, il faut entendre la thèse selon laquelle, quelle que soit 1' évidence empirique réunie à l'appui d'une hypothèse, il existe toujours des hypothèses concurrentes, distinctes de la précédente, mais compatibles avec les données. Dans Règles et représentations, Chomsky écrit: Cette thèse ... s'applique non seulement aux traductions entre langues, mais aussi à l'intérieur d'une même langue, non seulement aux problèmes de signification, mais aussi à toute proposition théorique en linguistique, telle que par exemple l'hypothèse de frontières de syntagmes ... Selon Quine, il n'y a ... aucun sens à vouloir construire une théorie du langage 30

Voir note 6, chapitre IlL 31 Voir ce qui est dit de la distinction entre langage et grammaire chez Chomsky, chapitre III, section 1.

120

DANS LE LABYRINTHE DU LANGAGE

et de l'esprit qui tente d'établir que les règles de la grammaire répartissent les syntagmes de telle ou telle façon au sein des représentations mentales (Chomsky 1980a: 17-18).

De cette situation d'indétermination, Quine conclut à la difficulté, voire 1' impossibilité de construire des grammaires formelles adéquates, une conclusion, on s'en doute, totalement injustifiée aux yeux de Chomsky. Il attaque la thèse de Quine, en y voyant, selon 1' expression de Sandra Laugier, «une trivialité, la généralisation linguistique d'un argument sceptique» (voir Laugier-Rabaté 1992: 11 0). Or Quine ne fait ici que constater une nouvelle fois la sous-détermination des théories scientifiques par 1' expérience, une observation qui vaut aussi pour les théories sur le langage, qui toutes excèdent les données de l'expérience. Il existe de fait, aux yeux de certains commentateurs de Quine, une proximité conceptuelle très étroite entre 1' indétermination de la traduction et la sous-détermination des théories scientifiques. Selon Chomsky, il y a plus qu'une similitude entre elles. L'indétermination de la traduction n'est en réalité qu'un cas particulier de la sous-détermination des théories scientifiques, centrée sur un domaine particulier des sciences de la nature, la linguistique. Or cette thèse est, aux yeux de Chomsky, à la fois vraie et 32 dépourvue d'intérêt. Quine, dans les années qui ont suivi, a répondu à cette objection, en tentant de montrer que l'indétermination n'est pas réductible à la sous-détermination, qu'en réalité elle s'ajoute à elle, même si elles sont peut-être l'une et l'autre de même nature.

5.2.3. Naturalisation de 1'épistémologie L'approche aux questions soulevées par la justification de la connaissance défendue par Quine sous le nom d'« épistémologie naturalisée» est aussi rejetée avec vigueur par Chomsky. On peut observer que Quine, comme Chomsky, prétend endosser une position naturaliste. Etc' est paradoxalement leur engagement naturaliste qui les conduit à défendre des positions distinctes et même opposées sur le langage et son apprentissage. Il est vrai que sur ce dernier point, on pourrait adopter la position accommodante de Jacques Bouveresse dans La parole malheureuse pour qui ce n'est pas sur la préexistence d'un dispositif inné d'acquisition du langage, ni sur l'importance de cette dotation originaire qu'il peut y avoir opposition réelle, mais sur son mode de préexistence, les uns préférant

32

Voir Chomsky 1969 : 61.

LA GRAMMAIRE GÉNÉRATIVE

121

parler d'« idées» ou de« concepts», les autres de dispositions comporte33 mentales innées (J. Bouveresse 1971 : 59).

Après tout, que la faculté humaine à construire et à interpréter des structures syntaxiques émerge de notre aptitude à analyser les informations linguistiques fournies par 1' expérience ou qu'elle soit directement déterminée par la configuration particulière de notre esprit et par les limitations qu'il impose au décodage de la réalité, on se retrouve en fin de compte doté d'une grammaire mentale, c'est-à-dire d'une collection, emmagasinée dans l'esprit, de concepts, de principes universels et de règles spécifiques à la langue acquise. Il reste que la forme même que prennent les grammaires et les contraintes spécifiques qu'elles doivent observer peuvent nous renseigner sur l'origine expérimentale ou innée de la Faculté de Langage. Or elles favorisent indiscutablement la seconde option. Ajoutons que l'opposition entre les deux conceptions évoquées par Bouveresse n'a rien d'anodin, elle est même fondamentale et justifie la position plus tranchée de Sandra Laugier, aux yeux de qui «toutes les thèses de Quine peuvent être modélisées à partir du schème 34 de 1' apprentissage». Or pour Quine, 1'enfant n'a pas de langage préalable et il n'apprend pas à parler tout seuL C'est en observant le comportement linguistique de son entourage qu'il apprend à tenir les énoncés analytiques pour vrais. Cet apprentissage, qui se poursuit tout au long de la vie et procède par «sédimentation» autour de quelques «dispositions» particulières, est, dans les termes de Quine, un« appren35 tissage du langage dépendant du langage». Or le langage scientifique est lui-même construit comme on apprend notre langue, qui est, par ailleurs, le schème conceptuel de la science. Il y a ici naturalisation du langage parce qu'il est objet d'apprentissage et se définit en termes sociaux. L'épistémologie elle-même est naturalisée. Il s'agit de définir la connaissance en termes naturels, sur la base de processus psychologiques (mais aussi biologiques, neurophysiologiques) qui sont du domaine des sciences de la nature. Ce que Quine veut découvrir, c'est comment se produit concrètement la connaissance, suivant quelles lois.

33

Ce passage est cité par Jacob & Pollock (1979: 764), qui qualifient de «conciliante» 1' interprétation de Bouveresse. 34 Sur l' importance de l' apprentissage dans l'épistémologie de Quine et sur les allersretours entre sa théorie de 1' apprentissage du langage et sa conception de la science, voir Laugier-Rabaté 1992: 11-12, 58-72. La science est, comme l'acquisition du langage, un processus d' apprentissage. 35 Voir Laugier-Rab a té 1992 : 18 pour une discussion.

122

D ANS LE LABYRINTHE DU LANGAGE

Or c'est la science qui impose elle-même ses propres normes, aucune norme extérieure n'est acceptable parce que c'est la science elle-même qui est le tribunal suprême de la vérité. L'épistémologie n'a donc pas pour objet de justifier ou de fonder la science, elle n'est pas extérieure à la science, mais appartient elle-même à l'ensemble des sciences. Cette attitude, selon Laugier (2004: 32), marque une rupture par rapport à l'épistémologie des années 30, pour qui la question centrale était celle du fondement de la théorie de la connaissance dans 1' expérience ou dans les structures de 1' esprit, non pas celle du mode d 'acquisition des connaissances et des croyances. Chomsky considère la naturalisation de l'épistémologie opérée par Quine comme une erreur fondamentale. On ne perçoit pas immédiatement les raisons de ce rejet. Faute d'une explication plus satisfaisante, on peut penser qu'elles doivent être cherchées dans le rôle que Quine fait jouer à la psychologie dans la justification de la connaissance. On peut ici reprendre une distinction proposée par Kornblith (1985) entre deux façons d'aborder les questions épistémologiques relatives à la constitution des savoirs. La science est généralement considérée comme une sorte de croyance vraie justifiée. Or, pour les uns, la croyance dans un contenu de connaissance ne peut être justifiée que par la qualité des arguments que 1' on peut invoquer en sa faveur ou par la cohérence de la relation qu'une proposition en attente de justification entretient avec d'autres propositions considérées comme justifiées. Pour les autres, on ne peut faire dépendre une croyance d'autres croyances sans s'interroger sur les processus responsables de l'existence de ces croyances. Or ces processus sont de nature psychologique. La deuxième position sous-tend l'idée de la naturalisation de l'épistémologie. De toute évidence, Chomsky n'a d'autre choix que d'adopter la première. Si, à ses yeux, l'épistémologie ne peut être naturalisée, c'est parce que la naturalisation doit faire référence à la psychologie (comment naissent effectivement les coyances vraies dans l'individu?), une psychologie qui est nécessairement à ses yeux d'essence empiriste, béhavioriste même, donc disquali36 fiée d'emblée. Le naturalisme en tant que tel n'est donc pas directement en cause dans la position de Chomsky. Ce qu'il refuse surtout, c'est un naturalisme qui emprunte la voie du béhaviorisme. Il y a d'autres formes de natura-

36

Mais, comme me le fait observer Benjamin Spector, le texte de Quine est libre de tout engagement envers une théorie psychologique particulière.

LA GRAMMAIRE GÉNÉRATIVE

123

lisme, libres de tout engagement béhavioriste. Le naturalisme peut en particulier s'accommoder d'une position rationaliste. Et, comme le répète Chomsky, l'expérience donne tort à l'empirisme. Les mécanismes rudimentaires d'apprentissage qu'il postule« sont intrinsèquement incapables de produire les systèmes de connaissance grammaticale qu'il faut attribuer au sujet parlant une langue» (voir Chomsky 1965: 79). Il vaut la 37 peine de citer Otero sur ce point. Il fallut plusieurs années à Chomsky pour se rendre compte qu'aucun processus inductif jamais proposé ne pouvait conduire, à partir du type de données dont l'enfant dispose, aux principes du niveau d'abstraction requis par la théorie du langage. Ce qui ne peut signifier qu'une chose, c'est que ces principes ne sont pas déterminés à partir de ces données par quoi que ce soit qui ressemble à de l'induction, conclusion qui contraste nettement avec la position de Quine selon laquelle «la philosophie de la logique inductive ... ne se distingue en rien de la tige principale de la philosophie, la théorie de la connaissance», comme ill' écrit dès la première ligne de sa Philosophy ofLogic (Otero, «Chomsky and the Rationalist Tradition», p. 4, in Otero, No am Chomsky 2: 1-27).

Il y a, on le voit, touchant la nature de 1' apprentissage un désaccord profond entre Chomsky et Quine. Pour ce dernier, les mécanismes grammaticaux qui rendent possible la production d'énoncés et les normes qui l'accompagnent sont appris avec le langage lui-même. Chez Chomsky, ces mécanismes et ces normes font partie de l'équipement inné interne à 1' esprit, qui précède l'apprentissage et le guide. La réflexion rationaliste a fait l'hypothèse que la forme générale d'un système de connaissance est fixée par avance comme une disposition de l'esprit, et que la fonction de l'expérience est d'amener cette structure schématique générale à se réaliser et à se différencier plus pleinement (Chomsky 1965: 75).

En conclusion, c'est une dimension bien précise de la philosophie de Quine qui explique le rejet par Chomsky de l'épistémologie naturalisée et qui, plus généralement, est à l'origine de l'interminable controverse qui a opposé Quine et Chomsky. La philosophie de Quine est certes naturaliste, mais elle ne peut se comprendre qu'en référence à son empirisme foncier, qui va de pair avec une position sur la philosophie du langage que Chomsky ne peut que récuser : le béhaviorisme.

37

Ce texte est cité par Barsky (1997). Je reprends ici la traduction qui en est donnée dans l'édition française, voir Barsky 1998: 105-106.

124

6.

D ANS LE LABYRINTHE DU LANGAGE

CoNCLUSION

Comme Hinzen (20 12: 117) l'a bien mis en évidence, «l'entreprise générative, du fait de sa perspective non fonctionnaliste sur 1'esprit, demeure une tentative rationaliste isolée dans un demi -siècle qui, virtuellement, a exclusivement favorisé les courants empiristes, pragmatiques ou herméneutiques». Et de fait, il est difficile d'imaginer un écart plus grand que celui qui sépare la philosophie anglo-saxonne de la deuxième moitié du xxe siècle et l'approche chomskyenne du langage et de 1' esprit. Les traits les plus saillants de 1' approche chomskyenne s' opposent aux choix philosophiques dominants de l'époque. Et la caractérisation du langage comme un système de connaissance, l'hypothèse de 1' innéisme, le recours généralisé à des entités abstraites non directement accessibles à l'observation, l'importance essentielle accordée à la dimension créatrice du langage et la quasi-ignorance du processus de performance font de l'entreprise générative un nouveau chapitre de la pensée rationaliste. Hinzen (2012: 121) écrit que Chomsky combine «une position internaliste touchant l'objet d'étude avec une attitude neutre du point de vue métaphysique et une méthodologie naturaliste». Revenons brièvement sur chacun de ces points. La position internaliste de Chomsky s'oppose à la conception des empiristes, en particulier à celle des béhavioristes, pour qui l'organisme est une boîte noire dont il est inutile d'essayer d'explorer la structure interne puisqu'elle est entièrement modelée par des forces externes. Selon lui, la seule stratégie envisageable dans la construction d'une science de l'esprit consiste à chercher à comprendre les états internes des organismes en ignorant leur relation avec le monde extérieur et en concentrant au contraire 1' attention sur leurs relations avec d'autres ' . systemes Internes. Pour y parvenir, Chomsky défend une approche naturaliste. Touchant le langage, on ne peut en effet faire mieux que de s'en tenir, comme dans l'étude d'autres aspects du monde naturel, à ce type d'approche et de rechercher pour les phénomènes mentaux livrés par l'expérience ou mis en évidence par l'expérimentation le traitement théorique le plus satisfaisant, fondé en principe et s'autorisant éventuellement le recours à des structures cachées. Ce qu'il s'agit avant tout de découvrir, c'est la réalité mentale qui est sous-jacente au comportement effectif des locuteurs. Or il est clair que les philosophes attendent sur le langage un type d' explication fort différent de celui que peut livrer l'enquête mentaliste internaliste, dans lequel la conscience aurait accès aux règles qui caractérisent la

LA GRAMMAIRE GÉNÉRATIVE

125

langue. Pour la majorité d'entre eux, cette enquête passe à côté de l'essentiel parce les modèles computationnels-représentationnels sont par eux-mêmes incapables de rendre compte de la relation entre la cognition et le monde et ignorent des dimensions fondamentales comme l'intentionnalité ou la conscience. Quant à la neutralité métaphysique endossée par Chomsky, qui se ramène à une position moniste, elle revient à rejeter le dualisme corpsesprit et à poser que ce sont les mêmes principes qui s'appliquent aux aspects physiques et aux aspects mentaux d'un organisme. Si des différences existent entre ces deux ordres de réalité, elles ne sauraient en aucun cas être d'ordre ontologique, contrairement à ce que soutenait Descartes.

CHAPITRE VI

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE Je souhaite ici discuter une approche de l'esprit qui considère le langage et d'autres phénomènes similaires comme des éléments du monde de la nature, que 1' on doit étudier par les méthodes ordinaires de 1' enquête empirique (New Horizons in the Study of Language and Mind, p. 106).

Tous les programmes sur le langage ne posent pas les mêmes questions. On peut même dire que les programmes se distinguent par le type de questions qu'ils posent. On sait que dans l'histoire de la pensée linguistique, certaines questions, initialement rejetées, sont devenues acceptables et même fondatrices d'une approche nouvelle. Ainsi, le projet cognitif a remis au goût du jour la question de l'origine du langage et des langues, que la Société Linguistique de Paris excluait explicitement de son champ d'étude dans les statuts dont elle s'est dotée en 1866, peu après sa fondation. Comme le chapitre III a tenté de le montrer, l'objet de la linguistique, selon Chomsky, ne peut se réduire à ce que le sens commun appelle «langage», d'une part parce que ce n'est pas exactement du langage qu'il s'agit, mais de la faculté qui le rend possible, des langues internes qu'elle produit et des grammaires qui leur sont sousjacentes, d'autre part parce que, pour caractériser adéquatement cette faculté, il convient d'apporter une réponse à plusieurs questions qui, bien que concernant chacune l'objet langage, l'abordent par des biais différents. Pour caractériser les buts de l'enquête rationnelle sur le langage, Chomsky choisit de raisonner en termes de connaissance et pose, à propos de la connaissance du langage, le type de questions que 1' on peut soulever à propos de toute connaissance: on doit s'interroger sur sa nature, sur la façon dont elle est acquise, sur son origine et son évolution, sur son emploi. Il s'agit donc pour la théorie linguistique (i) de caractériser la nature de la connaissance interne appelée I -langue; (ii) de rendre compte du processus d'acquisition, c'est-à-dire des voies par lesquelles les structures linguistiques naissent dans 1' esprit des locuteurs-auditeurs ;

128

DANS LE LABYRINTHE DU LANGAGE

(iii) d'expliquer l'origine du langage au regard de l'évolution, et pourquoi seuls les humains, pas les animaux, possèdent une grammaire mentale; (iv) de préciser comment cette connaissance est mise en œuvre dans la parole (ou dans des systèmes secondaires comme l'écriture); (v) de découvrir 1' armature et les mécanismes physiques qui servent de base matérielle à la représentation, à 1' acquisition et à 1' emploi de cette . connaissance.

Chomsky, comme beaucoup d'autres, épistémologues ou chercheurs dans les sciences dures, pense volontiers à la science comme à un ensemble de disciplines qui se donnent pour tâche de résoudre des puzzles, des énigmes, dont la solution est tout sauf évidente. Un programme de recherche se présente donc comme un ensemble de questionnements ou de propositions problématiques, qui ont le statut d'hypothèses tant qu'elles n'ont pas été soumises à l'épreuve de la réfutation empirique, mais deviennent des assertions constitutives de la théorie si elles surmontent cette épreuve avec succès. Le programme de recherche chomskyen peut ainsi aujourd'hui se décliner sous la forme d'une collection de problèmes spécifiques que la théorie se donne pour tâche de résoudre. , Etendant une pratique de Chomsky qui, dans Knowledge of Language, parle du «problème de Platon», on peut associer à chacune des questions majeures abordées le nom du philosophe ou du savant qui a été le premier à la poser, tout en indiquant dans quel texte la question est reprise par 1 Chomsky. (i)

(ii) (iii)

(iv) (v)

1

Qu'est-ce qui constitue la connaissance du langage dans l'esprit du locuteur-auditeur? (problème de Humboldt, Aspects de la théorie syntaxique) Comment cette connaissance est-elle acquise? (problème de Platon, Knowledge ofLanguage) Comment cette connaisance a-t-elle émergé dans l'espèce? (problème de Wallace, Berwick & Chomsky, Why Only Us, ou problème de Darwin, Homstein 2009) Comment cette connaissance est-elle utilisée dans la parole? (problème de Descartes, Language and Problems ofKnowledge) Comment cette connaisance est-elle implémentée dans le cerveau? (problème de Broca, Language and Problems ofKnowledge)

Cette présentation reprend pour 1' essentiel la classification proposée par Leivada (2012: 35-36).

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

1.

129

LE PROBLÈME DE HUMBOLDT

1.1. DÉPENDANCE DE LA STRUCTURE

Pour relever le défi posé par le problème de Humboldt, on doit se demander s'il est possible d'identifier, aux côtés des caractéristiques (B) et (C) identifiées au chapitre III et répétées ci-dessous, d'autres propriétés incontournables des langues, portant potentiellement sur ce problème. B. C.

les phrases sont potentiellement infinies; les phrases sont les unités linguistiques basiques.

(F), (G) et (H) sont des candidats plausibles à l'inclusion dans cette classe. F.

les phénomènes linguistiques sont sensibles à la structure syntagmatique des énoncés.

L'hypothèse (F) n'est pas une généralisation descriptive comme (B), mais une proposition théorique comme (C). Elle est indissociable de l'exigence que «toute langue incorpore une procédure générative [ ... ] qui caractérise les expressions internes à cette langue» ( « Problems of projection», p. 35) et qui, en particulier, donne un contenu à la notion de syntagme. On ne peut a priori exclure la possibilité que les propriétés saillantes des langues puissent être intégralement caractérisées sur la base de 1' ordre linéaire des éléments que contiennent les phrases, sans considération de la structure hiérarchique. Le bien-fondé de (F) est en fait confirmé par la découverte que quantité de phénomènes linguistiques sont sensibles à la structure hiérarchique et ne le sont pas à l'ordre linéaire. Pour illustrer cette propriété, on peut se référer aux analyses qui ont été proposées de l'anaphore libre et de l'anaphore liée, phénomènes illustrés par les exemples suivants : (1) (2) (3) (4)

a. Paul croit qu'il va gagner [anaphore libre] b. Il croit que Paul va gagner. Sa mère admire Paul. Julie et Lucie jouent l'une contre l'autre. [anaphore liée] Recommander Mathieu l'un à l'autre ennuie Jean et Luc

La grammaire doit expliquer pourquoi le pronom il peut librement coréférer avec Paul en (la), mais ne le peut pas en (lb). On admet en général qu'une expression référentielle comme Paul est nécessairement disjointe de tout pronom (plus généralement, de toute expression) qui occupe une position plus haute dans 1'arborescence, la notion de «supériorité

130

DANS LE LABYRINTHE DU LANGAGE

2

structurale» étant formulée sur la base de la « c-commande ». ( 1a) indique par contre que la coréférence est légitime entre un pronom et une expression référentielle qui le c-commande. La pertinence des relations hiérarchiques plutôt que de 1' ordre linéaire dans le calcul de la co référence est confirmée par la disponibilité de l'interprétation coréférentielle entre le pronom sa et Paul dans l'énoncé (2). La coréférence est légitime, bien que le pronom précède l'antécédent. Mais dans ce cas, il n'existe pas de parcours de c-commande entre le pronom possessif et son référent potentiel. (3) confirme que dans une séquence contenant une expression anaphorique comme l'un l'autre, cette dernière doit trouver (en gros, dans la proposition qui la contient minimalement) un antécédent qui laccommande.3 Au premier abord, cette condition n'est pas satisfaite en (4), où l'un à l'autre n'est pas c-commandé par l'antécédent potentiel Jean et Luc. Mais la difficulté disparaît si l'on fait l'hypothèse que l'infinitif recommander a lui-même un sujet silencieux, dont la référence est contrôlée par Jean et Luc et qui c-commande clairement l'expression anaphorique. L'existence de ce réseau anaphorique prédit correctement la bonne-formation de la relation entre l'un à l'autre et Jean et Luc. Les relations structurales entre le terme antécédent et le pronom ou 1' expression anaphorique jouent donc un rôle essentiel dans le phénomène de l'anaphore libre comme dans celui de l'anaphore liée. On peut multiplier les exemples illustrant la propriété de dépendance de la structure. Chomsky cite souvent le phénomène de l'inversion de ' l'auxiliaire en anglais. A partir de (5a), on doit dériver (5b), non (5c). ( 5)

a. The man who is he re is tall b. Is the man who is here tall? c. *Is the man who here is tall?

Le résultat correct ( 5b) est dérivé si 1' on fait 1'hypothèse que le processus d'inversion a accès à la structure en constituants de 1' énoncé et s'il est

2

La c-commande est définie comme suit: Un noeud a c-commande un noeud p si, et seulement si, p est le noeud soeur de a, ou est contenu dans y, noeud soeur de a. Reinhart (1983) est le travail fondateur sur les propriétés des relations de liage et sur le rôle de la c-commande dans 1' établissement de ces relations. 3 Une différence essentielle entre les deux phénomènes est que la relation entre une expression anaphorique et son antécédent est nécessairement locale (au sens où 1' antécédent doit être contenu dans la proposition contenant minimalement 1' expression anaphorique), alors que la coréférence entre un pronom et une autre expression ne peut s'établir que de façon non locale, voir chapitre VIII, section 5.3.

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

131

défini de façon à placer l'auxiliaire de la proposition matrice en tête de proposition. Le résultat agrammatical (5c) est dérivé par une grammaire dans laquelle seul 1' ordre linéaire des termes est considéré comme pertinent et où le processus d'inversion consiste à placer le premier auxiliaire en tête de proposition. Il faut souligner que la dépendance de la structure n'est pas une caractéristique directement observable dans les énoncés. C'est un savoir inné, qui permet à l'enfant de formuler la règle d'inversion de façon adéquate. Aux yeux de Chomsky, le fait qu'une opération dépendante de la structure ne présente aucun avantage du point de vue de l'efficacité communicationnelle ou de la simplicité, bien au contraire, appuie l'hypothèse que la dépendance structurale est un principe invariant du langage, un universel de forme. Les phénomènes d'accord pointent vers la même conclusion. Il serait totalement erroné de poser que l'accord affecte exclusivement des mots strictement adjacents. Les langues naturelles ne fonctionnent pas ainsi. Cette règle prédirait incorrectement la bonne-formation de (6a) et 1' agrammaticalité de ( 6b ). (6)

a. *Les filles de la troupe chantera. b. Les filles de la troupe chanteront.

Dans la mesure où elles prennent en compte les relations hiérarchiques qu'entretiennent les éléments qui constituent la phrase, pas l'ordre linéaire dans lequel ils apparaissent, on dira que les opérations transformationnelles sont «dépendantes de la structure». Cela suppose qu'il existe une architecture de la linéarité, qu'une organisation hiérarchique est sous-jacente aux séquences linéaires d'éléments, organisation qui est adéquatement représentée par le découpage de la phrase en syntagmes. G.

Les règles et les opérations syntaxiques sont récursives.

Une autre propriété formelle de la procédure générative qu'ont intégrée, sous une forme ou sous une autre, tous les modèles qui se sont succédé depuis les années 50 est la récursivité des règles et des opérations, visant à capturer le caractère d'infinité discrète de la syntaxe des langues naturelles. Une opération est récursive si elle peut indéfiniment s'appliquer à son propre output, produisant entre autres des structures dans lesquelles un constituant de catégorie X contient un sous-constituant de même catégorie. Cette propriété se manifeste dans les exemples (7), en (7a) où la proposition dans son ensemble contient plusieurs domaines eux-mêmes analysables comme des propositions, en (7b) où le groupe

132

DANS LE LABYRINTHE DU LANGAGE

nominal ce compositeur viennois est lui-même inclus dans un groupe 4 nominal plus large. (7)

a. [s René sait [s que Galilée croit [s que la terre est ronde ]]] b. [NP la septième symphonie [ de [NP ce compositeur viennois ]]]

Notons que dans la présentation qui vient d'être donnée, se trouvent confondus une propriété descriptive et indiscutable des langues - la possibilité d'enchâsser une catégorie dans une autre de même identité - et le mécanisme - les règles récursives - qui permet de dériver les structures correspondantes. En (7a), la règle manifestant la propriété de récursivité est celle qui introduit le symbole S. Si cette propriété est prise en charge par un système de réécriture, ce symbole figurera à la gauche de la règle réécrivant l'axiome du système et aussi à la droite d'autres règles. Le système inclura entre autres les deux règles suivantes : (8)

a. S

) NP + VP b. VP ) V+ S

En (7b), la règle pertinente est celle qui réécrit le symbole NP. Mais la propriété qui nous intéresse ne se manifeste pas nécessairement par l'inclusion d'un constituant de catégorie X dans un constituant plus large de même catégorie. Il existe une autre notion de récursion qui n'a rien à voir avec 1'enchâssement et la reduplication des catégories grammaticales, mais relève d'une branche des mathématiques, illustrée en particulier par le travail de Post (1944) sur les ensembles récursivement énumérables et par celui de Turing sur les fonctions mathématiques calculables par les ordinateurs. Depuis l'origine, la Grammaire Générative a soutenu que le modèle qui représente le mieux la Faculté humaine de Langage est une fonction calculable qui crée un ensemble potentiellement infini de structures à partir d'une liste finie d'atomes de la langue. Dans les versions minimalistes les plus récentes, qui s'attachent à n'intégrer à la théorie syntaxique que les hypothèses et les concepts absolument nécessaires, ceux en dehors desquels il n'y a pas de théorie possible, la grammaire ne dispose plus que d'une seule opération de construction de la structure, consistant à associer deux objets syntaxiques pour créer un objet syntaxique plus étendu. Cette opération, appelée Merge, qui génère un ensemble non borné de représentations structurales hiérarchisées, est évidemment récursive puisqu'il n'y a aucune limite définie à sa mise en 4

Je note provisoirement la catégorie proposition au moyen du symbole S.

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

133

oeuvre et qu'elle peut s'appliquer indéfiniment à son propre output. Elle intervient dans la combinaison des mots en syntagmes, dans la combinaison des syntagmes en propositions, dans celle des propositions en phrases complexes. Ainsi, en (7a), Merge construit d'abord le domaine prédicatif {la terre ronde} en associant le prédicat ronde et le groupe nominal {la terre} construit indépendamment; puisqu'on a affaire à une proposition à temps fini, il est nécessaire d'adjoindre à l'unité contenant le sujet et le prédicat adjectival une information concernant le temps; supposons que est soit l'exposant de la catégorie Temps correspondante; on obtient une structure [est [la terre ronde]] ; une exigence particulière de la catégorie Temps dans les langues comme le français et l'anglais est que la proposi5 tion dont elle est la tête ait un sujet flexionnel : le sujet {la terre} se déplace devant est pour satisfaire cette exigence; la structure résultante est fusionnée avec que; cette structure est ensuite combinée avec pense, et ainsi de suite ... Dans la suite de ce livre, c'est à la notion mathématique 6 que l'on référera quand on parlera de récursivité. L'analyse qui précède fait apparaître qu'une autre opération que Merge est nécessaire pour décrire 1' étendue effective des possibilités. L'objet {la terre} est utilisé une première fois pour constituer la «petite proposition» [la terre ronde] et une deuxième fois pour marquer la présence dans la structure de Temps et de son spécificateur. Tout se passe comme si, après avoir été inséré par Merge une première fois, il était remerged dans la position de sujet grammatical (il n'est bien sûr prononcé qu'une fois, dans la position la plus haute où il apparaît). Cette opération n'est autre que le déplacement.

5

Cette exigence, connue sous le nom de «principe EPP » (Extended Projection Principle, principe de projection étendu), impose que le spécificateur de Temps soit projeté et occupé par une expression nulle ou lexicalement réalisée. La notion de spécificateur est introduite chapitre VII, section 2.2. 6 Les propositions F et G renvoient à des propriétés distinctes. Si l'opération Merge est caractérisée comme dans le texte, elle peut associer à 1' énoncé (i) aussi bien la structure correcte (ii) que la structure incorrecte (iii), branchant uniformément vers la droite. Dans la structure (iii), les et enfants ne forment pas un constituant, ce qui prédit incorrectement l' agrammaticalité de la phrase (iv). (i) Les enfants jouent (ii) [[[les] [enfants]] [jouent]] (iii) [les [enfants [jouent]]] (iv) Ce sont les enfants qui jouent Des considérations indépendantes de Merge, en particulier les restrictions qui règlent 1' analyse syntagmatique, doivent être invoquées pour sélectionner la structure hiérarchique appropriée.

134

D ANS LE LABYRINTHE DU LANGAGE

H.

Les expressions linguistiques manifestent la propriété de déplacement.

La proposition (H) qui, comme (F) et (G), ne peut se comprendre qu'en référence au cadre théorique dans lequel elle s'inscrit représente 1' observation que certaines expressions, comme le sujet d'une phrase passive, sont prononcées dans une position différente de celle où elles sont thématiquement interprétées. C'est le cas de l'expression nominale cette lettre dans l'énoncé (9), qui occupe la position de sujet grammaticaL (9) Cette lettre a été écrite par Cicéron en 54.

Son site de réalisation lui permet de fonctionner discursivement comme le topique de l'énoncé. Mais, outre ce rôle discursif, elle est aussi porteuse d'un rôle argumentai spécifique, associé à une valeur thématique déterminée. Elle est en effet interprétée comme l'argument direct du prédicat écrire, interprétation que l'on retrouve dans la phrase active correspondante, où elle endosse également le rôle Thème. (10) Cicéron a écrit cette lettre en 54.

Pour décrire cette propriété, la Grammaire Générative fait l'hypothèse que l'argument Thème, inséré dans la structure comme l'objet direct du participe écrit, reçoit dans cette position le rôle thématique que le verbe écrire assigne à son argument direct et se déplace ensuite au cours de la dérivation dans la position de sujet grammaticaL Cette présentation peut être étendue à la relation qui existe entre les deux énoncés interrogatifs suivants: (11) a. Quel livre as-tu acheté? b. Tu as acheté quel livre?

La dérivation de (lla) suppose un déplacement de l'expression interrogative que/livre de la position d'objet direct à la périphérie de la proposition. Si la notion de récursivité est omniprésente dans les grammaires formelles et ne saurait être considérée comme une caractéristique exclusive des modèles chomskyens, il n'en va pas de même pour (H). Il existe des grammaires formelles confirmées qui n'ont pas recours au déplacement 7 et se définissent même essentiellement par le rejet de cette opération.

7

Voir chapitre II, section 3.

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

135

La Grammaire Générative semble être aujourd'hui l'une des seules théories à maintenir cette hypothèse. Les observations qui précèdent permettent de se faire une idée plus exacte de la forme que peut prendre une réponse au problème de Humboldt. Nous verrons que l'opération Merge, qui intervient directement dans la représentation des propositions (B), (F), (G), (H), constitue la cheville ouvrière de la caractérisation chomskyenne de la connaissance 8 du langage. 1.2. LA PROPRIÉTÉ BASIQUE

Une dimension essentielle dans la recherche d'une solution au problème de Humboldt est la prise en compte de la relation que le langage entretient avec d'autres facultés. C'est à elle que la proposition (A), énoncée au chapitre III et répétée ci-dessous, fait référence. A.

les phrases associent du son et de la signification.

C'est même pour Chomsky l'une des propriétés définitoires du langage, une propriété que ne peut ignorer une approche rationnelle. Une analyse théoriquement fondée de cette propriété constitue une pièce essentielle de la réponse à la question «Qu'est-ce que le langage?». Chomsky en donne une formulation plus précise dans What Kind of Creatures are We ? Chaque langue fournit une collection non bornée d'expressions structurées hiérarchiquement qui reçoivent une interprétation aux deux interfaces, celle avec le système sensorimoteur pour 1' externalisation et celle avec le système conceptuel-intentionnel pour les processus mentaux (Chomsky 2016: 4).

Celle qui suit, que l'on trouve dans Why on/y us, est une variante de la précédente. Une langue est un système computationnel fini produisant une infinité d'expressions, telles que chacune a une interprétation définie dans les systèmes sémantique-pragmatique et sensorimoteur (informellement la pensée et le son) (Berwick & Chomsky 2016: 1).

La tâche de la théorie linguistique est donc, en prenant pour point de départ la propriété basique, de déterminer à quoi peut ressembler un 8

Sur Merge et la construction de la structure, voir chapitre VIII, section 2. Sur Merge et le déplacement, voir chapitre VIII, section 4.

136

DANS LE LABYRINTHE DU LANGAGE

système computationnel représentant et expliquant de façon optimale cette propriété. En bref, chaque langue fournit un ensemble infini d'expressions hiérarchiquement structurées, systématiquement interprétées à 1' interface avec deux autres systèmes, le système conceptuel et le système sensorimoteur. La première interface est impliquée dans 1' interprétation, l'inférence, le planning, l'organisation de l'action, et d'autres éléments de ce qu'on appelle informellement la pensée. La seconde a en charge le processus d' externalisation, c'est-à-dire la communication et 9 les canaux qu'elle emprunte. Mais il est nécessaire d'affiner davantage la caractérisation qui vient d'être proposée. Selon Chomsky, les deux représentations d'interface sont en relation asymétrique, tant par leur statut que par leur dérivation. La propriété basique, qui doit être partiellement reformulée pour tenir compte de ce glissement, est en réalité la génération d'une collection non bornée d'expressions hiérarchiquement structurées, appliquées sur l'interface conceptuelle-intentionnelle, fournissant une forme de langage de la pensée ... L'extemalisation serait un processus secondaire, ses propriétés le réflexe d'un système sensorimoteur en grande partie ou totalement indépendant (Chomsky 2016: 13-14).

On doit comprendre que le parcours qui va de la numération - on désigne ainsi 1' ensemble des ressources lexicales utilisées dans un énoncé donné à la représentation sémantique de la proposition est un parcours syntaxique homogène, mettant en jeu pour l'essentiel des opérations computation10 nenes de même nature avant et après le point d'épellation, alors que le processus d' extemalisation fait appel à des règles spécifiques, sans rapport avec les précédentes. Ainsi se trouve justifiée selon Chomsky 1' idée que «le langage n'est pas du son avec de la signification, mais de la significa11 tion avec du son». Le langage est un système d'expression de la pensée, 9

L'existence de la langue des signes suffit à indiquer que le son n'est que l'une des modalités possibles de l'extemalisation (c'est-à-dire, de la dérivation d'une représentation externe). 1 ° Ce parcours constitue ce que l'on appelle la «syntaxe étroite», réunion de la «syntaxe explicite» (qui précède 1' épellation) et de la« syntaxe silencieuse» (qui la suit). Sur 1' architecture de la grammaire et en particulier sur le point d'épellation ou de transfert, voir chapitre VIII, section 1. 11 Voir Chomsky 2016: 4, 6, 14. Chomsky attribue à Aristote la conception du langage comme «du son avec de la signification», sans plus de précision. C'est dans le De interpretatione qu'Aristote introduit l'idée que tout son émis par la voix et doté de signification est «interprétation», que la phrase, par exemple, doit être considérée comme un son de voix significatif Je remercie Benjamin Spector de m'avoir permis d'identifier 1' origine de cette idée dans le corpus aristotélicien.

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

137

avant d'être un outil orienté vers la communication, un phénomène mental, interne à chaque individu, qui permet la formation dans l'esprit d'un ensemble d'expressions structurées, mais est couplé avec des mécanismes d' externalisation, qui rendent possible la communication avec les autres esprits. Cette conception est directement reflétée par 1'hypothèse que 1' extemalisation, c'est-à-dire l'association d'une forme sonore ou signée aux objets syntaxiques, qui a partie liée avec la communication, occupe dans le dispositif une position ancillaire par rapport à 1' interprétation sémantique, qui participe directement du langage de la pensée.

2.

LE PROBLÈME DE PLATON

Cette question est celle du pro blême logique de 1' acquisition du langage: comment l'enfant sélectionne-t-il une grammaire dans l'ensemble des grammaires descriptivement adéquates? L'expression «problème de Platon» renvoie au décalage considérable entre expérience et connaissance. Ce problème trouve l'une de ses illustrations dans le Ménon, le dialogue de Platon où Socrate raconte sa rencontre fortuite avec un jeune esclave, qui se montre capable de comprendre et de maîtriser les principes de la géométrie. La conclusion qui peut être tirée de cet épisode est qu'on n'apprendjamais que ce que l'on sait déjà. Le décalage entre expérience et connaissance se manifeste de façon particulièrement aiguë dans le processus d'acquisition du langage. Dans l'esprit de Chomsky, soucieux de donner de la propriété basique une explication fondée en raison, une langue possible est une langue qui peut être apprise. Or comment peut-on atteindre un niveau de connaissance aussi sophistiqué que la connaissance d'une langue alors que l'input est si restreint et 12 1' expérience si limitée? C'est de cette propriété paradoxale du savoir linguistique qu'il s'agit de rendre compte. Depuis que la question a été posée au cours des années 60, la solution proposée par Chomsky n'a guère varié: 1' acquisition de sa langue maternelle par 1' enfant ne reçoit une explication plausible et cohérente que si l'on fait l'hypothèse de 1' existence de structures innées hautement spécifiées, de ressources biologiquement déterminées dans l'esprit-cerveau de l'apprenant.

12

Chomsky cite à plusieurs reprises un passage de Russell qui formule la même inter. , , rogabon en termes generaux. «Comment se fait-il que les êtres humains, dont les contacts avec le monde sont brefs, personnels et limités, soient néanmoins capables de savoir autant qu'ils savent?» (Russell 1948: 31, cité par Chomsky 1975: 13 et Chomsky 1988: 3-4).

138

DANS LE LABYRINTHE DU LANGAGE

L'argument essentiel sur lequel repose toute l'approche chomskyenne de l'acquisition du langage, qui est aussi 1'un des arguments principaux en faveur de l'innéisme, est donc celui de la pauvreté du stimulus. L'observation initiale sur laquelle cet argument est fondé est que les locuteurs natifs savent sur la syntaxe de leur propre langue quantité de choses qu'ils n'ont pas pu apprendre ou induire à partir des données auxquelles ils ont été exposés dans la petite enfance. On ne peut supposer que l'enfant a découvert les propriétés universelles des langues par un processus d'abstraction à partir d'un corpus aléatoire. Est ainsi récusée la possibilité d'une acquisition à partir des données de l'expérience par des procédures d'apprentissage de type inductif. La seule constitution d'un tel corpus supposerait que l'enfant soit déjà capable de distinguer le grammatical du non-grammatical. La relative rapidité de l'acquisition, la pauvreté des stimuli impliqués, les régularités observées dans le processus donnent à penser que 1' apprentissage est guidé par des principes qui 1' orientent. Chomsky conclut qu'au moins certains aspects de la syntaxe relèvent d'un équipement préalable dans l'esprit-cerveau humain, qui détermine directement la façon dont les enfants vont réagir à ce qu'ils entendent. Il va de soi que l'environnement joue un rôle: les enfants sourds ne parlent pas; même si la variation s'inscrit dans des limites bien précises, les langues acquises varient considérablement (touchant la possibilité d'avoir des sujets nuls, un enfant français n'opère pas le même choix qu'un enfant italien). Mais si l'environnement a une incidence, c'est précisément parce que 1' équipement préalable est opérant. Il doit exister dans l'esprit-cerveau des humains un dispositif d'acquisition du langage, permettant a priori à l'enfant de construire la grammaire de n'importe quelle langue, donc de la langue à laquelle il est exposé, mais qui n'est en aucune façon un dispositif spécialisé dans 1' acquisition de cette langue. Cette hypothèse représente de façon naturelle et élégante 1' observation qu'une partie de notre connaissance du langage est innée et qu'une autre partie requiert un apprentissage permettant son acquisition. Elle va évidemment à l'encontre du point de vue béhavioriste selon lequel le cerveau est à la naissance une table rase et le langage un système d'habitudes et de comportements. Dans Aspects, Chomsky insiste sur le caractère particulièrement invraisemblable de la position empiriste pour ce qui touche à 1' apprentissage du langage. On voit pourquoi la conception suivant laquelle toute connaissance dérive uniquement des sens par des opérations élémentaires d'association et de «généralisation» devait être très séduisante au XVIIIe siècle pour promouvoir le naturalisme scientifique. Cependant, il ne reste aucune

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

139

raison aujourd'hui pour adopter sérieusement une position qui, étant donné une performance complexe de 1' être humain, 1' attribue entièrement à des mois (tout au plus à des années) d'expérience, plutôt qu'à des milliers d'années d'évolution ou à des principes d'organisation neurologique qui ont peut-être un fondement encore plus profond dans les lois physiques (Chomsky 1965 : 85).

La question de l'acquisition, présente de façon permanente dans la réflexion chomskyenne, a joué un rôle déterminant dans la mise en place et dans 1' évolution de la Grammaire Générative. Elle intervient directement dans la définition de la notion d'adéquation explicative dans Aspects; elle est liée à la dichotomie entre principes et paramètres dans le modèle du même nom. Mais la présentation que Chomsky fait du problème a changé au cours des années. Dans les années 60 et 70, il comparait l'acquisition d'une langue par l'enfant à la construction d'une théorie par le linguiste. C'est une condition préalable de son apprentissage que [l'enfant] soit en possession, premièrement, d'une théorie linguistique caractérisant la forme de la grammaire d'une langue humaine possible, et, deuxièmement d'une stratégie lui permettant de choisir une grammaire de la forme appropriée, compatible avec les données linguistiques primaires (Chomsky 1965 : 48).

Chomsky décrit donc l'apprentissage du langage comme un processus de formation et de sélection d'hypothèses que l'enfant soumet au test des données fournies par 1' environnement linguistique. C'est dans ces termes que l'on doit interpréter l'opposition entre les deux types d' adéquation distingués dans Aspects, que les modèles linguistiques cherchent à atteindre, 1' adéquation descriptive et 1' adéquation explicative. Une grammaire est descriptivement adéquate si elle décrit correctement la compétence intrinsèque du sujet parlant idéal, c'est-à-dire si les distinctions qu'elle opère entre phrases bien formées et phrases déviantes, tout comme les analyses qu'elle assigne aux phrases bien formées, correspondent à l'intuition linguistique de ce sujet. Cette tâche peut s'avérer difficile, mais la théorie linguistique doit, pour progresser, se proposer un but plus ambitieux que l'adéquation descriptive: elle doit viser à 1' adéquation explicative. Cette notion reçoit une définition technique précise, qui fait crucialement référence au processus d'acquisition. Une grammaire atteint l'adéquation explicative si «la théorie linguistique à laquelle elle est associée la choisit de préférence à d'autres grammaires, à partir de données linguistiques primaires, avec lesquelles toutes ces grammaires sont également compatibles» (Chomsky 1965: 45). Une

140

DANS LE LABYRINTHE DU LANGAGE

théorie linguistique est explicativement adéquate si elle parvient à sélectionner une grammaire descriptivement adéquate sur la base de données linguistiques primaires, si elle fournit une explication des intuitions du sujet parlant sur la structure des énoncés, en bref si elle parvient à déterminer comment la Faculté de Langage de l'enfant atteint un état stable. Ce but ne peut être atteint que si la théorie propose un modèle de l'acquisition du langage, c'est-à-dire une théorie de 1' apprentissage des langues et de la construction des grammaires. Dans les années qui ont suivi, surtout à partir de Lectures on Government and Binding, Chomsky parle de développement, de maturation, et répudie la notion même d'apprentissage. Il le fait explicitement dans le passage suivant de Règles et représentations. Mais il n'est pas absurde de se demander si, à parler ainsi d'apprentissage, on ne déforme pas la réalité ... Je souhaiterais au moins indiquer que, sous certains rapports fondamentaux, nous n'apprenons pas vraiment le langage, mais ... plutôt que la grammaire croît dans nos esprits (Chomsky 1980a: 127).

Ailleurs, il propose de substituer à 1' image du seau que 1' on remplit celle de la fleur que l'on arrose. C'est aussi à cette époque qu'il commence à utiliser pour référer à la Faculté de Langage la métaphore d'« organe mental». Le modèle des principes et paramètres, introduit à la fin des années 70, fournit le cadre théorique nécessaire à cette nouvelle implémentation. Dans Aspects, Chomsky soulignait déjà l'existence d'une tension forte entre le projet de caractériser les principes universels abstraits gouvernant la construction des grammaires qui constituent « 1' état initial» de la Grammaire Universelle et la nécessité de représenter formellement la diversité des langues naturelles. C'est à une tension entre la recherche de l'adéquation descriptive et celle de l'adéquation explicative que 1' on a affaire en réalité. La première requiert des théories formelles qu'elles aient un fort pouvoir descriptif, la seconde qu'elles soient maximalement restreintes. On ne peut atteindre l'adéquation explicative et en particulier donner du phénomène de l'acquisition du langage une représentation plausible qui n'en fasse pas un miracle permanent que si les options permises par la théorie de 1' état initial s'inscrivent dans des limites relativement étroites. Mais, dans le même temps, la prise en compte de la variation linguistique, la découverte de l'infinie complexité des organismes linguistiques imposent d'enrichir considérablement les systèmes génératifs, afin de satisfaire 1' adéquation descriptive. Le modèle des principes et paramètres représente une tentative originale et

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

141

historiquement unique pour résoudre cette tension entre variation linguistique et acquisition. Contrairement à la conception traditionnelle pour qui une langue se réduit à un système de règles permettant de former des structures grammaticales, ce modèle maintient que la Faculté de Langage ne contient pas de règles spécifiques, mais intègre d'une part des principes abstraits et universels de construction des grammaires, qui constituent l'état initial définissant la Grammaire Universelle, et d'autre part un ensemble limité d'options -les paramètres- spécifiant le fonctionnement de ces principes dans les langues particulières. Si des principes généraux existent, ils n'ont pas à être appris. Le processus d'acquisition se trouve donc considérablement simplifié si ces principes sont assignés à la Faculté de Langage, structurée comme un système de principes et de 13 paramètres. L'acquisition se limite alors à fixer la valeur de chaque paramètre, par l'effet d'une lente maturation de la Faculté de Langage au contact d'un environnement linguistique particulier. C'est bien cette hypothèse de travail que retiennent aujourd'hui la plupart des psychologues cognitivistes intéressés au problème de l'acquisition. Mais, comme le souligne Chomsky (2009: 25-26) dans un passage dont je reprends ici 1' essentiel, la perspective définie dans ce modèle conduit à accorder au processus d'acquisition une importance bien moindre dans la caractérisation de l'objet langage. Le fait de réduire le phénomène à une recherche débouchant, dans les premières années de la vie, sur l'identification et la fixation de paramètres divers impose de renoncer au scénario selon lequel les considérations sur la pauvreté du stimulus déterminent la limite inférieure de ce qui peut être attribué à la Grammaire Universelle - elle doit être minimalement structurée -, alors que la diversité des langues en fixe la limite supérieure - elle ne doit pas l'être trop. La nouvelle approche établit en effet une séparation nette entre les principes proprement linguistiques et 1' acquisition. Il ne suffit donc plus désormais, dans la caractérisation de l'objet langage, de faire référence à 1' équipement génétique et à la riche structure déductive de la Grammaire Universelle. D'autres dimensions doivent être prises en compte, les questions de simplicité, de redondance, d'économie, les considérations qui relèvent du troisième facteur. Cette perspective nouvelle a en fait pour effet de «faire tomber la barrière conceptuelle à l'étude de l'évolution du langage», hors d'atteinte d'une grammaire trop richement structurée. Le passage d'Aspects (p. 85) cité plus haut, qui

13

Sur ce point, voir aussi chapitre VII, section 3 .2, et chapitre IX, section 4.

142

DANS LE LABYRINTHE DU LANGAGE

indiquait quels éléments devraient être pris en compte pour construire une authentique théorie de 1' acquisition, anticipait les recherches contemporaines, en invitant à s'interroger aussi à la question de 1' évolution, c'est-à-dire au problème de Darwin. Pour donner de la propriété basique une explication fondée, il ne suffit pas d'établir comment elle est acquise par les individus, il faut aussi déterminer comment elle a pu, au cours de l'évolution, s'inscrire dans l'espèce.

3.

LE PROBLÈME DE DARWIN

La question de 1' origine du langage a toujours soulevé d'immenses difficultés. Celle de son évolution, plus simple en apparence, puisqu'il s'agit d'étudier la modification d'une fonction et l'émergence de structures nouvelles, se heurte elle aussi à divers obstacles. Rappelons brièvement la lecture minimaliste du phénomène de l'évolution et des difficultés qu'il soulève, telles qu'elles sont présentées dans Berwick & Chomsky (20 16). Les auteurs admettent tout d'abord sans discussion que le langage est spécifique à 1'espèce humaine. La faculté de langage est essentielle à la compréhension de ce que nous sommes. Et il existe, comme Descartes le soutenait, une discontinuité absolue entre le langage humain et la communication animale. Cette position exclut d'emblée toute étude comparative sur le sujet, qui supposerait la prise en compte conjointe des performances de plusieurs espèces. Elle implique un rejet de l'hypothèse assez courante posant que la Faculté de Langage chez les humains dérive des systèmes animaux de communication, de ceux des grands singes en particulier (gorilles, chimpanzés, orangs-outans ). La présence d'une Faculté de Langage chez l'homme n'est pas corrélée à un haut niveau de développement intellectuel (distinct d'une dispostion instinctive), combiné à une adaptabilité exceptionnelle, comme le croyait Darwin, mais au fait que notre esprit est configuré différemment. Deuxième caractéristique qui est, comme la précédente, source de difficulté: la documentation archéologique sur laquelle pourrait se fonder l'argumentation est extrêmement réduite. Les parties de l'anatomie humaine que l'on sait impliquées dans le langage- le cerveau, le larynx - ne survivent pas à 1'état de fossiles. Enfin, et c'est là 1' origine des controverses les plus sérieuses, les auteurs adoptent, concernant l' évolution du langage, une position fortement anti -adaptationniste. Ils rejettent une caractérisation fonctionnelle du langage, qui le réduirait à la parole ou à n'être qu'un instrument de communication, mais le traitent comme un phénomène biologique, plus précisément comme un mécanisme

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

143

computationnel interne à 1' esprit. De plus, selon eux, bien qu'on ait affaire à un organe biologique, le langage ne serait pas apparu et n'aurait pas évolué sous 1' effet de la sélection naturelle, le créneau temporel disponible étant trop court pour permettre l'émergence d'une Grammaire Universelle richement spécifiée. En un mot, la connaissance du langage, sa complexité excèdent de très loin ce qu'il est raisonnable d'attribuer à la sélection naturelle. C'est une mutation génétique mineure, conduisant à une reconfiguration des réseaux neuronaux internes au cerveau, qui a rendu possible son apparition. Elle se serait produite de façon soudaine, en une seule étape, dans un créneau temporel relativement étroit, situé selon Chomsky (2005) il y a environ 50.000 ans ou selon Berwick & Chomsky (2016), plus tôt encore, 14 autour de 200.000 ans. Chomsky défend donc touchant l'origine et l'évolution du langage le scénario du «bond en avant», en contradiction absolue avec le principe de continuité de la philosophie naturelle (Na tura non facit sa/tus) forgé par Aristote, repris par Leibniz, et que 1' on peut assurément considérer comme un précepte darwinien. Quelle est la nature de cette mutation? Chomsky est catégorique : la mutation pertinente coïncide avec l'apparition de l'opérationMerge dans le cerveau, c'est-àdire avec la possibilité de prendre deux objets mentaux, prélevés dans la numération ou préalablement construits, et de créer un objet mental plus étendu à partir des précédents. Une fois que cette opération est disponible, il est possible de construire une infinité de structures hiérarchiques et ainsi d'agencer des pensées complexes. La simplicité de cette opération basique, la simplification de la Grammaire Universelle qui en résulte s'accordent bien avec l'hypothèse d'une mutation soudaine et avec les données archéologiques qui situent l'émergence du langage dans une période relativement récente de l'évolution. Mais une interrogation fondamentale demeure: est-illégitime de considérer que le langage est un objet mental si particulier et si complexe, que 1' on est fondé à proposer de son origine et de son évolution une exp lication entièrement spécifique, ne pouvant être étendue à d'autres systèmes cognitifs? Chomsky est parfaitement conscient que, biologi-

14

C'est un point de vue opposé qui s'exprime dans le passage suivant de Darwin, 1'un des rares où il parle de langage, et où se trouvent mêlées la question de 1' origine des langues et celle de leur évolution. « La formation de langues différentes et d'espèces distinctes, et la preuve que les unes et les autres se sont développées graduellement, sont curieusement parallèles» (Darwin 1871, cité par Ruhlen 1994: 261-262).

144

DANS LE LABYRINTHE DU LANGAGE

quement parlant, associer le langage à un équipement préalable trop riche n'a aucun sens, et qu'il est préférable de raisonner dans les termes d'une Grammaire Universelle simplifiée. Mais c'est ce choix théorique qui le conduit à défendre l'hypothèse d'une mutation cognitive brutale et unique, c'est-à-dire à faire du langage une exception dans le processus d'évolution. C'est en effet parce qu'elle a émergé soudainement que la syntaxe doit être simple. Etc' est parce qu'elle doit être simple qu'elle ne peut avoir émergé qu'en une seule étape. Il y a là une forme de circularité, relevée par Progovac (2016: 993). Sans entrer pour 1' instant dans la discussion des controverses que l'hypothèse anti-adaptationniste a suscitées et sans décider s'il s'agit d'une véritable thèse scientifique ou d'un alibi destiné à justifier certains choix théoriques, on doit observer que l'intégration au programme de recherche minimaliste du problème de Darwin a entraîné, à partir des années 2000, un changement de point de vue radical touchant les différents facteurs qui façonnent la Faculté de Langage et a contribué à faire évoluer drastiquement la théorie elle-même, même si Chomsky s'était depuis longtemps posé la question de l'évolution, dans Language and Mind par exemple. Si en effet on admet la position anti-adaptationniste de Chomsky touchant l'évolution, il devient difficile de maintenir que le langage est un objet de la nature, un objet d'essence biologique, devant être abordé comme un chapitre des sciences de la nature. Cette position n'est pas en effet immédiatement compatible avec le naturalisme méthodologique. On voit donc se dessiner une nouvelle tension, cette fois entre 1' adéquation explicative et l'adéquation que l'on peut appeler« évolutionnelle ». Une théorie linguistique qui souhaite prendre en compte l'évolution du langage, au sens qui vient d'être donné, doit aller «au-delà de l'adéquation explicative». Une théorie linguistique qui souhaite aller au-delà de l'adéquation explicative doit se demander quels sont les fondements biologiques de la Faculté de Langage et comment la Grammaire Universelle s'est trouvée devenir une propriété de 1' espèce humaine. Dans Beyond explanatory adequacy, Chomsky est très clair: On peut chercher à atteindre un niveau d'explication plus profond que 1' adéquation explicative en se demandant non seulement quelles sont les propriétés du langage, mais aussi pourquoi elles sont ce qu'elles sont (Chomsky 2004 : 10 5).

Il est ainsi amené à se demander quels sont les facteurs qui contribuent à façonner le design du langage et la réponse qu'il donne est très différente

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

145

de celle que proposait le modèle précédent, celui des principes et paramètres. Trois facteurs déterminent la forme et le développement de la Faculté de Langage, la Grammaire Universelle (UG) n'étant que l'un des 15 facteurs qui contribuent à façonner cette faculté: (i) l'équipement génétique, c'est-à-dire UG, (ii) l'expérience, c'est-à-dire les données externes qui constituent l'environnement linguistique dans lequell' acquisition prend place, (iii) des principes qui ne sont pas spécifiques à la Faculté de Langage, «propriétés générales des systèmes organiques», contraintes physiques sur la forme et le développement des organismes vivants, qui limitent le champ des options disponibles pour 1' évolution.

De même que la prise en compte du problème logique de l'acquisition avait pour une part déterminé 1'armature conceptuelle et 1'architecture même du modèle des principes et paramètres, la décicion d'intégrer au programme de recherche minimaliste le problème logique de l'évolution induit des changements substantiels dans le modèle. Il s'agit tout d'abord de réduire l'importance quantitative de (i), qui était au coeur du dispositif dans le modèle précédent, en s'intéressant à des propriétés qui ne sont pas spécifiques à UG ou à la Faculté de Langage entendue au sens étroit. C'est à ces propriétés, énumérées en (iii), que Chomsky réfère sous l' étiquette de« facteur 3 ». Elles incluent des notions d'économie des dérivations et des représentations, des principes de computation efficace, la notion de moindre effort, l'idée que les dérivations doivent se composer d'étapes les plus courtes possible. La grammaire, entendue comme un ensemble de définitions, de principes, de théorèmes, ne peut plus être réduite à une information inscrite dans le code génétique de 1' espèce humaine. Il s'agit désormais d'opérer le départ entre les propriétés qui, comme Merge, relèvent de l'équipement génétique, c'est-à-dire du facteur 1, et celles qui sont du domaine du facteur 3, en particulier de déterminer avec précision ce qui reste de l'équipement génétique, une fois qu'ont été assignés au facteur 3 les effets qui précédemment relevaient du facteur 1. La référence au facteur 3 révèle que les critères d'adéquation changent quand il s'agit de dépasser l'adéquation explicative. On en arrive en effet à une théorie dans laquelle une bonne partie de la technologie en usage dans le modèle des principes et paramètres se trouve réduite à des principes cognitifs ou à des conditions d'interface.

15

Voir en particulier Chomsky 2005. Il est clair que Chomsky parle ici de la Faculté de Langage entendue au sens large.

146

D ANS LE LABYRINTHE DU LANGAGE

En invoquant ce facteur, Chomsky fait référence à 1'oeuvre de D'Arcy Thompson, qui a établi la pertinence des «lois de forme» en biologie, et à celle d'Alan Turing sur la morphogénèse, montrant que les formes observées dans les organismes sont plus souvent déterminées par les lois physiques que par la sélection, une conclusion qui conforte sa position anti-adaptationniste. Le point de vue novateur, visionnaire même, développé indépendamment par Thompson et Turing, repose sur l'idée que des mécanismes unificateurs puissants et des critères d'optimisation sont à l'oeuvre en biologie. Ce programme, on le voit, renverse la façon traditionnelle d'aborder le langage. Il prend pour point de départ la propriété basique formulée plus haut, et se demande à quoi pourrait ressembler le système computationnel capturant de façon optimale cette propriété, tout en observant strictement les méthodes scientifiques habituelles. Mais il introduit aussi l'idée que la Faculté de Langage est en partie façonnée par des facteurs qui n'ont rien de spécifiquement linguistique. C'est paradoxalement en s'intéressant à ces facteurs non linguistiques que 1' on peut se faire une idée plus juste de la nature du langage. 4.

LE PROBLÈME DE DESCARTES

Touchant le fonctionnement de la connaissance du langage dans la parole, Chomsky, dans Language and Problems of Knowledge, insiste sur la nécessité d'opérer une distinction entre perception et production (voir Chomsky 1988: 4-6). Le problème de la perception, qui pose la question de savoir comment nous interprétons ce que nous entendons est considérablement plus simple, selon lui, que le problème de la production, qui cherche à déterminer ce que nous disons et pourquoi nous le disons. C'est en réalité ce second problème qui mérite seul d'être étiqueté «problème de Descartes». Descartes, avant Humboldt, insiste sur l'aspect créateur du langage, tel qu'il est habituellement employé dans la parole: libre de tout stimulus ou cause externe ou interne, il permet d'exprimer ses pensées de façon originale et suscite à son tour des pensées nouvelles chez l'auditeur, il ne répète pas des discours déjà entendus, mais est capable de créer des formes qui n'avaient jamais été produites précédemment, il ne peut être redupliqué par aucune machine. C'est précisément cette dimension créatrice qui permet à Descartes de conclure que le langage des humains et donc les humains eux-mêmes se distinguent de tout ce qui existe dans le monde physique, les animaux, en particulier, assimilables à des machines, parce qu'ils ne sont pas

UN PROGRAMME POUR LA THÉORIE LINGUISTIQUE

147

16

doués de raison. Même lorsque, comme les grands singes, ils communiquent entre eux, ils ignorent le langage et la liberté de son emploi. L'homme, lorsqu'il recourt à la parole, n'est contraint par rien. Mais il y a, dans l'usage de la parole, une dimension qui ne relève pas de la compétence et de la théorie de la langue interne, mais de la performance et du langage externe, ce qui devrait limiter d'autant la contribution de la Grammaire Générative au problème de Descartes.

5.

LE PROBLÈME DE BROCA

Chomsky dans Language and Problems of Knowledge présente le problème de sa localisation cérébrale comme l'une des questions majeures que doit affronter tout programme sur le langage. Mais il reconnaît que notre ignorance touchant la neurologie du langage est encore immense. On sait depuis toujours que la Faculté de Langage peut être affectée sélectivement par des lésions touchant des parties différentes du cerveau. On sait depuis le milieu du XIXe siècle et l'article de Broca (1861) qu'il existe une latéralisation du langage: la production de la parole articulée est pour l'essentiel l'apanage du lobe frontal gauche du cerveau, alors que les capacités spatiales et visuelles relèvent de l'hémisphère droit. L'étude de Broca a été complétée en 1874 par celle de Wernicke qui a identifié l'arrière de l'hémisphère gauche comme une aire dédiée à la compréhension. Cette répartition indique déjà que différents modules du cerveau sont impliqués dans la connaissance du langage. Il ne fait pas de doute qu'une meilleure connaissance des réseaux neuronaux, rendue possible par le développement contemporain de l'imagerie fonctionnelle par résonance magnétique (IRM), et l'approfondissement des recherches sur les pathologies du langage par des études expérimentales fines sur les enfants sourds, sur ceux qui sont atteints de troubles spécifiques du langage (specifie language impairment, SLI) et sur les patients aphasiques devraient fournir dans un avenir proche des indications précieuses et précises sur la façon dont le langage est représenté dans le cerveau et dans quelles zones. Maintenant que les différentes questions qui définissent aujourd'hui le programme de la Grammaire Générative ont été identifiées, il est possible de prendre du champ et de s'interroger sur leur articulation et leur rôle 16

C'est aussi cette dimension créatrice qui force Descartes à admettre que 1' explication mécaniste, aussi loin qu'on l'étende, ne peut franchir la barrière infranchissable constituée par certains phénomènes mentaux. Elle est à la base de 1' argument en faveur du dualisme corps-esprit Voir chapitre V, section 3 .2. et la discussion des conclusions de Desmond Clarke dans Chomsky 2016: 93-94.

148

D ANS LE LABYRINTHE DU LANGAGE

respectif dans 1' ensemble du dispositif. On est immédiatement frappé par leur caractère hétéroclite. Elles portent certes sur un objet unique, le langage, mais elles sont habituellement prises en charge par des disciplines différentes, reposant sur des corps de principes et des méthodologies distinctes: linguistique, psychologie, biologie théorique, génétique, neurosciences cognitives, paléontologie. Leur coexistence au sein d'un même programme peut surprendre. Celle-ci témoigne en fait de l'ambition de Chomsky de construire un modèle qui affronte une question difficile entre toutes et lui apporte une réponse: qu'est-ce qui est spécifique au langage humain? Cette question initiale en engage plusieurs autres: quel type de système biologique est le langage? quelle est sa place dans le monde de la nature? comment est-il relié à d'autres facultés cognitives, innées ou acquises? partage-t-il certaines de ses propriétés avec les capacités d'autres espèces? Dans la construction d'une réponse appropriée, le linguiste ne peut se dispenser de connecter la théorie grammaticale avec d'autres dimensions, le phénomène d'acquisition chez 1'enfant, les troubles du langage, 1' implantation biologique et neuronale, l'histoire de 1' évolution ... Mais il faut se garder de croire que Chomsky entend révolutionner les disciplines connexes traitant de ces questions, comme il a révolutionné le champ proprement linguistique. Toutes du reste n'ont pas, dans la construction de la théorie linguistique, le rôle moteur que jouent le problèmes de Humboldt et celui de Platon. Il s'agit plutôt de confronter la théorie de la grammaire avec certaines hypothèses avancées dans d'autres champs intéressés au langage et de se demander avec lesquelles le projet minimaliste peut se trouver en accord, afin de vérifier si son orientation générale se trouve confirmée ou si, au contraire, 1' on doit se borner à constater les li mi tes de notre compréhension. Le cas de 1'origine et de l'évolution est assez particulier: Chomsky est amené à défendre une approche en rupture avec les conceptions habituelles et il déploie une énergie considérable pour démontrer que cette approche ne peut être écartée a priori et est au contraire extrêmement plausible. Je dresserai dans le dernier chapitre un bilan sommaire des résultats atteints par chaque composant de ce programme.

CHAPITRE VII

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

1

La Grammaire Générative peut être considérée comme un point de rencontre entre des préoccupations anciennes et oubliées dans 1' étude du langage et de 1' esprit et une compréhension nouvelle rendue accessible par les sciences formelles (The Minimalist Program 1995, p. 4).

Plusieurs périodes peuvent être distinguées dans le développement de la Grammaire Générative, chacune marquée par la publication d'un livre majeur, explorant une direction de recherche particulière, inaugurant un 2 dispositif théorique original et introduisant des outils formels nouveaux.

1.

LA PÉRIODE MATHÉMATIQUE (DE

1955 À 1959)

STRUCTURES SYNTAXIQUES

Le petit livre Structures syntaxiques (1957) marque la naissance officielle de la grammaire générative chomskyenne, même si plusieurs travaux avaient précédé, en particulier l'opus magnum The Logical Structure of Linguistic Theory, datant de 1955, mais publié seulement en 1975. Il correspond à une période que 1' on peut dire computationnelle et mathématique, où la langue est vue comme un ensemble de phrases grammaticales, la tâche du linguiste consistant à en découvrir la grammaire, c'est-à-dire le système de règles capable de générer toutes les phrases bien formées de cette langue et seulement ces phrases. Chomsky insiste déjà sur le caractère 1

Les chapitres VII et VIII, plus «linguistiques» que les précédents, sont aussi nécessairement plus techniques. Le lecteur souhaitant surtout connaître 1' état présent de la recherche en syntaxe peut sans inconvénient se reporter directement au chapitre VIII, en ignorant le chapitre VII qui donne un bref aperçu de 1'histoire du domaine dans les cinquante dernières années. 2 Boeckx & Homs te in (20 10) proposent un découpage périodique différent de celui qui est adopté ici, dans lequel Aspects et Lectures on Government and Binding sont inclus dans une même séquence. A mes yeux, LGB introduit, avec ce qui a précédé, une rupture tout aussi importante que le minimalisme.

150

DANS LE LABYRINTHE DU LANGAGE

d'infinité discrète des langues naturelles, qu'il associe étroitement à la notion de récursivité opérante dans les langages formels. Dans la modélisation qui est proposée, la grammaire générative d'une langue est un système fini de règles dont l'application récursive permet d'engendrer un nombre potentiellement infini de phrases. Ramenant les grammaires structurales antérieures à quelques modèles logiques simples, Chomsky montre que ni les grammaires à états finis ni les grammaires syntagmatiques (grammaires de structure en constituants, phrase structure grammars) ne peuvent exprimer adéquatement certaines caractéristiques évidentes des langues naturelles comme, par exemple, 1' existence de constituants discontinus, les relations à distance, les relations entre phrases. Il conclut que seul un modèle intégrant, aux côtés des règles syntagmatiques, des opérations 3 qu'il appelle transformations permet d'atteindre le résultat cherché. Si Chomsky développe dans Structures syntaxiques une approche quasi-mathématique du langage, fondée sur la théorie des ensembles, il se montre indifférent à la question de son acquisition par les jeunes enfants. Le phénomène n'apparaîtra comme une dimension cruciale de la recherche que dans Aspects, où il deviendra une pierre de touche essentielle dans la construction d'une théorie mentaliste du langage.

2. LA PÉRIODE FORMELLE ET COGNITIVE 2.1.

LA THÉORIE STANDARD (DE

1960 À 1970)

ASPECTS DE LA THÉORIE SYNTAXIQUE

La période suivante, que l'on peut dire formelle et cognitive, est inaugurée par la publication d'Aspects de la théorie syntaxique (1965), qui reste à ce jour le livre le plus accompli de Chomsky, celui où les buts de 1' entreprise générative sont le plus clairement formulés et où se trouve développée la théorie classique de la syntaxe générative, que 1' on appelle habituellement la «théorie standard». Si l'on peut parler de période cognitive, c'est parce que les considérations liées au processus d'acquisition jouent un rôle majeur dans l'argumentation. Rappelons que le but que se fixe la théorie linguistique n'est pas seulement 1'adéquation descriptive, c'est-à-dire la formulation de grammaires proposant des descriptions formalisées des langues naturelles et de la compétence sous-jacente des locuteurs natifs, mais aussi l'adéquation explicative, supposée fournir un modèle linguistique expliquant les 3

Pour plus de détails, voir chapitre IL

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

151

choix opérés par 1'enfant, lors de 1' apprentissage, dans la construction 4 d'une grammaire descriptivement adéquate. Cette préoccupation est sous-jacente à plusieurs des changements techniques évoqués plus bas. Un degré d'adéquation explicative supérieur est atteint, par exemple, par les grammaires qui incluent un niveau de cl-structure et confment la récursion dans le composant syntagmatique. Ce choix et quelques autres ouvrent la voie à une théorie du langage plus restreinte, parce qu'ils limitent les options disponibles dans la construction des grammaires. L'accent mis sur l'adéquation explicative va de pair avec un élargissement des buts que se fixe la recherche générative, désormais insérée dans un cadre cognitif plus étendu. Comme l'observent Boeckx & Homstein (2010), il ne s'agit plus de découvrir les grammaires qui génèrent toutes les séquences grammaticales d'une langue, et seulement ces séquences, mais de découvrir celles qui sont effectivement internalisées et intégrées à la cognition des locuteurs. En bref, deux types de considérations interviennent désormais dans l'évaluation des grammaires: elles doivent intégrer les jugements des locuteurs sur ce qui est grammatical et ce qui ne 1'est pas, elles doivent caractériser ce qui peut être acquis par l'enfant au cours de 1' apprentissage. Si l'on peut parler de période formelle, c'est parce que plusieurs innovations techniques de grande portée sont introduites, qui affment considérablement le modèle initial. Dans Structures syntaxiques, les «transformations d'enchâssement généralisées», qui combinaient des paires de propositions simples en structures propositionnelles complexes, par coordination ou enchâssement, constituaient l'unique moteur récursif de la grammaire. Ainsi, à partir de {{ Jean croit Phrase }, { que la terre est ronde}} , on pouvait obtenir { Jean croit que la terre est ronde }, en appliquant une transformation généralisée substituant au marqueur postiche Phrase une proposition générée indépendamment dans la base. Le diagramme des enchâssements dans une dérivation était appelé «indicateur transformationnel» par analogie avec 1' «indicateur syntagmatique», récapitulant les opérations de réécriture. Les autres transformations, appelées singulaires pour les distinguer des transformations généralisées, opéraient sur des propositions simples présentes dans la base pour dériver leur forme de surface (la transformation passive est l'une d'elles). Dans Aspects, les transformations généralisées sont abandonnées. La fonction récursive n'est plus endossée par la partie transformationnelle de la théorie, elle est désormais localisée dans le composant syntagmatique, le symbole S (Phrase) pouvant figurer à la droite des règles du système de réécriture. L'output de 4

Voir chapitre VI, section 2.

152

DANS LE LABYRINTHE DU LANGAGE

ce composant et des règles d'insertion lexicale qui insèrent les items dans le squelette structural et catégoriel ainsi construit définit un niveau de représentation cohérent et unifié, la cl-structure («structure profonde»), qui figure la structure sous-jacente de la phrase avant l'application des transformations syntaxiques et constitue l'input du composant transformationnel. Ce dernier ne contient plus désormais que des transformations singulaires, qui s'appliquent cycliquement, de bas en haut de 1' indicateur syntagmatique, à partir du domaine propositionnel le plus enchâssé, jusqu'à englober l'ensemble de la structure. Selon Chomsky, ce dispositif grammatical est plus simple, puisqu'il fait l'économie des transformations généralisées et résout une difficulté sérieuse de 1' organisation précédente, 1' absence de certaines interactions entre transformations singulaires et transformations généralisées, autorisées par la théorie, mais non attestées (voir Chomsky 1965: 182). Poser que c'est le composant syntagmatique qui prend en charge tous les phénomènes de récursion, en association avec l'application cyclique des transformations singulaires, permet de mieux caractériser formellement 1' interaction entre 1' enchâssement des propositions et les transformations singulaires. On peut ainsi expliquer pourquoi il est facile de trouver des exemples de situations où des transformations singulaires doivent opérer, de façon ordonnée, dans une proposition constituante avant qu'elle ne soit enchâssée ou dans une proposition matrice après qu'une autre proposition y a été enchâssée, mais pourquoi on ne rencontre pas de cas où une transformation singulaire devrait s'appliquer à une phrase matrice avant l'enchâssement d'une transformée de phrase. Cela tient à ce que 1' ordre des transformations singulaires opérant dans des propositions distinctes est déterminé par le cycle transformationnel. La théorie cyclique pose en effet qu'aucune règle ne peut opérer dans une proposition enchâssée une fois qu'une autre règle a opéré dans la proposi5 tion matrice ou dans l'enchâssée immédiatement superordonnée. Est 5

L'exemple (i) permet d'illustrer l'interaction entre l'enchâssement et les transformations singulaires dans la théorie d'Aspects. (i) Jean semble avoir été arrêté (ii) [NP semble [NP avoir été arrêté Jean]] (iii) [NP semble [Jean avoir été arrêté]] (iv) [Jean semble [avoir été arrêté]] (NP désigne une catégorie qui n'est remplie que dérivationnellement.) Deux transformations singulaires sont impliquées dans la dérivation de (i), qui ciblent l'une et l'autre l'élémentJean: la passivisation qui opère dans la proposition enchâssée et affecte l'argument direct de arrêté promu au rang de sujet grammatical de avoir été arrêté-, voir (ii) et (iii); la montée qui opère dans la proposition matrice et déplace l'argument précédent dans la position sujet de semble, voir (iv). La notion de cyclicité impose l'ordre adéquat:

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

153

également laissée ouverte la possibilité que les transformations singulaires opérant dans une même proposition soient elles-mêmes ordonnées. Autre innovation majeure introduite dans Aspects: l'intégration du lexique comme composant autonome dans la théorie syntaxique. Dans les modèles précédents, LSLT et Structures syntaxiques, mots et morphèmes grammaticaux étaient introduits par les règles syntagmatiques. Dans Aspects, des règles d'insertion lexicale, que l'on peut assimiler à un type particulier de transformation, sont définies. Les entrées lexicales ellesmêmes incluent toute l'information spécifique aux items lexicaux individuels, en particulier le cadre de sous-catégorisation spécifiant 1' environnement catégoriel dans lequel tel ou tel item peut être inséré. La grammaire du français inclut par exemple la règle syntagmatique (1), permettant de construire un groupe verbal ayant pour tête un verbe bitransitif comme comparer. Parallèlement, 1'entrée lexicale associée à comparer contient un trait de sous-catégorisation stricte de la forme (2). (1) VP )VNPàNP (2) comparer, [+ NP à NP]

Pour chaque séquence dominée par VP, il existe un trait de sous-catégorisation stricte attaché au verbe correspondant. Stowell et Chomsky remarqueront plus tard qu'il y a une redondance considérable entre les cadres de sous-catégorisation et les règles syntagmatiques. Ce qui indique que l'on peut faire l'économie de l'une de ces sources d'information. Or si l'une doit être éliminée, ce ne peut être que le système de règles syntagmatiques. Un pas que, selon Lasnik (20 18), Chomsky ne pouvait franchir au milieu des années 60, parce qu'à l'époque, les règles syntagmatiques et la notion de structure syntagmatique occupaient encore une position centrale dans 1' ontologie du modèle. 2.2.

LA THÉORIE STANDARD ÉTENDUE (DE

1970 À 1979)

Les articles des années 70, qui définissent la «théorie standard étendue», proposent un approfondissement de la théorie dans la triple direction d'une division du travail plus fine entre le Lexique et le compo1' opération qui affecte le domaine enchâssé intervient nécessairement avant 1' opération qui cible une position ou un élément de la phrase matrice. Les opérations singulaires affectant le domaine enchâssé et le domaine matrice sont elles-mêmes ordonnées à 1' intérieur de ces domaines. Ainsi l'accord du participe passé arrêté avec Jean en (iii) ne peut intervenir qu'après le déplacement de Jean dans la position de sujet grammatical de l' enchâssée. Il en va de même en (iv) pour l'accord entre le verbe matrice et son sujet.

154

DANS LE LABYRINTHE DU LANGAGE

sant transformationnel, d'une réduction drastique du nombre de transformations et d'une précision plus grande des contraintes qui en restreignent le fonctionnement. L'article «Remarks on Nominalization» (1971) introduit deux innovations essentielles, la théorie X-barre et l'hypothèse lexicaliste. Les nominalisations comme the enemy s destruction of the city ne sont plus, comme précédemment, produites transformationnellement, mais par un processus de nature lexicale. Plutôt que d'étendre l'appareillage transformationnel pour dériver cette expression nominale de la phrase the enemy destroyed the city, Chomsky choisit de raffmer les règles syntagmatiques de façon à accommoder directement les nominaux dérivés, simplifiant de ce fait le composant transformationnel. La position « lexicaliste » défendue dans l'article exploite les idiosyncrasies manifestées par les nominalisations. Il n'est pas toujours facile en effet de déterminer quelle serait la source propositionnelle de certaines nominalisations, ni d'expliquer l'absence inattendue d'autres nominalisations. La théorie X-barre, quant à elle, donne corps à deux idées essentielles. D'une part, les compléments, c'est-à-dire les syntagmes sélectionnés par une tête lexicale, occupent une position interne plus proche de la tête que ne le sont les modificateurs, les spécificateurs et les adjoints. D'autre part, les catégories syntaxiques complexes correspondent à la projection de l'item lexical identifiable comme leur tête: elles ont une structure endocentrique. Les catégories lexicales majeures, N, V, Adj, P, sont intégrées à des syntagmes qui ont tous la même structure interne. Un premier niveau de structure est constitué par la tête X et, quand elle est transitive, son complément; un deuxième niveau inclut la projection précédente et son spécificateur, qui peut être rempli ou ne pas l'être. Le niveau supérieur (de rang 2), celui auquel d'autres syntagmes peuvent être adjoints au syntagme de départ, est également une projection de la tête. (3)

6

(i) X' ) X (Y") (ii) X" ) (Z") X' la projection Y" est le complément de la tête X; la projection Z" est le spécificateur de la tête X (ou de la projection X") ; on fait l'hypothèse que la projection de rang 2, X", est la projection maximale de X, au sens où X" n'est pas dominé par une autre projection de X ; les notations X" et XP réfèrent donc au même objet syntaxique. 6

Pour des raisons typographiques évidentes, on substitue habituellement à la notation «barre» une notation par apostrophes, suivant en cela une pratique introduite par Lisa Selkirk: X" est la projection de rang 2 de X, X' celle de rang 1.

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

155

Ce schéma structural est posé comme universel et n'a pas à être appris. Le travail de J ackendoff ( 1972) sur les règles interprétatives a également eu une influence décisive sur le développement de la théorie. Au milieu des années 60, Chomsky souscrivait pleinement à la thèse de Katz et Postal posant que les transformations n'ont pas d'incidence sur la signification des énoncés. Le slogan de l'époque était que «les transformations ne modifient pas le sens». Il existe bien un aspect de la signification qui est représenté dans la cl-structure et demeure constant tout au long de la dérivation, celui qui est lié aux relations de dépendance thématique entre les têtes lexicales et leurs arguments (et que 1' insertion des traces est destinée à préserver, voir plus bas (5a), (5b)). Mais Jackendoff a établi que l'interprétation sémantique ne pouvait être (exclusivement) construite à partir de la cl-structure, avant la mise en oeuvre des processus transformationnels. Ces derniers peuvent en effet modifier l'ordre et les relations hiérarchiques entre expressions quantifiées, donc l'interprétation globale de l'énoncé qui les contient. Les deux énoncés (4), le premier actif, le second passif, n'ont pas les mêmes conditions de vérité (le premier peut être vrai quand le second est faux). (4)

a. Beaucoup de flèches n ' ont pas atteint la cible. b. La cible n'a pas été atteinte par beaucoup de flèches.

Ce contraste indique que la représentation sémantique des énoncés peut ne pas être récupérable à partir de leur cl-structure et doit être prise en charge par la s-structure («structure de surface», elle-même objet abstrait puisqu'elle peut contenir des traces, voir le paragraphe suivant), à condition qu'elle soit suffisamment enrichie, ou par un niveau de représentation sémantique spécifique, dérivé de la s-structure, la Forme Logique. Une innovation théorique de grande portée, exposée pour la première fois dans l'article« Conditions on transformations» (1973), est l'idée que la grammaire des langues naturelles doit intégrer un mécanisme de conservation, permettant d'enregistrer l'histoire dérivationnelle des têtes et des syntagmes, quelle que soit la catégorie à laquelle ils appartiennent. Cette histoire se réduit à peu de chose quand l'élément considéré n'a pas été déplacé. Elle est bien sûr beaucoup plus intéressante lorsqu'il y a eu movement. Dans ce cas, l'hypothèse est que le déplacement laisse dans la position originelle de l'élément déplacé un élément nul, un tenant-lieu silencieux appelé «trace». Que le site d'arrivée du déplacement soit une position A (un site argumentai) ou une position A' (une position périphé-

156

D ANS LE LABYRINTHE DU LANGAGE

rique qui, par définition, ne peut abriter un argument), l'insertion obligatoire de la trace dans la position originelle peut être rapportée au fait que cette position doit rester accessible tout au long de la dérivation, sa présence étant requise par les propriétés sélectionnelles de la tête locale. La trace a pour fonction principale de préserver la structure permettant de récupérer 1' interprétation argumentale/thématique de 1' élément déplacé. 7 C'est le cas dans les exemples suivants : (5)

a. Cette lettre a été écrite [NP t] par Cicéron. ' b. A quel professeur Pierre a-t-il envoyé son essai [qu t]?

L'expression cette lettre en (5a) est interprétée comme l'argument Thème du prédicat écrire dans la phrase passive, comme dans sa contrepartie active. L'expression à quel professeur en (5b) reçoit le rôle Destinataire du fait de sa mise en relation avec la trace interne au groupe verbal. On admet également qu'une trace apparaît dans les configurations impliquant un mouvement long. Pour des raisons sur lesquelles nous allons revenir, tout mouvement long, non borné en apparence, doit être analysé comme une succession de mouvements cycliques, qu'on ait affaire à un mouvement A (dans ce cas, la trace intermédiaire satisfait la condition que toute proposition ait un sujet, cf. (6a)), ou à un mouvementA'( dans ce cas, la trace intermédiaire assure le liage local de la variable dans la position argumentale ou dans un spécificateur intermédiaire par 1' élément en position périphérique, cf. (6b )). (6)

a. Cette lettre semble [[NPt] avoir été écrite [NP t] par Cicéron]. b. [Qui crois-tu [[qu t] qu'Oreste pense [[qu t] qu'Andromaque aime [qu t ]]]] ?

La théorie reconnaît deux types principaux de traces: les traces de NP (présentes par exemple dans les constructions passives) et les traces d'élément qu- (présentes dans le site originel des éléments interrogatifs ou dans des spécificateurs intermédiaires), auxquelles il faut adjoindre (i) les traces laissées par le déplacement des VPs, dans les langues comme l'anglais, où la topicalisation des groupes verbaux est légitime (Solve this difficult problem, he did [VP t ]), et (ii) les traces de têtes, par exemple, les traces verbales dans les langues où le mot verbal monte dans la tête

7 En (Sa), la notation [NP t] représente la trace de l'expression nominale déplacée. En (5b), [qu t] note la trace de l'expression interrogative déplacée.

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

157

8

Flexion (section 4.3). Sont ainsi introduites dans la grammaire les notions d'élément nul et de «catégorie vide». La recherche ultérieure isolera d'autres types d'élément nuls, l'élément PRO, hôte de la position sujet dans les constructions à contrôle (cf. (7)), et l'élément pro qui n'est rien d'autre qu'un pronom nul, argumentai ou explétif, pouvant occuper entre autres la position de sujet des propositions à temps fini dans les langues romanes autres que le français (cf. (8)). (7) (8)

Pierre a daigné [[PRO] lire l'essai de Paul]. a. [pro] ha telefonato ieri. a téléphoné hier «Elle/il a téléphoné hier.» b. [pro] ha telefonato Gianni. a téléphoné Gianni «C'est Gianni qui a téléphoné.»

9

La découverte que les langues naturelles ont un fonctionnement par domaines a donné lieu à la définition de contraintes de localité, principes généraux qui restreignent l'application de certains processus grammaticaux ou interprétatifs à un domaine syntaxique spécifique. Le premier de ces 10 principes, le principe A sur A, fait son apparition dans Language and Mind. 8

L'adoption d'unes-structure enrichie par des traces contribue à réduire 1' importance de la cl-structure pour l'interprétation sémantique et ouvre la voie à son élimination définitive, accomplie dans le programme minimaliste. 9 En (8a), pro est un pronom argumentai qui endosse le rôle thématique que le verbe telefonare assigne à son sujet. En (8b), c'est le sujet postverbal Gianni qui endosse ce rôle; pro est alors un élément explétif, ne portant par définition aucun rôle thématique. On admet traditionnellement que la légitimité de pro dans les deux constructions a partie liée avec la richesse de l'accord verbal en italien. Le modèle actuel rend disponibles plusieurs options pour représenter cette corrélation. Mais il faut prendre garde que certaines langues autorisent des sujets nuls alors que la flexion verbale est pauvre ou même inexistante (c'est le cas du chinois), que d'autres qui disposent apparemment d'une morphologie verbale riche n'admettent pas les sujets nuls, que d'autres autorisent les sujets nuls non référentiels et génériques, mais pas les sujets nuls référentiels (c'est le cas du finnois, de l'islandais, du portugais du Brésil), que d'autres enfin, comme le russe et l'hébreu, n'admettent la nonréalisation du pronom sujet qu'à la première et à la deuxième personne. 10 Le principe A sur A est une contrainte sur les règles grammaticales, en particulier sur les opérations transformationnelles, posant que, dans les situations où une catégorie A est enchâssée dans une autre instance de la même catégorie A, une règle qui réfère à la catégorie A ne peut cibler que l'instance la plus haute de A. Il est exclu par exemple d'extraire par mouvement un groupe prépositionnel d'un autre groupe prépositionnel. On ne peut dériver (ii) ou (iii) d'une structure analogue à (i) (on fait ici l'hypothèse que en est un pro-PP). (i) Jean a parlé au frère de Paul. (ii) *Jean en a parlé au frère [PP t ]. (iii) *De qui Jean a-t-il parlé au frère [PP t ] ? Les effets de cette contrainte ont été par la suite dérivés de la Condition de sous-jacence.

158

DANS LE LABYRINTHE DU LANGAGE

John Robert Ross, dans sa thèse de 1967, Constraints on variables in syntax, qui, au moins descriptivement, reste à ce jour la contribution la plus novatrice sur les phénomènes de localité, en démontre l'inadéquation et propose de le scinder en plusieurs conditions autonomes. Chomsky reprend la question dans l'article «Conditions on transformations» (1973) et introduit l'idée que les conditions présentes dans la liste disparate à laquelle parvient Ross peuvent pour la plupart être ramenées à un principe unique, qui a vocation à l'universalité et n'a donc pas à être 11 appris, la Condition de sous-jacence. Cette démonstration permet de ramener une multiplicité de comportements syntaxiques complexes à un principe explicatif unique, maximalement simple. Allant de pair avec cette proposition, il y a l'idée que tous les déplacements sont bornés et que ceux qui apparaissent comme non bornés sont en réalité la somme de plusieurs déplacements locaux. Le fait que 1' élément déplacé dans un mouvement interrogatif ou relatif ne puisse franchir de frontières d'îlot suffit à démontrer que le mouvement non argumentai (c'est-à-dire le déplacement dans une position périphérique) est lui-même borné et se ramène, quand il s'agit d'un mouvement long, à 12 une séquence de mouvements courts. Dans l'énoncé (6b), l'interrogatif qui est successivement déplacé à la périphérie de chaque proposition enchâssée avant d'atteindre la périphérie de la proposition matrice. Le déplacement argumentai peut aussi franchir plusieurs frontières propositionnelles et donner lieu à un déplacement long (cf. (9a)), pourvu qu'aucune proposition intervenante n'ait de système CP (cf. (9b)). (9)

a. [Le toit de la grange semble [ [NP t] menacer [[NP t] de s'effondrer]]] b. *[Cette lettre semble [cp qu'[[NP t] a été écrite [NP t] par Cicéron]]]

La Condition de sous-jacence fait partie d'un premier ensemble de contraintes qui peuvent être formulées en termes de noeuds-barrières, délimitant des domaines aux frontières infranchissables depuis l'intérieur 11

La Condition de sous-jacence énonce qu'aucune opération de déplacement ne peut faire franchir à l'élément déplacé plus d'un noeud-bamière (bounding node). La liste des noeuds-barrières pour l'anglais se limitait à l'époque à S (proposition) et NP (groupe nominal). Mais il semble que dans d'autres langues, les langues romanes en particulier, c'est le noeud S'(regroupant Set le système complémenteur qui lui est associé, CP dans la notation contemporaine), plutôt que S, qui a ce statut. Pour une discussion des effets de la Condition de sous-jacence, voir par exemple l'analyse de (21) et (25), chapitre VIII, section 6.1. 12 Un îlot est un constituant ou une configuration syntaxique définissant un domaine opaque pour 1' extraction et la création de dépendances. Par définition aucune relation ne peut s'établir à travers les frontières d'un îlot. On parle habituellement des contraintes de Ross comme de contraintes d'îlot (island constraints).

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

159

et impénétrables depuis l'extérieur. Un deuxième ensemble est fondé sur la notion d'intervention, l'idée étant qu'un élément donné se déplaçant vers une position donnée ne peut croiser dans son parcours un élément ou une position d'un certain type. Un cas particulier de cette restriction est la Condition du sujet spécifié, bloquant le déplacement d'une expression nominale par dessus un terme analysable comme sujet. Ainsi à partir de la structure (lOa), on ne peut dériver que (lOb), pas (lOc), qui supposerait un mouvement dans lequel l'objet déplacé croise le sujet de la proposition infinitive. ( 10) a. NP a été vu [Pierre voler cette montre] b. Pierre a été vu [[NP t] voler cette montre] c. *Cette montre a été vue [Pierre voler [NP t]]

C'est dans Barriers que cette dualité est clairement identifiée et formalisée, sous la forme de deux concepts théoriques indépendants, la théorie des barrières et la condition de minimalité. Mais la discussion est déjà largement amorcée dans «Conditions on transformations». «Ün wh-movement» (1977b) établit que les propositions interrogatives, les relatives, les clivées, les pseudo-clivées (auxquelles il faut probablement adjoindre les comparatives), par-delà les analogies qu'elles manifestent, partagent plusieurs propriétés formelles : 1' objet déplacé est un élément wh-/qu-; le site d'arrivée du déplacement est une position à la périphérie de la proposition, identifiable comme le spécificateur du syntagme complémenteur CP; la trace occupant la position originelle après le déplacement a les propriétés d'une variable; le mouvement est local et obéit à la condition de sous-jacence. Ces propriétés communes donnent à penser que c'est la même opération qui est impliquée dans la dérivation de chacune des constructions énumérées en (11). Cette opération est Déplacer qu- (Move-wh). (11) Je me demande à quel étudiant le professeur a parlé interrogative indirecte 1' étudiant auquel le professeur a parlé relative C'est l'étudiant auquel le professeur a parlé clivée La personne à qui le professeur a parlé est 1' étudiant pseudo-clivée

C'est la confirmation que la dérivation de chacune de ces constructions implique un déplacement local, obéissant à la condition de sous-jacence, qui constitue 1' apport essentiel de cet article. La démonstration peut

160

DANS LE LABYRINTHE DU LANGAGE

également être apportée que les diverses constructions impliquant le déplacement d'une expression nominale dans une position argumentale font appel à une opération transformationnelle unique, Déplacer NP. On a longtemps cru qu'il existait entre Déplacer NP et Déplacer qu- une différence majeure: la première règle est bornée, au sens où elle ne peut intervenir qu'à l'intérieur d'un domaine restreint, la seconde donne l'impression de pouvoir franchir plusieurs frontières propositionnelles en une seule étape. Mais il s'agit là, nous le savons désormais, d'une fausse évidence: les deux opérations sont bornées.

3.

LA PÉRIODE MODULAIRE ET PARAMÉTRIQUE (DE

1979 À 1993)

LECTURES oN GovERNMENT AND BINDING

La troisième période, marquée par la publication en 1981 de Lectures on Government and Binding (LGB) et la définition et le développement du modèle dit des «principes et paramètres», est la période modulaire et paramétrique. LGB se donne essentiellement pour tâche de formuler des principes généraux permettant d'alléger et de rationaliser l'appareil transformationnel. Il s'agit aussi d'intégrer les découvertes et les résultats de la recherche antérieure dans un ensemble théorique homogène et cohérent, d' affmer les analyses existantes, d'en proposer de nouvelles lorsque celles qui étaient disponibles n'étaient pas satisfaisantes (c'est le cas du filtre *[NP to VP] dans l'article Filters and Control, coécrit avec Howard Lasnik, destiné à rendre compte de la distribution des structures infinitives) et d'affronter des phénomènes nouveaux, comme le phénomène du 13 sujet nul (conventionnellement étiqueté pro-drop). Cet effort débouche sur la mise au point d'une nouvelle théorie syntaxique, à la fois modulaire et paramétrique. On peut, en ce sens, parler, à la suite de Williams ( 1984), d'un «montage» de plusieurs variantes successives de la théorie, écrites à des périodes différentes. La deuxième ambition de LGB est, plus spécifiquement, de définir un nouveau programme de recherche, soucieux de rendre compte à la fois du phénomène d'apprentissage et de la diversité des langues. Il va de soi, comme le souligne Williams, que ce qui est présenté dans le livre n'est que l'une des variantes possibles de cette 13

C'est aussi le cas du phénomène dit des «lacunes parasites» illustré par l'énoncé (i), où la position objet de lire est une lacune qui ne peut être interprétée qu'en référence à la variable contenue dans la position objet de rangé, phénomène discuté dans Sorne concepts and Consequences ofthe Theory ofGovernment and Binding, petit livre publié un an après, mais qui pourrait constituer le dernier chapitre de Lectures on Government and Binding. (i) Quel livre Jean a-t-il rangé [qu t] sans lire [que]?

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

161

théorie nouvelle. On doit donc distinguer soigneusement entre les idées directrices (leading ideas) et leur implémentation (execution), entre le programme et les analyses particulières qu'il autorise, entre l'approche modulaire et paramétrique, qui vaut encore à ce jour, et, par exemple, les détails de l'analyse du phénomène du sujet nul, dont il ne subsiste à peu près rien. Il reste que LGB est la première présentation plus ou moins complète d'une théorie modulaire embrassant la totalité du champ 14 syntaxique (et une partie du champ sémantique). 3.1.

MoDULES

C'est le programme lui-même qui va d'abord retenir notre attention. L'objectif que se propose désormais la théorie linguistique est de résoudre la tension induite par la double exigence à laquelle se trouve confrontée la construction des grammaires - donner une représentation plausible du processus d'acquisition et, en même temps, rendre compte de la variation linguistique. Pour atteindre ce but, une architecture modulaire est proposée, combinant une batterie de principes innés, assez abstraits, qui constituent la Grammaire Universelle (UG) et n'ont pas à être appris par 1' enfant, et des paramètres ouverts, correspondant à des choix restreints attachés à ces principes, dont la valeur est fixée pour chaque langue particulière au cours de l'apprentissage. La grammaire se présente comme une organisation regroupant plusieurs sous-systèmes autonomes et spécialisés, les modules, en interaction les uns avec les autres - la théorie de la structure syntagmatique, la théorie thématique, la théorie du Cas, la théorie du liage, la théorie des barrières -, chacun avec son vocabulaire de notions et ses principes propres qui, pris ensemble, contraignent l'application de règles très générales et très simples. Les principes pertinents dans la théorie de la structure syntagmatique (phrase structure grammar) sont ceux de la théorie X-barre (X-bar theory), qui, rappelons-le, déterminent la constituance des projections lexicales, c'est-à-dire le cadre catégoriel dans lequel les items lexicaux peuvent etre Inseres. Le principe qui intervient dans la théorie thématique (theta-theory) est le thêta-critère (theta-criterion), requérant qu'il existe une correspondance biunivoque dans une proposition donnée entre rôles thématiques et arguments. A

14



,

,

La relation entre syntaxe et morphologie est brièvement évoquée dans la présentation du phénomène pro-drop, voir par exemple note 9 et section 4.2.

162

D ANS LE LABYRINTHE DU LANGAGE

Le filtre sur le Cas (Case Fi/ter) imposant que toute expression nominale reçoive un Cas, éventuellement sans réalisation morpholo15 gique, est le principe central de la théorie du Cas (Case theory). Un système de règles d'assignation, sensibles à l'identité catégorielle de la tête se trouvant dans la localité immédiate de 1' expression nominale, est défini: V assigne le Cas structural accusatif, alors que Infl (Flexion), quand elle est finie, assigne le nominatif. La théorie du liage (binding theory) qui concerne exclusivement les relations d'antécédence impliquant une expression nominale et un antécédent potentiel dans une position argumentale, associe à chaque type un principe spécialisé : les éléments anaphoriques comme le se réfléchi ou l'expression réciproque l 'un l 'autre doivent trouver un antécédent local (c'est ce qu'énonce le principe A de cette théorie); les pronoms personnels de troisième personne, au contraire, n'admettent pas d'antécédent local, ils ne peuvent co référer qu'avec un antécédent qui n'est pas trop proche structuralement (comme le spécifie le principe B); les expressions référentielles ne peuvent pas avoir d'antécédent du tout (c'est le contenu du principe C). On voit que la typologie des expressions pertinente dans un module n'est pas celle qui est pertinente dans un autre module: le filtre sur le Cas concerne toutes les expressions nominales, mais non les domaines propositionnels; la théorie thématique concerne toutes les expressions définissant des arguments potentiels: c'est le cas de la majorité des expressions nominales (à 1' exception des éléments explétifs, explicites ou silencieux, et des traces anaphoriques), mais aussi des domaines propositionnels; les principes de la théorie du liage établissent une typologie spécifique des expressions nominales. Touchant la typologie pertinente pour le liage, on s'attend à ce que les éléments nuls puissent également y être intégrés. Or c'est bien le cas. Au regard du liage, les traces de NP se comportent comme des éléments anaphoriques et doivent avoir un antécédent local, condition qui n'est pas satisfaite en (lOc), répété ici en (12): (12) *Cette montre a été vue [Pierre voler [NPt]]

Un pronom, qu'il soit explicite ou nul, peut être c-commandé par son antécédent. Mais il ne peut lui-même fonctionner comme antécédent d'une 15

La notation « Cas» avec majuscule renvoie au cas abstrait qui, suivant les langues, peut être morphologiquement réalisé ou ne pas l'être, non pas au cas morphologique, noté « cas».

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

163

expression référentielle qu'il c-commande. La coréférence entre pro et Piero est possible en (13a), exclue en (13b ). Ce comportement est parallèle à celui du pronom il et de l'expression référentielle Pierre en (14a). (13) a. Piero crede che [NPpro] ha vinto la corsa. Piero croit que a gagné la course «Piero croit qu'il/elle a gagné la course.» b. *[NP pro] crede che Piero ha vinto la corsa. croit que Piero a gagné la course «Elle/il croit que Piero a gagné la course.» (14) a. Pierre croit qu'il va gagner b. Il croit que Pierre va gagner.

La mauvaise formation des exemples ( 13 b) et ( 14b) nous renseigne certes sur les conditions dans lesquelles un pronom peut fonctionner comme antécédent. Elle confirme surtout qu'une expression référentielle doit être libre de tout liage par une expression occupant une position argumentale, que cette expression soit pronominale ou non. Les traces d'élément qu, assimilables à des variables, instancient la même restriction. Il est exclu en (15) d'établir une relation de liage entre le pronom il et l'interrogatif qui, qui signifierait que la variable liée par qui inclut dans ses valeurs le référent de il. (15) Qui croit-il que Marie aime [qu t]?

La théorie des barrières (bounding theory) est organisée autour de la Condition de sous-jacence (Subjacency Condition) et d'autres principes de localité. Une dimension importante de la recherche sur ce point consiste à identifier les projections maximales qui fonctionnent comme catégories-barrières. Une théorie linguistique modulaire est donc une théorie dans laquelle l'infinie complexité des langues humaines est répartie entre différents modules. Or plus la théorie est modulaire, et plus le type de variation autorisé à 1' intérieur de chaque module est réduit.

3.2.

PARAMÈTRES

La variation entre les langues est elle-même endossée par des paramètres, enregistrant le fait que certaines propriétés peuvent prendre une valeur dans une langue donnée et la valeur opposée dans une autre. Ainsi certaines langues choisissent de placer l'objet nominal dans les phrases transitives à la droite du verbe - c'est le cas du français et de 1' anglais,

164

DANS LE LABYRINTHE DU LANGAGE

langues VO -, d'autres de le placer à gauche - c'est le cas du japonais et du turc, langues OV. Certaines langues déplacent les mots ou expressions interrogatives dans la syntaxe explicite - c'est le cas de toutes celles qui instancient le mouvement qu -,d'autres au contraire forment les interrogatives en laissant 1' interrogatif (ou 1' indéfini qui en tient lieu) dans sa position originelle - c'est le cas du chinois. Dans ces deux cas, un paramètre est impliqué, le «paramètre de la tête», le «paramètre interrogatif» ... Il en va de même pour la diversité des constructions passives dans les langues du monde, parmi lesquelles figurent des constructions ne mettant enjeu aucun mouvement, et d'autres comme les passifs en se qui n'utilisent pas l'auxiliaire être. L'interaction des divers modules avec les paramètres attachés est à 1' origine de la variation. C'est cette interaction qui constitue désormais le véritable objet d'étude, plutôt que «le passif» lui-même. L'opposition entre le français et toutes les autres langues romanes touchant la possibilité des propositions à temps fini à sujet nul est également prise en charge par un paramètre. Rizzi (1982) observe que cette propriété (voir (8a)), quand elle est observable, va de pair avec d'autres, la légitimité de l'inversion libre du sujet et du verbe fini (voir (8b)) et la possibilité de l'extraction des sujets qu- par dessus un complémenteur explicite (voir (16a)), une option exclue en français (voir (16b)). ( 16) a. Chi cre di che [qu t ] abbia letto Il disprezzo? qui tu crois que ait lu Le mépris «Qui crois-tu qui a lu Le mépris?» b. *Qui crois-tu qu( e) [qu t ] a lu Le mépris?

Le fait qu'un paramètre unique puisse couvrir un ensemble apparemment disparate de propriétés et de constructions apporte une confirmation précieuse à cette approche. Une part importante de l'apprentissage consiste pour l'enfant à fixer la valeur de chaque paramètre à partir des données positives de sa langue, c'est-à-dire en observant les formes linguistiques qui illustrent le choix qui est fait pour le paramètre pertinent. Chaque fois qu'un paramètre est fixé, c'est un ensemble de structures qui se trouve exclu, sans que l'enfant ait à apprendre quoi que ce 16 soit sur le statut de ces structures. 16

La première mention de la notion de paramètre se trouve dans un passage de 1' article On wh-movement, datant de 1977. Williams est donc fondé à poser que c'est cet article qui marque le début de l'approche modulaire et paramétrique. «Même si les conditions sont spécifiques à des langues ou à des règles particulières, il y a des limites à la diversité possible des grammaires. Ainsi, de telles conditions peuvent

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

165

3.3. ANALYSES NOUVELLES Considérons maintenant certaines des analyses avancées dans LGB. Une question qui n'avait pas jusqu'alors reçu de réponse satisfaisante est celle du statut particulier du sujet des propositions infinitives, position dont les expressions nominales se trouvent en général exclues. Rouveret & Vergnaud (1980) montrent que la caractéristique définitoire de cette position est qu'aucun Cas abstrait n'y est assigné. Ils montrent aussi qu'en français et en anglais, le sujet infinitival a accès à un Cas dans les structures, en nombre restreint, où un sujet est possible-c'est le cas des infinitives dépendantes d'un verbe de perception, du verbe laisser et des constructions causatives. Cette analyse établit une relation entre les propriétés particulières du sujet des infinitives et la théorie du Cas. Les constructions verbales passives reçoivent une analyse modulaire qui fait appel à la fois à 1'hypothèse des traces, à la théorie du Cas, à la théorie thématique et à la théorie du liage. Dans l'énoncé Cette lettre a été écrite par Cicéron, la présence de la morphologie passive (c'est-àdire de la combinaison être ... é ... ) retire au verbe transitif écrire la capacité d'assigner le Cas structural accusatif. L'argument direct, inséré initialement dans la position objet, doit donc se déplacer pour satisfaire le filtre sur le Cas. La position de sujet grammatical, quant à elle, qui, dans les structures considérées, est la position sujet du verbe être, n'est pas une position thématique (c'est-à-dire une position où un rôle théma.... tique est assigné). Etre appartient en effet à la classe des prédicats que 1' on appelle inaccusatifs et qui ont pour caractéristique de sélectionner un argument direct nominal ou propositionnel, mais pas d'argument externe. Ils ont aussi une deuxième caractéristique, celle de ne pas assigner de Cas accusatif dans la position objet, d'où leur nom. La construction passive peut donc être considérée comme un cas particulier de construction inaccusative. L'argument direct, qui conserve son rôle thématique originel, doit se déplacer et il peut se déplacer dans la position sujet sans violer le thêta-critère, puisque cette position n'est pas elle-même un site thématique. L'élément nul laissé dans la position objet est une trace anaphorique, qui est, comme le requiert la théorie du liage, liée par un antécédent

être considérées comme des paramètres qui doivent être fixés (pour la langue ou pour des règles particulières, dans le pire des cas) au cours du processus d'apprentissage[ ... ]. On a souvent supposé que les conditions sur 1' application des règles doivent être très générales, universelles même, pour être significatives, mais cela n' a pas besoin d'être le cas si l' établissement d' une condition 'paramétrique' permet de réduire substantiellement la classe des règles possibles » (Chomsky 1977b : 17 5).

166

D ANS LE LABYRINTHE DU LANGAGE

local, le sujet de la proposition. On en arrive à la représentation (5a), répétée ici en (17). (17) Cette lettre a été écrite [NP t] par Cicéron.

Deux évolutions parallèles, amorcées l'une et l'autre dans les années 70 (voir section 2.2.) concernent les règles syntagmatiques et les transformations. Elles contribuent à réduire considérablement le rôle des règles dans la grammaire, faisant de cette dernière une organisation modulaire, plutôt qu'un système de règles, comme c'était le cas dans les modèles précédents. Stowell (1981) reprend le problème de la redondance entre l'information contenue dans les règles syntagmatiques et celle qui est rendue accessible par les règles lexicales, spécifiant la sélection catégorielle des têtes verbales ou nominales. Il montre qu'on peut se dispenser entièrement des premières au profit des secondes, en maintenant un schéma général spécifiant la structure interne des constituants complexes. Or on dispose déjà d'un tel schéma. Il s'agit de la théorie X-barre. Touchant les transformations, il est possible de simplifier radicalement leur formulation (et donc, de faciliter leur acquisition) en éliminant de leur description structurale toute référence aux propriétés spécifiques des constructions particulières et en factorisant les conditions de localité et autres qui apparaissent de façon récurrente dans leur description structurale, au profit de contraintes très générales sur 1' application des règles. Comme on l'a indiqué précédemment, on en arrive à formuler deux opérations, Déplacer qu- et Déplacer NP, qui elles-mêmes peuvent être ramenées à une opération très peu spécifiée, Déplacer a, ou même Affecter a, qui peut se lire comme une instruction de déplacer n'importe quoi, n'importe où, n'importe quand. Les résultats indésirables doivent bien sûr être bloqués et ils le sont par des principes qui sont désormais des conditions générales sur les opérations transformationnelles, non des contraintes spécifiques sur des règles particulières. De là, la nécessité absolue, pour éviter la surgénération, de développer une théorie cohérente et articulée de la localité. Ces deux évolutions, qui contribuent à retirer tout statut théorique à la notion de «construction grammaticale» (il n'y a plus en effet désormais de transformation passive, d'opération de relativisation ou de formation de question), excluent de localiser la source de la variation entre les langues dans des différences dans leur système transformationnel ou dans leur composant syntagmatique et accentuent le rôle des paramètres associés aux principes eux-mêmes.

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

167

Un nouveau schéma propositionnel est proposé, qui s'appuie sur l'hypothèse du branchement binaire défendue par Kayne 1984 (selon laquelle un noeud ne domine au maximum que deux autres noeuds). (18) InflP ) NP Infl VP

17

On ne peut avoir affaire ici à une règle de réécriture puisque les systèmes de réécriture n'ont plus droit de cité dans la théorie. La notation utilisée est donc trompeuse. Il faut comprendre que dans ce schéma, la tête fonctionnelle Infl (Flexion) a pour complément la projection VP de la tête lexicale V et que le NP sujet occupe la position spécificateur de la projection InflP. Cette organisation catégorielle de la proposition a été étendue, au cours des années 80 et 90, à d'autres domaines, le syntagme nominal en particulier, où, dans les versions les plus simples, la projection NP (Groupe Nominal) est construite comme le complément de la tête D 18 (Déterminant). (19) DP ) D NP

Les représentations structurales et catégorielles de chaque domaine syntaxique sont désormais considérées comme résultant de l'intégration de projections lexicales NP, VP ... dans un squelette configurationnel défini par des têtes fonctionnelles (la flexion temporelle et la flexion d'accord, les déterminants, les complémenteurs) et leur projection InflP, DP, CP ... Les têtes lexicales spécifient le contenu de substance des différents domaines syntaxiques ; les têtes fonctionnelles introduisent des spécifications comme le temps, 1'aspect, le mode, la dé finitude, et abritent des mots outils comme les marqueurs de subordination ou les marques d'accord. Les relations complexes entre les têtes lexicales et les têtes fonctionnelles qui les dominent déterminent donc à la fois la forme et 1' interprétation des expressions linguistiques et sont pour une bonne part responsables de la variation linguistique. Etant donné le schéma propositionnel ( 18), les langues peuvent différer par le choix concernant le paramètre de la tête (qui ne se manifeste qu'à l'intérieur du VP) et par la valeur 17

Infl est le symbole de la catégorie Flexion (lnjlection). Les propositions finies et infinitives sont analysées comme des catégories endocentriques, projections de Infl. On a bien affaire à une structure binaire parce que Infl et VP forment un constituant qui exclut le NP sujet 18 De nombreux chercheurs admettent aujourd'hui que le nombre dans les structures nominales est représenté sous la forme d 'une tête fonctionnelle autonome, Nb, intervenant entre la projection NP et la tête D.

168

DANS LE LABYRINTHE DU LANGAGE

assignée à un autre paramètre impliquant la tête fonctionnelle Infl, le paramètre «V dans Infl » : la tête Infl peut requérir (comme le français) ou ne pas requérir (comme l'anglais) d'être morphologiquement et syntaxiquement associée à la tête lexicale V, qui «monte» ou «ne monte pas» dans 19 Infl. La réalité est en fait plus complexe, puisque l'anglais qui ne déplace pas les verbes lexicaux dans Infl y déplace les auxiliaires et y insère directement les modaux. Une étude comparative minutieuse des distributions adverbiales et de la négation en anglais et en français, telle que l'a menée Pollock (1989) dans un travail fondateur, permet de construire une analyse systématique et cohérente de cet ensemble complexe de données. ' A la lumière de ces développements, il est plausible de penser, comme le soutient Borer (1983), que la grande majorité des paramètres mettent exclusivement en jeu des propriétés des têtes fonctionnelles. Certes, quelques macroparamètres, parmi ceux qui avaient été proposés initialement, survivent, le paramètre distinguant les langues polysynthétiques des autres, par exemple. Mais les autres dimensions de variation peuvent être assimilées à des microparamètres attachés à des catégories fonctionnelles, prenant en charge des différences ténues entre langues étroitement reliées. Alors que les macroparamètres sont attachés aux principes et as similables à des règles d'un type particulier, les microparamètres ont une implantation purement lexicale. En conclusion, le modèle des principes et paramètres fournit l'équipement approprié pour poser des questions de fond sur l'acquisition du langage et constitue un outil d'une étonnante efficacité pour le développement de la nouvelle syntaxe comparative qu'il a contribué à susciter. L'étude de la variation entre les langues joue un rôle moteur dans les recherches de l'époque, la prédiction étant que les langues naturelles attestées, tout comme les langues aujourd'hui disparues et celles qui n'ont pas encore été étudiées, s'inscrivent toutes dans le patron ainsi dé fmi et instancient la même architecture, étant entendu qu'elles ne représentent qu'un sous-ensemble des grammaires théoriquement possibles. 19

Ce schéma très simple doit être aménagé pour rendre compte des langues dans lesquelles le site d'arrivée du verbe fini est la catégorie périphérique C- c'est le cas des langues Verbe-Sujet-Objet, dites à verbe initial, comme les langues celtiques (irlandais et gallois) ; c'est aussi celui des langues à verbe second, comme les langues germaniques, où le verbe fini occupant la tête C dans les propositions matrices est précédé d'un constituant réalisé dans le spécificateur de CP. Touchant les langues Verbe-Sujet-Objet, l'hypothèse du branchement binaire exclut qu'elles aient une structure plate. On a pu montrer que cet ordre linéaire résulte du déplacement du verbe fléchi dans une tête fonctionnelle plus haute que le site de réalisation de l'argument sujet, qui a été identifiée successivement comme étant la catégorie T (voir Rouveret 1994, parmi d'autres), puis la catégorie C (voir Rouveret 2017).

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

4.

169

LA PÉRIODE MINIMALISTE ET BIOLINGUISTIQUE (DE

1993

À AUJOURD'HUI)

THE MINIMALIST PROGRAM

La quatrième période est la période minimaliste à laquelle on peut aussi associer l'étiquette de bio linguistique, inaugurée par la publication en 1993 de l'article «A minimalist program for linguistic theory», suivie en 1995 par celle du recueil The Minimalist Program et, depuis 1995, par une quinzaine d'articles et plusieurs livres. Le minimalisme ne se distingue pas uniquement des modèles génératifs antérieurs par des choix techniques sophistiqués. Il adopte aussi une épistémologie du minimum, qui va bien au-delà d'une simple exigence de parcimonie et d'économie. Il s'agit tout d'abord de définir des computations efficaces, excluant les étapes superflues dans les dérivations et les symboles inutiles dans les représentations. Mais à cette exigence d'économie dérivationnelle et représentationnelle, nécessaire dans une théorie s'intéressant à un objet du monde naturel, s'ajoute le souci de n'intégrer au dispositif que des principes, des concepts et des procédés formels satisfaisant à un critère de «nécessité conceptuelle virtuelle», exigence qui qualifie le minimalisme comme une entreprise rationaliste, puisque ne sont retenues que les entités en dehors desquelles aucune théorie grammaticale n'est possible. C'est par exemple la nécessité conceptuelle qui rend virtuellement inévitable dans le cadre conceptuel adopté, c'est-à-dire une fois admise l'idée que toute théorie grammaticale traite d'objets, les énoncés, qui associent du son et de la signification -la présence dans l'architecture du modèle d'un niveau de représentation sémantique et d'un niveau de représentation phonétique. Deux niveaux qui, dans les modèles précédents, jouaient un rôle majeur, la cl-structure et las-structure, sont exclus du nouveau dispositif, parce qu'ils ne sont pas conceptuellement nécessaires et aussi, bien sûr, parce que leur présence n'est pas imposée par des considérations empiriques. Chomsky parvient en effet à montrer que, contrairement à ce que l'on pouvait penser a priori, une théorie syntaxique n'ayant pas recours à ces deux niveaux peut, moyennant certains aménagements, couvrir le même domaine empirique qu'une théorie qui les intègre. En réalité, leur existence était justifiée moins par des considérations empiriques que par la nécessité de résoudre des difficultés techniques. On peut se demander pourquoi cette épistémologie du minimum, qui n'a jamais été absente de la conception de la science défendue par Chomsky, se trouve réaffirmée aussi fortement. C'est que, dans les années 90 et 2000, la situation est à l'opposé de ce qu'elle était dans les

170

DANS LE LABYRINTHE DU LANGAGE

années 70 et 80. L'accumulation au cours de la période précédente de généralisations empiriques sur un nombre considérable de langues, la multiplication des outils conceptuels et formels, la croissance exponentielle du nombre de paramètres expliquent et rendent nécessaire l'adoption d'une épistémologie minimaliste. Le programme minimaliste est donc bien une tentative pour refonder la théorie grammaticale en recourant à un minimum d'hypothèses, de principes, de notions. Il va donc s'agir d'éliminer du dispositif grammatical les hypothèses redondantes et celles qui ne sont pas suffisamment justifiées par des considérations d'interface ou d'efficacité computationnelle, en bref de découvrir la structure minimale qu'il est possible d'attribuer à la grammaire. L'examen critique systématique auquel sont soumis les principes et les procédés formels introduits dans le modèle précédent, destiné à vérifier s'ils peuvent être éliminés ou si leurs effets peuvent être dérivés de considérations plus générales, ainsi que les questions sur 1'architecture du dispositif, constituent une composante essentielle de la stratégie minimaliste. Chomsky, dans cette période, renvoie de façon récurrrente à Galilée et la signification de cette référence ne doit pas être minimisée. Elle lui permet d'assigner au langage lui-même deux des propriétés que Galilée (mais aussi Bacon et Descartes) attribuait au monde naturel: la nécessité est à l'oeuvre dans la nature; les objets de la nature sont parfaits. Il y a là une forme de circularité. Le langage doit manifester ces deux caractéristiques parce que c'est un objet du monde naturel. Inversement, s'il manifeste vraiment ces deux caractéristiques, on ne peut plus douter qu'il s'agisse d'un objet du monde naturel. Il est important, afin de mesurer 1' importance des perspectives nouvelles ouvertes par cette hypothèse, de s'interroger plus précisément sur un ensemble de notions et de principes mis en avant dans les premières présentations du programme et toujours reprises depuis et de vérifier comment elles s'articulent les unes aux autres: la thèse minimaliste forte, les notions de perfection, d'optimalité et de nécessité conceptuelle. 4 .1. LA THÈSE MINIMALISTE FORTE

Dans la préface de The Minimalist Program, Chomsky, cherchant à préciser les buts de 1' entreprise minimaliste, distingue plusieurs questions fondamentales en attente de réponse. Il convient de se demander (i) quelles sont les conditions générales que la Faculté de Langage humaine est supposée satisfaire et (ii) parmi ces conditions, (a) lesquelles lui sont imposées par sa place dans l'ensemble des systèmes cognitifs de

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

171

1' esprit-cerveau, (b) lesquelles relèvent de «conditions générales de naturalité conceptuelle qui ont une plausibilité indépendante, à savoir la simplicité, l'économie, la symétrie, la non-redondance, et autres» (Chomsky 1995b: 1). Il va de soi que pour garantir le bien-fondé du programme minimaliste, il est nécessaire d'apporter la preuve que les considérations de nécessité conceptuelle occupent une position dominante parmi les dimensions qui déterminent le design de la Faculté de Langage, réduisant d'autant 1' influence des autres facteurs. C'est bien le point de vue défendu par Chomsky, lorsqu'il énonce la thèse minimaliste forte (Strong Minimalist Thesis , SMT), qui peut être interprétée comme un début de réponse à la question (ii a). (20) La thèse minimaliste forte énonce que le langage est une solution optimale aux conditions de lisibilité (Chomsky 2001 : 1).

Cette formulation combine deux idées distinctes. D'une part, le langage humain se trouve nécessairement en relation d'interface avec d'autres systèmes cognitifs de l'esprit-cerveau. D'autre part, c'est lui-même un système configuré de façon optimale pour satisfaire les conditions de lisibilité imposées par ces autres systèmes. Les grammaires s'en tiennent en effet strictement aux opérations minimalement nécessaires pour produire des objets utilisables par les interfaces. Il s'agit en effet d'aller au-delà de 1' adéquation explicative et d'expliquer pourquoi le langage est comme il est, pourquoi il a précisément les propriétés qu'on lui connaît. Le minimalisme fait le pari que prendre la SMT comme hypothèse de travail, la tenir pour vraie (elle ne peut 1' être totalement) est la meilleure stratégie permettant d'atteindre cet objectif. La SMT est l'une des propositions clés du minimalisme. Les notions de «solution optimale» et de «conditions de lisibilité» peuvent être considérées comme des extensions de ce qui définit la nécessité conceptuelle. Les propriétés du langage, celles du moins qui ne sont pas directement dérivables du fonctionnement du mécanisme computationnel, résultent des relations d'interface qu'il entretient avec les autres capacités cognitives. Plus précisément, on ne peut caractériser adéquatement la Faculté de Langage sans intégrer l'hypothèse que son design, c'est-à-dire son contenu et la façon dont il est organisé, est pour une large part déterminé par la nécessaire relation d'interface qu'elle entretient avec d'autres systèmes cognitifs, le système sensori-moteur SM et le système conceptuel-intentionnel C-I. Les propriétés d'organisation interne de la Faculté de Langage, les mécanismes computationnels qu'elle met en œuvre

172

DANS LE LABYRINTHE DU LANGAGE

représentent les meilleures solutions possible pour répondre à la nécessité de produire à chaque interface des représentations pleinement lisibles et interprétables par les systèmes cognitifs en contact. La contrainte de lisibilité suit presque de façon nécessaire, une fois que la Faculté de Langage est définie comme une capacité cognitive faisant le lien entre le son et la signification, entre la parole et la pensée. Si cette condition n'était pas satisfaite, le langage ne serait tout simplement pas utilisable, ni de façon interne pour construire des pensées complexes, ni de façon externe pour assurer la fonction de communication. L'idée que cette mise en relation est optimale implique idéalement que le langage ne contient pratiquement pas d'autres objets ou d'autres principes que ceux qui sont imposés par la nécessité conceptuelle. Comme l'observe Atkinson (2007), nous sommes en présence d'une construction théorique dont la caractéristique distinctive majeure, par rapport aux autres approches du langage, est de considérer comme axiomatique son interaction avec les systèmes cognitifs connexes. L'enjeu n'est donc pas uniquement de produire une théorie maximalement simple, conceptuellement parcimonieuse et esthétiquement élégante. On peut imaginer des théories linguistiques qui recherchent la simplicité, 1'élégance et 1'économie conceptuelle, mais qui ne s'intéressent pas aux relations de la F acuité de Langage avec les systèmes reliés. Il est facile d'en trouver des exemples. Il faut cependant garder présent à l'esprit que l'ambition du programme minimaliste n'est pas de montrer que la SMT est vraie - elle ne peut l'être complètement-, mais de se demander jusqu'où peut nous mener une stratégie de recherche fondée sur cette thèse. Si son efficacité est confirmée, 1' approche minimaliste s'en trouvera renforcée. Son échec devra au contraire être interprété comme marquant les limites de notre compréhension. En bref, la SMT a le statut d'une hypothèse empirique sur 1' organisation et le fonctionnement du langage. 4.2. PERFECTION DU LANGAGE

La question (iib) évoque d'autres dimensions intervenant potentiellement dans le design de la Faculté de Langage: la simplicité, l'économie. La philosophie des sciences les a rendues familières et, dès les débuts de la grammaire générative, elles semblent avoir été retenues comme essentielles et constitutives de la «bonne science» (voir chapitre II). Mais il ne s'agit pas seulement ici d'un minimalisme méthodologique, qui a guidé la construction de tous les modèles chomskyens depuis l'origine, mais d'un minimalisme que l'on peut appeler minimalisme de substance ou, à

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

173

la suite d'Uriageraka, minimalisme ontologique. Les propriétés d' élégance, de simplicité, d'économie ne sont pas seulement des caractéristiques d'une théorie parfaite, mais aussi des propriétés des objets soumis à analyse. Elles concernent la Faculté de Langage, pas seulement la théorie que l'on peut en proposer. En bref, l'objet d'étude est lui-même weil designed. Selon Chomsky, cette conception peut se recommander de l'intuition de Galilée posant que les objets de la nature manifestent une forme de perfection. Il reste bien sûr à vérifier si cette affirmation est confirmée par les données et à découvrir dans quelle mesure elle 1' est. Comme Lappin, Levine et Johnson, parmi beaucoup d'autres, 1' ont souligné, elle est contraire à tout ce que l'on sait des systèmes biolo20 giques, qui sont généralement poorly designed. Selon Freidin & Vergnaud (200 1), la perfection dont il s'agit ne peut être en dernière instance que de nature mathématique. Chomsky, de son côté, ne fait aucun effort pour clarifier la façon dont la notion de perfection peut s'appliquer à l'objet langage. Mais il suppose que la perfection qui irrigue les lois de la nature prend dans le langage la forme de 1' optimalité computationnelle. Il y a plusieurs façons dont la perfection peut se manifester dans le système computationnel, etc' est en général sous la forme de conditions d'économie qu'elle le fait: préférence pour des dérivations comprenant le moins d'étapes possible, établissement de relations les plus courtes possible, généralisation de 1' approche syntaxique aux phénomènes morphologiques et sémantiques, élimination des imperfections, comme le 21 mouvement qui est intégré à un mécanisme plus général (Merge).

20

Voir par exemple Lappin, Levine & Johnson 2000. 21 Le recours à la notion de perfection quand on parle des objets du monde naturel appellerait des commentaires plus étendus. On peut se demander, à la suite de Robert Martin, si la perfection de nature mathématique qui leur est attribuée peut recevoir la même caractérisation dans un monde clos où la géométrie euclidienne est un dogme indépassable et dans un univers infini où elle est confrontée à la multiplication des géométries non euclidiennes, de Lobatchewski à Riemann, et aux développements axiomatiques des mathématiques contemporaines. Il y a loin, observe-t-il, de la perfection galiléenne à l'incomplétude de GodeL On peut également rappeler qu'une partie des critiques contemporaines adressées à Kant, à sa conception des mathématiques comme doctrine de 1' «intuition» et au rôle qu'il leur attribue dans la construction des concepts repose pour 1' essentiel sur le fait qu'il a situé sa réflexion dans le cadre euclidien, rendu caduc par les développements mathématiques intervenus un siècle plus tard. Rappelons que dans 1' esprit de Chomsky, il ne s'agit pas seulement de dégager la meilleure théorie de l'objet, mais bien de déterminer en quoi l'objet lui-même est parfait On est donc en droit de se demander si la perfection qu'on attribue à cet objet manifeste davantage un design euclidien qu'un design non euclidien. Cette question, qui a des ramifications épistémologiques multiples, ne peut évidemment pas recevoir ne fût-ce qu'un début de réponse dans les limites de ce livre.

174

DANS LE LABYRINTHE DU LANGAGE

On en arrive donc à une double caractérisation de l'objet langage. Parce qu'il est en relation d'interface avec d'autres systèmes cognitifs, il doit satisfaire des conditions de lisibilité qui lui confèrent des propriétés qui sont virtuellement conceptuellement nécessaires. Parce que c'est un objet de la nature, il est parfait ou proche de la perfection. Atkinson (2007) souligne que cette perfection se manifeste aussi par la façon dont il satisfait les conditions de lisibilité, ce qui justifie que la SMT parle de «solution optimale». 4.3.

L'HYPOTHÈSE DE L'UNIFORMITÉ

L'une des hypothèses fondatrices du programme minimaliste, brièvement mentionnée au chapitre I, est qu'il n'y a qu'un langage et que chaque langue particulière n'est qu'une instanciation spécifique d'un pattern général, identique pour toutes les langues. Cette hypothèse invite à s'interroger sur la nature de la Grammaire Universelle et sur l'étendue de la variation qu'elle autorise entre les langues. Chomsky aborde la question dans les premières pages du premier article minimaliste (voir Chomsky 1993: 3). Selon lui, le terrain privilégié de la variation est constitué par les données linguistiques primaires immédiatement accessibles à l'enfant durant l'apprentissage, et qui la déterminent pour une bonne part. On s'attend donc à l'observer dans le composant phonologique (PF) et dans le lexique, caractérisation qui couvre un domaine assez étendu, puisque sont inclus « 1' arbitraire saussurien, les propriétés des formants grammaticaux (flexion ... ) et les propriétés facilement détectables attachées aux items lexicaux (le paramètre de la tête, par exemple)». Mais il serait hasardeux de supposer que la variation puisse pareillement affecter la syntaxe explicite et le composant LF, parce que, dans ce cas, la motivation empirique en faveur de cette hypothèse ne serait au mieux qu'indirecte. Chomsky pose que la variation est cantonnée au composant PF, à l'arbitraire du signe, aux propriétés générales ou particulières des items lexicaux. «Sic' est le cas, il n'y a, au-delà de cette variation restreinte, qu'un seul système computationnel et un seul lexique» (Chomsky 1993 : 3). Cette conclusion soulève à son tour plusieurs questions difficiles : ( i) sous quelle forme les mots sont-ils emmagasinés dans l'esprit, que 22 contient le «lexique mental »? (ii) quels types d'objets sont présents en 22

Cette expression n'est jamais utilisée par Chomsky. Elle est empruntée au titre du livre de Jean Aitchison (2003).

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

175

PF? (iii) quelle est la nature des atomes manipulés par les processus de LF? La première interrogation porte sur la forme que prennent les entités morphologiquement complexes dans le lexique : la racine et le suffixe des mots dérivés sont-ils listés séparément ou ces mots sont-ils déjà complets à ce niveau? qu'en est-il des mots fléchis? sont-ils insérés déjà construits dans les dérivations syntaxiques, comme le suppose le programme minimaliste, ou sont-ils assemblés dans le composant syntaxique, comme le soutient la morphologie distribuée? Pour résoudre ces questions, il est essentiel de garder présente à 1' esprit une observation de Chomsky dans Aspects: La notion même d'« entrée lexicale» présuppose un vocabulaire fixe et universel d'un type quelconque, sur la base duquel des objets sont caractérisés, de la même façon que la notion de «représentation phonétique» présuppose une théorie phonétique universelle (Chomsky 1965 : 217).

La réponse à la question (ii) est relativement aisée : au niveau PF, on a affaire à des mots, matériaux basiques de la parole (ou de la langue des signes), unités complètes morphologiquement complexes. L'hypothèse de l'uniformité a une incidence directe sur ce qui peut constituer une réponse appropriée à la question (iii). On peut supposer que les unités pertinentes au niveau LF sont les «items lexicaux», c'est-à-dire des complexes de traits, lexicaux et fonctionnels. Ces matrices sont à ce niveau dépourvues de traits phonétiques, mais comportent, outre des traits formels, des traits sémantiquement interprétables. Or les items lexicaux varient d'une langue à l'autre. Une position compatible avec l'hypothèse de l'uniformité est que toutes les langues disposent du même ensemble de traits en LF, mais qu'elles sélectionnent chacune un sous23 ensemble particulier dans cet ensemble universel. C'est le point de vue exprimé par Chomsky dans « Minimalist inquiries ». D'autres, comme Sigurosson (2004), estiment que cette théorie est contradictoire et proposent, afin de maintenir l'hypothèse de l'uniformité des formes logiques, que ces dernières contiennent un nombre conséquent de catégories 24 présentes en LF, mais silencieuses en PF.

23

De même, aucune langue ne mobilise l'ensemble des ressources syntaxiques rendues disponibles par la Grammaire Universelle. Chaque langue particulière opère un choix spécifique dans cet ensemble. 24 Ainsi, les langues sans article défini n'ignorent pas la définitude. Si l'on suit Sigurôsson, celle-ci est représentée dans ces langues au niveau LF (la catégorie D est présente et porte le trait adéquat), mais ne se manifeste pas au niveau PF.

176

DANS LE LABYRINTHE DU LANGAGE

4.4. PERTINENCE DE L'ÉVOLUTION

Une autre dimension, remise à l'ordre dujourpar les recherches cognitives, explique également pourquoi la théorie minimaliste a la forme qu'elle a: la question de l'origine et de l'évolution de la Faculté de 25 Langage. Le modèle précédent attribuait à la Faculté de Langage une structuration hautement différenciée et un fonctionnement spécifique, fondé sur la récursivité et la localité des opérations et intégrant une collection de principes sophistiqués. Or on ne s'attend pas à rencontrer un ensemble aussi complexe de propriétés dans un système biologique. Même si 1'on suppose qu'il a été façonné graduellement par des millions d'années d'évolution (un scénario qui n'est pas celui que retient Chomsky), on voit mal comment l'objet résultant pourrait intégrer des principes comme le filtre sur le Cas ou le principe des catégories vides (ECP), dont on ne trouve pas d'équivalents dans les autres systèmes cognitifs. On se souvient également que, selon Chomsky, le créneau temporel durant lequel la Faculté de Langage a pu s'installer au cours de l'évolution a été relativement court, laissant peu de temps pour la formation de principes 6 complexes? Il s'agit donc désormais, non pas d'enrichir la Grammaire Universelle, en lui attribuant le plus de propriétés possible afm de rendre plausible le processus d'acquisition, comme le faisait le modèle précédent, mais au contraire de l'alléger au maximum, afin de donner de l'évolution une représentation plausible. Pour atteindre cet objectif, le minimalisme introduit deux types nouveaux de contraintes. Certaines, on le sait, sont des conditions de lisibilité pertinentes aux interfaces. Puisque toute expression linguistique associe du son et de la signification, il est nécessaire de garantir que les deux représentations que la grammaire met à disposition, la représentation phonétique et la représentation sémantique, soient « lisibles», chacune au niveau d'interface pertinent, c'est-à-dire ne contienne pas des objets ou des symboles que les systèmes avec lesquels la Faculté 27 de Langage entre en relation ne pourraient pas déchiffrer ou interpréter. 25

L'article que Chomsky a coécrit avec Hauser et Fitch, publié dans Science en 2002, contient la première exposition du point de vue minimaliste sur 1' évolution. Il a été suivi par un deuxième article collectif, qui est une réponse à celui de Pinker & Jackendoff (2005), voir Fitch, Hauser & Chomsky (2005). 26 Voir chapitre VI, section 3. 27 Ainsi, la représentation sémantique livrée à 1' interface C-I ne peut contenir d'entité « ininterprétable », comme les pronoms explétifs, par définition dépourvus de toute interprétation; la représentation phonétique transmise au système SM ne peut contenir d'objet «imprononçable», ce qui serait le cas d'un affixe morphologique non attaché à un support lexical.

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

177

La SMT est une pièce maîtresse dans la recherche d'un au-delà de l'adéquation explicative et d'une solution au problème logique de l'évolution. D'autres contraintes interviennent dans le cours de la computation ellemême, mais n'ont rien de spécifiquement linguistique, puisqu'il s'agit de conditions pertinentes pour tous les systèmes organiques, de contraintes assurant 1' optimalité des computations par exemple. Ce sont celles qui, parmi les facteurs qui façonnent la Faculté de Langage, définissent le facteur 3. Ces deux ensembles de contraintes, auxquelles Chomsky tente de donner l'extension la plus large possible, contribuent pour une bonne part à expliquer que la Faculté de Langage soit configurée comme elle l'est.

4.5.

PROGRESSION DE LA RECHERCHE

Le programme minimaliste a été défini il y a plus de vingt-cinq ans. On peut, par-delà les idées directrices qui viennent d'être présentées, distinguer plusieurs étapes dans son évolution. La première qui va jusqu'à «Categories and transformations» (Chomsky 1995b) est dominée par 1'idée que les dérivations grammaticales sont contraintes par des conditions d'économie et que, pour choisir la dérivation optimale, celle qui représente le moindre coût, il est nécessaire de la comparer aux autres dérivations convergentes, c'est-à-dire aux autres dérivations qui réussissent en utilisant la même collection d'items lexicaux. Cette notion d'économie globale, totalement ingérable d'un point de vue computationnel, a vite été abandonnée, au profit d'une économie strictement locale. Mais les considérations d'économie restent, sous une forme ou sous une autre, omniprésentes dans la caractérisation minimaliste du fonctionnement grammatical. Une deuxième innovation remontant aux années 90 est le retour aux transformations généralisées dans la construction de la structure en constituants, une hypothèse introduite dans LSLT et dans Structures syntaxiques, mais qui avait été abandonnée dans 28 Aspects, quand la récursion avait été associée aux règles syntagmatiques. 28

Il est inévitable de recourir aux transformations généralisées dans une théorie où aucun niveau de cl-structure n'est associé aux énoncés et où c'est une opération unique, Merge, qui construit progressivement, de bas en haut, à partir des atomes que constituent les mots ou les items lexicaux, la structure syntagmatique correspondante. L'un des arguments que Chomsky (1965) présentait en faveur de l'élimination des transformations généralisées était que l'abandon d'une classe complexe d'opérations se faisait au bénéfice d'un composant indépendamment nécessaire, le composant syntagmatique. Cet argument ne tient plus aujourd'hui puisque les règles syntagmatiques ont été abandonnées.

178

DANS LE LABYRINTHE DU LANGAGE

Comme l'introduction des phases dans le dispositif (voir chapitre VIII, section 6.1.), le recours aux transformations généralisées marque le caractère fortement dérivationnel du système grammatical dans le programme minimaliste. La deuxième période est marquée par les articles techniques « Minimalist inquiries » (2000b ), «Derivation by phase» (200 1), « Beyond exp lanatory adequacy » (2004 ), «On phases» (2008), qui étendent la palette des procédés et mécanismes formels introduits dans «A minimalist pro , gram for lin guis tic theory » et « Cate go ries and transformations». A 1' opération syntagmatique M erge («Combiner», «Fusionner») qui associe deux objets syntaxiques pour en former un troisième, viennent s'ajouter M ove («Déplacer»), version contemporaine du déplacement transformationnel des modèles précédents, bientôt réanalysé comme une instance de Merge; Agree («Accorder»), 1' opération d'accord qui, en valuant les traits ininterprétables qui doivent l'être pour que la configuration d'ensemble soit interprétable à l'interface C-I, construit des dépendances entre objets syntaxiques; , Label («Etiqueter»), opération nécessaire puisqu'en 1' absence de structure prédéfinie, les projections résultant de Merge sont dépourvues 29 d'étiquette. La notion de phase se substitue partiellement à celle de 30 cycle. La troisième période n'est pas close. Elle est marquée par une réflexion renouvelée sur les notions de label et de projection et par la prise en compte, parmi les conditions qui façonnent la forme des langues, du «troisième facteur». L'idée sous-jacente à l'hypothèse du troisième facteur est que la Faculté de Langage au sens restreint n'est pas la seule dimension susceptible d'expliquer pourquoi le langage est comme il est. Les propriétés générales des systèmes organiques, les conditions réglant les computations efficaces doivent aussi être prises en considération. Il est clair que plus on attribue de propriétés au facteur 3, et moins on est contraint d'en attribuer au facteur 1, domaine spécifique de la Grammaire Universelle. une perspective souhaitable du point de vue minimaliste. C'est là un changement majeur par rapport aux modèles génératifs antérieurs qui ne faisaient aucune référence aux facteurs non linguistiques. C'est aussi un point de vue sans équivalent dans l'histoire de la pensée

29

Des exemples de chacune de ces opérations sont donnés au chapitre VIII. 30 Les phases sont des domaines désignés qui définissent des unités non seulement pour les dérivations, mais aussi pour 1' interprétation sémantique, pour 1' « extemalisation», et pour la sélection lexicale, voir chapitre VIII, section 6.

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

179

sur le langage. Plus généralement, la question générale qui se pose est la suivante: Jusqu'où peut-on aller dans la démonstration que toute la technologie spécifique au langage est réductible à une explication fondée en prin31 cipe ... ? (Chomsky 2005: 11 ).

5.

DES RÈGLES AUX PRINCIPES ET DES PRINCIPES '

AU TROISIEME FACTEUR

L'évolution qui vient d'être esquissée à grands traits est extrêmement complexe, rendue plus opaque encore par le fait que l'ordre des découvertes est en partie arbitraire et que, pas plus en linguistique qu'ailleurs, il ne se confond avec 1' ordre des raisons. Quelques lignes de force se dégagent cependant, qui permettent de découvrir le fil rouge qui donne sa cohérence à l'ensemble du parcours et suggèrent qu'il serait plus approprié de parler de progression que d'évolution. On peut dire qu'on est passé d'un modèle intéressé à la formulation et à la caractérisation des règles (Structures syntaxiques et Aspects) à un autre fondé sur la découverte et la définition de principes universaux (LGB et le modèle des principes et paramètres), puis à un troisième mettant au premier plan la recherche des raisons générales qui fournissent à ces principes leur motivation première (le programme minimaliste). Pendant la période LGB, la mise au jour de principes universels réglant le fonctionnement grammatical de toutes les langues était devenu le sujet de recherche essentiel. La définition d'une approche modulaire et paramétrique permettait de restreindre encore davantage les sources de variation, en associant à chaque module un ou plusieurs principes, éventuellement paramétrisables, qui lui sont propres. Le processus d'apprentissage se trouvait facilité d'autant. La multiplication des études portant sur la variation entre les langues a en fait permis de conclure que le modèle des principes et paramètres propose une caractérisation essentiellement correcte de la Faculté de Langage, ce qui en soi représente un progrès considérable. Mais, comme le soulignent Boeckx & Hornstein

31

Par «technologie spécifique au langage», Chomsky entend tous les principes et les mécanismes qui définissaient la Grammaire Universelle dans le modèle précédent, comme le gouvernement, le principe des catégories vides (ECP), la théorie du Cas, les niveaux barres, les indices ... Les principes en question sont pour la plupart difficiles à formuler et, avec les mécanismes qui les complètent, perdent toute plausibilité quand on s'interroge sur le problème logique de l'évolution du langage.

180

DANS LE LABYRINTHE DU LANGAGE

(20 10), il se contente de dire que la théorie linguistique devrait avoir ce type d'architecture, mais il ne va guère au -delà. Le minimalisme affronte la question de l'origine et de la motivation des principes eux-mêmes. Cette évolution dans les questionnements et le souci d'atteindre un au-delà de l'adéquation explicative paraissent être des traits définitoires de la recherche scientifique, comme en témoigne la citation suivante de Feynman. A mesure que la science progresse, on ne se contente plus d'une formule. D'abord, on a une observation, ensuite on a des données numériques que 1' on mesure, puis on a une loi qui résume toutes les données numériques. Mais la vraie gloire de la science est qu'on peut découvrir une manière de penser telle que la loi est évidente (Feynman 1963 : 26, cité par Boeckx & Homstein 2010).

Einstein, de son côté, parlait de « 1' ambition utopique et apparemment arrogante de savoir pourquoi la nature est comme elle est et pas autrement».32 Plusieurs dimensions explicatives sont sollicitées dans le programme minimaliste: 1' économie des dérivations et des représentations et le souci de construire des computations efficaces (manifesté par la condition du 33 lien minimal, la théorie des phases, le principe de computation minimale ... , qui filtrent les innombrables possibilités de construire des structures déviantes par application de Merge), les exigences de lisibilité imposées par les interfaces du son et de la signification, les limitations de la mémoire à court terme, la nécessité de faciliter 1' acquisition, mais aussi le caractère soudain de 1' apparition du langage dans 1'histoire de l' évoluti on. Parmi ces principes, certains n'ont rien de linguistique, mais paraissent pertinents pour toutes les procédures computationnelles. D'autres au contraire sollicitent directement l'équipement linguistique inné de 1' enfant en apprentissage et font partie de son patrimoine génétique. C'est le cas de 1' opération M erge qui endosse à la fois la construction de la structure et le processus de déplacement. Si cette nouvelle syntaxe est sur la bonne voie, il devient nécessaire de reformuler les principes du modèle précédent (voir note 31). Il y a là un véritable changement de perspective. On se demandait précédemment quel degré de complexité devait être attribué à la Grammaire Universelle pour rendre compte du processus d'acquisition.

32 33

Boeckx & Homstein (20 10) citent le passage d'Einstein dans son entier. Sur cette condition (Minimal Link Condition, MLC), voir chapitre VIII, note 29.

LES GRANDES PÉRIODES DE LA GRAMMAIRE GÉNÉRATIVE

181

C'était aborder la question par le haut. Le programme minimaliste l'aborde par le bas, en cherchant à déterminer quel est le minimum de structure que l'on peut assigner à la Grammaire Universelle pour rendre compte à la fois de la variation linguistique et de 1' acquisition. Ce renversement est inévitable une fois que s'impose 1' idée que toutes les propriétés qui contribuent à façonner le langage et à expliquer pourquoi il est comme il est ne sauraient relever du seul équipement génétique. Pour conclure, on peut observer que, si les contours du programme chomskyen ont été définis très tôt, chaque modification du modèle a été imposée par l'intégration d'une interrogation nouvelle: quel type de modèle peut rendre compte de l'acquisition du langage? quel type de modèle peut rendre compte à la fois de l'acquisition du langage et de la variation entre les langues? quel type de modèle peut rendre compte de surcroît de l'origine et de l'évolution du langage? On peut reprendre à ce propos l'une des critiques adressées à Kuhn par Popper. Il n'est pas exact que les changements de paradigme se produisent toujours à l'issue d'une crise révélant l'usure du paradigme existant. R. Bouveresse (1978: 87) rappelle qu'Einstein cherchait en solitaire à limiter des asymétries qui ne mettaient pas en péril les théories courantes. Le modèle des principes et paramètres, le programme minimaliste, s'il n'est pas déplacé de parler à leur propos de changement de paradigme, ne sont pas nés d'une crise, mais de la seule volonté de Chomsky de construire un modèle plus performant, permettant d'asseoir la recherche sur un fondement rationnel et conceptuel plus solide et autorisant une meilleure intégration de la Faculté de Langage à l'ensemble des facultés cognitives. Le chapitre VIII dresse un état des lieux raisonné de la théorie syntaxique contemporaine, telle qu'elle se dégage des travaux récents 34 menés dans le cadre du programme minimaliste.

34

Pour une présentation plus complète de ce programme, en particulier pour les aspects techniques ici laissés de côté, on peut se reporter à Rouveret 2015.

CHAPITRE VIII

LES INGRÉDIENTS D'UNE APPROCHE INTERNALISTE DU LANGAGE

Une question que 1'on peut poser est celle de savoir si ce que nous attribuons à la Faculté de Langage est motivé par des informations empiriques ou par le type de technologie que nous adoptons parce que nous voulons masquer des lacunes dans notre compréhension et présenter les données de façon utile, et dans quelle proportion. Une spéculation du Programme Minimaliste est que cette question ... peut être abordée de façon productive ... On ne sait pas si c'est le moment de la poser, mais au moins, en principe, elle a une réponse (The Architecture ofLanguage, p. 16).

L'objet de ce chapitre est de dresser un état des lieux rapide de la théorie syntaxique contemporaine, en concentrant 1' attention sur le modèle minimaliste, en mettant l'accent sur les hypothèses théoriques qui font consensus et en mentionnant les points de divergence et les questions laisées ouvertes. On sera ainsi mieux armé pour évaluer équitablement l'apport de la Grammaire Générative à la connaissance du langage et pour mesurer le chemin considérable parcouru depuis la publication de Structures syntaxiques. Mais si l'architecture d'ensemble du dispositif est désormais fermement établie, il n'est pas toujours facile de décider si, dans ce vaste ensemble, une proposition particulière peut être considérée comme un authentique résultat scientifique, constitue une généralisation empirique de grande portée ou équivaut simplement à une présentation plus systématique, plus élégante, plus originale de données linguistiques déjà connues. Cette indétermination tient au fait que chaque proposition s'insère dans un cadre conceptuel intégré, hautement cohérent, fortement structuré, dont il est difficile de la détacher. La notion de trace par exemple ne fait sens que dans une approche dérivationnelle, qui admet l'existence d'opérations de déplacement. Mais si on la replace dans ce cadre conceptuel, elle se révèle d'une exceptionnelle fécondité.

184

1.

DANS LE LABYRINTHE DU LANGAGE

L'ARCHITECTURE DE LA GRAMMAIRE

Dans le modèle proposé aujourd'hui, les opérations de construction de la structure et les processus de mouvement ont pris une forme très différente de celle des règles du modèle initial, celui qui est développé dans Structures syntaxiques. Les règles de réécriture ont été abandonnées, la notion de transformation considérablement épurée. Ces opérations sont en outre intégrées dans un ensemble beaucoup plus complexe et diversifié. L'une des propositions les plus remarquables de la syntaxe générative est que la Faculté de Langage peut être représentée comme un dispositif grammatical doté d'une architecture complexe, du type de celle que lui assigne le modèle des principes et paramètres. Avant l'avènement du programme minimaliste, plusieurs niveaux de représentation étaient distingués (cl-structure, s-structure, LF, PF), qui tiraient leur réalité du fait que des règles particulières s'y appliquaient ou que des principes y faisaient référence. Ces niveaux étaient mis en relation par deux des opérations élémentaires mises à disposition par la grammaire, le déplacement et 1' effacement. Si on soumet cette hypothèse à une critique minimaliste, on est conduit à la conclusion que seuls les niveaux de représentation à 1' interface entre la F acuité de Langage et une autre faculté sont nécessaires: la Forme Phonologique en relation avec le système sensorimoteur et la Forme Logique en relation avec le système conceptuel-intentionnel. 1 Les niveaux «internes» (cl-structure, s-structure) n'ont aucune réalité. Mais l'intuition initiale demeure: on a affaire à un modèle en Y (dans le Y, le pied figure la computation syntaxique et les deux branches la dérivation phonétique et la dérivation sémantique). Cette hypothèse repose sur une observation assez simple. Certains déplacements qui ont une incidence sur le sens n'ont pas de manifestation dans la forme phonétique. Ainsi, dans une proposition contenant deux expressions quantifiées, celle qui est structuralement la plus basse peut inclure la plus haute dans sa portée. La phrase ( 1) est ambiguë entre deux interprétations. (1) Au moins un étudiant a résolu chaque problème correctement.

Dans la première, le quantificateur existentiel un inclut le quantificateur universel chaque dans sa portée (au moins un étudiant a résolu correctement tous les problèmes). Dans la seconde, moins naturelle il est vrai, 1

Dans ce modèle, il ne peut plus exister quoi que ce soit de comparable à la cl-structure, puisque la structure propositionnelle est construite cycliquement, de bas en haut, par 1' opération Merge, qui combine directement les entités lexicales sans recourir à des cadres catégoriels prédéfinis.

185

LES INGRÉDIENTS D'UNE APPROCHE INTERNALISTE DU LANGAGE

c'est le quantificateur universel qui inclut le quantificateur existentiel dans sa portée (pour chaque problème, il y a au moins un étudiant qui l'a résolu correctement). Pour dériver l'interaction des portées dans la deuxième interprétation, on doit supposer, si 1' on fait 1'hypothèse que ces phénomènes peuvent être représentés géométriquement, que 1' expression quantifiée chaque problème s'est déplacée à la périphérie de la proposition, dans une position plus haute que celle occupée par l'expression quantifiée un étudiant. Or ce déplacement est un mouvement silencieux, sans réflexe phonologique ou phonétique. Inversement, certaines propriétés morphologiques ou syntaxiques, visibles dans les représentations phonétiques, sont dépourvues de toute incidence sémantique. C'est le cas de la marque de cas structural attachée aux noms (et aux pronoms, aux adjectifs ... ) dans certaines langues? Une bifurcation intervient donc dans les dérivations avant que ne soient atteints les niveaux d'interface. Dans l'implémentation retenue dans le minimalisme, la Faculté de Langage au sens étroit est donc en relation d'interface avec deux autres systèmes cognitifs, le système sensorimoteur SM et le système conceptuelintentionnel C-I. On appelle Transfert (Transfer) le point de la dérivation où est opérée la séparation entre les structures syntaxiques pertinentes pour l'interprétation sémantique et les structures qui interviennent dans la réalisation phonétique, les unes et les autres étant transmises à l'interface pertinente. On en arrive à un dispositif qui a l'architecture suivante: Lexique

t Numération

Select, Merge, Move, Agree Transfert

)

PF

)

SM

Move LF

C-I

Deux aspects de ce dispositif doivent être soulignés. 2

Le nominatif, 1' accusatif sont des cas structuraux. On doit les distinguer des cas inhérents, auxquels est attachée une valeur sémantique particulière. C'est le cas du datif sélectionné par des verbes comme no cere «nuire» en latin et de certains des cas obliques que 1' on rencontre dans cette langue.

186

DANS LE LABYRINTHE DU LANGAGE

Les représentations transmises au point de Transfert aux deux systèmes d'interface C-I et SM doivent être lisibles par eux. C'est dire que ces systèmes imposent des contraintes sévères sur les structures syntaxiques produites librement par Merge qui leur sont livrées. Elles sont en particulier soumises à des calculs phonétiques et sémantiques, effectués par les deux composants interprétatifs, PHON, qui prend en charge le parcours entre le point de Transfert et le système acoustiquearticulatoire et fournit à ce dernier, sous la forme de traits, des informations de nature phonétique, et SEM qui, opérant entre le point de Transfert et le système conceptuel-intentionnel, met à sa disposition des représentations sémantiques qu'il peut déchiffrer, c'est-à-dire débarrassées de symboles ou d'objets ininterprétables (comme les pronoms explétifs). Il faut donc en réalité distinguer dans l'architecture proposée deux types d'interfaces: les interfaces externes (entre la Faculté de Langage et les autres facultés) et les interfaces internes (entre le système computationnel et les composants interprétatifs PHON et SEM). Ce sont les composants internes PHON et SEM qui construisent les représentations transmises aux deux systèmes externes. Mais l'innovation minimaliste majeure concernant l'organisation de la grammaire est la reconnaissance d'une asymétrie dans la relation de la langue interne à chacune des interfaces. L'hypothèse du design optimal donne les résultats escomptés du côté sémantique, mais elle ne semble pas adéquate quand on considère la dimension sonore. Le mapping vers PHON/SM, qui ,débute à l'étape de la dérivation précédemment appelée Spell-Out (Epellation), conçu comme un processus d' externalisation, est nécesairement complexe, parce qu'il implique 1' aplatissement de la structure hiérarchique et 1' introduction de 1' accent et de la structure prosodique et assure la dérivation de 1'ordre linéaire, non pertinent pour les processus syntaxiques et sémantiques de construction et d'interprétation des expressions. Le mapping vers SEM/C-I est plus simple en apparence puisque c'est directement à partir de la structure hiérarchique produite par la computation syntaxique qu'est construite la représentation sémantique. La syntaxe et l'interprétation, de la numération à la construction de la représentation logique, constituent en fait un parcours homogène, relevant d'un module unique, la «syntaxe étroite», qui a recours à des règles du même type avant et après Transfert et qui exclut la dérivation phonétique sur la branche gauche. L' externalisation occupe une position secondaire par rapport à la sémantique qui a affaire au langage de la pensée. Les emplois du langage qui, comme la communication,

LES INGRÉDIENTS D ' UNE APPROCHE INTERNALISTE DU LANGAGE

187

relèvent directement de 1'externalisation, illustrent une dimension péri3 phérique du langage, probablement étrangère à la langue interne. Malgré les progrès considérables réalisés dans la connaissance du dispositif grammatical, certaines questions décisives pour clarifier 1' organisation globale de la grammaire n'ont pas à ce jour reçu de réponse définitive. L'une d'elles concerne la relation éventuelle entre les phénomènes syntaxiques, qui interviennent au dessus du niveau du mot, et les phénomènes morphologiques, qui interviennent au dessous du niveau du mot. Le programme minimaliste s'en tient à une position lexicaliste, posant que les mots sont introduits déjà construits et déjà fléchis dans les dérivations syntaxiques. Les items morphologiquement complexes ne sont pas construits dans la syntaxe, qui se borne à vérifier leurs propriétés morphosyntaxiques représentées sous la forme de traits. La morphologie distribuée, initiée par Halle & Marantz (1993), développe une réponse différente. D'une part, les mots morphologiquement complexes sont construits dans le composant syntaxique par les mêmes règles que celles qui affectent les mots et les syntagmes, Merge par exemple; d'autre part, c'est un composant morphologique autonome, intervenant sur la branche PF, qui prend en charge les phénomènes considérés traditionnellement comme relevant exclusivement de la morphologie: la présence ou l'absence d'exposant pour une catégorie flexionnelle donnée, les phénomènes de syncrétisme, de fusion, de fission ... La question n'est pas tranchée à ce jour. Il est inutile de préciser que le choix d'une option plutôt que de 1' autre débouche sur des grammaires très différentes, superficiellement du moins.

2.

CoNSTITUANCE

Un deuxième ensemble de généralisations et d'hypothèses concerne la constituance. On sait depuis l'apparition du structuralisme que la compréhension d'un grand nombre de phénomènes syntaxiques, mais aussi sémantiques et phonologiques, repose sur la description de la structure interne des énoncés rendue disponible par 1' analyse en constituants immédiats des phrases et des syntagmes. Une proposition fondamentale, qui remonte au travail de Kayne ( 1984), est que les constituants «bran4 chent» uniformément de façon binaire. Le branchement binaire doit être

3

Voir aussi chapitre VI, section 1.2. 4 Cela signifie que dans les représentations arborescentes, un noeud donné, correspondant à un constituant, c'est-à-dire un noeud « mère », ne domine au plus que deux noeuds « filles». Le trajet allant du noeud mère à l'un des noeuds filles qu'il domine est

188

DANS LE LABYRINTHE DU LANGAGE

vu comme une contrainte universelle de nature purement formelle, déterminant l'organisation structurale des langues naturelles. Il s'agit bien sûr d'une hypothèse empirique qui peut s'appuyer sur diverses considérations. On donne souvent l'exemple des constructions à ellipse du groupe verbal en anglais. (2) Sam might have been playing As time goes by. Sam might have been. Sam might have. Sam might.

Ces distributions sont immédiatement expliquées si l'on admet que seule une séquence formant un constituant peut être effacée et si la structure sous-jacente aux chaînes d'auxiliaires est une structure branchant uniformément à droite, comme en (3). (3) [ might [have [been [ playing NP ]]]]

Comment les structures binaires sont-elles générées? Dans le minimalisme, la construction des structures syntaxiques hiérarchisées est, on le sait, endossée par une opération unique, binaire, symétrique et récursive, Merge, produisant à partir de deux objets a et ~' un objet syntaxique nouveau y résultant de leur union. a et~ peuvent être des items lexicaux (ou une combinaison item fonctionnel + item lexical) tirés directement de la numération ou des expressions complexes construites préalablement et indépendamment. Le résultat y de Merge (a, ~) n'est autre qu'un ensemble non ordonné, que 1' on peut noter {a, ~}. Ainsi, 1' expression {interpréter une sonate} résulte de la combinaison de une et de sonate, produisant l'objet {une sonate}, et de la combinaison ultérieure de cet objet avec interpréter. Merge, qui associe directement des items lexicaux (ou fonctionnels) ou des expressions lexicales (ou fonctionnelles) sans recourir à des cadres catégoriels prédéfmis, tels ceux utilisés par la théorie X-barre, est l'une des 5 innovations majeures du programme minimaliste. Parce qu'elle ne une branche. La structure associée à la combinaison d'un verbe transitif direct et de son objet nominal ou propositionnel est clairement binaire. Mais l'hypothèse de Kayne impose d'associer une structure plus complexe aux constructions verbales bitransitives, dans lesquelles le verbe sélectionne deux arguments. Elle exclut en effet que le noeud VP domine directement le verbe et ses deux objets. Cette hypothèse n'était pas intégrée au modèle d'Aspects, qui utilisait des règles du type de (1), chapitre VIL 5 Les objets manipulés dans les dérivations syntaxiques ne sont plus des items lexicaux insérés par des règles d'insertion lexicale, au niveau de la cl-structure, dans des configurations arborescentes préalablement construites. C'est la combinaison des items lexicaux entre

LES INGRÉDIENTS D'UNE APPROCHE INTERNALISTE DU LANGAGE

189

contient que des éléments lexicaux réduits à eux-mêmes, on appelle bare 6 phrase structure le type de configuration ainsi produite. Ni a ni~ ne sont modifiés par Merge, un résultat qui suit de ce que Chomsky (20 16: 16) appelle le principe de computation minimale (Principle of Minimal Computation), qui impose de réduire au minimum les opérations de 7 computation et d'articulation. Si l'on admet que le langage observe un tel principe, on explique immédiatement pourquoi «l'ordre linéaire n'est qu'une propriété secondaire du langage, ne jouant apparemment aucun rôle dans les computations syntaxique et sémantique» (Chomsky 2016: 17). L'interprétation sémantique dépend de la hiérarchie représentée au niveau LF, pas de 1' ordre dans lequel se présentent les séquences externalisées. Pour des raisons qui sont détaillées dans la section suivante, Chomsky défend également l'idée que l'autre opération élémentaire des premiers modèles génératifs, Move (Déplacer), peut également être vue comme une instance de Merge. Il oppose ainsi le Merge externe, impliqué dans la construction de la structure, capturant le caractère récursif du langage, et le Merge interne, rendant compte des phénomènes de déplacement. Le second, contrairement au premier, ne sélectionne pas deux objets distincts, indépendants l'un de l'autre, mais affecte deux objets tels que l'un est contenu dans l'autre. Le Merge interne sélectionne un objet syntaxique, en extrait une partie, puis combine la partie extraite avec l'objet de départ. Cette situation est illustrée par le mouvement d'une expression interrogative à la périphérie de la proposition. (4) (Nelson ignore) [quelle sonate Martha va interpréter quelle sonate]

L'objet de départ est : (5) [Martha va interpréter quelle sonate] eux par applications successives de Merge qui met progressivement en place les structures syntaxiques. End' autres termes, c'est Merge qui, d'un même mouvement, construit la structure et assure l'insertion lexicale. 6 Voir Chomsky 1995c. Une propriété de la bare phrase structure est que la distinction entre projections maximales et projections minimales n'est plus inhérente aux catégories elles-mêmes, comme dans la théorie X-barre, mais reflète des propriétés relationnelles, récupérables à partir de la structure où elles figurent, sans marquage spécifique. 7 Ce principe bloque en particulier toute altération des structures déjà construites. Une fois qu'un objet syntaxique a été formé par le système computationnel, il ne peut plus être modifié par d'autres opérations de construction de la structure et de mouvement et demeure identique à lui-même pendant le reste de la computation. Ce principe impose indirectement le recours à la théorie du mouvement par copie (ou 1'hypothèse du Merge interne, voir le paragraphe suivant), qui, lorsqu'un objet étendu est formé par mouvement, ne modifie pas l'objet contenant initialement le terme déplacé.

190

DANS LE LABYRINTHE DU LANGAGE

Le Merge interne a pour effet de générer une deuxième copie de quelle sonate, 1'argument direct du verbe interpréter, à la périphérie de la proposition (dans le spécificateur du CP enchâssé), sans qu'il soit nécessaire de postuler une règle spécifique «Copier». Le principe de computation minimale peut à nouveau être invoqué pour expliquer que seule 8 1' occurrence la plus haute de 1' expression soit prononcée. En bref, on retiendra de ce qui précède qu'une seule opération Merge, à la définition très simple, obéissant à des contraintes très générales, est nécessaire et suffisante pour dériver les structures syntaxiques de toutes les langues naturelles, celles qui mettent en jeu une simple combinaison d'items lexicaux ou des objets syntaxiques préconstruits et celles, plus complexes, qui impliquent des opérations de déplacement ou associent des domaines propositionnels entiers. Merge intervient également directement dans la construction du sens des séquences linguistiques, puisque ce sont des fragments de structure résultant d'une ou de plusieurs applications de 9 Merge qui sont successivement transmis au composant sémantique. C'est cette opération, aux yeux de Chomsky, qui constitue le fondement de l'emploi créateur du langage et c'est sa présence chez l'homme qui différencie radicalement le langage humain des systèmes animaux de communication. Enfin, c'est la soudaine émergence de Merge à un point de l'évolution qui explique le surgissement du langage dans l'espèce. Une dimension de la constituance, ignorée dans les modèles précédents, a suscité des discussions intenses : la relation éventuelle entre ordre linéaire et structure hiérarchique. Kayne ( 1994) propose que le premier n'est qu'une spécification parmi d'autres de la seconde, qu'il est donné de façon univoque par cette dernière, sans laisser place à aucune ambiguïté. Or la linéarisation obéit à une contrainte très forte: la syntaxe est antisymétrique, les configurations symétriques ne peuvent être linéarisées. L'hypothèse de l'antisymétrie implique par exemple que deux langues qui ne placent pas l'objet direct du même côté du verbe n'assignent pas au groupe verbal la même structure interne. Ainsi, alors que dans le groupe verbal français ou anglais, le verbe et l'objet direct forment un sous-constituant [V NP], l'objet en japonais a été déplacé à 8

C'est donc de façon impropre que 1' on parle de la «théorie du mouvement par copie» : on a simplement affaire au Merge interne, non à une opération de copie. A' propos du déplacement, Chomsky écrit dans The Architecture of Language: «L'expression [déplacée] est dans toutes les positions - dans la position originelle, dans la position finale, et dans toutes les positions intermédiaires ... L'esprit la voit dans toutes les positions» (Chomsky 2000c: 25). 9 Voir ce qui est dit de la théorie des phases dans la section 6 de ce chapitre.

LES INGRÉDIENTS D ' UNE APPROCHE INTERNALISTE DU LANGAGE

191

la gauche du verbe dans une position plus haute que V, donnant lieu à une configuration [NP [V NP]]. Les structures du groupe verbal français et japonais ne sont donc pas des images miroirs l'une de l'autre. On peut en dire autant des phrases simples dans les langues SVO, comme le français et l'anglais, et dans les langues VOS, comme le malgache. Ce sont les contraintes sur la linéarisation qui imposent que, dans un cas comme dans l'autre, les structures hiérarchiques soient différentes. Pour des raisons dans lesquelles je n'entrerai pas, la structure [V NP] est linéarisable, la structure [NP V] où NP est la sœur de V, ne l'est pas. Il semble que ces contraintes soient indépendantes de Merge, et elles ne mettent aucunement en cause l'hypothèse chomskyenne que Merge suffit à générer toutes les structures syntaxiques des langues naturelles. Un point mérite d'être souligné. Si Kayne a raison, on ne peut plus dire que les langues SVO et SOV et les langues SVO et VOS diffèrent linéairement, mais partagent pour 1'essentiel la même structure hiérarchique. Cette multiplication des structures syntaxiques semble au premier abord introduire un élément de complexité considérable dans l'analyse des données. Mais elle pourrait aussi la simplifier et expliquer en particulier pourquoi le locuteur humain manifeste une telle virtuosité dans la découverte des hiérarchies structurales sous-jacentes aux séquences linéaires. Dans cette approche, en effet, l'ordre linéaire fournit des indices robustes sur 1' organisation hiérarchique des énoncés, que 1' on suppose généralement être invisible et silencieuse. Cette organisation est facilement récupérable, puisqu'elle est directement manifestée par 1' ordre des mots. Chomsky (1995c, 2008, 2013, 2015) développe une approche différente. S'il reconnaît une certaine efficacité à l'hypothèse de l'antisymétrie, il affirme que 1' ordre linéaire est un aspect périphérique du langage et est exclusivement l'affaire du processus d'extemalisation, donc de l'interface SM, comme le confirme le fait que l'alternance entre les ordres VO et OV n'a aucune incidence sur l'interprétation des séquences correspondantes. Il démontre aussi que les différents effets que Kayne attribue à la contrainte d'antisymétrie sont dérivables à l'interface C-I des conditions qui règlent l'étiquetage des projections (voir la section suivante). Enfin, si l'ordre linéaire est pris en charge par le processus d' extemalisation, si donc aucune opération syntaxique ne peut y faire référence, le fait que les opérations syntaxiques soient dépendantes de la structure peut 10 être vu comme un corrélat de la restriction de la composition à Merge. 10

Voir Chomsky, Gallego & Ott 2019.

192

3.

D ANS LE LABYRINTHE DU LANGAGE

CATÉGORIES

Il est temps de se demander quels types d'entités sont manipulés par 1' opération M erge et quelles sont les propriétés des structures résultantes, en bref de s'interroger sur la nature des configurations syntaxiques.

3 .1.

CATÉGORIES FONCTIONNELLES

J'ai fait référence dans le chapitre VII à l'idée que toute projection lexicale, nominale, verbale, adjectivale, est coiffée par une séquence ordonnée de catégories fonctionnelles. Ces dernières abritent des morphèmes porteurs d'une information logico-grammaticale, la définitude, le nombre dans le cas des noms, l'aspect, le temps, la personne dans le cas des verbes, déterminant la forme des mots et des expressions linguistiques et contribuant de façon décisive à leur interprétation. Les têtes lexicales quant à elles fournissent le contenu de substance et 1' information concernant la structure argumentale. L'interaction entre les items fonctionnels et les items lexicaux, variable suivant les langues, a fait l'objet, pendant les années 80 et 90, de recherches intenses. Dans son étude sur les phénomènes d'incorporation, Baker (1987) a établi que la formation de certains mots complexes peut se ramener à un processus syntaxique de déplacement tête-à-tête, observant strictement les restrictions sur le mouvement, en particulier le principe ECP. Dans son travail sur la syntaxe comparée du verbe en anglais et en français, Pollock (1989) a démontré que la dérivation des mots morphologiquement complexes, ici les formes verbales fléchies spécifiées pour le temps et l'accord, repose également sur un mouvement tête-à-tête. Le fait que l'inventaire catégoriel d'une langue ne se réduise pas aux traditionnelles parties du discours et qu'il soit nécessaire de conférer un statut syntaxique aux «mots outils» peut difficilement être mis en doute. L'originalité de 1' approche générative est ici que les items fonctionnels, quel que soit leur statut morphologique, morphème libre ou morphème lié, sont traités syntaxiquement comme des têtes, avec tout ce que cette hypothèse implique touchant la définition des dépendances dans lesquelles ils sont impliquées, le fait de porter des traits ininterprétables qui doivent recevoir une valeur, par exemple. En bref, la distinction stricte entre comportement syntaxique et statut morphologique enlève toute pertinence syntaxique à la dichotomie traditionnelle entre mots outils et affixes fonctionnels puisque, d'un point de vue strictement syntaxique, ils constituent une classe naturelle.

LES INGRÉDIENTS D ' UNE APPROCHE INTERNALISTE DU LANGAGE

3.2.

193

CARTOGRAPHIE

Une question essentielle, qu'avait abordée un petit nombre de chercheurs pendant la période des principes et paramètres, mais qui était restée sans solution, est celle de l'organisation et de l'articulation des catégories fonctionnelles entre elles au sein de la projection étendue qui 11 les contient. On admet aujourd'hui que les domaines propositionnels, au moins les domaines finis, instancient l'architecture catégorielle suivante: (6) Force > Topic > Focus > Finitude > T > Aspect > v > V

Ce schéma, très simplifié pour ce qui touche au domaine flexionnel, prend acte de la démonstration de Rizzi (1997) que la périphérie gauche ne se réduit pas à une catégorie unique C, mais instancie une structure fine, regroupant la catégorie Finitude, des têtes comme Topic et Focus, et la 12 catégorie Foree. La question est de savoir pourquoi, dans une dérivation qui met en place la structure de bas en haut, la tête Aspect est projetée après, donc plus haut que la tête v, pourquoi la tête T est insérée au dessus d'Aspect, la tête Finitude au dessus de T, pourquoi les têtes discursives s'intercalent entre Finitude et Force. Cette hiérarchie a-t-elle une justification indépendante? Peut-elle être dérivée d'autres considérations? Pour Rizzi et Cinque en particulier, on doit se contenter d'enregistrer cette hiérarchie catégorielle, de l'intégrer au sein d'une cartographie, où se trouvent regroupées des dimensions formant un ensemble hétéroclite : la finitude est de nature sémantique/grammaticale, topique et focus sont des notions liées à la structure informationnelle et discursive des énoncés, la force est une dimension de nature pragmatique plutôt que sémantique. D'autres, comme Ramchand & Svenonius (2014), font observer que la hiérarchie ci-dessus peut au moins en partie être conceptuellement motivée, puisque les items fonctionnels ont un sens, du moins un sens grammatical, et que l'arrangement structural selon lequel C (ou l'une des têtes de la périphérie) contient T et T contient v reproduit la hiérarchie sémantique entre les propositions, les situations et les événements. Il est 11

La notion de «projection étendue» a été introduite par Jane Grimshaw (voir par exemple Grimshaw 2005). Elle admet que l'ensemble des têtes fonctionnelles verbales, comme A spect et Temps, et leur projection constituent un complexe structural que l'on peut concevoir comme la projection étendue de la tête lexicale V. 12 Ce schéma est lui-même fortement simplifié, puisque plusieurs têtes Topic sont en réalité nécessaires. Cinque (1999) a d 'autre part montré que la structure catégorielle du domaine flexionnel (le morceau de structure intercalé entre la projection de V et la catégorie la plus basse de la périphérie gauche) est infiniment plus complexe que ne le suppose (6).

194

D ANS LE LABYRINTHE DU LANGAGE

d'autre part difficile d'imaginer que l'expression fonctionnant comme le topique de 1' énoncé n'occupe pas une position structuralement plus haute que celle qui fonctionne comme focus, la première devant probablement inclure la seconde dans sa portée. Mais cette réduction conceptuellement fondée demeure partielle. C'est la raison pour laquelle le recours à une cartographie est inévitable. ,

3.3.

ETIQUETAGE

Une autre question essentielle que rencontre la théorie de la cons tituance concerne l'étiquetage des projections syntaxiques dans une approche qui intègre l'opération Merge. La théorie X-barre posait qu'un syntagme, projection d'une tête H, héritait son label catégoriel de H: un groupe nominal est un NP, non pas parce qu'il a la distribution externe d'un groupe nominal, mais parce que 1' élément pivot qu'il contient, sa tête, est un nom ; un groupe verbal est un VP parce que sa tête est un verbe. Cette théorie, qui postule l' endocentricité des projections syntaxiques, garantit l'accessibilité de l'information touchant l'identité catégorielle des projections, pertinente dans le cours de la dérivation et à l'interface C-I. Or la définition de l'opération Merge n'intègre aucun mécanisme d'étiquetage, elle ne précise pas comment les objets qu'elle assemble reçoivent un label. Si un label est nécessaire pour référer aux entités impliquées dans les processus syntaxiques et leur assigner les propriétés sémantiques appropriées, il faut compléter la défnition de Merge par un algorithme d'étiquetage (Labeling algorithm). L'étiquetage a pour seule fonction de déterminer une propriété d'une projection X pertinente pour la construction des représentations d'interface. Il va de soi que le label ne peut être un objet syntaxique de plein droit, créé dans la syntaxe étroite et associé à une projection nouvellement construite. Cela reviendrait à violer la condition d'inclusion, excluant 1' introduction en cours de dérivation d'objets ou de propriétés ne pouvant être caractérisés comme inclus dans l'échantillon lexical initial. Chomsky propose que Label soit une opération qui, comme Agree, effectue une recherche minimale (minimal search), détectant 1' élément le plus accessible dans un 13 domaine, une tête par définition. L'étiquetage ne soulève aucune difficulté lorsqu'on a affaire à un objet complexe {H, XP} , où H est une tête et XP n'en est pas une. L'algorithme sélectionne la tête H, ou plutôt un trait de H, comme label. Il s'agit là du 13

Sur Agree, voir section 5 .1.

LES INGRÉDIENTS D ' UNE APPROCHE INTERNALISTE DU LANGAGE

195

cas le plus simple, pleinement compatible avec l'hypothèse de l' endocentricité adoptée dans les modèles précédents. Mais si l'enquête est étendue à d'autres structures, il apparaît à la fois que l'hypothèse de l'endocentricité est trop forte et que l'algorithme qui vient d'être proposé est insuffisant. Quel est par exemple le label des configurations associant deux têtes X et Y? La question concerne la définition même des catégories lexicales. Chomsky (2015) reprend l'approche de Borer (2005) et Marantz (1997), selon qui les éléments lexicaux, éléments de substance, sont des racines non catégoriellement spécifiées, qui acquièrent un statut catégoriel par 1' effet de leur merger avec un élément fonctionnel comme v ou n. En elles-mêmes, les racines sont trop faibles pour fonctionner comme labels. Une combinaison {x, RP} , où Rest une racine et x une tête catégorisante sera donc nécessaire, . , ment etiquetee x. Les configurations {XP, YP} , où aucun des deux termes n'est un item lexical, ne peuvent pas non plus être labélisées par 1' algorithme proposé, parce qu'une recherche minimale va détecter deux têtes, X et Y, et non pas une. Cette situation est illustrée par exemple par la construction sujet interne-prédicat, qui recouvre une structure {EA, *vP}. (7) T [13 (EA) [v* [VIA]]], où EA réfère à l'argument externe et IA à l'argument interne.

Si, par contre, EA se déplace dans la position de sujet grammatical, ~ sera étiqueté v*. EA, après son déplacement, fait en effet partie d'un élément discontinu, dont le maillon le plus bas n'est pas visible à l'algorithme. Il apparaît que dans ce cas, le déplacement de l'argument externe dans la position de sujet grammatical a pour effet de casser une configuration symétrique non labélisable. Ce scénario dérivationnel permet de dériver l'effet EPP (voir chapitre VI, note 5). Mais qu'est-ce qui fait de la configuration résultante {EA, TP} une structure labélisable et quel est ce label? (8) [a [EA] [TP T [13 (BA) [v* [V lA]]]]]

La notion de spécificateur n'ayant plus cours dans un modèle utilisant des structures syntaxiques nues (bare phrase structure), on ne peut maintenir l'hypothèse que les processus de déplacement ciblent le spécificateur d'une catégorie fonctionnelle. Chomsky propose que ces processus créent systématiquement des structures exocentriques, le terme déplacé étant adjoint par Merge interne à la projection maximale qui lui sert de support. C'est le cas dans la structure (8). Posant que T est trop «faible»

196

DANS LE LABYRINTHE DU LANGAGE

pour fonctionner en (8) comme label, Chomsky (2013, 2015) suggère que les configurations de ce type ne sont «stables» que si elle partagent un trait et que ce trait partagé définit 1' étiquette de la structure dans son ensemble. Ici, EA et T partagent des traits