Readings in Modern Linguistics: An Anthology
 9783110820041, 9789027921000

Table of contents :
Contents
Acknowledgements
Introduction: Contemporary Linguistics
Gedanken über das Indogermanenproblem
Internal Reconstruction of Pre-Indo-European Word-Forms
Linguistics and Prehistory
Le point de vue historique en linguistique
Phonometrischer Beitrag zur Frage der neuhochdeutschen Quantität
Structuralism in Modem Linguistics
Structural Analysis of Language
La stratification du langage
Remarques sur les principes de l'analyse phonémique
Categories of the Theory of Grammar
On the Interplay of External and Internal Factors in the Development of Language
De la variété des unités significatives
Dimensions of Meaning in Intonation
Cultural Implications of Some Navaho Linguistic Categories
Directions in Modern Linguistics
Origine de la linguistique synchronique de Saussure
Communication in Poetry
Statistical Considerations and Semantic Content
Why "Mama" and "Papa"?
Transformational Grammar
De quelques constantes de la théorie linguistique
A Biological Perspective of Language
Relations entre les types d'écriture et la langue
List of the Journals and Books where the articles can be found

Citation preview

Readings in Modern Linguistics

Readings in Modern Linguistics An Anthology by Bertil Malmberg

Läromedelsförlagen • Mouton

© Bertil Malmberg and Laromedelsforlagen Printed in Sweden Stockholm 1972. Kungl. Boktryckeriet P. A. Norstedt & Soner

Contents B. Malmberg Introduction: Contemporary Linguistics 1 N. S. Trubetzkoy Gedanken über das Indogermanenproblem 4 C. Hj. Borgström Internal Reconstruction of Pre-Indo-European Word-Forms 12 A. Tovar Linguistics and Prehistory 28 A. Sommerfelt Le point de vue historique en linguistique 51 E. Zwirner, K. Zwirner Phonometrischer Beitrag zur Frage der neuhochdeutschen Quantität 61 E. Cassirer Structuralism in Modern Linguistics 78 L. Hjelmslev Structural Analysis of Language 97 L. Hjelmslev La stratification du langage 106 E. Fischer-Jorgensen Remarques sur les principes de l'analyse phonémique 137 M. A. K. Halliday Categories of the Theory of Grammar 157 J. Vachek On the Interplay of External and Internal Factors in the Development of Language 209 A. Martinet De la variété des unités significatives 224 E. Uldall Dimensions of Meaning in Intonation 232 H. Hoijer Cultural Implications of Some Navaho Linguistic Categories 240 E. Haugen Directions in Modern Linguistics 252 E. Buyssens Origine de la linguistique synchronique de Saussure 267 I. Fónagy Communication in Poetry 282 L. Heilmann Statistical Considerations and Semantic Content 306 R. Jakobson Why "Papa" and "Mama"? 313 P. H. Matthews Transformational Grammar 321 N. Chomsky De quelques constantes de la théorie linguistique 336 E. H. Lenneberg A Biological Perspective of Language 344 V. Istrine Relations entre les types d'écriture et la langue 359 List of the Journals and Books where the articles can be found 383

Acknowledgements The editor wishes to thank the following publishers for permission to reprint copyright material: Nature Method Centre, Charlottenlund, Denmark, for Gedanken über das Indogermanenproblem by N. S. Trubetzkoy, and Remarques sur les principes de l'analyse phonémique by E. Fischer-J0rgensen; Linguistic Circle of New York, New York, U.S.A., for Internai Reconstruction of Pre-Indo-European Word-Forms by C. Hj. Borgström, Linguistics and Prehistory by A. Tovar, Structuralism in Modern Linguistics by E. Cassirer, La stratification du langage by L. Hjelmslev, Categories of the Theory of Grammar by M. A. K. Halliday, and Communication in Poetry by I. Fónagy; Mouton & Co., N. V. Uitgeverij, Holland, for Le point de vue historique en linguistique by A. Sommerfelt, and Why "Mama" and "Papa"? by R. Jakobson; Prof. Eberhard Zwirner for Phonometrischer Beitrag zur Frage der neuhochdeutschen Quantität by Eberhard und Kurt Zwinger; AB CWK Gleerup Bokförlag, Lund, Sweden, for Structural Analysis of Language by L. Hjelmslev; North-Holland Publishing Co., Amsterdam, Holland, for On the Interplay of External and Internal Factors in the Development of Language by J. Vachek, and De la variété des unités significatives by A. Martinet; Longmans, Greens & Co. Ltd., London, England, for Dimensions of Meaning in Intonation by E. Uldall from In Honour of Daniel Jones by Abercrombie; Linguistic Society of America, Washington D.C., U.S.A., for Cultural Implications of some Navaho Linguistic Categories by H. Hoijer, and Directions in Modern Linguistics by E. Haugen; Librairie E. Droz, Genève, Switzerland, for Origine de la linguistique synchronique de Saussure by E. Buyssens; Luigi Heilmann, Bologna, Italy, for Considerazioni statistico-matematiche e contenuto semántico by L. Heilmann; Jackson Son & Co. Ltd., Glasgow, England, for Transformational Grammar by P. H. Matthews; Editions Gallimard, Paris, France, for De quelques constantes de la théorie linguistique from Problèmes du langage, Collections Diogène, pp 14—21 by N. Chomsky; The M.I.T. Press, Cambridge, Mass., U.S.A., for A Biological Perspective of Language by E. H. Lenneberg; Recherches Internationales, Paris, France, for Relations entre les types d'écriture et la langage by V. Istrine.

B. Malmberg Introduction: Contemporary Linguistics The period from the late twenties till to-day (1970) has been characterized by a more rapid and at the same time more varied evolution of the science of language than ever before. In his "Cours", Ferdinand de Saussure had drawn the theoretical conclusions from the historical and comparative experience of 19th-century linguistics. He had learnt to consider language as form and to regard linguistic structures as arbitrary. In combination with the new claim for synchrony this attitude gave rise to what was soon to be known as structural linguistics. Under the double influence from Saussure and from Russian tradition Trubetzkoy, Jakobson, and Karcevski drew up a phonological programme which was worked out and applied within the famous Prague Circle. This programme was submitted to the first international Congress of Linguists, held at the Hague in 1928. During the thirties, Louis Hjelmslev and H. J. Uldall started a project for language description which made radical use of the Saussurean form thesis—the Glossematic theory. The same century saw the so-called American structuralism emerge, based on Leonard Bloomfield's "Language" (1933). Owing to their contact with native cultures and languages the American linguists had had to face grammatical and semantic structures and descriptive problems so far unknown to European scholars. The sociological orientation of linguistics, which was already inspired by Saussure and by contemporary French sociology, got a strong impetus through the pooling of linguistics and social anthropology into a science which became an American equivalent of the European "Wörter und Sachen" movement with its origin in earlier dialectology. Through behaviouristic doctrine American structuralism acquired an orientation unknown, or less prominent, in the corresponding European centres. The definition of language invariants, in phonology and morphology, made possible a quantitative treatment of linguistic units and the introduction of statistics into linguistic description (Zipf, E. Zwirner). Information theory gave a strong motivation for determining probability and predictability of language elements. In linguistic circles, interest tended more and more to focus on semantics. Finally, Chomsky's revolt against behaviouristic mechanism 2—Malmberg, Readings .

1

and quantitative description was in fact based on principles already implied in Jakobson's great theory as put forward in 1941 ("Kindersprache, Aphasie und allgemeine Lautgesetze"). It revived the old, rationalistic interest in language universals and in a so-called deep structure of language as underlying superficial differences of languages. The description of syntax, which had been neglected by the leading structuralists, became fundamental within the Chomskyan school. Over the last few years, the range has been extended so as to include still larger units of language: texts and fiction. Language covers the entire field of human activities. Linguistics is becoming the essential science of man. This Anthology is intended as a representative selection of original articles within the field of general linguistics as this science has been worked out during the 40 years referred to above, i.e. roughly from the rise of structuralism till recent contributions within generative and transformational grammar. As any choice of this kind, mine is of course just as arbitrary as language itself. My aim has been, however, to allow scope for different schools and movements in linguistics, but not to favour my own personal preferences. If I have chosen to start with a few modern contributions to historical and comparative grammar, I have done so to show in what way classical comparatism as inherited from the 19th century developed when coming into contact with synchronic description and structural principles. Trubetzkoy's article on the Indo-European problem (the first of the collection) is the most famous example of a critical attitude to earlier doctrines. It is of interest as such but does not, of course, represent any generally adopted position. The same is true of one of the concluding articles, that of Lenneberg. My aim has been to illustrate the different trends in modern linguistics by some typical articles—typical through the methods applied and through the principles established. It is hoped that the anthology will become useful for the study and teaching of linguistics in the universities, and that it will make it easier for specialists and for laymen to follow the debate as it has been going on during the period under consideration. The book will thus, I hope, serve as a reference book for readers of my "New Trends in Linguistics" (1964; Swedish original "Nya vagar inom spr&kforskningen", 4th ed. 1969).1 As editor of this anthology I have 1

French version "Les nouvelles tendances de la linguistique", 2nd ed. 1968; Spanish version "Los nuevos caminos de la lingiiistica", 1967; Polish version "Nowe drogi w jezykoznawstwie", 1969; Italian and Portuguese versions in preparation.

2

tried to remain as impartial as I tried to be when I wrote my survey of modern linguistics. For evident reasons, the Anthology is much more modern than the " N e w Trends".

3

N. S. Trubetzkoy Gedanken über das Indogermanenproblem1 Indogermanen heissen solche Menschen, deren Muttersprache zur indogermanischen Sprachfamilie gehört. Aus dieser wissenschaftlich einzig möglichen Definition folgt, dass „Indogermane" ein rein sprachwissenschaftlicher Begriff ist, so wie etwa „Syntax", „Genitiv", „Lautwandel", usw. Es gibt indogermanische Sprachen, und es gibt Völker, die diese Sprachen reden. Das Einzige, was all diesen Völkern gemein ist, ist die Zugehörigkeit ihrer Sprachen zu derselben Sprachfamilie. Heute gibt es viele indogermanische Sprachen und viele indogermanische Völker. Blicken wir in die Vergangenheit zurück, so finden wir, dass es auch früher so gewesen ist, •— soweit unser Auge reicht. Ausser den Vorfahren der heute noch lebenden indogermanischen Sprachen, bestanden früher noch andere indogermanische Sprachen, die ohne Nachkommenschaft verschollen sind. Es wird vermutet, dass es einmal eine Zeit gegeben hat, wo nur eine einzige indogermanische Sprache, die sogenannte indogermanische Ursprache, bestand, von der alle historisch überlieferten indogermanischen Sprachen stammen sollen. Diese Vermutung steht in Widerspruch mit der Tatsache, dass wir, soweit wir in die Geschichte zurückblicken können, immer eine Vielheit von indogermanisch redenden Völkern vorfinden. Ganz unmöglich ist die Vermutung einer indogermanischen Ursprache nicht. Sie ist aber auch gar nicht notwendig, und man kann sehr gut auch ohne sie auskommen. Der Begriff „Sprachfamilie" setzt gar nicht die gemeinsame Abstammung einer Anzahl von Sprachen von einer einzigen Ursprache voraus. Als Sprachfamilie bezeichnen wir eine Gruppe von Sprachen, die ausser einer Ähnlichkeit des Sprachbaues, noch eine ganze Reihe stofflicher Übereinstimmungen aufweisen, d. i. Sprachen, in denen eine beträchtliche Anzahl von lexikalischen und morphologischen Elementen gesetzmässige lautliche Entsprechungen zeigt. Um die Gesetzmässigkeit der Lautentsprechungen zu erklären, braucht man aber die Vermutung der gemeinsamen Abstammung nicht, da eine solche Gesetzmässigkeit auch beim Lehnverkehr zwischen benachbarten unverwandten Sprachen entsteht (die sogenannten „Fremdlaut1

4

Vortrag gehalten im Cercle linguistique de Prague den 14. Dezember 1936.

gesetze"). Und Übereinstimmung in rudimentären Elementen des Wortschatzes und der Formlehre ist auch kein Beweis für gemeinsame Abstammung, da alle Elemente der menschlichen Sprache entlehnbar sind, und da besonders auf niedrigen Entwicklungsstufen ganz rudimentäre Wörter und Morpheme von Sprache zu Sprache wandern. Seinerzeit hat P. Kretschmer mit Recht betont, dass zwischen Entlehnung und Verwandtschaft nur ein chronologischer Unterschied besteht. Solche Wörter, die aus dem Keltischen oder Italischen ins Germanische und aus dem Germanischen ins Slavische erst nach der germanischen Lautverschiebung übergegangen sind, erkennen wir als entlehnt. Solche dagegen, die denselben Weg bereits vor der Lautverschiebung gegangen sind, nennen wir urverwandt. Streng genommen, werden der Ursprache alle jene Elemente zugeschrieben, die in mehreren indogermanischen Sprachzweigen vorkommen, und bei denen die Richtung der Entlehnung nicht mehr festgestellt werden kann. Es gibt also eigentlich gar keinen zwingenden Grund zur Annahme einer einheitlichen indogermanischen Ursprache, von der die einzelnen indogermanischen Sprachzweige abstammen würden. Ebenso gut denkbar ist, dass die Vorfahren der indogermanischen Sprachzweige ursprünglich einander unähnlich waren, sich aber durch ständigen Kontakt, gegenseitige Beeinflussung und Lehnverkehr allmählich einander bedeutend genähert haben, ohne jedoch jemals mit einander ganz identisch zu werden. Diese Möglichkeit muss jedenfalls bei der Erörterung des Indogermanenproblems immer ins Auge gefasst werden. Dadurch, dass bisher nur die Hypothese der einheitlichen Ursprache berücksichtigt wurde, ist das Problem auf ein falsches Geleise geraten. Sein erstes, rein linguistisches Wesen, wurde vergessen. Prähistorische Archäologie, Anthropologie und Ethnologie werden unberechtigterweise herangezogen. Man diskutiert über den Wohnsitz, die Rasse und die Kultur des angeblichen indogermanischen Urvolkes, das vielleicht niemals existiert hat. Das Indogermanenproblem bekommt ungefähr folgende Fassung: „Welcher Typus der prähistorischen Keramik muss dem indogermanischen Volke zugeschrieben werden?" Diese und ähnliche Fragen sind aber wissenschaftlich unlösbar und daher müssig. Sie drehen sich in einem logischen Kreise, weil die Voraussetzung der Existenz eines indogermanischen Urvolkes mit bestimmten Kulturund Rassenmerkmalen sich nicht rechtfertigen lässt. Man läuft einem romantischen Hirngespinste nach, statt sich an die einzige positive wissenschaftliche Angabe zu halten, — nämlich, dass „Indogermane" ein rein linguistischer Begriff ist. Die einzige wissenschaftlich mögliche Fragestellung muss lauten: Wie und wo ist der indogermanische Sprachbau entstanden? Diese 5

Frage darf und kann nur mit rein sprachwissenschaftlichen Mitteln beantwortet werden. Um die angeführte Frage beantworten zu können, muss man sich vor allem darüber klar werden, was man unter indogermanischem Sprachbau verstehen soll. Woran erkennt man, dass eine Sprache indogermanisch ist? Gewiss braucht man dazu eine Anzahl von „stofflichen Übereinstimmungen" — d. i. von lexikalischen Elementen, Suffixen und Endungen, welche die betreffende Sprache mit anderen indogermanischen Sprachen, unter Beachtung regelmässiger Lautentsprechungen, gemein hat. Es ist aber unmöglich anzugeben, wie gross die Zahl dieser Elemente sein muss, um den indogermanischen Charakter der betreffenden Sprache zu verbürgen. Auch darüber, welche lexikalischen oder morphologischen Elemente in jeder indogermanischen Sprache bestehen müssen, kann nicht entschieden werden. Es gibt wohl fast kein einziges Wort, das in allen indogermanischen Sprachen vorkommen würde. Gerade die am stärksten verbreiteten Wörter bieten in den einzelnen indogermanischen Sprachen solche lautlichen Unregelmässigkeiten, dass ihre Grundform nur mit Vergewaltigung der Tatsachen rekonstruiert werden kann. Was die morphologischen Elemente betrifft, so stimmen sie nur selten genau überein. Oft versagen dabei die gewöhnlichen Lautentsprechungen, so dass man gezwungen ist, verschiedene spezielle, manchmal sehr künstliche „Auslautgesetze" ad hoc zu erfinden. Hinzu kommt noch der Umstand, dass viele von den am stärksten verbreiteten indogermanischen lexikalischen und morphologischen Elementen gar nicht auf die indogermanischen Sprachen allein beschränkt sind und in vielen nichtindogermanischen Sprachen vorkommen. Zieht man dies alles in Betracht, so wird man bei der Entscheidung der Frage, ob eine Sprache indogermanisch oder nichtindogermanisch sei, den „stofflichen Übereinstimmungen" keine allzugrosse Bedeutung beimessen. Solche Übereinstimmungen müssen bestehen, und ihr vollkommenes Fehlen darf als Beweis des nichtindogermanischen Charakters einer Sprache betrachtet werden. Es kommt aber auf ihre Zahl nicht an, und es gibt keine von ihnen, die ganz und gar unentbehrlich wäre, um die Zugehörigkeit einer Sprache zur indogermanischen Sprachfamilie zu beweisen. Zu einem solchen Beweise gehört ausser dem Vorhandensein von „stofflichen Übereinstimmungen" noch folgende 6 strukturelle Merkmale. Auf dem Gebiete der Lautlehre (Phonologie) nur zwei Punkte, mehr negativen Charakters: 1. — Es besteht keinerlei Vokalharmonie, d. i. der Vokalismus der nichtersten Silbe ist nicht durch den Vokalismus der ersten Wortsilbe bedingt, Da, wo der Ausdruck „Vokalharmonie" in der Be6

Schreibung gewisser indogermanischen Sprachen und Dialekte gebraucht wird, geschieht dies mit Unrecht, denn es handelt sich in solchen Fällen nicht um Vokalharmonie, im oben angegebenen Sinn, sondern um den Einfluss des Öffnungsgrades des betonten Vokals auf den Öffnungsgrad des oder der unbetonten Vokale. 2. — Der Konsonantismus des Anlauts ist nicht ärmer als der des Inlauts und des Auslauts. Dass es sich hier um einen wesentlichen Zug handelt, beweist der Vergleich mit uraloaltaischen und dravidischen Sprachen. Natürlich sehen wir dabei von den geminierten Konsonanten ab, die ihrem Wesen nach nicht im Anlaute vorkommen dürfen. Aus dem Gebiete der Morphonologie sind folgende Punkte zunehmen: 3. — Das Wort muss nicht unbedingt mit der Wurzel beginnen. — Es gibt keine indogermanische Sprache ohne Präfixe. Selbst in den ältesten indogermanischen Sprachen kommen echte Präfixe vor, d. i. solche Morpheme, die als selbständige Wörter nicht gebraucht werden (z. B. ij-, su-, dus-, e-). In den jüngeren indogermanischen Sprachen nimmt die Zahl solcher Präfixe stark zu. 4. — Die Formbildung geschieht nicht nur durch Affixe, sondern auch durch vokalische Alternationen innerhalb der Stammmorpheme. Zum alten Ablaut gesellt sich in allen indogermanischen Sprachen ein neuer, der durch die Wirkung spezieller Lautgesetze entstanden ist, vom synchronischen Standpunkte aber ganz frei ist. Es gibt keine indogermanische Sprache ohne Spuren des (alten oder neuen) vokalischen Ablauts. 5. — Ausser den vokalischen spielen auch freie konsonantische Alternationen eine morphologische Rolle. — Es gibt keine indogermanische Sprache ohne grammatischen Konsonantenwechsel. Freilich ist dieser Wechsel immer eine Folge irgendwelcher kombinatorischen Lautveränderungen, deren Formel sich meistens noch gut ermitteln lässt. Vom synchronischen Standpunkte aus ist aber der Konsonantenwechsel in jeder indogermanischen Sprache frei. Dass es sich dabei um einen wesentlichen Zug des Sprachbaus handelt, beweist der Vergleich mit anderen Sprachtypen, wie etwa dem semitischen, wo der Konsonantenwechsel überhaupt ausgeschlossen ist, oder dem altaischen, wo nur gebundene konsonantische Alternationen zugelassen werden. Auf morphologischem Gebiete kann nur ein Zug genannt werden: 6. — Das Subjekt eines transitiven Verbums erfährt dieselbe Behandlung wie das Subjekt eines intransitiven Verbums. D.i. in jenen indogermanischen Sprachen, wo der Kasusgegensatz Nom.-Akk. durch Endungen ausgedrückt ist, steht das Verbalsubjekt im Nom., gleichviel, ob Verbum transitiv oder intransitiv ist (z. B. lat. pater venit, pater filium amat), und in jenen, wo die Bezugskorrelation durch 7

die Wortstellung ausgedrückt wird, nimmt das Subjekt bei transitiven Verben dieselbe Satzstellung, wie bei den intransitiven (z. B. franz. le père vient, le père aime le fils). Jedes von diesen Strukturmerkmalen kommt auch in nichtindogermanischen Sprachen vor, alle sechs zusammen aber nur in indogermanischen Sprachen. Eine Sprache, die nicht alle genannten Strukturmerkmale besitzt, darf nicht als indogermanisch gelten, — selbst wenn sie in ihrem Wortschatze viele Übereinstimmungen mit indogermanischen Sprachen aufweist. Und umgekehrt ist eine Sprache, die den grössten Teil ihres Wortschatzes und ihrer formativen Elemente aus nicht indogermanischen Sprachen entlehnt hat, dennoch indogermanisch, wenn sie die genannten 6 spezifischen Strukturmerkmale besitzt, und sei es eine nur ganz kleine Anzahl lexikalischer und morphologischer Übereinstimmungen mit anderen indogermanischen Sprachen, die sie aufweist. Somit kann eine Sprache aufhören, indogermanisch zu sein, und umgekehrt, kann eine Sprache indogermanisch werden. Der Zeitpunkt, wo alle obenerwähnten sechs spezifischen Strukturmerkmale sich zum ersten Male in einer Sprache zusammenfanden, deren Wortund Formschatz eine Anzahl regelmässiger Übereinstimmungen mit den später überlieferten indogermanischen Sprachen aufwies — dieser Zeitpunkt war die Geburtsstunde des „Indogermanischen". Es ist nicht ausgeschlossen, dass ungefähr um dieselbe Zeit mehrere Sprachen in diesem Sinne indogermanisch geworden sind. Retrospektiv können wir sie heute nur als Dialekte der indogermanischen Ursprache betrachten, es ist aber logisch nicht notwendig, sie alle auf eine gemeinsame Quelle zurückzuführen. Nur ein geographischer Kontakt zwischen diesen ältesten indogermanischen Dialekten darf mit hohem Grad der Wahrscheinlichkeit angenommen werden. Für die Bestimmung des geographischen Raumes, in welchem diese Dialekte ihren indogermanischen Charakter bekommen haben, sind folgende Erwägungen massgebend. Die von J. Schmidt seinerzeit vorgeschlagene Wellentheorie gilt nicht nur für Dialekte einer Sprache, sondern auch für unverwandte aber geographisch benachbarte Sprachen. Jede Sprache weist mit den benachbarten gemeinsame Strukturmerkmale auf, die umso zahlreicher sind, je länger der geographische Kontakt gedauert hat. Das gleiche gilt auch von Sprachfamilien. Betrachtet man die geographische Verbreitung der Sprachfamilien der Alten Welt vom Standpunkte des Sprachbautypus, so muss man feststellen, dass diese Sprachfamilien eine ununterbrochene Kette bilden. Die finnischugrischen und samojedischen Sprachen stimmen in gewissen Punkten mit den altaischen überein, diese einerseits mit dem Koreanischen und durch dessen Vermittlung mit dem Japanischen, das wiederum eine Brücke zu den ozeani8

sehen Sprachen bildet, andererseits aber stimmen die altaischen Sprachen in wesentlichen Punkten zu den tibetobirmanischen Sprachen usw. In Afrika führt eine derartige Verkettung vom Semitischen, Chamitischen, Berberischen und Kuschitischen über negroide Sprachen der Art des Ful und Wolof zu den Sudansprachen, die durch Vermittlung der bantuiden mit echten Bantusprachen verbunden sind. — Erwägt man diese Tatsachen, sowie den Umstand, dass jedes von den obenerwähnten 6 Strukturmerkmalen des Indogermanischen allein für sich auch in nichtindogermanischen Sprachen vorkommt, so wird man die Entstehung des indogermanischen Sprachbaues in ein solches Gebiet versetzen dürfen, das an Sprachfamilien mit teilweise übereinstimmenden Strukturmerkmalen angrenzt. In Betracht kommen zwei grosse Gruppen von Sprachfamilien. Einerseits die uraloaltaische, die mit dem Indogermanischen die Akkusativkonstruktion (P. 6) gemein hat, und deren westlichster Ausläufer, das Finnischugrische, überdies noch einen freien Konsonantenwechsel (P. 5) aufweist. Andererseits die mediterrane Gruppe, die heute durch kaukasische und semitische Sprachen vertreten ist, und die sich mit dem Indogermanischen durch die Punkte 1, 2, 3 und 4 berührt. Nur zwischen diesen zwei Sprachbaugruppen bildet das Indogermanische eine Brücke: Dravidisch und Uraloaltaisch bieten dagegen untereinander strukturelle Übereinstimmungen, die dem Indogermanischen fremd sind, — wodurch die Versetzung der „Urheimat" des Indogermanischen nach Iran oder Nordindien unwahrscheinlich wird. Somit muss das Gebiet, wo die ältesten indogermanischen Dialekte entstanden sind, irgendwo zwischen den Gebieten der ugrofinnischen und der kaukasischmediterranen Sprachen situiert werden. Nähere Angaben lassen sich streng wissenschaftlich nicht rechtfertigen. Vor allem muss das Vorurteil bekämpft werden, wonach die sogenannte indogermanische Ursprache ein eng umgrenztes Gebiet umfassen sollte. Bei dem uneinheitlichen Charakter dieser indogermanischen Ursprache, der sich selbst bei den junggrammatischen Rekonstruktionsmethoden erkennen lässt, ist die Annahme eines einzigen Verbreitungsherdes gar nicht notwendig. Die Zusammenwirkung mehrerer Verbreitungszentren kann aber sehr gut auf einem recht grossen Gebiete — sagen wir von der Nordsee bis zum Kaspischen Meer — gedacht werden. Das Werden der indogermanischen Sprachen ist nicht ein einmaliger Akt, sondern ein dauernder Vorgang. Der indogermanische Sprachbau ist wie jedes Sprachgebilde der geschichtlichen Entwicklung ausgesetzt. Im Prinzip entwickelt sich jeder indogermanische Sprachzweig in seiner eigenen Richtung. Es gibt aber auch Entwicklungstendenzen, die allen diesen Sprachzweigen oder den meisten von 9

ihnen gemein sind. Betrachten wir diese Tendenzen im Vergleiche zu den nichtindogermanischen Nachbarsprachen, so ergeben sich interessante Feststellungen. Für die allerälteste Periode des Indogermanischen müssen nicht weniger als drei Artikulationsarten der Verschlusslaute angenommen werden. In den historisch überlieferten indogermanischen Sprachzweigen ist aber die Zahl der Artikulationsarten der Verschlusslaute auf zwei reduziert, und nur das Ossetische, das Armenische, das Kurdische und die indischen Sprachen, die von nichtindogermanischen Sprachen umgeben sind, bewahren bis heute noch drei- bezw. viergliedrige Verschlusslautsysteme. Nun findet man drei Artikulationsarten der Verschlusslaute in den kaukasischen Sprachen und, wenn man die sogennanten emphatischen Konsonanten als besondere Artikulationsart betrachten will, auch in den hamitosemitischen. Die finnischugrischen Sprachen dagegen bieten nur zwei Artikulationsarten der Verschlusslaute; und stimmen darin mit den uraloaltaischen überein. Im ursprünglichen Indogermanischen war die labiale Verschlusslautklasse schwächer als die anderen Klassen entwickelt, indem einer von den labialen Verschlusslauten (näml. *b) nur selten vorkam. In den historisch überlieferten indogermanischen Sprachen ist diese Benachteiligung der labialen Verschlusslaute aufgegeben worden. Nun bieten die nordkaukasischen Sprachen diese Benachteiligung der labialen Reihe, wie das Urindogermanische, und dasselbe darf auch vom Semitischen behauptet werden, das wohl emphatische Dentale und Gutturale, aber keinen emphatischen Labial kannte. In den finnischugrischen und altaischen Sprachen ist dagegen die labiale Reihe ebenso entwickelt, wie alle anderen. Für das ursprüngliche Indogermanische müssen wenigstens zwei Gutturalreihen angenommen werden; die historisch überlieferten indogermanischen Sprachen bieten aber fast alle nur eine einzige Gutturalreihe, und in jenen indogermanischen Sprachen, wo eine zweite Gutturalreihe besteht (Neupersisch, Ossetisch, Lettisch), handelt es sich um eine offenbar sekundäre Erscheinung. Nun ist das Vorhandensein von zwei Gutturalreihen für die kaukasischen Sprachen charakteristisch, während in den finnougrischen und altaischen Sprachen phonologisch nur eine Gutturalreihe besteht, und der Gegensatz zwischen Velar und Palatal durch die vokalische Umgebung bedingt ist. Wie J. Kurylowicz überzeugend gezeigt hat, müssen im allerältesten Indogermanischen Laryngallaute bestanden haben — worin es sich wiederum den kaukasischen und hamitosemitischen Sprachen näherte. Später aber verlor das Indogermanische seine Laryngale, und da, wo diese Laute in den historischen indogermanischen Sprachen auftreten, sind sie sekundär — ebenso wie in den heutigen ugrischen und altaischen Sprachen, deren ältere Entwickelungsstufe 10

keine Laryngale kannte. Im ursprünglichen Indogermanischen spielte die partielle Wurzelreduplikation eine wichtige morphologische Rolle, und lebt noch in historischer Zeit in den älteren Entwicklungsstufen der überlieferten indogermanischen Sprachen, die darin mit den semitischen und kaukasischen Sprachen übereinstimmen. Den jüngeren Entwicklungsstufen der indogermanischen Sprachen ist aber dieses morphologische Mittel vollkommen fremd, — ebenso wie den finnischugrischen und den altaischen Sprachen. Endlich hat Uhlenbeck recht überzeugend gezeigt, dass im ältesten Indogermanischen nicht der Nominativ dem Akkusativ, sondern der Ergativ dem Absolutus gegenübergestellt war, — ein Zug, der das Indogermanische mit den nordkaukasischen Sprachen (sowie mit dem Baskischen und einigen verschollenen Sprachen Vorderasiens) verbinden würde, während die spätere Opposition von Nom. und Akk. in den uralischen und altaischen eine Parallele findet. In allen oben aufgezählten Punkten haben sich also die indogermanischen Sprachen von einem Typus, der den heutigen ostkaukasischen Sprachen ähnlich war, zu einem anderen, an die finnischugrischen und altaischen Sprachen erinnernden Typus entwickelt. Diese Tatsachen lassen verschiedene Deutungen zu. Man kann darin die Folge besonderer historischer Ereignisse vermuten und sogar versuchen, diese Ereignisse zu rekonstruieren. Mit einigem Phantasieaufwand kann eine solche Rekonstruktion recht geistreich ausfallen — überzeugend kann sie aber nicht sein. Man kann aber die obenaufgezählten Tatsachen als die Äusserung eines natürlichen Entwicklungsganges deuten. Der durch die heutigen ostkaukasischen Sprachen vertretene hyperflektivische Sprachbau müsste dann als ein primitiver Zustand und der durch die altaischen Sprachen vertretene Typus als ein Ideal der Sprachentwicklung betrachtet werden. Diese Auffassung würde zwar der landläufigen egozentrischen Ansicht widersprechen, wonach die flektierenden Sprachen auf einer höheren Entwicklungsstufe als die agglutinierenden stehen. Das wäre gewiss kein Grund für ihre Ablehnung. Wir neigen also zur Annahme, dass der indogermanische Sprachbau auf dem Wege der Überwindung eines primitiven flektierenden Typus entstanden ist, ohne jedoch den höherentwickelten agglutinierenden Typus erreicht zu haben. In diesem Zusammenhang bekommt auch eine Bemerkung Charles Bally's eine Erklärung — nämlich, dass das Esperanto, das ja zweifellos einem Ideal der indogermanisch redenden Völker entspricht, eine aus indogermanischen Elementen gebaute rein agglutinierende Sprache ist.

11

Carl Hj. Borgstrom Internal Reconstruction of Pre-Indo-European Word-Forms1 1.1. There are at least two recognized procedures for tracing the history of a language or a group of languages: comparison of various documented stages of one linguistic tradition, and comparison of languages which are believed to have been dialects of one language in the past. The latter method has come to be known as the comparative method par excellence. There is, however, a third set of procedures which aim at reconstructing earlier stages of a language when neither older texts nor related languages are known. A suitable term for this method is internal reconstruction in contrast with the better known comparative reconstruction. Examples are F. de Saussure's analysis of PIE long vowels into short vowels followed by a 'coefficient sonantiqueand W. Streitberg's attempt at an explanation of PIE lengthened vowels ('Dehnstufe'). 1.2. The theoretical foundation of internal reconstruction lies partly in synchronic, partly in diachronic linguistics. 1.2.1. Structural linguistics aims at obtaining simple patterns by reducing the number of entities in each pattern to the minimum prescribed by the principle of relevancy. When apparently different entities are in complementary distribution, they are described as variants (allomorphs, allophones) of one entity. A notable simplification of morphemic patterns is obtained when the distribution of allomorphs is phonemically definable; as in the case of the English plural endings /-s/, /-z/, and /-iz/. Even different morphophonemic changes may sometimes be reduced to a common pattern: the interchanges /a/—/e/, /o/—/o/, /uI—/u/, /au/—/oii/ in German nouns (sing.—plur.) and adjectives (positive—comparative) are all instances of the pattern /non-

1

Abbreviations: PIE = Proto-Indo-European, as partially reconstructed by the comparative method; PrelE = any earlier stage of PIE which may be partially reconstructed by internal methods. NTS = Norsk Tidsskrift for Sprogvidenskap (Oslo). RDV, see 4.6. Transcription: hly ht, h, stand for laryngeals, h, for the a-coloring, h, for the ocoloring one(s); h x when the identification is doubtful. For a se 3.1., the asterisk is omitted before reconstructed words spelt with a.

12

front vowel/—/front vowel/. Now it happens that such simplification can be achieved only by changing certain parts of the given system, e.g. the number or distribution of its phonemes. Thus F. de Saussure found that most of the PIE series of vowel-gradation (ei—oi—/, en—on—n etc.) were cases of the one interchange e—o—zero; but a series like e—o—A was refractory unless he changed it into eA—oA—A, where A played the same part as i, n, etc. in the other series.2 1.2.2. A diachronic justification of internal reconstruction lies in the observation that some complicated patterns, particularly morphophonemic interchanges and certain allomorphs, have developed from simpler patterns of earlier periods. Thus the interchange in Eng. man—men, foot—feet is explained, i.e. reduced to a simpler pattern, when we know that it is due to the earlier presence of an ending *-iz in some forms of the plural, and that unstressed i caused a phonemic change of the preceeding vowel. It is therefore legitimate to ask for such explanations of complicated patterns even in languages whose history is not known, and to obtain them by assuming that certain phonemic and morphemic changes have taken place. The changes assumed must not contradict the principles of diachronic phonetics, phonemics, or morphemics. 1.3. On the other hand, we observe that complicated patterns may be simplified in the course of the history of a language, and that phonemes or morphemes may be lost without leaving traces. Since there is no way of reconstructing lost complications of entities, all reconstructive procedures are likely to yield an over-simplified picture of the reconstructed system. 3 1.4. Internal reconstruction need not always follow strictly the same course. Here are some special cases. 1.4.1. A certain pattern, e.g. a rule for the distribution of entities, which is not motivated in the given system, may be motivated, though not rendered simpler in itself, under certain systematic conditions which may then be assumed for an earlier stage of the language. For example, the distribution of consonants in PIE themes may become

' Recueil des publications scientifiques de F. de Saussure, p. 127. This hypothesis reduced several grammatical paradigms of PIE to common patterns, cf. ibid. pp. 137 f. and 224 f. It is the basis of the later 'laryngeal theory'; cf. J. Kurylowicz, Etudes indo-européennes I, p. 27 f. * Cf. the correct remarks by A. Martinet, Word9.261 (1953), about the dangers of striving after maximal simplicity in reconstructive linguistics. The tendency is inherent in internal reconstruction and must be counteracted by the principle that no reconstructed system should be treated as a complete linguistic system. 13

motivated by the assumption that themes were originally monosyllabic, cf. 3.3. 1.4.2. Alteration of one part of a linguistic system will often have consequences for the functioning of other parts of the system. Having reconstructed part of an earlier system by altering something in a given language, one may sometimes draw further conclusions about the structure of the earlier system. An instance of this type is the conclusion drawn in 3.1 about PrelE vowels. I.5. A short description of how internal reconstruction works would run as follows. A complicated or unmotivated pattern in a given language may sometimes be reduced to a simpler pattern, or be motivated, by the assumption that certain regular phonemic or morphemic changes have taken place in the past; thereby parts of an earlier system are tentatively reconstructed. The functioning of entities within this system should be determined as far as possible. 2.1. The terms 'word' or 'word-form', 'root', 'theme', and 'stem' play such important parts in what follows that it is necessary to indicate how I intend to use them. 2.2.1. Words are utterance-segments consisting of one or more morphemes. Assuming that there is a procedure for the demarcation of morphemes, it is possible, I believe, to formulate a set of distributional rules as a procedure for the demarcation of words.4 4

The following tentative rules, which are based on a few languages only, may serve to indicate what I mean. A morpheme is here understood to include its allomorphs; the stressed and unstressed forms of a morpheme count as different morphemes, e.g. in Eng. black bird and blackbird. Morphemes of type a (below) should be identified by their form and meaning. Two types of morphemes, a and b, may be distinguished as follows: a may in most environments be freely substituted for by any one of an indefinite number of other single morphemes; b may in most environments be substituted for only by a limited number of single morphemes and in some frequently occurring environments hardly by any. In most sequences it is easy to tell a from b, e.g. hat-s, teach-er (ab), eld-er than (abb), the hat, to go (ba). Morphemes which are not definitely b may be reckoned as a, e.g. under, up, be. A sequence of morphemes is (part of) one word if: I. the sequence has the same distribution in relation to morphemes b as at least one single morpheme; or (and) II. (1) the sequence consists of morphemes a and b, and (2) it contains not more than one a unless the a's together conform to I, and (3) the a, or cluster of a's may not be dropped without another a or cluster of a's being substituted for it (unless so much may be dropped that the b of the sequence forms a normal sequence with another a in the environment), and (4) only such morphemes may be intercalated that the whole new sequence conforms to the other parts of II. Sequence conforming to I only are compounds: school-boy, over-turn, Germ. Tag-es-licht, aus-geb(-en). Some compounds may be "suspended": ich gebe es

14

2.2.2. In some—perhaps all—languages, the unity of words as defined through the distribution of morphemes is strengthened by rules for the distribution of certain phonemes, allophones, or prosodemes within words. For instance, in Latin, Polish, Finnish, the distribution of accents is automatic with reference to word boundaries except in so far as certain words may or may not have an accent. The concept of 'word' is important for the understanding of many diachronic developments, cf. 3.5. 2.3. The following definitions apply to Proto- and Pre-IE only. A morpheme which may, without a derivational suffix, take verbal inflexional endings (and usually even nominal endings) will be called a root or theme; a root is such a morpheme which contains two consonants (e.g. *b'er 'carry', *wel 'will'), while a theme contains at least three consonants and may be analyzable into a root followed by another element (*leikw 'leave', *wel-p 'hope'). The elements forming themes from roots should be called 'extensions' rather than 'suffixes', because their known distribution is hardly such that we may define them as genuine morphemes. 5 Other nuclear morphemes and morpheme clusters will be called stems. They have usually more specialized functions than roots and

aus. Sequences conforming to I + 11 are derivatives; a is root, b is derivational morpheme. Type ab(b) : teach-er, nation-al-ize; type ba: un-clean, be-come. Sequences conforming to II only are inflected forms, b is then an inflexional morpheme, henceforward symbolized as c. An example of cac: Germ, zu-géb-en, written as two words to distinguish it from zû-geb-eti (aac), but cf. dus-zu-geb-en (,acac) written as one word; Eng. to give are two words because the a may be dropped (cf. II 3): I want to. Examples of intercalation in ac: hat-s, hatt-er-s (abc), hat-bands (aac, aa conforming to I); Fr. pleur-er, pleur-nich-er (abc)-, donn-ons, donn-i-ons (acc), donn-er-i-ons (accc); Lat. grau-em, grau-ior-em (acc). Morpheme c intercalated between a and c as above are semiderivational because a + the intercalated c conform to I in relation to inflexional morphemes in the same word, but not in relation to further environments. Some morphemes may be partly b, partly c: Span, nin-a (ab, distributed like mujer) versus buen-a (ac). Special rules. 1. A sequence ac is one word in spite of intercalation of morphemes (x)a' whereby a becomes one word and a'c another word, if (x)a' are morphemes which might be dropped according to II (3), the parenthesis: others, other boys; Port, clara-mente, clara e râpida-mente. Other special rules may be expected, e.g. for Eng. there-of, etc. (Acknowledgements: E. A. Nida: Morphology, 1949, particularly 4.6; A. Martinet in Actes du Ve congrès, Paris 1949, p. 293.) • Against E. Benveniste, Origines de la formation des noms en i.-e., I. chap, ix; but otherwise the distinction between "root" and "theme" has been taken over, with minor changes from Benveniste.

15

themes, e.g. the presentic verbal stem *yu-n(e)-g- 'yoke', the nominal stem *h1ek'wo- 'horse', the pronominal stem *kwo- 'who'. 3.1. It is possible that early PrelE had only one 'syllabic vocoid', 8 whose status of being or not being a vowel phoneme would depend on its distribution in words. 7 This conclusion may be drawn from three premises: (1) The PIE vowels i and u (as well as ryi, n, r, I) are interchangeable with y, w (m, n, r, /), and seem to have had only consonantic functions originally; (2) PIE e, o, á as well as a and the o which does not interchange with e are believed to have developed from e in the neighborhood of laryngeals. (3) The remaining PIE vowels e, o (and lengthened é, ó) are interchangeable and seem to have developed from the same e as under (2). This so-called fundamental vowel will hereafter be written a. However, the conclusion may be due to the over-simplification inherent in internal reconstruction; according to 1.3, we cannot know if two vowels, say, one high and one low vowel, had coalesced during the development from PrelE to PIE when new vowels, i, u, etc., were about to appear. 3.2. Many themes and stems have vowel-gradation so that an a occurs after every consonant, though not simultaneously after all, e.g. dark'a—drak'-s- 'to see', daywa—dyaw'shine, god, Zeus'. From this it might be concluded that themes and stems originally had the syllabic pattern CVCVCV . . . , e.g. dárák'á, dayáwá, and that one or more vowels had subsequently been syncopated in every form. 3.3. But this hypothesis is contradicted by another observation. It has been pointed out that there are heavy restrictions on the order in which consonants follow each other in PIE themes. 8 Themes do not usually end with two stops; in no themes is a medial stop or s flanked by two resonants (y, w, m, n, r, I), or even followed by a resonant; a medial laryngeal is not normally followed by m, n, r, I.9 That is to say, the medial consonant of a PIE theme is not less open and sonorous than the consonants on both sides of it; only s (and perhaps laryngeals)

• For the meaning of this term see K. L. Pike, Phonemics (1947), pp. 4 f. 7 See 7.2 for a possible PrelE minimal pair dráwá 'run'—dárwá 'tree' which, if correctly assumed, indicates that the vowel was permutable with consonants. 8 Karl Ammer, Studien zur idg. Wurzelstruktur (Die Sprache, II, Wien 1952, pp. 193 ff., particularly pp. 200, 211—12; W. P. Lehmann, Proto-Indo-European Phonology (Austin 1952) 14.5. Both authors point out that the most open and sonorous consonants are found in the middle and the more closed ones in marginal positions, though they disagree about certain details. • The alleged themes in -él, -eu, etc. are probably spurious, so that y, w may be added to the list. 16

may occur initially and finally without regard to this rule. Such restrictions would be quite unmotivated if the syllabic pattern of themes had been CVCVCV . . . ; they would be motivated if themes had originally been monosyllabic. When consonant sequences like y-t-l or p-t-k do not occur in themes, the reason for that must be that such sequences could not form monosyllables according to the syllabic patterns of PrelE. From this we may conclude that each PrelE root and theme contained only one fundamental vowel; the patterns were CVC and CVCC or CCVC and perhaps CCVCC. The contradiction between this conclusion and that of 3.2. must be solved.10 3.4. Neither in stems nor in inflected words do the consonants always pattern as one syllable, cp. m-d'-w 'mead', p-k'-w 'sheep', s-w-p-n 'sleep', w-kw-m 'voice' (acc. sg.), h^-s-m 'I am'. This fact may be interpreted in a diachronic sense: the more specialized types, i.e. stems and inflected forms, belong to a later period than the roots and themes. In early PrelE, the later roots and themes (or the vast majority of them) must have been monosyllabic words; in a subsequent period, the addition of morphemes sometimes made words polysyllabic. The variable occurrence of à (3.2) may have started in the former period, e.g. as a variation between CVCC and CCVC ('thème I' and 'thème II' in Benveniste's terminology), but it seems to have been fully developed only in the latter period. The process must have been a redistribution of vowels and it must have taken place according to a certain rule; to find that rule is the aim of the following paragraphs. 11 3.5. It is a priori probable that such a rule applied to complete wordforms, not to parts of words like themes or stems; similarly rules of syncope are normally operative within words, e.g. in ONorse or Olrish. The PrelE process may perhaps be viewed in the same light as the development of the Latin accent rules, i.e. as a means of strengthening the unity of words already definable as morphemic units (2.2.2).

10

K. Ammer, who accepts CVCVCV as the original pattern in themes, thinks that they became monosyllabic only after the vowel-reduction (op. cit. p. 211). It is difficult to see how. We should have to think that all themes whose sequences of consonants did not fit into the new monosyllabic pattern were either discharged or changed, e.g. by metathesis. At the time of the vowel-reduction, themes were probably often parts of words which did not become monosyllabic, and it is theoretically difficult to see why the themes should then be reduced to monosyllables at all costs. 11 What follows is mainly a summary of two articles of mine in NTS XV (1949), pp. 137—87 and XVI (1952), pp. 136—47. The rule for the distribution of vowels is the same as in my earlier papers, but its starting-point has been modified here by the theory of originally monosyllabic themes.

17

In that case the distribution of vowels in each word depended upon the length of the word, i.e. upon the number of consonants contained in it. In a language where the phonemic yield of vowels was very small (3.1), they might lend themselves to such a demarcative function. The word-forms of this PrelE period may not have contained exactly the same morphemes as their descendants in PIE. Any PIE word-form which has either lost or added an ending after the PrelE period is misleading with regard to the rule of vocalization if the latter depended upon the length of words. It will therefore be the task of internal reconstruction to change certain PIE word-forms according to 1.2, if the distribution of vowels may thereby be reduced to a simple principle. 4.1. In some archaic athematic verbs the location of a varies in accordance with the number of consonants so that at least the final part of each form presents clusters of two consonants. In the first, second, and third sg. of the present (imperfect) or aorist, the endings are the single consonants -m, -s, -t (the -i which occurs in the present only may be left out of this account); these forms are opposed to the third pi. with its biconsonantic ending -nt; the present participle follows the third pi. The first and second pi. and the dual forms are for various reasons difficult to interpret; cf. 7.1. The best examples are: hxast—hxsant 'be', hxayt—h^ant 'go' (Ved. eti, yanti cf. Gk. eisi, part, iont-), gw'ant—gv>lnant 'slay' (Ved. hand, ghnanti, Hitt. kwenzi, kunanzi), gwamt—gwmant 'come' (Ved. aor. agan, agman); verbs with infixed nasal; hxrnawt—hxrnwant 'move' (Ved. rnoti, rnvanti, Hitt. arnuzzi, arnuwanzi), yunagt—yungant 'yoke', etc. The vowel occurs between the third and the second consonant from the end of each form. 4.2. Equally archaic is the relation between some thematic nouns, or nouns in *-efos or *-a (-ah2) and, on the other hand, athematic nouns formed from the same theme or stem but with different location of a. The forms are cited in the nom. sg.; the acc. sg. usually has the same structure, while other forms present special problems. Daywas 'divine, god'—dyaws 'day, heaven, Zeus', b'algas (Ved. bhargas 'splendor')—b'lags (Gk. phlox), g'iaymah2 (Lith. ziema, cf. Gk. kheima)—g'iyams (Lat. hiems, Gk. khion, Av. zya), parkas (Gk. perkos 'speckled')—praks (Gk. prox 'a young deer or roe'), karkah2 (Ir. cerc 'a hen')—kraks (Gk. krex 'a kind of bird'). 4.3. The verb patterns are CVCC—CCVCC; the noun patterns are CVCCVC—CCVCC. The first noun pattern differs from the first verb pattern by containing V twice and by ending in a single C; also the two noun patterns both contain four consonants but still have 18

different vocalization. If we take away the final VC from the aberrant type, the relation between dayw and dyaws equals that between h^ast and h^sant. According to the principles of internal reconstruction, we may frame the following hypothesis: in PrelE, a class of uninfected nouns, e.g. dayw, were opposed to a class of nouns inflected by means of -s in the nom. and -m in the acc., e.g. dyaws, dyawm>*dyews *dye(w)m; at a later stage, some uninflected nouns received either case-endings (e.g. *deywos, *deywom) or suffixes (e.g. *g"eymohi)-, the location of the stem vowel then remained unchanged. But whence comes the 'thematic' vowel before the case-endings and the suffixes? The phonemic status of PrelE vowels renders it unlikely that the vowel alone was a suffix. Then these alternatives are left: (1) the vowel was inserted to avoid sequences of three consonants when endings of suffixes were added, e.g. dayw+s>daywas; (2) the redistribution of vowels after the period of monosyllabism had already introduced vowels in word final position, e.g. h^sta—h^anta, ddywa—dyawsa; these final vowels were normally dropped at a later stage except if an ending or a suffix had been added in the meantime, as in *deywos, *g"eymoh2. The latter alternative will be preferred because it gives the simplest explanation of the forms mentioned in 4.4 and 4.5.12 A final -a should then be added to all the forms in 4.1, and the forms in 4.2 should be reconstructed as ddywa—dyawsa, b'dlga—b'lagsa, etc. There is now one rule for the vocalization of all these forms. 4.4 The uninflected type (QCVCCV is represented by PIE neuters in *-u and *-i with "flexion ouverte," i.e. gen. in *-we\os and *-yejos. Their inflexion can be explained by the assumption that the gen. received an ending -sa before final vowels were dropped, while the nom.-acc. did not; some such nouns were at a much later stage transferred to the animate gender, e.g. Ved. pasus beside pasu and Goth. faihu etc. Examples: pasu, pasvas Secondary ^-structure

Scale of Exponence Data

Primary class

Secondary >class

41 Or nearly coextensive: the criteria for the setting up of one primary class or two are descriptive. For example, in English clause structure S and C are different elements standing in different relation to P. There is a high degree of overlap between their exponents: one primary class (class "nominal" of unit "group") can be set up as exponent of both S and C. The lack of exact coextensiveness will be stated by secondary elements and classes, to account for (for example) the occurrence of "the old hall," "the old town," "the old town hall," "this hall/ town/town hall is old," "this is a hall/town/town hall," and the non-occurrence of "this old is a hall," "this is an old," or "this hall is town."

179

for classes, the relation between the two can be demonstrated by the use of a colour code. System 6.1. Up to this point the theory has accounted for three aspects of formal patterning: the varying stretches that carry patterns, the ordered repetition of like events that makes up the patterns and the grouping of like events by their occurrence in patterns. What remains to be accounted for is the occurrence of one rather than another from among a number of like events. The category set up for this purpose is the "system."62 This falls under the general definition of system given above (2.1). But this does not yet state its place in grammatical theory, its relation to the other fundamental categories. The class is a grouping of items identified by operation in structure: that is, what enters into grammatical relations of structure is not the item itself considered as a formal realization63 but the class, which is not a list of formal items but an abstraction from them. By increase in delicacy, the primary class is broken down into secondary classes of the same rank. This set of secondary classes now stands in the relation of exponent to an element of primary structure of the unit next above. This gives a system of classes. If class 1 is the primary class (say of the group) operating at X in (clause) structure, and this has secondary classes 1.1, 1.2, and 1.3, then 1.1, 1.2, and 1.3 form a system of classes operating at X. X is now shown to presuppose a choice—a choice that is implied by the nature of the class (as a grouping of items) but that is displayed first still in abstraction, by reference to the category of class itself.64

" Cf. Firth, "Papers," p. 144: "Various systems are to be found in speech activity and when stated must adequately account for such activity. Science should not impose systems on languages, it should look for systems in speech activity, and, having found them, state the facts in a suitable language." Cf. also references given in 4.1 n 32, above. ™ Again, abstraction on the exponence scale. The formal item "the old man" is exponent of (is a member of) a class ("nominal," of the unit "group"). The class "nominal group" is exponent of (operates at the place of) an element of structure (S or C, of the unit "clause"). The formal item itself, of course, has its own (and ultimate) exponents in phonic or graphic substance. " Diagrammatically (axes as in 5.4 n. 50, above):

180

6.2. Systems of secondary classes thus allow the description to remain at a high degree of abstraction while displaying at each step, each increase in delicacy, a more finely differentiated range of choice. This is the value of the concept of "sub-class" (above, 5.2), since wherever a choice among a finite number of mutually exclusive possibilities is found to occur within a class one can recognize a system whose terms have the nature and degree of abstraction of the "class:" their relation to secondary elements of structure is implied but need not be stated. Thus the system provides what is, in the order in which the categories are presented here, the final requisite for the linking of the categories to the data.55 Through the system, in one of two ways (below, 6.3), the description can now account for the formal exponents, the items identified in linguistic form—and through them is linked, by description at other levels, to the ultimate exponents in substance. But there is a crucial point here. Any category can be linked directly to its exponents:56 a given formal item can be at one and the same time,

Secondary structures X Ya Z Yc and X Yb Z Yc

Primary structure X Y Z Y

\ 1 (at X) 2*(at Y) 3*(atZ)_ Primary classes

\ \

2.1 (at Ya) 2.2 (at Yb) 2.3 (at Yc) Secondary classes

" As already stressed (above, 2.2), the order of presentation here is for convenience of exposition; the relations among the theoretical categories do not involve logical precedence. " Since the categories are set up precisely to account for the data that are stated as their exponents, this is not surprising. Cf. Firth, "Synopsis," p. 1: "A theory derives its usefulness and validity from the aggregate of experience to which it must continually refer in renewal of connexion." The relation of category to exponent can be generalized as one of abstraction; one endpoint of this relation may be any one of four categories, but there is no scale of abstraction among the categories—their relation to each other is such that the move from any category to its exponent may be made either directly or via any or all of the other categories. As said below (6.2), the route may involve rank shift; but this does not mean that rank is to be equated with exponence or that there is any distinction between different units as regards the kind or degree of their relation to their exponents. (That is to say, even if one chooses to move from "clause" to exponent via

181

and in the same sense, an exponent of a unit, a structure, an element of structure, a class, and a term in a system. 5 ' At the same time the aim of grammar is to stay in grammar: to account for as much as can possibly be accounted for grammatically, by reference to the categories of grammatical theory. This, since it implies maximum generalization and abstraction, means that one proceeds from category to exponent by the longest route that is compatible with never going over the same step twice. Here it is important to avoid theoretical confusion between the scales of exponence and rank. Since the relation of class to structure is syntactical (as defined above, 5.3), if one derives classes from structures then "remaining in grammar" means moving step by step down the rank scale until the lowest unit is reached. 68 So it might appear as if going down the rank scale is the same thing as going down the exponence scale. But it is not. The sentence stands in exactly the same relation to its exponents as does the morpheme; one can move over (at right angles, so to speak) at any rank, and the categories of class, structure, and system remain at the same degree of abstraction whatever unit they are associated with. The deriving of class from structure is of course merely one way of stating a theoretical relation which could equally be viewed from the other end; 69 in this case "remaining in grammar" would mean going up the rank scale and it would appear (equally erroneously) that it was only at the rank of the sentence that one reached the exponents.

"group," this does not mean that the group is in any sense "nearer" to the data than the clause: indeed, the move from clause to exponent via group presupposes the possibility of moving from group to exponent via clause.) 67 So, for example, the formal item "were driven" may be exponent of: (i) the unit "group," (ii) the element P in structure, (iii) the class "verbal," and (iv) the term "passive" in a system of secondary classes. All these statements are interdependent: the link of exponent to each theoretical category depends on its link to all the others and on their own interrelations in the theory. Thus the unit "group" is linked to the structure of the "clause;" the class "verbal" is a class of the unit "group" and is linked to the elements of structure of the clause; the system "voice" has as terms classes of the verbal group; these classes have their own structures, etc. 68

Thus:

Units: sentence clause group etc.

etc.

" Without in any way affecting the syntactic nature of the "class". 182

6.3. There comes a point, however, when one is forced out to the exponents; and this happens in one of two ways. In the first case the description yields a system in which the formal exponents themselves operate as terms. Here we have gone all the way in grammar; the formal items are grammatically contrastive (and do not belong in the dictionary 60 ). In the second case the description yields a class where no further breakdown by grammatical categories is possible, a class whose exponents make up an open set. Here we must leave grammar; the relations between the exponents must be accounted for as lexical relations. Neither of these endpoints of grammar is restricted to the rank of any one unit. The exit to lexis tends to be associated predominantly—but probably never uniquely—with one unit, which for this reason is called in description the "word" (above, 3.3). The system of exponents also tends to operate at the lower end of the rank scale; but this, although predictable as economy of resources, is not a theoretical restriction: the rank distribution of formal exponents in systems is a descriptive feature which, in a five-unit description, may be expected to involve at any rate the three lower units. The theoretical place of the move from grammar to lexis is therefore not a feature of rank 61 but one of delicacy. It is defined theoretically as the place where increase in delicacy yields no further systems; this means that in description it is constantly shifting as delicacy increases. The grammarian's dream is (and must be, such is the nature of grammar) of constant territorial expansion. He would like to turn the whole of linguistic form into grammar, hoping to show that lexis can be defined as "most delicate grammar." The exit to lexis would then be closed, and all exponents ranged in systems. No description has yet been made so delicate that we can test whether there really comes a place where increased delicacy yields no further systems: relations at this degree of delicacy can only be stated statistically, and serious statistical work in grammar has hardly begun. It may

Cf. Paul Garvin, in Georgetown University Monograph Series No. 9, 1957, p. 55: "Morphemes of limited membership class should be listed in the grammar and morphemes which belong to classes of unlimited membership should be exemplified in the grammar and listed in the dictionary." 81 Except in the sense that the description will always try a move down the rank scale as a possible way of extending its power ("remaining in grammar"). But wherever the lexical item is greater than a morpheme, its further analysis by grammar into morphemes will leave its lexical relations unaccounted for. For example, in "the train left ten minutes late, but made it up," "made up" is a discontinuous verbal group analyzed as two words, one ("made") of two morphemes, the other simple; but it enters into an open set qua lexical item "make up," which itself is here assigned to no grammatical unit.

183

well be that the nature of language is such that this "most delicate grammar" will evaporate in distinctions which are so slenderly statistical that the system has, in effect, been replaced by the open set. For the moment it seems better to treat lexical relations, where even the identification of the items concerned by grammatical means is extremely complex, as on a different level, and to require a different theory to account for them. 6.4. A brief illustration, from English grammar, of the four fundamental categories. The exponent of the element S in primary clause structure is the primary class "nominal" of the unit "group". The primary structure of the nominal group is (M . . . n )H(Q . . . n ). The primary classes of the unit "word" operating at H and M are respectively the noun and the pre-noun. The element Mean be broken down into secondary structures composed of any combination of the elements D, O, E in that order, whose exponents are the secondary classes "deictic," "numerative," and "adjective" of the word. Deictics include a number of systems whose terms are the formal exponents themselves, with further secondary classes separating, for example, "all/both/such/half" (class 1, at D a ) from "a/the/some etc." (class 2, at Db) and various sub-classes involving concord. Adjectives likewise include a number of secondary classes, but in most of these the exponents form open sets, and for further treatment of these grammar hands over to lexis.62

Rank, Exponence, and Delicacy 7.1. In relating the categories to each other and to their exponents, the theory needs to operate with three scales of abstraction, the scales of rank, exponence, and delicacy. These need to be kept apart from each other, and also from two other things: regressive structures, 83 which are handled in the description by rank shift, and the range of levels by which grammar is distinguished from other aspects of language in the first place. The separation of levels has been taken as a starting-point, and it is not the purpose of this paper to explore this part of the theory. My own view is that, whatever is decided for presentation, which will vary with purpose, both in theory and in description it is essential to separate the levels first and then relate them. The theoretical reason is that different kinds of abstraction are involved, and therefore different " See below, 8. " Regressive structures can of course be regarded as forming a scale; but their description does not require the introduction of a separate scale into the theory. Cf. above, 3.2 n. 26. 184

categories. In description, the attempt to account for the data at all levels at once results in a failure to account for them fully at any level. If one rejects the separation of levels and wishes, for example, to combine grammatical and phonological criteria to yield a single set of units, the description becomes intolerably complex. The attempt to delimit grammatical units on phonological criteria in English has recourse to such things as a system of juncture in which any of the exponents in substance can be an exponent of any of the terms in the system. The exponents of the phonological unit which carries contrasts of intonation in English, the "tone group," are in fact not coextensive with the exponents of any one or even any two of the grammatical units: if one describes English grammar with the tone group as a unit, when it can be exponentially coextensive with every one of what a "monolevel" grammar would regard as five different units, one fails to show what is in fact the relation between the grammar and the phonology of the language.84 A meaningful account of how grammar and phonology are related in English must be based on a prior separate statement of the two.85 As said above (1.4), it is misleading to think of the levels as forming a hierarchy. They represent different aspects of the "patternedness" of linguistic activity. In this respect phonology is an "interlevel," since there is an added degree of dependence here: the patterns of substance, and those of form, are each fully definable in their own

14

Cf. Allen, "Structure and system in the Abaza verbal complex" (Transactions of the Philological Society 1956), pp. 143—145, from which the following is taken: "It frequently occurs that an appropriate 'bit' of the corresponding phonological statement (or of the orthography) is used as a label for the grammatical unit in question . . . The price of using such labels is constant vigilance . . . Where the phonological analysis permits of alternatives, that alternative is to be chosen which is most congruent with the grammatical analysis;... important correspondences may be observed between phonology and grammar, in so far as different phonological systems . . . may be required for the exponents of different grammatical categories—but the relation between them . . . is an indirect one via the phonic data." In spite of the different formulation, and the difference between Allen's diagrammatic representation and those used here (above, 1.7 n. 10, and below, 10.3 n. 88), I do not think that there is any conflict between Allen's view and the view put forward here. " In which (i) one set of units is set up for grammar, and their structures, classes, and systems described, and (ii) one set of units is set up for phonology and these also appropriately described. Other things being equal, a form of ponological statement will be preferred which simplifies the statement of the relations between phonology and grammar. It is here that one asks such questions as: "Is it possible to generalize any phonological features as recognition signals of a given grammatical category?" and "Is it possible to specify under what conditions a phonological unit, such as the tone group, is exponentially coextensive with one or other grammatical unit, such as the clause or group?"

185

terms, by internal reference, so to speak; whereas the patterns of phonology, being the organization of substance in form, although requiring to be stated separately because of the distinct nature of the abstractions involved, and the fact that (not surprisingly) the patterns are carried by different stretches of exponents, are only significant with reference to the two levels of form and substance. Context is an interlevel in a different sense, since it relates language to something that is not language; it is an interlevel because it is not with the nonlanguage activity itself that linguistics is concerned but with the relation of this to language form. Though there is no precedence or priority, there is of course order among the levels, as determined by their specific interrelations; and in the study of language as a whole form is pivotal, since it is through grammar and lexis that language activity is—and is shown to be—meaningful. 7.2. The scale of rank has been discussed (above, 3) with reference to the unit, the basic category which operates on this scale. The syntactic ("downward") determination of classes is a feature of the theory, so that with respect to the category of class the rank scale appears as one of logical precedence running from highest to lowest unit. But this precedence applies to class criteria only, so that even in the theory it is not a one-way relation: the theory itself embodies "shunting" (moving up and down the rank scale) as crucial to the interrelation of the categories. In description, all statements presuppose shunting; the description of the sentence cannot be complete until the description of the morpheme is complete, and vice versa. In presentation, of course, procedure varies according to purpose and scope: downward presentation seems easier to make clear, but this may well be overridden—for example if grammar is an adjunct to lexical description, as sometimes in the statistical study of lexis. Rank is distinct both from exponence and from delicacy. A shift in one never by itself entails a shift in either of the others. The reason why rank is often confused with other scales is that there are cases where a shift in rank does accompany a shift in something else; but this is always by virtue of the logical relations among the categories involved. The fact that by moving from structure to class, which is (or can be) a move on the exponence scale, one also moves one step down the rank scale, is due to the specific relation between the categories of "class" and "structure," and not to any inherent interdetermination between exponence and rank. The descriptive relevance of keeping the scales distinct is that it is important to be able to display what happens if one shifts on one scale, keeping the other two constant.68 " One may want to compare primary and secondary structures of the same (class of the same) unit: shift in delicacy only. One may want to compare classes of one 186

7.3. Exponence is the scale which relates the categories of the theory, which are categories of the highest degree of abstraction, to the data. 67 Since the categories stand in different relations to the data, it might seem necessary to recognize four different scales of exponence, one leading from each category. In fact, however, exponence can be regarded as a single scale. In the first place, each category can be linked directly by exponence to the formal item: it is in fact a requirement of the theory that any descriptive category should be able to be so linked. This may be stated by way of exemplification, as when we say "'the old man' is (an example of) an exponent of S in clause structure." This is however not a description of the element S, since by relating it to its exponent at a stage when it was not necessary to do so we should have lost generality (cf. above, 6.3). So instead of throwing up the grammatical sponge and moving out to lexis while this is still avoidable, the description takes successive steps down the exponence scale, changing rank where necessary, until (at the degree of delicacy chosen) it is brought unavoidably face to face with the formal item. In the second place, therefore, the step by step move from any one category to the data can proceed via any or all of the other categories. This is then a move down the exponence scale, and at each step, given that delicacy is constant, one category is replaced by another (either with or without change of rank, according to which category is replaced by which). While therefore the categories are distinct, they are interrelated in such a way that the relation of exponence has the status of a single scale.

unit with classes of the unit next below: shift in rank only. Or one may want to state and exemplify the classes of a given unit: shift in exponence only. " Cf. Firth, "Synopsis," taken from pp. 15—16: "The term exponent has been introduced to refer to the phonetic and phonological 'shape' of words or parts of words which are generalized in the categories . . . The consideration of graphic exponents is a companion study to phonological and phonetic analysis . . . The phonetic description of exponents which may be cumulative or discontinuous or both, should provide a direct justification of the analysis. It may happen that the exponents of some phonological categories may serve also for syntactical categories. But the exponents of many grammatical categories may require ad hoc or direct phonetic description . . . The exponents of the phonological elements of structure and of the . . . terms of systems are to be abstracted from the phonic material . . . The exponents of elements of structure and of terms in systems are always consistent and cannot be mutually contradictory." I would regard the concept of exponents as one of Firth's major contributions to linguistic theory. References will be found throughout the writings of Allen and of Carnochan, Eugenie Henderson, Mitchell, Palmer, Robins, and other linguists of the School of Oriental & African Studies, London, many of which are referred to elsewhere in this paper.

187

The ultimate exponent in form is the formal item. This has then to be related, in turn, to the substance. But this relationship, though it may also be called "exponence," entails a new scale, in which the nature of the abstraction is different and the formal item is now at the other end—it is itself the abstraction, and is not in any way delimited or categorized by grammar.68 When grammar reaches the formal item, either it has said all there is formally to be said about it or it hands over to lexis. The formal item is the boundary of grammar on the exponence scale. It is not of course the boundary on the rank scale: whenever the formal item is anything other than a single morpheme (whether in closed system like "seeing (that)," or in open set like "pickup") the grammar can be taken further down in rank, since it can state the structures in terms of elements whose exponents are words and morphemes. But "seeing (that)" enters into a system at group rank, while "pickup" emerges from the grammar as a word, though being a lexical item it would not necessarily be an exponent of any whole grammatical unit. Once it has been taken over by lexis, the grammatical categories, and the grammatical exponence scale, no longer impinge on it (see below, 8.2). 7.4. Delicacy is the scale of differentiation, or depth in detail. It is a cline, whose limit at one end is the primary degree in the categories of structure and class. In the theory, the other limit is the point beyond which no further grammatical relations obtain: where there are no criteria for further secondary structures, or systems of secondary classes or formal items. In description, delicacy is a variable: one may choose to describe a language without going beyond the primary degree, still being comprehensive in rank and exponence and making use of all the categories of the theory. Each subsequent increase in delicacy delays the move to exponents (cf. above, 7.3) and thus increases the grammaticalness of the description. The limit of delicacy is set by the means at one's disposal. In well-described languages, such as English, any extension in delicacy beyond what is already known requires either or both of large-

Strictly speaking the relation of the formal item to its exponent in substance entails a two-fold relation of abstraction, one of whose dimensions is exponence (and is therefore a prolongation of the scale which relates category to formal item). The other dimension is the abstraction, by likeness, of a "general" event (class of events, though not in the technical sense in which "class" is used here) from a large number of "particular" events, the individual events of speech activity. For theoretical purposes the exponence scale can be regarded as comprehending this dimension of abstraction, which takes place then in that part of the scale which relates formal item to exponent in substance. Cf. Firth, "Synopsis," p. 2; "Papers," pp. 144, 187.

188

scale textual studies with frequency counts and complex secondary classification based on multiple criteria, criteria which often cut across each other and may have to be variably weighted. And, as suggested above (6.3), a point will perhaps be reached where probabilities are so even as to cease to be significant69 and classes so delicately differentiated that the description will have to decide on crucial criteria and ignore the others,70 thus setting its own limits. Delicacy is distinct from rank and the limit of delicacy applies at the rank of all units, for example differentiation of clause structures and of classes of the group. At one stage, therefore, it becomes a limit on the grammatical differentiation of items which then remain to be lexically differentiated: it sets an endpoint to grammar where lexis takes over. Here the scales of delicacy and exponence meet. The endpoint set to grammar on the exponence scale is where abstraction ceases: one has to move from abstract category to exponential item. That set on the delicacy scale is where differentiation ceases: the set of exponents of each class, and of each element of structure, permits no further, more delicate groupings. If the formal items are still not ranged in systems, the implication in either case is that further relations among them are lexical. Whether or not, as discussed above (6.3), grammatical delicacy can reach a point where there is a one/one category-exponent relation (where each element of structure, and each class, has only formal item as exponent), when all formal relations, including those among what are now treated as lexical items, can be accounted for by the grammatical categories and stated grammatically—in other words, whether or not, ultimately, all linguistic form is grammar, we do not know. At present, lexical items must be treated separately, and lexical relations established in their own right. These lexical relations do not depend on grammatical categories71 (so they are not yet "most delicate gram-

"8 For example, the statistical study of sequences of clause classes, which is necessary both to the statement of sentence structures and to the description of a unit above the sentence, would reveal the range, and cline, of the determination of probabilities by the occurrence of a member of each class. (Cf. my (review of) Whatmough: Language: A Modern Synthesis in Archiuum Linguisticum X.) ™ For example, a preliminary study of about 1,000 items of the "put up" type, the purpose of which is to reveal the systems (dimensions) relevant to the identification and classification of so-called "phrasal verbs" in English, shows that fifteen different formal criteria yield fifteen different sets of classes. " That is, have not yet been shown to be dependent on grammatical categories, and must therefore be postulated to be independent until shown to be otherwise: on the general theoretical principle that heterogeneity is to be assumed until disproved by correlation. Recent (unpublished) work by Mcintosh suggests that

189

mar") and they have their own dimensions of abstraction (so not yet "most exponential grammar"). So there must be a theory of lexis, to account for that part of linguistic form which grammar cannot handle. Lexis 8.1. This section is intended merely to bring lexis into relation with grammar, not to discuss the theory of lexis as such. As has been pointed out (above, 3.3. and 6.3), there is no one/one correspondence in exponence between the item which enters into lexical relations and any one of the grammatical units. It is for this reason that the term "lexical item" is used in preference to "word," "word" being reserved as the name for a grammatical unit, that unit whose exponents, more than those of any other unit, are lexical items. Not only may the lexical item be coextensive with more than one different grammatical unit; it may not be coextensive with any grammatical unit at all, and may indeed cut right across the rank hierarchy. Moreover, since the abstraction involved is quite different, what is for lexis "the same" lexical item (that is, different occurrences of the same formal item) may be a number of different grammatical items, so it is not true that one lexical item always has the same relation to the rank hierarchy. So that, in English, (i) a lexical item may be a morpheme, word, or group (at least); (ii) a lexical item may be assigned to no rank, being for example more than a word but less than a whole group, or even both more and less than a word—part of one word plus the whole of another, sometimes discontinuously, and (iii) one and the same lexical item may in different occurrences cover any range of the possibilities under (i) and (ii).72 This does not mean that lexical items cannot be identified in grammar; it means that they are not identified by rank. They are identified,

lexical relations may, in some cases, be better described by reference to grammatical restrictions of variable extent; if so, this will affect both the theory of lexis and the relations between the levels of lexis and grammar. Cf. below, 8.2. " Two familiar examples may be cited, both exponents of the grammatical unit "clause:" (i) "John ran up a big hill" and (ii) "John ran up a big bill:" Primary structure: Exponent of P: class: of unit: formal item:

190

(0

SPA verbal group "ran"

(ii) SPC verbal group "ran up'

as has been suggested (above, 6.3), by their being unaccounted for in systems. But it is an additional descriptive reason (additional, that is, to the theoretical one that lexical items lend themselves to different relations of abstraction) for keeping grammar and lexis apart. When the two have been described separately, the next stage is to relate them; and it is here that the complex relation between lexical item and grammatical unit must be accounted for. This is exactly parallel to what was said above (7.1) about grammar and phonology; and, of course, it applies equally to phonology and lexis, where, after separate description, is displayed the relationship between the lexical item and the categories of phonology. 8.2. The task of lexis can be summed up, by illustration, as that it has to account for the likelihood of "wingless green insects" and for the, by contrast, unlikelihood of "colourless green ideas." 73 As in grammar, we shall expect language to work by contrasting "more likely" with

Down the rank scale, verbal groups "ran" and "ran up": Primary structure: Exponent of F: class: of unit: formal item:

(i) F verb word "ran"

finite

(ii) FPo verb finite word "ran"

In (i), the lexical item is "ran," exponent of both the unit "group" and the unit "word." If after further analysis "ran" is a compound word with two elements of structure whose exponents are morphemes, then the lexical item is "run" which is an exponent of the unit "morpheme." In (ii) the lexical item is "ran up" which is exponent of the unit "group" but above the rank of the word. (Orthography does not of course provide criteria for grammatical units; like phonology, it must be stated separately and then related to grammar, though if a one/one correspondence between orthographic and grammatical categories is found to work at any point, so much the better. The space in fact will not do in every case as exponent of the boundary of the grammatical unit "word" in English. Here however to treat (things like) "run up" as a single word, the only purpose of which would be to maximalize the in any case very partial correspondence between "word" and lexical item, considerably complicates the description of the verbal group.) If the analysis is taken to the morpheme, the lexical item is "run up," which contains one morpheme (but not the other) from the structure of the word "ran" plus another word from the structure of the group—it is both more and less than a grammatical word. Even if this type of morphemic analysis is rejected, the grammatically discontinuous lexical item will appear in "John was running up a big bill," where the analysis of "running" as a two morpheme word structure presumably would be accepted; and even where all words have simple structure, as in "John may run up a big bill," the lexical item, though not discontinuous, is an exponent of no grammatical unit, since it is more than a word but less than a group. 73 Cf. Chomsky, Syntactic Structures, pp. 15 ff. 191

"less likely" rather than "possible" with "impossible;" but, as has often been pointed out,74 this particular type of likelihood is not accounted for by grammar, at least not by grammar of the delicacy it has yet attained. It is however too often assumed that what cannot be stated grammatically cannot be stated formally: that what is not grammar is semantics, and here, some would add, linguistics gives up. 75 But the view that the only formal linguistics is grammar might be described as a colourless green idea that sleeps furiously between the sheets of linguistic theory, preventing the bed from being made. What are needed are theoretical categories for the formal description of lexis. It seems that two fundamental categories are needed, which we may call "collocation" and "set."78 The first basic distinction between these and the categories of grammar is that in lexis there are no scales of rank and exponence. There is no hierarchy of units; therefore no rank scale. There is only one degree of abstraction—a set is a set of formal items and a collocation is a collocation of formal items; therefore no exponence scale (exponence there is, of course, but it is a simple polarity). Only the scale of delicacy remains; sets and collocations can be more and less delicate. There is an analogy with the categories of grammar, an analogy

'* e.g. by Chomsky, Ioc. cit. Chomsky, however, does not countenance the formal study of lexis. In the present view, the concept of "grammatical" and "ungrammatical" is paralleled by that of "lexical" and "unlexical," this being the basic reason why (Chomsky, op. cit., p. 16) "the notion 'grammatical in English' cannot be identified in any way with the notion 'high order of statistical approximation to English':" "colourless green ideas sleep furiously" is "unlexical." "Lexical meaning" in the present theory is thus not the same as is meant by Chomsky on p. 108; it is one part ("grammatical meaning" being the other) of the formal meaning of language, and "formal meaning" is one part (the other being "contextual meaning") of the total meaning of language. " This view (that linguistics excludes the study of (non-formal) meaning) is probably no longer widely held. It is not within the scope of the present paper to discuss contextual meaning; but briefly, since context relates form to extratextual features, and is (like phonology) an interlevel, the categories of context, like those of phonology, are not determined by (still less, of course, do they determine) the categories of form; but contextual statement is required to account for all (instances of the) reflexion in form of extratextual features. For the statement of context, as distinct from either "content" or "concept," see especially Firth, "Synopsis," pp. 5—13 (and, in connexion with this, "Papers," p. 227, "Applications," pp. 2, 3) and "Ethnographic Analysis and Language" (Man and Culture, ed. Raymond Firth, London 1957). " Cf. Firth, "Synopsis," pp. 11—13, 26—27 and 31; T. F. Mitchell "Syntagmatic Relations in Linguistic Analysis" (Transactions of the Philological Society 1958), pp. 108 ff.; my "Secret History," pp. 156—175.

192

due to the nature of language as activity. Collocation, like structure, accounts for a syntagmatic relation; set, like class and system, for a paradigmatic one. There the resemblance ends. Collocation is the syntagmatic association of lexical items, quantifiable, textually, as the probability that there will occur, at n removes (a distance of n lexical items) from an item x, the items a, b, c . . . Any given item thus enters into a range of collocation, the items with which it is collocated being ranged from more to less probable; and delicacy is increased by the raising of the value of n and by the taking account of the collocation of an item not only with one other but with two, three, or more other items. Items can then be grouped together by range of collocation, according to their overlap of, so to speak, collocational spread. The paradigmatic grouping which is thereby arrived at is the "set." The set does not form a closed system, but is an open grouping varying in delicacy from "having some (arbitrary minimum) collocation in common" to subsets progressively differentiated as the degree of collocational likeness set as defining criterion increases.77 In lexis, as in grammar, it is essential to distinguish between formal and contextual meaning. 78 Once the formal description has identified the categories and the items, these can and must be treated contextually. The formal item of lexis, the "lexical item," is unrestricted grammatically; grammatical categories do not apply to it,79 and the abstraction of the item itself from a number of occurrences (including, for example, the answer to the question whether one is to recognize

" Analogous to the morphological grouping (the "paradigm") of grammar is the lexical "ordered series of words": cf. Firth, "Papers," p. 228—though Firth's "ordered series of words" includes what I should consider a "lexical set," namely his "lexical groups by association," these being (by analogy) "syntactical." 78 The traditional vehicle of lexical statement, the dictionary, states formal meaning by citation and contextual meaning by definition. The theoretical status of lexicographical definition (Firth's "shifted terms"—"Synopsis," p. 11) needs to be carefully examined. 7i Cf. above, 7.4 n. 71. The point, however, is: what is to be regarded as "one" lexical item? Dictionaries, in general, mix grammatical and lexical criteria: in the Shorter Oxford Dictionary, for example, "cut v." (defined as "to penetrate so as to sever the continuity of with an edged instrument") and "cut sb." ("the act of cutting") are shown as separate items having the same relation to each other as "bear v." ("to support and remove; to carry") and "bear sb." ("a heavilybuilt, thick-furred plantigrade quadruped . . . " ) . But formally (quite apart from the fact that one contextual statement will cover both cut v. and cut sb. but not both bear v. and bear sb.) the pairs are quite distinct: there is a high degree of overlap in the range of collocation of cut v. and cut sb., which is not the case with bear v. and bear sb. Collocation provides a formal criterion for the identification of the lexical item.

8—Malmberg, Readings .

193

one lexical item or more than one) depends on the formal, lexical relations into which it enters. The nature of these relations is such that formal statements in this lexis require textual studies involving large scale frequency counts: not of course of the frequency of single items, but of items in collocation. Since these are no longer difficult to undertake, it should not be long before we find out much more about how language works at this level.

An Analogy 9.1. Eating, like talking, is patterned activity, and the daily menu may be made to yield an analogy with linguistic form. Being an analogy, it is limited in relevance; its purpose is to throw light on, and suggest problems of, the categories of grammar by relating these to an activity which is familiar and for much of which a terminology is ready to hand. The presentation of a framework of categories for the description of eating might proceed as follows: Units: Daily menu Meal Course Helping Mouthful Unit: Daily Menu Elements of primary structure Primary structures Exponents of these elements (primary classes of unit "meal")

Secondary structures Exponents of secondary elements (systems of secondary classes of unit "meal")

System of sub-classes of unit "meal"

E, M, L, S ("early," "main," "light," "snack") E M L EMLS (conflated as EML(S)) E: 1 (breakfast) M: 2 (dinner) L: 3 (no names available; see S: 4 secondary classes) EL a S a M EL a M EML b S b EMS a L c L a : 3.1 (lunch) L b : 3.2 (high tea) L c : 3.3 (supper) Sa: 4.1 (afternoon tea) S b : 4.2 (nightcap) E: 1.1 (English breakfast) 1.2 (continental breakfast)

Passing to the rank of the "meal," we will follow through the class "dinner:" Unit: Meal, Class: dinner Elements of primary structure

194

F, S, M, W, Z ("first," "second," "main," "sweet," "savoury")

Primary structures

Exponents of these elements (primary classes of unit "course")

Secondary structures Exponents of secondary elements (systems of secondary classes of unit "course")

Systems of sub-classes of unit "course"

Exponential systems operating in meal structure

MW MWZ MZW FMW FMWZ FMZW FSMW FSMWZ FSMZW (conflated as (F(S)MW(Z)) 1 (antipasta) F: 2 (fish) S: M: 3 (entrée) W: 4 (dessert) 5 (cheese*) Z: (various, involving secondary elements Fa.-d> M a , b , W a . c ) F a : 1.1 (soup) Ft>: 1.2 (hors d'oeuvres) F c : 1.3 (fruit) F d : 1.4 (fruit juice) M a : 3.1 (meat dish) M b : 3.2 (poultry dish) W a : 4.1 (fruit*) W b : 4.2 (pudding) W c : 4.3 (ice cream*) F a : 1.11 (clear soup*) 1.12 (thick soup*) 2.01 (grilled fish*) S: 2.02 (fried fish*) 2.03 (poached fish*) W b : 4.21 (steamed pudding*) 4.22 (milk pudding*) F 0 : grapefruit/melon F d : grapefruit juice/pineapple juice/ tomato juice M a : beef/mutton/pork M„: chicken/turkey/duck/goose

A t the rank of the "course," the primary class "entrée" has secondary classes "meat dish" and "poultry dish." Each of these two secondary classes carries a grammatical system whose terms are formal items. But this system accounts only for simple structures of the class "entrée," those made up of only one member of the unit "helping." The class "entrée" also displays c o m p o u n d structures, whose additional elements have as exponents the (various secondary classes of the) classes "cereal" and "vegetable." W e will glance briefly at these:

Unit: Course, Class:

entrée

Elements of primary structure Primary structures Exponents of these elements (primary classes of unit "helping") Secondary structures

J. T. A ("joint," "staple," "adjunct") J JT JA JTA (conflated as J((T)(A))) J: 1 (flesh) T: 2 (cereal) A: 3 (vegetable) (various, involving—among others— secondary elements J a ,b, T a ,b, A a ,b,) 195

Exponents of secondary elements (systems of secondary classes of unit "helping")

Ja: Jt>: Ta: Tu: Aa: At,:

1.1 1.2 2.1 2.2 3.1 3.2

(meat) ] systems as at M in (poultry) J meal structure (potato) (rice) (green vegetable*) (root vegetable*)

And so on, until everything is accounted for either in grammatical systems or in classes made up of lexical items (marked*). The presentation has proceeded down the rank scale, but shunting is presupposed throughout: there is mutual determination among all units, down to the gastronomic morpheme, the "mouthful." Like the morpheme, the mouthful is the smallest unit, and all eating activity can be broken down into mouthfuls. Like the morpheme, it is neither more nor less fundamental than any other unit. But how little it reveals, if description proceeds in one direction from it, of the complexity of the whole activity! Our predecessors thought of language as an organism, and drew their analogies from evolution. We reject this as misleading; but no less misleading is its familiar substitute, according to which language is an edifice and the morphemes are the bricks. Perhaps if language had been thought of as activity we should never have heard of "morphemics." It is unfair on one who was among the greatest figures in linguistic science to call the "bricks and edifice" view of language "Bloomfieldian"—and I do not know that Bloomfield ever used this analogy.80 But if I may use "Bloomfieldian" as a shorthand name for a view of language, and a body of descriptive method, though of course with many individual varieties, which has had wide currency for the last quarter of a century and owes a very great deal to Bloomfield's work, I would like to consider what seem to me to be certain questionable features of "Bloomfieldian" linguistics. What is being called in question is really the theory (and perhaps the analogy) of how language works. The Seven Sins 10.1. From the point of view of the present theory, there are seven features of what is here labelled "Bloomfieldian" method which would 80 An analogy which Bloomfield did use was that of the signal: "Accordingly, the signals (linguistic forms, with morphemes as the smallest signals) consist of different combinations of the signalling-units (phonemes), and each such combination is arbitrarily assigned to some feature of the practical world ('sememe')" (Language, p. 162). This runs the risk of suggesting the analogy of a code—or even that language "is" a code. If language is a code, where is the pre-coded message? Cf. my (review of) Herdan: Language as Choice and Chance in Archiuum Linguisticum XI (ii).

196

perhaps justify critical comment. 8 1 These are: (1) (2) (3) (4) (5) (6) (7)

confusion of "level" with "rank" confusion of "rank" with "exponence" conflation of different level levels overemphasis on lowest unit reluctance to shunt reluctance to shade distribution of redundancy

The confusion of level with rank takes a specific form: the relation between different units at one level (morpheme . . . sentence) is conflated with the relation between two different levels, grammar and phonology. Ranged o n a single scale ("from phoneme to utterance") are (i) the move between phonology and grammar (which moreover always goes from the "interlevel" to the level: cf. below, 10.3) and (ii) the move between units (which moreover always goes from the lowest to the highest: cf. below, 10.5) in (a) phonology and (b) grammar. In description, this leads to unwanted complexity and thus weakens the power of the grammar: one must be free to recognize grammatical units whose exponents in substance both overlap with and completely fail to coincide with the units carrying phonological contrasts. 82 In the theory, there is a confusion of abstractions: the abstraction involved in relating one unit to another at the same level is quite different from that involved in relating one level to another. The sense in which a sentence "consists o f " morphemes is stated in description with reference to its definition in the theory, and is totally different 81 Detailed references are not given in this section. It is recognized, as already remarked, that what is here called "Bloomfieldian" method is an abstraction from a large body of descriptive work by different linguists, within which there is considerable variety and disagreement even on basic issues. Roughly it covers the work based on what Hockett called the "item and arrangement" model. It is not of course suggested that all the points made in this section are applicable to all such studies, nor all of them to any one study, within this type of linguistics. Since I have been concerned to apply the present theory in the description of English, many of the points made here were in fact first formulated with reference to A. A. Hill's Introduction to Linguistic Structures, which incorporates what is probably the best comprehensive account of English grammar yet published and is an example of the method here referred to. Hill's book has recently been the subject of a review article by Haas ("Linguistic Structures," Word XVI (ii); my present aim differs from Haas' in that I want to consider certain features of an approach in descriptive linguistics, exemplified by Hill's work but also by many other studies, in the light of the theory here outlined. 8! Especially since a language may make systemic use of this variable (cf. 4.2 n. 37 above, where it is suggested that it is desirable to recognize in English a grammatical system the exponent of which is precisely the contrast between coextensiveness of the grammatical unit with one and with (a sequence of) two exponents of a phonological unit).

197

from the sense in which a morpheme "consists o f " phonemes—indeed it is doubtful if there is any meaningful sense in which a morpheme consists of phonemes. (The contrastive use of "morph" and "morpheme" is designed to build in an extra stage to account for the two kinds of abstraction. But it does not get over the first (descriptive) difficulty; nor in fact does it solve the theoretical one, since morph and phoneme differ in the extent and kind of formal determination underlying their phonological abstraction. 83 ) 10.2. The relation among the units also tends to be confused with the relation between a category and its exponent(s). It is assumed that in moving up the rank scale, from morpheme to sentence, one is also moving up the exponence scale. It is true (as said above, 6.2 and 7.3) that in comprehensive description, in order to display the full grammaticalness of language, one takes the final step on the exponence scale at the lowest rank possible (though this, as already shown, is by no means always the morpheme), 84 and this is probably the reason for the confusion of rank with exponence. But the scales of rank and exponence are again different dimensions of abstraction, and one can link any unit directly to its formal exponent (and through this to its exponent in substance): the relation of an exponent of the unit "sentence" to the category of sentence is exactly the same as that of an exponent of the unit "morpheme" to the category of morpheme. 10.3. The conflation of levels referred to is the conflation of grammar and phonology, which follows, though is distinct, from the confusion of level with rank (above, 10.1). The theoretical basis of this criticism is complex but crucial. Any distinction in substance may (i) be a free variant, in which case it is formally meaningless, or it may (ii) carry a distinction in form, with meaning either at the grammatical 83 Cf. above, 4.2 n. 37. Hills' proportion, however, is morph : morpheme : allomorph:: sound : phoneme : allophone. "Every morpheme must contain one phoneme and may contain several" (p. 89) and, for English, "the occurrence of any juncture always marks the boundary of an entity larger than a phoneme. The entity thus bounded may be word, phrase or sentence, but must always be at least a morph" (pp. 93—94). The phoneme thus enters into the statement both of the unit "morpheme" and of its structure. 81 That is, the final step of the formal statement, the move to the formal item. Strictly, since formal statement includes the placing of all forms at all units, it would be more accurate to say "though it is by no means always at morpheme rank that systems of formal items are to be found." For example in English the items "when," "because," "if," "in case," "provided that," etc., though they can of course be analyzed into words and morphemes, operate as items at the rank of the group, and, as such, are members of a particular class of the group.

198

o r at the lexical level. 8 5 All

f o r m a l distinctions p r e s u p p o s e

some

d i s t i n c t i o n in substance, 8 6 and o n c e a distinction in substance is s h o w n t o carry a f o r m a l distinction it m u s t be a c c o u n t e d f o r in p h o n o l o g y . 8 7 B u t n o relation w h a t e v e r is p r e s u p p o s e d b e t w e e n the

categories

required t o state the distinction in f o r m (grammar or lexis) a n d the categories

required to state p h o n o l o g i c a l l y the distinction in substance

w h i c h carries it. 8 8 F o r e x a m p l e : the units m a y n o t be coextensive, a n d

85

So if we find in three languages items in substance statable phonetically a [pata] and [pete], these may yield: Substance Li [a]/[e] L, " L, "

Form —(free variant) singular/plural (grammar) 'cat'/'dog' (lexis)

(Phonologically restricted variants may be of either type: the language might have [pata] and [pete], never [pate] or [peta], without prejudice to whether the contrast between [pata] and [pete] is formally meaningful [L2,3) or not (LJ.) 8 " It does not matter, of course, what type of distinction is made in substance: the pair above could equally be replaced by e.g. [pit] and [pat], or ['pata] and [pa'ta], etc. " Again it does not matter where: the following grammatical contrasts in English are carried by substantial features requiring very different phonological statements: Form Phonology (unit) (contrast) I work: I worked phoneme: addition of segment /t/ " : replacement of /v/ by /d/ they've worked: they'd worked he was working: was he working syllable: change in sequence foot: shift of unit boundary (so rehe was/working: he/was working distribution of strong and weak syllables—change of tonicity) tone group: replacement of one term II1 he was/working//:// 4 he was/ in intonation system by another working// The phonological statement cannot necessarily be expected to cover the systems concerned: it would be absurd, for example, to state the affirmative: interrogative system in phonological terms—though, as said below, it must carry the potentiality of being so stated, since it presupposes a distinction in substance. 88 Phonology relates form to substance by providing for a separate statement of abstraction f r o m substance for those features that are formally meaningful. The relevant section of the diagram in 1.7 n. 10 above could be more delicately represented as: Substance

Form \phonology..-'"

4
ei > ai > ai within the so-called Great Vowel Shift. The stage di was reached in the course of the 17th century, so that at that period (and well into the 18th century) word-pairs like refines — joins made perfect rhymes. Under these circumstances, one might have expected the diphthongal di of words like joint, point to develop into ai, along with the ai that had been traced back to M E i. The ultimate merger of what were originally the ME sounds i and ui really did take place in number of dialects but not in the standard language. On the contrary, in words of the type joint, point one can note, from the middle of the 18th century onwards, the penetration of the diphthong [oi], which has remained characteristic of the standard pronunciation of such words until the present day. This unexpected turn of development is commonly attributed to the influence of spelling;14 as is well known, the written form of words like joint, point had contained the digraph oijoy since the M E takeover of these words from Norman French. There is no reason why this explanation should be refuted; and yet, it again contains only a part of the truth, not the whole of it. It is worth pointing out that the said explanation leaves one aspect of the process unaccounted for: why is it that the impact of the written norm upon its spoken counterpart " K. Luick, Historische Grammatik d. engl. Sprache, I. Leipzig 1914—40, § 544. 14 L. Luick, I.e.; W. Horn-M. Lehnert, Laut unci Leben. Berlin 1953, § 185.

215

has come to assert itself in this particular type of words, while in some other word-types in which the written o also corresponded to the spoken a no such impact can be observed — see, e.g., words like come, done, love, pronounced in ME as [kum, dun, luv], in the 17th century as [kam, dsn, lav], in ModE as [kAm, dAn, IAV]. N o trace of the influence of written o upon the pronunciation can be established here. How can the difference of development in the two word types be accounted for? In attempting to answer this question one should again recall the fact that the impact of the written norm of language upon its spoken counterpart is only a specific instance of that more general phenomenon, viz. of the influence of external factors on the development of the system of language. Convinced as we are of the specific character of the system of the written norm (see above, note 8), the external character of the interventions of that norm into the structure of the corresponding spoken norm is not open to doubt: the interventions are qualitatively different from the internal changes going on within the structure of the spoken norm. As however, these internal changes often appear to be motivated by the structural needs and wants of the spoken norm, a hypothesis may naturally emerge to the effect that the very intervention of the written norm may be somehow connected with the structural situation within the spoken norm. In other words, one should ask whether the spelling pronunciation [oi] in words like joint, point may not have been motivated by what Havränek calls "raisons intrinsèques" of the English spoken norm. To answer this question adequately, one should recall the fact that the diphthong [oi] plays a very specific part in the ModE phonematic system. As has been shown in some detail elsewhere,16 the ModE [oi] signalizes the synchronically foreign character of the word containing it.16 It must have been felt as such signal since the EME period when the diphthong çi (and ui\) appeared for the first time in English in loanwords of Norman French origin. Graphically both diphthongs were recorded by one and the same digraph, viz. oijoy. When words containing the ME ui reached the stage of ai, a concrete possibility arose of the definite merger of what originally has been ME I and M E ui. It should be realized that such phonematic merger would have deprived the words of the type joint, point of their signal of foreign character; i.e. words of that type would have become

15

J. Vachek, Über die phonologische Interpretation der Diphthonge mit besonderer Berücksichtigung des Englischen. Facultas philosophica univ. Carolinae Pragensis, Prâce z. véd. üstavu 33, Praha 1933, pp. 87—170 (esp. pp. 133, 165). " On synchronically foreign words see V. Mathesius, Englische Studien 70. 1935, pp. 21—35.

216

virtually domesticated. This domestication would have drastically separated such words from those lexical items of French origin which had contained the diphthong Qi (also a signal of foreign character) and were to preserve this diphthong also in future (see e.g., choice, joy). One may thus conclude that in EModE a tendency emerged counteracting the possibility of domestication of words like joint, point; this tendency may have been aimed at strengthening the lexical and stylistic links joining the words of that type with those of the type choice, joy, equally felt as synchronically foreign, by the introduction of Qi into the words of the former type. There can be no doubt that the diphthong Qi, an outstanding and, on account of its structural asymmetry, 17 also a very striking phonematic item of the language, was particularly fitted for the purpose of underlining the synchronically foreign character common to both discussed word categories. The need to differentiate, as clearly as possible, synchronically foreign words from those which were synchronically domestic was indicated in English with particular urgency, in view of the important stylistic part played in that language by foreign lexical items since the ME period.18 But other languages, too, present analogous instances of increased differentiation: see e.g., the part played n vulgar Colloquial Czech by the phoneme /g/, unknown in domestic words but often introduced into synchronically foreign words, again for the purpose oif underlining their synchronically foreign character (see inst. like balgon 'balcony', cirgus 'circus', bicygl 'bicycle', plagat 'placard, poster', for the first time pointed out by V. Mathesius)19.

It appears, then, that the 18th century spoken norm of English readily conformed to the external influence of its corresponding written norm because the intervention of the latter was found acceptable by, and even beneficial to, the former, whose two lexical strata, so important for stylistic purposes, could in future be delimited and differentiated more effectively than before. At the same time, this functional conception of our problem can satisfactorily account for the fact that no spelling pronunciation asserted itself in the abovenoted instances like come, done, love, whose 17th century structure also opposed written o to spoken a. It will be easily seen that in instances of this type there were no structural pre-requisites for the penetration of the spelling pronunciation. First, words like come, done, love do not belong to the synchronically foreign, but to the synchronically domestic lexical stratum which, being an unmarked member of the opposition foreign—domestic, needs no specific phonic

17

See our treatise quoted above, note 15, esp. p. 110. A. C. Baugh, A History of the English Language. London 1952, esp. pp. 230 ff. "Travaux du CLP 1, Prague 1929, pp. 67—85. 18

217

signals to mark it off from the rest of the vocabulary. Second, the phoneme /;>/, which might have benefited from the assertion of spelling pronunciation in come, done, love, has never been characteristic of this or that stratum of the English vocabulary. It is frequently found in both the opposed strata and therefore, unlike the diphthong [oi], it is not fitted to act as a phonic signal characterizing any of the two. To sum up, it appears that also the circumstances accompanying the penetration of the spelling pronunciation [oi] in words like joint, point fully confirm the validity of the above-quoted thesis o f B . Havranek; it may be suggested, then, that the validity of the thesis is not confined to the grammatical level of language (as V. N. Yartseva's formulation of her analogous thesis might suggest) but applies to its phonic level as well. V Another interesting case of the assertion of spelling pronunciation in EModE is concerned with the unstressed suffix -ing, frequently added to verbal bases (such as be-ing, mak-ing, speak-ing). As is commonly known, the final [-qg] of that suffix became simplified into [-5] (the change may have taken place as early as in the 14th century; in the standard pronunciation it must have penetrated by the end of the 16th century at the latest). In the EModE period (in some dialects even earlier) this [-q] became simplified into [-n] which also penetrated into the standard pronunciation. As, however, the written norm of the standard language retained the spelling -ing, English orthoepists made every effort to restore the original pronunciation [-iij]. The effort proved to be successful: by the end of the 17th century [-ig] came to be restored in the standard pronunciation, while the pronunciation [-in] has been preserved only in dialects (and, to some extent, in the speech of conservative aristocracy.20 The assertion of the spelling pronunciation in this case presents some specific features which, from the general linguistic point-of-view, make it even more remarkable than the assertion of spelling pronunciation in words like joint, point. One had not to do here, that is to say, with the problem of differentiating two lexical strata, but with one of the structural problems of the English phonematic system considered as a whole, without any regard to stylistic differentiation. 21 The change of the suffixal [-irj] > [-in], it should be noted, seriously

" K. Luick, op. cit. § 767; W. Horn-M. Lehnert, op. cit. § 408. " For a more detailed analysis of the problem see J. Vachek, Notes on the Phonematic Value of theModem English t}-Sound (to be published in D. Jones' Commemorative Volume).

218

jeopardized the very existence of the phoneme /r)/ in English. After that change, the phoneme /q/ could only occur in one single position, viz. at the end of a stressed morpheme (as in sing, tongue, etc.), and even there the sound [-q] might have been interpreted differently, i.e. as a manifestation of the biphonematic group /ng/ (though it is fair to state that this alternative phonematic interpretation, too, would have involved some specific difficulties). Under the circumstances, the discarding of the phoneme /q/ seemed to be near at hand, the more so that in words like ink, tank, finger the velar articulation of [-1]-] was clearly due to the following [k] or [g], so that these instances of [rj] could be easily explained away as combinatory variants of the phoneme /n/. The more surprising appears, then, the restoration of [-1]] in the suffix -ing, as this restoration obviously ran counter to the trend of development ascertainable in English before the time of that restoration. On the face of it, the external intervention of the written norm in this case looks like a factor that was not merely inorganic but even destructive, because it invalidated the impending solution of an urgent phonematic problem, i.e. it made impossible the abolishment of the phoneme /r)/, whose functional yield had become extremely slight and which, therefore, must have appeared as a most uneconomic item of the language. In other words, the intervention of an external factor here appears to have been not only non-conforming to the needs and wants of the system of language, but even flagrantly opposed to such needs. And, of course, it also appears to be in glaring contradiction to Havrânek's thesis referred to above. Still, a more detailed analysis of the structural situation on E M o d E is bound to reveal that even in the case of the restoration of [q] in the suffix -ing the external influence of the written norm could only be asserted because the E M o d E spoken norm had been possessed of an important structural pre-requisite, enabling it to conform to that external influence. This pre-requisite was what A . Martinet 22 calls the "full integration" of the phoneme /q/. A s is commonly known, as fully integrated within its phonematic system is regarded that phoneme which is opposed, by means of its distinctive features, to a greater number of phonemes co-existing with it in the system. Thus, /p/ may be regarded as fully integrated in English, because it is opposed not only to /b/ (from which it is differentiated as its tense counterpart), but also to jfI and /t/ (the differentiating features being here, respectively, the explosive and the gravis articulation of [p]23). The principle

** Économie des changements phonétiques, Berne 1955, pp. 79 ff. ,3 For the less c o m m o n terms see R. Jakobson-M. Halle-C. G. M. Fant, Preliminaries to Speech Analysis. Technical Report N o . 13, Acoustics Laboratory, Massachusetts Technological Institute, January 1952.

219

of economy, the importance of which for language Martinet duly points out, is responsible for the tendency aimed at having the phonemes of language integrated as fully as possible. In Martinet's opinion, the more integrated a phoneme is, the firmer is its foothold in the system and, vice versa, an unsatisfactory degree of integration of a phoneme may lead to a palpable weakening of its foothold in the system, and even to its ultimate abolishment in it. Concrete investigation of language development seems to endorse Martinet's theory. Some time ago we tried to show24 that one of the main reasons of the gradual but consistent process of abolishment of the ModE phoneme /h/ is its structural isolation among the ModE consonant phonemes (i.e., its lack of integration), and similar comment of ours, though less radically stated, attaches to ModE /r/.25 The important part played by the degree of integration of this or that phoneme is also evidenced by the fact that fully integrated phonemes may often subsist in language despite their low frequency of occurrence in actual contexts and despite their slight functional yield. Martinet himself mentions ModE /z/ as a specimen case of this category. Statistical investigation has shown that /z/ is the least frequent of ModE phonemes; its inability to occur in a number of important wordpositions (e.g., word-initial and word-final) is responsible for its very slight functional yield. And yet, for all these grave handicaps, the phoneme /z/ not only subsists in English but does not show any signs of its impending abolishment. In Martinet's opinion, its firm foothold in the system is due to the relatively high degree of integration: /zI is a member of two correlative series, being opposed to /§/ and to /c/ (the concerned types of opposition being, respectively, those of lax — tense, and of continuant — discontinuous). Clearly, should the phoneme /z/ become discarded from the ModE system of consonant phonemes, an empty space ("case vide", as Martinet calls it) would arise in the network of ModE phonematic relations. It appears that it is exactly the tendency to prevent the rise of such an empty space that is responsible for the continued existence of /z/ in the ModE phonematic system, despite all its above-mentioned handicaps. Let us take up again the problem of the ModE phoneme /q/. It will be recalled that it is a fully integrated phoneme, and it has been such from the very beginning of its existence in English (i.e., from Late ME or EModE). This is clearly shown by the following scheme: /PI - / t / - / k / /b/ - / d / - / g / H - ¡nIW " See our paper quoted above, note 7. " Sbornik praci filosoficke fakulty brnenske university A8, 1960, pp. 79—93.

220

The scheme reveals that the phonologization of /q/ has filled an empty space that existed in the English phonematic system before that phonologization, and that the abolishment of the phoneme /rj/ would re-establish that empty space. The above-discussed instance of M o d E /zI has shown that the tendency aimed at the full integration of a phoneme may be so powerful as to render insignificant the troubles caused by low contextual frequency and slight functional yield. One may, therefore, venture to suppose that also in the case of M o d E /q/ its full integration in the system counted for more than its relatively small functional yield. Seen in this light, even the restoration of [-r>] in the suffix -ing does not appear to be a factor so inorganic and destructive as one might be tempted to think. Indeed, in view of the fact that the influence of the written norm, enforced by the effort of the orthoepists, helped to prop up the position of the jeopardized phoneme /rj/ by restoring one of its lost positions in English words, the operation of external factors appears, in this case too, to have been motivated by the needs and wants of the system of language. Exactly as in the case of /z/, the full integration of /q/ helped to preserve in language a phoneme whose foothold, judged by quantitative standards, had not been particularly firm. Under these circumstances, it appeared profitable to conform to the operation of external factors where this operation was able to underline the phonematic status of the jeopardized but fully integrated phoneme. It is worth pointing out that in popular dialects (which, unlike the standard language, were free f r o m the impact of orthoepists) the position of /r)/ in the system, despite its full integration, remained unstable; as has been shown in our paper quoted above, note 21, the process aimed at the abolishment of /rj/ as a phoneme (i.e., at the phonematic revaluation of [g] into /ng/ or, in other positions, into /n/) is in a fairly advanced stage.

Summarizingly, it may be said that the sound changes concerning E M o d E [r|] furnish highly instructive evidence of the interplay of external and internal factors in language development. It will be noted that, for all the importance of the external factors, the decisive part in the interplay, here too, appears to be invariably reserved to factors of internal order. In other words, not even the sound changes concerning E M o d E [13] are in contradiction to the thesis of B. Havranek; on the contrary, they may be said to be in full agreement with that thesis.

VI Our rapid glance at three remarkable points of the historical development of English has confirmed that the influence of external factors upon the development of the structure of language could only 221

assert itself because its assertion was in harmony with the needs and wants of the structure exposed to that influence. This conclusion, of course, will have to be checked by further research into the development of other languages before general validity can be attributed to it. At present, at least one objection should be briefly touched upon. It may sometimes be observed that in the development of a language evidence of such external influence may be found as cannot well be regarded as motivated by the structural needs and wants of that language. A remarkable instance of the kind is mentioned by Martinet (op. cit. p. 191): a foreign language (in the given case, Basque) may exercise an influence upon one of the dialects of the native language (in the given case, Catalanian) which, in some of its point, becomes changed in a manner which wholly lacks any structural motivation. In reflecting upon such instances, Martinet does not hesitate to give vent to his distrust of consistently functional explanations of language development. He says expressly that ". . . il y a des cas ou, quoi qu'on fasse, elles [ = les solutions fonctionelles, J. V.] sont impuissantes, . . . elles ne sont pas un ensemble de recettes permettant d'expliquer tout a partir de n'importe quoi" (p. 191). Still, as we have already pointed out elsewhere,28 it is hardly necessary to draw from the given premisses a conclusion so very sceptical. Instances of the type pointed out by Martinet certainly exist but they by no means suspend the validity of the thesis urging the necessity of the functional approach to the study of external influence upon language; they only impel the linguist to formulate the said thesis with some caution. Obviously, it will not be possible to maintain that a language system (and particularly its phonic level) submits only to such external influence as conforms with its structural needs and wants. Clearly, a negative formula will be more up to the mark: a language system (and particularly its phonic level) does not submit to such external influence as would be incompatible with its structural needs and wants. To put the thing differently, language so to speak exercises the right of control with regard to the external influence with which it is faced. The role of the system of language is thus rather regulative than initiative. 2 '

" Slovo a slovesnost (Praha) 19, 1958, pp. 52—60.—Cf. also P. Trost's observations ibid. 21, 1960, pp. 7—9. 27 Incidentally, analogous regulative control seems to be exercised by the system of language with regard to the rules governing the mechanism of speech-organs. These rules undoubtedly motivate (or at least co-motivate) many a sound-change, e.g. various assimilations, reductions in unstressed syllables, etc. Sometimes it happens, however, that a change which might appear imminent, is not materialized, obviously because its materialization would interfere with the

222

If our negative formula is confronted with the thesis of B. Havrânek, repeatedly discussed in the above lines, it will be found that no basic difference exists between the two. Our final formula only specifies and makes more explicit Havrânek's references to "des raisons intrinsèques". One may indeed say that Havrânek's approach to the problem, though dating from more than three decades ago, was fundamentally sound. As regards V. N. Yartseva's formula, going back to 1952, it may be credited with having duly implied the regulative part played by language in conforming to outside influence. On the other hand, her thesis refers to the grammatical level of language alone. Our above observations show, however, that the thesis has a wider scope, and that it will have to be applied even to the phonic level of language.28 structural needs and wants of language. (On this point, see also J. Vachek, Sbornik praci filos. fak. brnenké university A2, 1954, pp. 67—80.) 28 A. Sommerfelt's valuable paper External versus Internal Factors in the Development of Language, NTS 19, 1960 [in fact, late 1961], reached the present writer after the MS of the above lines had been handed over to the printer, and so could no longer be evaluated here.

223

André Martinet

De la variété des unités significatives La recherche linguistique contemporaine, qui entend se fonder sur des réalités directement observables et opérer avec des unités définies formellement, a écarté dès l'abord la distinction traditionnelle entre des unités lexicales et des unités grammaticales, ou, pour employer des termes usuels, dans les écrits de langue française, entre « sémantèmes » et « morphèmes ». Il s'agissait assez peu, au départ, de s'élever contre les définitions naïves selon lesquelles les premiers avaient un sens et les seconds n'en avaient pas. On désirait surtout marquer ce que toutes les unités « à double face », douées d'un signifiant et d'un signifié, avaient en commun et qui les opposait à l'autre unité fondamentale, l'unité à face unique, le phonème. Le terme de « morphème » a été presque universellement retenu pour désigner l'unité significative minima, et dans l'usage d'Outre-Atlantique on opère aujourd'hui dans le cadre de la « morphémique » avec des « morphes » et des « allomorphes » selon le modèle des « phones » et des « allophones » de la «phonémique ». Le désir de ne pas remettre trop tôt en question l'unité fondamentale du « morphème » ainsi conçu, a eu pour effet qu'on s'est longtemps refusé à envisager, sur le plan du langage en général, la nécessité ou l'utilité d'une distinction entre plusieurs types de « morphèmes ». On s'est attaché à classer, dans chaque langue particulière, les unités significatives minima selon leurs latitudes combinatoires, sans chercher, bien entendu, à identifier, d'une langue à une autre, les catégories ainsi obtenues. On attendait, de toute langue, qu'elle présentât des phonèmes et des « morphèmes » avec les structurations qu'impliquent ces termes. Mais on se refusait à poser en principe l'existence universelle de deux types ou plus de deux types distincts de « morphème », un peu comme on écartait, en phonologie, l'obligation de ranger nécessairement à part syllabiques et non-syllabiques, c'est-à-dire voyelles et consonnes. Nous apercevons nettement aujourd'hui la nécessité de dépasser ce stade de la recherche, et nous en possédons les moyens. Mais le propos délibéré de ne pas outrepasser les données de l'observation, de ne pas induire hâtivement, de ne pas voir un trait fondamental de la nature humaine là où il n'y a qu'une habitude particulière à un canton du globe ou, tout au plus, un trait largement répandu, reste un besoin fondamental de nos recherches. La démarche qui nous amène à poser, 224

en linguistique générale, le problème des différents types d'unités significatives minima, ne se fonde pas sur une généralisation à partir d'observations particulières. Elle résulte d'un examen des rapports qu'entretiennent nécessairement entre elles ces unités lorsqu'elles figurent dans un énoncé quelconque. Nous ne postulons rien qui ne soit impliqué dans la définition d'une langue comme un instrument de communication procédant par émissions vocales, donc linéaires. Ces émissions, dites « énoncés », étant doublement articulées et intégralement analysables en deux types d'unités successives : des unités distinctives, dites « phonèmes », des unités significatives, les « morphèmes » de la plupart des « structuralistes ». Pour ces derniers, nous préférons la dénomination moins ambiguë de « monèmes ». On ne comprendra pourquoi la question peut et doit se poser de l'établissement de catégories distinctes de monèmes antérieurement à l'analyse de langues particulières, que si l'on perçoit tout d'abord que ce qui vaut pour les phonèmes ne vaut pas nécessairement pour les monèmes. L'analyse linguistique contemporaine s'est attachée tout d'abord à dégager les unités distinctives, les phonèmes, et à en marquer le caractère proprement linguistique, caractère que la recherche traditionnelle avait mal perçu ou mal explicité. Ce n'est que dans un deuxième temps qu'a été abordé l'examen des unités significatives. On s'explique, dans ces conditions, que l'expérience phonologique, toute fraîche, ait été largement mise à contribution comme en portent témoignage les parallélismes terminologiques rappelés cidessus. Le principe fondamental selon lequel rien n'est proprement linguistique qui n'ait une expression formelle (un signifiant) a entraîné maints chercheurs à ne voir, dans le « morphème », qu'une succession de phonèmes, et à oublier que si les unités significatives sont plus complexes que les unités distinctives, ce n'est pas seulement parce qu'elles se « composent » en général de plusieurs phonèmes, mais surtout parce que leur fonction est autre. On ne saurait calquer le traitement des « morphèmes » sur celui des phonèmes. Il ne peut être question, une fois les unités significatives dégagées, de faire abstraction de leur caractère significatif et de procéder à leur classement par simple référence aux positions respectives qu'elles peuvent occuper dans la chaîne. Ceci ne veut pas dire que leur signification propre doive intervenir à ce stade de la recherche, mais seulement que le fait qu'elles contribuent à la signification a pour conséquence l'existence de relations syntagmatiques dont ne saurait rendre compte un relevé des collocations possibles. Pour dégager en quoi diiïère le comportement proprement linguistique des phonèmes et des monèmes, il faut rechercher ce qu'impliquent en fait les épithètes de « distinctifs » et de « significatifs » qui servent à les caractériser en les opposant les uns aux autres. Ceci ap9—Malmberg, Readings .

225

paraît assez bien lorsqu'on compare le rôle d'une même réalité physique, le chiffre, dans les numéros d'une part, les nombres proprement dits d'autre part. Dans un numéro de téléphone, par exemple, celui d'une petite ville ou, dans celui de Paris, lorsqu'on fait abstraction du central, disons 2413, un chiffre comme 2 ne représente, ne symbolise aucune réalité; seule la suite de chiffres 2413 est identifiable comme le numéro de l'abonné M. N. Seul l'ensemble 2413 a une valeur significative. Le choix de 2, en première position, au lieu de 3 ou de 1 permet à lui seul de distinguer ce numéro 2413 de 3413 et de 1413 qui sont ceux d'autres abonnés. Chaque chiffre a, dans un numéro, une fonction distinctive qu'il exerce à son rang. La situation est analogue à celle que nous constatons dans le cas des phonèmes: soit le mot /sval / («cheval»); le choix de /s/ en première position au lieu de /a/ ou de lo/ permet à lui seul de distinguer ce mot /sval/ des mots /aval/ /« aval ») et /oval/ (« ovale »); il se trouve que /tval/, avec /t/ au lieu de /s/ n'existe pas comme mot, comme il se peut que le numéro/5413/ avec /5/ au lieu de /2/ ne soit affecté à aucun abonné. Tout autre est le rôle du chiffre dans un véritable nombre. Soit le nombre 2413 qui désigne en kilogrammes le poids d'un chargement. Le chiffre 2 y correspond à une réalité précise, à savoir une partie du chargement qui pèse deux tonnes; les autres chiffres, 4, 1 et 3, correspondent eux aussi à des réalités. Dans un nombre, chaque chiffre a une valeur significative. Cette valeur résulte de la combinaison d'une valeur intrinsèque, dans le cas de 2 la « dualité », et de la valeur conférée par la position respective des unités, dans le cas du 2 de 2413 le « millier ». Cette valeur est analogue à la fonction significative des monèmes. Soit l'énoncé le cheval tire la charrette; le monème cheval y combine sa valeur propre d'animal d'une certaine espèce avec celle de « sujet » de ce qui suit qui lui est conférée par sa place par rapport aux autres monèmes de l'énoncé. La façon dont s'analysent linguistiquement les données de l'expérience dépend de la langue employée: là où le français utilise les cinq monèmes le, cheval, tire, la, charrette dans cet ordre, telle autre langue utiliserait un énoncé que nous pourrions être tenté de rendre comme par, cheval, charrette, tirage. De même, la façon dont s'exprimera numériquement une masse déterminée dépendra du système de numération employé: là où, avec le système décimal, on « analyse » le chargement en deux milliers, quatre centaines, une dizaine et trois unités de masse, l'emploi d'un système duodécimal aboutirait à une « analyse » en une unité de quatrième rang, quatre de troisième, neuf de deuxième et une unité. Un autre système de numération, celui qui, à chaque rang, ne distingue qu'entre l'unité, 1, et son absence, 0, de telle sorte que le premier rang indique l'unité ou son absence, le second la paire, p. ex. 1(0), ou son absence, p. ex. (1)0(1), le troisième la double paire, p. ex. 1(00), ou son absence 226

(1)0(00), etc., exprimerait la même masse au moyen d'un nombre de 12 chiffres : 100101100011. Notre système de notation des nombres présente toutefois un degré d'abstraction et de condensation qu'on ne saurait attendre des systèmes moins consciemment élaborés que sont les systèmes linguistiques. Sur certains points, ce que nous trouvons dans les langues rappelle les systèmes de notation des nombres qui ont précédé l'emploi du zéro, comme celui des Romains où chaque chiffre portait en lui-même sa valeur tout entière : M, indépendamment de son rang, correspondait à « millier », C à centaine, X à dizaine, etc.; dans le système primitif où tous les chiffres successifs indiquaient des grandeurs qui s'ajoutaient et, où l'on n'utilisait pas la soustraction (type IV = 4 de la numération romaine d'aujourd'hui), 2413 était noté MMCCCCXIII. Avec un système de ce type, il était assez normal que la forme graphique suivît la forme orale correspondante et qu'on commençât par noter les unités les plus élevées pour finir par les plus basses. Mais, puisque la valeur du chiffre ne dépendait pas de sa position par rapport aux autres chiffres du même nombre, 2413 aurait pu se noter également, encore que moins pratiquement, IIIXCCCCMM, ou encore MCCXICCIIM. Employé par des personnes de langue allemande, un tel système pourrait permettre de conserver l'ordre des éléments de la numération parlée : vierhundertneunundzwanzig (429) serait aussi bien ou mieux CCCC VIIIIXX que CCCCXXVIIII. Il est, dans les langues, des monèmes qui se comportent comme les chiffres romains, c'est-à-dire dont la valeur ne doit rien à la place qu'ils occupent parmi les autres monèmes de l'énoncé : la fonction d'un monème comme hier est la même quelle que soit sa position par rapport aux autres éléments de la proposition : la valeur d'hier est la même que je dise il est arrivé hier ou hier, il est arrivé; il n'est pas normal de construire il est hier arrivé, mais si un poète ou quelque étranger risquait cette syntaxe, la valeur de hier resterait identique à elle-même. Il est vrai que le message il est arrivé hier et le message hier, il est arrivé ne sont pas identiques ou, comme on dit, ils n'ont pas absolument la même signification. Mais la valeur de hier n'est nullement affectée de ce fait. Le comportement de l'interlocuteur, ce qu'on peut considérer comme l'équivalent observable de cette signification, peut varier certes selon la place donnée à hier. Mais le parallèle des chiffres romains illustre bien en quoi ceci n'affecte pas la contribution d'hier à la signification totale : il n'est pas dit qu'un client réagirait de la même façon à un prix indiqué soit comme IIIVXCD, soit comme DCXVIII; mais D vaudrait 500 aussi bien dans le premier nombre que dans le second. L'analogie de structure entre les nombres et les énoncés linguistiques ne saurait être poursuivie beaucoup plus loin. Il existe en fait, entre les uns et les autres, une différence fondamentale : le nombre 227

n'exprime jamais qu'un des degrés d'un même signifié : la quantité dénombrable. La quantité correspondant à un nombre donné intéresse les usagers comme un tout et nullement du fait de l'articulation particulière qu'il reçoit par suite de l'utilisation de tel ou tel système : 618 et DCXVIII sont absolument identiques; on passe de l'un à l'autre sans résidu d'aucune sorte. Il n'en va pas de même de la communication linguistique où l'expérience à transmettre est toujours d'une complexité telle qu'il faut nécessairement choisir ceux des éléments qui apparaîtront dans le message. Ce choix est largement déterminé par la structure et les ressources de la langue employée, de telle sorte qu'il ne saurait y avoir identité entre j'ai mal à la tête et mi duole il capo comme il y a identité entre 618 et DCXVIII. L'analyse qui aboutit au nombre peut être, pratiquement, plus ou moins recommandable. Mais elle n'affecte en rien le message : en passant d'un système décimal à un système duodécimal, chiffres et rangs (dizaines, centaines d'une part, douzaines, grosses d'autre part) se partagent différemment la besogne : ce qui est chiffre d'un côté peut être rang de l'autre et vice-versa. Mais ceci ne change pas le résultat : le contenu du message est homogène, même si son expression ne l'est pas. Le contenu du message linguistique n'est pas toujours homogène; son articulation s'en ressent et ne peut plus être simplement, comme dans le cas du nombre, une question d'opportunité pratique. Certains éléments de l'expérience se trouvent s'imposer avec une grande fréquence, ceux, par exemple, qui correspondent à des rapports et qui s'expriment souvent au moyen de prépositions. D'autres sont individuellement plus rares, ceux, par exemple, qui correspondent à des objets ou des actions et dont l'expression fournit la masse des lexiques. De par le jeu normal de l'économie, les plus fréquents tendent à s'exprimer de la façon la plus courte et la plus simple, la plus simple de toutes consistant à laisser la position respective des monèmes correspondant à d'autres éléments le soin de les suggérer, de même que la position de 1 devant 3 dans 13 suffit à suggérer « dizaine ». C'est ainsi qu'en français la position de Jean devant court dans Jean court suggère « sujet ». Mais alors que la valeur significative du rang intervient à n'importe quel degré de la quantité dénombrable selon le système de numération choisi, l'utilisation de la position respective des éléments de la chaîne linguistique est sous la dépendance de la nature, combien variable, des réalités perçues qui sont à la source des messages, réalités qui, de façon générale, déterminent la fréquence respective des diverses unités linguistiques. Les rapports entre les différents éléments du nombre sont uniformes et de la plus grande simplicité : il s'agit toujours, complications comme IV et raffinements ultérieurs comme 22 mis à part, de rapports additifs : 2413, c'est deux milliers+quatre centaines+une dizaine 228

+ 3 unités. Les rapports entre les monèmes de l'énoncé participent de la complexité du contenu de l'expérience à transmettre. Tant que les rapports de deux termes successifs sont toujours du même type, additif par exemple, la simple succession des deux termes suffit à indiquer leur rapport. Mais là où existe toute une gamme de rapports divers, il faut nécessairement avoir recours, au moins pour certains d'entre eux, à autre chose que la simple succession. On peut sans doute tirer le maximum de cette succession en donnant une valeur à sa direction de façon que le rapport du premier terme au second ne soit pas identique à celui de second au premier : dans l'anglais hair-root, le premier élément est complémentaire du second, celui-ci étant primaire. D'autre part, on peut se contenter d'exprimer un rapport très général en laissant au sens des deux éléments le soin d'en préciser la nature : gold watch désigne une montre dont les éléments métalliques apparents sont réalisés en or; goldfish désigne un poisson dont l'aspect peut évoquer l'or; watch évoquant un objet à parties métalliques, le rapport « fait (partiellement) de » ou, simplement, « en » s'impose; fish désignant un animal, c'est-à-dire un composé de matières organiques, le rapport ne peut guère être que « qui rappelle » ou, simplement, « comme ». Certaines langues, on pense par exemple à celles de l'Asie de l'est et du sud-est, tirent un parti remarquable de ce qu'on peut appeler le rapport de détermination. Il semble, toutefois, qu'on ne puisse nulle part éviter l'utilisation de procédés moins sommaires d'indication des rapports. Si nous laissons de côté les procédés prosodiques ou, si l'on préfère, supra-segmentaux qui, ou bien sortent du cadre proprement linguistique (faits d'intonation), ou, comme les tons, s'identifient en fait avec ceux qui vont suivre, la façon la plus simple de noter les rapports est d'introduire à cet effet un nouveau monème dans la chaîne, c'est-à-dire de considérer le rapport comme un élément de l'expérience à communiquer au même titre que les termes de ce rapport. C'est ce que font, tout naturellement et sans se poser aucun problème, ceux qui se refusent à distinguer entre différents types d'unités significatives sur le plan de la linguistique générale et avant de considérer une langue déterminée. Est-ce à dire, toutefois, que ces monèmes qui indiquent les rapports soient en tous points de même type que ceux dont ils indiquent les rapports? N'ont-ils pas des propriétés syntaxiques particulières qui les distinguent de tous les autres monèmes? Notons d'abord que là où s'établit un rapport de détermination, l'élément déterminé continue d'exister avec son statut antérieur lorsqu'on supprime l'élément déterminant : si dans les amis des voisins sont arrivés, je supprime des voisins, le statut de les amis dans le nouvel énoncé les amis sont arrvés n'a pas changé. L'élément qui précise la nature de la détermination n'a naturellement de justification qu'en 229

présence du déterminant; si celui-ci disparaît, l'indicateur du rapport doit disparaître. Les amis des voisins n'est pas à concevoir comme les amis—des—voisins mais bien comme les amis—des voisins. Mais ce qu'il importe de bien retenir c'est que, du fait de la présence de l'indicateur du rapport, le déterminant acquiert une autonomie syntaxique, c'est-à-dire la possibilité de figurer dans l'énoncé sans perdre sa qualité de déterminant. Peu importe qu'on ne fasse qu'exceptionnellement usage des latitudes que confère cette autonomie; des voisins les amis sont arrivés serait certes inattendu, mais resterait parfaitement compréhensible. Le rapport d'un déterminant à ce qu'il détermine est d'ordinaire désigné comme sa fonction. Il est donc normal qu'on désigne ceux des monèmes qui indiquent la fonction de celui ou ceux qu'il accompagne comme des monèmes fonctionnels. On peut définir les monèmes fonctionnels comme ceux qui confèrent l'autonomie syntaxique à des monèmes qui ne l'ont pas naturellement. Ceux qui, comme hier, ou vite, peuvent figurer en différents points de l'énoncé sans que leur contribution personnelle à cet énoncé soit modifiée, ceux donc dont la fonction est incluse dans leur sens-même, jouissent de l'autonomie syntaxique et seront désignés comme des monèmes autonomes. Le critère de l'autonomie syntaxique permet donc de distinguer sur le plan de la linguistique générale et antérieurement à toute considération d'une langue particulière, entre des monèmes non-autonomes du type de voisin, des monèmes autonomes, du type d'hier, et des monèmes fonctionnels dont l'adjonction confère l'autonomie à un monème non-autonome. Il est vraisemblable que toute langue présente ces trois types de monèmes. Mais nous ne voulons y voir que des possibilités, d'extension variable d'une langue à une autre, chacune d'entre elles pouvant, en théorie, faire défaut. Le critère de l'autonomie syntaxique aboutit à distinguer fondamentalement, parmi les monèmes « grammaticaux »—ceux qui, comme on dit, appartiennent à des inventaires limités—entre les monèmes fonctionnels comme les prépositions, et les monèmes grammaticaux non-autonomes, comme l'article ou le pluriel. Si ces unités, fonctionnellement si nettement distinctes, ont été jusqu'ici généralement confondues, c'est sans doute que leur fréquence respective étant du même ordre et d'un ordre élevé, leurs signifiants tendent à se contracter selon le principe que le coût d'un signifiant, c'est-à-dire grossièrement le nombre de ses phonèmes, diminue quand augmente sa fréquence. Ceci peut aboutir à l'amalgame de signifiants des types fonctionnels les plus divers, celui que l'on constate par exemple, dans le lat. hominibus, dont il est passablement arbitraire de découper le signifiant en tranches successives, alors qu'on y reconnaît sans difficulté une unité « homme », une unité « datif » (ou « ablatif ») et une 230

unité « pluriel ». L'identification de ces amalgames et leur dissociation en monèmes distincts est recommandable dès que ces monèmes appartiennent à des types fonctionnellement distincts. Il y a une réalité fonctionnelle du langage qui doit être cherchée au-delà d'accidents purement formels : l'autonomie syntaxique ramène au même procédé linguistique fondamental l'expression prépositionnelle des rapports et leur expression casuelle. La distinction entre des monèmes autonomes, fonctionnels et nonautonomes n'épuise pas la variété des types concevables : le monème prédicatif, celui par rapport auquel se marque l'autonomie ou la nonautonomie des autres composants primaires de l'énoncé, a nécessairement un statut particulier. Ce statut est d'ailleurs variable selon qu'il n'implique qu'un seul type de rapport possible avec ces composants (« verbes » sans distinction entre actif et passif), ou que deux ou plus de deux types de rapport sont à la disposition du locuteur : le vigneron taille la vigne, la vigne est taillée par le vigneron. Les adjectifs de nos langues sont au départ, dans leur emploi comme attribut (le tour est joli), des monèmes prédicatifs dont les diverses modalités (temps, modes, personnes) s'agrègent autour d'une sorte d'auxiliaire, la copule. Leur emploi comme épithète ([le joli tour . ..) représente une utilisation non primaire analogue à celle des monèmes prédicatifs ordinaires en propositions subordonnées. Il convient de ne pas oublier qu'un « même » monème, identifié par sa forme phonologique et par son sens, peut être, selon les contextes, autonome, non-autonome, fonctionnel ou prédicatif : le fr. hier qui nous a servi à illustrer le concept de monème autonome, perd son autonomie dans le contexte la journée d'hier, où sa fonction lui est conférée par le fonctionnel de; dans beaucoup de langues, le mot qui désigne un lieu, comme la forêt, est autonome et équivalent de « dans la forêt », sauf là où sa position par rapport au prédicat ou le voisinage d'un fonctionnel lui retire cette autonomie. Les nombreux idiomes où le « même » monème sert aussi bien comme prédicat, avec le sens de « donner », que comme un fonctionnel indicateur du bénéficiaire (objet indirect), illustrent simplement la variété des rôles que les besoins communicatifs de l'homme peuvent être amenés à confier à un seul et même signe.

231

Elizabeth Uldall

Dimensions of Meaning in Intonation1 Since my first encounters with the study of intonation, under Professor Daniel Jones, the questions of what kind of'meanings' intonation carries, how these vary from one speech community to another, and in what terms the meanings may be described have interested me. I would not wish to maintain that the three dimensions hypothesized in this paper are the only kinds of meaning carried by intonation, but they obviously bulk large in it. At the outset, my intention was to look for some way of reducing the large number of terms used in describing the meanings of intonations, reducing them preferably to a small closed set. The experiment described here consisted in offering to a group of subjects a number of sentences on each of which 16 intonation contours had been imposed synthetically, and asking them to rate these on a set of scales consisting of opposed adjectives, with a view to investigating the attitudes or emotional meanings conveyed by the various contours. 2 Professor Osgood's 'semantic differential' appears to be a suitable technique for investigating the emotional meanings of intonation contours, since it is precisely 'emotional meaning' which is strongly present in intonation, and with this aspect of meaning the semantic differential deals most successfully. The 15 subjects were speakers of American English, and the original recording on which the contours were synthesized was spoken by an American. The contours, shown in Fig. 1, were the same as those used in an earlier experiment. 3 They were intended to cover all the kinds of variation which differentiate intonation contours, though of course nothing like all the possible combinations of variables were represented. The variables are: Range: wide/narrow.

1

The work described here was carried out with the benefit of research funds from the Haskins Laboratories, New York, in connection with a grant from the Carnegie Corporation of New York. I am much indebted to Dr Boris Semeonoff of the Department of Psychology of Edinburgh University for statistical advice. ' See The Measurement of Meaning, Osgood, Suci, and Tannenbaum, Urbana, 1957. * E. T. Uldall, 'Attitudinal Meanings conveyed by Intonation Contours', Language and Speech, III, 1960, 223—234.

232

to

E

Pitch reached at end of contour: high/mid/low. Shape of contour: one direction/with a change of direction. Treatment of weak syllables: (a) continuing the line of the strong syllables; (b) rising above the line of the strong syllables; (c) falling below the line of the strong syllables. The 'scales' used were the same as in the earlier experiment, with the addition of authoritative I submissive, unpleasant I pleasant, genuine!pre233

tended (feeling) and weakjstrong (feeling), so that the page on which the subjects were asked to rate each contour on each sentence appeared thus: bored polite timid sincere tense disapproving deferential impatient emphatic agreeable authoritative unpleasant genuine weak

interested rude confident insincere — — relaxed approving arrogant patient unemphatic disagreeable submissive pleasant pretended strong

These terms were arranged with seven places between them; the subjects were instructed that the places next to the terms should be checked to indicate 'extremely' (bored or interested, etc.), the two places a little farther in from the terms to indicate 'quite' (bored or interested, etc.), the two places flanking the middle to indicate 'slightly' (bored or interested, etc.), and the middle space to indicate 'neutral' or 'neither' in relation to the scale under consideration. The extra scales mentioned were added to the original ten in an effort to find more 'central' terms for the dimensions of emotional meaning which appear to be most strongly represented in intonation: 'pleasant/ unpleasant', 'authoritative/submissive', and 'strong/weak' (feeling expressed). In the material on which diagrams A, B, C, D, E are based, three of the new scales were in fact used as being suitable characteristic terms in these dimensions. The addition 'genuine (feeling)/ pretended (feeling)' was not successful; 'pretended' feeling must either not be expressed in intonation, or be a function of intonation in context; all the contours presented were rated as expressing 'genuine' feeling. The four sentences were as follows: A. Statement: 'None of the members are going.' B. Yes-or-no question: 'Was it arranged at the meeting?' C. Question-word question: 'What did he think they were doing?' D. Command: 'Bring it along to the meeting.' To these was added a nonsense-sequence: E. ['soomava 'patOaro izemq] All of these sentences consisted of the same number and arrangement of strong and weak syllables. The real sentences were intended to be suitable as remarks between social equals. They were recorded by Dr Alvin Liberman of the Haskins Laboratories, New York. It was 234

found necessary to have them all recorded on a rising contour in order that the final syllables should not be so low in intensity as to make synthesis difficult. The contours were 'applied' to the sentences by means of the Voback synthesizer. Each subject took each test twice, some in the same order both times, and some in the reverse order. This was done partly in order to increase the number of judgments to be averaged, and partly to see whether the judgments appeared to be affected by the order in which the contours were presented: were the subjects judging the contours in relation to their whole experience of intonation, or in relation to the preceding contours? It is clear that the former is the case; the variability in judgment was more or less constant for each subject as a person, from two-thirds of a scale unit for the 'best' subject, to one and two-thirds scale units for the 'worst' one ('Scale unit': the difference between, e.g., 'slightly bored' and 'quite bored'.) The average variation over all the texts was 1-12 scale units on test/retest. These are larger 'errors' than Osgood found on test/retest for subjects judging word'concepts' in similar tests: ' . . . average errors . . . always less than a single scale unit . . . and for evaluative [pleasant/ unpleasant] scales average about half of a scale unit.' 4 The contours themselves also varied in the amount of test/retest variability in the judgments made of them: e.g. contour No. 15 (raised weak syllables, final rise) is usually near the most variable end of a list of the contours arranged to show this characteristic. 'Raised weak syllables', though they certainly occur in American intonation, in the speech of men as well as women, are sometimes said to be a 'woman's "submissive"

0

2

2

"strong" (feeling)

weak" (feeling)

• 2

0

"authoritative"

2

2

A: "None of the members are going'

Fig. 2A. The Measurement of Meaning, 131.

235

"submissive"

B:"Was it arranged at the meeting?"

C: "What did he think they were d o i n g ? " Figs 2B a n d C.

intonation'. The variability of the judgments in this case may indicate that this contour was less familiar to the subjects than the other contours were, or that it was unfamiliar to some of the subjects. There were also differences in the amount of variability on the various scale terms: the subjects were least variable on the scales expressing the 'pleasant/unpleasant' dimension, and most variable on those expressing the 'strong/weak' one. In other words, they were more consistent about their own reactions to the contours than about what they judged the 'speaker's' intention to be. Factor analyses of the correlations between the various scales for each part of the experiment—A, B, C, D, E—were carried out with a 236

E: Nonsense sequence: ('soiamava 'paiSars 'zenig) Figs 2 D a n d E.

view to extracting the main 'dimensions of meaning' conveyed by these intonations. As in the previous experiment, the 'pleasant/unpleasant' factor was by far the strongest. The grouping of the scale terms in the factor analyses made it clear, however, that this time the'authoritative/ submissive' factor came second and the 'strong (feeling)/weak (feeling)' factor third. This was the reverse of the earlier experiment, though there were some indications in the earlier one that the arrangement might not be the same for all four sentence types. It is possible that the uniform emergence of the factors on all the sentences this time is related to a larger and better choice of scale terms. 237

Two scales were chosen to represent each factor in the construction of the 'semantic space' 5 diagrams, Fig. 2—A, B, C, D, E, which show the relations of the various contours to the three 'dimensions' and to each other. Subjects' scores (reversed where necessary) on bored/ interested and unpleasant ¡pleasant were averaged to represent the 'pleasant/unpleasant' dimension; authoritative ¡submissive and timidj confident were averaged for 'authoritative/submissive'; and weak/ strong and emphatic¡unemphatic were averaged for the 'strong/weak' dimension. The diagrams display, for each sentence-type and the nonsensesequence, three dimensions: the right half of the diagram shows contours judged 'pleasant', the left half 'unpleasant'. The near half shows those judged 'authoritative', the far half'submissive'. Solid lines rising from the point of intersection of these two scores show 'strong' judgments, the height of the line being proportional to the 'strength' of the feeling; dotted lines descending from the point of intersection of the first two scores show 'weak' judgments, with the length of the line showing how 'weak' the contour was judged to be. The contours are shown at the ends of the vertical lines. Contours may thus be described by three terms: No. 8 is in all cases 'pleasant, authoritative, strong'; No. 4 is 'unpleasant, authoritative, weak' on the statement and both types of question, 'unpleasant, authoritative, strong' on the command. Where contours bear the same description in these terms, as e.g., Nos. 8, 9, and 10, they may be nearsynonyms in intonation, or it may be that they would be differentiated on some dimension of meaning not investigated. The contours fall about equally into the 'pleasant' and 'unpleasant' sectors. Few contours appear in the 'submissive' sector; this may mean that there are few 'submissive' intonations, or it may be that 'submissiveness' is expressed less readily by intonation than by tempo or voice-quality, variations in which were of course expressly excluded from this experiment. The effects of context are also excluded, which may bear on the fact that fewer contours are considered 'weak' than 'strong'. Diagram C for the question-word question differs markedly from the others. Within the material of the experiment, it does not appear to be possible to be 'submissive' in asking this type of question, and it is difficult to convey 'weak' feeling. This is perhaps not a phonetic observation, but it is certainly of some linguistic interest. The contours which are most nearly 'neutral' on the various sentence types are as follows: Statement: Final rises ending at mid pitch. Yes-or-no question: Final rises ending high. ' The Measurement of Meaning, 114.

238

Question-word question: Final rises, ending high or mid. Command: Final rises, ending high or mid. The 'neutral' contours for the yes-or-no question can perhaps be related to the American English contours usually described as typical for questions of this kind. The others are difficult to relate to any norm. Generalizing over the five tests, the three 'dimensions of meaning' postulated here are associated with the elements in contour variation in the following ways: (terms in parentheses show less consistent connection with the dimension) 'pleasant'

rises

'unpleasant'

'authoritative'

'submissive' 'strong' feeling

'weak' feeling

ending high change of direction [excluding No. 7] raised weak syllables (lowered weak syllables) (narrow range) wide range change of direction rises ending at mid raised or lowered weak syllables (final fall) (rises ending high [excluding No. 8]) wide range change of direction lowered weak syllables (rises ending at mid) (narrow range) (raised weak syllables)

The 'positive' ends of the dimensions are more easily characterized than the 'negative' ones. Where the contours are rated differently on the different sentences, it can be seen that the less 'lively' a contour is, the more variable it is in meaning. The narrow-range 'smooth' contours Nos. 1, 3, 4, and 6, vary most often from one sentence to another. The two rising contours, 1 and 3, vary on all three dimensions; the two falls, 4 and 6, are always very 'unpleasant', but can be 'authoritative' or 'submissive', 'strong' or 'weak'. The more 'lively' the contour is, the more stable is its position in the 'semantic space' over the different sentences. Contours Nos. 8, 9, and 10, involving wide range and a change of direction, always occupy the same sector of the space, the 'pleasant, authoritative, strong' one. The less 'interesting' the intonation contour is, the more influential the sentence itself is in the judgment of the total effect, and vice versa.

239

Harry Hoijer

Cultural Implications of Some Navaho Linguistic Categories S o m e years ago, 1 in a n article called T h e status o f linguistics as a science (Lg. 5 . 2 0 7 — 1 4 [1929]), E d w a r d Sapir m a d e a n interesting statement describing l a n g u a g e in part as 'a guide t o "social reality" '. T h e statement g o e s o n t o say (209): Though language is not ordinarily thought of as of essential interest to the students of social science, it powerfully conditions all our thinking about social problems and processes. H u m a n beings do not live in the objective world alone, nor alone in the world of social activity as ordinarily understood, but are very much at the mercy of the particular language which has become the medium of expression for their society. It is quite an illusion to imagine that one adjusts to reality essentially without the use of language and that language is merely an incidental means of solving specific problems of communication or reflection. The fact of the matter is that the 'real world' is to a large extent unconsciously built up on the language habits of the group. N o two languages are ever sufficiently similar to be considered as representing the same social reality. The worlds in which different societies live are distinct worlds, not merely the same world with different labels attached. O n e o f Sapir's students, B e n j a m i n L. W h o r f , f o l l o w e d this lead in a series o f brilliant papers, recently re-issued in a p a m p h l e t p u b l i s h e d b y the F o r e i g n Service Institute o f the D e p a r t m e n t o f State under t h e title F o u r articles o n metalinguistics. In the longest a n d m o s t i m p o r tant o f these, T h e relation o f habitual t h o u g h t a n d b e h a v i o r t o language, W h o r f c o m p a r e s the l a n g u a g e patterns o f H o p i , a n I n d i a n t o n g u e s p o k e n in A r i z o n a , with t h o s e o f m o d e r n E u r o p e a n languages, m a i n l y English, French, and G e r m a n . 2 H i s p u r p o s e is stated as f o l l o w s (Sapir m e m o r i a l v o l u m e 78): The portion of the whole investigation here to be reported may be summed up in two questions: (1) Are our own concepts of "time," "space," and "matter" given in substantially the same form by experience to all men, or are they in part conditioned by the structure of particular languages? (2) Are there traceable affinities between (a) cultural and behavioral norms and (b) large-scale linguistic patterns?

1

This paper was presented as a forum lecture at the Linguistic Institute in Ann Arbor, Michigan, 20 July 1950. 2 Originally published in the Sapir memorial volume, ed. by Leslie Spier: Language, culture, and personality 75—93 (Menasha, Wis., 1941).

240

Incidentally, and to avoid possible misunderstanding, Whorf explicitly denies (ibid.) 'that there is anything so definite as " a correlation" between culture and language, and especially between ethnological rubrics such as "agricultural," "hunting," etc., and linguistic ones like "inflected," "synthetic," or "isolating." ' We need not summarize Whorf's discussion of the problems he sets, but I should like to quote from his conclusions (92—3): Concepts of "time" and "matter" are not given in substantially the same form by experience to all men but depend on the nature of the language or languages through the use of which they have been developed. They do not depend so much upon any one system (e.g., tense, or nouns) within the grammar as upon the ways of analyzing and reporting experience which have become fixed in the language as integrated "fashions of speaking" and which cut across the typical grammatical classifications, so that such a "fashion" may include lexical, morphological, syntactic, and otherwise systematically diverse means coordinated in a certain frame of consistency . . . As for our second question . . . There are connections but not correlations or diagnostic correspondences between cultural norms and linguistic patterns. Although it would be impossible to infer the existence of Crier Chiefs from the lack of tenses in Hopi, or vice versa, there is a relation between a language and the rest of the culture of the society which uses it.

It seems likely that Whorf is understating the significance of the 'connections' he elucidates between language and other aspects of culture. It is altogether probable that there may be 'diagnostic correspondences', not in the specific fashion of Whorf's example, but in a more abstract or remote sense. If a study of a language, a set of patterns of speaking, uncovers a certain framework for reality characteristic of its speakers, and if a study of non-linguistic cultural patterns lays bare similar fundamental concepts, there is more than just a non-diagnostic connection between the several aspects of a culture. But this is a problem as yet uninvestigated; Whorf's analysis does no more than suggest certain lines of research. My purpose in this paper is to apply Whorf's technique of analysis to a quite different culture, that of the Navaho Indians of New Mexico and Arizona. In passing, it is not without interest that the Navaho, though they lived as neighbors of the Hopi for more than 400 years and have taken over many of the overt patterns of Hopi culture, are nevertheless very different from them in their basic cultural assumptions and outlook. The world of social reality characteristic of the Navaho, and reflected in their language, is no more like that of the Hopi than it is like our own. Before we investigate the Navaho fashions of speech germane to our purpose, it is necessary to outline briefly the major structural characteristics of the Navaho language, and in particular of the verb. 3 3

Details will be found in my papers on the Apachean verb, IJAL 11.193—203

241

Navaho morphological constructions, however they may be subdivided, are fundamentally much alike in structure. Each consists of a theme—composed of a stem or set of stems with or without a thematic prefix—which may occur either alone or with one or more non-thematic prefixes. Many constructions also include one or more proclitics and enclitics, semi-independent elements which usually have syntactic function. Three major form classes may be recognized: particles, nouns, and verbs. These differ mainly in the amount and kind of grammatical inflection they undergo. Particles—e.g. pronouns, numerals, modifiers, conjunctions—are not inflected, though they often take one or more proclitics or enclitics. Nouns occur as free themes (i.e. in absolute constructions), preceded by a possessive pronoun prefix (i.e. in possessive constructions), and in compounds or complex phrase-like constructions which function as nouns. A small number of noun themes, together with all independent postpositions, appear only in possessive constructions or in compounds; these have no free forms. Another but very small set of themes appears both as nouns and as verbs: thus, the theme natoh in absolute and possessive noun constructions has the meaning 'tobacco' and, in verb constructions, the meaning 'to smoke [a cigar or cigarette]'.4 Verb themes never occur as free forms and are usually provided with from three to seven or more distinctive stems, with or without a thematic prefix. Non-thematic verb prefixes are of two kinds, derivational and paradigmatic. The former are mainly adverbial in function, while the latter denote concepts of aspect, mode, tense, number, and the pronouns for the subject, object, and indirect object. Some verb themes can be made into verb constructions solely by the addition of one or more appropriate paradigmatic prefixes to one of its stem forms. Most verb themes, however, require one or another set of derivational prefixes in addition to the appropriate paradigmatic elements. Such derivations (i.e. verb themes plus derivational prefixes) are called verb bases. Many themes appear in several bases and some, like the theme 'one round object moves', in more than a hundred bases. 5 The term 'verb base' applies, however, to any verb segment to which paradigmatic prefixes may be added to form a free verb construction, whether this consists of a theme alone or of a theme plus derivational prefixes.

(1945); 12.1—13, 51—9 (1946); 14.247—59 (1948); 15.12—22 (1949). For further details, see The structure of the noun in the Apachean languages, Actes du 28 e Congrès international des Américanistes 174 (Paris, 1948). 5 For illustrations, see IJAL 15.17—21.

1

242

Verb bases fall into two major categories, neuter and active. Neuter bases are conjugated for person and number in only one paradigm (the stem is invariable throughout the paradigm), but active bases have seven required paradigms: imperfective, perfective, progressive, future, iterative, customary, and optative. Active bases may have as many as five distinctive stems (e.g. one each for imperfective, perfective, progressive and future, iterative and customary, and optative), but some have fewer (i.e. where a single stem appears in more than one paradigm), and, in a few instances, one stem may occur in all seven paradigms. Verb bases built on the same theme occasionally employ different though related sets of stems. Compare, for example, the bases di- . .. ba • h, -ba • -bah 'begin to go on a raid' and na -. -ba -h,- ba• -bah, -ba • h 'go about raiding'. Contrasts such as these testify that particular stem configurations denote specific aspects, cutting across the division into the categories listed above. Thus di-.. .ba • h, -ba •-bah, is a base defining momentaneous action as contrasted with na-.. . ba • h, -ba • -bah, -ba • h, which defines continuative action. The numerous verb bases employing the theme 'a round object moves' are divided into no less than seven aspectival categories, each with a distinctive set of stems.6 Turning our attention now to the meanings of these verbal categories, we find that neuter verbs in general report states or conditions. Neuter verbs contain no morpheme denoting tense, mode, or aspect, but simply report a state of being (an absence of movement or action) like 'being at rest', 'standing', or 'sitting'. Some neuter verbs define qualities: to be 'blue', 'white', 'thin', 'fat', or 'tall'. Active verbs, on the other hand, report events, movements, and actions. These are reported, not necessarily in relation to tense categories, but mainly in respect to aspect and mode. In an imperfective active verb, the event is moving toward fulfillment; the third person imperfective nihda • h, for example, means 'he moves to a sitting position'. Note that the emphasis lies not on the present tense (unavoidable in the English translation) but on the uncompleted nature of the movement. The same verb in the third person perfective, ninda, means 'he has moved to a sitting position', that is, the movement to a sitting position has been completed or achieved. Both these expressions can be given tense by adding appropriate but optional enclitics: nihda-h-dd- {-do-, future tense enclitic)'he will be moving to a sitting position' and nihda-do• 'he will have moved to a sitting position'. But although such tense enclitics as -do• may or may not be used, the active verb cannot avoid aspectival or modal denotation, for it must be «IJAL 15.13—7. 243

expressed in one or another of the seven required paradigms. In the progressive aspect—e.g. no-da-1 'he goes along moving to a sitting position'—events are reported in continuous process without reference to a beginning or end. A better example is found in yd ?a-l, roughly 'he is carrying a round object', which, upon analysis, turns out to mean 'he moves along handling a round object'. Again note the emphasis on the state rather than the time of the action; compare yo-^a-l-nP {-np, past tense enclitic) 'he was moving along handling a round object'. Iterative forms of the active verb have clearly aspectival denotation; the third person iterative of 'one moves to a sitting position' (the verb base cited above) is hnada • h 'he moves to a sitting position repeatedly'. Emphasis here lies solely on the repetition of the event, a repetition which has no end. The customary, a paradigm made up by combining the imperfective prefix complex with the iterative stem, while it also emphasizes repetition, carries the further denotation that such repetition is a matter of habit or custom. Such forms are particularly numerous in reports of customs, habitual modes of group behavior, where, for example, the Navaho will say (NT 404)7 na-dq• ? ('corn') deiyis ('they customarily gather it') • do • ('and') deiW ('they customarily husk it'). The optative is purely a modal category. For example (NT 20), Coyote, because the weather is hot, says: lids ('clouds') hole? ('let there be!'), Wdozol ('let it sprinkle [with rain]!'); and when the water from the rain is high, sildo?e • I ('let [the water] begin to float with me!'). Only the future paradigm expresses tense in Navaho (e.g. nido-da-1 'he will move to a sitting position'), and even here there is some evidence, too tentative to introduce in this paper, that the future, so-called, is better interpreted as an inceptive progressive—that is, as an aspect rather than a tense category. While at first sight the Navaho division of verb bases into neuters and actives appears to represent a sharp dichotomy, further analysis reveals both a structural and a semantic relation between them. Neuter verb bases, though never conjugated in more than one paradigm, are not all conjugated in the same paradigm. There are, in fact, five neuter paradigms, each with its own meaning, as follows: (1) The ¿-neuter, structurally identical with the ¿-perfective of active verb bases, which reports a position at a point in space or time, (an object) in a given position. Thus, 5// ('mountain') sPq ('a round solid object lies at rest') = 'a mountain lies at rest'. (2) The «-neuter, structurally identical with the «-perfective of ' Edward Sapir and Harry Hoijer, Navaho texts (Iowa City, 1942). The number in parentheses refers to the page on which the citation appears.

244

active verb bases, which reports a position extending in a line from one point to another. Thus, 3II ('mountain') n ? 4 ('round solid objects lie in a row') = 'a range of mountains lies extending from one point to another'. (3) The ^-neuter, structurally identical with the ^-perfective of active verb bases, which reports a position extending indefinitely from a fixed point. Thus, ce ('rock, stone') yi- ?d ('a rigid object has extension from a fixed point') = 'a [slender pinnacle of] stone extends [upward]'. This phrase is also a noun, referring to the slender, phalluslike rocks so common in the Navaho country. (4) The imperfective neuter, structurally identical with the imperfective of active verb bases, which reports qualities similar to those denoted by adjectives in English. Thus, ligai 'it is white'. (5) The progressive neuter, structurally identical with the progressive of active verb bases. We find only one example: yd • 'he has him in view, he sees him'. These several forms of the neuter category strongly suggest that the neuter represents semantically a phase of events characterized by the withdrawal of motion: the state of being that remains when movement of a particular kind ends. To summarize this phase of our investigation, it would appear that Navaho verb categories center very largely about the reporting of events, or better, 'eventings'. These eventings are divided into neuters, eventings solidified, as it were, into states of being by virtue of the withdrawal of motion, and actives, eventings in motion. The latter are further subdivided into imperfectives, eventings in process of completion; perfectives, eventings completed; progressives, eventings moving along; and iteratives, eventings repeated over and over again. The customary reports eventings repeated by force of habit or custom; the optative, a desire that an eventing take place; and the future, the expectation that an eventing will occur. But this is not all. A careful analysis of the meanings of Navaho verb bases, neuter and active, reveals that eventings themselves are conceived, not abstractly for the most part, but very concretely in terms of the movements of corporeal bodies, or of entities metaphorically linked with corporeal bodies. Movement itself is reported in painstaking detail, even to the extent of classifying as semantically different the movements of one, two, or several bodies, and sometimes distinguishing as well between movements of bodies differentiated by their shape and distribution in space. To illustrate, there are four basic and different verb themes which report the unspecified movement of human beings, other animate beings, and certain natural objects classed as animate. Of these, -ha • h means 'one (member of this class) moves', - ? a-f means 'two or a few 245

move', -kah

means 'several move', and -ze-h means 'a group moves

en masse'. If movement is more precisely specified, still other themes must be employed: -Xo-s 'move on all fours, trot', -ye-d 'move at a run', -ta-h 'move by flying', -?e-I 'move by floating on water', -bq-s 'move by rolling [as a h o o p or wheel]'. In the five themes last cited, the number moving is not specified; the theme is the same for one, two, or more. A n especially vivid example of the N a v a h o pattern of reporting movement in terms of an object or objects moving is revealed by a literal analysis of the meaning 'he picks something up' or 'he chooses or selects something'. Twelve verbs express this meaning. A l l have the same prefix complex: naidi-- 'third person causes it [to move] upward', but each has a different theme, depending on the nature of the referent of 'it'. If 'it' refers to a round solid object, the theme (in its imperfective form) is

h; thus, naidi

?a-h

'third person causes

a round solid object to move upward'. L o n g slender objects require the theme -t\- h, one animate object the theme -te • h, a set o f objects the theme -ni l, a rigid container with contents the theme -ka h, a fabric-like object the theme -co • s, a bulky object the theme -zo • d, a set of parallel objects the theme -zo • s, an unspecified mass the theme -3a-h, a wool-like mass the theme -30• /, a rope-like object the theme -le, and a mud-like mass the theme -Xe-h* A s I have indicated previously, the meaning of a verb base may be denoted by a theme alone or by a theme with one or more derivational prefixes. Prefixes and prefix combinations, like the themes we have just cited, also refer in large part to movement. T o illustrate, let us cite a few o f the more than one hundred verb bases formed on the theme -ha-h 'one animate object moves [in an unspecified fashion]'. I quote only the prefix complexes plus the meanings of the completed verb bases: Oa-di-..

. 9 'one moves away from, outwalks', Oa-na-..

. 'one

comes back to', Oa • -. . . 'one comes or goes to', Oa • -na •-... 'one again comes or goes to',

7a-...

'one moves away, out of sight',

?a-he--...

'one moves in a circle back to the starting point', dah-di-. .. 'one starts off on a journey', ta-di-... ta-h-...

'one moves to one place after another',

'one moves into the water', na-.. . 'one moves across',

ha-.. . 'one moves out of an enclosed space', ha-di-... fetch', yah-?a-...

away from', 0-cq-h-?a-...

IJAL 11.13—23. ' 0 represents any pronominal prefix. 10 See also IJAL 15.12—22, esp. 18—21.

246

'one moves

'one moves in between', ci-. . . 'one moves

outside [e.g. of a house]'. 10

8

'one starts off to

'one goes inside [e.g. a house]', O-ca-...

But this high degree of specificity in the reporting of movement is not confined in Navaho to verbs having particular reference to motion of one sort or another. On the contrary, it permeates the Navaho lexicon in the sense that many verbs, not at first sight expressive of movement, prove to be so on more detailed analysis. For example, the theme -ha • h 'one animate object moves [in an unspecified fashion]' is easily recognized in a large number of bases, the meanings of which appear to be far distant from any concept of movement. The following examples are typical: Oa-na-.. .-ha 'be busy, preoccupied', literally 'one moves continuously about with reference to it'; . .ha-h 'one dresses', lit. 'one moves into clothing'; ho-., .-ha-h 'a ceremony begins', lit. 'a happening moves'; na-.. .-ha 'onelives', lit.'one moves about here and there'; ?an\--na-. . .-ha 'one is young', lit. 'one moves about newly'; yisda-.. .-ha-h 'one is rescued, saved', lit. 'one moves to safety'. Similar examples follow, based on the theme - ? a-h 'a round object moves': O-da-h-. ..-''ah 'greet someone with a message', lit. 'move a round solid object to meet someone'; na-ho-.. .-?d 'make plans', lit. 'move happenings about here and there'; Oe-nl-ho-. . .-?a-h 'decide upon, make a rule about', lit. 'move a rule down to rest by means of [it]'; ha-di-.. .-?d-h 'sing', lit. 'move words out of an enclosed space'; ci-ho-.. .-?d-h 'make [it] known', lit. 'move an event outside'. A third Navaho speech pattern further emphasizes movement; this is the technique of reporting substantive concepts in terms of some characteristic action or movement of an object or set of objects. Structurally, this means that finite verb forms or larger expressions containing finite verb forms may have two grammatical functions—• nominal and verbal. 11 Thus, hani• bq • z 'full moon' or 'a hoop-like object has rolled out' (act. pf.), ?ddildil 'stave game' or 'several objects move repeatedly through space' (act. ipf.), na-lco s 'a paper, letter' or 'a fabric-like object is moved about' (pass, ipf.), cinabq-s 'wagon' or 'wood rolls about hoop like' (cm 'wood' + nabq-s 'it rolls about hoop-like', act. prog.). Neuter verb bases parallel those in the active category, for states or conditions, like eventings, are often reported only in reference to specified classes of objects. For each of the twelve active verb themes earlier cited in translating 'he picks it up' we have a corresponding neuter theme which denotes the same class of object at rest. Thus, spq 'a round solid object is at rest', sitq 'a long slender object is at rest', siti 'an animate object lies', sinil 'a set of objects lie', sikq 'a rigid container with contents is at rest', sllcd-z 'a fabric-like object is at rest', sizd-d'a bulky object is at rest', slzo-z 'a set of parallel ob11

See the paper cited in fn. 4, pp. 183—4.

247

jects is at rest', si^a- 'an unspecified mass is at rest', S130• I 'a woollike mass is at rest', sila 'a rope-like object is at rest', and site- ?'a mudlike mass is at rest'. To summarize: in three broad speech patterns, illustrated by the conjugation of active verbs, the reporting of actions and events, and the framing of substantive concepts, Navaho emphasizes movement and specifies the nature, direction, and status of such movement in considerable detail. Even the neuter category is relatable to the dominant conception of a universe in motion; for, just as someone is reported to have described architecture as frozen music, so the Navaho define position as a resultant of the withdrawal of motion. Parallels to this semantic theme may be found in almost every aspect of Navaho culture taken as a whole. Even today the Navaho are fundamentally a wandering, nomadic folk, following their flocks from one pasturage to another. Myths and legends reflect this emphasis most markedly, for both gods and culture heroes move restlessly from one holy place to the next, seeking by their motion to perfect and repair the dynamic flux which is the universe. As illustration, the reader may consult any of the tales recorded in Navaho Texts, especially perhaps that entitled The Origin of Horses, the tale of Turquoise Boy as he seeks out a mode of transport for man (NT 108-25). To turn now to another aspect of verb structure: what is the precise relationship, in semantic terms, between the subjects and goals of a Navaho verb on the one hand and the verb base on the other? We have already noted that the finite verb form, active and neuter, is a syntactic construction in microcosm, for inevitably included in such forms are anaphoric pronouns referring to words or phrases outside the verb which define its subject, object, and indirect object. In neuter intransitive verbs the subject pronoun prefix refers to an object which (a) belongs to the class of objects defined by the verb theme and (b) is characterized by the state or condition denoted by the verb base. An example: from -ti 'one animate object lies' we may form sit\'I lie', sinti 'you lie', and slti 'he lies', si- is a prefix used with neuters, and the pronoun prefixes (/- first person, n- second person, and zero third person) refer to single beings characterized by the condition of lying. In neuter transitives, however, the subject pronoun prefix denotes, not a member of the class defined by the verb theme, but some thing or being outside this class. It is the direct-object prefix that refers to an object in the class defined by the verb theme and characterized by the state or condition denoted by the verb base. Furthermore, the subject pronoun prefix refers to an agency conceived as responsible for the object denoted by the goal pronoun. Thus, if we transitivize the forms quoted above, and add to them respectively the goal pronouns 248

n- second person, si- first person, and yi- third person, we obtain: hsilt[ 'I have you lying', sisinlti 'you have me lying', and ylst'i (< yisi-l-tj.) 'he has him lying'. A more concrete illustration of this contrast comes from the following two phrases: Xe-^^isPq 'the Night Way [a ceremony] is in progress' (Xe- ?3i 'Night Way' plus sPq 'a round solid object is in position'; ceremonials are included in the category of round solid objects) and Xe- ?3iyis?q 'he is responsible for [this] performance of the Night Way' (yis?q < yi-si-l-?q). In the first phrase Xe-is the subject of the verb spq, but in the second it is the goal of yis?q, and the subject, an agency referred to by the third-person subject prefix, is conceived in a state of reponsibility for the ceremony. In active intransitive verbs, the subject pronoun prefix refers to an object which (a) belongs to the class of objects defined by the verb theme and (b) participates as actor in the action denoted by the verb base. Note this significant detail: that the object denoted by the subject pronoun does not perform the action; it is, rather, included in the action of a set of objects to which it belongs. An example: from the base ni-.. ,-te • h 'one animate object moves to a lying position (i.e. lies down)', we may form the imperfectives niste • h 'I lie down', nite-h 'you lie down', and nite-h 'he lies down', ni- is a derivational prefix (the prefix for the imperfective is zero), and the subject pronouns (s- first person, high tone second person, and zero third person) refer to actors included by virtue of their animateness in the meaning of the verb base. Active transitive verbs introduce the notion of agency. Here the subject pronoun prefix refers to an agent who initiates the action denoted by the verb base in reference to a specified object, symbolized by the goal pronoun, included in the class of objects defined by the verb theme. An example: from the causative base di-. . .-l-te-h 'begin to cause an animate object to move (i.e. begin to carry an animate object)', we may form the following imperfectives: hdiste-h ( the cake was made by Mary there+Loc. Secondly, it could be derived from two kernel sentences taken together: John's there and John's in the garden. Leaving this, we note that it is also possible to generate, in Lees's kernel, the same sentence with Vu (intransitive) instead of be by rules 1, 2, 3, 4, 6 and 7: e.g. John's lying there in the garden. But the phrase-structure rules will not generate a similar string with V t r + Nom instead of be: therefore John's picking peas there in the garden must partly be derived by optional transformation. This seems inconsistent, and it raises the question: why is such a sequence included in the kernel at all? First, it is difficult to find examples with PLoc+Nom PLoc+Nom unless the second Loc is patently attributive to the first Nom: thus John | 's || in 111 the shed 1111 in the garden is surely best referred to a pair of kernel sentences John's in the shed and the shed's in the garden. Otherwise one Loc takes the form of there etc. But then one might ask why here and there are introduced at all into the kernel, when analogous promorphs such as he (p. 17) or where (p. 36) are derived from Nom and Loc by transformation. It seems an easier problem to devise transformations for a chain in the gardenthere in the garden-* there than to handle restrictions on Loc in the kernel: i.e. one would prefer the first alternative suggested above. It is worth while to go on and reconsider the status of Loc after transitive verbs (Vtr). The correctness of the collocations in John | 's picking peas | in the garden7 can be predicted from the correctness of 7

For such a string—rather than immediate—constituent analysis see R. E. Longacre, "String constituent analysis", Lg. xxxvi, p. 63.

324

John's picking peas and John's in the garden in much the same way as John | 's picking | the peas 11 in the garden is predictable from John's picking peas and the peas are in the garden. It is a reasonable principle that where such predictability obtains the sentence which embodies both collocations should be transformationally derived from the two embodying each separately. For such cases then Loc can be deleted from the kernel after V t r + N o m . Taking this further, John's standing in the garden is similarly predictable from John's standing and John's in the garden: hence for some cases at least Loc can be deleted after V^. The position is more complicated for Acc (see rules 7, 18, etc.). Although he's going up the road can be referred to he's up the road, there is no *he's to the market or *the pig's to the market corresponding to he's going to the market or he's taking the pig to the market: therefore the predictability of these sentences cannot be registered in such a simple way. But it can be registered if we accept a transformational change of preposition, and adduce he's at the market alongside he's going and the pig's at the market alongside he's taking the pig. Similarly (with the addition instead of the substitution of to), he's going into the garden can be referred to he's in the garden and he's climbing onto the table to he's on the table, although there is no *he's into the garden or *he's onto the table. The irregularity of these Loc-> Acc changes (up->up, at-^-to, in into, ononto) can of course be relegated to subsidiary rules (perhaps on a lower level). I am not suggesting that this analysis is necessarily better than the one set out by Lees, but it has at least this advantage, that it is related to a partial theory of how kernel sentences ought to be distinguished from other transforms. At any rate, to choose between these two alternatives (and any others which may present themselves), one would have to embark on a thorough study of prepositional phrases. Similarly with other tentative sections of Lees's kernel description. The trouble is, of course, that these phrasestructure rules are needed only as a preliminary to transformational discussion of nominalisations: as Lees remarks (p. 53), this is only one problem out of many, and some of these problems have not yet been studied in detail. Thus to construct a kernel without making a large number of more or less arbitrary decisions would carry him far beyond the scope of his thesis. But if the rules are as tentative as this, the detailed description of nominalisations may be built on an unsure foundation. Probably the solution to this dilemma is not to start from a kernel at all. This involves separating the notion of transformation, as proposed by Harris (see above) from the generative model of grammar proposed by Chomsky. One may still think that a genera325

tive grammar is the only one likely to provide a general solution, but one begins to tackle particular problems without introducing transformations in any fixed direction (symbolised by A«-->-B instead of A-»B). Then later, when one feels sure that for some rules at least direction must be brought in to simplify the analysis, one tries to trace backwards towards what will be the relevant fragments of the kernel. In this way one need postulate no more of the phrasestructure than is required for the analysis in hand. A recent article 8 by Lees himself is a good example of such an early stage of an analysis: for something more complex see Worth's treatment of the Russian instrumental. 9 A further advantage of this approach is that one uses no more algebra etc. than is needed for the problem in hand, which makes the argument much easier for a reader to follow. Another problem is: what is the status of such kernel sentences in comparison with the various transforms derived from them? Both Chomsky and Lees tend to regard all alike as strings which, after obligatory rules have corrected artificialities of pattern, correspond directly to actual English sentences. Thus the output of the phrasestructure grammar is, in theory at least, " a string of concatenated morphemes" (p. 29) and by implication this string must be grammatical. In practice there are examples to the contrary. Thus by rule 33 (explained below) a symbol Comp is introduced which is never resolved by any subsequent rule in Chapter I: therefore it appears as such in the kernel output. Moreover since the transformation which converts it to a string of morphemes is optional, it will sometimes appear in the transformational output as well. Similarly with the C introduced by rule 8. Now these symbols are needed as a device for generalising a series of rules. In tracing back to the kernel (see above) it is quite normal to find that within the same group of texts some can be carried back further than others. To give examples for Comp, you can trace back John's ready to go to John's ready, but not John's likely to go to * John's likely: therefore Lees writes the kernels as John's ready/likely Comp. Thus for John's likely Comp serves as a sort or marker of incorrectness, showing that the sequence is ungrammatical until the matrix (see below) is filled out by subsequent transformation. But for John's ready it is in fact redundant, and at some stage will have to be removed to permit this sentence to appear in the final output. To take a further example (not noted by Lees) Mary's got a black hat

8

A multiply ambiguous adjectival construction in English, Lg. xxxvi, p. 207. D. S. Worth, "Transform analysis of Russian instrumental constructions", Word, xiv, p. 247. It is odd that neither this article, nor the three by Harris, are mentioned in Lees's bibliography. 9

326

can be traced back to Mary's got a hat and the hat is black, but for Mary's got a pretty smile there is no * Mary's got a smile and only at a pinch the smile is pretty. Here, following the same practice, the asterisked sentence could be represented as M a r y + a u x + g e f + a d j e c ti\e+smile, but to keep the transformation as generalised as possible we would have to do the same for the sentence with hat. Possibly because Lees does not see this device quite as I do, the same technique is not considered for Loc on p. 8, where the baby lay in the bed cannot be traced to *the baby lay: at any rate he decides that Loc must be resolved on the phrase-structure instead of the transformational level. The redundancy in this method can be eliminated, and the number of symbols reduced, by representing these sentences such as * John's likely simply as what they appear to be when first postulated: kernel sentences exhibiting a grammatical colligation but an ungrammatical collocation. These collocations are introduced with a generalised marker of incorrectness to replace Comp etc., and this tag (say an asterisk) stays with the string until it is removed by the relevant transformation. There is a further advantage. Where (as in most of the examples quoted above) two kernel sentences are taken together to generate a single transform, Lees distinguishes between what he calls the matrix- and the constituent-sentence (p. 55): the matrix is the one whose structure survives the transformation to form the main clause or phrase of the transform, and the constituent the one which is altered to form a subordinate phrase or clause. Thus, of the kernel sentences of I saw the man in the garden (see discussion of Loc above), I saw the man is the matrix and the man is in the garden the constituent. Now in all the cases where Lees introduces a symbol such as Comp, it is the matrix-sentence which is involved, and it is hard to see how this technique could be applied to a constituent-sentence. The problem does, however, arise: for instance, Lees himself (p. 10) points out that there is no kernel sentence *the gun is at her to which he can refer he aimed the gun at her. Again there is no constituent sentence * John's in the mirror for I saw John in the mirror. The easiest solution is the same as the one suggested above for the matrix examples: these sentences should be introduced into the kernel with a temporary marker of incorrectness. The most important point is that this forces a revision of the status of kernel sentences: they must be regarded not as actual sentences on the same level as their transforms, but as more or less artificial structures for generating actual sentences on a quite different level. In fact this does not require any great extension of Chomsky and Lees's own doctrine: they are already prepared to accept artificialities of pattern, and in his analysis of reflexives (pp. 99 ff. and 327

footnotes 45 and 46) Lees postulates ungrammatical collocations (e.g. on p. 99 * John-cut- John as against John^-cut-JohnS) subsequently removed by obligatory transformation. My purpose is to make clear that they can be corrected by optional transformation as well. In this way we can make full use of one of the principal advantages of a generative grammar (shared for instance by a process morphophonemics): 10 it is judged by the grammaticalness of its terminal output alone, and to arrive at the right result non-terminal stages may be as ungrammatical as you please. These last paragraphs illustrate, inter alia, how transformational analysis can be helped by isolating collocations. To develop this further we could return to the notion of predictability used earlier to handle sentences with Loc and Acc. That, for instance, *the stone's ready to drink is collocationally abnormal can be predicted from the abnormality of *John drank the stone, and that *the sigh is ready to utter is so from *the sigh is ready. In each case what would be the other kernel sentence is perfectly normal: the stone's ready and John uttered a sigh.11 In the same way either of the two incorrect kernels can guarantee the incorrectness of *the sigh is ready to drink. But the incorrectness of *the soup is brown to drink and *the soup is ready to have cannot be predicted in the same way, since all the kernel sentences would be grammatical (the soup is brown, John drank the soup, the soup is ready, John's got the soup). Therefore it must be ascribed, as a minimum, to the presence of brown in the first case and of have in the second. Now the upshot of this is that in detailing the transformation it is quite unnecessary to refer to the collocations soup-brown etc. and John-drink-soup etc., but absolutely necessary to refer to the lexical classes ready etc. and drink etc. as against brown etc. and have etc. But in detailing the kernel sentences the position is quite the reverse. In this way it is possible to separate at least some classes of collocation and at least some lexical classes which are relevant on quite different levels. Furthermore, it is sometimes necessary to distinguish classes of collocations which are relevant on the transformational level alone. Consider the following transformations: the boy's got a bicycle .450» .090"

Ratio 12.3 35 47 34 34 104 40

° Estimate based on Seckel (1960). Estimate based on Schultz (1941). 0 Estimate based on Kroeber (1948).

4

a n d t h e d e n s i t y o f their d i s t r i b u t i o n is w i t h i n n o r m a l l i m i t s . T h e r e f o r e w e d o t n o t h a v e h e r e m i n i a t u r e d a d u l t brains, b u t b r a i n s t h a t differ very substantially f r o m those o f normal adults in the absolute n u m b e r o f cells. I n t e l l e c t u a l l y , t h e s e d w a r f s f o r t h e m o s t p a r t s h o w s o m e ret a r d a t i o n , o f t e n n o t s u r p a s s i n g a m e n t a l a g e level o f 5 t o 6 years. All o f t h e m acquire the rudiments o f language, including speaking a n d u n d e r s t a n d i n g , a n d t h e m a j o r i t y m a s t e r t h e verbal skills a t l e a s t a s 355

well as a normal 5-year-old child. From Table 1 it is apparent that neither the absolute nor relative weights of brains and bodies reveal the nature of the relationship between speech and its neurological correlates. Apparently the ability to speak is not dependent upon nonspecific increase in cell number or anything as general as brain-weight/body-weight ratios. Instead of postulating a quantitative parameter as the critical variable for the ability to acquire language, we should look toward much more specific modes of internal organization of neurophysiological processes. At present we do not know what they might be. But man's developmental and maturational history suggests that growth processes and functional lateralization are involved (Lenneberg, in press), the physical nature of which remains to be discovered.

Conclusion In the first part of this presentation I have argued that speciesspecific peculiarities are to be expected from the evolutionary processes themselves. Therefore, language specialization need not mystify us. In the second part I have tried to show that the basis for language capacity might well be transmitted genetically. In the last section I have rejected the notion that man's ability to speak is due to such general properties as an increase in intelligence or a relative increase in the weight of his brain. It seems, rather, as if language is due to as yet unknown species-specific biological capacities. In conclusion I wish to emphasize that all these considerations serve to establish an hypothesis and to stimulate new directions for research on the nature of man. However, the facts presented do not constitute a theory. Let us hope they will lead to one in the future.

References Ajuriaguerra, J. de. Langage et dominance cérébrale. J. franç. d' O to-RhinoLaryngol., 1957, 6, 489—499. Auerbach, V., Digeorge, A., Baldridge, R., Tourtellotte, C., and Brigham, M. Histidinemia: A deficiency in histidase resulting in the urinary excretion of histidine and of imidazolepyruvic acid. J. Pediatr., 1962, 60, 487—497. Black, M. Linguistic relativity: The views of Benjamin Lee Whorf. Phil. Rev., 1959, 68, 228—238. Brewer, W. F. Specific language disability: Review of the literature and a family study. Honors thesis, Harvard University, 1963. Caspari, E. Genetic basis of behavior. In A. Roe and G. G. Simpson (Editors), Behavior and evolution. New Haven: Yale University Press, 1958. Chomsky, N. Syntactic structures. The Hague: Mouton, 1957.

356

Coppoletta, J. M., and Wolbach, S. B. Body length and organ weights of infants and children. Amer. J. Pathol., 1932, 9, 55—70. Dobzhansky, T. Mankind evolving. New Haven: Yale University Press, 1962. Drew, A. L. A neurological appraisal of familial congenital word-blindness. Brain, 1956, 79, 440—460. DuBrul, E. L. Evolution of the speech apparatus. Springfield, 111.: Thomas, 1958. Eustis, R. S. The primary etiology of the specific language disabilities. J. Pediatr., 1947, 31, 448—455. Feuer, L. S. Sociological aspects of the relation between language and psychology. Phil, Sei., 1953, 20, 85—100. Fuller, J. L., and Thompson, W. R. Behavior genetics. New York: John Wiley, 1960. Furth, H. The influence of language on the development of concept formation in deaf children. J. abnorm, soc. Psychol., 1961, 63, 386—389. Gallagher, J. R. Specific language disability: A cause for scholastic failure. New Engl. J. Med., 1950, 242, 436—440. Ghadimi, H., Partington, M., and Hunter, A. A familial disturbance of histidine metabolism. New Engl. J. Med, 1961, 265, 221—224. Ghadimi, J. R., Partington, M., and Hunter, A. Inborn error of histidine metabolism. Pediatrics, 1962, 29, 714—728. Greenberg, J. H. Concerning influences from linguistic to nonlinguistic data. In Harry Hoijer (Editor), Language in culture. Chicago: University of Chicago Press, 1954. Greenberg, J. H. (Editor). Universals of language. Cambridge, Mass.: M.I.T. Press, 1963. Hall, C. S. The genetics of behavior. In S. S. Stevens (Editor), Handbook of experimental psychology. New York: John Wiley, 1951. Hallgren, B. Specific dyslexia (congenital word-blindness). Actapsychiatr. neurol. scand., 1950, Suppl. 65. Hartmann, P. Allgemeinste Strukturgesetze. In Sprache und Grammatik. The Hague: Mouton, 1961. Hjelmslev, L. Prolegomena to a theory of language. Indiana University Publications in Anthropology and Linguistics, Memoir 7. Baltimore: Waverly Press, 1953. Köhler, W. The mentality of apes. New York: Harcourt, Brace, 1925. Kroeber, A. L. Anthropology. New York: Harcourt, Brace, 1948. Lenneberg, E. Cognition in ethnolinguistics. Language, 1953, 29, 463—471. Lenneberg, E. A note on Cassirer's Philosophy of Language. Phil, phenomenol. Res., 1954, 15, 512—522. Lenneberg, E. Language, evolution and purposive behavior. In S. Diamond (Editor), Culture in history. New York: Columbia University Press, 1961. Lenneberg, E. The relationship of language to the formation of concepts. Synthese, 1962a, 14, No. 2/3, 103—109. Lenneberg, E. Understanding language without ability to speak: A case report. J. abnorm, soc. Psychol., 1962b, 65, 419—425. Lenneberg, E. Speech as a motor skill with special reference to non-aphasic disorders. In U. Bellugi and R. Brown (Editors), The acquisition of language. Child Developm. Monogr., 1964, 29, 115—126. Lenneberg, E. Speech development: Its anatomical and physiological concomitants. In V. E. Hall (Editor), Speech, language and communication. Brain and Behavior (in press). Lenneberg, E. H., Nichols, I. A., and Rosenberger, E. F. Primitive stages of

357

language development in mongolism. Proc. Assoc. Res. nerv. ment. Disease, 1964, 42, 119—137. Luchsinger, R. Die Vererbung von Sprach- und Stimmstörungen. Foliaphoniatr., 1959, 11, 7—64. Moorhead, P. S., Mellman, W. J., and Wenar, C. A familial chromosome translocation associated with speech and mental retardation. Amer. J. hum. Genet., 1961, 13, 32—46. Morley, M. The development and disorders of speech in childhood. Baltimore: William & Wilkins, 1957. Mountcastle, V. B. (Editor). Interhemispheric relations and cerebral dominance. Baltimore: Johns Hopkins University Press, 1962. Oléron, P. Recherches sur le développement mental des sourds-muets. Paris: Centre National de la Recherche Scientifique, 1957. Orton, S. T. Familial occurrence of disorders in the acquisition of language. Eugenics, 1930, 3, No. 4, 140—147. Pfaendler, U. Les vices de la parole dans l'optique du généticien. Akt. Probl. der Phoniatr. und Logopaed., 1960, 1, 35—40. Rensch, B. Neuere Probleme der Abstammungslehre. Stuttgart, 1954. Révész, G. Denken und Sprechen. In G. Révész (Editor), Thinking and speaking: A symposium. Amsterdam: North Holland, 1954. Rosenstein, J. Cognitive abilities of deaf children. J. Speech Hearing Res., 1960, 3, 108—119. Schultz, A. H . The relative size of the cranial capacity in primates. Amer. J. Anthropol., 1941, 28, 273—287. Seckel, H. P. G. Birdheaded dwarfs: Studies in developmental anthropology including human proportions. Springfield, 111.: Thomas, 1960. Teuber, H.-L. Perception. In J. Field, H. W. Magoun, and V. E. Hall (Editors), Handbook of physiology. Section 1 : Neurophysiology, Vol. III. Washington, D.C.: American Physiological Society, 1960. Weir, R. H. Language in the crib. The Hague: Mouton, 1962.

358

V. Istrine Relations entre les types d'écriture et la langue Les travaux concernant l'écriture ne posent pas toujours d'une manière suffisamment nette les problèmes théoriques les plus importants : quelles sont les interactions entre l'écriture et la langue; quels traits peut-on considérer comme les traits essentiels formant les systèmes d'écriture des divers peuples; le développement de l'écriture manifeste-t-il des influences de classe et, dans ce cas, dans quelle mesure, etc. La terminologie qu'utilisent les travaux de théorie et d'histoire de l'écriture est d'une irrégularité extrême. La situation déplorable où se trouve réduite la science de l'écriture exige instamment l'examen des principes théoriques de cette science. I Le premier problème qui se pose à la théorie de l'écriture •— et le plus important — est celui de la nature de l'écriture, de sa destination essentielle et de ses caractéristiques. Les possibilités du langage phonétique comme moyen de communication entre les hommes sont inépuisables. Il n'en reste pas moins insuffisant sur deux points très importants : limitation dans l'espace (le langage n'est audible qu'à une distance relativement petite) et limitation dans le temps (le langage n'est audible qu'au moment où il est articulé). A notre époque, il est vrai, avec le développement de la technique, ces deux insuffisances du langage articulé sont en partie surmontées. Ainsi la limitation du langage dans l'espace est abolie par l'utilisation du téléphone et de la radio; la limitation dans le temps au moyen de l'enregistrement du son. Mais d'abord, le développement de la technique n'a éliminé — affaibli plutôt — qu'en partie ces deux insuffisances du langage articulé; en second lieu, l'élimination partielle de ces insuffisances du langage n'a été réalisée pratiquement qu'à la fin du XIX e et au début du xx e siècle. Cependant, la nécessité de transmettre à distance et de fixer dans le temps le langage existe pour les hommes depuis fort longtemps. Elle fut satisfaite par l'usage de diverses formes d'enregistrement graphique du langage, mais aussi par l'utilisation d'objets divers (cordelettes à nœuds, coquillages, etc.) affectés d'une signification conventionnelle. 359

L'usage de divers objets avec signification conventionnelle pour la transmission et la fixation du contenu significatif essentiel du langage est apparu principalement au cours des étapes qui ont précédé le développement de l'écriture, et chez des peuples relativement peu nombreux (la forme la plus développée en étant le kipou des Incas du Pérou). Le procédé essentiel de l'écriture, celui qui en constitue la caractéristique la plus importante, est l'enregistrement graphique. Par conséquent, on peut dire que l'écriture est un moyen de communication entre les hommes complémentaire du langage articulé, réalisé à l'aide de diverses sortes de signes graphiques, reflétant d'une manière ou d'une autre le langage articulé et servant à la transmission de ce langage et à sa fixation dans le temps. Ainsi l'écriture, tout en apparaissant et se développant sur la base de la langue, possède en même temps sa spécificité. Voici les caractéristiques les plus importantes de l'écriture : 1. L'écriture n'est pas un instrument de communication essentiel, autonome, mais auxiliare, complémentaire de la langue; c'est pourquoi elle apparaît à un stade plus tardif du développement de la société et demeure pendant une longue période au service non pas de toute la société, mais d'une partie seulement de celle-ci. 2. L'écriture sert principalement à la transmission du langage à distance ou à sa fixation dans le temps. 3. Ce sont les signes graphiques perceptibles à la vue qui constituent le procédé de l'écriture; de ce dernier point de vue, l'écriture est proche du domaine des arts graphiques. Mais si l'écriture a avec le langage un but commun et ne s'en distingue que par les procédés de réalisation de ce but, elle a avec les arts graphiques des procédés communs et des buts différents. L'objectif essentiel des productions de l'art graphique est la connaissance du monde par l'image artistique, à des fins d'influence active sur lui; l'objectif essentiel de l'écriture est la transmission du langage. A cette différence de but correspond une différence dans le caractère même des moyens, fussent-ils semblables en apparence; les moyens de l'art sont des images artistiques concrètes; les moyens de l'écriture sont toujours des représentations et des signes plus ou moins conventionnels servant à la transmission d'éléments du langage humain. Aux tout premiers stades de leur développement, il est vrai, l'écriture et l'art graphique étaient très proches l'un de l'autre. Dans les premiers stades du développement de l'écriture, on utilisait pour la transmission du langage presque les mêmes dessins que dans l'art graphique. Ainsi, l'Indien d'Amérique du Nord qui voulait enregistrer les conditions d'échanges d'un renard contre deux castors dessinait le renard et les castors et les réunissait par le signe de deux mains croisées. Mais déjà là : 360

1. la représentation du renard et des castors n'avait pas pour fin la perception artistique; elle était destinée à symboliser et à fixer les conditions du troc, formulées préalablement dans le discours; 2. ces figures se présentaient non comme des images artistiques, mais comme des représentations conventionnelles, schématiques. Par la suite, au fur et à mesure qu'elle se développait, l'écriture s'éloignait davantage de l'art graphique et devenait de plus en plus apte à la transmission du langage articulé. Ainsi dans l'écriture alphabétique contemporaine le signe graphique — la lettre — n'a plus aucun caractère figuratif et sert de signe graphique purement conventionnel de l'élément le plus simple du langage articulé — le son isolé (ou phonème). II La terminologie en usage dans les sciences de l'écriture reste jusqu'ici d'une grande irrégularité. Au nombre des notions qu'il convient de préciser et d'introduire dans la théorie de l'écriture, il faut compter la notion de « système d'écriture », de « type d'écriture », de « groupe (famille) de systèmes d'écriture », de « graphème » et de « principes orthographiques fondamentaux d'écriture ». Le « système d'écriture » peut être défini comme l'écriture historiquement constituée et organisée de tel ou tel peuple (par exemple les systèmes d'écriture russe, chinois, grec et autres). Chaque système d'écriture se caractérise par : un type d'écriture défini, une constitution plus ou moins stable, une signification et une forme constantes des signes graphiques, de principes orthographiques plus ou moins constants. Les systèmes d'écriture peuvent être autochtones — nés et développés en conformité avec la langue d'un peuple donné et en reflétant les particularités les plus importantes (par exemple, l'écriture russe, l'écriture chinoise, etc.) — ou empruntés par un peuple à un autre et adaptés dans une mesure plus ou moins grande à une langue donnée (par exemple, l'écriture hiéroglyphique chinoise par les Japonais ou l'écriture consonantique arabe par des peuples de l'Asie Centrale et du Caucase). Chaque système historiquement constitué utilise un fonds défini de signes graphiques. Ces signes servent à la transmission de tels ou tels éléments de la langue — mots entiers, syllabes séparées ou sons — ils possèdent, autrement dit, une signification définie dans leur relation avec la langue. En outre, le signe graphique est ordinairement doué d'une forme graphique typique plus ou moins constante, qui en permet la reconnaissance indépendamment des « mains » et des styles individuels d'écriture sujets à des variations dans le cours 361

de l'histoire. Cette forme typique peut être appelée la base graphique du signe (par exemple, pour la lettre cha de l'écriture russe : trois traits verticaux units par leurs extrémités inférieures). Dans la mesure où l'écriture sert à la transmission de la langue, ce qui en apparaît comme la caractéristique la plus importante, ce n'est pas la forme graphique des signes; il s'agit de déterminer quels sont les éléments (énoncés entiers, mots séparés, syllabes, sons) qui sont symbolisés par les signes graphiques. De ce point de vue, quatre « types d'écriture » se sont constitués historiquement: le type pictographique, le type idéographique, le type syllabique et le type phonétique. L'écriture pictographique se présente, en règle générale, comme une écriture imagée (figurative), transmettant l'énoncé globalement. Autrement dit, les pictogrammes, à la différence des idéogrammes, expriment une phrase entière, proposition ou communication, non encore découpée très nettement par des signes en mots séparés. En outre, les figures employées dans la pictographie se caractérisent par une très grande instabilité et une signification qui n'est pas toujours unique. On considère souvent que la principale différence entre les systèmes idéographique et pictographique réside dans le caractère conventionnel, non imagé, non figuratif, de la forme des signes idéographiques. Cette assertion est fausse aussi bien du point de vue méthodologique que du point de vue des faits. Elle est fausse méthodologiquement pour la raison qu'une classification typologique doit procéder non de la forme des signes mais de leur signification dans la langue. Elle est fausse aussi du point de vue des faits, car s'il est vrai que les idéogrammes sont en général plus conventionnels et schématiques, certains pictogrammes possèdent pourtant un caractère non figuratif, conventionnel, schématique 1 . Par ailleurs, dans de nombreux systèmes d'écriture idéographique (par exemple dans l'hiéroglyphique du vieil égyptien) et même dans des systèmes phonétiques (comme le phénicien) les signes graphiques conservaient leur forme figurée initiale. C'est pourquoi ce qu'il convient de considérer comme la différence essentielle entre la pictographie et l'idéographie, c'est, non pas la forme des signes, mais leur signification, ce que le signe symbolise, à savoir : ou bien une communication en entier (proposition) ou bien une partie significative de celle-ci (mot). Outre cela (ou plus exactement grâce précisément à cela) les signes idéographiques sont plus constants, plus stables, d'un sens plus défini que les pictogrammes. Aussi dès que dans l'écriture pictographique d'un peu1

Voir, par exemple, la lettre d'une jeune fille youkaguire dans D . Diringer : The Alphabet, N e w York, 1949, p. 35.

362

pie, une signification définie s'attache aux figures, aux signes d'une écriture pictographique, dès que presque chaque signe commence à signifier un mot déterminé, l'écriture pictographique devient idéographique en dépit du fait que les formes de nombreux signes conservent encore leur caractère initial d'image. Dire que les signes idéographiques désignent toujours des mots (ou des parties significatives de mots) ne suffit pas. 11 faut encore tenir compte du fait que ces signes se subdivisent assez nettement en deux catégories. Certains signes (les chiffres modernes, par exemple, ou les « hiéroglyphes idéographiques » chinois) sont liés à la signification du mot, mais n'en prédéterminent pas le son; les autres (par exemple les « hiéroglyphes phonétiques » chinois) au contraire, sont liés au son du mot. Les signes des deux catégories diffèrent en ceci que les premiers peuvent être utilisés pour désigner des mots synonymes (malgré la différence de son) alors que les seconds peuvent désigner des homonymes (malgré la différence de signification). C'est précisément pourquoi, pour la précision dans la désignation du mot dans l'écriture idéographique, il est parfois nécessaire de combiner des signes des deux catégories. Dans divers travaux sur les problèmes de l'écriture, ces signes portent des noms différents. Les signes de la première catégorie s'appellent « idéogrammes », « hiéroglyphes idéographiques », « déterminatifs sémantiques »; les signes de la seconde catégorie s'appellent « phonogrammes », « logogrammes », « hiéroglyphes phonétiques ». L à aussi, l'organisation d'une terminologie s'impose. A la différence de celles des pictogrammes et des idéogrammes, les caractéristiques des écritures syllabique et phonétique ne soulèvent pas de discussion. On appelle écriture syllabique celle où le signe désigne une syllabe et phonétique celle où le signe désigne un son. De la définition donnée plus haut, il découle que la notion « d'écriture » recouvre tous les types d'écriture : phonétique, syllabique, idéographique et même pictographique, étant donné que tous servent à la transmission du langage à distance et à sa conservation dans le temps et que tous ont pour instrument des signes et des figures graphiques. Cependant la pictographie ne constitue pas un système d'écriture, car elle ne possède pas de matériel constant de signes graphiques de significations et de formes constantes. Il faut remarquer qu'on ne rencontre pour ainsi dire pas de système d'écriture qui soit purement du type phonétique, du type syllabique ou du type idéographique. Ainsi, même dans les systèmes alphabétiques européens actuels, on utilise largement les idéogrammes (par exemple les chiffres, les signes mathématiques, etc.) et aussi des signes désignant non pas un seul, mais plusieurs sons (par exemple les lettres russes chtcha, iou, ia, etc.). D'autre part, 363

même dans une écriture idéographique, comme celle du sumérien, il existe à côté des idéogrammes des logogrammes et même des signes syllabiques isolés. C'est pourquoi le type d'écriture doit être déterminé selon le caractère des signes qui prédominent dans le système. Cependant, même en tenant compte de cette condition, on a dû dégager des types intermédiaires, transitionnels (par exemple le type idéographique-syllabique). On compte au nombre de ces types : 1. les systèmes d'écriture où, par développement interne, se sont trouvés représentés des signes idéographiques aussi bien que des signes syllabiques et alphabétiques (par exemple, l'écriture cunéiforme assyro-babylonienne); 2. les systèmes d'écriture qui combinent deux systèmes différents dont l'un est idéographique et l'autre syllabique ou alphabétique (l'écriture japonaise unissant l'hiéroglyphique chinoise aux signes syllabiques nationaux kana). A l'intérieur d'un type donné d'écriture, on peut considérer deux aspects différents. Ainsi, par exemple, parmi les systèmes d'écriture de type alphabétique se distinguent d'une manière assez nette les systèmes dits « consonantiques » (phénicien, hébreu ancien, etc.), où les signes ne représentent en principe que des phonèmes consonantiques ou semi-vocaliques. Les systèmes alphabétiques d'écriture peuvent être subdivisés aussi selon le principe orthographique fondamental qui y prédomine, c'est-à-dire le principe qui détermine l'écrasante majorité de leurs règles orthographiques particulières. Les principes orthographiques fondamentaux les plus importants sont : 1. le principe phonétique pur : l'orthographe des mots correspond à leur prononciation actuelle (par exemple, les différents systèmes de transcription phonétique); 2. le système phonologico-morphologique : orthographe unique des phonèmes — et aussi des morphèmes — même lorsque, pour des raisons phonétiques, leur prononciation varie dans les différentes formes grammaticales (par exemple, l'écriture russe); 3. le principe historico-traditionnel : orthographe des mots correspondant à leur prononciation dans le passé (par exemple, les écritures française et anglaise). En dehors de la classification typologique, on peut grouper les systèmes d'écriture en groupes (familles) d'origine commune. Ainsi on peut distinguer un groupe de systèmes alphabétiques d'écriture basés sur le slave (russe, bulgare, serbe, etc.) ou sur le latin (français, allemand, etc.) ou sur l'arabe (arabe, persan, afghan, etc.). Toutes ces questions de terminologie et de classification exigent un grand travail d'approfondissement, car l'organisation d'une terminologie et d'une classification est une des conditions les plus importantes du développement accéléré de la science. 364

III La deuxième question qui se pose à la théorie de l'écriture est celle de l'origine de l'écriture et du caractère de l'écriture primitive. Cette question (comme celle de l'origine du langage) était jusqu'à ces derniers temps dominés en U.R.S.S. par la théorie erronée élaborée par N. la. Marr et ses disciples. Deux thèses essentielles en découlaient : 1. L'écriture pictographique primitive est née du « langage par gestes » en même temps que le langage articulé (ou même avant). 2. Cette écriture primitive était fondamentalement d'un caractère magique. « Les exigences d'une accumulation toujours croissante d'idées pour lesquelles les moyens du langage par gestes étaient insuffisants, écrivait N. la. M a r r , . . . suscitèrent un processus dialectique de division du langage unique, à l'origine cinétique ou linéaire, en deux langues : langue phonétique et langue graphique, c'est-à-dire l'écriture magique primitive . . . »2. Une telle position fut soutenue également par des disciples de Marr. « Il est plus que vraisemblable, affirmait par exemple l'académicien I.I. Mechtchaninov, que les premiers stades de l'écriture se sont produits aux époques qui ont précédé la formation même du langage phonétique articulé. Par conséquent, l'écriture en tant que telle est antérieure au langage phonétique» 3 . Selon l'hypothèse développée par I.I. Mechtchaninov 4 , le langage cinétique serait né au cours du paléolithique inférieur et l'écriture au cours du paléolithique moyen, tandis que le langage articulé ne serait apparu que dans le paléolithique supérieur. De cette façon, l'écriture s'avérerait plus ancienne que le langage de toute une période archéologique. Cette théorie fut largement diffusée par des publications encyclopédiques et de vulgarisation scientifique (voir, par exemple, l'article « écriture » dans la l r e édition de la Grande Encyclopédie Soviétique5). C'est la même théorie que développe le manuel d'histoire de l'écriture du savant tchèque C. Loukotka 6 .

a

N. la. Marr: « Iazyk i pis'mo », Izvestia GAIMK, t. VI, n° VI, Leningrad 1930, p. 17. • I. I. Mechtchaninov : « K voprossou o statdial'nosti v pis'me i iazyke », Izvestia GAIMK, t. VII, n° V—VI, L. 1931, p. 7. ' Ibidem, p. 92. • Grande Encyclopédie Soviétique, lre éd., t. 45, pp. 429—432. • C. Loukotka : Razvitie pis'ma (trad. russe), Moscou, Ed. de littérature étrangère, 1950, pp. 24 et suivantes.

365

Des vues analogues sur l'origine de l'écriture ont été exprimées par une série d'auteurs étrangers, Tchang Tcheng-Ming, Van Ginneken, Sindler, etc. Ainsi Tchang Tcheng-Ming dans une monographie particulière 7 essaye de déduire toute l'hiéroglyphique chinoise du « langage par gestes ». Et Van Ginneken 8 , s'appuyant sur les données de Tchang Tcheng-Ming, aboutit à la conclusion générale que l'origine du langage articulé comme de l'écriture est le « langage par gestes ». La théorie de Marr, Mechtchaninov et autres sur la priorité du développement de l'écriture sur celui du langage articulé est entièrement dénuée de preuves. Elle contredit totalement les données de fait. Il faut avant tout remarquer que l'archéologie, si souvent invoquée par ses auteurs, ne peut fournir aucune preuve de l'existence ou de la non existence du langage dans la période sans écriture de l'histoire humaine. Cela est évident du fait que les monuments du langage non fixés par l'écriture ne relèvent pas de l'archéologie. Les données réelles les plus riches sur ce problème sont du domaine de l'histoire et de l'ethnographie. Or, toutes ces données non seulement ne confirment pas, mais au contraire démentent formellement l'antériorité du développement de l'écriture sur celui du langage. « Le langage phonétique ou langage parlé a toujours été l'unique langage de la société humaine capable d'être un moyen pleinement valable de communication entre les hommes. L'histoire ne connaît aucune société humaine, aussi arriérée soit-elle, qui ne possède son langage phonétique. L'ethnographie ne connaît aucun petit peuple arriéré — fût-il aussi ou encore plus primitif que, par exemple, les Australiens ou les habitants de la Terre de Feu au siècle dernier — qui ne possède son langage phonétique »9. D'autant plus que l'existence de sociétés humaines qui auraient possédé l'écriture sans posséder de langage phonétique est fondamentalement impossible et que ni l'histoire ni l'ethnographie n'en connaissent la moindre. Par contre, l'histoire et l'ethnographie connaissent beaucoup de peuples qui possèdent un langage phonétique sans posséder d'écriture. La théorie de l'apparition de l'écriture avant la naissance du langage phonétique contredit aussi les principes mêmes de la doctrine

' Tchang Tcheng-Ming : L'écriture chinoise et le geste humain, Paris 1937. • Van Ginneken : La reconstruction typologique des langues archaïques de l'humanité, Amsterdam 1939. ' Staline : A propos du marxisme linguistique, Ed. de la Nouvelle Critique, pp. 54—55.

366

marxiste, car l'usage de l'écriture suppose une pensée développée et sans langage il ne peut y avoir de pensée. De quelle manière donc et à quelle époque est apparue l'écriture primitive? Comme nous l'avons montré plus haut, l'écriture est un instrument de communication auxiliaire, complémentaire du langage phonétique, servant à la transmission du langage et à sa conservation dans le temps. La langue est une condition nécessaire à l'existence de la société. L'écriture ne l'est pas, ou plutôt elle le devient à un stade déterminé du développement de la société, avec l'agrandissement progressif des sociétés, leur extension dans l'espace et leur stabilisation dans le temps. Lorsque l'humanité était composée de petits groupements familiaux et clanaux, le langage suffisait à satisfaire entièrement ses besoins de communication. Mais aussitôt que le développement des forces productives et la complication des rapports de production eurent entraîné la formation de communautés clanales et tribales plus solides et plus stables, la nécessité se fit sentir d'un instrument de communication auxiliaire, complémentaire du langage : l'écriture. C'est ce que confirme le contenu des documents écrits primitifs qui nous sont parvenus. Ils enregistrent presque tous des événements, des actions de chefs, des coutumes, des prières, etc., servant ainsi à la conservation du langage dans le temps; ou ils contiennent des relations de chasse, des rapports sur des engagements avec des ennemis, des messages d'amour, etc., servant ainsi à la transmission à distance du langage. Il est probable qu'il faut rapporter l'écriture primitive aux débuts du développement de la structure clanale. Cette vue est confirmée par le fait que l'écriture, au moins sous sa forme pictographique rudimentaire, se rencontre chez la plupart des peuples que connaissent l'histoire et l'ethnographie, y compris ceux dont le développement est resté aux stades primitifs de l'organisation clanale (les peuples du Grand-Nord, les Australiens du XIX e siècle, etc.). C'est probablement le dessin primitif qui a donné naissance à cette écriture rudimentaire pictographique. Il est très possible que les nombreux dessins sur des rochers, des pierres ou des murs de caverne, datant du paléolithique supérieur, qui sont parvenus jusqu'à nous, aient été réalisés à des fins de communication écrite entre les hommes. Il est très possible que le chasseur primitif revenant de la chasse et voulant en faire le récit à ses contribules l'ait fait au moyen d'un dessin. Ce dessin pouvait servir aussi à la perpétuation de l'événement dans la mémoire du narrateur et des auditeurs. Dans un cas comme dans l'autre, nous avons l'embryon de l'écriture, c'est-à-dire de l'instrument de communication complémentaire du langage phonétique. Quelles étaient les caractéristiques essentielles, le contenu et 367

la signification de cette écriture pictographique primitive? Comme nous l'avons indiqué, selon la théorie de Marr, cette écriture primitive possédait en quelque sorte fondamentalement un caractère magique. L'écriture primitive, affirme I.I. Mechtchaninov, « . . . était utilisée presque exclusivement pour la communication avec le totem et la puissance magique . . . »10. Cette affirmation est en contradiction avec la réalité des faits. La plupart des inscriptions pictographiques (provenant des Indiens d'Amérique du Nord, des Noirs d'Afrique, des peuples du Grand Nord, etc.) servaient à des fins non pas magico-religieuses mais pratiques. Ce sont pour la plupart des marques de propriété personnelle ou tribale portée sur des objets mobiliers, sur des pierres de bornage, sur des animaux domestiques, etc.; des signes numériques qui se présentent d'ordinaire sous forme de combinaisons de bâtonnets et de croix; des inscriptions sur des pierres tombales, relatant à l'aide de dessins les événements les plus importants de la vie du défunt; des communications concernant la chasse; des rapports relatifs à des engagements guerriers, raids et campagnes militaires; des messages d'amour; des documents fixant les conditions d'un échange. Les formules magiques, les exorcismes, les marques de tabou et d'autres inscriptions à contenu et signification magiques sont en quantité moindre. Les dessins primitifs de l'époque paléolithique qui nous sont parvenus, et qui furent probablement à l'origine de l'écriture pictographique, ont, eux aussi, un caractère essentiellement réaliste. Les plus anciens d'entre eux (par exemple les dessins de la station de La Ferrassi, etc.) se présentent comme des contours d'animaux et des figures de femmes schématisées, gravées dans la pierre. L'essentiel dans ces dessins, c'est leur caractère cognitif, l'essai de représenter les phénomènes de la réalité entourant l'homme primitif et qui avaient pour lui la signification la plus vitale. La théorie de Marr et Mechtchaninov sur le caractère magique de l'écriture primitive est aussi en contradiction avec les principes mêmes de la doctrine matérialiste marxiste-léniniste, pour laquelle l'art, la science et par conséquent l'écriture aussi, sont le reflet de la réalité. C'est dans la langue et donc dans l'écriture que se manifeste la pensée humaine. Et si la pensée de l'homme primitif n'avait pas été réaliste, elle n'aurait pas été le reflet de la réalité qui l'entoure, l'homme n'aurait pas pu s'orienter correctement dans cette réalité ni plus tard, la soumettre à ses exigences et ses besoins.

10

1. I. Mechtchaninov, ouvrage cité note 3.

368

IV Un des problèmes les plus importants de la théorie de l'écriture est celui-ci : parmi les traits que présentent les divers systèmes d'écriture, lesquels convient-il de considérer comme essentiels et lesquels comme secondaires, et d'autre part, quels sont les liens qui les rattachent à la langue? L'écriture est un instrument de communication entre les hommes, mais un instrument non autonome, dépendant de la langue et la traduisant par des moyens graphiques qui lui sont propres. Les traits fondamentaux de l'écriture sont par conséquent liés dans une importante mesure aux principes mêmes de la langue. Peuvent être considérés comme tels les traits suivants : 1. le type de l'écriture : pictographique, idéographique, phonétique (syllabique ou alphabétique) ou intermédiaire, transitionnel entre les types énumérés; 2. le matériel fondamental des signes utilisés; en particulier : pour le système idéographique le matériel fondamental d'idéogrammes; — pour le système phonétique, le matériel fondamental de signes syllabiques ou alphabétiques; — pour le système intermédiaire, la combinaison des deux; (l'écriture pictographique rudimentaire n'a pas de matériel de signes graphiques un tant soit peu constant et stable). En outre, comme nous l'avons déjà indiqué, dans le second trait fondamental de l'écriture, le matériel de signes graphiques, on peut distinguer par convention deux aspects: a) la signification des signes; b) les formes graphiques typiques des signes. Tous ces traits doivent être considérés comme essentiels, étant donné qu'ils apparaissent comme les plus constants et les plus immuables dans chaque système d'écriture, qu'ils en constituent les traits spécifiques distinguant un système donné de tous les autres. A chaque changement important de l'un de ces traits fondamentaux de l'écriture (par exemple le passage de l'écriture idéographique à l'écriture idéographique-phonétique, ou le changement du fonds des signes graphiques, par exemple le remplacement de la base latine d'un alphabet par une base russe), c'est le système même de l'écriture qui change et qui se transforme en un autre, différent du premier. Pour les systèmes d'écriture les plus répandus à notre époque, les systèmes phonétiques (alphabétiques), il faut considérer aussi comme traits fondamentaux les différents principes orthographiques d'écriture : phonétique, phonologique-morphologique, historiquetraditionnel. Un changement radical du principe orthographique fondamental et dominant d'un système change le système même; plus 369

encore, il entraîne la nécessité d'un changement dans le matériel des signes graphiques. Par exemple, l'application conséquente de la proposition de l'écrivain russe du XVIII e siècle Trediakovski, de passer de l'écriture « d'après les racines » à l'écriture « d'après les sons » aurait rendu nécessaire l'introduction dans l'alphabet russe d'une série de lettres complémentaires, en particulier de lettres pour les voyelles réduites apparaissant en position non accentuée. Au contraire, ne doivent pas être classés parmi les traits fondamentaux les traits qui ne sont ni très importants, ni spécifiques dans les systèmes d'écriture des peuples et qui dans les limites d'un seul système se distinguent par leur grande variabilité. Au nombre de tels traits secondaires, on peut citer : 1. les diverses « mains » et les divers styles d'écriture; 2. les diverses règles particulières d'orthographe; 3. les règles de ponctuation, etc. Même dans les cas où des changements considérables se produisent dans ces traits (par exemple lors du remplacement de la vieille onciale russe par la semi-onciale, lors de la révision de règles d'orthographe ou de ponctuation), le système d'écriture en tant que tel ne se transforme pas en un autre, sauf les cas extrêmement rares où les changements de main ou de style d'écriture conduisent à des bouleversements importants de graphèmes, ou lorsque la modification des règles d'orthographe entraîne des changements importants dans le fonds, la signification ou l'emploi des signes graphiques. V Dans la mesure où l'écriture est l'expression graphique de la langue, les traits fondamentaux de chaque système d'écriture développé, comme nous l'avons indiqué plus haut, sont toujours plus ou moins liés aux principes de la langue nationale. Aussi le premier trait fondamental de Vécriture — son type —- est dans une importante mesure conditionné par le degré de développement historique du peuple et la structure grammaticale de la langue nationale. Sur le plan de l'histoire générale, l'écriture a évolué graduellement des représentations pictographiques rudimentaires, fortuites, aux systèmes idéographiques organisés mais compliqués, encombrants, puis aux systèmes d'écritures syllabique ou alphabétique, considérablement plus simples. C'est précisément dans cette direction que s'est produit le développement de l'écriture chez la plupart des peuples anciens cultivés : chez les peuples de culture méditerranéenne (Egypte, Phénicie, Grèce, Rome), dans les anciens Etats du MoyenOrient (Sumer, Babylone, Assyrie, Perse), en Inde, au Japon, en Corée, etc. 370

Historiquement, le premier type, le type embryonnaire de l'écriture a été la pictographie. Comme nous l'avons indiqué, un pictogramme exprime ordinairement une proposition entière qui n'est pas encore nettement découpée en mots distingués par des signes. De là le fait que le pictogramme se présente ordinairement comme une composition complexe dont les éléments distincts ne peuvent être compris que dans leurs relations mutuelles. Il convient de remarquer que le caractère si fortement synthétique du pictogramme correspond à la structure polysynthétique des langues des peuples qui ont développé avec le plus d'intensité l'écriture pictographique (Aztèques, autres Indiens d'Amérique — Iroquois par exemple, nombreux peuples du Nord, etc.). Il ne s'ensuit naturellement pas que la structure polysynthétique de la langue ait été la cause de l'apparition de l'écriture pictographique; la pictographie a été employée largement chez les peuples dont la langue présentait une structure tout à fait différente, mais qui se trouvaient aux stades les plus primitifs du développement social. Mais on peut considérer avec vraisemblance la structure polysynthétique de la langue comme un des facteurs qui ont pu favoriser le développement de l'écriture pictographique chez un certain nombre de peuples. Autre caractéristique de l'écriture pictographique : l'inconstance, l'instabilité de la grande majorité des figures utilisées, créées en général pour des occasions particulières. C'est pourquoi l'écriture pictographique n'exigeait aucun apprentissage spécial, aucune éducation spéciale; elle était accessible à tous. Cette accessibilité à tous correspondait aux plus anciennes étapes du développement de l'humanité, quand il n'y avait pas encore de division en classes et, par conséquent, de division en minorité lettrée et majorité illettrée. Mais son accessibilité n'empêchait pas la pictographie d'être une écriture extrêmement imparfaite, primitive, inorganisée. Les figures pictographiques étaient instables; elles n'avaient pas toujours une signification unique et permettaient des interprétations diverses; on ne les déchiffrait qu'avec peine, comme les rébus modernes. Il était presque impossible à l'aide de la pictographie de rendre des notions abstraites ou d'enregistrer des faits compliqués (contrats commerciaux, lois, etc). C'est pourquoi, à mesure que la société se développait et que s'accroissait la complexité de la pensée et de la langue, à mesure que le besoin apparaissait d'une correspondance organisée, les figures pictographiques synthétiques primitives, occasionnelles, se décomposaient de plus en plus en signes distincts dont la signification et la forme graphique se stabilisaient de plus en plus. Graduellement, chaque signe commença à désigner un mot défini, distinct, et de ce fait même l'écriture pictographique se réorganisa pour devenir l'écriture idéographique, plus parfaite, plus or371

donnée, mais aussi plus compliquée. J. V. Staline lie l'apparition d'une correpondance régulière (et par conséquent aussi les premiers systèmes graphiques ordonnés) à la naissance de l'Etat et au développement du commerce. Les idéogrammes présentaient une plus grande divisibilité, une signification moins ambiguë, une stabilité plus forte que les pictogrammes. Ils permettaient de transmettre les productions littéraires et les documents les plus compliqués. Cela rendait les systèmes idéographiques bien plus propres à la correspondance variée et ordonnée qui se développait avec l'apparition des Etats et l'essor du commerce. En même temps, la faiblesse du lien entre les idéogrammes et l'aspect phonétique du langage faisait que ces systèmes convenaient très bien aux formations étatiques antiques dont la composition ethnique était bigarrée et aux peuples qui n'avaient pas encore développé de langue littéraire nationale unique. Par contre, leur complication fut une des causes des difficultés que rencontra la propagation de la science de l'écriture parmi les peuples qui en usaient. C'est pourquoi à mesure que la société évoluait et que s'élargissaient le domaine d'emploi et le cercle des utilisateurs de l'écriture, à mesure que se constituait une langue littéraire unique, les systèmes d'écriture se transformaient de l'intérieur en systèmes syllabiques ou alphabétiques, bien plus simples et plus accessibles. A son tour, le développement des systèmes d'écriture syllabique et alphabétique, en fixant une prononciation unique des mots, accélérait le processus de formation d'une langue littéraire propre à tout le peuple. F. Engels liait l'apparition des systèmes d'écriture phonétiques au passage à la « civilisation ». Caractérisant les différents stades de l'époque de « barbarie », précédant la « civilisation », Engels écrivait : « 3. Stade supérieur. Il commence avec la fonte du minerai de fer et passe à la civilisation avec l'invention de l'écriture alphabétique et son emploi pour la notation littéraire » u . Cependant, d'autres peuples connurent une évolution tout aussi régulière — sur le plan de l'humanité en général — mais différente, en relation avec les particularités de leurs langues. Ainsi, par exemple, le fait que la Chine, malgré l'antiquité et le haut degré de sa culture, n'est pas passée de l'écriture idéographique à l'écriture phonétique s'explique, dans une importante mesure, par les particularités de la langue chinoise. La première de ces particularités 11

F. Engels: L'Origine de la famille, de la propriété privée et de l'Etat, Ed. sociales 1954, p. 31. Il convient de mentionner que la division de l'histoire de la société en stades de culture sociale, élaborée par F. Engels sur la base du schéma de L. Morgan est actuellement soumise à révision (voir les articles Barbarie et Sauvagerie dans la deuxième édition de la Grande Encyclopédie Soviétique).

372

est la structure isolante (isolant les racines) du vieux chinois, l'immuabilité de la base dans la formation grammaticale. Ainsi le mot chinois fey sert dans des conditions différentes soit de substantif « vol », soit de verbe « voler » soit d'adjectif « volant ». A cette particularité se rattache aussi le fait que la plus grande partie des mots-outils, ainsi que toutes sortes d'affixes sont perçus comme des mots à sens plein. Une deuxième particularité de la langue chinoise, qui a contribué plus fortement encore à rendre difficile le passage à l'écriture phonétique, est l'existence d'un grand nombre de dialectes avec leurs particularités phonétiques; ce qui s'explique dans une importante mesure par le morcellement féodal de l'ancienne Chine, par le faible développement du marché national et par l'oppression nationale colonialiste de l'impérialisme, qui a empêché jusque dans les temps modernes l'atténuation de ce morcellement. L'intercompréhension mutuelle de représentants des divers dialectes régionaux de la Chine est facilitée par l'écriture hiéroglyphique, étant donné que les hiéroglyphes sont lus par les représentants de chaque dialecte selon la prononciation dialectale des mots symbolisés par les hiéroglyphes. L'intercompréhension demanderait un effort beaucoup plus grand avec une écriture phonétique qui refléterait les diverses prononciations des mêmes mots. La question du passage à l'écriture phonétique alphabétique se pose avec une particulière urgence dans les conditions de la Chine nouvelle démocratique, car le système hiéroglyphique entrave le développement de l'instruction dans les larges masses populaires. Il suffit de faire remarquer que la compréhension de textes simples exige la connaissance de deux à trois mille hiéroglyphes. Cependant le passage du système hiéroglyphique, qui existe en Chine depuis plusieurs millénaires et qui est lié aux particularités de la langue chinoise, à la langue phonétique, ne pourrait se produire qu'à la suite d'une préparation très longue et compliquée, basée en partie sur l'affermissement en Chine d'une langue littéraire unique; sa propagation dans le peuple est assurée, comme résultat de la victoire de la révolution, par l'unification économique et politico-culturelle de la Chine12. C'est par d'autres voies que l'écriture s'est constituée en Corée et au Japon, en liaison avec la structure grammaticale toute différente — essentiellement agglutinante — des langues coréenne et japonaise. Dans ces pays qui se sont développés sous une forte influence culturelle chinoise, le système d'écriture chinois est utilisé depuis longtemps. Mais, pour des raisons d'ordre linguistique, l'hié12

Sur ce sujet, voir plus loin, pp. 127—135 (N.d.l.R.).

373

roglyphe chinoise n'est pas d'un usage commode pour la Corée et le Japon. En effet, à la différence des mots chinois, les mots coréens et japonais sont sujets à des changements grammaticaux (flexions, suffixes, désinences) qui ne peuvent être rendus par des signes idéographiques. C'est pourquoi dans ces pays, depuis longtemps déjà, on utilise parallèlement aux hiéroglyphes des systèmes d'écriture syllabique nationaux — l'écriture kana au Japon et l'écriture koungmoun13 en Corée. En outre, aussi bien en Corée qu'au Japon, à côté du système d'écriture syllabique s'est constitué un système mixte idéographiquesyllabique qui symbolise par des hiéroglyphes les morphèmes radicaux immuables et par des signes syllabiques les parties variables du mot. Au Japon ce système a été adopté partout. Dans l'ancienne Corée, la presse périodique et les écrits savants l'utilisaient, tandis que dans la littérature dominait une écriture purement phonétique. Dans la démocratie populaire de Corée, on utilise actuellement d'une façon générale les signes phonétiques (koungmoun) mais on se sert sporadiquement des hiéroglyphes parallèlement à l'écriture phonétique pour rendre plus clairement certains concepts complexes ou des mots empruntés au chinois ou pour distinguer des homonymes. La facilité relative de la combinaison des signes idéographiques et phonétiques dans l'écriture coréenne ou japonaise s'explique dans une importante mesure par la structure grammaticale agglutinante de ces langues: les mots peuvent en effet y être divisés en bases généralement immuables (que peut facilement symboliser un idéogramme) et en affixes (que des signes phonétiques peuvent rendre facilement). Ainsi la structure isolante d'une langue, le fait que presque tous les mots, y compris les mots-outils, sont perçus comme des mots à sens plein, la présence d'une grande quantité d'homonymes, l'abondance de dialectes avec des prononciations différentes des mêmes mots, ainsi que l'extension insuffisante d'une langue littéraire unique, sont des facteurs qui favorisent le maintien des systèmes idéographiques (logographiques) d'écriture, même quand ces systèmes commencent à entrer en opposition avec l'évolution de la langue, quand s'y développent les éléments d'une morphologie affixale. Par contre le passage au système phonétique (syllabique ou alphabétique) est favorisé par : 1. l'abondance dans la langue de formes grammaticales qui ne peuvent pas être rendues par des idéogrammes et dont la propagation nécessite l'usage de signes syllabiques et alphabétiques (c'est une telle situation qui a favorisé la consolidation du système d'écriture syllabique en Corée et au Japon); 13

Nom actuel; anciennement eenmoun.

374

2. la séparation nette des mots en mots à sens plein et en motsoutils; 3. le petit nombre des homonymes; 4. la formation et la diffusion d'une langue littéraire unique. Le passage à l'écriture phonétique est favorisé aussi, et dans une mesure bien plus importante, comme nous l'avons indiqué plus haut, par l'élargissement des domaines de l'écriture et sa diffusion dans de larges masses populaires auxquelles l'écriture idéographique est inaccessible du fait de sa complexité. Enfin, la structure agglutinante de la langue entraîne la coexistence dans l'écriture de signes idéographiques et de signes phonétiques. Le deuxième trait fondamental de chaque langue, le matériel de signes utilisés est toujours lié dans les écritures idéographiques au matériel lexical de base de la langue, dans les écritures phonétiques au matériel phonétique de base et dans les systèmes intermédiaires à l'un et l'autre. Les particularités du matériel phonétique de la langue prédéterminent aussi dans une importante mesure l'utilisation de la variété syllabique ou alphabétique de l'écriture phonétique. Dans les systèmes idéographiques, le fonds d'idéogrammes évolue et se transforme en fonction des changements historiques du fonds lexical de la langue. Ainsi, par exemple, le nombre d'hiéroglyphes que comprend le système hiéorglyphique chinois, en comptant tous les signes historiquement connus, atteint, selon l'opinion générale, cinquante mille14. A l'heure actuelle, dans des conditions très étroites, étant donné les modifications subies au cours des siècles par le fonds lexical de la langue chinoise, on emploie beaucoup moins du tiers de cette quantité. Il suffit de faire remarquer que dans les ateliers de composition typographique chinois, le nombre des signes hiéroglyphes dépasse rarement dix mille; les autres hiéroglyphes ne sont presque jamais utilisés et ne sont nécessaires à connaître que pour la lecture de quelques œuvres anciennes de la littérature chinoise. Mais en même temps, et avec l'apparition de nouveaux concepts, et par conséquent de nouveaux mots, il continue de naître de nouveaux hiéroglyphes (par exemple, pour le mot radio, etc.). Bien plus frappante encore est la relation de dépendance qui existe entre le matériel des signes graphiques avec leurs significations

" U n dictionnaire raisonné parmi les plus complets des hiéroglyphes chinois et qui comprend presque tous les hiéroglyphes fixés dans des documents écrits, y compris les plus anciens, le dictionnaire K'ang hi tche tien (1716), explique 42.174 hiéroglyphes.

375

et le matériel phonique de la langue dans les systèmes d'écriture phonétiques. Ainsi l'usage au Japon, en Corée et en Inde (nagari) d'écritures syllabiques et non pas alphabétiques, s'explique en grande partie par le fait que les mots sont constitués dans ces langues d'un nombre relativement réduit de syllabes différentes qui se retrouvent dans des combinaisons diverses. C'est pourquoi toute la diversité phonétique de ces langues pouvait être rendue par une petite quantité de signes syllabiques. L'écriture japonaise offre une illustration très claire des règles qui lient les systèmes syllabiques d'écriture aux particularités de la langue, étant donné les lois phonétiques — caractéristiques du japonais — concernant les syllabes ouvertes. Les syllabes japonaises sont en général constituées soit d'une seule voyelle soit d'une consonne plus voyelle. Cela limitait très étroitement le nombre des syllabes possibles en japonais et rendait du même coup l'utilisation d'un système syllabique commode pour la langue japonaise. C'est pourquoi le système japonais kana se composait de 47 signes syllabiques15. L'usage d'un système syllabique a été favorisé aussi par le fait que le mot japonais se découpe nettement en syllabes, tandis qu'il est très difficile d'extraire un son isolé de la syllabe, étant donné qu'on n'emploie jamais de consonne qui ne soit accompagnée d'une voyelle. En japonais moderne, la loi des syllabes ouvertes n'est plus entièrement respectée. Cela s'explique d'une part par le développement d'une flexion interne qui a suscité par une série de circonstances l'apparition de groupes de deux consonnes et d'autre part par l'invasion du japonais par les mots étrangers, d'abord chinois et maintenant anglais. La plus grande partie de ces mots a été refondue en fonction de la loi des syllabes ouvertes (par exemple le mot anglais pistol devient en japonais pisutoru). Il n'en reste pas moins que ces mots étrangers violaient la structure phonétique du japonais et en particulier la loi des syllabes ouvertes. C'est pourquoi les signes syllabiques kana ne peuvent déjà plus rendre toute la diversité du phonétisme japonais actuel; ainsi, la question du passage de l'écriture syllabique à l'écriture alphabétique se pose d'une façon de plus en plus aiguë au Japon. En Corée, l'écriture syllabique s'est altérée encore davantage. A la base de l'alphabet national coréen il y a de 35 à 40 signes phonétiques. Ces signes ne sont utilisés que dans des complexes syl-

15

Après la dernière réforme de l'orthographe (1945), le nombre des signes a été réduit à 45.

376

labiques16 rigoureusement déterminés, à chacun desquels correspond dans la typographie coréenne une ligature déterminée. Mais, étant donné la grande diversité de la constitution syllabique du coréen moderne, le nombre des complexes syllabiques dans l'écriture coréenne dépasse actuellement deux mille; si bien que ce système graphique basé sur le principe syllabique comporte plus de deux mille signes syllabiques à ligature. Il est aisé de comprendre que cela rend très difficile l'apprentissage de la lecture, de l'écriture et des procédés d'assemblage et pose d'une manière très urgente la question du passage de l'écriture syllabique à l'écriture phonétique. Il convient, à ce propos, de remarquer que, pour un coréen, le son se sépare plus facilement de la syllabe que pour un japonais, et que, par conséquent le passage à l'écriture phonétique lui est plus facile. C'est ce que montre le fait que les signes syllabiques coréens, à la différence des japonais, se présentent comme des groupes complexes de signes phonétiques distincts. D'une manière générale dans les langues qui ne possèdent qu'un nombre limité de syllabes différentes, les systèmes syllabiques sont plus simples et plus faciles à étudier et à employer que les systèmes phonétiques; ce n'est pas sans raison que l'enseignement de la lecture commence ordinairement par la lecture des syllabes. L'usage des systèmes syllabiques d'écriture est puissamment favorisé aussi par la simplicité uniforme de la constitution des syllabes, qui fait que chaque syllabe est reconnue et perçue comme une unité et un tout indécomposable. Le seul défaut de ces systèmes pour ces langues est l'impossibilité de transcrire les mots étrangers, en particulier les noms propres étrangers, si ces mots sont d'une constitution syllabique différente. Par contre, pour les langues qui possèdent un grand nombre de syllabes différentes à constitution complexe, les systèmes syllabiques d'écriture sont irrationnels sous tous les rapports. A la différence de l'écriture japonaise, coréene ou indienne (nagari), les systèmes d'écriture phénicien, vieil hébreu ou arabe, se présentent comme des systèmes phonétiques alphabétiques, mais sont surtout constitués de lettres consonnes 17 . Ce fait est lié à la structure grammaticale « à flexion interne >>18 des langues sémitiques, au

" Chacun de ces complexes syllabiques ne s'inscrit pas dans une seule ligne horizontalement, mais se combine autour d'une lettre voyelle selon des axes divers (en fonction du dessin de la voyelle). 17 En arabe moderne les sons vocaliques sont représentés, non par des lettres spéciales, mais au moyen de signes diacritiques (points, etc.). 18 Nous appellerons « à flexion interne » les langues (sémitiques par exemple) qui expriment les formes et les relations grammaticales principalement par une

377

fait en particulier que les racines des mots étaient constituées dans ces langues principalement de consonnes, les voyelles variant et servant surtout à la formation des thèmes dérivés et des formes grammaticales (par exemple en arabe sur la racine q-t-l, on obtient par infixation de diverses voyelles les mots : qitl « ennemi, meurtrier », qutl « sanguinaire », qatala « il a tué », qutila « il a été tué », 'aqtala « il fit tuer », etc.). Au Moyen-Age, avec les victoires arabes sur d'autres peuples qui se convertissent à l'Islam, le système arabe d'écriture se répand. Mais le système consonantique d'écriture arabe correspondant à la structure à flexion interne et au système phonétique de l'arabe se révèle artificiel et étranger aux peuples turc, iranien, caucasien et autres, appartenant à des groupements linguistiques non sémitiques; la structure grammaticale agglutinante ou à flexion externe et le système phonétique des langues de ces peuples étaient en effet absolument différents. C'est en grande partie la raison pour laquelle, après la révolution, ceux de ces peuples qui font partie de l'U.R.S.S. ont pu passer assez facilement et naturellement du principe arabe de l'écriture à celui de l'écriture russe, plus proche du système de leurs langues (présence de caractères vocaliques, etc.). Les lettres servant à marquer des sons vocaliques apparurent dans l'écriture du grec ancien, bien que cette écriture fût née et se fût développée sous l'influence de l'écriture consonantique phénicienne. Dans une grande mesure, cela aussi s'explique par la structure à flexion externe de la langue grecque, en particulier par le fait que les phonèmes vocaliques n'y étaient pas utilisés seulement pour l'expression de formes grammaticales, mais entraient dans la formation des bases radicales. Dans les systèmes d'écriture latin et vieux slave, qui se sont développés sons l'influence du système grec, le système alphabétique est modifié en fonction du système phonétique particulier de ces langues. Si ces modifications furent très légères dans l'écriture latine, elles furent beaucoup plus significatives en vieux slave. Ainsi d'après O. A. Dobias-Rojdenstvenskaia, l'alphabet latin emprunta à l'alphabet grec vingt lettres auxquelles il n'en ajouta que trois (g, y, z) d'abord et ensuite M19. A leur tour, les alphabets occidentaux contemporains (français, anglais, allemand), en dépit des particularités des systèmes phonétiques des langues occidentales, devaient emprunter au latin

flexion interne (flexion des bases) et « à flexion externe » les langues (par exemple le grec, le latin, le russe, l'allemand, etc.) dans lesquelles les formes et les relations grammaticales s'expriment principalement par une flexion externe.

" Voir O. A. Dobias-Rojdenstvenskaia: Istoriapis'ma v srednie veka, MoscouLeningrad, 1936, pp. 56 et suiv.

378

24 lettres en ne leur ajoutant que deux (w et j). Ainsi les systèmes d'écriture latin et occidentaux se sont développés principalement par emprunts. Par contre, sur les 43 lettres qui forment l'alphabet « cyrillique » vieux slave, 19, c'est-à-dire 45 %, étaient nouvelles par leur signification phonétique. Absentes des alphabets grec classique et byzantin, elles étaient apparues en raison des particularités du système phonétique du vieux slave. Le développement de l'alphabet russe sur la base de l'alphabet vieux slave fit subir à ce dernier d'importantes modifications. Ainsi l'alphabet slave et russe, contrairement à l'alphabet latin et occidental, a évolué d'une manière relativement autonome. Il ressort de tout cela que, dans les systèmes phonétiques d'écriture, le matériel de signes utilisés est toujours plus ou moins prédéterminé par le matériel phonique de la langue. L'existence dans une langue d'un nombre limité de syllabes différentes favorise le développement d'un système syllabique, mais la complication et la diversité de la constitution syllabique de la langue favorise le développement de systèmes phonétiques. De même une constitution de radicaux qui admettent aussi bien des voyelles que des consonnes favorise l'apparition d'alphabets comprenant aussi des lettres voyelles et inversement. En outre, l'emprunt d'un système alphabétique étranger peut déterminer une rupture entre l'écriture et la langue nationale; par contre, le développement autonome, créateur d'un système d'écriture, assure le lien nécessaire entre celui-ci et la langue. La question des lois dans les différents systèmes phonétiques d'écriture de tels ou tels principes orthographiques (phonétique, phonologico-morphologique, historico-traditionnel) occupe une place à part. L'emploi, ou plus exactement la prédominance dans l'écriture du principe historique-traditionnel n'est pas lié aux particularités de la langue; il s'explique surtout par la politique conservatrice du gouvernement dans le domaine de l'écriture. Inversement la prédominance plus ou moins grande dans une écriture du principe phonétique ou phonologico-morphologique est déterminée vraisemblablement par les particularités de la langue et est soutenue par une politique gouvernementale qui tient compte de ces particularités. Cependant, cette question, en dépit de sa grande importance pratique, a été très peu étudiée et exige des travaux spéciaux.

379

VI Tout ce qui vient d'être dit sur le système de signes graphiques et son usage se rapporte principalement à la signification phonétique ou conceptuelle de ces signes. Mais, comme nous l'avons dit, il est nécessaire de distinguer dans chaque signe graphique, outre sa signification phonétique ou conceptuelle, sa forme graphique typique. Des particularités graphiques typiques définies et plus ou moins constantes sont souvent caractéristiques non seulement de signes isolés mais aussi de systèmes entiers (par exemple le caractère cunéiforme de l'écriture du Moyen-Orient antique, le caractère ornemental de l'écriture arabe, le caractère voisin des formes géométriques de l'écriture latine, etc.). Le système de signes utilisé appartient aux traits fondamentaux de l'écriture aussi bien par la signification (conceptuelle ou phonétique) des signes que par leur forme graphique typique. A travers la signification conceptuelle ou phonétique des signes utilisés, c'est un lien direct avec la langue qu'entretient le système d'écriture, tandis que la forme graphique typique des signes aussi bien que le caractère graphique de tout le système d'écriture ne sont pas liés à la langue et sont déterminés par les tendances artistiques complexes qui caractérisent la graphie d'un peuple donné, par les influences de la graphie des écritures précédentes, par les matériaux et les instruments (pierre, argile, papyrus, parchemin, papier) utilisés, etc. En outre la forme typique des signes graphiques est toujours plus ou moins conventionnelle; on la considère ordinairement comme nationale en vertu d'une longue tradition historique 20 . De ce point de vue, on peut par exemple affirmer que les deux systèmes d'écriture vieux slave, le cyrillique et le glagolitique, qui possèdent sur une base graphique différente des alphabets d'une composition phonétique presque identique, sont plus proches l'un de l'autre que le système cyrillique ne l'est de l'onciale grecque. En effet, ces deux dernières écritures se ressemblent par la forme graphique d'un grand nombre de lettres, mais diffèrent fortement par la composition phonétique de l'alphabet. C'est pourquoi c'est faire une erreur de principe que de vouloir résoudre le problème du degré d'autonomie de l'alphabet cyrillique en se basant sur le nombre de lettres à forme graphique « neuve » et de celles qui ont été graphiquement « empruntées » à l'alphabet

50

Ainsi, bien que de nombreuses lettres des alphabets russe et latin (a, e, o, etc.) coïncident par leur forme graphique, l'introduction dans une inscription russe d'une seule lettre latine dont la forme ne coïncide pas avec la lettre russe (par exemple N ou D) serait considérée comme une violation grossière de la structure graphique nationale de l'écriture russe.

380

grec21. Le mérite essentiel des créateurs de cet alphabet (pour autant qu'il ait eu des créateurs individuels) n'est pas dans le fait qu'ils aient pu réussir à inventer une série de lettres graphiquement nouvelles pour représenter les sons que possédaient les langues slaves et qui n'existaient pas en grec; leur principal mérite est d'avoir pu déterminer correctement la structure phonétique (phonologique) propre de la langue slave et par conséquent d'avoir établi correctement le fonds alphabétique de base de l'abécédaire slave. C'est cela qui définit l'originalité de l'alphabet cyrillique et qui est cause que cet alphabet — vieux de plus d'un millénaire — est demeuré jusqu'à nos jours à la base de la majorité des alphabets slaves. Pour ce qui concerne les formes graphiques des lettres de l'alphabet cyrillique destinées à symboliser les sons identiques en grec et en vieux slave, il aurait été irrationnel d'en inventer de nouvelles, alors que le grec en possédait de suffisamment simples et précises. La situation était différente pour les lettres destinées à représenter des sons que le grec ne possédait pas, et qui étaient nécessaires pour traduire le langage vieux slave. C'est dans la formation de ces lettres que se manifesta l'invention créatrice de l'alphabet cyrillique. Des principes analogues sont à la base de la structure graphique des nouveaux alphabets mis au point pour les peuples de l'U.R.S.S. De tout ce qui vient d'être dit, on peut tirer sur le plan méthodologique les conclusions suivantes. L'étude de la théorie et de l'histoire de l'écriture doit toujours être faite en relation avec l'histoire de la société, l'écriture étant un instrument de communication entre les hommes, et avec l'histoire de la langue, l'écriture étant un moyen de communication auxiliaire, complémentaire de la langue, reflétant directement la langue. C'est seulement de cette façon qu'il sera possible de découvrir les lois réelles les plus importantes de développement de l'écriture aussi bien chez des peuples considérés séparément qu'à l'échelle de la société en général. Ceci n'exclut naturellement pas la possibilité ou même la nécessité d'étudier l'écriture du point de vue des arts graphiques, de la paléographie et des autres méthodes spéciales. Ces méthodes sont d'autant plus légitimes que l'écriture, en dehors de sa fonction fondamentale (servir à la transmission du langage) se présente comme une technique particulière, dépendant des matériaux et des instruments utilisés, et comme un fait de style, dépendant des changements de style dans les arts plastiques. Mais chacune de ces mé-

11

Voir par exemple N. S. Tchaev et L. V. Tcherepnine : Rousskaia Moscou 1946, p. 56.

paleographia,

381

thodes ne peut que compléter la méthode essentielle d'étude de l'écriture, la méthode linguistique, étant donné que la réalisation graphique de l'écriture n'est qu'un moyen de transmission du langage et que les lois les plus importantes de l'écriture sont du domaine linguistique et non graphique. Jusqu'à ces derniers temps, l'étude de l'histoire de l'écriture était en général détachée de l'histoire de la société et de l'histoire de la langue et l'attention était concentrée sur l'aspect extérieur, graphique de l'écriture. Il en résultait que l'histoire de l'écriture aboutissait à l'histoire des emprunts de formes graphiques ou à celle des variations de main et de style chez tel ou tel peuple. Les lois véritables, essentielles, du développement de l'écriture ne peuvent être découvertes que par l'étude de l'histoire de l'écriture en liaison étroite avec l'histoire de la société et l'histoire de la langue. Nekotorye voprossy teorii pis'ma (Tipy pis'ma i ix sviaz' s iazykom). Voprossy iazykoznania, 1953, 4, 109—121. Traduit par David

Cohen.

List of the Journals and Books where the articles can be found N. S. Trubetzkoy, Gedanken über das Indogermanenproblem C. Hj. Borgström, Internal Reconstruction of Pre-Indo-European Word-Forms A. Tovar, Linguistics and Prehistory A. Sommerfelt, Le point de vue historique en linguistique E. Zwirner, K. Zwirner, Phonometrischer Beitrag zur Frage der neuhochdeutschen Quantität E. Cassirer, Structuralism in Modern Linguistics L. Hjelmslev, Structural Analysis of Language L. Hjelmslev, La Stratification du langage E. Fischer-J0rgensen, Remarques sur les principes de l'analyse phonémique M. A. K. Halliday, Categories of the Theory of Grammar J. Vachek, On the Interplay of External and Internal Factors in the Development of Language A. Martinet, De la variété des unités significatives E. Uldall, Dimensions of Meaning in Intonation H. Hoijer, Cultural Implications of some Navaho Linguistic Categories E. Haugen, Directions in Modern Linguistics E. Buyssens, Origine de la linguistique synchronique de Saussure I. Fônagy, Communication in Poetry L. Heilmann, Statistical Considerations and Semantic Content R. Jakobson, Why " M a m a " and "Papa"? P. H. Matthews, Transformational Grammar N. Chomsky, De quelques constantes de la théorie linguistique

Acta Linguistica (Hafniensia) I, 1959, p. 81—89 Word X, 1954, p. 275—287

Word X, 1954, p. 333—350 Acta Linguistica (Hafniensia) V, 1945 —49, p. 113—124 Archiv für vergleichende Phonetik I, 1937, p. 96—112 (also Bibliotheca Phonetica 7, 1969, p. 58—106). Word I, 1945, p. 99—120 Studia linguistica I, 1947, p. 69—78 (also Essais linguistiques, 1959, p. 27—35). Word X, 1954, p. 163—188 (also Essais linguistiques, 1959, p. 36—68). Travaux du Cercle linguistique de Copenhague V, 1959, p. 214—234 Word XVII, 1961, p. 241—292 Lingua XI, 1962, p. 433—448

Lingua XI, 1962, p. 280—288 In honour of Daniel Jones, 1961, p. 271—279 Language XXVII, 1951, p. 111—120 Language XXVII, 1951, p. 211—222 Cahiers Ferdinand Saussure XVIII, 1961, p. 17—33 Word XVII, 1961, p. 194—218 Quaderni di glottologia VII, 1962—63, p. 35—45 Selected Writings I, 1962, p. 538—545 Archivum linguisticum XIII, 1961, p. 196—209 Problèmes du langage, Collection Diogène, p. 14—21

383

E. H. Lenneberg, A Biological Perspective of Language V. Istrine, Relations entre les types d'écriture et la langue

E. H. Lenneberg (ed.) New Directions in the Study of Language, 1964, p. 65—88 Recherches internationales à la lumière du marxisme No. 7, 1958, p. 35—60