Comment Comprendre les Structures Profondes du Langage

Il y a deux caractéristiques frappantes du langage que toute théorie scientifique de ce comportement humain par excellence doit prendre en compte. La première est que nous ne parlons pas tous la même langue. Ce serait une observation choquante n’était pas si banale. Les systèmes de communication et les autres animaux ont tendance à être universels, tout animal de l’espèce étant capable de communiquer avec un autre. De même, de nombreux autres attributs humains fondamentaux montrent beaucoup moins de variations. Sauf accident génétique ou environnemental, nous avons tous deux yeux, une bouche et quatre membres. Partout dans le monde, nous pleurons quand nous sommes tristes, sourions quand nous sommes heureux et rions quand quelque chose est drôle, mais les langues que nous utilisons pour décrire cela sont différentes.

La deuxième caractéristique frappante du langage est que lorsque l’on considère l’espace des langues possibles, la plupart des langues sont regroupées en quelques bandes minuscules. C’est-à-dire que la plupart des langues sont beaucoup, beaucoup plus semblables les unes aux autres que la variation aléatoire ne l’aurait prédit.

À partir des travaux pionniers de Joseph Greenberg, les chercheurs ont catalogué plus de deux mille universaux linguistiques (faits vrais pour toutes les langues) et biais (faits vrais pour la plupart des langues). Par exemple, dans les langues avec un ordre des mots fixe, le sujet vient presque toujours avant l’objet. Si le verbe décrit un événement causé, l’entité qui a provoqué l’événement est le sujet (« Jean a brisé le vase ») et non l’objet (par exemple, « Le vase shbroke John » signifiant « Jean a brisé le vase »). Dans des langues comme l’anglais où le verbe est d’accord avec l’un de ses sujets ou objets, il est généralement d’accord avec le sujet (comparez « l’enfant mange les carottes » avec « les enfants mangent les carottes ») et non avec son objet (cela ressemblerait à « l’enfant mange la carotte » vs « l’enfant mange les carottes »), bien que dans certaines langues, comme le hongrois, la fin du verbe change pour correspondre à la fois au sujet et à l’objet.

Lorsque je signale cela à mes étudiants, j’ai généralement des regards vides. Sinon, comment la langue pourrait-elle fonctionner? La réponse est: très différemment. Les scientifiques et les ingénieurs ont créé des centaines de langages artificiels pour faire le travail des mathématiques (souvent appelé « le langage universel »), de la logique et de la programmation informatique. Ces langues ne présentent aucune des caractéristiques mentionnées ci-dessus pour la plus simple des raisons: les chercheurs qui ont inventé ces langues n’ont jamais pris la peine d’inclure l’accord des verbes ou même la distinction sujet / objet elle-même.

Depuis que nous avons pris conscience de la contrainte de la variation du langage humain, les chercheurs ont eu du mal à trouver une explication. Le récit le plus célèbre est peut-être l’hypothèse de la grammaire universelle de Chomsky, qui soutient que les humains naissent avec une connaissance innée de nombreuses caractéristiques du langage (par exemple, les langues distinguent les sujets et les objets), ce qui expliquerait non seulement les universaux interlinguistiques, mais aussi peut-être comment l’apprentissage des langues démarre en premier lieu. Au fil des ans, la grammaire universelle est devenue de plus en plus controversée pour un certain nombre de raisons, dont l’arbitraire de la théorie: La théorie remplace simplement la question de savoir pourquoi nous avons les langues que nous avons, et pas les autres, par la question de savoir pourquoi nous avons la Grammaire universelle que nous avons, et pas une autre.

Comme alternative, un certain nombre de chercheurs ont exploré la possibilité que certains universaux du langage échappent aux contraintes de conception nécessaires. L’idée de base est que certaines langues possibles mais inexistantes n’existent pas parce qu’elles seraient simplement de mauvaises langues. Il n’y a pas de langues dans lesquelles vous vous répétez répétez chaque mot. Nous n’avons pas besoin de Grammaire universelle pour expliquer cela; la pure paresse suffira. De même, il n’y a pas de langues composées d’un seul mot très ambigu (désolé Hodor); une telle langue serait presque inutile pour la communication.

Dans un article récent passionnant, Ted Gibson et ses collègues fournissent des preuves pour une explication de contrainte de conception d’un biais bien connu impliquant les fins de cas et l’ordre des mots. Les marqueurs de casse sont des affixes spéciaux collés sur des noms qui spécifient si le nom est le sujet ou l’objet (etc.) du verbe. En anglais, vous pouvez le voir sur les pronoms (comparez « elle a parlé avec elle »), mais sinon, l’anglais, comme la plupart des langues SVO (langues où l’ordre des mots typique est Sujet, Verbe, Objet) ne marque pas la casse. En revanche, le japonais, comme la plupart des langues SOV (langues où l’ordre des mots typique est Sujet, Objet, Verbe) marque la casse, avec -wa ajouté aux sujets et -o ajouté aux objets directs. « Yasu a vu l’oiseau » est traduit par « Yasu-wa tori-o mita » et « L’oiseau a vu Yasu » est traduit par « Tori-wa Yasu-o mita. »La question est de savoir pourquoi il existe cette relation entre le marquage au cas par cas et l’ordre des mots SOV.

Gibson et ses collègues fournissent l’explication suivante. Pour comprendre une phrase, il faut déterminer quel personnage fait quoi: est-ce Yasu qui a vu l’oiseau, ou était-ce l’inverse? Nous savons que c’est le sujet qui voit, donc le problème se réduit à identifier le sujet. Dans les deux langues SOV et SVO, vous pouvez (généralement) utiliser l’ordre des mots pour identifier le sujet, mais la différence est que dans les langues SOV, le sujet et l’objet sont beaucoup plus proches l’un de l’autre, ce qui rend plus probable que vous soyez confus quant à ce qui est arrivé en premier (alternativement, le locuteur peut accidentellement changer l’ordre des mots).

Gibson et ses collègues ne se concentrent pas sur les raisons pour lesquelles vous pourriez devenir confus, mais il vaut la peine de prendre un moment pour envisager certaines possibilités. Le plus évident (pour moi) implique le problème de liaison. Le problème de liaison est plus facile à décrire en utilisant un exemple de perception. Ci-dessous, vous verrez un R rouge, un X vert et un I bleu. Mais si vous regardez directement le signe plus à droite, vous aurez probablement non seulement du mal à reconnaître les lettres (elles devraient apparaître comme un fouillis de lignes et de courbes), mais même à déterminer quelle lettre est de quelle couleur (cela dépendra de votre proximité de l’écran; plus vous êtes proche, plus le problème sera grave; vous devrez peut-être regarder pendant quelques secondes pour obtenir le plein effet).

Le problème de liaison consiste donc à déterminer quels aspects de notre expérience perceptuelle appartiennent tous au même objet. Ce problème peut être particulièrement prononcé du fait de ces différentes caractéristiques (couleur, forme, etc.) sont initialement traitées par différentes parties du cerveau et doivent être liées ensemble en aval. La façon dont cela est fait est l’un des problèmes fondamentaux non résolus en psychologie et en particulier en neurosciences.

Le traitement du langage est confronté à des défis similaires. Nous avons différents flux d’informations: quels mots ont été prononcés et dans quel ordre ils ont été prononcés. Il est plus facile de lier les informations de commande au bon mot dans les langues SVO comme l’anglais car le sujet et l’objet sont éloignés (il y a un verbe entre les deux), tout comme le problème d’encombrement dans l’exemple ci-dessus est amélioré en espaçant les lettres:

Les langues SOV n’ont pas cette astuce à leur disposition, ce qui peut expliquer pourquoi elles ajoutent souvent des marqueurs de casse comme indices supplémentaires à la subjectivité et à l’objectivité.

Gibson et ses collègues fournissent des preuves ingénieuses pour ce récit. Ils ont présenté aux gens des scènes simples, comme où une fille donne un coup de pied à une balle, et leur ont demandé de décrire la scène en gestes (pas de parole autorisée). La plupart des gens ont décrit (dans un geste) la fille d’abord, puis le ballon, puis l’action de coup de pied — c’est-à-dire qu’ils ont utilisé un ordre SOV. Bien sûr, lorsque l’événement de coups de pied implique une fille et une balle, il n’y a pas beaucoup de questions sur qui a donné le coup de pied.

Les chercheurs ont également demandé aux gens de décrire par gestes un événement dans lequel une fille a donné un coup de pied à un garçon. Étant donné que les garçons et les filles sont capables de donner des coups de pied, il est très possible de se demander qui a donné des coups de pied à qui. Et maintenant, les participants étaient beaucoup plus susceptibles de décrire (en geste) la fille, puis l’événement de coups de pied, puis le garçon — c’est-à-dire qu’ils sont passés à un ordre SVO. Cela était vrai (avec quelques complications que vous pouvez lire dans l’article) que le participant soit un locuteur natif de l’anglais (une langue SVO) ou un locuteur natif du coréen ou du japonais (langues SOV).

Gibson et ses collègues ont fourni une bonne explication pour expliquer pourquoi vous pourriez vouloir utiliser l’ordre des mots SVO plutôt que l’ordre des mots SOV lorsque le marquage des cas n’est pas disponible pour vous, et ils montrent également que les gens, laissés à eux-mêmes, le font réellement.

Il reste encore beaucoup à faire. Vous vous demandez peut-être pourquoi les langues SOV existent, d’autant plus qu’elles vous font généralement apprendre toutes ces terminaisons de mots ennuyeuses. Gibson et ses collègues suggèrent que nous pouvons avoir un biais par défaut pour l’ordre des SOV, comme le montrent les faits selon lesquels (a) les langues SOV (comme le japonais) sont en fait plus courantes que les langues SVO (comme l’anglais), et (b) les participants à leur étude préféraient légèrement l’ordre des SOV dans l’ensemble. Les chercheurs citent également des preuves que les langues nouvellement créées peuvent être plus susceptibles d’être des SOV. Pourtant, rien de tout cela n’explique pourquoi SOV serait la valeur par défaut; comme d’habitude, une nouvelle question a été posée avec la réponse à une ancienne. Nous avons également encore besoin d’une explication de la raison pour laquelle certaines langues SVO ont un marquage de cas et d’autres langues SOV ne le font pas (les auteurs esquissent quelques possibilités).

Dans l’ensemble, cependant, cet article fournit l’un des exemples les plus clairs à ce jour d’où une tendance importante dans le langage humain – un biais auquel on ne s’attendrait pas à exister par simple hasard – peut être expliquée par référence aux principes universels de calcul et de théorie de l’information. Cela n’exclut pas nécessairement la Grammaire universelle – peut-être que la Grammaire universelle implémente intelligemment de bons principes de calcul – mais elle éclaire pourquoi le langage humain – et par extension, la nature humaine – est tel qu’il est et non d’une autre manière.

Êtes-vous un scientifique spécialisé en neurosciences, en sciences cognitives ou en psychologie? Et avez-vous lu un article récent sur lequel vous aimeriez écrire? Veuillez envoyer vos suggestions au rédacteur en chef de Mind Matters, Gareth Cook, journaliste lauréat du prix Pulitzer et collaborateur régulier de NewYorker.com . Gareth est également l’éditeur de la série Best American Infographics, et peut être atteint à garethideas À gmail.com ou Twitter @garethideas.