L'acquisition du langage est un processus complexe et fascinant. Le petit d’homme ne naît pas avec le langage. Pour communiquer avec son entourage, il doit apprendre la langue parlée autour de lui, qui est l’un des quelque 6000 systèmes symboliques conventionnels utilisés dans le monde. Et, compte tenu du haut niveau de sophistication des systèmes linguistiques, il y parvient en un laps de temps relativement court. Cet article explore la manière dont les jeunes enfants acquièrent et développent leur langue maternelle, en se concentrant particulièrement sur l'acquisition des noms.
Introduction
L’étude de la production spontanée des jeunes enfants, versant le plus visible de la capacité langagière, est le moyen le plus ancien auquel les chercheurs aient eu recours pour tenter de comprendre l’acquisition du langage à ses débuts. Le présent article apporte une contribution à cette interrogation, en montrant que l’étude systématique des corpus de production naturelle des jeunes enfants est une voie d’accès féconde pour aider à comprendre les processus d’émergence et d’acquisition du langage, en particulier la mise en place des contraintes fondamentales de la langue.
L'Émergence du Langage chez l'Enfant
L’enfant commence, en effet, à produire ses premiers mots conventionnels vers le début de sa seconde année, et, deux ou trois ans plus tard, il sera parvenu à mettre en place un système de communication efficace où il aura progressivement intégré la plupart des contraintes de base de la langue : il maîtrise alors les principaux aspects de la phonologie, il connaît à peu près le sens et les conditions d’emploi de plusieurs milliers de mots, et il sait utiliser correctement les principales règles morphologiques et syntaxiques de sa langue maternelle.
Méthodes d'Étude de l'Acquisition du Langage
Les premières investigations - tels les travaux pionniers de W.F. Léopold (1939-1949) ou de A. Grégoire (1947) - reposaient sur les journaux que les auteurs tenaient en observant généralement leurs propres enfants. L’entrée dans l’ère de la méthodologie moderne se produit vers les années soixante, avec l’innovation que représente la possibilité d’enregistrement des données sonores. Cette innovation va ouvrir la voie aux études qui, à l’instar du projet mené à l’Université d’Harvard par R. Brown et son équipe sur trois enfants devenus célèbres sous les noms d’Adam, Eve et Sarah (Brown, 1973), examinent le développement langagier à travers l’analyse intensive des productions réelles des jeunes enfants. Au cours des dernières décennies, les études de production se sont à nouveau profondément renouvelées, bénéficiant cette fois de l’essor des moyens audio-visuels et surtout informatiques. L’enregistrement vidéo modifie les conditions de recueil des données et permet l’analyse des indicateurs non linguistiques - situations, actions, gestes, regards - associés aux interactions verbales.
Les études de production naturelle s’appuient ainsi maintenant sur des corpus diversifiés et systématiquement recueillis, constitués des productions verbales spontanées des jeunes enfants, enregistrées en audio ou préférentiellement en vidéo au cours de séances où l’enfant est en situation de vie quotidienne et en interaction avec son entourage. Les enregistrements sont ensuite exhaustivement transcrits et informatisés, les transcriptions comportant non seulement les productions de l’enfant et de ses interlocuteurs mais aussi des informations sur la situation et le contexte de ces productions. Les productions de l’enfant, voire de ses interlocuteurs, peuvent être ainsi diversement codées selon les dimensions souhaitées, et conformément aux objectifs des recherches. Comme on le voit, le recueil et l’analyse des données de production naturelle sont extrêmement coûteux en temps et en énergie, ce qui limite nécessairement la taille des échantillons.
Lire aussi: Conditions et Avantages
L'Apport de l'Informatique: Le Childes
L’une des manifestations les plus significatives de la révolution informatique dans l’étude de la production naturelle a été la création de réseaux et systèmes informatisés destinés à gérer la transcription, le codage et l’analyse des données. Le plus connu de ces réseaux est sans doute le Child Language Data Exchange System dit Childes, fondé en 1984 par B. MacWhinney et C. Snow grâce au financement de la Fondation MacArthur. Le Childes, dont la vocation est de favoriser les échanges entre chercheurs à travers la communauté scientifique internationale, fournit trois principaux instruments progressivement mis au point au cours des années et présentés en détail dans plusieurs ouvrages (MacWhinney, 2000) et mis à jour sur Internet. Le premier instrument, le CHAT Manual, est un guide pour l’informatisation des données de production naturelle et fournit un ensemble d’instructions ou normes destinées à assurer une standardisation des procédures de transcription et de codage. Les règles minimales concernent la présentation de la transcription, tandis que des conventions plus élaborées sont proposées pour le codage (phonologique, morphologique, codage des actes de parole par exemple). Le deuxième instrument est un ensemble de programmes informatiques permettant l’analyse automatique des données transcrites dans le format CHAT. Enfin le troisième instrument est la base de données elle-même, constituée d’un nombre croissant de corpus transcrits dans ce format. L’intérêt de principe d’une telle base de données est évident, puisqu’elle permet au chercheur qui veut examiner une question ou tester une hypothèse d’avoir accès à un vaste ensemble de données d’origines variées et traitables automatiquement.
Recherches sur l'Acquisition du Français
Nous menons depuis plusieurs années un programme de recherche sur l’émergence du langage chez l’enfant et les premières étapes de l’acquisition, entre 1 et 3-4 ans environ, étude menée à travers l’analyse de la production naturelle. Ce programme, principalement centré sur l’acquisition du français comme langue maternelle (mais pouvant faire appel à des comparaisons inter-langues), a pour objectif général de dégager les processus de constitution du système linguistique chez l’enfant. Pareil objectif définit un domaine de recherche qui, s’il est bien représenté au plan international, est encore relativement peu exploré en France, où les travaux consacrés aux premières étapes du développement se sont surtout concentrés sur la communication prélinguistique et les interactions conversationnelles (Marcos, 1998 ; Veneziano, 2000) ou sur l’étude de la perception et de la production de la parole (Boysson-Bardies, 1996 ; Bertoncini & Boysson-Bardies, 2000). Par contraste, nos recherches sur la constitution du système linguistique ont pour but de déterminer les processus par lesquels l’enfant intègre les contraintes fondamentales de la langue, telles par exemple les contraintes lexicales et morphosyntaxiques, voire les contraintes pragmatiques.
Approches Fonctionnalistes et Systèmes Dynamiques
L’ensemble du programme développe une approche fonctionnaliste intégrative de l’acquisition du langage. Apparues en psycholinguistique autour des années quatre-vingt, les approches fonctionnalistes (Bates & MacWhinney, 1982 ; Elman, Bates, Johnson, Karmiloff-Smith, Parisi & Plunkett, 1996 ; MacWhinney, 1999 ; Tomasello, 2003) offrent une alternative aux modèles syntaxiques, modulaires et innéistes de l’acquisition du langage. Ces approches mettent l’accent sur les déterminants environnementaux et sociaux ou sur les déterminants cognitifs généraux, sans pour autant nier l’existence de prédispositions ni les particularités linguistiques de l’acquisition du langage.
Éclairée par la théorie des systèmes dynamiques (Van Geert, 1991 ; 1994), notre approche se définit plus précisément par deux caractéristiques. La première est sa perspective intégrative. L’idée de base, au cœur des débats sur modularité et interaction, est que, dès le début, l’acquisition du langage est gouvernée, non seulement par le jeu des interactions entre facteurs génétiques, environnementaux et cognitifs, mais aussi par celui des interactions « internes » à l’œuvre entre les divers composants de la capacité langagière. L’une des questions centrales est, par exemple, celle des relations entre développement lexical et développement grammatical, que nous examinons de façon conjointe et dont nous recherchons les lieux d’interface et d’interdépendance. La deuxième caractéristique est l’intérêt accordé à la variabilité : non seulement à la variation inter-linguistique, mais aussi à la variation inter- et intra-individuelle.
Constitution d'une Base de Données sur le Français
Pour mener notre programme de recherche sur l’acquisition du système linguistique par les enfants francophones, nous avons entrepris de constituer une base de données sur le français, en relation avec le Childes mais de façon indépendante. Les corpus longitudinaux de Benjamin (de 21 à 48 mois) et de Pauline (de 14 à 39 mois) sont utilisés, ainsi que les corpus transversaux ou mixtes de la base dite « TRL2 » (transverso-longitudinale), constituée par les enregistrements de différents enfants étudiés à certains moments privilégiés du développement. Nos données sont recueillies à 20 mois, 30 mois, 39 mois, et 48 mois, chaque groupe d’âge comportant 20 enfants (les séances ont ici une durée de 30 à 45 minutes). Parmi ces enfants, dix d’entre eux se retrouvent d’un groupe à l’autre, formant la composante longitudinale du corpus. Le corpus « Autisme » est également constitué par les données langagières d’enfants atteints d’autisme.
Lire aussi: Engagement qualité de la crèche à Lille
Codage des Productions des Enfants
Après le recueil des données, une étape essentielle dans l’étude de la production naturelle est celle de l’élaboration et de la mise en œuvre de systèmes de codage des productions des enfants. Comme nous l’avons indiqué, le Childes propose des systèmes de codage très complets. Nous avons cependant préféré élaborer nous-même des codages qui soient le plus possible appropriés aux objectifs et hypothèses de nos recherches. Pour chaque session transcrite, un fichier de codage comportant les productions de l’enfant est constitué ; en règle générale, il consiste en un échantillon formé d’un nombre constant d’énoncés extrait de la transcription, en l’occurrence 120 énoncés pour chaque enfant et chaque mois d’âge. Cet échantillon est choisi de manière la plus « écologique » possible, en respectant l’organisation des séquences discursives et en privilégiant les séquences les plus riches, tout en conservant l’idée que l’échantillon doit être représentatif du langage de l’enfant. Chaque énoncé est soumis à plusieurs séries de codages correspondant aux différents objectifs des recherches. Les codages sont réalisés en référence constante à l’ensemble de la transcription et aux informations fournies par les productions des interlocuteurs et les indications du transcripteur.
Le Développement des Noms
Nous nous proposons maintenant d’illustrer nos recherches sur l’étude de la production naturelle précoce et la constitution du système linguistique en présentant un ensemble d’analyses sur le développement des noms. On considère généralement que les noms constituent, avec les verbes, l’une des deux catégories linguistiques fondamentales qui structurent l’organisation d’un très grand nombre de langues, parmi lesquelles le français. Les noms servent à désigner les entités du monde, animées ou inanimées, tandis que les verbes permettent de faire référence aux événements, actions ou états attribués aux entités.
Précocité et Importance des Noms
Figurant parmi les premiers mots conventionnels produits par les jeunes enfants, les noms ont un statut privilégié dans l’acquisition. En même temps que les enfants, au début de leur deuxième année, commencent à se servir de petits mots fonctionnels à valeur socio-pragmatiques tels qu’interjections, routines, particules d’interaction comme « oui » ou « non », ils se mettent aussi à utiliser des éléments qu’on désigne sous le terme de « noms » dans la langue adulte. Bien qu’elle ait été récemment questionnée par certaines études sur l’acquisition de langues comme le coréen ou le chinois (Choi & Gopnik, 1995 ; Tardif, 1996), l’idée que l’acquisition des noms est précoce et précède celle des verbes ne peut guère être mise en doute pour un bon nombre de langues qui partagent l’opposition verbo-nominale. L’existence du « noun bias », ou prédominance initiale des noms, a été tout particulièrement mise en évidence dans des études qui, en utilisant les questionnaires parentaux standardisés du Communicative Development Inventories (Fenson, Dale, Reznick, Bates, Thal & Pethick, 1994) ont examiné le développement lexical d’enfants acquérant comme langue maternelle l’anglais, l’italien, l’espagnol ou l’hébreu, par exemple (pour une revue, voir Bassano, 2000a et Bassano et al., 2005).
Diverses hypothèses ont été avancées pour expliquer la prédominance initiale des noms. La plus connue est l’hypothèse de la Partition Naturelle proposée par D. Gentner (Gentner, 1982 ; Gentner & Boroditsky, 2001) : les noms sont acquis précocement en raison de leur simplicité notionnelle et cognitive, parce que, contrairement aux verbes et aux autres termes relationnels, ils réfèrent généralement à des entités perceptives distinctes, d’une grande cohésion interne et hautement individualisées - des personnes, des objets concrets -, qui formeraient ainsi le marche-pied logique de l’acquisition lexicale.
Évolution de la Proportion des Noms dans le Lexique
Nos études de production naturelle sur la structuration lexicale nous ont permis de mettre en évidence la place qu’occupent les noms dans le lexique des enfants français au cours des premières étapes du développement du langage, montrant en particulier leur précocité et leur haute fréquence initiale, ainsi que leur relatif décours par la suite. Ainsi, l’analyse du corpus de Pauline (Bassano et al., 1998) a fait apparaître que, parmi les quatre macro-catégories lexicales distinguées, deux prédominent largement en fréquence jusqu’à 18 mois au moins : les noms, qui forment 40 % des mots types, et les éléments que nous avons appelés « para-lexicaux » (interjections, particules oui/non, formules) qui en forment plus de 30 %. En revanche, les prédicats (verbes et adjectifs) sont à cette étape nettement moins représentés (15 %), et les mots grammaticaux moins encore (10 %). Par la suite, au cours du développement, les proportions de noms et d’éléments para-lexicaux diminuent tandis que les proportions de prédicats et de mots grammaticaux augmentent, de sorte qu’autour de deux ans les quatre catégories lexicales occupent à peu près la même part du lexique, et qu’à 30 mois, ce sont les mots grammaticaux qui sont le plus représentés (40 % des mots-types), suivis par les prédicats et les noms (26 % et 23 %) et finalement les items para-lexicaux (11 %). Ces tendances développementales ont été confirmées par une étude transversale impliquant un grand nombre d’enfants (20 par groupe d’âge) observés à 20, 30 et 39 mois (Bassano et al., 2005). La proportion moyenne de noms trouvée dans les productions des enfants diminue significativement entre 20 et 30 mois (de 31 % à 23 %), de même que la proportion d’items para-lexicaux (de 30 % à 17 %), tandis qu’augmentent significativement les proportions de prédicats (de 17 % à 23 %) et de mots grammaticaux (de 23 % à 38 %). Il est à noter que les changements développementaux observés entre 30 et 39 mois sont nettement moins drastiques qu’entre 20 et 30 mois : les changements entre 30 et 39 mois ne sont significatifs ni pour les noms (dont la proportion diminue légèrement, de 23 % à 21 %), ni pour les items para-lexicaux (dont la proportion reste stable, autour de 17 %), tandis qu’augmentent significativement les proportions de prédicats (de 23 % à 27 %) et de mots grammaticaux (de 38 % à 42 %).
Lire aussi: Boutons rouges sur le gland: que faire?
Le Mot : Un Concept Complexe
Dans la conscience linguistique des locuteurs francophones, le « mot » est un concept de la grammaire traditionnelle qui permet de « parler » du langage en s’appuyant sur sa segmentation à l’écrit et sous-tendu par la croyance qu’« un mot correspond à une idée ; une idée correspond à un mot ». Cependant, cette conception ne peut tenir que tant qu’elle est impensée, le concept de « mot » pouvant être qualifié d’évanescent tellement sa définition est à géométrie variable. Cependant, au-delà de sa critique, le « mot » résiste dans l’usage que ce soit dans celui des linguistes qui ne l’ont pas totalement exclu de leurs concepts opérationnels ou que ce soit dans l’enseignement où il est omniprésent, parfois en concurrence avec des regroupements de mots aux contours variables. Dès lors, se posent des questions de cohérence aussi bien en linguistique qu’en didactique de la langue : quels effets sur les élèves et sur les enseignants peut bien avoir l’usage d’un concept flou ? Faut-il redéfinir le mot en cherchant à lui donner une cohérence proprement linguistique ? Sur quelles bases pourrait se faire cette définition et avec quelles conséquences sur la description du français ?
L'Incohérence des Raisonnements
Dans l’usage commun qui en est fait, l’unité graphique impose au regard le « mot » comme une réalité inaliénable qu’il ne serait pas utile d’interroger. Or, le mot graphique se présente implicitement comme la coïncidence de critères qui en réalité ne concordent pas : « une unité autonome de sens représentée par les blancs de l’écrit ». De fait, ce qu’on appelle communément « mot » est le fruit de logiques implicites et contradictoires. Depuis Saussure, la mise au jour du morphème, caractérisé comme unité minimale de signification, n’a pas contribué à une redéfinition du mot. En effet, si un mot peut correspondre à un morphème, comme sans, ou sembler y correspondre comme Pars !, il est, la plupart du temps, constitué de plusieurs morphèmes. Le mot « partions » inclut ainsi un lexème part-, un morphème -i de l’imparfait et un morphème -ons de la personne 4, mis au jour par les commutations respectives avec voulions, partons et partiez. Il n’est pas logique de conclure que -ons n’est pas un mot si nous ou il l’est. En outre, cette logique est contredite à l’intérieur même de la langue française qui admet d’une part quelques « mots » amalgamés comme au qui ne sépare pas à de l’article défini le et d’autre part des mots composés et des formes composées de mots qui n’en seraient pas moins « mots » bien que séparés par des blancs graphiques. C’est le cas de parce que dont la définition en tant que « mot » s’appuie sur la non-séparabilité des éléments. La non-séparabilité d’éléments graphiques séparés par des blancs n’est pourtant pas non plus un critère absolu de définition du « mot ». De fait, si le mot graphique est difficile à légitimer, c’est qu’il semble, par sa segmentation, imposer une analyse de la langue. De la même façon, l’écrit ne peut pas signaler les amalgames ou les absences significatives que met au jour une analyse par opposition.
Solidarité et Disposition des Morphèmes
« De façon générale, la tendance à ne pas séparer dans l’énoncé, les monèmes qui sont sentis comme étroitement liés par le sens est trop naturelle pour qu’on n’en trouve pas des traces dans toutes les langues. Prenant acte d’un emploi toujours présent même si larvé en particulier dans la définition de la dérivation et des catégories de mots, y compris chez les linguistes qui l’ont évacué comme les fonctionnalistes et les structuralistes, certains théoriciens de la théorie de la médiation, comme Pergnier, s’interrogent : « Est-ce l’existence du mot qui pose problème ? « Si l’unité, concernant le mot, ne peut se fonder sur l’unicité de constituants, elle ne peut se fonder que sur la solidarité. Or, des solidarités fortes et à double sens lient certains morphèmes, leur coprésence étant rendue nécessaire et leur ordre fixe. « La solidarité d’apparition entre les listes de sèmes associés [chant- apparaît avec -ait ou -a, aucun des morphèmes ne peut apparaître seul] s’accompagne d’une fixité de l’ordre dans lequel ils apparaissent. Pour en donner un exemple, dans l’énoncé elle parle le javanais, alors que la sélection de elle se fait simultanément avec celle de parle rendant compte de leur interdépendance, il n’en est pas de même des éléments elle parle et le javanais qui peuvent constituer des énoncés complets, autonomes dans le cadre de réponse à une question. De même, la disposition ne respecte pas les mêmes règles de fixité entre ces éléments qu’entre les morphèmes solidaires, comme le démontre Pergnier qui fait contraster : « Les enfants jouent dans la cour/Dans la cour jouent les enfants/dans la cour, les enfants jouent/Les enfants dans la cour jouent », voire « Jouent, dans la cour, les enfants… » avec « *Enfants les jouent dans rue la. Le « mot » dans sa nouvelle acception ne serait donc pas une « unité de sens » mais une « unité grammaticale de signification ». Si on s’appuie sur le critère de solidarité pour poser les frontières d’un mot, il apparaît facilement que le déterminant en français n’est pas autonome et est, au contraire, étroitement associé au lexème, lui-même étant nécessairement précédé d’un déterminant. Quand ce n’est pas le cas, on peut poser la présence d’un déterminant zéro « qui acquiert une valeur sémiologique par opposition aux déterminants matérialisés ».
Le Mot à l'Épreuve de la Clinique
Si l’analyse linguistique, malgré sa complexité, suffit à démontrer l’existence de « mots » plus étendus que les « mots graphiques », elle a aussi été mise à l’épreuve de la clinique, dans le cadre des expérimentations du LIRL (Laboratoire Interdisciplinaire de Recherches sur le Langage) de Rennes 2 dans les années 1980. En effet, dans le cadre de recherches sur l’aphasie, l’équipe du LIRL s’est attachée à montrer qu’on pouvait séparer une rationalité glossologique d’autres rationalités humaines, d’ordre sociologique, éthique et technique, chacune de ces rationalités pouvant se révéler intacte quand les autres étaient touchées. A ainsi été démontré que l’aphasique de Wernicke n’était plus capable d’opérer de choix lexicologique et morphologique mais conservait les schémas d’unité quand l’aphasique de Broca, lui, était devenu incapable de construire une unité alors que ses choix lexicologiques et morphologiques étaient corrects et que donc sa capacité à établir une valeur par opposition était conservée.
tags: #petit #noun #maternelle #définition