Le développement multimodal du langage de l’enfant : des

Morgenstern, A. (2019). Le développement multimodal du langage de l’enfant : des premiers bourgeons aux constructions multimodales. In Audrey Mazur-Palandre&, Isabel Colon (eds..).Multimodalité du langage dans les interactions et l’acquisition. pp. 27-52.

1

Le développement multimodal du langage de l’enfant : des premiers bourgeons aux

constructions multimodales Aliyah Morgenstern

Sorbonne Nouvelle- Paris 3

Introduction Grâce à un bain de langage permanent et à ses interactions pluri-sensorielles avec son environnement, le langage de l’enfant se développe progressivement. Il sera constitué de riches constructions composées d’éléments multimodaux subtilement façonnés qui auront des fonctions communicatives multiples. Dans ce chapitre, nous retraçons le cheminement des enfants dans leur acquisition des formes pluri-sémiotiques du langage grâce à l’étayage des experts (adultes et enfants plus âgés) qui les entourent. Nous commencerons par une revue de travaux et un positionnement théorique rapides afin de montrer pourquoi il est important de prendre en compte la dimension multimodale dans l’acquisition du langage. Nous donnerons ensuite des exemples décrivant les premiers bourgeons multimodaux produits par l’enfant qui contiennent des éléments vocaux et gestuels. Grâce aux reformulations de l’adulte en dialogue, des modèles de productions cibles sont fournis à l’enfant et le guident dans son processus d’appropriation. Nous montrons comment les premiers bourgeons fleurissent pour se transformer en constructions complexes qui peuvent contenir des formes non standard créatives et comment elles se stabilisent enfin pour former des énoncés multimodaux dans lesquels les modalités tissent les unes avec les autres des fonctions sémantiques et pragmatiques subtilement nouées. Les gestes co-verbaux, regards, expressions faciales, sont alors finement coordonnés avec la parole.

1. Acquisition du langage et multimodalité 1.1. Construction d’une approche pluri-sémiotique du langage On a longtemps décrit le développement du langage chez l’enfant en commençant par les premières vocalises et la maturation des capacités phoniques sans prêter beaucoup d’attention aux capacités motrices, aux mouvements, aux regards du bébé puis aux gestes de l’enfant. Mais les premiers journaux des observateurs du langage enfantin contiennent déjà des intuitions fulgurantes sur les qualités pluri-sensorielles (qui passent par l’ouïe, la vue, le toucher et parfois par le goût et l’odorat) et multimodales (qui s’expriment par la parole, le geste, le regard, les expressions faciales) du processus d’acquisition du langage. Darwin est l'un des premiers scientifiques (à la suite de Taine, 1876) à avoir tenu un journal sur son fils aîné et à avoir publié un article sur lui dans Mind (1877). Darwin (1872) s’intéresse surtout à l’expressivité du bébé et ses entrées de journal sont donc centrées sur l’expression des émotions (colère, peur, plaisir...). Il insiste d’abord sur les différentes fonctions de l’intonation. Par ailleurs, selon lui, certains mouvements habituels s’automatisent et sont associés à des fonctions communicationnelles. Cela peut être illustré par les premières manifestations corporelles de la négation (gestes d’évitement ou


2

de rejet qui consistent à détourner la tête, le corps, à repousser de la main). Des schémas mimétiques d’actions imitables, des représentations partagées des objets que l’on peut manipuler, ancrent l’acquisition des premiers gestes de l’enfant (Zlatev et coll., 2005). On a maintenant la preuve grâce aux études en imagerie cérébrale que l’usage du langage implique des représentations motrices (Arbib, 2012). C’est par de subtiles mises en forme des actions quotidiennes et des pratiques avec les objets de l’environnement que la communication manuo-gestuelle au sein des interactions sociales amène l’enfant à adopter les formes conventionnelles du langage symbolique gestuel et verbal. Darwin montre également comment l’enfant passe pour la première fois des gestes aux mots et donne l’exemple de « Mum » (à la fois démonstratif, substantif et verbe) pour exprimer un désir avec au départ le sens de « donne-moi à manger ». Le mot est donc indissociable de son intonation (directive) et de l’action envisagée. Dans ses notes sur le développement de son fils, Darwin (1877) souligne l’importance de comprendre la transition entre les mouvements du corps incontrôlés et les gestes intentionnels. Romanes (1889) compare les gestes des hommes et des animaux. Il présente la « langue gestuelle des sourds » comme la marque de l’universalité des gestes symboliques. Grâce notamment au travail de Bruner (1975, 1983), ces dimensions ont été progressivement prises en compte par les chercheurs en acquisition du langage. Il s’agissait d’abord de voir dans la gestualité un système de communication qui précèderait le système verbal, puis deviendrait un système complémentaire, les gestes et les mots étant intimement liés. Selon Werner et Kaplan (1963, p. 66) : « Linguistic representation emerges from, and is rooted in, non linguistic forms of representation » (les représentations linguistiques prennent leurs racines dans les formes non linguistiques de représentation). Selon Bates (1976), on trouve dans les premiers gestes des enfants des propriétés qui étaient à son époque spécifiquement attribuées par les linguistes générativistes au langage. Les enfants de 13 mois (Bates et coll., 1988) produisent des gestes manuels qui sont considérés comme l'équivalent de mots (faire le geste de se brosser les cheveux en voyant une brosse équivaut à dire « brosse »). Ces gestes seraient des équivalents aux noms. Le point de départ de l’intérêt des chercheurs en acquisition du langage pour les gestes, ces actions corporelles visibles (Sansavini et coll., 2010), peut être résumé dans l’assertion de Laguna selon laquelle “in order to understand what the baby is saying you must see what the baby is doing” (pour comprendre ce que le bébé dit, il faut voir ce que le bébé fait, Laguna, 1927, p. 91). Les productions des enfants sont comme des esquisses évanescentes du langage adulte et ne peuvent être analysées que dans leur contexte interactionnel, en prenant en compte le savoir partagé, les actions, les gestes, les expressions faciales, les postures, les mouvements de tête avec les mots produits par les enfants (Morgenstern & Parisse, 2007; Parisse & Morgenstern, 2010). En parallèle, une approche intégrative, multimodale du langage se construit grâce aux apports de Goodwin (1986, 2013) ou de Levinson (2006). La reconnaissance des langues des signes a également joué un rôle important dans la prise en compte de la dimension gestuelle. Un foisonnement de travaux sur la gestualité ou sur le rôle complémentaire des formes sémiotiques voit le jour et vient enrichir le travail déjà mené sur le développement du langage de l’enfant. Les anthropo-linguistes, confrontés à une multiplicité de cultures dont beaucoup de tradition orale, aident les linguistes à prendre conscience que l’appareil formel construit pour décrire les langues est largement basé sur des textes écrits (Linell 2005) alors que les usages les plus fréquents du langage sont dans les interactions en face-à-face (Goffman, 1963). Ce sont nos pratiques discursives qui façonnent la langue que nous nous approprions et que nous utilisons dans notre vie quotidienne. Les sémioticiens (Kress, 2010) insistent eux aussi sur l’importance de prendre en compte les différents canaux simultanés (auditif, visuel, tactile) avec lesquels nous conceptualisons le monde qui nous entoure et nous exprimons.


3

L’ensemble de ces travaux nous amène à prendre en compte les diverses ressources sémiotiques que l’enfant s’approprie et manipule lors de son entrée dans le langage et de construire une approche multimodale de l’acquisition du langage pleinement articulée avec les approches fonctionnalistes et basées sur l’usage.

1.2. Approches théoriques de l’acquisition chez l’enfant et multimodalité Dans les recherches en acquisition du langage, en complémentarité de mécanismes cognitifs généraux, les tenants de l’approche cognitive et fonctionnaliste posent une « usage based theory of language acquisition » (Tomasello, 2003), insistant donc sur les usages que fait l’enfant en tenant compte du langage qui l’environne ou qui lui est adressé. La linguistique cognitive a pour hypothèse que la faculté d’acquisition du langage repose sur des mécanismes cognitifs généraux, à l’œuvre dans d’autres activités cognitives que le langage. Elle va à l’encontre de la thèse classique de la grammaire générative (théorie chomskyenne des « principes et paramètres », Chomsky, 1959), selon laquelle les langues ne peuvent être acquises que par un module spécifique, un « organe du langage » (les propriétés de ce module seraient radicalement différentes de celles du reste du système cognitif humain). Même si l’enfant a des capacités d’ordre biologique et cognitive innées contrairement aux autres animaux, liées sans doute à l’évolution de l’espèce, il doit apprendre les conventions linguistiques de sa communauté culturelle à partir du langage des autres. Il les construit en parallèle avec les autres apprentissages d’ordre cognitif et social comme le fait de pouvoir suivre le regard de l’autre, d’attirer son attention, de lire ses intentions, la capacité à faire des analogies, à catégoriser, à symboliser. Au niveau linguistique, selon l’approche cognitive et constructiviste, l’enfant apprend des mots et des constructions isolés, et ce sont ces petits bouts de langage doués de sens en contexte, qui progressivement lui permettent de se construire des grammaires successives. Comme nous le rappelle Ingram (1989, p. 483) : “Constructions have been in child language all the time” (les constructions ont toujours été constitutives du langage de l’enfant). Les grammaires de construction, en particulier l’approche de Goldberg (1995, 2006), ont cherché à expliquer le développement du langage de l’enfant (Tomasello, 2003). Les enfants entrent dans le langage en se saisissant de portions concrètes de formes et tailles différents au sein de leurs interactions avec les autres. Ils sont ensuite capables de généraliser ces portions qui deviennent des constructions plus abstraites, symboliques de par leur utilisation conventionnelle dans leur communauté linguistique. Ces constructions linguistiques contiennent des élément multimodaux utilisés de manière intégrative (un pointage, un mot, un regard, une expression faciale…) afin d’assurer des fonctions communicationnelles spécifiques. L’acquisition du langage est donc un domaine dans lequel il est plus que nécessaire d’appliquer une « grammaire de construction multimodale » (Morgenstern, 2014), et d’analyser comment ces ressources pluri-sémiotiques fonctionnent de concert. Les observateurs du langage de l’enfant du XIX° siècle avaient déjà exprimé leurs intuitions sur la langue « gestalt » de l’enfant dans leurs journaux sur leurs propres enfants (Stern & Stern, 1907 ; Pavlovitch, 1920). Ces intuitions ont été théorisées par Brown (1973) et reprises par des auteurs comme Crystal, Fletcher & Garman (1976) qui parlent des différents niveaux linguistiques, Peters (1980) qui décrit le développement des unités du langage, et par de nombreux défenseurs d’une approche fonctionnaliste de l’acquisition du langage (Budwig, 1995 ; Clark, 2003) qui associent le développement du langage à d’autres domaines de la cognition et à son ancrage social et conversationnel. On peut associer l’approche socio-constructiviste aux approches énonciativistes plus françaises. C’est en situation et dans l’interaction que le bébé soumet en permanence le flux sonore, (auquel on ajoutera le flux visuel, tactile, olfactif) qui lui parvient, à une analyse que Culioli appelle activité épilinguistique qui


4

a pour caractéristique d’être non consciente et « qui est au cœur de l’activité de langage et que l’on peut constater déjà chez l’enfant » (Culioli, 1990, p. 18). Les théories énonciativistes mettent donc à la fois l’accent sur les aspects discursifs et intersubjectifs du langage et sur l’activité mentale du sujet, qu’il soit enfant ou adulte au sein de la co-énonciation. Notre approche se situe en continuité avec ces perspectives et va plus loin en cherchant à montrer que le langage de l’enfant est par nature multimodal, intégratif, mais que selon la modalité dominante de la langue qui entoure l’enfant, un canal (visuel ou vocal) va être privilégié. Si les enfants entendants sont amenés à privilégier le canal vocal qui est prédominant chez les adultes qui interagissent avec eux, tout en gardant la capacité à allier subtilement les expressions du visage, les gestes, le regard les postures à leurs productions vocales, et à continuer à utiliser des gestes de manière co-verbale, les enfants sourds-signeurs, vont privilégier la modalité visuelle quand leur interlocuteur est sourd-signeur. Nous proposons de considérer le processus d’acquisition du langage comme étant multimodal et d’utiliser une grammaire de construction multimodale (Morgenstern, 2014) en reconnaissant avec Cienki (2012, 2017) que le sujet en interaction réagit selon « a scope of relevant behaviors » (un éventail de conduites pertinentes) en fonction de son intention communicationnelle, de son interlocuteur, de son contexte, de sa situation, de l’activité en cours et utilisera donc plus ou moins la modalité gestuelle et/ou verbale. De plus « l’apprenti sujet-énonciateur » (Morgenstern, 2006) se transforme en fonction de son âge et de ses expériences. Son « éventail de conduites pertinentes » évolue en fonction des réactions de son entourage, des attentes des adultes, qui progressivement vont l’amener vers les formes standard de sa culture dans laquelle la modalité verbale, dans la communauté entendante, est en général prédominante.

1.3. Méthode Grâce à une complémentation entre les études du langage spontané et les études expérimentales, aux apports de la vidéo, de logiciels spécialisés, de bases de données multilingues et multimodales (MacWhinney, 2000), à des approches théoriques qui incluent différents niveaux d’analyse, et grâce à de riches collaborations entre des experts de domaines scientifiques différents, nous avons désormais les outils, et en particulier la vidéo, pour montrer que « le langage est multimodal de manière inhérente » (Müller, 2009, p. 216). L’utilisation d’une caméra à des fins de recherche en sciences humaines et sociales est une pratique qui date des années 1970 et qui est liée aux avancées technologiques. L’apport de l’internet a permis ensuite de créer des bases de données partagées entre chercheurs avec l’accord des sujets filmés. L’outil audiovisuel, quand il est utilisé avec suffisamment d’expertise permet d’accomplir une véritable investigation vidéographique et de saisir la complexité des interactions sociales (paroles, gestes, expressions faciales, regards, attitudes, postures). Le dispositif filmique ouvre à un mode de connaissance anthropologique (Remillet, 2011) qui n’est pas encore suffisamment exploré dans certains milieux de recherche cependant, et les avancées des sciences humaines et sociales dans ce domaine peuvent être utiles à d’autres domaines scientifiques. Dès le début des années 1960, Sacks (1994) recommande l’utilisation d’enregistrements pour capturer les pratiques quotidiennes car cela permet de rejouer indéfiniment les extraits à analyser et de les transcrire, mais aussi de partager les données avec d’autres chercheurs qui peuvent ainsi vérifier et confirmer les analyses ou en faire d’autres et participer à des recherches collaboratives. Charles et Marjory Goodwin (Goodwin, 1994) pratiquent et enseignent l’utilisation d’enregistrements vidéo filmés dans différents environnements sociaux, depuis les années 1970 aux États-Unis. En Grande-Bretagne, la pratique est appliquée aux milieux médicaux et en particulier à la consultation médicale par Christian Heath (1996). Ces approches favorisent l’enregistrement dans le milieu naturel dans lesquelles surviennent les


5

pratiques quotidiennes car les conduites de chacun sont façonnées par les interlocuteurs et les environnements et ne sauraient être capturées en dehors de leur contexte (Mondada, 2009). L’action de filmer et la présence de chercheurs sont bien sûr sources d’interférences dans les situations en cours comme l’explique Labov dans son « paradoxe de l’observateur » (1972). Elles viennent altérer le « milieu naturel » et modifier le contexte que les chercheurs essaient de capturer. Il s’agit alors pour les chercheurs d’être capables d’évaluer ces interférences, de les prendre en compte, mais également de trouver les moyens pour qu’elles soient incorporées dans le cadre. C’est le cas quand on filme un enfant depuis qu’il est tout bébé de manière régulière. La répétition de la présence, si possible du même chercheur, permet de créer de la familiarité et de mieux l’intégrer. Par ailleurs, quand le chercheur filme des scènes du quotidien, les habitudes des familles viennent contrebalancer l’étrangeté de la situation de tournage. Il est possible de choisir des contextes et des activités suffisamment prenantes pour que la caméra et l’observateur ne soient pas le centre d’intérêt des personnes enregistrées. Il est par ailleurs fondamental d’aller à la rencontre de son sujet d’étude, en particulier quand il s’agit d’un enfant, et de nouer « une relation particulière avec lui, sa famille, son entourage, son lieu de vie, afin que l’enfant analysé ne soit ni un enfant virtuel, ni un enfant hypothétique, idéal, normatif ou typique, ni un enfant de papier » (Morgenstern, 2009, p. 79). Nos sujets d’étude existent en dehors de nos enregistrements, nos relations avec eux nous permettent ensuite d’analyser les interactions, les comportements, les pratiques en connaissant leur contexte de vie et en passant du temps avec eux hors caméra. Les sessions enregistrées ne représentent bien sûr qu’une toute petite tranche de vie transitoire, mais que nous pouvons ensuite observer, écouter, analyser à loisir grâce à ces traces recueillies sous forme vidéo et à leurs transcriptions. Dans la méthode de recueil de corpus que nous utilisons (Morgenstern & Parisse, 2012), les enregistrements vidéo, qui ont lieu une fois par mois puis sont transcrits, représentent un corpus bien pauvre selon les standards posés par Tomasello et Stahl (2004) qui préconisent des méthodes de recueil beaucoup plus dense. Nous ne pouvons pas savoir en quoi l’enfant a changé au jour le jour, ou même de semaine en semaine, contrairement aux pères scientifiques du tournant du dix-neuvième siècle qui pouvaient noter l’évolution des phénomènes étudiés de manière quotidienne dans les journaux qu’ils tenaient sur leurs enfants (Taine, 1876 ; Darwin, 1877). Cependant, chaque enregistrement représente une surprise. Nous re-découvrons l’enfant chaque mois, avec toutes ses transformations. Grâce à ces ruptures dans le flux temporel, à cette discontinuité forcée, nous pouvons ainsi pointer des développements saillants qui n’auraient pas saisi notre attention de la même façon si nous avions vu l’enfant évoluer au quotidien. L’objectif est de garder une continuité entre le travail de recueil des données, les analyses et les hypothèses théoriques que les données vont inspirer. Ainsi la théorie sera nourrie de l’observation réelle des faits de langues en contexte. Il est alors impossible d’éviter une analyse subjective des faits qui passe par un véritable corps à corps entre le linguiste et son « sujet », ici l’enfant. C’est en cela que le travail d’analyse est personnel et qu’il est à consolider par des processus de travail collectif afin d’atteindre une validité scientifique. En utilisant des enregistrements vidéo, le chercheur s’insère dans son terrain d’étude. Il n’est pas aisé d’entrer dans la maison des sujets sur lesquels l’on travaille, mais il est important au moment des analyses de prendre cette présence en compte, de considérer l’observateur comme un participant à part entière avec les spécificités de son rôle. « Constituer son propre corpus pose cependant des questions d’ordre éthique qu’il faut savoir aborder. Il n’est pas simple de pénétrer dans un noyau familial, de faire intrusion avec une caméra, sans avoir le sentiment de voler ces images, voire de violer nos sujets d’observation. Cette position d’observateur, il faut s’y sentir bien, savoir l’occuper, en connaître les


6

limites. Il faut que les enfants et les adultes que l’on observe l’acceptent, et même l’accueillent » (Morgenstern, 2009, p. 89). L’approche que nous proposons se rapproche de la théorie ancrée (ou « grounded theory ») (Strauss & Glaser, 1967). Ce sont les données de la recherche effectuée sur le terrain qui permettent d’élaborer la théorie qui ne repose pas forcément sur une hypothèse que le terrain a pour but de valider ou de réfuter. Cependant, les « observables » sur lesquels nous choisissons de travailler, sont déjà le reflet de notre approche théorique (Ochs 1979) qu’ils continuent de nourrir constamment. Il y a tout au long de l’activité de recherche en acquisition du langage une influence mutuelle des observables sur la théorie et de la théorie sur les observables. Nous avons construit une méthode de codage des manifestations pluri-sémiotiques qui nous permet de différencier les productions vocales (cris), les mots (acceptés comme ayant un sens conventionnel soit dans la famille, soit dans la communauté linguistique), les actions (avec des objets notamment) et les gestes symboliques (gestes qui ont acquis un sens conventionnel dans une communauté linguistique particulière comme le secouement de la tête pour exprimer la négation). Il n’est pas toujours aisé de distinguer les gestes des enfants, des actions (ou postures) car ces dernières sont souvent réintégrées dans le dialogue par les adultes qui leur attribuent un sens et une intention communicationnelle comme dans l’exemple suivant.

Exemple 1 (Ellie 1;02).

Ellie est dans la cuisine et est en train de se déplacer.

Mère: do you want some milk? (est-ce que tu veux du lait)

Elle positionne le gobelet contenant du lait devant les yeux de l’enfant.

Ellie: repousse lentement le gobelet à l’aide de sa main droite, son regard est posé sur le gobelet.

Mère: no, okay. (non, d’accord)

Ellie manifeste son refus par une action concrète sur le réel et repousse en touchant le gobelet offert par sa mère. Cette dernière réintègre l’action de sa fille dans le dialogue. Elle lui attribue la même fonction qu’une production verbale et elle la reformule d’ailleurs verbalement. Nous avons codé cette expression de rejet comme étant une action en prenant la perspective de l’enfant (tout en pouvant pas décoder si l’action est associée à une intention communicationnelle), mais nous lui attribuons dans l’interaction, une fonction communicationnelle en prenant la perspective de la mère qui a interprété l’action de l’enfant. Nous tâchons de distinguer, autant que possible, ce qui est réellement construit par l’enfant, ce qui est interprété par son interlocuteur et ce qui est importé des catégorisations projetées par le chercheur. Les exemples donnés dans ce chapitre sont tirés du corpus en milieu familial de Madeleine (petite fille française, monolingue, filmée en France une fois par mois de 10 mois à 7 ans) et d’Ellie1 (petite fille britannique monolingue, filmée en Angleterre une fois par mois par sa grand-mère de 1 à 5 ans) collectés dans le projet ANR CoLaJE (Morgenstern, 2009 ; Morgenstern & Parisse, 2012). Dans la suite du chapitre, nous illustrons le parcours multimodal de ces enfants au cours de leur entrée dans le langage.

1 Les exemples tirés du corpus d’Ellie ont été transcrits et analysés de manière détaillée dans Beaupoil-Hourdel (2015) dans le contexte de l’entrée dans la négation multimodale.


7

2. Premiers bourgeons multimodaux 2.1. Le geste de pointage La maturation neurologique permet aux enfants de maîtriser leurs mouvements et de les transformer en gestes en raison de leurs capacités motrices plus fines. Leurs interlocuteurs assignent du sens à ces gestes et les intègrent dans les interactions. En parallèle, les enfants développent les pré-requis cognitifs qui leur permettent de reprendre les gestes symboliques qui leur sont proposés dans des routines comme « au-revoir » ou « ainsi font font font les marionnettes ». Ainsi, le geste de pointage émerge grâce à la maîtrise de la motricité fine, de la capacité à symboliser et à imiter/répéter/reprendre les formes employées par les adultes. Certains gestes conventionnels apparaissent très tôt chez l’enfant, et c’est notamment le cas pour le pointage observable avant l’âge de douze mois, peu de temps avant les premiers mots. Selon Cabrejo Parra (1992), ce geste représente une condition nécessaire à la construction du langage car il donne à l’enfant la possibilité de désigner un objet en tant que lieu d’attention partagée et d’échange avec l’adulte. L’objet montré prend un statut particulier puisque le geste de pointage accompagné du regard le distingue de son environnement (Bruner, 1983). L’enfant réalise ainsi une première opération de symbolisation dans un « meeting of minds » (Tomasello, 1999) avec l’adulte que les grands singes ne pourraient pas faire (Butterworth, 1991, 2003 ; Tomasello, 2002). Il s’agirait ici de la première manifestation toute simple de pré-requis spécifiques à l’homme dans son accès au langage : la capacité à partager, à communiquer, à comprendre une intention. Le geste de pointage a reçu une attention particulière dans le domaine de l’acquisition du langage depuis le milieu des années 1970. Il s’agit de l’une des formes gestuelles les plus étudiées, si ce n’est la plus étudiée, pour diverses raisons. Selon Bates et coll. (1979) ou Bruner (1983), l’utilisation du pointage chez l’enfant permet d’anticiper son développement linguistique, la richesse lexicale et l’activité de dénomination en particulier. Si le pointage (le geste symbolique et non le mouvement en lui-même) est bien un geste d’ordre socio-pragmatique, construit à partir des capacités motrices, cognitives, psychiques de l’enfant qui s’approprie un geste et un symbolisme dans le bain de mots et de gestes qui l’environne, l’enfant l’utilise pour l’autre, mais aussi pour lui-même car il fait également des pointages monologiques en l’absence de l’adulte (puisque c’est ainsi qu’il a été utilisé devant lui, il reprend alors la « mise en gestes » de l’adulte). À ces moments là, l’enfant joue à la fois le rôle de l’adulte et son propre rôle et il est alors celui qui montre et celui qui regarde, à l’intérieur d’une mini-saynète dialoguée. Ces manifestations monologiques du processus de pensée de l’enfant sont d’abord gestuelles puis se poursuivront par ce que Piaget (1923) et Vygotsky (1934) appellent langage égocentrique. Que ce soit en tant qu’objet d’attention commune ou en solitaire, le pointage permet à l’enfant de segmenter le milieu environnant, de singulariser un élément saillant pour lui et d’en faire un référent. Il peut alors parler de cet objet, pour lui, mais bien sûr pour l’autre, le nommer, le demander, le commenter. Son activité de monstration par le pointage lui permet de faire ses premiers pas dans la prédication : il extrait un élément du réel qui l’entoure et l’insère dans une proto-structure syntaxique à au moins deux éléments, un pointage associé à un mot qui peuvent également s’accompagner du regard posé sur l’objet désigné ou sur l’interlocuteur. Pour Clark (1978), les déictiques verbaux employés plus tard par l’enfant sont en continuité naturelle avec le pointage. Selon cette perspective, le pointage correspondrait à un mécanisme de transition au cours de l’acquisition du langage qui favoriserait en particulier l’accès à la combinatoire. En effet, pour Bates et coll. (1977), le pointage facilite l’accès aux combinaisons et donc à la syntaxe. Pour Goldin-


8

Meadow & Butcher (2003), le pointage joue un rôle crucial dans la transition entre les énoncés à un mot et les énoncés à deux mots.

2.2. Premières combinaisons Les combinaisons mot-geste permettent de déclencher la phase des énoncés à deux mots. Goldin-Meadow & Butcher (2003) s’intéressent en particulier aux combinaisons dans lesquelles les mots et les gestes apportent une information sémantique différente et complémentaire et que Clark (1996) appelle « component rather than concurrent ». Ces combinaisons ne sont produites que lorsque les gestes et les mots forment un système bi-modal à part entière. Les deux parties de l’information seraient donc deux éléments d’une même proposition à l’intérieur d’un seul acte communicationnel. L’enfant manifesterait par ces combinaisons mots-gestes complémentaires (Goldin-Meadow les appelle « mismatch » car il n’y a pas redite de la même information) une certaine maturité cognitive et il s’agirait d’une transition vers les énoncés à deux mots. Il est intéressant de faire un parallèle entre ce phénomène de transition au niveau sémantique, qui permet de combiner deux modalités d’expression avec le canal gestuel et visuel utilisés simultanément pour porter deux « sémantèmes » différents, et la réduplication qui joue également un rôle de transition au niveau phonologique et morphologique puisqu’elle permet à l’enfant d’allonger ses productions vocales et verbales. L’enfant utilise deux stratégies, d’une part, il agence simultanément deux unités sémantiques différentes en alliant le geste et le mot, d’autre part, il peut allonger ses énoncés en produisant consécutivement deux fois la même syllabe ou le même mot. L’alliance entre ces deux stratégies (deux formes différentes simultanées, deux formes identiques consécutives) lui permettra ensuite de produire deux formes différentes consécutives et d’intégrer la syntaxe linéaire du langage verbal qui nous contraint à produire des énoncés dans lesquels les éléments vocaux font sens en étant articulés les uns après les autres.

Les compétences pour exprimer plus d’une facette ou plus d’un élément d’un événement dans le même tour de parole en opposition à ce que Scollon (1976) appelle des « constructions verticales » (différents éléments exprimés dans deux tours de parole successifs souvent reconstruits en un énoncé dans les reformulations des parents) sont nécessaires pour que les enfants soient capables de combiner deux mots. Les différentes facettes d’un évènement sont d’abord exprimées grâce à deux modalités complémentaires, un geste et un mot représentants deux éléments différents. Dans les situations de lecture de livre par exemple, un adulte va souvent répéter la construction multimodale composée du mot « regarde » (ou un déictique comme « là ») associé à un geste de pointage sur une partie de l’illustration. Dans l’exemple suivant, Madeleine, reprend exactement la même construction :

Exemple 2. Madeleine 1;01

*MER : oh regarde le petit Popi !

La mère pointe un personnage dans le magazine pour enfant qu’elles sont en train de regarder (Popi). Madeleine regarde le magazine.

*MER : oh il met les pieds dans l'eau ?

Madeleine essaie de tourner la page mais sa mère est toujours en train de lui montrer d’autres éléments dans le même illustration.

*MER : regarde c'est quoi ça ?


9

La mère pointe un élément dans l’image.

*MER: c'est quoi ça ?

*MER: c'est un ?

*MAD: vers.

%pho : vɛʁ

Madeleine tourne la page.

*MER: oh petit ours !

*MAD: regarde.

%pho: œga

Elle pointe un élément dans l’image.

*MER :oui.

Dans cet extrait, Madeleine utilise un geste, le pointage et une suite de phonèmes avec exactement le même patron intonatif répété à plusieurs reprises par sa mère alors qu’elle produit une séquence incomplète de phonèmes pour le mot « regarde » qu’elle a également associé à chaque fois à un pointage. Les enfants entrent très tôt dans la reprise des patrons prosodiques (Konopczynski, 1990) afin de transmettre leurs intentions par un large éventail d’actes de langage (requête, injonction, commentaire) ce qui leur permet de compenser leur système phonologique encore incomplet. Les patrons prosodiques les aident donc à faire la transition entre des vocalisations pré-linguistiques et leurs premiers mots. La transition entre les énoncés multimodaux geste-mot et les énoncés à deux mots est étayée par les stratégies communicationnelles des adultes. Les combinaisons gestes-mots sont très productives entre 1 et 2 ans chez l’enfant, et les parents ont tendance à reformuler verbalement les combinaisons geste-mot en des énoncés « unimodaux » verbaux (Goldin-Meadow, 2009) comme le montre l’exemple suivant.

Exemple 3. (Ellie 1;09).

Robert, l’oncle d’Ellie, montre une pochette de disque dur noire à l’enfant et lui demande de quelle couleur elle est.

Ellie: blue. (bleu)

Elle regarde l’objet et le prend dans ses mains.

Robert: Oh, haussement de sourcils I think it might be black. Oh it’s definitely black.

Ellie: no (.) blue. (non, bleu) pointage sur l’objet

Ellie utilise un pointage pour référer à l’objet. On peut considérer que ce pointage a la même fonction référentielle qu’un pronom anaphorique de 3° personne (it), utilisé par l’adulte (Robert). L’enfant produit un énoncé multimodal équivalent à « no, it’s blue » (non, il est bleu) en produisant deux formes verbales, « no » puis « blue » associées au pointage sur l’objet qui lui permet de référer à l’objet et de transformer l’adjectif « blue » en opération de prédication. Dans l’exemple suivant, le geste est associé à la parole et chaque modalité porte sa propre fonction. La négation est uniquement exprimée par le secouement de tête.


10

Exemple 4 . (Ellie 1;11).

Ellie et sa grand-mère jouent à la poupée. La grand-mère s’occupe de la poupée Maddie et Ellie joue avec sa poupée Susie. La grand-mère prend un biberon et fait semblant de le donner à Maddie.

Ellie: Susie bottle! (biberon Susie) Secouement de tête

Ce geste est habituellement appelé co-verbal, mais on pourrait également considérer que ce sont les paroles produites qui seraient à appeler co-gestuelles. C’est ensemble que les deux modalités concourent à la construction du message. La prédominance du verbal qui à partir de cet âge-là caractérise la majorité des productions d’Ellie, nous incite à subordonner la gestualité à la parole dans notre terminologie, mais pour Ellie, les deux modalités ont à 1;11 des fonctions spécifiques qui assemblées lui permettent de produire un énoncé dans lequel elles sont intégrées pour former une assertion négative. Ces modalités ne sont pas hiérarchisées au départ, mais la communauté linguistique amène l’enfant à privilégier le verbal pour des raisons de commodité dans les pratiques quotidiennes dans un monde où on lui parle en cuisinant, en le nourrissant, en dessinant, en nettoyant, en conduisant. On observe en revanche que le rythme et la densité des interactions langagières des enfants sourds avec leurs parents durant nos tournages est assez différente puisqu’il n’est pas facile de signer en changeant le bébé, en faisant son lit, en lui donnant à manger. On note l’interruption fréquente d’activités en cours au moment des interactions langagières. Au fur et à mesure qu’ils grandissent, les activités langagières des enfants sourds s’adaptent à leur environnement, ils apprennent à signer rapidement, ou d’une main, à esquisser les signes tout en menant certaines activités.

2.3. Gestes co-verbaux Quand l’enfant entendant entre dans le langage verbal, et le manipule de plus en plus, la gestualité semble moins présente, mais des observations fines permettent de constater qu’elle ne disparaît pas et accompagne la parole. Madeleine, à 2;04 maîtrise déjà bien le système phonologique du français, et privilégie la parole, mais sa gestualité lui permet de renforcer ses actes de langage. Dans l’exemple suivant elle utilise le geste épistémique appelé « palm up » (bras écartés, paumes vers le haut) accompagné d’une expression faciale.

Exemple 5. (Madeleine 2;04).

Madeleine joue à la dinette et sert le café à sa maman. Elle fait semblant de renverser du café sur le sol et fait donc semblant de nettoyer le sol à l’aide d’un jouet en forme d’aspirateur qu’elle adore utiliser.

Madeleine: l’a plus l’a plus de café. palm-up bi-manuel.

Elle regarde sa mère.

Mère: ah bah tout va bien.Mais tu m’en ressers parce que moi j’en ai pas bu du coup.

Madeleine: il est où ? palm-up sur la main gauche.

Ses gestes épistémiques accompagnent l’expression de l’absence (« l’a plus de café ») et la demande de localisation (« il est où ? »). Son énoncé multimodal est d’autant plus « grandiloquent » que le café est imaginaire et fait partie d’un jeu symbolique. Elle incarne de manière pluri-sémiotique le jeu avec sa maman et essaie de mettre en scène avec ses actions et ses expressions langagières la présence d’un café versé dans une tasse, renversé, nettoyé alors qu’il est virtuel. C’est le dialogue multimodal et co-construit


11

avec sa mère (« tu m’en ressers, parce que moi j’en ai pas bu du coup ») qui permet de donner de la présence au café. Ce type de négation incarnée de manière quasi théâtrale se retrouve chez Ellie dans l’exemple suivant.

Exemple 6. (Ellie 3;09)

Ellie et sa grand-mère trient les déguisements qui se trouvent dans une grande malle.

Ellie: dress from the dressing-up box. (une robe de la malle à déguisement)

Elle sort un grand vêtement de la malle.

Mère: Wow what’s that Ellie? (Oh là là, qu’est-ce que c’est Ellie ?)

Grand-mère: what is it?(Qu’est-ce que c’est ?)

Ellie: secouement de tête I don’t kno::w! (je ne sais pas) avec beaucoup d’air sur la voix. Retournement de la main droite paume vers le haut.

Nous sommes de nouveau dans une scène de jeu mais le déguisement qui est l’objet du discours est bien présent. Ellie l’a catégorisé comme étant une robe (dress), mais les questions successives posées à la fois par sa mère et sa grand-mère l’amènent à remettre en question sa catégorisation lexicale. Elle produit donc un énoncé multimodal, fortement épistémique, exprimant son manque de savoir à la fois verbalement et gestuellement. Ainsi, entre 2 et 3 ans, chez Madeleine et Ellie, si les gestes ont peut-être moins tendance à être utilisés directement pour référer seuls à un objet ou un événement, ils sont produits en collaboration avec les productions verbales, en particulier quand il s’agit de mettre en scène des fonctions sémantiques ou pragmatiques particulièrement saillantes dans le dialogue en cours. Nous allons nous tourner vers l’examen de la coordination des gestes et de la parole une fois que l’enfant maîtrise le verbal.

3. Vers la maîtrise de la communication multimodale La communication gestuelle ne disparaît pas avec l’apparition de la parole (Marcos, 1998). Elle est même largement utilisée par les adultes en complémentarité avec les productions verbales (Guidetti, 1998). Nos analyses du corpus de Madeleine (Morgenstern et coll., 2010 ; Morgenstern & Parisse, 2012) montrent que les modalités vocales et gestuelles sont associées et se complémentent depuis les premiers pointages, jusqu’à la maîtrise de la parole.

3.1. Retour sur le pointage Nous avons catégorisé tous les gestes de pointage de Madeleine et de sa mère afin de mener des

analyses quantitatives et qualitatives et de suivre leurs fonctions depuis ce que l’on appelle les usages « pré-linguistiques » (avant les premiers mots) jusqu’à leurs usages « co-verbaux ».


12

Graphique 1: Pourcentage des gestes de pointage de Madeleine et de sa mère par rapport au nombre d’énoncés

Comme nous le voyons dans le graphique 1, l’augmentation du nombre d’énoncés de Madeleine sans pointage est spectaculaire : le pourcentage d’énoncés avec pointage atteint plus de 90% à 1;02 pour retomber autour de 2 ans autour de 10% et se stabiliser à un niveau très proche du pourcentage d’énoncés avec pointage de sa mère. Dans une étude précédente, nous avions montré que l’usage des déictiques chez Madeleine est complémenté 100% du temps par des gestes de pointages au début du corpus et seulement 5% vers 2;0 (Mathiot et coll., 2009). Mais le nombre d’occurrences de pointages par heure est en fait toujours très important à la fin du corpus. Madeleine produit 95 gestes de pointages en une heure à 4;01,27 par exemple (graphique 2). La variation est liée à des facteurs contextuels (elle utilise beaucoup de pointages pendant l’activité de lecture par exemple).

Graphique 2: Nombre de pointages par heure dans les productions de Madeleine

Les fonctions des gestes de pointage de Madeleine se diversifient beaucoup tout au long du corpus entre 1 et 4 ans. Ses pointages sont d’abord produits en isolation et ont soit une fonction proto-déclarative (commentaire), soit une fonction proto-impérative (requête). Vers 1 an, ses pointages sont souvent complétés par une production vocale et l’ensemble de la construction pointage + production vocale a

0%10%20%30%40%50%60%70%80%90%100%

1;00.05

1;02.14

1;03.18

1;06.04

1;09.03

1;11.13

2;02.06

2;04.15

2;06.10

2;08.05

2;10.20

3;00.28

3;06.08

4;01.27

MèreMadeleine

0

20

40

60

80

100

120

1;00.05

1;02.14

1;03.18

1;06.04

1;09.03

1;11.13

2;02.06

2;04.15

2;06.10

2;08.05

2;10.20

3;00.28

3;06.08

4;01.27


13

une fonction syncrétique. Vers 1;06, les gestes de pointages sont produits avec des déictiques ou des noms et permettent de localiser clairement les objets montrés ou requis dans l’espace. La construction pointage + nom permet donc à l’enfant d’associer deux fonctions différentes et de désigner ainsi l’objet tout en le localisant. Les productions verbales deviennent ensuite plus complexes : on trouve des prédicats, puis des énoncés à plusieurs termes. Vers 2;0 ans, nous trouvons le premier emploi d’un geste de pointage avec une fonction différente qui pourrait être glosée par « Attention ! ». L’index est levé verticalement et tenu devant le menton. Elle parle à sa poupée et lui dit « faut pas attraper froid » tout en faisant le geste de pointage. Elle commence également à pointer dans l’espace pour désigner des entités absentes. À 2;06, elle pointe vers différents lieux dans l’espace dans des activités de narration fictive. Elle commence également à utiliser des gestes co-verbaux bien plus diversifiés. À 3 ans, ses productions verbales sont de plus en plus complexes et contiennent des propositions subordonnées complétives et relatives. Son système temporel se diversifie et elle traverse la phase que McNeill (2005) appelle « explosion gestuelle » avec une gestualité de plus en plus riche, des expressions faciales marquées et une plus grande maîtrise de la gestion de ses regards. Entre 3 et 4 ans, les fonctions de ses gestes de pointage se diversifient de plus en plus. Elle utilise ses doigts pour compter ses poupées et réfère avec l’index de la main droite aux doigts levés de la main gauche représentant les poupées comme des classificateurs en langue des signes.

À 4 ans, ses pointages sont totalement intégrés dans une gestualité co-verbale fluide et maîtrisée. Les pointages suivent les variations rythmiques de sa prosodie : ses gestes et ses productions verbales sont liés avec une grande subtilité. Elle manifeste une très grande maîtrise de la localisation, l’orientation et les mouvements de ses gestes de pointages, ce qui lui permet d’exprimer des différences formelles entre les fonctions. Elle utilise le pointage pour référer à la durée, pour atténuer un énoncé, pour suspendre une prédication faite verbalement. Par exemple, alors qu’elle s’apprête à aller chercher un déguisement dans sa chambre et se changer, elle interdit à l’observatrice qui est en train de la filmer d’entrer dans la chambre. Elle lève l’index droit près de son menton et dit je dois chercher mon déguisement. Elle commence à marcher vers sa chambre sur la pointe des pieds, son index continue à s’élever vers le haut de son visage dans un geste qui ressemble à ce qui est produit pour demander le silence. Nous avons interprété ce geste co-verbal comme indiquant une atténuation de l’interdit qu’elle met en place vis a vis de l’observatrice avec qui son attitude est par ailleurs habituellement très respectueuse. Ce geste est donc une forme de modalisation de la prohibition. Il lui permet d’exprimer avec subtilité un mélange d’injonction et de respect. A la fin de cette scène elle complète l’ensemble par l’énoncé tu me suis pas hein?

La complexification des pointages de Madeleine permet d’illustrer, de spécifier, de renforcer, de modaliser les significations de ses productions vocales. Les gestes permettent d’enrichir les compétences communicationnelles des enfants bien au-delà de la phase « pré-linguistique » et des premières combinaisons gestes-mots. Ils font partie du système communicationnel multimodal et intersubjectif. Il devient donc de plus en plus compliqué d’analyser les gestes et la parole de manière indépendante. La nature performative, interactionnelle et socio-culturelle du langage implique la coopération des deux modalités qui se soutiennent et se modifient mutuellement.

Il est ainsi nécessaire de comprendre non seulement comment la modalité vocale ou la modalité gestuelle sont utilisées de manière de plus en plus experte par les enfants grâce à l’étayage adulte et aux interactions quotidiennes, mais également comment ces canaux et ces modalités fonctionnent ensemble. Cela nous permettra de mieux comprendre comment les enfants deviennent des sujets énonciateurs multimodaux capables de gérer les interactions en face-à-face avec subtilité. Afin d’illustrer la richesse


14

multimodale de la communication des enfants qui maîtrisent déjà la parole, nous allons analyser un extrait représentatif du corpus de Madeleine.

3.2. Analyse qualitative multimodale d’un extrait en fin de corpus À la fin du corpus longitudinal de Madeleine, alors qu’elle va bientôt fêter ses 7 ans, la petite fille

est capable de raconter à la fois le contenu des évènements et des discours dont elle a été témoin. Dans ses productions liées à l’acte de dépeindre (Streeck, 2008), elle a acquis les compétences pour montrer la situation rapportée à la fois par la modalité vocale et la modalité gestuelle. Dans l’exemple suivant, elle dépeint sa mère qui découvre sur l’agenda électronique de son téléphone qu’elle a un rendez-vous professionnel au moment de la fête d’anniversaire prévue pour Madeleine.

Exemple 7. Madeleine 6;11

*CHI: maman un jour s'est mis(e) devant son téléphone qu' elle s'est mis(e) <han mince> [=! discours rapporté] .

%act: CHI quitte l’observatrice du regard, elle place ses mains devant son visage pour mimer la situation comme si elle tenait un téléphone, puis en disant « mince » porte les deux mains à plat sur sa bouche. Elle reporte ensuite son regard sur OBS au moment de la prise de parole suivante.

*CHI: parce qu'elle avait déjà tout préparé on avait déjà donné les invitations elle dit <han mince j' ai un rendez vous pile à l' heure de ton anniversaire> [=! discours rapporté, le regard se détourne d’abord de OBS puis se reporte directement sur elle au moment où elle dit « ton anniversaire », expressions faciales reproduisant celle qu’elle attribue à sa mère, petits mouvements de la tête, prosodie exagérée] .

*OBS: oui.

*CHI: en fait elle a essayé d(e) régler en fait c'est son collègue qui vient.

%act: CHI fait un geste en disant « régler » jusqu’à la fin de l’énoncé les deux mains écartées, index et pouces tendus, autres doigts repliées, mouvement cyclique des mains.

*OBS: ah donc elle pourra être là.

*CHI: oui parce-qu' elle était là <non mais moi j(e) veux voir tes copines hein> [=! discours rapporté, changement de voix, regard quitte OBS, expressions faciales imitant celles qu’elle attribue à sa mère avec énervement].

*OBS: +< ouf !

*OBS: 0 [=! petit rire] .

*CHI: +< <je veux être là> [=! discours rapporté, continuation des expressions faciales, petits gestes saccadés des mains].

La première instance de discours rapporté attribué à sa mère n’est pas introduite par un verbe quotatif : elle utilise des marqueurs non-segmentaux pour indiquer que l’origine énonciative a changé, un changement de voix et une gestualité accentuée avec des expressions faciales spécifiques, et son interlocutrice la comprend parfaitement. Son utilisation du regard pour changer de perspective est particulièrement intéressante, elle quitte l’observatrice du regard au moment où elle prend le rôle de sa mère, dans un transfert personnel qui rappelle ce que Cuxac (2000) décrit dans les narrations en langue des signes française. L’alternance des regards est très cohérente pendant l’ensemble de la séquence. Le


15

regard sur l’interlocutrice indique qu’elle est dans l’espace du discours. Le regard qui quitte l’observatrice et se porte soit sur les mains « tenant » le téléphone, soit dans l’espace pour jouer son rôle alors qu’elle fait des expressions faciales exagérées, exprime qu’elle entre dans l’espace de sa narration. À l’intérieur de cet espace d’ailleurs, au moment où elle joue le rôle de sa mère s’adressant à elle-même Madeleine, la petite narratrice porte son regard dans les yeux de OBS et lui assigne ainsi son propre rôle d’interlocutrice au moment où a eu lieu l’évènement : OBS devient Madeleine, alors que Madeleine joue sa mère. La voix de Madeleine devient celle de sa mère exprimée par une prosodie plus aigüe, le corps de Madeleine incarne celui de sa mère avec ses gestes et ses expressions faciales. On remarque par ailleurs dans ce passage combien certaines constructions multimodales sont utilisées de manière automatique par Madeleine comme le « han mince » accompagné d’un geste des mains sur la bouche et d’une expression faciale, ou le geste assez sophistiqué impliquant une configuration, une localisation et un mouvement cyclique particuliers qui accompagne le verbe « régler ». À la fin de notre suivi longitudinal, Madeleine est devenue une énonciatrice experte, qui maîtrise les différentes fonctions de chaque modalité et qui manie les constructions multimodales pour exprimer à la fois sa propre subjectivité et celle qu’elle est capable d’attribuer aux autres.

Conclusion Les enfants ont dès le plus jeune âge des compétences cognitives qui leur permettent d’analyser le bain de langage qui les entoure et guide ainsi leurs propres usages. Ils assemblent les éléments des structures sans avoir cependant la maîtrise de la complexité de chaque marqueur grammatical, chaque geste, chaque schéma intonatif et chaque construction multimodale. Ils élaborent des systèmes transitoires créatifs (Cohen, 1924), qui contiennent des « erreurs » et des déviances par rapport au système adulte. Il leur faut un certain temps pour apprendre à utiliser toutes les formes conventionnelles. Mais grâce à leur exposition au langage adulte, leurs productions langagières se développent progressivement et se rapprochent des formes standard. Ils sont capables de se rectifier eux-mêmes (Morgenstern et coll., 2013), d’internaliser le rôle des adultes, de s’approprier les outils linguistiques, les codes sociaux et les comportements qui sont intégrés au langage dans et grâce au dialogue. Dans les communautés linguistiques que nous avons prises en exemple tout au long de ce chapitre (France et Angleterre), la mise en place pluri-sémiotique des outils grammaticaux et des constructions gestuelles et vocales a lieu grâce à la collaboration entre adultes et enfants en fonction de leur ancrage dans chaque contexte de production. Pour analyser l’entrée des enfants dans la langue, il nous paraît donc important d’utiliser les outils conceptuels d’une grammaire de construction multimodale. Ces outils permettent de prendre en compte toutes les ressources sémiotiques que les adultes apportent et dont les enfants se saisissent tout au long de leur développement en fonction de leur maturité cognitive et linguistique pour devenir des sujets énonciateurs multimodaux capables d’ajuster les formes utilisées aux interlocuteurs, aux interactions et aux situations spécifiques auxquelles ils participent.

Bibliographie ARBIB Michael A., 2012, How the Brain got Language, the Mirror System Hypothesis, Oxford, New-York, Oxford University Press.


16

BATES Elisabeth, 1976, Language and Context: The Acquisition of Pragmatics. New York, Academic Press. BATES Elisabeth, 1977, From gesture to the first word: on cognitive and social prerequisites. In Lewis M.

et Rosenblum L. (eds), Interaction, conversation and the development of language. New-York, Wiley, p. 247-307.

BATES Elizabeth, BENIGNI Laura, BRETHERTON Inge, CAMAIONI Luisa, VOLTERRA Virginia, 1977, ‘From Gesture to the First Word: On Cognitive and Social Prerequisites’, in Interaction, Conversation, and the Development of Language, ed. by M Lewis and L Rosenblum, New York, Wiley, p. 247–307.

BATES Elisabeth, BENIGNI Laura, BRETHERTON Inge, CAMAIONI Luisa & VOLTERRA Virginia, 1979, The emergence of symbols: Cognition and communication in infancy. New York: Academic Press. Bates, E., Bretherton, I. & Snyder, L. (1988). From first words to grammar : Individual differences and dissociable mechanisms. New York, Cambridge University Press.

BEAUPOIL-HOURDEL Pauline, 2015, Acquisition et expression multimodale de la négation. Manuscrit de thèse, Sorbonne Nouvelle-Paris 3.

BROWN, Roger, 1973, A first language: The early stages, Cambridge, MA, Harvard University Press. BRUNER, Jerome, 1975, The ontogenesis of Speech Acts. Journal of Child Language, 2, p. 1-19. BRUNER Jerome, 1983, Child Talk :learning to use language, New York, Norton. BUDWIG Nancy, 1995, A developmental-functionalist approach to child language, Mahwah, NJ,

Erlbaum. BUTTERWORTH F. G., 1991, The ontogeny and philogeny of joint visual attention, in A. Whiten (eds),

Natural theories of mind, Oxford, Basil Blackwell, p. 223-232. BUTTERWORTH F. G., 2003, Pointing is the Royal Road to Language for Babies, in Sotaro Kita (ed),

Pointing: where Language, Culture, and Cognition Meet, Hillsdale, New-Jersey, Erlbaum. CABREJO-PARRA Evelio, 1992, Deixis et opérations symboliques, in L. Danon-Boileau & M.- A. Morel

eds, La Deixis, Paris, P.U.F. CHOMSKY Noam, 1959, Review of Verbal Behavior by B.F. Skinner, Language 35, p. 26-58. CIENKI Alan, 2012, Usage events of spoken language and the symbolic units we (may) abstract from

them. In Janusz Badio & Krzysztof Kosecki (eds.), Cognitive processes in language, p. 149–158. Bern, Peter Lang.

CIENKI Alan, (sous presse), Utterance Construction Grammar (UCxG) and the variable multimodality of constructions, Linguistics Vangard.

CLARK Eve V., 2003, First language acquisition, Cambridge, Cambridge University Press. COHEN Marcel, 1924, Sur les langages successifs de l’enfant, in: Mélanges linguistiques offerts à M. J.

Vendryès par ses amis et ses élèves, Paris, Champion, collection publiée par la société de linguistique, XVII, 109-127.

CRYSTAL David, FLETCHER Paul, GARMAN Michael, 1976, The grammatical analysis of language disability, London, Edward Arnold.

CULIOLI Antoine, 1990, Pour une lingusitique de l’énonciation – Opérations et représentations (Tome 1), Ophrys, coll. L’homme dans la langue.

CUXAC Christian, 2000, La langue des signes française ; Les voies de l'iconicité. Faits de Langues 15/16, Paris, Ophrys.

DARWIN Charles, 1972, The Expression of the Emotions in Man and Animals, Londres, John Murray. DARWIN Charles, 1877, A Biographical Sketch of an Infant, Mind 2, p. 285-294. DE LAGUNA Grace, 1927, Speech: Its function and development, New Haven, Yale University Press.


17

GOLDBERG, Adele, 1995, Constructions: A Construction Grammar Approach to Argument Structure, Chicago, University of Chicago Press.

GOLDBERG, Adele, 2006, Constructions at Work: The Nature of Generalization in Language, Oxford, Oxford University Press.

GOFFMAN Erving, 1963, Behavior in public places. New York, Free Press. GOLDIN-MEADOW Susan, BUTCHER Cynthia, 2003, Pointing toward two-word speech in young children,

in: S. Kita (ed.), Pointing: Where language, culture, and cognition meet, Mahawa, NJ, Erlbaum, p. 85-107.

GOLDIN-MEADOW, Susan, 2009, How gesture promotes learning throughout childhood, Child Developmental Perspective 3 (2), p. 106–111.

GOODWIN Charles, 1986, « Gestures as a resource for the organization of mutual orientation », Semiotica, 62(1- 2), p. 29–50.

GOODWIN Charles, 1994, Recording human interaction in natural settings. Pragmatics, p. 181—209. GOODWIN Charles, 2013, « The co-operative, transformative organization of human action and

knowledge ». Journal of Pragmatics, 46(1), p. 8–23. GUIDETTI Michèle, 1998, Les usages des gestes conventionnels chez les enfants, dans Josie Bernicot et

al., De l’usage des gestes et des mots chez l’enfant, Paris, Armand Colin, p. 27-50. HEATH Christian, 1996, Body movement and speech in medical interaction. Cambridge, Cambridge

University Press. INGRAM David, 1989, First langugage acquisition. Method, Description and Explanation, Cambridge,

Cambridge University Press. KONOPCZYNSKI Gabrielle, 1990, Le Langage Émergent: Caractéristiques Rythmiques, Hamburg, Buske. KRESS Gunther, 2010, Multimodality: A Social Semiotic Approach toContemporary Communication.

London, Routledge. LABOV William, 1972, Sociolinguistic Patterns. Philadelphia, University of Pennsylvania Press. LEVINSON Steven, 2006, ‘On the human "interaction engine"’. In N. J. Enfield, & S. C. Levinson

(Eds.), Roots of human sociality: Culture, cognition and interaction, p. 39-69, Oxford, Berg. LINELL Per, 2005, The written language bias in linguistics, Londres, Routledge. MACWHINNEY Brian, 2000, The CHILDES Project: Tools for analyzing talk, vol. 2: The Database,

Mahwah, NJ, Erlbaum. MARCOS Haydée, 1998, De la communication prélinguistique au langage: formes et fonctions, Paris,

L’Harmattan. MATHIOT Emmanuelle, LEROY Marie, MORGENSTERN Aliyah, 2009, « Premiers pointages chez l’enfant

entendant et l’enfant sourd-signeur: deux suivis longitudinaux entre 7 mois et 1 an 7 mois », dans Sandra Benazzo (ed.), Au croisement de différents types d’acquisition: pourquoi et comment comparer, AILE-LIA N°1, p. 141-168.

MCNEIL David, 2005, Gesture and Thought, Chicago, Chicago University Press. MONDADA Lorenza, 2006, Video recording as the reflexive preservation and configuration of

phenomenal features for analysis. Dans Knoblauch H, Raab J, Soeffner HG, Schnettler B, editors. Video analysis. Bern, Lang, p. 51—68.

MORGENSTERN Aliyah, PARISSE Christophe, 2007, « Codage et interprétation du langage spontané d'enfants de 1 à 3 ans », Corpus n°6 “Interprétation, contextes, codage,” p. 55-78.

MORGENSTERN Aliyah, PARISSE Christophe, 2012, “The Paris Corpus”, French Language Studies 22(1), p. 7-12.


18

MORGENSTERN Aliyah, 2006, Un JE en construction. Ontogenèse de l’auto-désignation chez l’enfant, Bibliothèque de Faits de langues, Ophrys.

MORGENSTERN Aliyah, 2009, L’enfant dans la langue, Paris, Presses de la Sorbonne Nouvelle. MORGENSTERN Aliyah, CAËT Stéphanie, BLONDEL Marion, Limousin Fanny, Leroy-Collombel Marie,

2010, “From gesture to sign and from gesture to word: pointing in deaf and hearing children”, Gesture 10: 2-3, p. 172-202.

MORGENSTERN, Aliyah, LEROY-COLLOMBEL Marie, CAËT Stéphanie, 2013, ‘Self- and Other-Repairs in Child–adult Interaction at the Intersection of Pragmatic Abilities and Language Acquisition’, Journal of Pragmatics, The Pragmatic-Discursive Dimension of Grammar Acquisition, 56 (2013), p. 151–67.

MORGENSTERN Aliyah, 2014, ‘Children’s Multimodal Language Development’, dans Manual of Language Acquisition, eds. Christiane Fäcke, Berlin-Boston, de Gruyter, p. 123–42.

MÜLLER Cornelia, 2009, Gesture and Language, in: Kirsten Malmkjaer (ed.), Routledge’s Linguistics Encyclopedia, London, Routledge, p. 214-217.

OCHS Elinor, 1979, « Transcription as theory ». In E. Ochs & B. Schieffelin, Developmental Pragmatics. New York, Academic Press, p. 43-72.

PARISSE Christophe, MORGENSTERN Aliyah, 2010, A multi-software integration platform and support for multimedia transcripts of language. LREC 2010, Proceedings of the Workshop on Multimodal Corpora: Advances in Capturing, Coding and Analyzing Multimodality, p. 106-110.

PAVLOVITCH Mikhail, 1920, Le langage enfantin, acquisition du serbe et du français par un enfant serbe, Paris, Champion.

PETERS, Ann, 1980, The units of language acquisition, University of Hawaii Working Papers, Linguistics 12, 1:1-72.

PIAGET, Jean, 1923, Le langage et la pensée chez l’enfant, Neuchâtel, Delachaux & Niestlé. REMILLET Gilles, 2011, « Filmer les pratiques de soin dans la consultation médicale en acupuncture. Une

approche ethno- cinématographique », Ethnologies, 33(2), p. 99—121. ROMANES Georges, 1889, L’évolution mentale chez l’homme. Origine des facultés humaines, Paris, Alcan. SACKS Harvey, 1994, « Notes on methodology », dans Atkinson JM, Heritage J, editors. Structures of

social action. Cambridge, Cambridge University Press, p. 21—7 [édité par Gail Jefferson]. SANSAVINI Alessandra et al. 2010, “Early development of gestures, object-related actions, word

comprehension and word production, and their relationships in Italian infants”, Gesture 10: 1, p. 52-85.

SCOLLON Robert, 1976, Conversations with a one-year old: A case study of the developmental foundations of syntax, Honolulu, University Press of Hawaii.

STERN Clara, STERN William (1907), Die Kindersprache – Eine psychologische Untersuchung, Leipzig, Barth (reedition 1928).

STRAUSS Anselm, GLASER Barney, 1967, La découverte de la théorie ancrée. Stratégie pour la recherche qualitative. Paris, Colin.

STREECK Jurgen, 2008, Depicting by gestures. Gesture 8:3, p. 285–301. TAINE Hyppolyte, 1876, « L'acquisition du langage chez les enfants et dans l'espèce humaine ». Revue

Philosophique de la France et de l'Etranger, 1, p. 357-395. TOMASELLO Michael, 1999, The cultural origins of human cognition, Cambridge, MA, Harvard. TOMASELLO Michael, 2003, A Usage-Based Theory of Language Acquisition, Cambridge, MA, Harvard

University Press. TOMASELLO, Michael, STAHL Daniel, 2004, « Sampling children’s spontaneous speech : how much is

enough ? » Journal of Child Language, 31, p. 101-121.


19

TOMASELLO Michael, 2002, « Why Apes don’t point ? » dans N.J. Enfield & S.C. Levinson (eds.) Roots of Human Sociality. Culture, Cognition and Interaction, Oxford, New-York, Berg, p. 506-524.

VYGOTSKY Lev, 1934, Pensée et langage (traduction française 1997), Paris, La Dispute. WERNER Heinzernard, KAPLAN B, 1963, Symbol formation. Hillsdale, NJ: Lawrence Erlbaum Associates. ZLATEV Jordan, 1997, Situated Embodiment, Studies in the Emergence of Spatial Meaning, Stockholm,

Gotab Press.

Documents

Le développement multimodal du langage de l’enfant : des