COMPREHENSION DE LA PAROLE DANS LA PAROLE - Les thèses …

Université Lumière Lyon 2 - Université de Lyon

Ecole doctorale Neurosciences et Cognition

Thèse en vue de l’obtention du titre de Docteur en Psychologie Cognitive

COMPREHENSION DE LA PAROLE DANS LA PAROLE :

UNE APPROCHE INTER-LANGUES POUR EVALUER LES

INTERFERENCES LINGUISTIQUES DURANT LA COMPREHENSION

Aurore GAUTREAU

Sous la direction de Fanny MEUNIER

Composition du jury :

Dr Josiane BERTONCINI (examinateur)

Dr Christian FULLGRABE (rapporteur)

Dr Fanny MEUNIER (directrice de thèse)

Dr Jean-Luc SCHWARTZ (examinateur)

Pr Elsa SPINELLI (rapporteur)

Soutenue le 20 Décembre 2013

1

REMERCIEMENTS

Je remercie chaleureusement ma directrice de thèse, Fanny Meunier, de la confiance

qu’elle m’a accordée pour travailler sur ce projet de recherche qui m’a tant plu. Merci pour

tout ce que vous m’avez appris.

Je remercie également Michel Hoen, pour sa collaboration sur ce projet de recherche. Merci

de m’avoir fait progresser.

Un grand merci à Josiane Bertoncini, Christian Füllgrabe, Jean-Luc Schwartz et Elsa Spinelli,

d’avoir montré de l’intérêt pour mon travail de thèse en acceptant de faire partie du jury.

Je remercie Olivier Bertrand de m’avoir accueillie au sein du Centre de Recherche en

Neurosciences de Lyon, ainsi que Tatjana Nazir de m’avoir accueillie au sein du Laboratoire

sur le Langage, le Cerveau et la Cognition (L2C2).

Merci à Martine Theillère et à Christiane Battoue pour leur disponibilité et leur gentillesse.

Mille mercis aux membres du groupe SpiN, pour leur aide et pour les échanges que nous

avons eus.

Merci à tous les étudiants, doctorants, chercheurs et autres membres du L2C2 pour leur bonne

humeur et leurs sourires.

Je remercie Daniel Zagar de m’avoir donné l’envie de faire de la recherche.

Merci à tous les volontaires qui ont participé à mes études, ainsi qu’à tous les locuteurs des

différentes langues que j’ai enregistrés.

Merci Stéphane, pour ton amitié.

Je remercie infiniment mes parents, mon frère, mes grands-parents et Sofiane pour leur

présence et leur soutien.

Ce travail de thèse a été réalisé grâce à une allocation de recherche financée par la

Délégation Générale de l’Armement conjointement avec l’ERC (European Research

Council) dans le cadre du projet SpiN n° 209234 dirigé par Fanny Meunier.

Résumé

2

RESUME

Cette thèse s’est intéressée aux interférences linguistiques intervenant dans la situation

de la parole dans la parole, en comparant l’effet de masque de masqueurs paroliers générés

dans une langue intelligible pour les participants (français) à celui de masqueurs paroliers

générés dans des langues non connues (gaélique irlandais et italien), sur l’identification de

mots cibles français. Une tâche de décision lexicale à -5 dB nous a permis d’observer des

résultats significativement différents entre les masqueurs paroliers générés dans les langues

inconnues (irlandais et italien), avec les masqueurs paroliers italiens qui ont réduit

l’intelligibilité des mots cibles français avec la même efficacité que les masqueurs paroliers

français, alors que les masqueurs paroliers irlandais ont conduit aux performances les plus

élevées. L’utilisation de masqueurs de bruit fluctuant générés à partir de chacun des

masqueurs paroliers, a montré que seuls les masqueurs paroliers générés dans une langue

intelligible ont produit des interférences linguistiques de haut niveau en plus d’interférences

acoustiques et linguistiques de bas niveau. Ainsi, la différence de performances observée

entre les masqueurs paroliers irlandais et italiens serait expliquée au niveau acoustique et non

à un niveau linguistique. De plus, bien que les masqueurs paroliers italiens et français aient eu

des effets de masque équivalents, leurs interférences étaient de natures différentes. Lorsque

l’italien devient intelligible pour les participants, les masqueurs paroliers italiens, comme

ceux générés en français, produisent des interférences linguistiques de haut niveau, et ce, que

les mots cibles soient produits dans la langue native des participants ou dans leur langue

seconde.

Mots-clés : compréhension de la parole dans la parole, inter-langues, bruit fluctuant,

interférences linguistiques de haut niveau, tâche de décision lexicale, accès au lexique, langue

seconde.

Abstract

3

ABSTRACT

This research aimed to explore the linguistic interference that occurs during the

speech-in-speech situation, by comparing the masking effects of speech backgrounds that

were produced in an intelligible language for the participants (i.e., French), to the masking

effects of speech backgrounds that were produced in unknown foreign languages (i.e., Irish

and Italian), on the identification of French target words. At -5 dB SNR, a lexical decision

task revealed significantly divergent results with the unknown languages (i.e., Irish and

Italian), with Italian and French speech backgrounds hindering French target word

identification to a similar extent, whereas Irish speech backgrounds led to significantly better

performances. Using fluctuating noise backgrounds derived from each speech background

signals, showed that only the speech backgrounds generated in an intelligible language (i.e.,

French) produced linguistic interference of high level in addition to acoustic interference and

linguistic interference of low level. Thus, the difference observed between the speech

backgrounds in Irish and Italian can be explained at an acoustic level but not at a linguistic

level. Moreover, although the speech backgrounds in French and in Italian had equivalent

masking effects on French word identification, the nature of their interference was different.

When Italian became intelligible to the participants, the speech backgrounds in Italian

produced linguistic interference of high level like those generated in French, with the target

words produced in the native language to the participants or in their second language.

Key-words: speech-in-speech comprehension, multilingual, fluctuating noise, linguistic

interference of high level, lexical decision task, lexical access, second language.

Table des matières

4

TABLE DES MATIERES

REMERCIEMENTS .................................................................................................................. 1

RESUME .................................................................................................................................... 2

ABSTRACT ............................................................................................................................... 3

TABLE DES MATIERES ......................................................................................................... 4

PREAMBULE ............................................................................................................................ 7

PARTIE THEORIQUE ............................................................................................................ 10

A) LES MODELES DE TRAITEMENT DU LANGAGE PARLE .................................. 12

1. Le modèle de la Cohorte ............................................................................................ 12

1.1. Cohort I (Marslen-Wilson & Welsh, 1978) ....................................................... 12

1.2. Cohort II (Marslen-Wilson, 1987, 1990) ........................................................... 13

2. Le modèle TRACE (McClelland & Elman, 1986) .................................................... 14

3. Le modèle Short List (Norris, 1994) ......................................................................... 16

4. Le modèle NAM (Luce, Pisoni & Goldinger, 1990) ................................................. 17

5. Conclusions ............................................................................................................... 18

B) LA SITUATION DE LA PAROLE DANS LA PAROLE ........................................... 20

1. Deux types d’effets de masque .................................................................................. 20

1.1. Définition de l’effet de masque énergétique ...................................................... 20

1.2. Définition de l’effet de masque informationnel ................................................. 21

2. Ségrégation des signaux concurrents ......................................................................... 21

2.1. Rapport Signal sur Bruit (RSB) ......................................................................... 21

2.2. Nombre de locuteurs dans le masqueur .............................................................. 22

2.3. Fréquence fondamentale (F0) ............................................................................. 25

2.4. Localisation spatiale ........................................................................................... 28

3. Effet de masque informationnel ................................................................................ 30

3.1. Manipuler la nature des masqueurs .................................................................... 30

3.1.1. Bruit stationnaire ......................................................................................... 30

3.1.2. Bruit fluctuant ............................................................................................. 31

3.2. Manipuler le style parolier des masqueurs ......................................................... 36

3.3. Manipuler la langue des masqueurs ................................................................... 38

4. Interférences linguistiques ......................................................................................... 41

Table des matières

5

4.1. Interférences lexicales ........................................................................................ 41

4.2. Interférences sémantiques .................................................................................. 42

C) INTELLIGIBILITE DE LA PAROLE DANS UNE LANGUE SECONDE ............... 44

1. Intelligibilité d’une L2 dans le silence ...................................................................... 44

1.1. Difficulté à différencier certains sons ................................................................ 44

1.2. Plus de compétiteurs ........................................................................................... 46

2. Intelligibilité d’une L2 dans le bruit .......................................................................... 49

2.1. Plus difficile dans une L2 que dans une langue native ...................................... 49

2.2. Masqueurs paroliers dans une L2 versus dans une langue native ...................... 52

D) SYNTHESE ET PROBLEMATIQUE GENERALE .................................................... 56

1. Synthèse ..................................................................................................................... 56

2. Problématique ............................................................................................................ 57

PARTIE EXPERIMENTALE .................................................................................................. 60

E) EXPERIENCE 1 ........................................................................................................... 62

1. Objectifs ..................................................................................................................... 62

2. Méthode ..................................................................................................................... 64

3. Résultats ..................................................................................................................... 69

4. Discussion .................................................................................................................. 72

F) EXPERIENCE 2 ........................................................................................................... 80

1. Objectifs ..................................................................................................................... 80

2. Méthode ..................................................................................................................... 82

3. Résultats ..................................................................................................................... 86

4. Discussion .................................................................................................................. 88

G) EXPERIENCE 3 ........................................................................................................... 95

1. Objectifs ..................................................................................................................... 95

2. Méthode ..................................................................................................................... 95

3. Résultats ..................................................................................................................... 98

4. Discussion ................................................................................................................ 102

H) EXPERIENCE 4 ......................................................................................................... 109

1. Objectifs ................................................................................................................... 109

2. Méthode ................................................................................................................... 109

3. Résultats ................................................................................................................... 111

4. Discussion ................................................................................................................ 114

Table des matières

6

I) BILAN DES EXPERIENCES 1, 2, 3 & 4 .................................................................. 118

J) EXPERIENCE 5 ......................................................................................................... 123

1. Objectifs ................................................................................................................... 123

2. Méthode ................................................................................................................... 124

3. Résultats ................................................................................................................... 125

4. Discussion ................................................................................................................ 128

5. Comparaison des Expériences 3 & 5 ....................................................................... 133

K) EXPERIENCE 6 ......................................................................................................... 139

1. Objectifs ................................................................................................................... 139

2. Méthode ................................................................................................................... 140

3. Résultats ................................................................................................................... 141

4. Discussion ................................................................................................................ 145

5. Comparaison des Expériences 5 & 6 ....................................................................... 150

DISCUSSION GENERALE .................................................................................................. 156

CONCLUSION ...................................................................................................................... 170

REFERENCES ....................................................................................................................... 171

ANNEXES ............................................................................................................................. 181

ANNEXE 1 : Matériel expérimental de l’Expérience 1 ..................................................... 182

ANNEXE 2 : Matériel expérimental de l’Expérience 2 ..................................................... 183

ANNEXE 3 : Matériel expérimental des Expériences 3 à 6 ............................................... 184

ANNEXE 4 : Matériel expérimental des Expériences 3 à 6 (suite) ................................... 185

ANNEXE 5 : Liste des Tableaux ....................................................................................... 186

ANNEXE 6 : Liste des Figures .......................................................................................... 188

Préambule

7

PREAMBULE

La compréhension de la parole est une tâche naturelle et nous la réalisons de façon

automatique ; cependant, elle reste complexe. D’une part, le signal de parole est caractérisé

par une grande variabilité. Il peut être produit dans une même langue avec des accents

régionaux différents, il peut aussi être produit avec un débit plus ou moins rapide ; enfin, des

erreurs de prononciation peuvent être commises. D’autre part, la parole est rarement perçue

dans des conditions optimales puisque du bruit environnant est souvent présent, réduisant

ainsi l’intelligibilité du message cible. Ce bruit concurrent peut être d’origine purement

acoustique lorsqu’il s’agit par exemple de bruits de la rue, il peut aussi être porteur

d’informations linguistiques et acoustiques, notamment lorsqu’une discussion a lieu à

proximité. Dans ce travail de thèse, nous nous intéresserons à la compréhension de la parole

lorsque cette dernière sera présentée simultanément avec un autre bruit de parole.

La situation de la parole dans la parole a souvent été utilisée afin d’étudier les

phénomènes de ségrégation entre les signaux de parole en compétition. Dans cette thèse, c’est

sous un autre angle que nous nous sommes intéressés à cette situation d’écoute ; nous avons

décidé d’examiner les interférences produites par la parole concurrente sur l’intelligibilité de

la parole cible. Lorsque la ségrégation entre les signaux de parole concurrents est ardue, il

arrive que les informations acoustiques et linguistiques présentes dans la parole concurrente

perturbent la compréhension du message cible. La parole concurrente produit alors deux types

d’interférences : des interférences acoustiques et des interférences linguistiques. Nous nous

focaliserons en particulier sur les interférences linguistiques.

Lorsque l’auditeur tente d’identifier un message cible, les informations linguistiques de la

parole concurrente ne sont pas pertinentes. Par conséquent, elles vont interférer sur

l’intelligibilité du message cible dans la mesure où elles vont être traitées en même temps que

les informations linguistiques de la parole cible.

L’identification d’un signal de parole correspond à l’appariement de ce dernier aux

représentations de mots stockés en mémoire. Les modèles psycholinguistiques du traitement

du langage parlé, élaborés sur la base de résultats obtenus dans le silence, postulent que

l’identification d’un signal de parole résulte de compétitions entre différentes unités

linguistiques. Ainsi, dans la situation de la parole dans la parole, lorsque le message cible et la

Préambule

8

parole concurrente sont perçues, il est possible que des compétitions linguistiques aient lieu

pendant le processus d’identification de chacun des signaux (message cible et parole

concurrente).

Quelques études s’intéressent aux compétitions linguistiques entre les signaux de

parole concurrents et cherchent à identifier quels types d’unités linguistiques interfèrent avec

l’identification de la parole cible. Jusqu’à présent, des interférences au niveau lexical ont été

mises en évidence en manipulant la langue de la parole concurrente (Van Engen & Bradlow,

2007). Cette dernière correspond à la langue native des participants ou à une langue qui leur

est inconnue et donc non intelligible. Lorsque la parole concurrente est produite dans la

langue native, les mots qui la composent sont intelligibles, ils sont identifiés et confondus

avec les mots du message cible. Dans cette thèse, nous manipulerons la langue de la parole

concurrente afin de déterminer si des compétitions au niveau phonémique ont lieu.

Organisation de la partie théorique

La partie théorique sera composée de trois parties. Dans la première partie, nous

commencerons par présenter certains modèles psycholinguistiques du traitement du langage

parlé. Nous observerons de quelles façons ces modèles envisagent les compétitions entre les

différentes unités linguistiques. Dans la seconde partie, nous présenterons des travaux

existants sur la situation de la parole dans la parole. Nous ferons un point des connaissances

actuelles sur cette situation d’écoute et nous verrons que plusieurs paramètres peuvent être

manipulés afin de mieux la cerner. Enfin, dans la dernière partie, nous nous intéresserons à la

situation spécifique de la parole dans la parole lorsque le message cible est produit dans une

L2 plutôt que dans une langue native.

Organisation de la partie expérimentale

Dans la partie expérimentale, nous présenterons six expériences menées au cours de la

thèse. Pour chacune d’elles, il était question d’explorer les interférences linguistiques

produites par la parole concurrente et de déterminer dans quelle situation d’écoute elles sont

les plus efficaces. Dans l’Expérience 1, nous avons pris pour base le paradigme expérimental

développé dans l’étude de Van Engen & Bradlow (2007), la parole concurrente était produite

Préambule

9

dans la langue native des participants, comme le signal cible, ou dans une langue inconnue. Il

s’agissait de répliquer les résultats de cette étude avec de la parole cible produite en français

plutôt qu’en anglais. Dans les Expériences 2 à 4, nos objectifs étaient d’une part d’optimiser

le paradigme expérimental utilisé afin d’explorer la situation de la parole dans la parole, et

d’autre part, de repérer si les phonèmes présents dans les signaux de parole concurrents

entrent en compétition. Dans les Expériences 5 & 6, nous avons fait varier le niveau de

connaissances des participants pour la langue de la parole concurrente. Nous avons utilisé la

langue native des participants et leur langue seconde (L2) en tant que langues intelligibles.

L’Expérience 6 nous a également permis d’étudier la situation de la parole dans la parole

lorsque le message cible est produit dans une L2.

10

PARTIE THEORIQUE

11

Partie théorique Les modèles de traitement du langage parlé

12

A) LES MODELES DE TRAITEMENT DU LANGAGE PARLE

La compréhension du langage parlé résulte de la reconnaissance presque immédiate

des mots ; celle-ci étant décrite comme un appariement entre le signal de parole qui est perçu

et les représentations linguistiques stockées en mémoire. Au cours de cet appariement, des

compétitions entre des unités linguistiques ont lieu ; celles-ci sont décrites dans plusieurs

modèles psycholinguistiques qui rendent compte de la reconnaissance du langage parlé dans

le silence. Dans cette partie, nous présenterons le modèle de la Cohorte dans sa version

originale (Marslen-Wilson & Welsh, 1978) et sa version révisée (Marslen-Wilson, 1987,

1990), ainsi que les modèles TRACE (McClelland & Elman, 1986), Short List (Norris, 1994)

et NAM (Luce, Pisoni & Goldinger, 1990). Nous retrouverons un point commun entre les

modèles, tous postulent qu’à la présentation d’un signal de parole, deux opérations de base se

mettent en place : l’activation de candidats lexicaux compatibles avec le signal de parole, puis

la sélection du candidat qui s’apparie le mieux avec l’information du signal. Nous nous

intéresserons à la façon dont chacun d’eux envisage les compétitions entre les unités

linguistiques. Ceci attirera particulièrement notre attention puisque dans cette thèse, nous

examinerons les compétitions linguistiques pendant la compréhension de la parole dans la

parole, c’est-à-dire dans une situation où le signal de parole n’est pas présenté dans le silence

mais simultanément avec d’autres signaux de parole.

1. Le modèle de la Cohorte

1.1. Cohort I (Marslen-Wilson & Welsh, 1978)

Le modèle de la Cohorte version I, aussi appelé « Active Direct Access Model », est le

premier modèle spécifique au traitement du langage parlé. L’unité linguistique intermédiaire

entre le signal de parole et les entrées lexicales est le phonème. Ce modèle accorde un statut

privilégié au début des mots, en ce sens qu’il considère que seule l’information portée par les

premiers phonèmes du signal de parole va entraîner l’activation des candidats lexicaux. De

plus, Cohort I met l’accent sur le déroulement temporel de l’accès au lexique ; le signal de

parole est analysé de façon séquentielle et continue, c’est-à-dire au fur et à mesure qu’il arrive

au système perceptif. Ce modèle propose que l’identification d’un mot se déroule en deux


13

phases : la phase de contact et la phase de sélection. A l’apparition d’un signal de parole, le

premier phonème de ce signal est traité. Un ensemble de candidats lexicaux commençant par

ce phonème va alors être activé pour former la « cohorte ». Ne peuvent avoir le statut de

candidats lexicaux que les mots qui s’apparient parfaitement avec le premier phonème du

signal ; le modèle ne tolère aucune déviation du signal de parole. Puis, au fur et à mesure de la

progression du signal, les candidats qui ne sont plus compatibles au signal vont être éliminés,

la « cohorte » va ainsi se réduire jusqu’à ce qu’il ne reste plus qu’un seul candidat. Cette

phase de sélection s’effectue ainsi par un processus bottom-up, de bas en haut, c’est

l’information entrante (informations sensorielles) qui désactive les candidats lexicaux.

Lorsqu’il ne reste plus qu’un seul candidat, on parle du point de reconnaissance du mot, ou

point d’unicité. Celui-ci peut se situer avant la fin du signal de parole. Par exemple, la

séquence de phonèmes /kroko/ est suffisante pour identifier le mot « crocodile », en effet dans

la langue française, il n’y a pas d’autre mot commençant par cette séquence de phonèmes.

Ainsi, ce modèle postule que les mots peuvent être reconnus dès que l’information acoustico-

phonétique est suffisante.

Diverses critiques ont été apportées à ce modèle. Tout d’abord, Cohort I postule que le

nombre de candidats dans la « cohorte » ainsi que leur fréquence d’occurrence n’affecteraient

pas la reconnaissance du mot. Cependant, il a été mis en évidence qu’un mot fréquent était

plus rapidement reconnu qu’un mot peu fréquent (Taft & Hambly, 1986). Une autre critique

concerne les mots dont le premier phonème est incorrectement prononcé. Ce modèle ne leur

permet pas d’être sélectionnés pour faire partie de la « cohorte », ils ne peuvent alors pas être

reconnus. Une version révisée de ce modèle, Cohort II, a été proposée par Marslen-Wilson en

1987.

1.2. Cohort II (Marslen-Wilson, 1987, 1990)

Dans cette version révisée du modèle de la Cohorte, Marslen-Wilson (1987, 1990)

propose que ce ne soit plus le phonème qui représente la base de l’appariement entre le signal

de parole et les entrées lexicales, mais les traits phonétiques (niveau inférieur). L’appariement

entre le signal de parole et les entrées lexicales n’a alors plus besoin d’être parfait ; malgré

une erreur de prononciation, un mot va pouvoir être reconnu. Les mots dont les premiers

phonèmes sont voisins de ceux du mot à reconnaître vont également faire partie de la

« cohorte » ; ainsi « chigarette » va pouvoir être identifié comme « cigarette ». Dans Cohort


14

II, un niveau d’activation est attribué à chaque candidat présent dans la « cohorte ». Ce niveau

d’activation dépendra du degré d’appariement du candidat avec le signal de parole. Un

candidat est sélectionné lorsque son niveau d’activation dépasse d’une différence critique

celui des candidats concurrents. Cohort II intègre également la notion de fréquence

d’occurrence des candidats lexicaux, celle-ci va influencer le niveau d’activation des

candidats. Plus précisément, la fréquence d’occurrence va influencer le temps nécessaire pour

que le signal de parole soit reconnu (mot cible). Dufour & Frauenfelder (2007) expliquent que

lorsque le mot cible possède un compétiteur de plus haute fréquence, le niveau d’activation de

ce dernier est plus élevé. Lorsque les informations sensorielles sont suffisantes pour identifier

le mot cible, il faudra plus de temps pour que le niveau d’activation du mot cible dépasse

d’une valeur significative celui du compétiteur.

Dans Cohort II, les principes fondamentaux du modèle de la Cohorte sont préservés. En effet,

le signal acoustique est analysé de façon séquentielle et continue, la « cohorte » est formée sur

la base des informations sensorielles. Les compétitions lexicales sont engendrées par un

processus d’inhibition bottom-up, il n’y a pas de confrontation directe entre les candidats

lexicaux. Dans la version révisée du modèle, l’unité de base devient le trait phonétique, la

notion de niveau d’activation est intégrée ainsi que le paramètre de fréquence d’occurrence

des candidats lexicaux.

2. Le modèle TRACE (McClelland & Elman, 1986)

Le modèle TRACE est un modèle connexionniste basé sur le principe d’activation

interactive proposé par McClelland et Rumelhart (1981) dans le domaine de la reconnaissance

visuelle des mots. TRACE comporte trois niveaux successifs représentant trois types

d’unités : les traits phonétiques, les phonèmes et les mots. Les traits phonétiques et les

phonèmes sont donc les unités intermédiaires entre le signal de parole et les entrées lexicales.

Les unités sont organisées hiérarchiquement et le flux d’informations circule à la fois de façon

ascendante et de façon descendante ; le modèle est ainsi entièrement dynamique et interactif.

Ces unités sont également interconnectées, par des connexions facilitatrices entre les niveaux

ainsi que par des connexions inhibitrices à l’intérieur d’un même niveau (voir Figure 1).


15

Figure 1 : Représentation schématique du modèle TRACE (McClelland & Elman, 1986).

(Extraite de Frauenfelder, 1996).

Comme dans le modèle de la Cohorte, le signal de parole est traité de façon continue.

En revanche, alors que le modèle de la Cohorte postule que les candidats lexicaux ne sont

activés que par le début du signal de parole, TRACE ne privilégie aucune portion du signal,

les candidats lexicaux sont activés à chaque portion du signal perçue. TRACE prend ainsi en

compte le fait que dans le langage parlé, les frontières entre les mots ne sont pas saillantes.

Dans ce modèle, le nombre de candidats activés est alors plus important ; des candidats qui ne

débutent pas comme le signal de parole peuvent être activés, par exemple pour le mot cible

« coulisse », le mot « lisse » sera un candidat.

Lorsque le signal de parole est perçu, un processus ascendant s’opère, les traits phonétiques

sont analysés et vont activer les phonèmes qui les contiennent. L’activation d’un phonème

entraîne à son tour l’activation de tous les mots qui comportent ce phonème. Un processus

descendant a également lieu, les mots vont renforcer le niveau d’activation des phonèmes, ces

derniers renforçant eux-mêmes le niveau d’activation des traits phonétiques. A chaque fois

qu’une nouvelle portion du signal est perçue, le processus ascendant recommence, de


16

nouveaux candidats lexicaux sont activés. Prenons l’exemple du mot « bateau ». Le phonème

[b] va activer tous les mots qui contiennent ce phonème quelque soit sa place dans le mot.

Lorsque le phonème [a] est ensuite activé, les mots qui contiennent le phonème [b] restent

activés, les mots qui contiennent le phonème [a] sont activés à leur tour. Mais les mots qui

contiennent les phonèmes [b] et [a] à la suite auront le niveau d’activation le plus élevé. C’est

par un processus d’inhibition latérale que les mots activés entrent en compétition. Les mots

les plus activés inhibent plus fortement les autres candidats. Un mot sera reconnu lorsque son

niveau d’activation est suffisamment supérieur à celui des autres mots en compétition.

Dans ce modèle, des candidats lexicaux peuvent être activés en tout point du signal de parole.

De plus, les compétitions entre les candidats lexicaux sont directes. Une critique faite au

modèle TRACE concerne le nombre de candidats lexicaux activés. Il semble coûteux de

devoir gérer instantanément une si grande quantité de candidats.

3. Le modèle Short List (Norris, 1994)

Le modèle Short List postule que l’identification des mots résulte de deux

étapes distinctes : une première étape de sélection des candidats lexicaux, inspirée du modèle

de la Cohorte ; et une seconde étape inspirée du modèle TRACE, dans laquelle les candidats

lexicaux entrent en compétition. Dans Short List, l’unité intermédiaire entre le signal de

parole et les entrées lexicales est le phonème. Lors de la première étape, les phonèmes perçus

vont activer des candidats lexicaux dont le nombre sera limité puisque seuls les mots

compatibles avec l’information sensorielle seront sélectionnés ; on parle alors d’une petite

liste de candidats : la « Short List ». Plus précisément, à chaque phonème, un score

d’ajustement entre le candidat lexical et le signal de parole va s’opérer. Un bon appariement

sera codé positivement (+ 1) et un défaut d’appariement sera codé négativement (- 3). Les

auteurs ont fourni l’exemple suivant : pour le signal d’entrée /k/ /a/ /t/, les mots « cat » et

« catalog » obtiennent un score identique (+ 1 + 1 + 1) = + 3 ; du fait de leur défaut

d’appariement sur le troisième phonème, les mots « cap » et « captain » quant à eux auront un

score plus faible de (+ 1 + 1 - 3) = - 1. Nous retrouvons le processus d’inhibition bottom-up

proposé par le modèle de la Cohorte ; c’est l’information entrante qui influence le devenir du

candidat lexical. De plus, ce score d’ajustement permet à Short List de tenir compte des

erreurs de prononciation.


17

Dans la seconde étape, les candidats de la « Short List » vont s’inhiber entre eux ; c’est l’étape

des compétitions lexicales. Nous retrouvons des inhibitions latérales comme dans le modèle

TRACE. Celles-ci seront les plus fortes entre les mots ayant obtenu les scores d’ajustement

les plus élevés, c’est-à-dire entre les mots qui ont le plus de phonèmes en commun.

Dans Short List, des candidats lexicaux sont activés à chaque nouvelle information entrante.

Le processus d’inhibition bottom-up et le calcul d’ajustement permettent à ce modèle de

contrôler le nombre de candidats lexicaux activés et de pallier ainsi au problème du modèle

TRACE. Des inhibitions latérales permettent au mot cible d’être reconnu.

4. Le modèle NAM (Luce, Pisoni & Goldinger, 1990)

Le modèle NAM inclut, comme le modèle TRACE, des mots qui ne débutent pas

comme le signal de parole. En effet, dans le modèle « Neighborhood Activation Model », soit

« modèle à activation du voisinage », tous les mots proches de l’item cible (voisins) vont être

activés. On entend par voisins, tous les mots qui peuvent être obtenus par addition, délétion,

ou substitution d’un phonème, autrement dit tous les mots similaires au mot cible à un

phonème près quelque soit sa place dans le mot. De plus, dans NAM, la fréquence

d’occurrence de chaque voisin est prise en compte.

L’identification du mot cible résulte d’un calcul de probabilités influencé par le nombre de

voisins et leur fréquence. Plus précisément, des valeurs décisionnelles vont être calculées par

des unités de décision propre à chaque candidat ; ces unités de décision étant renseignées par

des informations issues de trois sources : 1) des informations provenant de patterns acoustico-

phonétiques ; 2) des informations lexicales ; 3) des informations concernant le niveau général

d’activité de l’ensemble du système de décision. Concernant les patterns acoustico-

phonétiques, ils sont stockés en mémoire à long terme et sont activés lorsqu’ils sont

compatibles avec le signal de parole, et ce dès la présentation de ce dernier. Il s’agit d’une

étape pré-lexicale du traitement de la parole. Ces patterns acoustico-phonétiques activent les

unités de décision de manière directe. Quant aux informations lexicales, elles renseignent sur

la fréquence des mots et permettent d’ajuster le niveau d’activation des unités de décision. La

fréquence des mots n’a pas d’effet pendant l’étape pré-lexicale mais une fois que les patterns

acoustico-phonétiques auront activé l’ensemble des compétiteurs. La valeur décisionnelle

attribuée à chaque compétiteur va être réajustée par les unités de décision au fur et à mesure

du déroulement du signal de parole. Un mot sera reconnu lorsque son poids (valeur) dépasse


18

le poids des autres compétiteurs d’une valeur critique, il est alors placé en mémoire à court

terme. Le modèle NAM propose ainsi un calcul de probabilités afin d’identifier le mot cible.

Il n’y a pas de confrontation directe entre les candidats lexicaux, les compétitions lexicales ne

sont pas issues d’un processus d’inhibitions latérales.

5. Conclusions

Les modèles présentés proposent que les compétitions entre les candidats lexicaux

soient engendrées par un processus d’inhibition bottom-up et/ou par des inhibitions latérales

entre les candidats. Avec le processus d’inhibition bottom-up, seule l’information sensorielle

gère les compétitions lexicales ; elle désactive directement les candidats lexicaux qui ne sont

plus compatibles avec l’information du signal (Cohort I), ou elle influence le niveau

d’activation (Cohort II) ou le score d’ajustement attribué à chaque candidat (Short List).

Lorsque des inhibitions latérales sont impliquées, les candidats s’affrontent directement entre

eux (TRACE). Le modèle Short List combine les inhibitions bottom-up et les inhibitions

latérales.

D’autres différences entre les modèles sont observées, notamment en ce qui concerne la partie

du signal de parole qui génère l’activation des candidats lexicaux. Pour le modèle de la

Cohorte, dans sa version originale et sa version révisée, seule l’information portée par le

début du signal peut activer les candidats lexicaux. Les autres modèles ne privilégient aucune

portion du signal de parole, les candidats peuvent être activés en tout point du signal.

Les modèles postulent également que le signal de parole n’est pas apparié aux représentations

lexicales stockées en mémoire de façon directe, des unités sous lexicales serviraient

d’intermédiaires. La nature de ces unités varie selon les modèles, il peut s’agir de patterns

acoustico-phonétiques (NAM), des traits phonétiques (Cohort II) ou des phonèmes (Cohort I,

TRACE, Short List). Les principales caractéristiques des modèles que nous avons décrits sont

résumées dans le Tableau 1 ci-dessous.


19

Tableau 1 : Principales caractéristiques des modèles psycholinguistiques présentés.

Modèle Unité intermédiaire Importance du

début du signal

Diffusion de

l’activation

Inhibitions

latérales

Cohort I phonème oui ascendante non

Cohort II trait phonétique oui ascendante non

TRACE phonème non ascendante et

descendante oui

Short List phonème non ascendante oui

NAM patterns acoustico-

phonétiques non ascendante non

Ces modèles ont envisagé la reconnaissance de la parole et les compétitions

linguistiques qui ont lieu pendant cette tâche dans une situation d’écoute où l’auditeur perçoit

la parole dans le silence, sans prendre en considération le fait qu’en situation d’écoute

écologique, la parole est souvent perçue simultanément avec d’autres signaux sonores. Dans

cette thèse, nous nous intéresserons à la situation dans laquelle l’auditeur est gêné par du bruit

concurrent lorsqu’il percevra des signaux de parole. Plus précisément, nous étudierons la

situation de la parole dans la parole. Cette situation d’écoute semble être pertinente en

psycholinguistique puisque des compétitions linguistiques seront générées lorsque le message

cible sera identifié alors même que la parole concurrente sera traitée. Les compétitions

linguistiques issues du traitement de la parole concurrente vont interférer sur les processus

d’identification de la parole cible.

Partie théorique La situation de la parole dans la parole

20

B) LA SITUATION DE LA PAROLE DANS LA PAROLE

Il n’est pas rare qu’en situation naturelle, le langage parlé soit bruité par des sons

environnementaux comme une discussion voisine (au restaurant, dans un amphithéâtre…),

une télévision ou une radio qui fonctionne à proximité, ou encore les bruits de la rue. Ces sons

concurrents affectent la compréhension de la parole. La difficulté à comprendre la parole cible

ne sera pas la même que les sons concurrents proviennent d’un bruit de parole ou qu’ils

proviennent d’un bruit purement acoustique. Ce travail de thèse porte un intérêt particulier à

la compréhension de la parole cible dégradée par de la parole. Il semblerait que les

informations linguistiques présentes dans la parole du bruit de fond gênent la compréhension

du message transmis. Nous chercherons à identifier les propriétés linguistiques qui perturbent

la parole cible et nous nous intéresserons donc à la situation de la parole dans la parole.

Cherry (1953) fut le premier à décrire le phénomène « Cocktail Party ». Le bruit

Cocktail Party est composé de la parole cible à laquelle sont ajoutés un ou plusieurs autres

signaux de parole. Nous appelons « masqueur » l’ensemble de ces signaux concurrents. Le

masqueur dégrade le message de la parole cible. Le phénomène « Cocktail Party » renvoie à

une capacité à extraire et à comprendre un signal de parole cible parmi d’autres signaux

concurrents. Dans la situation de la parole dans la parole, deux types d’effets de masque sont

produits par le signal de parole concurrent : un effet de masque énergétique et un effet de

masque informationnel. (Pollack, 1975 ; Bronkhorst, 2000 ; Brungart, 2001 ; Brungart,

Chang, Simpson & Wang, 2006 ; Darwin, 2008).

1. Deux types d’effets de masque

1.1. Définition de l’effet de masque énergétique

Le masque énergétique intervient dès lors qu’un bruit concurrent, qu’il soit parolier ou

purement acoustique, est produit en présence de la parole cible. Les informations spectro-

temporelles du bruit concurrent se superposent au moins partiellement à celles de la parole

cible en temps et en fréquence. Le masque énergétique se produit à un niveau périphérique,

dès la cochlée.


21

1.2. Définition de l’effet de masque informationnel

On parle d’effet de masque informationnel lorsque la parole cible est dégradée par un

bruit concurrent de même nature. Autrement dit, ce type d’effet de masque est propre à la

situation de la parole dans la parole. Les informations linguistiques contenues dans la parole

concurrente vont interférer sur l’intelligibilité de la parole cible ; car même si elles ne sont pas

pertinentes pour l’auditeur, elles vont être traitées automatiquement et simultanément avec les

informations linguistiques de la parole cible qui elles, sont pertinentes. Des interférences entre

ces différentes informations linguistiques sont ainsi produites. Le masque informationnel

intervient au niveau du système auditif central.

2. Ségrégation des signaux concurrents

Une meilleure intelligibilité du message cible est constatée lorsque la ségrégation entre

la parole cible et la parole concurrente est facilitée. Nous allons voir que le Rapport Signal sur

Bruit fixé entre la parole cible et la parole concurrente ainsi que le nombre de locuteurs

présents dans le bruit de fond sont des facteurs qui influencent la ségrégation entre les deux

flux de parole concurrents. De même, les auditeurs peuvent s’appuyer sur certaines

caractéristiques vocales des voix cibles et concurrentes, telles que leur fréquence

fondamentale (F0), et s’aider de la localisation spatiale des signaux concurrents pour extraire

plus facilement le message cible du bruit de fond.

2.1. Rapport Signal sur Bruit (RSB)

Le Rapport Signal sur Bruit (RSB) correspond au rapport entre le niveau sonore de la

parole cible et le niveau sonore de la parole du masqueur. Il est exprimé en Décibels.

L’intelligibilité de la parole cible est influencée par le RSB fixé entre les deux flux de parole

concurrents. Il est plus facile d’extraire la parole cible du bruit de fond lorsqu’elle est produite

à un niveau sonore plus élevé que celui du bruit de fond. Plus le RSB entre le parole cible et le

masqueur diminue, plus l’intelligibilité de la parole cible est réduite.

Par exemple, Hoen et al. (2007) ont réalisé une tâche d’intelligibilité avec des mots

cibles qui ont été insérés dans des masqueurs paroliers avec les valeurs de RSB suivantes : +6,

+3, 0 ou -3 dB. Les masqueurs paroliers étaient composés de 4, 6 ou 8 locuteurs. Les auteurs


22

ont observé que la difficulté à récupérer le message cible a augmenté progressivement avec la

diminution du RSB.

Brungart (2001) a exploré l’effet du RSB sur l’intelligibilité de phrases cibles lorsque

celles-ci étaient dégradées par deux types de masqueurs : des masqueurs paroliers à 1 locuteur

unique et des masqueurs de bruit modulé. L’auteur a comparé les performances des

participants pour une gamme de RSB allant +15 dB à -12 dB. Concernant le locuteur des

masqueurs paroliers, il pouvait s’agir de la même personne que le locuteur cible, ou d’une

personne différente qui était de même sexe ou de sexe différent que le locuteur cible. Les

masqueurs de bruit modulé ne produisent qu’un effet de masque énergétique alors que les

masqueurs paroliers produisent un effet de masque informationnel en plus d’un effet de

masque énergétique. Brungart a observé une diminution de l’intelligibilité des phrases cibles

avec la diminution du RSB ; elle n’a pas été identique selon que les masqueurs ont produit

uniquement un effet de masque énergétique (masqueurs de bruit modulé) ou un effet de

masque informationnel en plus d’un effet de masque énergétique (masqueurs paroliers).

Concernant les masqueurs de bruit modulé, les performances des participants n’ont pas été

affectées de +15 dB à -3 dB, puis elles ont diminué de façon linéaire de -3 dB jusqu’à -12 dB.

Pour les masqueurs paroliers, des résultats différents ont été mis en évidence. Lorsque le

locuteur du masqueur était identique au locuteur cible ou de même sexe, un pattern de

résultats identiques a été obtenu. Les performances sont restées très élevées de +15 dB à +9

dB, puis elles ont chuté rapidement de façon linéaire de +9 dB à 0 dB. De 0 dB à -12 dB elles

se sont stabilisées. Toutefois, les performances étaient plus faibles lorsque le locuteur cible et

le locuteur du masqueur était la même personne. Lorsque le locuteur du masqueur était de

sexe différent, les performances n’ont chuté que de 20% de +15 dB à -12 dB, cette diminution

était progressive sur l’ensemble de la gamme de RSB. Ainsi dans cette étude, Brungart a mis

en évidence l’effet du RSB sur l’intelligibilité de la parole cible. A partir de -3 dB l’effet de

masque énergétique était présent (masqueurs de bruit modulé) ; les performances ont ensuite

diminué de façon monotone. Ceci n’a pas été le cas lorsqu’un effet de masque informationnel

était associé à un effet de masque énergétique (masqueurs paroliers).

2.2. Nombre de locuteurs dans le masqueur

Il a été mis en évidence que plus le nombre de locuteurs augmente, plus la

compréhension de la parole cible est difficile. Miller (1947) a mis au point la première étude


23

faisant varier le nombre de locuteurs dans le bruit de fond. Cet auteur a évalué l’intelligibilité

de la parole cible en mesurant le SRT, « Speech Reception Threshold », qui correspond à la

valeur de RSB nécessaire pour que le pourcentage d’identifications correctes de mots cibles

atteigne 50%. Miller (1947) a observé une augmentation nécessaire du RSB avec

l’augmentation du nombre de locuteurs dans le masqueur. Cette augmentation a été constatée

de 1 à 2 locuteurs, puis de 2 à 4 locuteurs, ainsi que de 6 à 8 locuteurs. Le niveau sonore du

signal cible a dû être augmenté par rapport au niveau sonore du signal concurrent (RSB) avec

l’augmentation du nombre de locuteurs afin de maintenir les pourcentages d’identifications

correctes à 50%. L’augmentation du nombre de locuteurs a donc entraîné une dégradation du

message cible de plus en plus importante.

Simpson & Cooke (2005) ont eux aussi examiné l’effet du nombre de locuteurs dans le

masqueur sur l’intelligibilité de la parole cible. Ils ont mesuré les performances de

participants avec une tâche d’identification de consonnes cibles présentées dans un ensemble

de type VCV (Voyelle/Consonne/Voyelle). Ces consonnes étaient dégradées par deux types

de masqueurs : des masqueurs paroliers dont le nombre de locuteurs variait de 1 à 512, et des

masqueurs de bruit fluctuant. Ces derniers sont composés uniquement des informations

spectrales et temporelles des masqueurs paroliers, les informations linguistiques sont limitées.

La Figure 2 représente les résultats obtenus dans cette étude.


24

Figure 2 : Pourcentages d’identifications correctes des consonnes cibles, pour les masqueurs

paroliers (« natural babble ») et les masqueurs de bruit fluctuant (« babble-modulated

noise »), en fonction du nombre de locuteurs. (Extraite de Simpson & Cooke, 2005).

Avec les masqueurs paroliers, les auteurs ont observé une diminution non linéaire des

performances avec l’augmentation du nombre de locuteurs. Plus précisément, les

performances ont chuté rapidement de 85% à 40% de 1 à 8 locuteurs, elles se sont ensuite

stabilisées de 8 à 128 locuteurs. Enfin, elles sont repassées à 50% pour 512 locuteurs. Avec

les masqueurs de bruit fluctuant (générés à partir des masqueurs paroliers), les performances

ont chuté rapidement de 85% à 55% de 1 à 6 locuteurs ; de 6 à 512 locuteurs, elles ont

diminué lentement pour arriver à 50% d’identifications correctes. Pour 512 locuteurs, les deux

types de masqueurs ont donc conduit au même pourcentage d’identifications correctes. C’est à

partir de 3 locuteurs qu’un écart de performances entre les deux types de masqueurs (parolier

et bruit fluctuant) a été observé. Cet écart étant le plus important avec 8 locuteurs dans les

masqueurs (18%), il serait expliqué par le fait que les masqueurs paroliers produisent un effet

de masque informationnel contrairement aux masqueurs de bruit fluctuant qui ne possèdent

pas d’informations linguistiques.

Pour ces deux types de masqueurs, les performances ont chuté avec l’augmentation du

nombre de locuteurs du fait d’une saturation spectro-temporelle du signal de plus en plus

importante. Le système auditif réussirait de moins en moins à réaliser une ségrégation des


25

signaux concurrents avec l’augmentation du nombre de locuteurs dans le bruit de fond,

réduisant ainsi l’intelligibilité de la parole cible.

Les résultats de l’étude de Hoen et al. (2007) ont conforté l’idée d’une saturation

spectro-temporelle du signal avec l’augmentation du nombre de locuteurs dans le masqueur.

Dans leur étude, des mots cibles français ont été insérés dans des masqueurs paroliers

composés de 4, 6 ou 8 locuteurs. Les participants devaient effectuer une tâche d’intelligibilité

en rapportant les mots cibles. Les auteurs ont observé que les performances les plus faibles

ont été obtenues avec 4 locuteurs, suggérant que dans cette condition d’écoute, l’effet de

masque informationnel était le plus important. De plus, dans cette condition, et non pas avec 6

ou 8 locuteurs, certains mots présents dans les masqueurs paroliers ont été retranscrits à la

place des mots cibles, indiquant que même si chacun des 4 locuteurs ne peut être ni suivi ni

compris, certains mots du masqueur sont encore disponibles. En revanche dans cette

expérience, à partir de 6 locuteurs, la saturation spectro-temporelle du signal devient

prégnante (effet de masque énergétique grandissant). Les informations linguistiques présentes

dans le signal concurrent sont moins accessibles, l’effet de masque informationnel est donc

plus faible ; l’accès aux informations telle que la fréquence fondamentale des locuteurs (voir

paragraphe suivant) est également réduit, ce qui rend la ségrégation plus difficile. Dans le

même temps, on observe un lissage de l’enveloppe spectrale et temporelle du signal avec

l’augmentation du nombre de locuteurs dans le masqueur. Le système auditif ne peut alors

plus s’aider des fluctuations temporelles présentes dans les masqueurs pour extraire des

fragments du signal cible, ces fluctuations temporelles étant moins saillantes.

Dans le travail expérimental de cette thèse, nous tiendrons compte de ce phénomène

de saturation spectro-temporelle du signal. Nous utiliserons des masqueurs paroliers

composés de 4 locuteurs au plus, afin d’optimiser l’observation des interférences

linguistiques.

2.3. Fréquence fondamentale (F0)

La fréquence fondamentale (F0) correspond à la hauteur d’un son. Un son complexe

tel que la parole peut être décomposé en plusieurs sons élémentaires, appelés harmoniques,

dont les fréquences respectives sont des multiples de la F0 (loi de Fourier). Chaque personne


26

possède sa propre valeur de F0 ; cependant, nous pouvons situer la F0 des femmes aux

alentours de 240 Hz et celle des hommes aux alentours de 120 Hz (Vaissière, 2006).

Dans la situation de la parole dans la parole, lorsque la F0 du locuteur de la parole

cible est différente de la F0 des locuteurs du bruit de fond, la ségrégation entre les deux flux

de parole est facilitée, ce qui améliore l’intelligibilité du message cible. Cet effet de la F0 a

été mis en évidence dans des études où le signal de parole concurrent est manipulé, soit en

rendant son contenu sémantique incongru (Brokx & Nooteboom, 1982) soit en lui supprimant

les informations lexicales et sémantiques (Gaudrain, 2008), mais aussi dans des études où le

signal de parole concurrent n’est pas modifié (Darwin, Brungart & Simpson, 2003). Nous

allons détailler les études de Brokx & Nooteboom (1982) et de Gaudrain (2008).

Brokx & Nooteboom (1982) ont élaboré une tâche d’intelligibilité de phrases cibles

allemandes dégradées par des masqueurs paroliers allemands à 1 locuteur. Les masqueurs

paroliers étaient composés de phrases sémantiquement incongrues. Le locuteur des masqueurs

paroliers et le locuteur des phrases cibles étaient la même personne ; cependant pour les

masqueurs paroliers, la F0 du locuteur était fixée à 100 Hz alors que pour les phrases cibles, la

F0 du locuteur était manipulée et pouvait prendre une des six valeurs de F0 suivantes : 100,

103, 106, 109, 120 ou 200 Hz. Le pourcentage de bonnes réponses était de 40% lorsque la F0

des phrases cibles et celle des masqueurs paroliers étaient équivalentes. Ce pourcentage de

bonnes réponses n’a cessé de s’améliorer au fur et à mesure que la F0 des phrases cibles a

augmenté, et il a atteint les 60% lorsque la F0 des phrases cibles était à 120 Hz (ce qui est

équivaut à 3 demi-tons). En revanche, pour une valeur de F0 à 200 Hz, les performances ont

chuté ; lorsque la valeur de F0 est double, une « fusion » des deux signaux s’opère et rend la

ségrégation à nouveau plus difficile.

Au cours de sa thèse, Gaudrain (2008) a observé des résultats similaires à l’aide d’une

tâche d’intelligibilité de mots cibles français monosyllabiques masqués par de la parole en

français inversée temporellement ; cette dernière étant dépourvue d’informations lexicales et

sémantiques. Les mots cibles et les masqueurs ont été produits par des locuteurs masculins

différents. La F0 des mots cibles est restée fixée à 100 Hz, seule la F0 des masqueurs a été

manipulée, elle était de 100, 134, 179 ou de 240 Hz. L’intelligibilité des mots cibles s’est

améliorée avec l’augmentation de la différence de F0 entre les mots cibles et les masqueurs de

parole inversée. Sans différence de F0 entre les signaux concurrents, le pourcentage de bonnes

réponses était de 50%, il est passé à plus de 60% lorsqu’un écart de 5 demi-tons (F0 des


27

masqueurs à 134 Hz) était présent entre les mots cibles et les masqueurs. (Voir aussi Summers

& Leek, 1998.)

Les deux études que nous venons d’évoquer se sont intéressées à l’effet de la F0 des

locuteurs sur l’intelligibilité de la parole cible lorsque le signal concurrent était produit par un

locuteur unique. D’autres études ont utilisé des masqueurs paroliers composés de plus d’un

locuteur et ont montré que l’effet de la F0 (ségrégation plus facile lorsque la F0 de la cible et

celle du masqueur sont différentes plutôt qu’identiques) est réduit lorsque le nombre de

locuteurs dans le masqueur augmente. Par exemple dans leur paradigme, Brungart, Simpson,

Ericson & Scott (2001) ont manipulé le nombre de locuteurs dans le masqueur, le RSB entre

la parole cible et la parole concurrente ainsi que le genre des locuteurs. Les participants ont

réalisé une tâche d’intelligibilité sur des phrases cibles anglaises masquées par des masqueurs

paroliers anglais composés de 2 ou de 3 locuteurs. Dans un masqueur, tous les locuteurs

étaient de même sexe ; ils étaient de même sexe ou de sexe différent de celui du locuteur des

phrases cibles. Concernant le RSB, la gamme de valeurs suivante a été manipulée : de -12 dB

à +15 dB par pas de 3 dB. Les phrases cibles ainsi que les phrases utilisées pour générer les

masqueurs provenaient d’un corpus développé par Bolia, Nelson, Ericson & Simpson (2000).

Leur structure commune était la suivante : « Ready (call-sign)? Go to (color) (number) now »

; avec 8 indicatifs possibles (par exemple : Arrow, Baron, Charlie…), 4 couleurs (blue, green,

red, white) et 8 chiffres (de 1 à 8). Une phrase possible était « Ready Baron? Go to green

eight now ». Les participants étaient informés que la phrase cible commençait par « Ready

Baron? » et que les deux ou trois phrases des masqueurs débutaient avec un des 7 autres

indicatifs possibles. Les participants devaient sélectionner sur un écran d’ordinateur la couleur

et le numéro cités dans la phrase cible. Les auteurs ont comparé les résultats à ceux d’une

précédente étude de Brungart (2001) dans laquelle les mêmes phrases cibles étaient dégradées

par un locuteur unique (de même sexe ou de sexe différent de celui du locuteur des phrases

cibles). Les résultats de ces deux études ont permis d’observer que l’effet de la F0 a diminué

avec l’augmentation du nombre de locuteurs dans le masqueur pour les valeurs de RSB

extrêmes (les plus basses et les plus élevées). Plus le nombre de locuteurs a augmenté, moins

les participants ont pu prendre avantage de la différence de genre (différence de F0) entre le

locuteur du signal cible et les locuteurs des masqueurs paroliers. En effet, les caractéristiques

vocales des locuteurs sont de moins en moins accessibles avec l’augmentation du nombre de


28

locuteurs. Les performances ont diminué, la ségrégation des flux concurrents étant plus

difficile.

Dans la partie expérimentale de cette thèse, afin de limiter les effets de ségrégation

entre les signaux concurrents, chaque locuteur aura sa propre valeur de F0. Nous utiliserons

des masqueurs paroliers à 2 voix féminines, dont les F0 seront proches de 205 Hz et de 225

Hz. Nous produirons également des masqueurs paroliers à 4 voix. Pour cela, nous utiliserons à

nouveau les 2 voix féminines dont les F0 sont proches de 205 Hz et de 225 Hz et nous

ajouterons 2 voix masculines avec des F0 proches de 105 Hz et de 125 Hz. La F0 de la voix

cible sera elle, à 240 Hz.

2.4. Localisation spatiale

La ségrégation entre la parole cible et la parole concurrente est facilitée lorsque ces

deux flux de parole concurrents sont séparés dans l’espace. Cet effet de la localisation spatiale

a été exploré en présentant aux participants le signal cible et le signal concurrent via un

casque auditif de façons dichotique, monaurale et spatialisée (Dole, Hoen & Meunier, 2012),

ou bien en présentant les signaux concurrents via un même haut-parleur ou via deux haut-

parleurs séparés par une distance angulaire différente (Kidd, Mason, Rohtla & Deliwala,

1998 ; Freyman, Helfer, McCall & Clifton, 1999).

Dans leur étude, Dole et al. (2012) ont demandé à des participants natifs du français de

réaliser une tâche d’intelligibilité sur des mots cibles français insérés dans des masqueurs

paroliers français composés de 4 locuteurs. Les stimuli étaient présentés aux participants via

un casque auditif. Trois conditions d’écoute ont été générées : dichotique, monaurale et

spatialisée. Dans la condition d’écoute dichotique, les mots cibles étaient présentés dans une

oreille à un niveau sonore fixé à 65 dB, et les masqueurs dans l’autre oreille à 45 dB. Dans

cette condition d’écoute, la séparation spatiale de la cible et du masqueur est maximale. Dans

la situation d’écoute monaurale, les mots cibles et les masqueurs sont présentés dans une seule

et même oreille à 65 dB. Enfin, dans la situation d’écoute spatialisée, les mots cibles étaient

présentés dans une seule oreille à 65 dB, et les masqueurs dans les deux oreilles, à 65 dB dans

l’oreille où les mots cibles étaient également présentés, à 45 dB dans l’autre oreille. Voir ci-

dessous la Figure 3 représentant les trois conditions d’écoute.


29

Figure 3 : Figure illustrant les trois conditions d’écoute testées dans l’étude de Dole et al.

(2012) : monaurale, dichotique et spatialisée. (Extraite de Dole et al., 2012).

Les auteurs ont observé un effet de la localisation spatiale sur les pourcentages de

retranscriptions correctes des mots cibles français. En effet, les pourcentages de bonnes

réponses étaient de 98% dans la condition d’écoute dichotique, c’est-à-dire lorsque la

séparation spatiale entre les mots cibles et les masqueurs paroliers était maximale. Les

performances ont diminué dans la condition d’écoute spatialisée, avec 80% de retranscriptions

correctes. Les performances étaient les plus faibles dans la condition monaurale (70%)

lorsqu’aucun repère spatial n’était fourni aux participants. Dans cette condition d’écoute, la

ségrégation entre les signaux concurrents est plus difficile, ce qui réduit l’intelligibilité du

signal cible. Le système auditif doit alors s’aider d’autres indices que les indices spatiaux,

comme par exemple la fréquence fondamentale des voix des différents locuteurs.

Il a également été montré que cet effet de la localisation spatiale varie selon que le

masqueur produit ou pas un effet de masque informationnel. Dans l’étude de Kidd et al.

(1998), les participants devaient identifier non pas des stimuli paroliers comme cibles, mais

des tons. Deux types de bruits ont été utilisés comme masqueurs : du bruit à large bande, qui

ne produit qu’un effet de masque énergétique, ou des tons qui produisent un effet de masque

informationnel en plus d’un effet de masque énergétique puisque ces signaux sont de même

nature que les signaux cibles. Le signal cible était présenté via un haut-parleur situé en face

des participants. La localisation spatiale des masqueurs par rapport au signal cible variait de

0° à 180° (90° à droite, 90° à gauche). Les résultats ont révélé des performances

d’identification du signal cible plus élevées à mesure que la séparation spatiale augmentait.

Néanmoins, cet avantage était moindre lorsque les masqueurs ne produisaient qu’un effet de

masque énergétique (bruit à large bande) plutôt que lorsque les masqueurs produisaient en

plus un effet de masque informationnel (tons).


30

Des résultats semblables ont été observés dans l’étude de Freyman et al. (1999) avec

des stimuli paroliers. Le signal cible correspondait à des phrases sémantiquement incongrues.

Il était dégradé par des masqueurs paroliers à 1 locuteur qui produisent des effets de masque

informationnel et énergétique, ou par des masqueurs de « speech-spectrum noise » dépourvus

d’informations linguistiques et qui ne produisent donc qu’un effet de masque énergétique. Ces

masqueurs étaient présentés via le même haut-parleur que le signal cible ou via un haut-

parleur situé 60° à droite. La séparation spatiale des signaux concurrents a entraîné une plus

forte amélioration des performances avec les masqueurs paroliers plutôt qu’avec les

masqueurs de « speech-spectrum noise ». L’avantage d’une séparation spatiale entre le signal

cible et le signal concurrent est plus important lorsque le signal concurrent produit un effet de

masque informationnel en plus d’un effet de masque énergétique (voir également Freyman,

Balakrishnan & Helfer, 2004).

Dans nos études, les participants seront équipés d’un casque auditif et une seule

situation d’écoute sera mise en place, tous les stimuli seront présentés de façon diotique.

Autrement dit, la cible et le masqueur seront présentés tous les deux dans les deux oreilles. En

ne testant que cette condition d’écoute, nous souhaitons nous affranchir d’un effet de la

localisation spatiale.

3. Effet de masque informationnel

Plusieurs études ont cherché à mettre en lumière l’effet de masque informationnel.

Pour cela, certains auteurs ont fait varier : la nature du bruit présent dans les masqueurs (bruit

stationnaire (Garcia Lecumberri & Cooke, 2006), bruit fluctuant (Dole, Hoen & Meunier,

2009 ; Broersma & Scharenborg, 2010)), le style parolier des masqueurs (Calandruccio, Van

Engen, Dhar & Bradlow, 2010b), ou la langue des masqueurs paroliers (Rhebergen, Versfeld

& Dreschler, 2005 ; Garcia Lecumberri & Cooke, 2006 ; Van Engen & Bradlow, 2007).

3.1. Manipuler la nature des masqueurs

3.1.1. Bruit stationnaire


31

Afin d’examiner un effet de masque informationnel, Garcia Lecumberri & Cooke

(2006) ont demandé à des participants natifs de l’anglais de réaliser une tâche d’identification

de consonnes cibles anglaises présentées dans le silence ou dégradées par différents types de

masqueurs : (a) des masqueurs paroliers à 1 locuteur, natif de l’anglais ou de l’espagnol ; (b)

des masqueurs paroliers à 8 locuteurs natifs de l’anglais ; (c) des masqueurs de bruit

stationnaire. Contrairement aux masqueurs paroliers, à 1 et à 8 locuteurs, qui produisent un

effet de masque informationnel en plus d’un effet de masque énergétique, les masqueurs de

bruit stationnaire ne produisent qu’un effet de masque énergétique. En effet, ils ont été

générés à partir de masqueurs paroliers de sorte qu’ils ne partagent avec eux que les

informations spectrales ; les informations linguistiques ainsi que les fluctuations temporelles

ont été supprimées. Les meilleures performances ont été obtenues dans le silence, puis avec

les masqueurs paroliers à 1 locuteur. Les performances étaient un peu plus faibles avec les

masqueurs de bruit stationnaire et encore plus faibles avec les masqueurs paroliers à 8

locuteurs. L’effet de masque énergétique des masqueurs paroliers à 1 locuteur est plus faible

que celui des masqueurs paroliers à 8 locuteurs (en effet, plus le nombre de locuteurs

augmente, plus la saturation spectro-temporelle du signal est importante), qui est lui-même

plus faible que l’effet de masque énergétique des masqueurs de bruit stationnaire. Les auteurs

ont alors expliqué les performances plus élevées des participants avec les masqueurs de bruit

stationnaire plutôt qu’avec les masqueurs paroliers à 8 locuteurs par le fait que ces derniers

contiennent des informations linguistiques, ils produisent donc un effet de masque

informationnel qui réduit l’intelligibilité des consonnes cibles ; ce qui n’est pas le cas lorsque

les masqueurs sont composés uniquement d’informations spectrales (bruit stationnaire). Avec

les masqueurs paroliers à 1 locuteur, bien qu’un effet de masque informationnel soit présent,

il est fortement réduit par une ségrégation facilitée ; les participants peuvent par exemple

s’aider d’indices tels que la F0 des locuteurs.

3.1.2. Bruit fluctuant

Dans l’étude que nous venons de détailler, Garcia Lecumberri & Cooke (2006) ont

manipulé des masqueurs de bruit stationnaire de sorte que ces derniers ne conservent que les

informations spectrales de la parole. D’autres types de masqueurs dépourvus d’informations

linguistiques peuvent être générés, comme par exemple des masqueurs de bruit fluctuant qui

conservent les informations spectrales de la parole ainsi que les fluctuations temporelles. Le


32

bruit fluctuant semble être un masqueur moins efficace que le bruit stationnaire. Miller &

Licklider (1950) ont observé de meilleures performances lors d’une tâche d’identification de

signaux paroliers en présence d’un masqueur composé de bruit fluctuant plutôt que de bruit

stationnaire. Le RSB était également manipulé. La Figure 4 ci-dessous représente les

différences de performances (exprimées en pourcentages), appelées aussi « démasquage »,

obtenues avec les masqueurs de bruit fluctuant et les masqueurs de bruit stationnaire. Pour des

valeurs négatives de RSB, l’avantage du bruit fluctuant sur le bruit stationnaire était le plus

important ; le démasquage a diminué progressivement avec l’augmentation du RSB.

Figure 4 : Niveau de démasquage obtenu en fonction du Rapport Signal sur Bruit (« SNR »

en dB). (Extraite de Miller & Licklider, 1950).

Nous retrouvons également une meilleure intelligibilité du signal cible avec les

masqueurs de bruit fluctuant plutôt qu’avec les masqueurs de bruit stationnaire dans l’étude

de Broersma & Scharenborg (2010). Ce résultat serait expliqué par la présence des

fluctuations temporelles dans les masqueurs de bruit fluctuant, et de leur absence dans les

masqueurs de bruit stationnaire. Les fluctuations temporelles entraînent des maxima et des

minima d’énergie (voir Figure 5). En particulier, les minima d’énergie, aussi appelés

« vallées », rendent le bruit fluctuant moins masquant et permettent au système auditif

d’extraire des fragments du signal cible (Festen & Plomp, 1990 ; Bronkhorst & Plomp, 1992 ;

Howard-Jones & Rosen, 1993a, 1993b ; Assmann & Summerfield, 2004 ; Cooke, 2006 ;

Füllgrabe, Berthommier & Lorenzi, 2006 ; Lorenzi, Husson, Ardoint & Debruille, 2006 ;

Rhebergen, Versfeld & Dreschler, 2006 ; Gnansia, Cheveigné & Lorenzi, 2009).


33

Figure 5 : Figure représentant un signal de parole (en bleu) inséré dans un bruit stationnaire

(en rouge à gauche) ou dans un bruit fluctuant (en rouge à droite). (Extraite de Fleuriot,

Garnier & Lorenzi, 2007).

Dans notre groupe de recherche, Dole et al. (2009) ont masqué des mots cibles

français avec trois types de masqueurs : des masqueurs paroliers, des masqueurs de bruit

fluctuant et des masqueurs de bruit stationnaire. Les masqueurs paroliers français étaient

composés de 4 locuteurs. Les masqueurs de bruit fluctuant ont été générés à partir des

masqueurs paroliers ; ils possèdent les mêmes informations spectro-temporelles tout en étant

dépourvus d’informations linguistiques. Enfin, les masqueurs de bruit stationnaire ne

possèdent que des informations spectrales ; ils ont également été générés à partir des

masqueurs paroliers. Ainsi, les masqueurs de bruit fluctuant et de bruit stationnaire partagent

les mêmes informations spectrales.

Dans l’étude de Broersma & Scharenborg (2010), les masqueurs de bruit fluctuant étaient

générés à partir de masqueurs paroliers composés d’1 locuteur ; ici Dole et al. (2009) ont

généré les masqueurs de bruit fluctuant à partir des masqueurs paroliers à 4 locuteurs. Les

résultats observés par Dole et al. (2009) sont représentés dans la Figure 6 ci-dessous.


34

Figure 6 : Taux de retranscriptions correctes obtenus avec les trois types de masqueurs : du

bruit stationnaire (« BBN » pour « stationary broadband noise »), du bruit fluctuant

(« SN » pour « fluctuating speech-shaped noise »), des masqueurs paroliers (« Cock » pour

« Cocktail noise »). (Extraite de Dole et al., 2009).

Les résultats ont montré un effet du type de bruit dans le masqueur avec des

performances significativement différentes d’un masqueur à l’autre. Les taux de

retranscriptions correctes étaient les plus faibles avec les masqueurs paroliers. Ceci est dû au

fait que ce type de masqueurs produit un effet de masque informationnel et un effet de

masque énergétique, contrairement aux deux autres types de masqueurs qui ne produisent

qu’un effet masque énergétique. Les performances étaient ensuite plus élevées avec les

masqueurs de bruit fluctuant et plus élevées encore avec les masqueurs de bruit stationnaire.

Ce résultat ne correspond pas aux attentes des auteurs. Etant donné que les masqueurs de bruit

fluctuant possèdent des fluctuations temporelles et donc des minima d’énergie (les

« vallées ») permettant d’extraire des fragments du signal cible, le pourcentage de

retranscriptions correctes aurait dû être plus élevé avec les masqueurs de bruit fluctuant plutôt

qu’avec les masqueurs de bruit stationnaire. Cependant, les auteurs expliquent ce résultat par

le fait que les masqueurs de bruit fluctuant ont été générés à partir de masqueurs paroliers à 4

locuteurs, pour lesquels la saturation spectro-temporelle est plus importante que pour des

masqueurs composés d’1 locuteur (Broersma & Scharenborg, 2010). Ainsi, les fluctuations

temporelles de chacun des locuteurs s’accumulant, les maxima d’énergie se superposent aux


35

minima d’énergie, lissant ainsi le signal concurrent. Les masqueurs de bruit fluctuant

semblent produire alors un effet de masque énergétique plus important que celui des

masqueurs de bruit stationnaire, contrairement à l’hypothèse des auteurs.

Dans cette thèse et plus précisément à partir de l’Expérience 2, nous utiliserons des

masqueurs de bruit fluctuant en plus des masqueurs paroliers. Nous les préférons aux

masqueurs de bruit stationnaire car ils permettent une analyse plus fine de l’effet de masque

informationnel et donc des interférences linguistiques. En effet, la différence entre les

masqueurs paroliers et les masqueurs de bruit fluctuant réside dans le fait que ces derniers

sont dépourvus d’informations linguistiques de haut niveau.

Les fluctuations temporelles de la parole peuvent être décomposées en fluctuations

temporelles lentes de moins de 50 Hz (environ) et en fluctuations temporelles plus rapides, de

plus de 50 Hz. Selon Rosen (1992) (voir aussi Gnansia et al., 2009), les fluctuations

temporelles lentes représenteraient l’enveloppe d’amplitude du signal et seraient porteuses des

informations concernant le rythme global du signal de parole. Quant aux fluctuations

temporelles plus rapides, elles correspondraient à la périodicité ainsi qu’à la structure

temporelle fine du signal. La périodicité reflète notamment l’information sur la fréquence

fondamentale (F0) ; la structure temporelle fine porterait notamment les informations telles

que le lieu d’articulation et le mode d’articulation.

Pour générer les masqueurs de bruit fluctuant, nous nous appuierons sur les méthodes

utilisées dans notre groupe de recherche (Dole et al., 2009). Les masqueurs de bruit fluctuant

seront générés à partir des masqueurs paroliers, seules les informations spectrales et les

fluctuations temporelles lentes seront conservées. Les masqueurs de bruit fluctuant produiront

alors des interférences qui impliqueront des informations acoustiques et linguistiques de bas

niveau ; les informations acoustiques étant les informations spectrales, et les informations

linguistiques de bas niveau étant les informations portées par les fluctuations temporelles

lentes, c’est-à-dire le rythme. Les masqueurs paroliers seront les seuls à produire des

interférences qui impliqueront les informations linguistiques de haut niveau en plus des

informations acoustiques et linguistiques de bas niveau ; parmi les informations linguistiques

de haut niveau, nous trouvons les phonèmes, les syllabes, les mots et les informations

sémantiques.


36

3.2. Manipuler le style parolier des masqueurs

Il a été montré que l’intelligibilité d’un message cible est améliorée lorsque celui-ci est

produit dans un style parolier clair plutôt que dans un style parolier conversationnel typique

(Payton, Uchanski & Braida, 1994). Dans un style parolier clair, le locuteur parle comme si la

personne à qui il s’adresse a des difficultés à le comprendre. Calandruccio et al. (2010b) se

sont alors demandés quel serait l’impact de masqueurs paroliers produits dans un style clair

sur l’intelligibilité de la parole cible par rapport à des masqueurs paroliers produits dans un

style conversationnel. Les auteurs ont formulé deux hypothèses : (a) soit les masqueurs

paroliers produits dans un style clair auront un effet de masque plus important que les

masqueurs paroliers au style conversationnel, (b) soit ils auront un effet de masque plus

faible. L’hypothèse (a) s’appuie sur le fait que les mots prononcés dans un style clair sont plus

intelligibles, ils seraient alors de plus forts distracteurs pour les participants que les mots

prononcés dans un style conversationnel. Dans ce cas, des interférences linguistiques seraient

mises en avant. L’hypothèse (b) quant à elle, propose qu’il serait plus facile d’extraire la

parole cible avec les masqueurs paroliers au style clair puisque leurs fluctuations temporelles

seraient plus exagérées, c’est-à-dire plus saillantes, que celles des masqueurs paroliers au

style conversationnel ; notamment les minima d’énergie seraient plus larges (la durée des

« vallées » serait plus longue) et permettraient d’extraire plus facilement le signal cible

(Festen & Plomp, 1990 ; Gnansia et al. 2009).

Dans une première expérience, les auteurs ont testé l’hypothèse (a) en demandant à des

participants natifs de l’anglais de réaliser une tâche d’intelligibilité sur des phrases cibles

anglaises dégradées par des masqueurs paroliers à 2 locuteurs générés en anglais (langue

native) ou en croate (langue inconnue des participants). Pour générer ces masqueurs paroliers,

des locuteurs natifs de l’anglais et des locuteurs natifs du croate ont lu des phrases dans un

style clair ou conversationnel. L’hypothèse (a) sera validée dans le cas où les performances

sont équivalentes entre les masqueurs paroliers croates au style clair et ceux au style

conversationnel, et que des performances plus faibles sont observées avec les masqueurs

paroliers anglais au style clair plutôt qu’avec ceux au style conversationnel. Les phrases cibles

ont elles aussi été produites dans un style clair ou conversationnel. Le Rapport Signal sur

Bruit était manipulé, il était de -3 dB ou de -5 dB. Les résultats ont montré un effet du RSB,

un effet de la langue des masqueurs ainsi qu’un effet du style parolier des phrases cibles. En

effet, les performances étaient plus faibles avec un RSB de -5 dB plutôt qu’avec un RSB de -3


37

dB ; elles étaient plus faibles avec les masqueurs paroliers anglais plutôt qu’avec les

masqueurs paroliers en croate ; enfin les participants ont eu plus de difficultés avec les

phrases cibles produites dans un style conversationnel plutôt que dans un style clair. En

revanche, l’effet du style parolier des masqueurs n’était pas présent, quelle que soit la langue

des masqueurs, le RSB ou le style parolier des phrases cibles. L’hypothèse (a), selon laquelle

les masqueurs paroliers au style clair seraient de plus forts distracteurs pour les participants

n’a donc pas été validée. Dans ce paradigme expérimental, manipuler le style parolier des

masqueurs n’a pas permis de mettre en évidence un effet de masque informationnel.

Une seconde expérience a été mise en place pour tester l’hypothèse (b), selon laquelle les

masqueurs paroliers au style clair seraient moins efficaces que les masqueurs paroliers au

style conversationnel. Les masqueurs paroliers étaient cette fois-ci composés d’1 locuteur

unique anglais, qui parlait dans un style clair ou conversationnel. Des masqueurs de bruit

fluctuant ont également été générés à partir des masqueurs paroliers aux styles clair et

conversationnel, de telle sorte qu’ils possèdent les mêmes informations spectrales et

temporelles tout en étant dépourvus d’informations linguistiques. L’hypothèse (b) sera validée

si les performances des participants sont plus faibles avec les masqueurs de bruit fluctuant au

style conversationnel plutôt qu’avec ceux au style clair. Le RSB était à nouveau manipulé (-8

dB et -10 dB pour les masqueurs de bruit fluctuant, -14 dB et -16 dB pour les masqueurs

paroliers), ainsi que le style parolier des phrases cibles (styles paroliers clair et

conversationnel). Avec les masqueurs paroliers, les performances n’étaient significativement

pas différentes qu’ils aient été générés dans un style clair ou conversationnel. De plus, l’effet

du RSB n’était pas significatif, seul l’effet du style parolier des phrases cibles a été mis en

évidence. Avec les masqueurs de bruit fluctuant, la tâche était aussi difficile que le style soit

clair ou conversationnel. L’effet du RSB et celui du style parolier des phrases cibles étaient

significatifs. Ces résultats ont donc suggéré que les différences de fluctuations temporelles

entre les masqueurs de bruit fluctuant au style clair et ceux au style conversationnel n’ont pas

influencé l’intelligibilité de la parole cible. Il semble qu’entre les masqueurs paroliers au style

clair et ceux au style conversationnel, d’autres différences acoustiques que des différences de

fluctuations temporelles soient présentes.

Dans nos expériences, nous utiliserons des masqueurs paroliers au style

conversationnel de manière à ce que la situation d’écoute générée dans notre paradigme

expérimental s’approche le plus possible d’une situation écologique.


38

3.3. Manipuler la langue des masqueurs

La première étude à faire varier la langue de la parole concurrente a été menée par

Rhebergen et al. (2005). Des participants de langue maternelle allemande ont réalisé une tâche

d’intelligibilité avec des phrases cibles allemandes. Les masqueurs paroliers étaient produits

par une locutrice unique, native du suédois (une langue inconnue des participants) ou de

l’allemand (langue native des participants). Les résultats des participants ont montré des

performances plus élevées avec les masqueurs paroliers générés dans une langue inconnue

(suédois) plutôt qu’avec des masqueurs paroliers générés dans leur langue native (allemand).

Des résultats similaires ont été mis en évidence dans l’étude de Garcia Lecumberri &

Cooke (2006). Lors d’une tâche d’intelligibilité de consonnes cibles anglaises, des

participants natifs de l’anglais ont eu des meilleures performances en présence de masqueurs

paroliers (à 1 locuteur) générés en espagnol, une langue qui ne leur a jamais été enseignée,

plutôt qu’en présence de masqueurs paroliers anglais (langue native). En effet, les

informations linguistiques de la langue inconnue n’étant pas intelligibles pour les participants,

ces informations ne perturbent pas l’intelligibilité des phrases cibles.

La célèbre étude de Van Engen & Bradlow (2007) a fait suite aux deux études

évoquées ci-dessus. Ces auteurs se sont intéressés à l’effet de masque informationnel en

manipulant à la fois la langue des masqueurs paroliers, le RSB, ainsi que le nombre de

locuteurs dans les masqueurs. Les auteurs ont montré que l’effet de masque informationnel

n’est observable que dans certaines situations d’écoute. Nous allons détailler cette étude car

elle constitue la base de notre travail expérimental.

Une tâche d’intelligibilité (retranscrire par écrit) de phrases cibles anglaises a été proposée à

des participants natifs de l’anglais. Les phrases cibles étaient insérées dans des masqueurs

paroliers générés en anglais (langue native) ou en mandarin (langue inconnue). Ces

masqueurs étaient composés de 2 ou de 6 locuteurs. Les phrases présentes dans les masqueurs

paroliers étaient sémantiquement incongrues. Les phrases cibles étaient insérées 500 ms après

le début des masqueurs, avec un RSB de +5 dB, 0 dB ou -5 dB. Nous rappelons qu’un RSB

positif indique que le niveau sonore de la cible est plus élevé que le niveau sonore du

masqueur. Quatre groupes différents de participants ont été constitués. Pour chaque groupe, 4

conditions expérimentales parmi les 12 possibles ont été présentées ; il y avait 16 phrases

cibles par condition expérimentale. Les participants commençaient toujours par entendre les

situations d’écoute les plus favorables. Ainsi, l’expérience débutait avec la valeur de RSB la


39

plus élevée (+5 dB ou 0 dB) et avec les masqueurs paroliers générés dans la langue inconnue

des participants (mandarin). Le Tableau 2 ci-dessous récapitule les conditions expérimentales

de cette étude.

Tableau 2 : Conditions expérimentales présentées aux quatre groupes de participants dans

l’étude de Van Engen & Bradlow (2007).

1° condition 2° condition 3° condition 4° condition

Nombre de locuteurs Mandarin Anglais Mandarin Anglais

Groupe 1 6 +5 dB +5 dB 0 dB 0 dB

Groupe 2 6 0 dB 0 dB -5 dB -5 dB

Groupe 3 2 +5 dB +5 dB 0 dB 0 dB

Groupe 4 2 0 dB 0 dB -5 dB -5 dB

Les auteurs ont fait l’hypothèse que l’intelligibilité des phrases cibles anglaises devrait

être plus faible avec les masqueurs paroliers anglais (langue native) plutôt qu’avec ceux

générés en mandarin (langue non connue). De plus, ils s’attendaient à ce que les performances

diminuent avec l’augmentation du nombre de locuteurs dans les masqueurs paroliers (2 versus

6), ainsi qu’avec la diminution du RSB (+5 dB, 0 dB et -5 dB).

Les résultats ont en effet montré des performances plus faibles avec 6 locuteurs dans les

masqueurs paroliers plutôt qu’avec 2 locuteurs, et des performances qui ont chuté avec la

diminution du RSB. Cela a confirmé que l’intelligibilité de la parole cible a été réduite à

mesure que le nombre de locuteurs des masqueurs a augmenté et à mesure que le niveau

sonore de la cible a diminué par rapport au niveau sonore des masqueurs. Concernant l’effet

de la langue des masqueurs paroliers, il était significatif uniquement avec les masqueurs

paroliers à 2 locuteurs et lorsque le RSB était de 0 dB et de -5 dB ; les performances étaient

plus faibles avec les masqueurs paroliers en anglais plutôt qu’avec ceux en mandarin.

Autrement dit, les masqueurs paroliers ont eu un effet de masque plus important lorsqu’ils

étaient générés dans la langue native des participants plutôt que dans une langue inconnue.

Les informations linguistiques des masqueurs paroliers anglais étant intelligibles, elles ont

interférées sur l’intelligibilité du message cible. Il est à préciser que l’effet de la langue des

masqueurs était présent à 0 dB, mais uniquement lorsque cette condition suivait la condition à

+5 dB, c’est-à-dire lorsqu’elle représentait une situation d’écoute plus difficile pour les

participants. Cela ne concernait donc que les groupes 1 et 3. Lorsque les groupes 2 et 4


40

entendaient les conditions à 0 dB puis celles à -5 dB, l’effet de la langue des masqueurs

n’était pas présent à 0 dB. Enfin, l’absence d’effet de la langue des masqueurs avec 6

locuteurs serait due au fait qu’avec l’augmentation du nombre de locuteurs, la densité

spectrale et temporelle du signal est plus importante (en accord avec les résultats rapportés par

Hoen et al., 2007). Un effet de masque énergétique plus important réduit l’accès au contenu

linguistique des masqueurs paroliers ainsi que leur effet de masque informationnel.

Le Tableau 3 ci-dessous regroupe les différentes études citées dans la partie théorique, ayant

manipulé la langue des masqueurs paroliers.

Tableau 3 : Récapitulatif des études présentées ayant manipulé la langue des masqueurs

paroliers.

Etudes Nature de la

cible

Langue de

la cible

Langue des

masqueurs

Nombre de

locuteurs

Rhebergen et al.

(2005) phrases allemand allemand / suédois 1

Garcia Lecumberri &

Cooke (2006) VCV anglais anglais / espagnol 1

Van Engen & Bradlow

(2007) phrases anglais anglais / mandarin 2 et 6

Calandruccio et al.

(2010b) phrases anglais anglais / croate 2

Brouwer et al.

(2012) phrases anglais anglais / néerlandais 2

Dans cette thèse, nous manipulerons la langue de la parole concurrente afin de mettre

en évidence un effet de masque informationnel dans la situation de la parole dans la parole.

Nous évaluerons l’intelligibilité de mots cibles produits dans la langue native de participants

français. Comme pour les études évoquées ci-dessus, la parole concurrente sera produite dans

la langue native des participants, ou dans des langues qui leur sont inconnues. Nous avons

choisi de générer des masqueurs paroliers en français (langue native) ainsi qu’en gaélique

irlandais et en italien (langues inconnues). Les masqueurs paroliers seront composés de 2 et

de 4 locuteurs.


41

4. Interférences linguistiques

Les études que nous venons de décrire ont mis en évidence l’effet de masque

informationnel. Cependant, il n’a pas encore été identifié si ce sont les informations sous-

lexicales telles que les phonèmes et les syllabes, ou bien si ce sont les informations lexicales

(mots) et sémantiques des masqueurs paroliers qui sont responsables de cet effet. Nous allons

présenter deux études qui ont révélé des interférences impliquant des informations lexicales

(Boulenger, Hoen, Ferragne, Pellegrino & Meunier, 2010) et sémantiques (Brouwer, Van

Engen, Calandruccio & Bradlow, 2012).

4.1. Interférences lexicales

Boulenger et al. (2010) se sont intéressés aux interférences lexicales pendant la

situation de la parole dans la parole en faisant varier la fréquence d’occurrence des mots

présents dans les masqueurs paroliers. Les auteurs ont cherché à déterminer dans quelle

mesure la fréquence d’occurrence des mots dans le signal concurrent interfère sur

l’intelligibilité de la parole cible. En effet, si les participants sont sensibles à l’information

lexicale des masqueurs paroliers, alors les performances de ces participants devraient varier

en fonction de la fréquence d’occurrence des mots présents dans les masqueurs paroliers.

Ainsi, les auteurs ont prédit que les masqueurs paroliers composés de mots très fréquents

devraient davantage interférer sur l’intelligibilité de la parole cible que les masqueurs

paroliers composés de mots peu fréquents ; les mots très fréquents étant pour les modèles

théoriques de plus forts compétiteurs pour l’accès au lexique que les mots peu fréquents. Des

participants français ont réalisé une tâche de décision lexicale sur des mots cibles français

insérés dans des masqueurs paroliers qui étaient composés de mots très fréquents ou peu

fréquents (mots sélectionnés dans la base de données Lexique 2, New, Pallier, Brysbaert &

Ferrand, 2004). Le nombre de locuteurs présents dans les masqueurs paroliers a également été

manipulé, ils étaient 2, 4, 6 ou 8 locuteurs. Les auteurs ont observé un effet du nombre de

locuteurs, les temps de réaction étaient significativement plus rapides avec 2 locuteurs dans

les masqueurs plutôt qu’avec 4, 6 ou 8 locuteurs ; il n’y avait pas de différence significative

entre ces trois dernières conditions. Un effet de la fréquence d’occurrence des mots était

également présent, les temps de réaction étaient significativement plus longs lorsque les

masqueurs paroliers étaient composés de mots très fréquents plutôt que de mots peu fréquents,


42

mais uniquement avec 2 et 8 locuteurs dans les masqueurs. Avec 2 locuteurs, les informations

linguistiques des masqueurs paroliers étant encore intelligibles, l’effet de la fréquence

d’occurrence des mots a pu s’exprimer. En revanche à 8 locuteurs, le contenu linguistique des

masqueurs est moins accessible, la saturation spectrale et temporelle du signal étant plus

importante. Afin de comprendre la présence surprenante de l’effet de fréquence d’occurrence

des mots dans la condition à 8 locuteurs, les auteurs ont réalisé des analyses acoustiques et ont

mis en évidence des différences acoustiques/énergétiques entre les mots très fréquents et les

mots peu fréquents avec 8 locuteurs dans les masqueurs. Finalement, les résultats ont montré

que lorsque le masqueur était composé de peu de locuteurs (2 locuteurs), des compétitions

lexicales ont été déclenchées ; ces dernières ont été plus fortes lorsque le signal concurrent

était composé de mots très fréquents.

4.2. Interférences sémantiques

Afin de mettre en évidence des interférences sémantiques dans la situation de la parole

dans la parole, Brouwer et al. (2012) ont utilisé le même type de tâche que dans l’étude de

Van Engen & Bradlow (2007). Des participants natifs de l’anglais ont été recrutés pour

réaliser une tâche d’intelligibilité avec des phrases cibles anglaises. Ces dernières étaient

insérées dans des masqueurs paroliers à 2 locuteurs, natifs de l’anglais (langue native des

participants) ou natifs du néerlandais (langue inconnue des participants). Notons qu’à la

différence de Van Engen & Bradlow (2007), Brouwer et al. (2012) ont testé du néerlandais,

qui est plus proche de l’anglais (même origine, similarités phonétiques) que le mandarin (voir

aussi Bradlow, Clopper, Smiljanic & Walter, 2010). Les auteurs ont également manipulé le

contenu sémantique des masqueurs paroliers ; ces derniers étaient composés de phrases

sémantiquement acceptables ou sémantiquement incongrues. A -5 dB, les résultats ont révélé

un effet de la langue des masqueurs, les participants ont eu de meilleures performances

lorsque les masqueurs paroliers étaient générés dans une langue qui leur était inconnue

(néerlandais) plutôt que dans leur langue native (anglais). Brouwer et al. (2012) ont donc

obtenu un effet de la langue des masqueurs similaire à celui de Van Engen & Bradlow (2007),

bien que le néerlandais soit plus proche de l’anglais que le mandarin. Cette étude montre ainsi

que l’intelligibilité de la parole cible est meilleure dès lors que la langue concurrente est

inintelligible. Les résultats ont également montré que l’effet du contenu sémantique n’était

présent qu’avec les masqueurs paroliers anglais (langue native) ; les performances étaient


43

significativement plus élevées lorsque les phrases étaient sémantiquement incongrues plutôt

que lorsqu’elles étaient sémantiquement acceptables. En revanche avec les masqueurs

paroliers en néerlandais, les performances étaient équivalentes que le contenu sémantique soit

acceptable ou pas. En effet, étant donné que les participants ne comprenaient pas le contenu

linguistique en néerlandais, ils n’ont pas été affectés par les informations sémantiques de la

parole concurrente. L’étude de Brouwer et al. (2012) a ainsi mis en évidence l’intervention

d’interférences sémantiques lorsque la parole concurrente est intelligible.

Boulenger et al. (2010) ainsi que Brouwer et al. (2012) ont mis en lumière,

respectivement, des interférences lexicales et des interférences sémantiques. Dans la partie

expérimentale de cette thèse, nous nous intéresserons aux interférences qui impliquent des

informations linguistiques sous-lexicales. Plus précisément, notre objectif sera de déterminer

si des interférences phonémiques peuvent être repérées dans la situation de la parole dans la

parole. Pour cela, nous manipulerons le pourcentage de phonèmes communs entre la langue

des masqueurs paroliers et la langue de la parole cible (également langue native des

participants). Dans le cas où les participants sont sensibles à l’information phonémique des

masqueurs paroliers, plus ce pourcentage de phonèmes communs sera élevé, plus les

interférences phonémiques seront importantes, ce qui réduira l’intelligibilité de la parole cible.

Nous utiliserons des masqueurs paroliers en français, en gaélique irlandais et en italien. Le

pourcentage de phonèmes communs entre les langues cible et concurrente sera de 100% pour

les masqueurs paroliers français (langue native), de 60% pour les masqueurs paroliers italiens,

et de 18% pour les masqueurs paroliers en gaélique irlandais.

Partie théorique Intelligibilité de la parole dans une langue seconde

44

C) INTELLIGIBILITE DE LA PAROLE DANS UNE LANGUE SECONDE

La compréhension de la parole dans la parole est une tâche difficile. Les interférences

linguistiques produites par le bruit de parole concurrent sont en partie responsables de cette

difficulté en réduisant l’intelligibilité du message cible. Qu’en est-il des interférences

linguistiques lorsque le message cible est produit dans une langue seconde (L2), les

interférences linguistiques sont-elles plus pénalisantes ? Dans la partie expérimentale de cette

thèse, nous explorerons la situation de la parole dans la parole lorsque le message cible sera

produit dans la L2 des participants et nous examinerons les interférences linguistiques qui

interviennent dans cette situation d’écoute.

1. Intelligibilité d’une L2 dans le silence

Le nombre de personnes qui communiquent dans leur L2 est en augmentation. Par

exemple, il est maintenant fréquent de partir travailler à l’étranger et ainsi, d’être amené à

utiliser quotidiennement une langue autre que sa langue native. La compréhension de la

parole s’avère plus difficile lorsqu’elle est produite dans une L2 plutôt que dans la langue

native (Weber & Broersma, 2012). En effet, certains sons (plus précisément certains

contrastes phonétiques) restent plus difficiles à différencier que d’autres, et ce, même lorsque

l’on pratique la L2 depuis plusieurs années. De plus, un mot produit dans une L2 active un

plus grand nombre de compétiteurs, il est alors reconnu plus lentement qu’un mot parlé dans

une langue native.

1.1. Difficulté à différencier certains sons

La difficulté à identifier des mots présentés dans une L2 peut tout d’abord être

expliquée par le fait que certains sons de la L2 sont plus difficiles à différencier que d’autres

(Best, 1995 ; Flege, 1995 ; Strange, 1995 ; Broersma, 2005). La paire de consonnes /r/ - /l/

représente l’exemple le plus célèbre de sons difficiles à différencier pour des personnes

natives du japonais qui communiquent en anglais (Goto, 1971 ; Strange & Dittmann, 1984 ;

Iverson et al., 2003 ; Aoyama, Flege, Guion, Akahane-Yamada, & Yamada, 2004 ; Cutler &

Otake, 2004). En effet, les consonnes /r/ et /l/ n’étant pas présentes dans les langues asiatiques


45

telles que le japonais et le mandarin, les natifs de ces langues ont des difficultés à créer des

catégories phonémiques distinctes pour ces consonnes. Lorsque les mots anglais « rock » et

« lock », ou « road » et « load », qui ne diffèrent qu’au niveau du contraste /r/ - /l/ sont

présentés aux personnes natives du japonais, les deux mots sont considérés comme des

homophones. Plus précisément, les phonèmes /r/ et /l/ seraient assimilées au phonème /l/ car

ce dernier est phonétiquement plus proche du phonème japonais /ɾ/ que le phonème /r/.

Cette difficulté concerne également les voyelles. Par exemple, les personnes natives du

néerlandais qui communiquent en anglais sont en difficulté pour différencier les phonèmes /æ/

- /ɛ/ (Schouten, 1975 ; Broersma & Cutler, 2011). A l’aide d’une tâche d’amorçage « cross-

modal » (modalités auditive et visuelle), Broersma (2012) a présenté à des participants natifs

du néerlandais qui parlent l’anglais comme L2 ainsi qu’à des participants monolingues natifs

de l’anglais, des paires de mots anglais trisyllabiques tels que : daffodil – deficit. Pour chaque

paire, les deux mots commencent par le même onset mais la voyelle qui suit est différente ;

par exemple l’onset /d/ sera suivi de /æ/ ou de /ɛ/. Ce contraste a été choisi car, comme

mentionné ci-dessus, il est difficile à différencier pour des participants néerlandais qui

apprennent à parler l’anglais. Pour chaque paire, un seul mot constituera la cible et sera

présenté visuellement sur un écran d’ordinateur ; par exemple daffodil. Avant la présentation

visuelle de chaque mot cible, une amorce auditive est présentée aux participants. Trois types

d’amorces auditives ont été générés : (a) les amorces identiques qui correspondent exactement

au début du mot cible : daffo venant de daffodil ; (b) les amorces différentes qui

correspondent exactement au début de l’autre mot de la paire : defi venant de deficit ; (c) les

amorces contrôles qui correspondent au début d’un mot n’ayant pas de lien avec les mots de

la paire : moni venant de monitor. Les deux groupes de participants (participants monolingues

natifs de l’anglais et participants natifs du néerlandais qui parlent l’anglais comme L2) ont

réalisé une tâche de décision lexicale, ils devaient décider si le mot cible écrit sur l’écran

d’ordinateur existait dans la langue anglaise. Ainsi, les participants natifs de l’anglais ont

réalisé la tâche dans leur langue native, alors que les participants natifs du néerlandais ont

réalisé la tâche dans leur L2. Les résultats ont montré que les amorces identiques ont facilité

l’identification des mots cibles pour les deux groupes de participants. Pour les participants

natifs de l’anglais, les amorces différentes n’ont pas facilité l’identification des mots cibles.

En effet pour ces participants, les catégories phonémiques pour le contraste /æ/ - // étant

distinctes, le système auditif a perçu que la voyelle qui suivait l’onset était différente dans

l’amorce et dans le mot cible. Cependant, pour les participants natifs du néerlandais,


46

les amorces différentes ont facilité l’identification des mots cibles. Etant donné que le

contraste /æ/ - // est difficile à différencier pour ces participants, les amorces différentes ont

eu le même effet que les amorces identiques.

Créer des catégories phonémiques distinctes peut être difficile même lorsque l’on

atteint un haut niveau d’expertise de la L2 (Pallier, Bosch & Sebastian-Gallés, 1997 ;

Sebastian-Gallés & Soto-Faroco, 1999 ; Pallier, Colomé & Sebastian-Gallés, 2001). Par

exemple, Pallier et al. (2001) ont recruté des participants natifs de l’espagnol qui parlent le

catalan comme L2 depuis au moins 15 ans. Ils ont comparé leurs performances à celles de

participants natifs du catalan qui parlent l’espagnol comme L2. Ces deux groupes de

participants ont réalisé une tâche de décision lexicale sur des mots et pseudo-mots catalans

présentés auditivement. Les auteurs ont sélectionné des mots composés de contrastes catalans

difficiles à différencier pour des natifs de l’espagnol (/e/ - /ε/, /s/ - /z/). Sur la base de ces

contrastes, des paires de mots catalans ont été formées, les mots d’une paire n’étant différents

qu’au niveau de ces contrastes. Par exemple pour le contraste /e/ - /ε/, le mot composé du

phonème /e/ était présenté en premier, puis dans un autre essai, le mot composé du phonème

/ε/ était à son tour présenté. Les auteurs s’appuient sur le fait que dans une tâche de décision

lexicale, les effets de répétition sont robustes ; les temps de réaction sont toujours plus rapides

lorsqu’un même mot est présenté une seconde fois. Les participants natifs du catalan, c’est-à-

dire les participants qui ont réalisé la tâche dans leur langue native, n’ont pas obtenu des

temps de réaction plus courts pour le 2ème

mot de la paire, indiquant qu’ils ont traité

différemment les phonèmes /e/ et /ε/. En revanche, les participants natifs de l’espagnol ont eu

des temps de réaction plus courts pour le 2ème

mot de la paire qui a donc été considéré comme

une répétition du premier mot. Dans cette étude, bien que les participants natifs de l’espagnol

pratiquent le catalan depuis au moins 15 ans, les catégories phonémiques de certains

phonèmes ne sont toujours pas distinctes.

1.2. Plus de compétiteurs

Lorsqu’un auditeur ne parvient pas à réaliser des catégories phonémiques distinctes

dans sa L2, un plus grand nombre de compétiteurs serait activé lors de l’identification d’un

mot cible. Garcia Lecumberri, Cooke & Cutler (2010) ont fourni un exemple concernant des

personnes natives d’une langue asiatique qui apprennent à parler l’anglais. Etant donné que


47

ces personnes ont des difficultés pour différencier les sons /r/ et /l/, le début du mot anglais

« regis- » peut activer des candidats lexicaux qui commencent aussi bien par /l/ que par /r/,

par exemple : « legislate, register ». Ce n’est qu’à partir du sixième phonème qu’une

différenciation entre les deux mots va se faire (voir aussi Cutler, Weber & Otake, 2006).

De plus, un plus grand nombre de compétiteurs seraient activés lors de l’identification

de mots présentés dans une L2, ces derniers activeraient en parallèle à la fois des compétiteurs

du lexique mental de la L2, mais aussi des compétiteurs du lexique mental de la langue native.

Ceci a par exemple été mis en évidence par Weber & Cutler (2004) dans une étude utilisant

un paradigme d’eye-tracking qui permet d’exploiter les mouvements oculaires des

participants envers les objets présentés sur l’écran d’ordinateur (voir également Spivey &

Marian, 1999 ; Marian & Spivey, 2003a, 2003b ; Blumenfeld & Marian, 2007). Dans l’étude

de Weber & Cutler (2004), deux groupes de participants ont été testés : (a) des participants

natifs du néerlandais qui parlent l’anglais comme L2 ; (b) des participants natifs de l’anglais

qui ne connaissent pas le néerlandais. Les auteurs leur ont fait écouter un nom d’objet en

anglais qui était inséré à la fin d’une consigne ; par exemple « Click on the kitten », le mot

cible étant « kitten ». Ensuite, les participants devaient identifier cet objet cible sur un écran

où figuraient également trois autres objets. Pour un de ces trois objets, le nom en néerlandais

avait un début phonémiquement similaire au nom de l’objet cible : « kist », il s’agissait du

compétiteur. Pour ce même objet, le nom en anglais (« chest ») n’avait pas de lien

phonémique avec le nom de l’objet cible. Pour les deux autres objets, les noms en anglais et

en néerlandais n’avaient pas de lien avec le nom de l’objet cible ; ils étaient des distracteurs,

par exemple « flower / bloem » et « swing / schommel ». Les auteurs ont utilisé la localisation

et les temps de latence des mouvements des yeux vers les objets pour évaluer l’accès au

lexique du mot cible inséré à la fin de la consigne auditive.

Les résultats des participants natifs du néerlandais qui parlent l’anglais comme L2 sont

représentés dans la Figure 7 (graphique a), ceux des participants natifs de l’anglais

monolingues dans la Figure 7 (graphique b) ci-dessous.


48

Figure 7 : Pourcentages de fixations envers l’objet cible (« English target (kitten) »), l’objet

compétiteur (« Dutch compétiteur (kist) ») et les objets distracteurs (« Distractor (flower) »),

en fonction du temps (en ms). Le graphique (a) représente les résultats des participants natifs

du néerlandais qui parlent l’anglais comme L2 ; le graphique (b), les résultats des participants

anglais monolingues. (Extraite de Weber & Cutler, 2004).


49

Concernant les participants natifs du néerlandais (graphique a), les résultats ont montré

que les pourcentages de fixations envers l’objet cible, le compétiteur et les distracteurs ont

commencé à diverger à partir de 300 ms. Entre 300 et 800 ms, le pourcentage de fixations

était le plus important pour l’objet cible. Les résultats ont également révélé que pour cette

période, le pourcentage de fixations pour le compétiteur était significativement plus important

que celui obtenu pour les distracteurs, confirmant que la présentation auditive des mots cibles

produits dans la L2 des participants (anglais) a activé des compétiteurs de leur langue native

(néerlandais) ; et ce, même lorsque cette dernière n’était pas la langue avec laquelle la tâche

était réalisée (langue pertinente). Pour les participants anglais monolingues (graphique b), les

pourcentages de fixations entre les différents objets ont commencé à diverger avant 300 ms.

Rapidement, ils étaient significativement plus élevés pour l’objet cible. Les pourcentages de

fixations pour le compétiteur et pour les distracteurs n’étaient pas différents.

2. Intelligibilité d’une L2 dans le bruit

Les études décrites ci-dessus suggèrent qu’il est moins facile de communiquer dans

une L2 plutôt que dans une langue native du fait de la difficulté à différencier certains sons et

du fait de la présence d’un plus grand nombre de compétiteurs qui ralentissent l’identification

des mots. Pour ces raisons, les personnes qui communiquent dans leur L2 sont davantage

affectées par la présence de bruits concurrents que les personnes qui communiquent dans leur

langue native ; et ce, que le bruit concurrent soit purement acoustique ou qu’il soit composé

d’informations linguistiques et acoustiques. Notamment, les études de Garcia Lecumberri &

Cooke (2006) et de Cooke, Garcia Lecumberri & Barker (2008) confortent cette idée. (Voir

aussi Florentine, Buus, Scharf & Canevet, 1984 ; Florentine, 1985 ; Mayo, Florentine & Buus,

1997 ; Meador, Flege & MacKay, 2000 ; Rogers, Lister, Febo, Besing & Abrams, 2006.)

2.1. Plus difficile dans une L2 que dans une langue native

Garcia Lecumberri & Cooke (2006) ont proposé une tâche d’identification de

consonnes cibles à des participants natifs de l’anglais ainsi qu’à des participants natifs de

l’espagnol qui parlent l’anglais comme L2. Dans la partie B, nous avons décrit les résultats de

cette étude pour un des deux groupes, le groupe des participants natifs de l’anglais. Nous

rappelons rapidement le paradigme expérimental. Les consonnes cibles étaient présentées


50

dans le silence ou en présence de différents types de masqueurs : (1) des masqueurs paroliers

à 1 locuteur natif de l’anglais ou de l’espagnol ; (2) des masqueurs paroliers à 8 locuteurs

natifs de l’anglais ; (3) des masqueurs de bruit stationnaire. Les masqueurs paroliers

produisent des effets de masque énergétique et informationnel, les masqueurs de bruit

stationnaire produisent uniquement un effet de masque énergétique.

Les résultats des deux groupes de participants (participants natifs de l’anglais et participants

natifs de l’espagnol qui parlent l’anglais comme L2) sont représentés ci-dessous dans la

Figure 8.

Figure 8 : Pourcentages d’identifications correctes des consonnes cibles présentées : dans le

silence (« quiet »), en présence des masqueurs paroliers à un locuteur natif de l’anglais

(« english ») ou de l’espagnol (« spanish »), avec du bruit stationnaire (« ssn »), et des

masqueurs paroliers anglais à 8 locuteurs (« babble »). Les performances des participants

anglais monolingues sont indiquées par la lettre N, celles des participants natifs de l’espagnol

qui parlent anglais en L2 par les lettres NN. (Extraite de Garcia Lecumberri & Cooke, 2006).

Les auteurs ont observé un pattern de résultats similaire entre les deux groupes de

participants. L’ordre des performances, des plus élevées aux plus faibles, était le suivant :

dans le silence, avec les masqueurs paroliers à 1 locuteur (natif de l’anglais ou de l’espagnol),

avec les masqueurs de bruit stationnaire et enfin en présence des masqueurs paroliers anglais

à 8 locuteurs. Néanmoins, pour chaque condition expérimentale, les participants natifs de

l’espagnol qui parlent l’anglais comme L2 ont eu de plus faibles performances que les


51

participants natifs de l’anglais. Autrement dit, les participants qui ont réalisé la tâche dans leur

L2 (participants natifs de l’espagnol) ont davantage été affectés par la présence des

masqueurs. De plus, l’écart de performances entre les deux groupes de participants a

augmenté à mesure que la tâche devenait plus difficile. Cet écart était le plus important avec

les masqueurs paroliers anglais à 8 locuteurs. Contrairement aux masqueurs de bruit

stationnaire qui ne produisent qu’un effet de masque énergétique, les masqueurs paroliers

anglais à 8 locuteurs produisent en plus un effet de masque informationnel. Il apparaît ainsi

que les participants natifs de l’espagnol ont davantage souffert du masque informationnel que

les participants natifs de l’anglais.

Dans leur étude, Cooke et al. (2008) ont étudié la compréhension de la parole dans une

L2 en utilisant uniquement des masqueurs composés d’informations linguistiques et

acoustiques (masqueurs paroliers à 1 locuteur) et en manipulant le RSB. Des participants

natifs de l’espagnol qui parlent l’anglais comme L2 ainsi que des participants natifs de

l’anglais devaient identifier des phrases cibles anglaises, et plus précisément certains mots

présents dans ces phrases cibles, qui étaient masquées par 1 locuteur concurrent natif de

l’anglais. Ce dernier était identique ou différent du locuteur des phrases cibles (de même sexe

ou de sexe différent). Les valeurs de RSB manipulées étaient les suivantes : de -9 dB à +16

dB. Pour chaque condition expérimentale, les participants natifs de l’espagnol ont été plus

affectés par les masqueurs paroliers que les participants natifs de l’anglais. L’écart de

performances entre les deux groupes a augmenté à mesure que le RSB diminuait, c’est-à-dire

avec la diminution du niveau sonore du signal cible par rapport au niveau sonore du signal

concurrent ; la situation d’écoute devenant de plus en plus difficile. La Figure 9 ci-dessous

illustre les résultats de cette étude.


52

Figure 9 : Pourcentages d’identifications correctes des mots cibles en présence des

masqueurs paroliers à 1 locuteur identique à celui des phrases cibles (« same talker »),

différent mais de même sexe (« same gender »), de sexe différent (« different gender »). La

lettre N est utilisée pour les performances des participants natifs de l’anglais, et les lettres NN

pour les participants natifs de l’espagnol. (Extraite de Cooke et al., 2008).

2.2. Masqueurs paroliers dans une L2 versus dans une langue native

Dans la situation de la parole dans la parole, nous pouvons faire varier le niveau de

connaissances des participants pour la langue de la parole cible : les participants identifient la

parole cible produite dans leur langue native ou dans leur L2. Nous venons de voir que

l’intelligibilité d’une langue seconde est plus difficile que celle d’une langue native, quelque

soit la nature du bruit concurrent.

Il est également possible de faire varier le niveau de connaissances des participants pour la

langue des masqueurs paroliers. Jusqu’à présent (partie B), nous avons présenté des travaux

dont l’objectif était de mettre en évidence un effet de masque informationnel en manipulant la

langue des masqueurs paroliers ; celle-ci correspondait à la langue native des participants ou à

une langue qui leur était inconnue. Ainsi, les informations linguistiques présentes dans les

masqueurs paroliers étaient soit intelligibles, soit inintelligibles. Nous allons décrire l’étude de

Van Engen (2010), dans laquelle des masqueurs paroliers ont été générés dans deux langues

intelligibles pour les participants, leur langue native et leur langue seconde.


53

Van Engen (2010) a testé deux groupes de participants, des participants natifs du

mandarin qui parlent l’anglais comme L2, ainsi que des participants natifs de l’anglais. Dans

un premier temps, afin de régler le RSB, des phrases cibles anglaises insérées dans des

masqueurs de bruit stationnaire ont été présentées aux deux groupes de participants. L’auteur

utilise ainsi le « Hearing In Noise Test » (HINT, Nilsson, Soli & Sullivan, 1994) qui permet

d’estimer les valeurs de RSB pour lesquelles les participants peuvent identifier correctement

50% des mots constituant les phrases cibles. Van Engen a constaté qu’un RSB plus élevé était

nécessaire pour les participants natifs du mandarin que pour les participants natifs de

l’anglais, confirmant que les masqueurs sont plus efficaces lorsqu’il s’agit d’identifier de la

parole cible produite dans une L2 plutôt que dans une langue native. Voir la Figure 10 ci-

dessous.

Figure 10 : Valeurs de RSB nécessaires à 50% d’identifications correctes des phrases cibles,

pour les participants natifs de l’anglais (« English listeners ») et natifs du mandarin

(« Mandarin listeners »). (Extraite de Van Engen, 2010).

A l’issue de ce test, Van Engen a retenu deux valeurs de HINT (« RSB de base »), une pour

chaque groupe de participants. Ces valeurs de HINT ont été modulées de -6 dB à +3 dB, par

pas de 3 dB (HINT -6 dB, HINT -3dB, HINT +0 dB, HINT +3 dB). Ce procédé permet de

s’intéresser à l’effet de RSB sans se focaliser sur sa valeur.

Dans un deuxième temps, des phrases cibles anglaises étaient insérées dans des masqueurs

paroliers à 2 locuteurs générés en mandarin ou en anglais. Ainsi, pour les participants natifs

de l’anglais, la parole cible était produite dans leur langue native ; les masqueurs paroliers ont

été générés dans leur langue native (anglais) ou dans une langue inconnue (mandarin).


54

Concernant les participants natifs du mandarin qui parlent l’anglais comme L2, la parole cible

était produite dans leur L2, et les masqueurs paroliers étaient générés dans leur langue native

(mandarin) ou dans leur L2 (anglais) ; les informations linguistiques étaient intelligibles pour

les deux types de masqueurs. Les résultats sont représentés dans la Figure 11 ci-dessous.

Figure 11 : Pourcentages de mots cibles correctement identifiés en présence des masqueurs

paroliers anglais (« English babble ») et mandarins (« Mandarin babble »), pour les quatre

valeurs de HINT sélectionnées. Les performances des participants natifs de l’anglais sont

reportées à gauche, celles des participants natifs du mandarin à droite. (Extraite de Van

Engen, 2010).

Concernant les participants natifs de l’anglais, ils ont obtenu des performances

significativement plus élevées lorsque la langue des masqueurs paroliers était inintelligible

(mandarin) plutôt qu’intelligible (anglais). Cet effet de la langue des masqueurs a été observé

pour les valeurs de HINT les plus élevées. Concernant les participants natifs du mandarin qui

ont réalisé la tâche avec de la parole cible produite dans leur L2 (anglais), de meilleures

performances ont été observées avec les masqueurs paroliers en mandarin plutôt qu’en

anglais, et ce, uniquement pour les valeurs extrêmes de HINT (valeurs la plus basse et la plus

élevée). Autrement dit, les masqueurs paroliers produits dans la L2 des participants (anglais)

ont été plus efficaces que les masqueurs paroliers générés dans leur langue native (mandarin).

Il ressort de cette étude que les masqueurs paroliers générés dans la langue native des

participants et ceux générés dans leur langue seconde n’ont pas affecté de façon équivalente

l’intelligibilité de la parole cible produite dans la langue seconde des participants.

Dans cette thèse, nous manipulerons le niveau de connaissances des participants pour

la langue de la parole cible ainsi que le niveau de connaissances des participants pour la


55

langue des masqueurs paroliers. Nous testerons deux groupes de participants : des participants

natifs du français qui parlent l’italien comme L2 et des participants natifs de l’italien qui

parlent le français comme L2. Des mots cibles français seront insérés dans des masqueurs

paroliers générés en français, en irlandais et en italien. Ainsi, les participants natifs du français

devront identifier des mots cibles produits dans leur langue native alors que les participants

natifs de l’italien réaliseront la tâche dans leur L2. Concernant les masqueurs paroliers, ils

seront générés dans la langue native des participants (groupe 1 : français, groupe 2 : italien),

dans leur langue seconde (groupe 1 : italien, groupe 2 : français) ou dans une langue qui leur

est inconnue (groupes 1 et 2 : irlandais). Nous explorerons ainsi la situation de la parole dans

la parole lorsque le message cible sera produit dans la langue native ou dans la L2 des

participants, et nous déterminerons dans quelle situation d’écoute les interférences

linguistiques seront les plus efficaces (masqueurs paroliers générés dans la langue native, dans

la langue seconde ou dans une langue inconnue).

Partie théorique Synthèse et problématique générale

56

D) SYNTHESE ET PROBLEMATIQUE GENERALE

1. Synthèse

La situation de la parole dans la parole représente une situation d’écoute écologique.

Ainsi elle a suscité l’intérêt de nombreuses études, essentiellement dans le domaine de la

psycho-acoustique mais aussi, comme nous l’avons vu, dans le domaine de la

psycholinguistique.

Dans la situation de la parole dans la parole, deux types d’effets de masque ont été définis : un

effet de masque énergétique, qui correspond à des interférences entre les informations

spectrales et temporelles des signaux en compétition ; et un effet de masque informationnel

pour lequel des interférences interviennent entre les informations linguistiques des signaux

concurrents.

Un ensemble d’études s’est focalisé sur les phénomènes de ségrégation entre le signal

cible et le signal concurrent. Plus la ségrégation est facilitée, plus l’intelligibilité du message

cible est bonne. Plusieurs indices peuvent aider l’auditeur à réaliser la ségrégation. Nous

avons évoqué :

(a) le Rapport Signal sur Bruit entre le signal cible et le signal concurrent : plus le niveau

sonore du signal cible est élevé par rapport au niveau sonore du signal concurrent, plus

l’intelligibilité du signal cible est meilleure ;

(b) le nombre de locuteurs dans les masqueurs : plus il est important, plus l’effet de masque

du signal concurrent est efficace, ce qui réduit l’intelligibilité du message cible ;

(c) la fréquence fondamentale (F0) des différents locuteurs : l’intelligibilité du message cible

est améliorée lorsque le locuteur du signal cible et celui des masqueurs ont une F0 différente ;

(d) la localisation spatiale du signal concurrent par rapport à celle du signal cible : plus le

signal concurrent est éloigné du signal cible, plus les performances sont élevées.

Certains paramètres de la situation de la parole dans la parole ont été manipulés afin de

mettre en évidence un effet de masque informationnel. Notamment, différents types de

masqueurs ont été générés en plus des masqueurs paroliers : des masqueurs de bruit

stationnaire et des masqueurs de bruit fluctuant. Ces deux types de masqueurs sont générés à


57

partir de masqueurs paroliers, le bruit stationnaire n’en conserve que les informations

spectrales et le bruit fluctuant conserve les informations spectrales ainsi que les fluctuations

temporelles. C’est en observant des performances significativement plus faibles avec les

masqueurs paroliers plutôt qu’avec les masqueurs de bruit stationnaire ou de bruit fluctuant

que l’effet de masque informationnel produit par les masqueurs paroliers est mis en lumière ;

ces masqueurs étant les seuls à posséder des informations linguistiques.

Un effet masque informationnel a également été observé en faisant varier la langue dans

laquelle les masqueurs paroliers sont générés ; il peut s’agir de la langue native des

participants ou d’une langue qui leur est inconnue. L’intelligibilité de la parole cible est

meilleure avec des masqueurs paroliers produits dans une langue non connue ; les

informations linguistiques n’étant pas intelligibles pour les participants, elles n’interfèrent pas

sur l’intelligibilité de la parole cible.

Enfin, certains travaux ont cherché à identifier quels types d’informations

linguistiques interfèrent sur l’intelligibilité du message cible : les informations

sémantiques, les mots, les syllabes, les phonèmes. Nous avons présenté une première étude

(Boulenger et al., 2010) qui a mis en évidence des interférences d’ordre lexical en faisant

varier la fréquence d’occurrence des mots présents dans les masqueurs paroliers.

L’intelligibilité du message cible était plus élevée lorsque les masqueurs paroliers étaient

composés de mots peu fréquents que lorsqu’ils étaient composés de mots très fréquents, ces

derniers étant de plus forts compétiteurs. Dans une seconde étude (Brouwer et al., 2012), ce

sont des interférences sémantiques qui ont été mises en avant. Les masqueurs paroliers au

contenu sémantique incongru ont moins affecté l’intelligibilité du message cible que les

masqueurs paroliers dont le contenu sémantique était acceptable.

2. Problématique

Dans cette thèse, nous examinerons les interférences linguistiques qui interviennent

dans la situation de la parole dans la parole et nous chercherons à les caractériser. Notre

démarche se fera en trois étapes :

1) Lors de la première étape, des mots cibles français seront insérés dans des masqueurs

paroliers générés en français (langue native des participants) ou en gaélique irlandais (langue


58

inconnue). Notre objectif sera de vérifier que les résultats obtenus avec de la parole cible en

français répliquent ceux observés dans la littérature, à savoir un effet de masque plus

important pour des masqueurs paroliers produits dans la langue native des participants plutôt

que pour des masqueurs paroliers produits dans une langue inconnue. Nous manipulerons

également certains paramètres de la situation d’écoute, tels que le RSB entre le signal cible et

le signal concurrent ainsi que le nombre de locuteurs dans les masqueurs paroliers. Il sera

question d’identifier les conditions expérimentales qui nous permettront, dans les étapes

suivantes, d’explorer le plus favorablement possible les interférences linguistiques.

2) Dans la seconde étape, nous chercherons à déterminer s’il nous est possible de repérer

des interférences phonémiques dans la situation de la parole dans la parole. Pour cela, les

mots cibles seront insérés dans des masqueurs paroliers en français (langue native) ainsi que

dans des masqueurs paroliers en gaélique irlandais et en italien (deux langues inconnues).

Ainsi, le pourcentage de phonèmes communs entre la langue des masqueurs paroliers et la

langue native des participants sera manipulé (100% avec les masqueurs paroliers français,

80% avec ceux en italien, 18% avec ceux en irlandais). Nous testerons l’hypothèse selon

laquelle plus ce pourcentage est élevé, plus les interférences phonémiques seront importantes.

Nous utiliserons également des masqueurs de bruit fluctuant qui nous permettront d’analyser

plus finement l’hypothèse des compétitions phonémiques.

3) Enfin, dans la dernière étape, le niveau de connaissances des participants pour les

langues des masqueurs paroliers sera manipulé. Au lieu de ne tester que des participants

monolingues, nous présenterons notre paradigme expérimental à des participants natifs du

français qui parlent l’italien comme langue seconde, ainsi qu’à des participants natifs de

l’italien qui parlent le français comme langue seconde. Nous chercherons à déterminer si les

masqueurs paroliers générés dans la langue seconde et dans la langue native des participants

interfèreront de façon équivalente sur l’intelligibilité du message cible. Tester des participants

natifs de l’italien qui parlent le français comme langue seconde sera l’opportunité d’explorer

la situation de la parole dans la parole lorsque le message cible est produit dans une langue

seconde.

59

60

PARTIE EXPERIMENTALE

61

Partie expérimentale Expérience 1

62

E) EXPERIENCE 1

1. Objectifs

Dans cette thèse, nous nous intéressons aux interférences linguistiques qui

interviennent dans la situation de la parole dans la parole. Dans la partie théorique, nous avons

décrit des études qui ont manipulé la langue des masqueurs paroliers afin d’examiner les

interférences linguistiques. Il s’agissait d’utiliser la langue native des participants ou une

langue qui leur était inconnue. La parole cible, quant à elle, était produite dans leur langue

native. Il a été montré que l’intelligibilité de la parole cible est réduite lorsque la langue de la

parole concurrente est intelligible pour les participants plutôt que non intelligible. Ces travaux

ont été menés avec de la parole cible produite en allemand (Rhebergen et al., 2005) ou en

anglais (Garcia Lecumberri & Cooke, 2006 ; Van Engen & Bradlow, 2007 ; Calandruccio et

al., 2010b). Dans notre première expérience, nous explorerons la situation de la parole dans la

parole avec des mots cibles en français. Nous vérifierons que l’intelligibilité des mots cibles

français sera plus faible avec des masqueurs paroliers en français (langue native des

participants) plutôt qu’avec des masqueurs paroliers en gaélique irlandais, langue non connue

des participants (et donc non intelligible). Dans ce cas, nous aurons confirmé l’effet de la

langue des masqueurs mis en évidence dans la littérature.

Nous manipulerons également le Rapport Signal sur Bruit (RSB) entre les mots cibles

et les masqueurs paroliers ainsi que le nombre de locuteurs présents dans les masqueurs

paroliers. Nous utiliserons des valeurs de RSB de 0 dB et de -5 dB. En effet pour ces valeurs,

Van Engen & Bradlow (2007) ont observé des différences significatives entre les

performances obtenues avec les masqueurs paroliers en anglais (langue native) et celles

obtenues avec les masqueurs paroliers en mandarin (langue non connue). Dans notre

expérience, nous nous attendons tout d’abord à ce que les performances des participants

soient plus élevées à 0 dB plutôt qu’à -5 dB ; la situation d’écoute étant plus favorable avec

un RSB à 0 dB plutôt qu’à -5 dB puisque le niveau sonore des mots cibles sera équivalent à

celui des masqueurs paroliers plutôt qu’inférieur. Ensuite, dans le cas où l’effet de la langue

des masqueurs (français versus irlandais) est observé, nous examinerons s’il sera influencé par


63

le RSB : sera-t-il plus important pour une des deux valeurs de RSB manipulées (0 dB ou -5

dB) ?

Concernant le nombre de locuteurs présents dans les masqueurs paroliers, nous nous

appuierons sur les résultats des études de Van Engen & Bradlow (2007) et de Hoen et al.

(2007) et nous utiliserons des masqueurs paroliers à 2 et à 4 locuteurs. En effet, c’est avec 2

locuteurs dans les masqueurs que Van Engen & Bradlow (2007) ont observé des différences

significatives entre les performances obtenues avec les masqueurs paroliers anglais et celles

avec les masqueurs paroliers mandarins. Avec 6 locuteurs dans les masqueurs paroliers,

l’effet de la langue des masqueurs n’était plus présent. Ce résultat est dû au fait qu’avec 2

locuteurs, les informations linguistiques présentes dans les masqueurs paroliers sont plus

accessibles qu’avec 6 locuteurs et peuvent davantage interférer sur l’intelligibilité de la parole

cible. Plus le nombre de locuteurs dans le masqueur parolier augmente, plus la saturation

spectro-temporelle du signal est importante, ce qui réduit l’accès aux informations

linguistiques du masqueur parolier et l’effet de masque de ce dernier.

De leur côté, Hoen et al. (2007) ont évalué l’intelligibilité de mots cibles français dégradés par

des masqueurs paroliers français à 4, 6 et 8 locuteurs. Avec les masqueurs paroliers à 4

locuteurs, les participants ont retranscrit des mots présents dans les masqueurs paroliers à la

place des mots cibles. Ce type d’erreurs de retranscriptions n’a pas été observé avec les

masqueurs paroliers à 6 et 8 locuteurs. Les résultats de cette étude montrent, comme ceux de

l’étude de Van Engen & Bradlow (2007), qu’à partir d’un certain nombre de locuteurs dans le

masqueur, 6 locuteurs, l’accès aux informations linguistiques du signal concurrent est réduit,

rendant ainsi leur effet de masque plus faible. Nous utiliserons donc également des masqueurs

paroliers à 4 locuteurs.

Dans notre expérience, nous observerons si l’effet de la langue des masqueurs paroliers est

présent pour les masqueurs paroliers à 2 et 4 locuteurs et s’il varie en fonction du nombre de

locuteurs.

L’Expérience 1 a donc pour objectif de vérifier s’il est possible de répliquer l’effet de

la langue des masqueurs avec de la parole cible en français. La présence de cet effet nous

permettra d’observer un effet de masque informationnel et donc un effet des interférences

linguistiques. Il est aussi question de définir une situation expérimentale pertinente et adaptée

qui nous permette dès l’Expérience 2, d’explorer plus avant la nature des informations

linguistiques qui interfèrent sur l’intelligibilité du message cible. C’est pourquoi, pour le RSB


64

comme pour le nombre de locuteurs dans les masqueurs, nous manipulerons deux valeurs, 0

dB et -5 dB, 2 et 4 locuteurs. Pour la suite de nos travaux, nous conserverons les valeurs pour

lesquelles l’effet de la langue des masqueurs aura été le plus important, c’est-à-dire que nous

sélectionnerons les conditions d’écoute les plus favorables à l’étude des interférences

linguistiques.

2. Méthode

2.1. Stimuli

Cent trente-six stimuli ont été générés dans l’Expérience 1, en mixant chacun des 136

mots cibles à un masqueur parolier (composé de 2 ou de 4 locuteurs) qui était produit en

français ou en irlandais.

2.1.1. Mots cibles

Cent trente-six mots français dissyllabiques (annexe 1) ont été sélectionnés dans la

base de données Lexique 2 (New et al., 2004). La fréquence moyenne de ces noms communs

variait de 0,20 à 566,49 occurrences par million de mots ; la moyenne étant de 31,16 et

l’écart-type de 75,36.

Ces mots ont été prononcés par une locutrice de langue maternelle française âgée de 28 ans,

différente des locutrices enregistrées pour générer les masqueurs paroliers français.

L’enregistrement s’est déroulé dans une salle insonorisée du laboratoire Dynamique Du

Langage à Lyon à l’aide d’un microphone (Micro SE 2200A) et du logiciel enregistreur

Audacity. Chaque mot était sauvegardé dans un fichier au format .wav indépendant. Les

fichiers ont ensuite été normalisés à l’aide du logiciel Praat (Boersma & Weenink, 2013) ;

l’intensité moyenne de chacun des signaux (RMS) était mesurée puis ramenée à 70 dB-A,

niveau sonore moyen d’une discussion.

2.1.2. Masqueurs paroliers


65

Le roman Le Petit Prince, d’Antoine de Saint Exupéry, a été choisi pour réaliser les

masqueurs paroliers. Ce roman a été sélectionné car il a été traduit par des professionnels dans

de nombreuses langues dont le gaélique irlandais.

Les chapitres 1, 4, 5, 8 et 16 ont été sélectionnés car ils comportent peu de dialogues. Le but

étant d’obtenir des phrases avec peu d’intonation afin que certaines phrases du masqueur

n’attirent pas davantage l’attention du participant que d’autres phrases du masqueur. Ces

chapitres ont été enregistrés en français et en gaélique irlandais.

Masqueurs paroliers en français

Quatre locutrices et 6 locuteurs de langue maternelle française âgés de 22 à 32 ans ont

lu les chapitres sélectionnés. Les enregistrements étaient individuels et ont eu lieu dans une

salle insonorisée du laboratoire Dynamique Du Langage à Lyon. Le matériel était composé

d’un microphone (Micro SE 2200A) et du logiciel enregistreur Audacity. Chaque chapitre

constituait une piste et était sauvegardé au format .wav. Les enregistrements de chacun des

locuteurs ont été écoutés à l’aide du logiciel Praat. Les enregistrements de 2 locutrices et de 2

locuteurs dont le style parolier était standard et le plus naturel (pas de prosodie exagérée, pas

d’accent régional) ont été conservés.

Masqueurs paroliers en gaélique irlandais

Trois locutrices et 3 locuteurs de langue maternelle gaélique âgés de 20 à 31 ans ont lu

les chapitres sélectionnés. Les enregistrements étaient individuels et ont eu lieu dans une salle

d’enregistrements de musiques à la Radio Gaélique à Dublin. Le matériel était composé de

l’enregistreur numérique Zoom H2. Chaque chapitre constituait une piste et était sauvegardé

au format .wav. Les enregistrements de 2 locutrices et de 2 locuteurs ont été sélectionnés

selon les mêmes critères que pour les voix des masqueurs français.

Pour les 2 langues manipulées (français et gaélique irlandais), les enregistrements de

chacun des 4 locuteurs ont été traités avec Praat selon le protocole suivant : (a) suppression

des silences et des pauses excédant 500 ms, de façon à ce que l’apparition d’un mot cible ne

coïncide pas avec des minima d’énergie (phénomène appelé « écoute dans les vallées »,

Festen & Plomp, 1990 ; Gnansia et al., 2009) présents dans les fluctuations temporelles du

masqueur parolier ; (b) suppression des phrases contenant des erreurs de prononciation ou des

noms propres ; (c) normalisation du niveau sonore à 70 dB-A.


66

Afin d’éviter des différences dans les caractéristiques vocales des locutrices et des locuteurs

sélectionnés à travers les deux langues manipulées (français et gaélique irlandais), les

fréquences fondamentales (F0) des voix féminines françaises et irlandaises ont été

normalisées aux plus proches valeurs suivantes : 205 Hz et 225 Hz ; les voix masculines

françaises et irlandaises ont été normalisées aux plus proches valeurs de : 105 Hz et 125 Hz.

Ceci a été réalisé en utilisant le « built-in pitch manipulation tool » dans Praat. Les voix

féminines étaient fixées à des valeurs de F0 (205 Hz et 225 Hz) différentes de celle de la voix

cible (240 Hz) afin d’éviter des problèmes de ségrégation de la voix cible féminine parmi les

voix féminines concurrentes. Chaque enregistrement de chacun des locuteurs a ensuite été

attentivement écouté afin de vérifier que la normalisation ne les ait pas dégradés.

Un programme informatique réalisé sous Praat nous a permis d’extraire de façon aléatoire des

séquences de 4 secondes parmi les enregistrements de chacun des locuteurs dans les deux

langues manipulées. A partir de ces séquences de 4 secondes, nous avons généré des

masqueurs à 2 voix et à 4 voix en français et en gaélique irlandais. Les masqueurs français à 2

voix ont été générés en mixant une séquence de 4 sec de chacune des 2 locutrices (séquences

sélectionnées de façon aléatoire). La même procédure a été appliquée pour obtenir les

masqueurs irlandais à 2 voix. Les masqueurs français à 4 voix étaient le résultat du mixage

d’une séquence de 4 sec de chacun des 4 locuteurs. De même pour les masqueurs irlandais à 4

voix.

Afin de ne pas présenter plusieurs fois les mêmes séquences de masqueurs paroliers, 34

masqueurs paroliers à 2 locuteurs différents et 34 masqueurs paroliers à 4 locuteurs différents

ont été générés dans chacune des 2 langues (français et irlandais).

Chaque mot cible a été inséré à 2,5 sec du début d’un masqueur de 4 sec à l’aide du logiciel

Matlab. Tous les participants ont ainsi été exposés pendant la même durée au masqueur

parolier seul avant que le mot cible ne soit présenté, comme le montre la Figure 12.

Le Rapport Signal sur Bruit (RSB) a été fixé en utilisant à nouveau Matlab. Une condition

expérimentale (RSB à 0 dB) consistait à présenter les mots cibles avec le même niveau sonore

que les masqueurs et dans ce cas le stimulus (mot cible inséré dans un masqueur) était à 70


67

dB. Dans l’autre condition expérimentale (RSB à -5 dB), les mots cibles avaient un niveau

sonore inférieur que celui des masqueurs paroliers, dans ce cas les mots cibles étaient à 65 dB

et les masqueurs paroliers à 70 dB.

Figure 12 : Mot cible inséré à 2,5 sec dans un masqueur parolier de 4 sec à 4 voix (deux

femmes et deux hommes).

2.2. Conditions expérimentales

Dans l’Expérience 1, les variables manipulées étaient :

- L le facteur fixe à mesures répétées « Langue des masqueurs » à 2 modalités, français et

gaélique irlandais ;

- N le facteur fixe à mesures répétées « Nombre de locuteurs » dans le masqueur à 2

modalités, 2 locuteurs et 4 locuteurs ;

- R le facteur fixe à mesures répétées « Rapport Signal sur Bruit » à 2 modalités, -5 dB et 0

dB ;

- P le facteur aléatoire « Participants » à 40 modalités.

Il en résulte le plan expérimental suivant : P40*L2*N2*R2. Nous avions donc 8 conditions

expérimentales. Le plan d’analyse était identique au plan expérimental. La variable

dépendante correspondait au pourcentage de mots cibles correctement retranscrits.


68

2.3. Liste de mots

Parmi les 136 mots cibles sélectionnés, 8 ont été utilisés pour la phase d’entraînement,

un mot pour illustrer chaque condition expérimentale. Pour s’assurer que les 128 mots cibles

restants soient présentés dans chacune des 8 conditions expérimentales, 8 listes

expérimentales différentes ont été générées. Par exemple dans la liste 1, le mot « ballon » a

été présenté dans la condition « masqueur français, 2 locuteurs, -5 dB », dans la liste 2,

« ballon » a été présenté dans la condition « masqueur français, 2 locuteurs, 0 dB », dans la

liste 3 il a été présenté dans la condition « masqueur français, 4 locuteurs, -5 dB ». Dans les

listes 4, 5, 6, 7 et 8, il a été présenté respectivement, dans les conditions « masqueur français,

4 locuteurs, 0 dB », « masqueur irlandais, 2 locuteurs, -5 dB », « masqueur irlandais, 2

locuteurs, 0 dB », « masqueur irlandais, 4 locuteurs, -5 dB », « masqueur irlandais, 4

locuteurs, 0 dB ». Ainsi, à travers les 8 listes, chacun des 128 mots cibles a été présenté dans

toutes les conditions expérimentales. Chaque participant n’entendait qu’une seule liste de

sorte que les mots cibles ne soient présentés qu’une fois pour éviter les effets de répétition.

Ainsi, nous avions dans chacune des listes, 16 mots par condition expérimentale. A l’intérieur

de chacune des listes, l’ordre de présentation des stimuli (un mot cible inséré dans un

masqueur) était randomisé à chaque passation.

2.4. Procédure expérimentale

Les participants ont été testés individuellement dans une salle d’expérimentation face à

un écran d’ordinateur. Ils portaient un casque audio (Sennheiser HD 448) avec lequel les

stimuli ont été délivrés de façon diotique (présentation identique pour chacune des deux

oreilles) à un niveau d’écoute confortable (65 dB SPL), contrôlé à l’aide d’une oreille

artificielle. Le logiciel DMDx (Forster & Forster, 2003) a été utilisé pour la présentation des

stimuli. La tâche des participants consistait à écouter les stimuli, repérer le mot cible et le

retranscrire. La consigne était donnée oralement puis apparaissait à l’écran au début de

l’expérience.

« Une étoile va s’afficher au centre de l’écran. Puis vous entendrez une séquence sonore

composée d’un mot cible présenté dans différents types de bruits. Vous devez repérer ce mot.

Puis ‘Répondez’ s’inscrira sur l’écran. Vous devez écrire le mot que vous avez entendu.

Appuyez sur la barre espace pour passer à la séquence suivante ».


69

Chaque stimulus ne pouvait être entendu qu’une seule fois. Avant la phase test, l’expérience a

débuté par une phase d’entraînement durant laquelle les participants se familiarisaient au

mode de présentation des stimuli et à la voix cible. Chaque participant avait la possibilité de

débuter l’expérience dès qu’il le souhaitait en appuyant sur la barre espace. Il appuyait à

nouveau sur celle-ci après avoir retranscrit chaque mot cible, le stimulus suivant démarrait.

Les participants n’étaient pas limités dans le temps. L’expérience durait de 30 à 40 minutes.

2.5. Participants

Quarante participants de langue maternelle française, âgés de 18 à 30 ans ont passé

l’Expérience 1. Aucun ne connaissait le gaélique irlandais, aucun n’avait reçu d’enseignement

de cette langue. De plus, aucun ne souffrait de trouble auditif ni de trouble du langage. Tous

étaient volontaires et ont été dédommagés pour leur participation.

3. Résultats

Tous les participants et tous les mots cibles de la phase test ont été inclus dans

l’analyse, soit 40 participants et 128 mots cibles. Les réponses écrites des participants ont été

codées (soit correctes, soit fausses) puis transformées en performances numériques. Le

pourcentage de retranscriptions correctes par participant a été ainsi obtenu.

Les fautes d’orthographe n’ont pas été prises en compte dès lors qu’une syllabe était restituée

correctement au niveau phonologique. Par exemple, l’item « crapaud » a été considéré comme

correcte même si celui-ci a été écrit « crapeau ».

Dans le but d’effectuer une analyse de variance sur nos données, nous avons réalisé une

transformation arcsinus RAU sur les performances brutes collectées (mot reconnu = 1, mot

non identifié = 0). Cette transformation est préconisée par Studebaker (1985) afin d’obtenir

une répartition gaussienne des données et entrer ainsi dans les critères de validité de

l’ANOVA. Cette transformation des données en arcsinus RAU est généralement appliquée

dans les études portant sur la situation de la parole dans la parole (voir par exemple Van

Engen & Bradlow, 2007).


70

Une analyse de variance à mesures répétées a été menée sur les scores RAU, en considérant

comme variable aléatoire les participants et comme variables intra-sujets : la Langue des

masqueurs (à 2 modalités : le français et le gaélique irlandais), le Nombre de locuteurs (à 2

modalités : 2 et 4 locuteurs dans le masqueur) et le Rapport Signal sur Bruit (à 2 modalités : -

5 dB et 0 dB). Cette ANOVA a été réalisée sous le logiciel Statistica, comme toutes les

analyses de variance qui ont été effectuées dans la suite des travaux de cette thèse.

Pour la clarté, les pourcentages de réponses correctes ont été utilisés pour décrire et

représenter graphiquement les données. Ils sont notamment reportés dans le Tableau 4.

Tableau 4 : Pourcentages moyens de retranscriptions correctes des mots cibles français

obtenus dans chacune des huit conditions expérimentales. Les écart-types sont également

indiqués.

Masqueurs paroliers irlandais Masqueurs paroliers français

-5 dB 0 dB -5 dB 0 dB

Nb locuteurs 2 4 2 4 2 4 2 4

Moyennes 60,56 55,64 91,58 91,56 38,75 35,16 79,84 84,24

Ecart-types 11,60 13,66 6,83 6,42 12,60 15,16 11,37 8,45

3.1. Effets principaux

Effet de la Langue des masqueurs

Les résultats ont montré un effet principal de la Langue des masqueurs de 15,33% qui

est apparu significatif à l’analyse de variance (F(1,39) = 202.39, p < .001). En moyenne, les

pourcentages de retranscriptions correctes étaient plus faibles lorsque les masqueurs paroliers

étaient produits en français (59,5% ; écart-type (ET) = 25,69) plutôt qu’en gaélique irlandais

(74,83% ; ET = 19,64).

Effet du Rapport Signal sur Bruit

Les résultats ont également indiqué un effet principal du Rapport Signal sur Bruit de

39%. Cet effet est apparu significatif à l’analyse de variance (F(1,39) = 873.59, p < .001). De

plus faibles performances ont été obtenues lorsque le RSB était fixé à -5 dB (47,52% ; ET =

17,06) plutôt qu’à 0 dB (86,81% ; ET = 9,8).


71

Effet du Nombre de locuteurs

L’analyse de variance n’a révélé aucun effet significatif du Nombre de locuteurs dans

le masqueur (F(1,39) = 0.68, n.s.). En effet, les performances moyennes des participants

étaient très proches qu’il y ait 2 locuteurs (67,69% ; ET = 22,79) ou 4 locuteurs concurrents

(66,64% ; ET = 25,38).

3.2. Interactions simples et double

Langue des masqueurs * RSB

L’ANOVA nous a indiqué une interaction simple significative entre le facteur Langue

des masqueurs et le facteur RSB (F(1,39) = 22.23, p < .001). Les comparaisons post-hoc

réalisées avec le test HSD de Tukey ont montré que l’effet de la Langue des masqueurs était

significatif à -5 dB (p = .0001) ainsi qu’à 0 dB (p = .0001). Comme le montre la Figure 13,

l’effet de la Langue des masqueurs était plus important à -5 dB (21%) plutôt qu’à 0 dB (10%).

Figure 13 : Effet de la Langue des masqueurs paroliers (français et gaélique irlandais) sur les

pourcentages moyens de retranscriptions correctes des mots cibles en fonction du RSB (-5 dB

et 0 dB). Les erreurs standard ont été reportées. Le symbole ‘ * ’ signale une différence

significative entre les masqueurs paroliers français et irlandais à -5 dB ainsi qu’à 0 dB.


72

RSB * Nombre de locuteurs

L’ANOVA a mis en évidence une interaction simple significative entre les facteurs

RSB et Nombre de locuteurs (F(1,39) = 5.79, p = .02). Les comparaisons post-hoc réalisées

avec le test HSD de Tukey ont montré que l’effet du RSB était significatif avec 2 locuteurs

dans le masqueur (p = .0001) ainsi qu’avec 4 locuteurs (p = .0001). Cet effet du RSB était de

43% avec 4 locuteurs et de 38% avec 2 locuteurs.

Langue des masqueurs * Nombre de locuteurs

L’interaction simple entre le facteur Langue des masqueurs et le facteur Nombre de

locuteurs n’est pas ressortie significative lors de l’ANOVA (F(1,39) = 1.82, n.s.).

L’analyse de variance n’a pas révélé d’interaction double significative entre les trois facteurs

manipulés (F(1,39) = 0,49, n.s.).

4. Discussion

4.1. Rappel des objectifs

L’Expérience 1 a évalué l’intelligibilité de mots cibles français insérés dans des

masqueurs paroliers composés de 2 ou de 4 locuteurs qui parlaient dans la langue native des

participants (français) ou dans une langue qui leur était inconnue (gaélique irlandais). Le

niveau sonore des mots cibles était identique à celui des masqueurs paroliers (0 dB) ou

inférieur (-5 dB).

Tout d’abord, nous voulions déterminer si l’intelligibilité des mots cibles français serait plus

faible avec les masqueurs paroliers français plutôt qu’avec les masqueurs paroliers irlandais.

Nous voulions aussi vérifier que les performances des participants seraient plus faibles avec

un RSB de -5 dB entre les mots cibles et les masqueurs paroliers plutôt qu’avec un RSB à 0

dB. Dans le cas où l’effet de la Langue des masqueurs serait significatif, il était question de

déterminer si cet effet serait plus important pour une des deux valeurs de RSB (-5 dB et 0 dB).

Il s’agissait enfin d’examiner si le nombre de locuteurs dans le masqueur (2 ou 4 locuteurs)

allait faire varier l’effet de la Langue des masqueurs.


73

4.2. Effet de la Langue des masqueurs

L’analyse des résultats a mis en évidence une plus faible intelligibilité des mots cibles

français lorsque les masqueurs paroliers étaient produits en français plutôt qu’en gaélique

irlandais. Autrement dit, la situation d’écoute était plus difficile lorsque les masqueurs

paroliers étaient produits dans la langue native des participants (français) plutôt que dans une

langue qui leur était inconnue (gaélique irlandais).

Cet effet de la Langue des masqueurs a tout d’abord été mis en évidence par Rhebergen et al.

(2005), lorsque des participants natifs de l’allemand ont moins bien identifié des phrases

cibles allemandes dégradées par des masqueurs paroliers allemands plutôt que suédois (langue

inconnue des participants). L’effet de la Langue des masqueurs a également été testé auprès

de participants natifs de l’anglais lors de tâches d’intelligibilité de paroles cibles anglaises

(des consonnes dans l’étude de Garcia Lecumberri & Cooke (2006), des phrases pour Van

Engen & Bradlow (2007) et Calandruccio et al. (2010b)). L’effet a été retrouvé puisque de

plus faibles performances ont été observées avec les masqueurs paroliers générés dans la

langue native des participants (anglais) plutôt qu’avec les masqueurs générés dans une langue

inconnue des participants, telle que l’espagnol (Garcia Lecumberri & Cooke, 2006), le

mandarin (Van Engen & Bradlow, 2007), le croate (Calandruccio et al., 2010b). Dans

l’Expérience 1, nous avons confirmé l’effet de la Langue des masqueurs avec des participants

natifs du français et des mots cibles français.

Lorsque les masqueurs paroliers sont produits dans la langue native des participants, les

informations linguistiques présentes dans les masqueurs paroliers sont intelligibles et entrent

en compétition avec les informations linguistiques de la parole cible. Plus précisément,

certains mots vont être extraits des masqueurs paroliers et vont être identifiés. Pendant leur

identification, des candidats lexicaux vont être activés et vont entrer en compétition. Ces

compétitions linguistiques vont interférer sur l’identification des mots cibles. Les masqueurs

paroliers produisent alors un effet de masque informationnel qui s’ajoute à l’effet de masque

énergétique.

L’effet de masque informationnel a été exploré par Calandruccio, Dhar & Bradlow (2010a),

en proposant à des participants natifs de l’anglais une tâche d’intelligibilité avec des phrases

cibles anglaises et cinq types de masqueurs paroliers, chacun avec un niveau d’intelligibilité

différent. Plus précisément, pour deux conditions extrêmes d’intelligibilité, des masqueurs


74

paroliers ont été générés en anglais (langue native des participants) ou en mandarin (langue

inconnue des participants) par des locuteurs natifs de ces langues (conditions expérimentales

identiques à celles testées dans l’étude de Van Engen & Bradlow (2007)). Les masqueurs

paroliers anglais étaient alors totalement intelligibles pour les participants et les masqueurs

paroliers en mandarin totalement inintelligibles. Pour trois conditions intermédiaires

d’intelligibilité, des masqueurs paroliers anglais faiblement, modérément et fortement

intelligibles ont été produits. Pour cela, les auteurs ont demandé à des locuteurs natifs du

mandarin de parler dans leur langue seconde : l’anglais. Leurs productions dans la langue

anglaise ont été définies comme étant faiblement, modérément ou fortement intelligibles. Ces

cinq conditions d’intelligibilité ont permis aux auteurs de tester l’hypothèse selon laquelle

l’intelligibilité de la parole cible diminuerait avec l’augmentation du niveau d’intelligibilité

des masqueurs paroliers. Les résultats ont révélé que la situation d’écoute était la plus difficile

avec les masqueurs paroliers anglais générés par les locuteurs natifs de l’anglais ; autrement

dit lorsque les masqueurs paroliers étaient totalement intelligibles. En ce qui concerne les

masqueurs paroliers anglais produits par les locuteurs natifs du mandarin (faiblement,

modérément et fortement intelligibles), l’intelligibilité des phrases cibles a significativement

diminué avec l’augmentation du niveau d’intelligibilité des masqueurs. Finalement, les

différences de performances observées dans cette étude peuvent être expliquées par le niveau

d’intelligibilité des masqueurs paroliers. Plus les masqueurs paroliers étaient intelligibles, plus

les interférences linguistiques entre les deux flux de parole concurrents étaient importantes

(effet de masque plus important), diminuant ainsi l’intelligibilité des phrases cibles.

Dans l’Expérience 1, lors du codage des réponses écrites des participants, nous avons

observé, parmi les erreurs commises, que des mots présents dans les masqueurs paroliers

français ont été retranscrits à la place des mots cibles français. Nous appelons ce type

d’erreurs de retranscription des intrusions. Ces dernières ont déjà été signalées dans les études

évoquées précédemment (notamment dans l’étude de Van Engen & Bradlow, 2007). Lorsque

les masqueurs paroliers sont générés dans une langue intelligible pour les participants, les

informations linguistiques de ces masqueurs paroliers, et plus précisément les mots, font

intrusion pendant le traitement de la parole cible.

A partir de ces observations, Van Engen & Bradlow (2007) ont voulu déterminer si les

interférences linguistiques ne concernaient que les informations du niveau lexical (mots) ou si

des informations du niveau sous-lexical (phonèmes, syllabes) seraient également impliquées.


75

Pour répondre à cette question, les auteurs ont masqué des phrases cibles anglaises avec deux

types de masqueurs paroliers anglais : un premier type avec des phrases correctes, un second

type composé de phrases incorrectes obtenues en remplaçant certains mots par des pseudo-

mots (manipulation des onsets, codas ou voyelles). La tâche des participants étaient de

retranscrire les phrases cibles anglaises. Les résultats n’ont montré aucune différence

significative entre les performances obtenues avec les deux types de masqueurs paroliers

anglais, suggérant que les intrusions ne concerneraient pas uniquement les informations du

niveau lexical ; les informations sous-lexicales encore présentes dans les pseudo-mots

entreraient également en interférence lors du traitement des phrases cibles.

Cependant, les auteurs ont fait remarquer que les pseudo-mots utilisés dans cette expérience

étaient très similaires aux mots ; en effet, ils ont été obtenus en ne remplaçant que certains

phonèmes (par exemple la phrase : « Your tedious beacon lifted our cab » est devenue « Your

bedious reacon loofted our bab »). Cette similarité entre les pseudo-mots et les mots a pu

entraîner une activation du lexique lorsque les pseudo-mots étaient présentés. Ici, dans

l’exemple, le deuxième mot de la phrase sémantiquement correcte « tedious » a été remplacé

par le pseudo-mot « bedious », or le début de ce pseudo-mot a pu activer le mot « bed ».

Effectivement, les auteurs ont noté que les participants avaient fréquemment retranscrit des

mots existants qui ressemblaient aux pseudo-mots présents dans les masqueurs paroliers.

Cette similarité pourrait expliquer l’absence de différence entre les performances obtenues

avec les deux types de masqueurs (phrases correctes vs. phrases constituées de pseudo-mots).

Ainsi, afin de déterminer si les interférences linguistiques n’impliquent que des informations

du niveau lexical ou si des informations du niveau sous-lexical sont également impliquées,

d’autres paradigmes expérimentaux peuvent être élaborés. Dans l’Expérience 2, notre objectif

sera de tester si les interférences linguistiques ont lieu au niveau phonémique.

Pour les masqueurs paroliers produits dans une langue intelligible (français), nous

avons observé qu’un effet de masque informationnel était présent en plus d’un effet de

masque énergétique ; cela étant confirmé par le fait que certains mots présents dans les

masqueurs paroliers français ont été retranscrits à la place des mots cibles français. En

revanche, pour les masqueurs paroliers générés dans la langue inconnue des participants

(irlandais), les résultats ne nous permettent pas d’exclure la possibilité que ces masqueurs

paroliers puissent aussi produire un effet de masque informationnel. Les résultats ont

uniquement montré que les pourcentages de retranscriptions correctes étaient


76

significativement plus élevés avec les masqueurs paroliers irlandais plutôt qu’avec les

masqueurs paroliers français, et qu’aucun mot appartenant aux masqueurs paroliers irlandais

n’a été retranscrit à la place des mots cibles français (cela étant expliqué par le fait que

l’irlandais est une langue inintelligible pour les participants). Or, nous pourrions envisager

que les phonèmes présents dans le signal de parole concurrent contribuent à la dégradation de

l’intelligibilité de la parole cible. En effet, chaque langue possède des phonèmes qui lui sont

propres et des phonèmes qu’elle partage avec d’autres langues. D’après Maddieson, Flavier,

Marsico & Pellegrino (2011), 18% des phonèmes français seraient présents dans l’inventaire

phonémique du gaélique irlandais. Ainsi, même si les informations lexicales des masqueurs

paroliers irlandais sont inintelligibles pour les participants, ces derniers pourraient traiter les

phonèmes français présents dans les masqueurs paroliers irlandais. Ces phonèmes entreraient

en compétition avec les phonèmes des mots cibles français. Dans l’Expérience 2, nous

testerons cette hypothèse plus avant.

4.3. Effet du Rapport Signal sur Bruit

L’Expérience 1 a mis en évidence un effet significatif du Rapport Signal sur Bruit

(RSB), avec des performances significativement plus faibles à -5 dB plutôt qu’à 0 dB. La

situation d’écoute était donc plus difficile lorsque le niveau sonore des mots cibles était

inférieur au niveau sonore des masqueurs paroliers plutôt qu’équivalent. Ceci est cohérent

avec les résultats observés dans la littérature selon lesquels l’intelligibilité de la parole cible

serait influencée par le niveau de RSB fixé entre les deux flux concurrents ; plus le niveau

sonore de la parole cible serait faible par rapport au niveau sonore de la parole concurrente

(plus le RSB est faible), plus l’intelligibilité de la parole cible serait réduite. Par exemple,

dans une tâche d’intelligibilité de phrases cibles anglaises dégradées par des masqueurs

paroliers anglais composés de 2 ou de 3 locuteurs, Brungart (2001) a fait varier le RSB entre

les deux flux de parole concurrents par pas de 3 dB, de +15 dB à -12 dB. Il a observé une

diminution progressive des performances à mesure que le RSB diminuait. Hoen et al. (2007)

se sont également intéressés à cet effet du RSB en fixant le RSB entre des mots cibles français

et des masqueurs paroliers français à +6, +3, 0 ou -3 dB. La difficulté à récupérer le message

cible a augmenté progressivement avec la diminution du RSB.


77

Les résultats de l’Expérience 1 ont également montré une interaction significative entre les

facteurs Langue des masqueurs et RSB. L’effet de la Langue des masqueurs (taux de

retranscriptions correctes significativement plus élevés avec les masqueurs paroliers irlandais

qu’avec les masqueurs paroliers français) était présent pour les deux valeurs de RSB

manipulées (-5 dB et 0 dB), et celui-ci était plus important à -5 dB plutôt qu’à 0 dB.

Autrement dit, l’écart de performances observé entre les masqueurs paroliers français et

irlandais a été fonction du RSB fixé entre les deux flux de paroles concurrents ; c’est lorsque

la situation d’écoute était la plus difficile (à -5 dB) que l’écart de performances était le plus

important.

Ce résultat est en accord avec les résultats de la littérature. En effet, d’autres études ont

également mis en évidence que la situation d’écoute à -5 dB est la plus favorable pour révéler

les différences entre les effets de masque des langues manipulées (langue native des

participants versus langue inconnue). En effet, Van Engen & Bradlow (2007) puis

Calandruccio et al. (2010a) ont observé des effets de masque significativement différents

entre des masqueurs paroliers anglais et mandarins uniquement lorsque le RSB était fixé à -5

dB. Dans l’étude de Van Engen & Bradlow (2007), l’intelligibilité de phrases cibles anglaises

était évaluée lorsque ces dernières étaient insérées dans les masqueurs paroliers anglais et

mandarins à 2 locuteurs. Pour un groupe de participants, le RSB était d’abord fixé à 0 dB puis

à -5 dB. Les auteurs ont observé des performances significativement plus faibles avec les

masqueurs paroliers anglais plutôt qu’avec les masqueurs paroliers mandarins uniquement à -

5 dB ; cette différence significative de performances n’était pas présente lorsque le RSB était

de 0 dB. Calandruccio et al. (2010a) ont eux aussi comparé les effets de masque de masqueurs

paroliers anglais et mandarins sur l’intelligibilité de phrases cibles anglaises avec des RSB de

-5 dB et de -3 dB. Ces auteurs ont donc testé un RSB de -3 dB qui est plus proche de -5 dB

que le RSB de 0 dB utilisé dans l’étude ci-dessus. Calandruccio et al. (2010a) ont retrouvé des

performances significativement différentes entre les masqueurs paroliers anglais et mandarins

à -5 dB mais pas à -3 dB.

En tenant compte des résultats des deux études ci-dessus ainsi que ceux observés dans

l’Expérience 1, nous avons choisi, pour l’Expérience 2, de poursuivre notre étude de la

situation de la parole dans la parole en fixant le RSB entre les mots cibles français et les

masqueurs paroliers uniquement à -5 dB. Cette situation d’écoute semble être plus favorable

pour explorer plus avant les interférences linguistiques entre les deux flux de parole


78

concurrents et notamment pour déterminer si celles-ci peuvent avoir lieu au niveau

phonémique.

4.4. Effet du Nombre de locuteurs

Dans l’Expérience 1, l’effet principal du Nombre de locuteurs dans le masqueur n’est

pas ressorti significatif à l’ANOVA, suggérant que les participants n’ont pas été plus affectés

par les masqueurs paroliers à 4 locuteurs que par ceux composés de 2 locuteurs. Les résultats

nous ont également indiqué que l’effet de la Langue des masqueurs était présent avec 2 et 4

locuteurs dans les masqueurs, mais qu’il n’était significativement pas différent selon le

nombre de locuteurs. Tout d’abord, cette absence d’interaction significative entre les facteurs

Langue des masqueurs et Nombre de locuteurs pourrait être due au fait que dans les deux

situations d’écoute (2 et 4 locuteurs), le niveau de saturation spectro-temporelle du masqueur

parolier est suffisamment faible pour que les informations linguistiques qui y sont présentes

puissent interférer efficacement sur l’intelligibilité de la parole cible. Ensuite, cette absence

d’interaction significative ne nous indique pas un nombre de locuteurs optimal avec lequel il

convient de générer les masqueurs paroliers afin d’obtenir une situation d’écoute favorable

pour explorer les interférences linguistiques. Comme nous devions faire un choix afin de

réduire le nombre de conditions expérimentales dans l’Expérience 2, nous avons décidé

d’utiliser uniquement les masqueurs paroliers à 4 locuteurs pour lesquels les caractéristiques

vocales des locuteurs sont moins prépondérantes que dans la situation à 2 locuteurs dans les

masqueurs paroliers. En effet, il a été montré qu’avec 2 locuteurs, les participants peuvent

s’aider de la fréquence fondamentale (F0) des différents locuteurs pour mieux extraire le

message cible (voir par exemple Brungart et al., 2001).

4.5. Conclusions

A présent que nous avons répliqué l’effet de la Langue des masqueurs mis en évidence

dans la littérature avec de la parole cible française et des masqueurs paroliers français et

irlandais, nous pouvons, dans l’expérience suivante, explorer plus avant les interférences

linguistiques qui ont lieu entre les deux flux de parole concurrents. Plus précisément, nous

allons tester l’hypothèse selon laquelle les interférences linguistiques impliqueraient les

informations d’ordre phonémique. Les résultats de l’Expérience 1 nous ont indiqué que la


79

situation d’écoute avec un RSB de -5 dB entre le signal cible et le signal concurrent nous

permettrait d’explorer les compétitions phonémiques le plus favorablement possible. Quant au

nombre de locuteurs présents dans les masqueurs paroliers, l’effet de la Langue des

masqueurs n’a pas varié avec 2 ou 4 locuteurs. Toutefois, il nous semble que la situation la

plus appropriée pour examiner les compétitions phonémiques soit celle où 4 locuteurs

composent les masqueurs paroliers, car les caractéristiques vocales des locuteurs concurrents

y sont moins prépondérantes que dans les masqueurs paroliers à 2 locuteurs.


80

F) EXPERIENCE 2

1. Objectifs

Dans l’Expérience 2, notre objectif est de caractériser les interférences linguistiques

qui ont lieu entre la parole cible et la parole concurrente. Plus précisément, nous cherchons à

déterminer si les masqueurs paroliers produisent des interférences qui impliquent les

informations linguistiques d’ordre phonémique.

Dans l’Expérience 1, nous avons utilisé une tâche d’intelligibilité sur des mots cibles français

et nous avons identifié une situation d’écoute qui semble être favorable pour tester

l’hypothèse des compétitions phonémiques : des mots cibles insérés dans des masqueurs

paroliers à 4 locuteurs avec un Rapport Signal sur Bruit (RSB) de -5 dB. Dans l’Expérience 2,

nous prenons pour base cette situation d’écoute et nous ajoutons certains paramètres,

notamment une troisième langue (l’italien) ainsi qu’un deuxième type de masqueurs (des

masqueurs de bruit fluctuant).

En plus du français et du gaélique irlandais, déjà présents dans le paradigme

expérimental, nous incluons l’italien en tant que langue non connue des participants (langue

non intelligible), au même titre que l’irlandais. Néanmoins, d’après leur inventaire

phonémique, ces deux langues ne sont pas aussi proches de la langue native des participants

(le français). D’après Maddieson et al. (2011), la langue française possède 35 phonèmes (14

voyelles et 21 consonnes) et l’italien en possède 30 (7 voyelles et 23 consonnes). Nous

retrouvons 18 phonèmes du français (7 voyelles et 11 consonnes) dans l’inventaire

phonémique de l’italien, soit 60% de phonèmes communs entre la langue native et l’italien.

Le gaélique irlandais possède 69 phonèmes (20 voyelles, 45 consonnes et 4 semi-consonnes),

nous retrouvons 13 phonèmes français (4 voyelles et 9 consonnes) dans l’inventaire

phonémique de l’irlandais, soit 18% de phonèmes communs entre la langue native et le

gaélique irlandais. Sur la base de ces inventaires phonémiques, l’italien est une langue plus

proche du français que le gaélique irlandais.

Bien que, dans cette expérience, nous nous focalisons sur la distance phonémique de la langue

concurrente avec la langue native des participants, il convient de noter que l’italien est

également proche du français par son origine et son système rythmique (voir Tableau 5). En


81

effet, alors que le gaélique irlandais est une langue celtique et une langue accentuelle, l’italien

est une langue romane et une langue syllabique comme le français (Ramus, 1999a, 1999b).

Tableau 5 : Principales caractéristiques des trois langues manipulées dans l’Expérience 2.

français italien gaélique irlandais

Distance phonémique 100% 60% 18%

Rythme langue syllabique langue syllabique langue accentuelle

Origine langue romane langue romane langue celtique

Dans l’Expérience 2, des masqueurs paroliers seront donc générés dans la langue native des

participants (français) ainsi que dans deux langues qui leur sont inconnues : l’italien qui est

phonémiquement proche du français et l’irlandais qui est phonémiquement éloigné du

français. Nous voulons tout d’abord confirmer l’effet de la langue des masqueurs paroliers et

observer si les pourcentages de retranscriptions correctes des mots cibles français seront plus

faibles avec les masqueurs paroliers français (langue native) plutôt qu’avec les masqueurs

paroliers irlandais et italiens (langues inconnues). Ensuite, nous voulons déterminer si la

distance phonémique de l’irlandais et de l’italien avec la langue native des participants

(français) influencera les performances des participants. Jusqu’à présent, seule l’opposition

entre une langue connue et une langue non connue a été testée. Les pourcentages de

retranscriptions correctes seront-ils plus faibles lorsque les masqueurs paroliers seront générés

en italien plutôt qu’en gaélique irlandais ? C’est-à-dire lorsque les masqueurs paroliers seront

produits dans une langue concurrente qui est phonémiquement proche de la langue native

(italien) plutôt que dans une langue phonémiquement éloignée (irlandais). Nous testerons

ainsi l’hypothèse des compétitions phonémiques selon laquelle plus le pourcentage de

phonèmes communs entre la langue native et la langue concurrente est important, plus le

pourcentage de phonèmes identifiés dans le masqueur parolier sera important ; ce qui

engendrera des compétitions phonémiques plus nombreuses, rendant ainsi la situation

d’écoute plus difficile.

Dans la situation de la parole dans la parole, les masqueurs paroliers produisent un

effet de masque énergétique mais aussi un effet de masque informationnel. L’effet de masque

énergétique correspond à un recouvrement (au moins partiel) des informations spectro-

temporelles du signal concurrent sur celles du signal cible. Quant à l’effet de masque

informationnel, il reflète, dans la situation de la parole dans la parole, les interférences


82

produites par les informations linguistiques du signal concurrent sur l’intelligibilité des

informations linguistiques du signal cible. Dans l’Expérience 2, nous allons différencier deux

types d’interférences produits par le masque informationnel : les interférences qui impliquent

les informations linguistiques de bas niveau (telles que le rythme) et celles qui impliquent les

informations linguistiques de haut niveau (phonèmes, syllabes, mots). En dissociant ces deux

types d’interférences, nous pourrons examiner plus précisément si des compétitions au niveau

phonémique ont lieu, les phonèmes étant des informations linguistiques de haut niveau. Pour

cela, nous produirons des masqueurs de bruit fluctuant en plus des masqueurs paroliers

(Festen & Plomp, 1990). Les masqueurs de bruit fluctuant seront générés à partir des

masqueurs paroliers français, irlandais et italiens, de telle sorte qu’ils partagent les mêmes

informations acoustiques (spectrales) et linguistiques de bas niveau (fluctuations temporelles

lentes) que les masqueurs paroliers, mais en supprimant les informations linguistiques de haut

niveau. Ainsi, lorsque pour une langue, des performances significativement différentes seront

observées entre les deux types de masqueurs (parolier versus bruit fluctuant), cela suggèrera

que les informations linguistiques de haut niveau présentes dans le masqueur parolier auront

participé à la dégradation des mots cibles français en plus des informations acoustiques et

linguistiques de bas niveau. Parmi les informations linguistiques de haut niveau se trouvent

des phonèmes mais aussi des syllabes, des mots. Alors dans le cas où les compétitions

linguistiques impliqueraient les phonèmes, nous nous attendons à ce que l’effet des

informations linguistiques de haut niveau des masqueurs paroliers soit lié au pourcentage de

phonèmes communs entre la langue concurrente et la langue native (effet plus important avec

les masqueurs paroliers français, plus faible avec les masqueurs paroliers italiens, encore plus

faible avec les masqueurs paroliers irlandais). Si de tels résultats sont observés, ils indiqueront

que les masqueurs paroliers générés dans une langue inintelligible pour les participants

(irlandais et italien) auront produit des interférences impliquant des informations linguistiques

sous-lexicales telles que les phonèmes.

2. Méthode

2.1. Stimuli


83

Quatre-vingt-quatre stimuli ont été utilisés dans l’Expérience 2. Chacun des 84 mots

cibles a été inséré dans un masqueur (parolier ou de bruit fluctuant) qui était produit en

français, en irlandais ou en italien.

2.1.1. Mots cibles

Quatre-vingt-quatre mots français dissyllabiques (annexe 2) ont été sélectionnés parmi

les 136 mots cibles utilisés dans l’Expérience 1. Les mots ont été sélectionnés de sorte qu’ils

soient équilibrés en fréquence (moyenne = 23,97 ; ET = 48,56).

2.1.2. Masqueurs paroliers

Masqueurs paroliers en français et en gaélique irlandais

Dans l’Expérience 2, 14 masqueurs paroliers français à 4 voix étaient nécessaires.

Nous les avons sélectionnés au hasard parmi les 34 masqueurs paroliers français à 4 voix qui

ont été générés dans l’Expérience 1. De même pour le gaélique irlandais, 14 masqueurs

paroliers à 4 voix ont été choisis au hasard parmi les 34 générés dans l’Expérience 1.

Masqueurs paroliers en italien

Trois locutrices et 3 locuteurs de langue maternelle italienne âgés de 21 à 35 ans, ont

lu les mêmes chapitres que les locutrices et les locuteurs français et irlandais. Les

enregistrements ont eu lieu dans les mêmes conditions et avec le même matériel que pour les

locutrices et locuteurs français. Chaque chapitre constituait une piste et était sauvegardé au

format .wav. Les enregistrements de 2 locutrices et de 2 locuteurs ont été sélectionnés selon

les mêmes critères que pour les voix des masqueurs paroliers français et irlandais.

Les masqueurs paroliers italiens à 4 voix ont été générés en suivant la même méthode que

celle décrite dans l’Expérience 1 pour les masqueurs paroliers français et irlandais à 4 voix.

Tout d’abord, les enregistrements de chacun des 4 locuteurs italiens ont été modifiés avec

Praat selon le protocole suivant : (a) suppression des silences et des pauses excédant 500 ms,

(b) suppression des phrases contenant des erreurs de prononciation ou des noms propres, (c)

normalisation du niveau sonore à 70 dB-A.


84

Les F0 des voix des 4 locuteurs ont également été normalisées aux plus proches valeurs de

205 Hz et 225 Hz pour les voix féminines italiennes, et aux plus proches valeurs de 105 Hz et

125 Hz pour les voix masculines italiennes.

Ensuite, des séquences de 4 sec ont été extraites aléatoirement des enregistrements de chacun

des 4 locuteurs italiens. Les masqueurs paroliers à 4 voix ont été obtenus en mixant une

séquence de 4 secondes sélectionnée de façon aléatoire de chacun des 4 locuteurs. Au total, 14

masqueurs paroliers italiens à 4 voix ont été générés.

2.1.3. Masqueurs de bruit fluctuant

Afin d’obtenir des masqueurs de bruit fluctuant dont les propriétés énergétiques sont

comparables à celles des masqueurs paroliers à 4 voix, nous avons dérivé 42 masqueurs de

bruit fluctuant directement à partir des 42 masqueurs paroliers à 4 voix mentionnés ci-dessus

(14 masqueurs paroliers pour chacune des 3 langues manipulées). A l’aide du programme

Matlab, l’enveloppe temporelle des masqueurs paroliers a été extraite sous 60 Hz afin d’en

dériver les fluctuations dynamiques lentes. Puis par une transformée de Fourier (FFT),

l’énergie spectrale du signal d’origine a été calculée et la distribution de phases en a été

extraite. Les phases ont été redistribuées de façon aléatoire, puis réinjectées dans l’enveloppe

temporelle du signal d’origine. Ainsi, l’énergie du signal restait la même mais distribuée

différemment, ce qui a eu pour effet de détruire les informations d’ordre linguistique, comme

l’illustre la Figure 14.

Figure 14 : Spectrogrammes d'un masqueur parolier composé de quatre locuteurs (à gauche)

et de sa forme resynthétisée en bruit fluctuant (à droite). (Figures réalisées à l'aide du logiciel

Adobe Audition 3.0).


85

Avec le logiciel Matlab, chaque mot cible a été inséré à 2,5 sec du début d’un masqueur de 4

sec (parolier ou bruit fluctuant). Dans l’Expérience 2, le Rapport Signal sur Bruit entre le mot

cible et le masqueur était toujours de -5 dB, le niveau sonore du mot cible était fixé à 65 dB et

celui du masqueur à 70 dB.


Dans l’Expérience 2, les variables manipulées étaient les suivantes :

- L le facteur fixe à mesures répétées « Langue des masqueurs » à 3 modalités, français,

gaélique irlandais et italien ;

- T le facteur fixe à mesures répétées « Type de bruit » dans le masqueur à 2 modalités, parole

et bruit fluctuant ;


Il en résulte le plan expérimental suivant : P30*L3*T2. Nous avions donc 6 conditions

expérimentales. Le plan d’analyse était identique au plan expérimental. La variable

dépendante correspondait au pourcentage de mots cibles correctement retranscrits.

2.2.1. Liste de mots

Parmi les 84 mots cibles sélectionnés, 6 ont été utilisés pour la phase d’entraînement,

un mot pour chaque condition expérimentale. Pour s’assurer que les 78 mots cibles restants

soient présentés dans chacune des 6 conditions expérimentales, 6 listes expérimentales

différentes ont été générées, sur le même principe que celui utilisé dans l’Expérience 1. Par

exemple dans la liste 1, le mot « ballon » a été présenté dans la condition « masqueur parolier

français », dans la liste 2, « ballon » a été présenté dans la condition « masqueur parolier

irlandais », dans la liste 3 il a été présenté dans la condition « masqueur parolier italien ».

Dans les listes 4, 5 et 6 il a été présenté dans les conditions « masqueur de bruit fluctuant

français », « masqueur de bruit fluctuant irlandais », « masqueur de bruit fluctuant italien »,

respectivement. Ainsi, à travers les 6 listes, chacun des 78 mots cibles a été présenté dans

toutes les conditions expérimentales. Chaque participant n’entendait qu’une seule liste de

sorte que les mots cibles ne soient présentés qu’une fois pour éviter les effets de répétition.

Ainsi, dans chacune des listes, nous avions 13 mots par condition expérimentale. A l’intérieur


86

de chacune des listes, l’ordre de présentation des stimuli était randomisé pour chaque

passation.

2.2.2. Procédure expérimentale

La procédure expérimentale était exactement identique à celle de l’Expérience 1. Les

stimuli étaient présentés un à un, les participants devaient repérer les mots cibles et les

retranscrire.

2.2.3. Participants

Trente volontaires de langue maternelle française, âgés de 19 à 30 ans ont participé à

l’Expérience 2. Tous étaient différents des participants de l’Expérience 1. Aucun ne

connaissait le gaélique irlandais ni l’italien car aucun n’avait suivi d’enseignement de ces

deux langues. De plus, aucun ne souffrait de trouble auditif ni de trouble du langage. Leur

participation a été dédommagée.

3. Résultats

Tous les participants et tous les mots cibles de la phase test ont été inclus dans

l’analyse, soit 30 participants et 78 mots cibles. Comme pour l’Expérience 1, les réponses

écrites des participants ont été codées (soit correctes, soit fausses) puis transformées en

performances numériques afin d’obtenir le pourcentage de retranscriptions correctes par

participant. Comme dans l’Expérience 1, les fautes d’orthographe n’ont pas été prises en

compte dès lors qu’une syllabe était restituée correctement au niveau phonologique. Une

transformation arcsinus RAU (Studebaker, 1985) sur les performances brutes collectées (mot

reconnu coté 1, mot non identifié coté 0) a été réalisée.

Une analyse de variance à mesures répétées a été conduite sur les résultats de l’Expérience 2,

en considérant comme variable aléatoire les participants, comme variable dépendante les

scores RAU et comme variables intra-sujets : la Langue du masqueur (à 3 modalités :

irlandais, italien et français) et le Type de bruit dans le masqueur (à 2 modalités : parole et


87

bruit fluctuant). Pour la clarté, les pourcentages de réponses correctes (voir Tableau 6) ont été

utilisés pour décrire et représenter graphiquement les données.


obtenus dans chacune des six conditions expérimentales. Les écart-types sont également

indiqués.

Masqueurs de bruit fluctuant Masqueurs paroliers

irlandais italien français irlandais italien français

Moyennes 73,59 55,64 61,54 56,92 36,92 34,36

Ecart-types 10,44 12,88 13,40 12,22 9,35 12,89


Effet de la Langue du masqueur

L’analyse de variance a révélé un effet principal significatif de la Langue des

masqueurs (F(2,58) = 41.74, p < .0001). En moyenne, les pourcentages de retranscriptions

correctes étaient plus élevés lorsque les masqueurs étaient produits en irlandais (65,26% ; ET

= 14,06) plutôt qu’en français (47,95% ; ET = 18,91) ou en italien (46,28% ; ET = 14,62).

Effet du Type de bruit

L’effet principal du Type de bruit dans le masqueur de 21% est également ressorti

significatif à l’ANOVA (F(1,29) = 149.51, p < .0001). En moyenne, les performances étaient

plus faibles avec les masqueurs paroliers (42,74% ; ET = 15,3) qu’avec les masqueurs de bruit

fluctuant (63,59% ; ET = 14,3).

3.2. Interaction simple

L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit est

ressortie significative à l’ANOVA (F(2,58) = 3.35, p < .05). Les comparaisons post-hoc

réalisées avec le test HSD de Tukey ont montré que l’effet du Type de bruit dans le masqueur

était significatif pour chacune des langues manipulées (irlandais, italien et français). Les

comparaisons post-hoc ont également mis en évidence que dans les conditions où les

masqueurs étaient composés de bruit fluctuant, des performances significativement différentes

ont été observées entre l’irlandais et l’italien (p < .001), ainsi qu’entre l’irlandais et le français


88

(p < .001). Lorsque les masqueurs étaient composés de parole, nous avons retrouvé des

différences significatives dans les performances entre les mêmes langues : entre l’irlandais et

l’italien (p < .001), entre l’irlandais et le français (p < .001). Ces résultats sont reportés dans la

Figure 15.

Figure 15 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les

pourcentages moyens de retranscriptions correctes des mots cibles à -5 dB, en fonction de la

Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont reportées. Le

symbole ‘ * ’ indique une différence significative entre les deux types de bruits (parole et

bruit fluctuant) pour l’irlandais, l’italien et le français. Des différences significatives sont

également présentes entre les masqueurs paroliers irlandais et italiens, ainsi qu’entre les

masqueurs paroliers irlandais et français. Pour la clarté, la différence significative entre les

masqueurs de bruit fluctuant irlandais et français et celle entre les masqueurs de bruit

fluctuant irlandais et italiens ne figurent pas sur le graphique.

4. Discussion


Dans l’Expérience 2, les mots cibles français étaient insérés dans des masqueurs

paroliers produits dans la langue native des participants (français) ou dans deux langues qu’ils

ne connaissaient pas (gaélique irlandais et italien). Les mots cibles étaient également insérés


89

dans des masqueurs de bruit fluctuant, générés à partir des masqueurs paroliers français,

irlandais et italiens. Les masqueurs de bruit fluctuant ne partagent que les informations

acoustiques et linguistiques de bas niveau avec les masqueurs paroliers.

Tout d’abord, nous voulions vérifier que l’intelligibilité des mots cibles français serait plus

faible avec les masqueurs paroliers français qu’avec les masqueurs paroliers irlandais et

italiens. Ensuite, nous voulions déterminer si les masqueurs paroliers irlandais et italiens

conduiraient à des résultats équivalents ou si les performances des participants seraient

influencées par la distance phonémique de ces langues avec la langue native des participants

(français) ; l’italien étant phonémiquement plus proche du français que l’irlandais. Enfin, en

comparant les performances obtenues avec les masqueurs paroliers et les masqueurs de bruit

fluctuant pour chacune des trois langues manipulées, il était question d’examiner si les

informations linguistiques de haut niveau présentes dans les masqueurs paroliers français,

irlandais et italiens ont joué un rôle dans le masquage des mots cibles français.

4.2. Situation de la parole dans la parole

Les résultats de l’Expérience 2 ont révélé que dans la situation de la parole dans la

parole (c’est-à-dire lorsque les mots cibles étaient insérés dans les masqueurs paroliers),

l’intelligibilité des mots cibles français a été influencée par la langue des masqueurs paroliers.

Des langues ont davantage masqué les mots cibles français que d’autres. C’est le cas du

français et de l’italien, qui ont entraîné des pourcentages de retranscriptions correctes

significativement plus faibles que l’irlandais.

Ainsi, dans l’Expérience 2, les masqueurs paroliers français et irlandais ont conduit au même

pattern de résultats que dans l’Expérience 1. Les masqueurs paroliers générés en irlandais,

c’est-à-dire dans une langue inconnue pour les participants (et donc inintelligible), ont eu un

effet de masque significativement plus faible (autrement dit des performances

significativement plus élevées ont été observées) que les masqueurs paroliers produits dans la

langue native des participants (français).

Dans l’Expérience 2, nous avons inclus l’italien qui, comme l’irlandais, est une langue

inconnue pour les participants (et donc inintelligible). Cependant l’italien n’a pas conduit aux

mêmes résultats que l’irlandais. Avec les masqueurs paroliers italiens, les pourcentages de

retranscriptions correctes des mots cibles français étaient significativement plus faibles

qu’avec les masqueurs paroliers irlandais et équivalents à ceux obtenus avec les masqueurs


90

paroliers français. Ce résultat montre tout d’abord que les deux langues inconnues pour les

participants (italien et irlandais) ont eu un effet de masque significativement différent. Ce

résultat indique également que l’italien, langue inintelligible car inconnue des participants, a

eu un effet de masque équivalent à celui de la langue native des participants (français). Ce

résultat observé avec les masqueurs paroliers italiens est inattendu puisqu’il ne correspond pas

à l’effet de la Langue des masqueurs mis en évidence jusqu’à présent dans la littérature,

lorsque la langue native était de l’allemand et la langue inconnue du suédois (Rhebergen et

al., 2005), ou lorsque la langue native était de l’anglais et la langue inconnue de l’espagnol

(Garcia Lecumberri & Cooke, 2006), du mandarin (Van Engen & Bradlow, 2007), ou du

croate (Calandruccio et al., 2010b). Ces études ont mis en lumière un effet de masque plus

faible sur la parole cible pour la langue inconnue et inintelligible que pour la langue native.

Le plus faible pourcentage de retranscriptions correctes obtenu avec les masqueurs paroliers

italiens plutôt qu’avec les masqueurs paroliers irlandais pourrait être dû au fait que l’italien

est phonémiquement plus proche de la langue native que l’irlandais ; 60% des phonèmes

français sont retrouvés dans l’inventaire phonémique italien alors que seulement 18% des

phonèmes français sont présents dans l’inventaire phonémique de l’irlandais. Ainsi,

l’hypothèse serait que plus le pourcentage de phonèmes communs entre la langue native et la

langue concurrente serait grand, plus les interférences phonémiques entre les signaux

concurrents seraient importantes.

Cependant, avant d’explorer davantage l’hypothèse des compétitions phonémiques entre les

deux flux de parole concurrents, regardons tout d’abord les résultats obtenus avec les

masqueurs de bruit fluctuant afin de vérifier que les informations linguistiques de haut niveau

(phonèmes, syllabes, mots) présentes dans les masqueurs paroliers français, irlandais et

italiens ont été impliquées dans la dégradation du signal cible. Le bruit fluctuant a été généré à

partir des masqueurs paroliers dans les trois langues manipulées (français, irlandais, italien).

Pour chacune des langues, les deux types de masqueurs (parolier versus bruit fluctuant)

partagent les mêmes informations spectrales et temporelles ainsi que les mêmes informations

linguistiques de bas niveau ; seuls les masqueurs paroliers possèdent des informations

linguistiques de haut niveau. Notre idée était de comparer, pour chacune des langues, les

pourcentages de retranscriptions correctes obtenus avec les deux types de masqueurs (parolier

versus bruit fluctuant). Des performances significativement différentes indiqueront que les


91

informations linguistiques de haut niveau présentes dans les masqueurs paroliers ont été

impliquées dans la dégradation du signal cible.

4.3. Nature des interférences

L’analyse statistique a révélé une interaction significative entre les facteurs Type de

bruit dans le masqueur et Langue des masqueurs et a indiqué que l’effet du Type de bruit était

présent pour chacune des langues manipulées (français, irlandais et italien).

Ceci nous a tout d’abord confirmé que la situation d’écoute a été plus facile avec les

masqueurs de bruit fluctuant plutôt qu’avec les masqueurs paroliers, c’est-à-dire lorsque les

informations linguistiques de haut niveau n’étaient pas présentes dans le signal concurrent.

Cette différence significative entre les deux types de masqueurs (parolier versus bruit

fluctuant) présente pour les trois langues manipulées a également montré que les informations

linguistiques de haut niveau présentes dans les masqueurs paroliers français, irlandais et

italiens sont entrées en compétition avec les informations linguistiques des mots cibles

français.

Nous nous sommes alors demandés si cet effet des informations linguistiques de haut niveau

était proportionnel au pourcentage de phonèmes communs entre la langue native des

participants et la langue concurrente (60% de phonèmes communs entre le français et l’italien,

18% entre le français et l’irlandais). En effet, dans le cas où les interférences linguistiques

auraient lieu au niveau phonémique, nous pourrions nous attendre à ce que l’effet des

informations linguistiques de haut niveau soit le plus important pour les masqueurs paroliers

français, un peu plus faible pour les masqueurs paroliers italiens, et plus faible encore pour les

masqueurs paroliers irlandais. Pour cela, nous avons soustrait, pour chaque participant et pour

chacune des trois langues manipulées (français, irlandais et italien), les pourcentages moyens

de retranscriptions correctes des mots cibles obtenus avec les masqueurs de bruit fluctuant à

ceux obtenus avec les masqueurs paroliers. Nous avons ainsi obtenu les différences de

performances pour chacune des trois langues. En moyenne, elles étaient de 27,18% pour le

français, de 18,72% pour l’italien et de 16,67% pour l’irlandais. Les différences de

performances obtenues pour l’italien étant proches de celles observées pour l’irlandais, nous

avons mené une analyse de variance afin de déterminer si les différences de performances

observées pour l’italien et l’irlandais étaient significativement différentes. Une ANOVA à

mesures répétées a été effectuée, non pas sur les différences de pourcentages moyens de


92

retranscriptions correctes mais sur les différences de scores RAU moyens. L’ANOVA a

considéré comme variable aléatoire les participants et comme variable intra-sujets la Langue

des masqueurs (à 3 modalités : le français, le gaélique irlandais et l’italien). Le plan d’analyse

était le suivant : P30*L3. L’ANOVA a confirmé que l’effet principal de la Langue des

masqueurs était significatif (F(2,58) = 3.35, p < .05). Les comparaisons post-hoc effectuées

avec le test HSD de Tukey ont révélé que les différences de performances moyennes étaient

significativement différentes uniquement entre l’irlandais et le français. Autrement dit, entre

l’italien et l’irlandais ainsi qu’entre l’italien et le français, les différences de performances

n’étaient pas significativement différentes. Cette analyse n’a alors pas indiqué que les effets

des informations linguistiques de haut niveau étaient proportionnels au pourcentage de

phonèmes communs entre la langue native des participants et la langue concurrente. Cela

suggère que l’effet des interférences linguistiques observé ne s’expliquerait pas uniquement

par des compétitions au niveau phonémique. D’autres interférences d’ordre linguistique

auraient lieu, comme par exemple des interférences post-lexicales, qui seraient expliquées par

le type de tâche que nous avons utilisé dans cette expérience (tâche d’intelligibilité), et dont

l’effet pourrait s’ajouter à celui des compétitions phonémiques.

Dans cette expérience, de même que dans la précédente, nous avons utilisé une tâche

d’intelligibilité dans laquelle les participants devaient retranscrire le mot cible entendu une

fois que le stimulus était terminé. Chaque mot cible était inséré à 2,5 secondes du début du

masqueur et leur présentation se terminait avant la fin du masqueur qui lui durait 4 secondes.

Ainsi, du temps s’écoulait entre la fin de présentation du mot cible et la fin du masqueur,

durant lequel des traitements post-lexicaux peuvent avoir lieu et influencer la réponse finale

des participants. Ces traitements post-lexicaux impliquent des connaissances explicites sur le

langage et des habiletés métalinguistiques. La tâche d’intelligibilité est alors caractérisée de

tâche « off-line » puisqu’elle permet de mesurer la pertinence des réponses obtenues une fois

que les processus de reconnaissance du mot cible impliqués dans l’accès au lexique sont

terminés.

Afin de limiter l’effet des interférences post-lexicales et d’explorer les interférences

linguistiques qui ont lieu entre les deux flux de parole concurrents pendant l’accès au lexique

des mots cibles, nous avons décidé dans l’Expérience 3, de tester les mêmes conditions

expérimentales que dans l’Expérience 2, mais avec une tâche de décision lexicale. Nous

demanderons aux participants de décider le plus rapidement possible et en commettant le


93

moins d’erreurs possible si le mot cible existe dans la langue française. Ainsi, nous

obtiendrons des temps de réaction qui nous informeront sur la rapidité avec laquelle les mots

cibles auront été reconnus, reflétant la rapidité avec laquelle ces mots auront été activés dans

le lexique. Plus les temps de réaction seront longs, plus les mots cibles auront été reconnus

lentement du fait des interférences produites par le signal concurrent. Alors que la tâche

d’intelligibilité est une tâche « off-line », la tâche de décision lexicale est caractérisée de tâche

« on-line ». Par ailleurs, la validité de la tâche de décision lexicale pour explorer la situation

de la parole dans la parole a déjà été mise en évidence. Boulenger et al. (2010) ont utilisé une

tâche de décision lexicale afin d’étudier l’effet de la fréquence des mots (haute versus faible

fréquence) présents dans les masqueurs paroliers sur la vitesse d’accès au lexique de mots

cibles français. Dans l’Expérience 3, la tâche de décision lexicale nous permettra d’explorer

de façon plus précise les interférences phonémiques entre les deux flux de parole concurrents

puisque l’effet des interférences post-lexicales sera limité.

4.4. Conclusions

Dans l’Expérience 2, les masqueurs paroliers produits en irlandais, c’est-à-dire dans

une langue inconnue pour les participants, ont conduit à des résultats attendus puisqu’ils ont

eu un effet de masque plus faible que les masqueurs paroliers français (langue native). En

revanche, des résultats surprenants ont été observés avec les masqueurs paroliers générés en

italien, autre langue non connue des participants. En effet, les masqueurs paroliers italiens ont

entraîné des pourcentages de retranscriptions correctes équivalents à ceux observés avec les

masqueurs paroliers français. Ainsi, les deux langues inconnues des participants (irlandais et

italien) ont eu des effets de masque significativement différents. La distance phonémique de

l’italien et de l’irlandais avec la langue native pourrait expliquer ces résultats. L’italien étant

phonémiquement plus proche de la langue native (français) que l’irlandais, les compétitions

phonémiques ont pu être plus importantes en présence des masqueurs paroliers italiens.

Néanmoins, nous ne sommes pas en mesure de valider ou d’invalider cette hypothèse. En

effet, bien que la comparaison des performances obtenues avec les masqueurs paroliers et les

masqueurs de bruit fluctuant ait mis en évidence un effet des informations linguistiques de

haut niveau pour chacune des trois langues manipulées (français, irlandais et italien), cet effet

n’était pas proportionnel au pourcentage de phonèmes communs entre la langue concurrente

et la langue native, suggérant que d’autres types d’interférences, telles que des interférences


94

post-lexicales, pourraient également intervenir. C’est pourquoi dans l’Expérience 3, nous

testerons les mêmes conditions expérimentales que dans la présente expérience mais avec une

tâche de décision lexicale qui nous permettra d’explorer les interférences linguistiques entre

les deux flux de parole concurrents pendant l’accès au lexique et minimisera l’effet des

interférences post-lexicales.


95

G) EXPERIENCE 3

1. Objectifs

Dans cette Expérience 3, nous utiliserons une tâche de décision lexicale plutôt qu’une

tâche d’intelligibilité (Expériences 1 & 2) afin d’explorer les interférences linguistiques qui

ont lieu dans la situation de la parole dans la parole. Plus précisément, la tâche de décision

lexicale nous permettra de capturer ces interférences linguistiques pendant l’accès au lexique

des mots cibles français ; nous cherchons à les caractériser plus finement. Les traitements

post-lexicaux devraient être minimisés, nous continuerons ainsi de tester l’hypothèse des

compétitions phonémiques selon laquelle l’identification des mots cibles français serait

influencée par le pourcentage de phonèmes communs entre la langue native des participants et

la langue de la parole concurrente ; plus ce pourcentage sera élevé plus les interférences

phonémiques seront importantes. Enfin, nous serons attentifs aux résultats qui seront obtenus

avec les masqueurs paroliers produits en italien (langue non connue des participants), ces

derniers ayant eu, dans l’expérience précédence, un effet de masque équivalent aux

masqueurs paroliers générés en français (langue native).

2. Méthode

2.1. Stimuli

Dans l’Expérience 3, 162 stimuli ont été générés en mixant chacun des 81 mots cibles

et chacun des 81 pseudo-mots cibles à un masqueur (parolier ou de bruit fluctuant) produit en

français, en irlandais ou en italien.

2.1.1. Items cibles

Quatre-vingt-un mots français dissyllabiques (annexe 3) ont été sélectionnés parmi les

84 mots utilisés dans l’Expérience 2 (fréquence d’occurrence moyenne = 24,45 ; ET = 49,52).

Plus précisément, les 3 mots qui n’ont pas été retenus étaient des mots utilisés dans la phase

d’entraînement de l’Expérience 2. Quatre-vingt-un pseudo-mots (annexe 4) ont été construits


96

à partir des 136 mots utilisés dans l’Expérience 1, en respectant les règles phonotactiques de

la langue française, comme par exemple « trouchet ».

De façon à ce que les pseudo-mots soient prononcés par la même voix que les mots, nous

avons réenregistré la totalité des items cibles : mots et pseudo-mots. Pour ce faire, une

locutrice de langue maternelle française âgée de 21 ans (différente de celle qui avait enregistré

les mots cibles dans les expériences précédentes) a été recrutée. L’enregistrement a eu lieu

dans les mêmes conditions et avec le même matériel que pour la locutrice et les

enregistrements précédents.

2.1.2. Masqueurs

Masqueurs paroliers en français, en irlandais et en italien

Dans l’Expérience 3, 27 masqueurs paroliers à 4 voix étaient nécessaires pour chacune

des 3 langues manipulées (français, irlandais et italien). Les masqueurs paroliers français et

irlandais ont été sélectionnés au hasard parmi ceux générés dans l’Expérience 1. Pour les

masqueurs paroliers italiens, seulement 14 avaient été créés dans l’Expérience 2, 13 nouveaux

masqueurs paroliers italiens ont donc été générés selon la même méthode que celle décrite

dans les expériences précédentes.

Masqueurs de bruit fluctuant en français, en irlandais et en italien

Vingt-sept masqueurs de bruit fluctuant pour chacune des 3 langues manipulées ont

été utilisés dans l’Expérience 3. Treize nouveaux masqueurs de bruit fluctuant par langue ont

été générés afin de compléter les 14 masqueurs de bruit fluctuant pour chacune des 3 langues

qui ont été utilisés dans l’Expérience 2.

Dans l’Expérience 3, comme dans l’Expérience 2, chaque item cible était inséré à 2,5 sec du

début d’un masqueur de 4 sec avec un Rapport Signal sur Bruit de -5 dB (le niveau sonore du

mot cible était fixé à 65 dB et celui du masqueur à 70 dB). Cette opération a été effectuée

sous le logiciel Matlab.


Dans l’Expérience 3, les variables manipulées étaient les suivantes :


97





- N le facteur fixe à mesures répétées « Nature des items cibles » à 2 modalités, mots et

pseudo-mots ;


Le plan expérimental était le suivant : P30*L3*T2*N2. Les analyses statistiques menées ci-

dessous n’ont pris en compte que les performances des participants obtenues avec les mots

cibles. Nous avions donc 6 conditions expérimentales, le plan d’analyse était le suivant :

P30*L3*T2.

2.3. Liste d’items

Parmi les 162 stimuli sélectionnés (81 mots cibles et 81 pseudo-mots cibles), 6 (3 mots

et 3 pseudo-mots) ont été utilisés pour la phase d’entraînement, un pour chaque condition

expérimentale. Pour s’assurer que les 156 items cibles restants (78 mots cibles et 78 pseudo-

mots cibles) soient présentés dans chacune des 6 conditions expérimentales, 6 listes

expérimentales différentes ont été générées selon le même principe que celui utilisé dans les

expériences précédentes. Par exemple dans la liste 1, le mot « ballon » et le pseudo-mot

« trouchet » ont été présentés dans la condition « masqueur parolier français », dans la liste 2,

« ballon » et « trouchet » ont été présentés dans la condition « masqueur parolier irlandais »,

dans la liste 3, ils ont été présentés dans la condition « masqueur parolier italien ». Dans les

listes 4, 5 et 6, ils ont été présentés dans les conditions « masqueur de bruit fluctuant français

», « masqueur de bruit fluctuant irlandais », « masqueur de bruit fluctuant italien »,

respectivement. Ainsi, à travers les 6 listes, chacun des 78 mots cibles et chacun des 78

pseudo-mots cibles ont été présentés dans toutes les conditions expérimentales. Chaque

participant n’entendait qu’une seule liste de sorte que les mots cibles et les pseudo-mots cibles

ne soient présentés qu’une fois pour éviter les effets de répétition. Ainsi, nous avions dans

chaque liste, 13 mots et 13 pseudo-mots par condition expérimentale. A l’intérieur de chacune

des listes, l’ordre de présentation des stimuli était randomisé pour chaque passation.


98


Les participants ont été testés dans les mêmes conditions que dans les Expériences 1 &

2. Les stimuli étaient également délivrés de façon diotique à un niveau d’écoute confortable

(65 dB SPL), excepté qu’ils ont été présentés avec le logiciel E-prime (Psychology Software

Tools, Inc., Pittsburgh, PA, USA). Il était demandé aux participants de réaliser une tâche de

décision lexicale sur les items cibles qui étaient insérés dans les masqueurs. Les participants

devaient décider le plus vite possible et en commettant le moins d’erreurs possible, si l’item

cible était un mot de la langue française en appuyant sur une des deux touches du clavier

sélectionnées. La consigne était donnée oralement puis apparaissait à l’écran au début de

l’expérience.

« Une étoile va s’afficher au centre de l’écran. Puis vous entendrez une séquence sonore

composée d’un mot cible présenté dans différents types de bruits. Dès que vous avez repéré ce

mot, vous devez répondre le plus vite possible et en commettant le moins d’erreurs possible si

ce mot existe dans la langue française ou s’il n’existe pas. Vous donnerez votre réponse en

appuyant sur une des deux touches sélectionnées. Appuyez sur la barre espace pour passer à

la séquence suivante ».

Comme dans les expériences précédentes, chaque stimulus ne pouvait être entendu qu’une

seule fois. Une phase d’entraînement précédait la phase test. Les participants démarraient

l’expérience dès qu’ils le souhaitaient en appuyant sur la barre espace. Ils appuyaient à

nouveau sur celle-ci après avoir répondu, le stimulus suivant commençait. L’expérience durait

en moyenne 30 minutes.

2.5. Participants

Trente volontaires de langue maternelle française, âgés de 18 à 27 ans ont participé à

l’Expérience 3. Aucun n’avait participé aux Expériences 1 & 2, aucun ne parlait, ne

comprenait ou n’avait suivi d’enseignement de gaélique irlandais ni d’italien, et aucun ne

souffrait de trouble auditif ni de trouble du langage. Ils ont été dédommagés pour leur

participation.

3. Résultats


99

Tous les participants et tous les mots cibles de la phase test ont été inclus dans les

analyses, soit 30 participants et 78 mots cibles. Deux analyses de variance à mesures répétées

(ANOVA) ont été conduites sur les performances des participants à -5 dB. Pour la première

analyse, les Temps de Réaction moyens (TRs : intervalle de temps en millisecondes entre le

début du mot cible et le moment où le participant presse le bouton) ont été mesurés pour les

mots cibles correctement identifiés dans chaque condition expérimentale (Tableau 7). Les

essais pour lesquels les participants ont fait des erreurs (34,1%), n’ont pas répondu dans le

temps imparti de 4500 ms (4,3%), ainsi que les essais pour lesquels les TRs étaient inférieurs

à 300 ms (0,2%) n’ont pas été inclus dans l’analyse. Ainsi, la première ANOVA a considéré

comme variable dépendante les TRs, et comme variable intra-sujets la Langue des masqueurs

(à 3 modalités : irlandais, italien et français) et le Type de bruit dans le masqueur (à 2

modalités : parole et bruit fluctuant). Dans la seconde ANOVA, les taux d’erreurs moyens

(Tableau 8) constituaient la variable dépendante et les variables intra-sujets étaient les mêmes

que dans la première ANOVA.

3.1. Analyse statistique des moyennes de TRs

Tableau 7 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement

identifiés dans chacune des six conditions expérimentales. Les écart-types sont également

indiqués.



Moyennes 1125 1216 1161 1167 1262 1272

Ecart-types 166,98 252,94 204,04 188,19 260,50 225,72


Effet de la Langue du masqueur


masqueurs (F(2,58) = 5.83, p < .005). En moyenne, les participants ont été plus rapides avec

les masqueurs irlandais (1146 ms ; ET = 177,68), et plus lents avec les masqueurs français

(1217 ms ; ET = 220,43) et italiens (1240 ms ; ET = 255,65).


100


L’ANOVA a également indiqué que l’effet principal de 67 ms du Type de bruit dans

le masqueur était significatif (F(1,29) = 8.92, p = .005). Les masqueurs paroliers ont entraîné

des TRs moyens plus longs (1234 ms ; ET = 229,12) que les masqueurs de bruit fluctuant

(1167 ms ; ET = 211,89).

3.3. Interaction simple

L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit n’est

pas ressortie significative à l’ANOVA (F(2,58) = 1.25, n.s.). Les comparaisons post-hoc

effectuées avec le test HSD de Tukey ont montré que l’effet du Type de bruit n’était

significatif qu’avec le français (p = .02). Les comparaisons post-hoc ont également mis en

évidence qu’avec les masqueurs paroliers, une différence significative était présente entre

l’irlandais et le français (p < .05), ainsi qu’une différence tendancielle entre l’irlandais et

l’italien (p = .07). En revanche, lorsque les masqueurs étaient composés de bruit fluctuant,

aucune différence entre les langues n’a atteint le seuil de significativité. Les résultats sont

reportés dans la Figure 16 ci-dessous.

Figure 16 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs

moyens (en ms) à -5 dB, en fonction de la Langue des masqueurs (irlandais, italien et


101

français). Les erreurs standard sont reportées. Le symbole ‘ * ’ indique une différence

significative entre les deux types de bruits (parole et bruit fluctuant) pour le français. Des

différences significatives sont également présentes entre les masqueurs paroliers irlandais et

italiens, ainsi qu’entre les masqueurs paroliers irlandais et français.

3.4. Analyse statistique des taux d’erreurs

Tableau 8 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions

expérimentales. Les écart-types sont également indiqués.



Moyennes 28,21 37,18 27,69 31,79 43,85 35,64

Ecart-types 15,56 14,99 12,39 14,53 19,29 16,47

3.4.1. Effets principaux


L’effet principal de la Langue des masqueurs est ressorti significatif à l’ANOVA

(F(2,58) = 9.29, p < .001). En moyenne, les participants ont fait moins d’erreurs avec les

masqueurs irlandais (30% ; ET = 15,04) et français (31,67% ; ET = 14,99) et un peu plus

d’erreurs avec les masqueurs italiens (40,51% ; ET = 17,45).


L'ANOVA a également montré un effet principal significatif du Type de bruit dans le

masqueur de 6,06% (F(1,29) = 5.49, p < .05). En moyenne, les masqueurs paroliers ont

entraîné des taux d’erreurs plus élevés (37,09% ; ET = 17,43) que les masqueurs de bruit

fluctuant (31,03% ; ET = 14,88).

3.4.2. Interaction simple


pas ressortie significative à l’ANOVA (F(2,58) = 0.52, n.s.). Les comparaisons post-hoc

réalisées avec le test HSD de Tukey ont révélé que l’effet du Type de bruit n’était significatif

pour aucune des trois langues manipulées. Avec les masqueurs de bruit fluctuant, les

comparaisons post-hoc ont montré une différence significative entre le français et l’italien (p


102

= .04), ainsi qu’une différence tendancielle entre l’irlandais et l’italien (p = .06). Avec les

masqueurs paroliers, seule une différence significative entre l’irlandais et l’italien a été

signalée (p < .005).

4. Discussion


Dans l’Expérience 3, une tâche de décision lexicale a été utilisée afin d’examiner et de

comparer l’impact des masqueurs paroliers produits en français (langue native des

participants), en irlandais ou en italien (langues non connues) sur la vitesse d’accès au lexique

des mots cibles français. Des masqueurs de bruit fluctuant ont également été utilisés pour

masquer les mots cibles et nous renseigner quant à la nature des informations impliquées par

les interférences produites par les masqueurs paroliers générés dans les trois langues

manipulées (français, irlandais et italien). Une différence significative entre les temps de

réaction obtenus avec les masqueurs paroliers et les masqueurs de bruit fluctuant indiqueront

que les informations linguistiques de haut niveau présentes dans les masqueurs paroliers se

seront associées aux informations acoustiques et linguistiques de bas niveau pour perturber

l’accès au lexique des mots cibles français.


L’analyse de résultats a révélé que la vitesse d’accès au lexique des mots cibles

français a été influencée par la langue des masqueurs paroliers. Les participants ont mis

significativement plus de temps pour décider si les mots cibles existaient dans la langue

française lorsque les masqueurs paroliers étaient produits en français et en italien plutôt qu’en

irlandais.

Tout d’abord, ces résultats montrent que les deux langues inconnues et inintelligibles pour les

participants (irlandais et italien) n’ont pas perturbé l’identification des mots cibles français de

façon équivalente ; les masqueurs paroliers irlandais ont eu un effet de masque

significativement plus faible que celui des masqueurs paroliers italiens. Ensuite, les

masqueurs paroliers produits en italien, langue inconnue et inintelligible pour les participants,

ont perturbé l’identification des mots cibles français avec la même efficacité que les


103

masqueurs paroliers générés en français, langue native des participants ; les temps de réaction

obtenus avec les masqueurs paroliers italiens et français n’étaient significativement pas

différents.

Des résultats attendus ont donc d’abord été observés avec le français, la situation d’écoute

était difficile lorsque la langue concurrente était la langue native des participants, puis avec

l’irlandais, la tâche a été réalisée plus facilement qu’avec le français (pour des résultats

similaires voir Rhebergen et al., 2005 ; Garcia Lecumberri & Cooke, 2006 ; Van Engen &

Bradlow, 2007 ; Calandruccio et al., 2010b). En revanche, l’italien a conduit à des résultats

surprenants avec un effet de masque équivalent à celui de la langue native des participants

(français).

Dans la situation de la parole dans la parole (avec les masqueurs paroliers français, irlandais

et italiens), la tâche de décision lexicale utilisée dans cette Expérience 3 a mis en lumière le

même type de pattern de résultats que la tâche d’intelligibilité de l’Expérience 2 ; et ce, bien

que les données acquises avec ces deux tâches ne soient pas de même nature : des temps de

réaction avec la tâche de décision lexicale, des pourcentages de retranscriptions correctes avec

la tâche d’intelligibilité.

Regardons à présent les résultats obtenus lorsque les mots cibles français étaient

insérés dans les masqueurs de bruit fluctuant dans les trois langues manipulées (français,

irlandais et italien). Intéressons nous plus précisément à la comparaison des temps de réaction

moyens obtenus avec les deux types de masqueurs (parolier et bruit fluctuant) afin de

déterminer si la tâche de décision lexicale a mis en avant un effet des informations


italiens.


L’analyse des résultats a montré que l’effet du Type de bruit dans le masqueur était

présent uniquement pour le français. Les temps de réaction étaient significativement plus

courts avec les masqueurs de bruit fluctuant plutôt qu’avec les masqueurs paroliers ; ce qui

confirme que les informations linguistiques de haut niveau présentes dans les masqueurs

paroliers français ont participé au ralentissement de l’accès au lexique des mots cibles français

en plus des informations acoustiques et linguistiques de bas niveau. En revanche, pour


104

l’italien et l’irlandais, il n’y avait pas de différence significative entre les temps de réaction

obtenus avec les deux types de masqueurs (parolier et bruit fluctuant), indiquant que l’accès

au lexique des mots cibles français a été principalement perturbé par les informations

acoustiques et linguistiques de bas niveau présentes dans les masqueurs paroliers irlandais et

italiens.

Il ressort de ces résultats que les informations linguistiques de haut niveau présentes dans les

masqueurs paroliers ont interféré sur l’accès au lexique des mots cibles français uniquement

lorsque la langue des masqueurs paroliers était intelligible pour les participants (français). De

plus, les phonèmes que l’irlandais et l’italien ont en commun avec la langue native (18% de

phonèmes communs entre l’irlandais et le français, 60% entre l’italien et le français) ne

semblent donc pas avoir été impliqués dans les interférences produites par les masqueurs

paroliers irlandais et italiens. Ceci est en accord avec les études (Best & Strange, 1992 ; Hallé,

Best & Levitt, 1999) qui ont rapporté que la production d’un phonème commun à plusieurs

langues varie au niveau articulatoire selon la langue dans laquelle il est produit, ce qui conduit

à des perceptions différentes de ce phonème. Dans notre cas, les phonèmes communs entre le

français et l’irlandais ainsi que ceux communs entre le français et l’italien ne seraient pas

entrés en compétition car même s’ils sont catégorisés de la même façon dans l’Alphabet

Phonétique International, ils ont pu être produits et perçus différemment.

Nous rappelons que dans la situation de la parole dans la parole, des temps de réaction

significativement plus longs ont été observés avec les masqueurs paroliers italiens plutôt

qu’avec les masqueurs paroliers irlandais. Etant donné l’absence de différence significative

entre les temps de réaction obtenus avec les deux types de masqueurs (parolier et bruit

fluctuant) en irlandais et en italien, la différence significative de temps de réaction observée

entre les masqueurs paroliers italiens et irlandais serait expliquée par des différences dans les

informations acoustiques et linguistiques de bas niveau entre ces deux langues.

Notamment, ces deux langues ont un système rythmique différent ; l’italien est une langue

syllabique comme le français, alors que l’irlandais est une langue accentuelle. L’italien et le

français ont donc un rythme syllabique régulier alors que pour l’irlandais la durée des syllabes

est variable et le rythme est donné par les syllabes accentuées. L’utilisation du rythme des

langues dans le traitement de la parole a notamment été mise en évidence par de nombreux

auteurs lors de situations d’écoute silencieuses (Cutler, Mehler, Norris & Segui, 1983, 1986 ;

Nazzi, Bertoncini & Mehler, 1998 ; Nazzi, Jusczyk & Johnson, 2000). Dans notre expérience,


105

une hypothèse pourrait donc être que l’accès au lexique des mots cibles français a davantage

été perturbé par les masqueurs paroliers lorsque ces derniers étaient produits dans une langue

dont le système rythmique était identique à celui de la langue cible (mots cibles français

insérés dans des masqueurs paroliers italiens) plutôt que différent (mots cibles français insérés

dans des masqueurs paroliers irlandais). L’étude de Reel & Hicks (2012) vient soutenir cette

hypothèse. Ces auteurs ont demandé à des participants natifs de l’anglais de répéter des

phrases cibles anglaises masquées par des masqueurs paroliers à 2 locuteurs générés dans

quatre langues différentes : en anglais, en allemand, en espagnol ou en français ; les trois

dernières langues étant des langues inconnues pour les participants. L’allemand comme

l’anglais sont des langues accentuelles, alors que l’espagnol et le français sont toutes les deux

des langues syllabiques. Les auteurs ont observé que les participants ont eu moins de

difficultés à réaliser la tâche avec les masqueurs paroliers espagnols et français qu’avec les

masqueurs paroliers anglais et allemands, autrement dit lorsque la langue concurrente avait un

système rythmique différent de celui de la langue cible. Les résultats ont également montré

des performances équivalentes entre les masqueurs paroliers anglais et allemands, bien que

l’anglais soit la langue native des participants et l’allemand une langue qu’ils ne connaissent

pas. Les auteurs suggèrent alors que dans leur paradigme expérimental, les participants ont

davantage été sensibles au rythme de la langue concurrente plutôt qu’à l’intelligibilité de

celle-ci.

Cette différence entre l’italien et l’irlandais au niveau du système rythmique pourrait

expliquer à la fois la différence significative révélée entre les temps de réaction obtenus avec

les masqueurs paroliers italiens et les masqueurs paroliers irlandais, ainsi que la différence

significative observée entre les taux d’erreurs obtenus avec ces mêmes masqueurs paroliers.

En effet, l’analyse des taux moyens d’erreurs a indiqué que les masqueurs paroliers italiens

ont conduit à un taux d’erreurs significativement plus élevé que les masqueurs paroliers

irlandais. Etant donné que l’effet du Type de bruit dans le masqueur n’était significatif pour

aucune des langues manipulées, des différences dans les informations acoustiques et

linguistiques de bas niveau, comme par exemple une différence de système rythmique entre

l’italien et l’irlandais, pourraient être la cause de cette différence significative entre les taux

d’erreurs.

Par ailleurs, il est remarquable que les masqueurs de bruit fluctuant italiens aient également

conduit à un taux d’erreurs significativement plus élevé que les masqueurs de bruit fluctuant

français. Cela pourrait être dû à la plus grande difficulté ressentie par les participants pour


106

extraire le mot cible des masqueurs. En effet, dans la tâche de décision lexicale, des erreurs

peuvent être commises quant à la décision à prendre (décider si l’item appartient à la langue

française), ainsi que des erreurs liées à la ségrégation des flux ; autrement dit, des erreurs

entraînées par la difficulté à extraire le mot cible du signal concurrent. Ainsi, il aurait été plus

difficile d’extraire les mots cibles avec les masqueurs de bruit fluctuant italiens plutôt qu’avec

ceux générés en français. Par exemple, les participants n’auraient réussi à extraire qu’une

partie du mot, les conduisant à une prise de décision incorrecte. Etant donné que les

différences entre les taux d’erreurs ont été entraînées par des masqueurs de bruit fluctuant, ces

différences seraient expliquées par des différences acoustiques et linguistiques de bas niveau

entre les langues italienne et française. Des différences quant à la place de l’accent tonique

sont notables, bien que ces langues soient toutes deux des langues syllabiques et romanes.

La situation de la parole dans la parole a montré des effets de masque

significativement différents entre les deux langues inconnues et inintelligibles (irlandais et

italien), mais aussi des effets de masque équivalents entre le français, langue native des

participants, et l’italien, langue inconnue et inintelligible pour les participants. Etant donné

qu’un effet des informations linguistiques de haut niveau a été mis en lumière seulement pour

les masqueurs paroliers français, il apparaît que le français et l’italien ont pénalisé

l’identification des mots cibles français de façon équivalente mais avec des interférences qui

ont impliqué des informations de natures différentes. Contrairement à l’italien qui a produit

des interférences qui n’ont impliqué que des informations acoustiques et linguistiques de bas

niveau, le français a en plus produit des interférences qui ont impliqué des informations

linguistiques de haut niveau.

4.4. Tâche de décision lexicale versus tâche d’intelligibilité

Les résultats de l’Expérience 3 concernant la nature des informations impliquées par

les interférences produites par les masqueurs paroliers français, irlandais et italiens ne

correspondent pas à ceux observés dans l’Expérience 2. Dans l’expérience précédente, un

effet des informations linguistiques de haut niveau était présent pour chacune des trois

langues manipulées. Nous avions même, à partir de ce résultat, cherché à déterminer si les

interférences linguistiques produites par les masqueurs paroliers dans les trois langues avaient

lieu au niveau phonémique.


107

Cette différence entre les Expériences 2 & 3 peut être expliquée par le fait que ces deux

expériences ont utilisé des tâches différentes ; dans l’Expérience 2 il s’agissait d’une tâche

d’intelligibilité et dans l’Expérience 3 d’une tâche de décision lexicale. Lorsque nous nous

intéressons uniquement aux conditions dans lesquelles les mots cibles étaient insérés dans les

masqueurs paroliers (c’est-à-dire dans la situation de la parole dans la parole), les deux tâches

ont mis en avant un pattern de résultats similaire : les masqueurs paroliers français et italiens

ont dégradé plus fortement l’identification des mots cibles français que les masqueurs

paroliers irlandais. En revanche, ces deux tâches ont indiqué des résultats divergents quant à

la nature des informations impliquées par les interférences produites par les masqueurs

paroliers dans les trois langues. Cette divergence dans les résultats serait expliquée par le fait

que ces deux tâches capturent les processus cognitifs à des moments différents. Alors que la

tâche de décision lexicale mesure la vitesse d’accès au lexique des mots cibles, la tâche

d’intelligibilité évalue la compréhension une fois que les traitements perceptifs impliqués

dans l’accès au lexique ont été exécutés. Cela suggère que dans l’Expérience 2, l’effet des

informations linguistiques de haut niveau mis en évidence pour les masqueurs paroliers

irlandais et italiens, correspondrait à un effet des interférences post-lexicales que la tâche

d’intelligibilité prend en compte. La tâche de décision lexicale dans l’Expérience 3 ayant

indiqué que les masqueurs paroliers irlandais et italiens ne produiraient que des interférences

acoustiques ou linguistiques de bas niveau, la différence de performances que ces masqueurs

paroliers ont engendrée serait due à des différences dans les caractéristiques acoustiques et

linguistiques de bas niveau entre ces langues, comme par exemple des différences au niveau

de leur système rythmique.

En indiquant que les masqueurs paroliers irlandais et italiens auraient produit uniquement des

interférences qui ont impliqué des informations acoustiques et linguistiques de bas niveau, la

tâche de décision lexicale de l’Expérience 3 suggère que manipuler des langues inintelligibles

selon leur distance phonémique avec la langue native des participants ne permet pas de tester

l’hypothèse des compétitions phonémiques entre les deux flux de parole concurrents.

4.5. Conclusions

Dans l’Expérience 3, une tâche de décision lexicale a été utilisée afin de capturer les

interférences entre les signaux de parole concurrents pendant l’accès au lexique des mots

cibles français. Une comparaison des temps de réaction obtenus avec les masqueurs paroliers


108

et les masqueurs de bruit fluctuant pour chacune des trois langues manipulées (français,

irlandais et italien) a mis en évidence un effet des informations linguistiques de haut niveau

uniquement pour les masqueurs paroliers français. Cela suggère tout d’abord que les

masqueurs paroliers générés dans les deux langues inconnues des participants (irlandais et

italien) ont entraîné des temps de réaction significativement différents, mais les interférences

qu’ils ont produites ont impliqué des informations de mêmes natures, à savoir des

informations acoustiques et linguistiques de bas niveau. Ensuite, concernant les masqueurs

paroliers français et italiens, bien qu’ils aient ralenti l’accès au lexique des mots cibles

français aussi fortement, leurs interférences ont impliqué des informations de natures

différentes. Les informations acoustiques et linguistiques de bas niveau ainsi que les

informations linguistiques de haut niveau des masqueurs paroliers français ont perturbé

l’accès au lexique des mots cibles français, alors que pour les masqueurs paroliers italiens, les

informations linguistiques de haut niveau ne seraient pas entrées en compétition avec les mots

cibles.

Dans cette expérience, la tâche de décision lexicale a entraîné un pourcentage moyen

d’erreurs de 34,1%, ce qui est élevé par rapport au pourcentage moyen d’environ 10% qui est

généralement observé dans une tâche de décision lexicale réalisée dans le silence. Dans

l’Expérience 4, nous allons utiliser à nouveau la tâche de décision lexicale et tester les mêmes

conditions expérimentales que dans l’Expérience 3 mais en fixant le Rapport Signal sur Bruit

entre les mots cibles français et les masqueurs à 0 dB au lieu de -5 dB; le niveau sonore des

mots cibles sera alors équivalent au niveau sonore des masqueurs au lieu d’être plus faible.

Nous nous attendons à ce que les pourcentages moyens d’erreurs diminuent, et il sera question

d’examiner si les patterns de résultats à 0 dB évolueront par rapport à ceux observés à -5 dB

ou s’ils resteront similaires ; patterns qui concernent les temps de réaction observés dans la

situation de la parole dans la parole ainsi que la nature des informations impliquées par les

interférences produites par les masqueurs paroliers.


109

H) EXPERIENCE 4

1. Objectifs

Dans les expériences précédentes, des effets de masque équivalents ont été mis en

évidence pour les masqueurs paroliers français et italiens. L’Expérience 3 a précisé que ces

masqueurs paroliers avaient produit des interférences de natures différentes ; seules les

informations linguistiques de haut niveau des masqueurs paroliers français auraient interféré

sur l’identification des mots cibles français. Dans cette Expérience 4, nous souhaitons obtenir

plus de précisions sur ce pattern de résultats. Une possibilité est de rendre la tâche de décision

lexicale moins difficile et ainsi de pouvoir exploiter un plus grand nombre de données. Pour

cela, nous allons utiliser la tâche de décision lexicale de l’expérience précédente et tester les

mêmes conditions expérimentales, mais avec un RSB de 0 dB au lieu de -5 dB ; la situation

d’écoute devrait être facilitée pour les participants et nous nous attendons à un taux d’erreurs

moyen plus faible. Nous observerons également si les résultats qui seront obtenus avec les

masqueurs paroliers irlandais et les masqueurs de bruit fluctuant dans les trois langues

manipulées évolueront avec le passage à 0 dB.

2. Méthode

2.1. Stimuli

Les 162 stimuli utilisés dans l’Expérience 4 (items cibles et masqueurs) étaient

exactement identiques à ceux générés dans l’Expérience 3 (annexes 3 et 4). Ces 162 stimuli

ont été obtenus en mixant chacun des 81 mots cibles et chacun des 81 pseudo-mots cibles à un

masqueur (parolier ou de bruit fluctuant) produit en français, irlandais ou italien, selon la

méthode décrite dans l’Expérience 3.

Dans l’Expérience 4, le Rapport Signal sur Bruit a été fixé à 0 dB et non pas à -5 dB comme

dans l’Expérience 3, le niveau sonore des items cibles était donc identique au niveau sonore

des masqueurs.


110


Dans l’Expérience 4, les variables manipulées étaient les mêmes que dans

l’Expérience 3. Nous les rappelons :

- L le facteur fixe à mesures répétées « Langue du masqueur » à 3 modalités, français,





pseudo-mots ;


Le plan expérimental était le suivant : P28*L3*T2*N2. Les analyses statistiques qui ont été

réalisées pour l’Expérience 4 n’ont pris en compte que les performances des participants

obtenues avec les mots cibles. Nous avions donc 6 conditions expérimentales, le plan

d’analyse était le suivant : P28*L3*T2.


La procédure expérimentale était exactement identique à celle de l’Expérience 3. Les

participants devaient réaliser une tâche de décision lexicale sur les items cibles insérés dans

les masqueurs. Ils devaient identifier le plus vite possible et en faisant le moins d’erreurs

possible si l’item cible était un mot de la langue française.

2.4. Participants

Vingt-huit volontaires de langue maternelle française, âgés de 18 à 32 ans ont participé

à l’Expérience 4. Aucun n’avait participé aux 3 expériences précédentes, aucun n’avait suivi

d’enseignement de gaélique irlandais ni d’italien, et aucun ne souffrait de trouble auditif ni de

trouble du langage. Leur participation a été dédommagée.


111

3. Résultats



(ANOVA) ont été menées sur les performances des participants à 0 dB. Pour la première

analyse, les TRs moyens ont été mesurés pour les mots cibles correctement identifiés dans

chaque condition expérimentale (Tableau 9). Les essais pour lesquels les participants ont fait

des erreurs (22,1%), n’ont pas répondu dans le temps imparti de 4500 ms (0,8%), ainsi que les

essais pour lesquels les TRs étaient inférieurs à 300 ms (0,2%) n’ont pas été inclus dans

l’analyse. Ainsi, la première ANOVA a considéré comme variable dépendante les TRs, et

comme variables intra-sujets la Langue des masqueurs (à 3 modalités : irlandais, italien et

français) et le Type de bruit dans le masqueur (à 2 modalités : parole et bruit fluctuant). Dans

la seconde ANOVA, les taux d’erreurs moyens (Tableau 10) constituaient la variable

dépendante et les variables intra-sujets étaient les mêmes que dans la première ANOVA.




indiqués.



Moyennes 1043 1086 1094 1058 1108 1139

Ecart-types 155,35 201,28 169,18 151,53 186,26 182,69




masqueurs (F(2,54) = 7.12, p < .001). Les participants ont été plus rapides lorsque les

masqueurs étaient produits en irlandais (1051 ms ; ET = 152,23) et plus lents avec les

masqueurs italiens (1097 ms ; ET = 192,48) et français (1117 ms ; ET = 175,87).


112


L’effet principal du Type de bruit dans le masqueur n’est pas ressorti significatif à

l’ANOVA (F(1,27) = 3.13, n.s.). Les TRs moyens étaient proches que, les mots cibles aient

été insérés dans des masqueurs paroliers (1102 ms ; ET = 175,3) ou dans des masqueurs de

bruit fluctuant (1075 ms ; ET = 175,63).


L’analyse de variance n’a pas indiqué d’interaction simple significative entre les deux

facteurs Langue des masqueurs et Type de bruit (F(2,54) = 0.3, n.s.). Les comparaisons post-

hoc réalisées avec le test HSD de Tukey ont montré que l’effet du Type de bruit dans le

masqueur n’était significatif pour aucune des trois langues manipulées. Avec les masqueurs

paroliers, les comparaisons post-hoc ont révélé une différence significative entre l’irlandais et

le français (p = .05), c’est-à-dire entre les langues qui ont conduit aux performances extrêmes.

Enfin, avec les masqueurs de bruit fluctuant, aucune différence entre les langues n’a été

révélée. Les résultats sont reportés dans la Figure 17 ci-dessous.


moyens (en ms) à 0 dB, en fonction de la Langue des masqueurs (irlandais, italien et français).

Les erreurs standard sont reportées. Le symbole ‘ * ’ indique une différence significative entre

les masqueurs paroliers irlandais et français.


113






Moyennes 17,58 27,20 17,03 20,88 26,10 23,63

Ecart-types 12,88 13,32 12,09 12,71 12,27 13,56



L’analyse de variance a indiqué un effet principal significatif de la Langue des

masqueurs (F(2,54) = 5.89, p < .005). En moyenne, les taux d’erreurs étaient plus faibles

avec les masqueurs irlandais (19,23% ; ET = 12,79) et français (20,33% ; ET = 13,16), et plus

élevés avec les masqueurs italiens (26,65% ; ET = 12,7).


L’effet principal du Type de bruit dans le masqueur n’est pas ressorti significatif à

l’analyse de variance (F(1,27) = 2.02, n.s.). Les taux d’erreurs étaient proches entre les

masqueurs paroliers (23,53% ; ET = 12,88) et les masqueurs de bruit fluctuant (20,6% ; ET =

13,47).


L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit n’a pas

été signalée comme significative à l’ANOVA (F(2,54) = 1.3, n.s.). Les comparaisons post-hoc

avec le test HSD de Tukey ont indiqué que l’effet du Type de bruit dans le masqueur n’était

significatif pour aucune des trois langues. Les comparaisons post-hoc ont également montré

qu’avec les masqueurs de bruit fluctuant, une différence significative a été observée entre le

français et l’italien (p = .04) ainsi qu’une différence tendancielle entre l’irlandais et l’italien (p

= .06). Avec les masqueurs paroliers, aucune différence entre les langues n’a été mise en

évidence.


114

4. Discussion


Dans l’Expérience 4, nous avons testé les mêmes conditions expérimentales que dans

l’Expérience 3, mais dans une situation d’écoute plus favorable ; les items cibles étaient

insérés dans des masqueurs paroliers et des masqueurs de bruit fluctuant générés en français,

en irlandais et en italien, avec un RSB fixé à 0 dB au lieu de -5 dB (Expérience 3). Il était

question d’examiner si les pourcentages d’erreurs des participants allaient diminuer, et si une

évolution des résultats entre un RSB à -5 dB (Expérience 3) et un RSB à 0 dB serait

engendrée. Plus précisément, dans cette partie, nous porterons un intérêt particulier aux

résultats obtenus avec les masqueurs paroliers français et italiens qui, dans l’expérience

précédente, ont eu des effets de masque équivalents bien qu’ils aient produit des interférences

de natures différentes.

4.2. Taux d’erreurs moyens

Dans la situation d’écoute à 0 dB, le taux d’erreurs des participants a effectivement

diminué. Même s’il reste plus élevé que celui observé dans une tâche de décision lexicale

réalisée dans le silence (estimé environ à 10%), le taux d’erreurs moyen des participants est

passé de 34,1% (pourcentage obtenu à -5 dB) à 22,1%.

Qu’en est-il des temps de réaction moyens obtenus dans la situation de la parole dans la

parole et de la nature des interférences produites par les masqueurs paroliers français,

irlandais et italiens ?


Dans l’Expérience 4 avec un RSB fixé à 0 dB, l’analyse des résultats a indiqué des

temps de réaction significativement différents uniquement entre les masqueurs paroliers

irlandais et français. Les masqueurs paroliers italiens ont entraîné des temps de réaction qui ne

différaient significativement pas de ceux observés avec les masqueurs paroliers irlandais et

français. Plus précisément, les masqueurs paroliers irlandais ont conduit aux temps de


115

réaction les plus courts, et les masqueurs paroliers français aux temps de réaction les plus

longs.

Ce pattern de résultats obtenu avec un RSB de 0 dB entre les mots cibles et les masqueurs est

différent de celui observé dans l’Expérience 3 lorsque le RSB était fixé à -5 dB. En effet, dans

l’expérience précédente, l’accès au lexique des mots cibles français était aussi long avec les

masqueurs paroliers italiens qu’avec ceux générés en français, et significativement plus court

avec les masqueurs paroliers irlandais. Il semblerait que la situation d’écoute à 0 dB soit

moins favorable que la situation d’écoute à -5 dB pour mettre en évidence des différences

entre les langues (notamment entre l’irlandais et l’italien), et entre leur niveau de perturbation

sur l’accès au lexique des mots cibles français.

De plus dans l’Expérience 1, nous avons étudié la situation de la parole dans la parole

avec une tâche d’intelligibilité et nous avons comparé les effets de masque de masqueurs

paroliers français et irlandais lorsque le RSB entre les mots cibles et les masqueurs paroliers

était fixé à -5 dB ou à 0 dB. Nous avons observé des pourcentages moyens de retranscriptions

correctes significativement plus élevés avec les masqueurs paroliers irlandais qu’avec les

masqueurs paroliers français, et ce pour les deux valeurs de RSB manipulées (-5 dB et 0 dB) ;

néanmoins, cet effet de la Langue des masqueurs était plus important à -5 dB plutôt qu’à 0

dB. Ainsi, en tenant compte des résultats obtenus avec la tâche d’intelligibilité de

l’Expérience 1, de ceux observés avec la tâche de décision lexicale utilisée dans l’Expérience

3 (à -5 dB) et de ceux révélés dans la présente expérience (à 0 dB), la situation d’écoute à -5

dB semble être la plus pertinente pour révéler les différences entre les effets de masque des

masqueurs paroliers français, irlandais et italiens.

Les résultats des études antérieures sont en accord avec cette idée. Les études de Van

Engen & Bradlow (2007) et de Calandruccio et al. (2010b) ont été menées auprès de

participants natifs de l’anglais qui devaient réaliser une tâche d’intelligibilité sur des phrases

cibles anglaises dégradées par des masqueurs paroliers à 2 locuteurs générés en anglais et en

mandarin. Des performances significativement différentes ont été observées entre les

masqueurs paroliers anglais et mandarins uniquement à -5 dB, cette différence significative a

disparu lorsque le RSB est passé à -3 dB (Calandruccio et al., 2010b) et à 0 dB (Van Engen &

Bradlow, 2007).


116

Intéressons nous à présent aux résultats obtenus avec les masqueurs de bruit fluctuant

et plus précisément aux résultats de la comparaison des temps de réaction obtenus avec les

deux types de masqueurs (parolier et bruit fluctuant). Déterminons si le passage d’un RSB de

-5 dB à un RSB de 0 dB a eu un impact sur la nature des informations présentes dans les

masqueurs paroliers français, irlandais et italiens qui sont entrées en compétition avec la

parole cible.


Nos résultats ont indiqué que l’effet du Type de bruit dans le masqueur n’était présent

pour aucune des trois langues manipulées (français, irlandais et italien). Cette absence de

différence significative entre les temps de réaction moyens obtenus avec les deux types de

masqueurs (parolier et bruit fluctuant) pour chacune des langues révèle que les informations


italiens n’ont pas perturbé l’accès au lexique des mots cibles français ; seules les informations

acoustiques et linguistiques de bas niveau ont influencé les temps de réaction des participants.

Ce pattern de résultats obtenu à 0 dB ne confirme pas celui observé dans l’Expérience

3 à -5 dB. En effet, dans l’expérience précédente, un effet des informations linguistiques de

haut niveau a été mis en évidence pour les masqueurs paroliers générés dans la langue

française (langue native) et donc dans la seule langue intelligible pour les participants. Ici à 0

dB, les masqueurs paroliers français ont produit des interférences qui n’ont pas impliqué les

informations linguistiques de haut niveau. Une explication serait qu’à 0 dB, la ségrégation

entre les deux flux de parole concurrents étant plus facile, les participants pourraient extraire

le signal cible du signal concurrent avec moins de difficulté. L’effet d’interférence des

informations linguistiques de haut niveau des masqueurs paroliers serait alors réduit.

Quant à la nature des informations impliquées par les interférences produites par les

masqueurs paroliers irlandais et italiens, nous retrouvons à 0 dB comme à -5 dB, l’absence de

différence significative entre les temps de réaction obtenus avec les deux types de masqueurs

(parolier et bruit fluctuant), ce qui indique que seules les informations acoustiques et

linguistiques de bas niveau des masqueurs paroliers irlandais et italiens ont perturbé l’accès au

lexique des mots cibles français. Néanmoins, une différence apparaît entre les situations

d’écoute à -5 dB et à 0 dB. En effet, à -5 dB (Expérience 3), les masqueurs paroliers italiens


117

ont conduit à des temps de réaction significativement plus élevés que les masqueurs paroliers

irlandais. Or à 0 dB, il n’y a plus de différence significative entre les temps de réaction

obtenus avec les masqueurs paroliers irlandais et italiens. Ainsi à 0 dB, bien que des effets des

informations acoustiques et linguistiques de bas niveau aient été observés pour les masqueurs

paroliers irlandais et italiens, ces effets seraient réduits, ce qui expliquerait l’absence de

différence significative entre les temps de réaction obtenus avec les masqueurs paroliers

irlandais et italiens. Ces effets d’interférences seraient réduits et non pas annulés ou

supprimés. En effet, une différence de temps de réaction entre les masqueurs paroliers

irlandais et français est tout de même mise en évidence. A nouveau, le fait que la ségrégation

entre les deux flux concurrents soit plus facile à 0 dB qu’à -5 dB pourrait expliquer les

patterns de résultats différents observés entre les situations d’écoute à -5 dB et à 0 dB.

4.5. Conclusions

Dans l’Expérience 4, la situation d’écoute à 0 dB (niveau sonore des mots cibles

équivalent à celui des masqueurs) a permis de réduire le pourcentage d’erreurs des

participants. Néanmoins, cette situation d’écoute ne se révèle pas être la plus favorable pour

explorer la nature des informations présentes dans les masqueurs paroliers qui perturbent

l’accès au lexique des mots cibles. En effet, l’effet des informations linguistiques de haut

niveau présent pour les masqueurs paroliers français à -5 dB (Expérience 3) a été réduit en

passant à 0 dB. Une réduction de l’effet des informations acoustiques et linguistiques de bas

niveau a également été observée pour les masqueurs paroliers italiens et irlandais. Dans cette

expérience, bien que le nombre de données à analyser soit plus important (diminution du taux

d’erreurs moyen des participants), nous n’avons pas pu obtenir d’informations

supplémentaires concernant les effets de masque équivalents des masqueurs paroliers français

et italiens (Expérience 3). Pour ces raisons, dans les expériences suivantes, nous n’utiliserons

plus la situation d’écoute à 0 dB mais la situation d’écoute à -5 dB.

Partie expérimentale Bilan des Expériences 1, 2, 3 & 4

118

I) BILAN DES EXPERIENCES 1, 2, 3 & 4

Dans cette thèse, nous nous intéressons aux interférences linguistiques qui

interviennent dans la situation de la parole dans la parole, notre objectif étant de les

caractériser. Suite aux quatre premières expériences, et avant de passer aux Expériences 5 &

6, rappelons nos objectifs et faisons un bilan des résultats obtenus.

Expérience 1

Dans l’Expérience 1, des mots cibles français étaient insérés dans des masqueurs

paroliers à 2 et à 4 locuteurs générés en français et en gaélique irlandais, le français étant la

langue native des participants et le gaélique irlandais une langue qui leur est inconnue (et

donc inintelligible). Le RSB était de -5 dB ou de 0 dB. Les participants devaient retranscrire

le mot cible entendu. En accord avec les résultats mis en évidence dans la littérature, nous

avons confirmé que l’intelligibilité des mots cibles français a été plus faible avec les

masqueurs paroliers générés dans la langue intelligible pour les participants (français) plutôt

que dans la langue inconnue (irlandais). En effet, les informations linguistiques des

masqueurs paroliers français étant intelligibles, elles ont interféré sur l’intelligibilité des mots

cibles français. Ceci étant notamment mis en évidence par le fait que les participants ont

retranscrit certains mots présents dans les masqueurs paroliers français à la place des mots

cibles français.

Expérience 2

Dans l’Expérience 2, il était question de déterminer si seules les informations lexicales

produisent des interférences ou si les informations sous-lexicales peuvent elles aussi entrer en

compétition avec la parole cible. Nous avons testé plus particulièrement l’hypothèse selon

laquelle les interférences linguistiques interviendraient au niveau phonémique. L’objectif était

d’explorer plus avant les interférences linguistiques produites par les masqueurs paroliers

générés dans une langue intelligible, mais aussi d’en connaître davantage sur les interférences

produites par les masqueurs paroliers générés dans une langue inintelligible. En effet, ces

masqueurs pour lesquels aucune intrusion lexicale n’est observée (c’est-à-dire que dans les


119

erreurs de retranscription des participants, nous n’avons pas observé de mots appartenant aux

masqueurs paroliers irlandais à la place des mots cibles français), ne produisent-ils qu’un effet

de masque énergétique ou leurs informations d’ordre phonémique pourraient-elles également

participer à la dégradation du message cible ? Nous avons testé l’hypothèse des interférences

phonémiques en incluant une deuxième langue inconnue des participants : l’italien. La langue

italienne est plus proche du français que l’irlandais selon plusieurs critères tels que le système

rythmique ou l’origine. Cependant, nous avons choisi l’italien pour sa distance phonémique

avec le français. En effet, dans l’inventaire phonémique de l’italien, nous retrouvons 60% des

phonèmes du français. L’irlandais est plus éloigné du français puisque seulement 18% des

phonèmes français sont présents dans l’inventaire phonémique de l’irlandais (Maddieson et

al., 2011). Selon l’hypothèse des interférences phonémiques, plus le pourcentage de

phonèmes communs entre la langue cible et la langue concurrente sera élevé, plus les

interférences phonémiques seront importantes, ce qui réduira l’intelligibilité des mots cibles

français. Dans cette Expérience 2, les masqueurs paroliers étaient composés de 4 locuteurs et

le RSB était fixé à -5 dB. Nous avons retrouvé des performances significativement plus

faibles avec les masqueurs paroliers français qu’avec les masqueurs paroliers irlandais. Nous

avons également observé des performances équivalentes entre les masqueurs paroliers

français et les masqueurs paroliers italiens, ce qui est surprenant puisque l’italien est une

langue non intelligible pour les participants et le français leur langue native.

Dans l’Expérience 2, nous avons pris en compte le fait que dans la situation de la

parole dans la parole, le masque informationnel produit au moins deux types d’interférences :

celles qui impliquent les informations linguistiques de bas niveau (rythme) et celles qui

impliquent les informations linguistiques de haut niveau (phonèmes, syllabes, mots). Afin

d’explorer plus favorablement les interférences linguistiques de haut niveau, nous avons

utilisé un deuxième type de masqueurs : des masqueurs de bruit fluctuant. Ils ont été générés à

partir des masqueurs paroliers français, irlandais, italiens, et ne partagent que les informations

acoustiques et linguistiques de bas niveau avec ces masqueurs paroliers ; les informations

linguistiques de haut niveau ont été supprimées. Des différences significatives de

pourcentages de retranscriptions correctes ont été révélées entre les deux types de masqueurs

(parolier et bruit fluctuant) pour chacune des trois langues manipulées, suggérant que les

informations linguistiques de haut niveau présentes dans les masqueurs paroliers français,

irlandais et italiens se sont associées aux informations acoustiques et linguistiques de bas

niveau pour dégrader l’intelligibilité des mots cibles français. Des analyses statistiques


120

complémentaires ont indiqué que ces effets des informations linguistiques de haut niveau

n’étaient pas proportionnels au pourcentage de phonèmes communs entre la langue cible et la

langue concurrente, suggérant que des interférences linguistiques autres que des interférences

phonémiques interviendraient, comme par exemple des interférences post-lexicales. Ces

dernières seraient dues à la tâche d’intelligibilité que nous avons utilisée pour tester notre

paradigme expérimental. En effet, les participants doivent retranscrire le mot cible une fois

que l’essai est terminé. Entre la fin de présentation du mot cible et la fin de l’essai, du temps

s’écoule pendant lequel des traitements post-lexicaux peuvent avoir lieu et influencer la

réponse finale des participants.

Expérience 3

Dans l’Expérience 3, au lieu d’utiliser une tâche d’intelligibilité, nous avons testé

notre paradigme expérimental avec une tâche de décision lexicale qui a pour caractéristique

de minimiser l’effet des interférences post-lexicales ; elle nous a permis de tester l’hypothèse

des interférences phonémiques durant l’accès au lexique des mots cibles français. Concernant

les masqueurs paroliers, la tâche de décision lexicale a mis en lumière le même pattern de

résultats que la tâche d’intelligibilité : la situation d’écoute était plus facile avec les

masqueurs paroliers irlandais et aussi difficile avec les masqueurs paroliers italiens qu’avec

les masqueurs paroliers français. En revanche, concernant la nature des interférences, la tâche

de décision lexicale a indiqué des résultats différents de ceux observés avec la tâche

d’intelligibilité dans l’Expérience 2 puisqu’un effet des informations linguistiques de haut

niveau n’a été révélé que pour les masqueurs paroliers français. Il ressort tout d’abord de

l’Expérience 3, que l’effet des informations linguistiques de haut niveau n’est intervenu que

lorsque la langue des masqueurs paroliers était intelligible. Les masqueurs paroliers français

et italiens auraient donc perturbé l’accès au lexique des mots cibles français avec autant

d’efficacité mais avec des interférences de natures différentes ; les masqueurs paroliers

italiens n’auraient produit que des interférences acoustiques et linguistiques de bas niveau.

Ensuite, concernant les masqueurs paroliers produits dans les deux langues inconnues des

participants (irlandais et italien), ils n’ont pas dégradé aussi efficacement la parole cible mais

leurs interférences ont impliqué des informations de mêmes natures : des informations

acoustiques et linguistiques de bas niveau. Les phonèmes communs entre le français et

l’irlandais ainsi que ceux communs entre le français et l’italien, ne semblent pas avoir créé


121

d’interférences pendant l’accès au lexique des mots cibles français. La tâche de décision

lexicale s’est avérée être plus précise que la tâche d’intelligibilité en minimisant l’effet des

traitements post-lexicaux. Elle nous a permis d’écarter l’hypothèse selon laquelle, dans notre

paradigme expérimental, les masqueurs paroliers générés dans les langues inconnues des

participants produiraient des interférences phonémiques.

Expérience 4

Dans l’Expérience 4, afin de déterminer s’il est possible d’obtenir davantage

d’informations avec la tâche de décision lexicale, nous avons testé le même paradigme

expérimental à 0 dB. Nous avons observé un pattern de résultats différent de celui à -5 dB.

En effet, avec les masqueurs paroliers, les temps de réaction étaient significativement

différents uniquement entre l’irlandais et le français. Les temps de réaction entre les deux

langues inconnues des participants (irlandais et italien) n’étaient plus significativement

différents. De plus, l’effet des informations linguistiques de haut niveau produit par les

masqueurs paroliers français à -5 dB dans l’Expérience 3, n’était plus présent dans cette

expérience à 0 dB. Etant donné l’absence de différence significative entre les masqueurs

paroliers irlandais et italiens, les effets des informations acoustiques et linguistiques de bas

niveau de ces masqueurs paroliers ont, eux aussi, été réduits. Ce pattern de résultat pourrait

être expliqué par le fait qu’à 0 dB, la ségrégation entre le signal cible et le signal concurrent

est plus facile qu’à -5 dB.

Expériences 5 & 6

Dans nos deux dernières expériences, les Expériences 5 & 6, notre objectif est de nous

focaliser sur le pattern de résultats observé avec les masqueurs paroliers français et italiens à

-5 dB ; ils ont perturbé l’accès au lexique des mots cibles français avec autant d’efficacité

mais avec des interférences de natures différentes. Nous utiliserons à nouveau la tâche de

décision lexicale et nous testerons le même paradigme expérimental, à savoir des mots cibles

français insérés dans des masqueurs paroliers à 4 locuteurs produits en français, irlandais,

italiens, ou dans des masqueurs de bruit fluctuant générés à partir des masqueurs paroliers

dans chacune des trois langues manipulées. Le RSB sera de -5 dB. La différence entre

l’Expérience 3 et les Expériences 5 & 6 concernera les participants sélectionnés, et plus


122

précisément leur niveau de connaissance du français et de l’italien. Dans l’Expérience 5, nous

testerons un groupe de participants natifs du français qui parlent l’italien comme langue

seconde. A présent que l’italien est une langue intelligible pour ces participants, nous

examinerons si un effet des informations linguistiques de haut niveau sera produit par les

masqueurs paroliers italiens. Dans l’Expérience 6, la tâche de décision lexicale sera réalisée

par des participants natifs de l’italien qui parlent le français comme langue seconde. Cette

expérience sera ainsi l’occasion de tester notre paradigme expérimental lorsque les mots

cibles français seront produits dans la langue seconde des participants. Nous observerons si

des effets des informations linguistiques de haut niveau seront produits par les masqueurs

paroliers italiens et français, et nous les comparerons. Dans l’Expérience 5 comme dans

l’Expérience 6, nous explorerons l’accès au lexique des mots cibles français lorsque les

masqueurs paroliers seront produits dans la langue native des participants (Expérience 5 :

français, Expérience 6 : italien), dans leur langue seconde (Expérience 5 : italien, Expérience

6 : français) ou dans une langue qui leur est inconnue (Expériences 5 & 6 : irlandais).


123

J) EXPERIENCE 5

1. Objectifs

Dans les Expériences 1 à 4, seuls les masqueurs paroliers produits en français étaient

intelligibles pour les participants. En effet, ces derniers étaient natifs du français et n’avaient

aucune connaissance du gaélique irlandais ni de l’italien. Dans l’Expérience 5, les masqueurs

paroliers générés en italien seront eux aussi intelligibles pour les participants. Nous

recruterons des participants natifs du français qui parlent l’italien comme langue seconde

(L2) ; le gaélique irlandais gardera le statut de langue non connue (non intelligible). Utiliser

ce groupe de participants nous permettra de faire évoluer notre paradigme expérimental

puisque nous allons faire varier, pour la langue de la parole concurrente, le niveau de

connaissances des participants, c’est-à-dire leur niveau d’expertise. Ainsi, la tâche de décision

lexicale sera proposée avec des mots cibles français qui seront insérés dans des masqueurs

paroliers générés dans la langue native des participants (français), dans leur langue seconde

(italien) et dans une langue qui leur est inconnue (irlandais). Nous testerons les mêmes

conditions expérimentales que dans l’Expérience 3 : les mots cibles seront insérés avec un

Rapport Signal sur Bruit de -5 dB dans les masqueurs paroliers, ces derniers seront composés

de 4 locuteurs. Des masqueurs de bruit fluctuant générés à partir des masqueurs paroliers

français, irlandais et italiens, seront également utilisés.

L’objectif de l’Expérience 5 est de compléter les résultats de l’Expérience 3. Dans cette

dernière, lorsque la langue des masqueurs paroliers était intelligible pour les

participants (c’est-à-dire lorsque les masqueurs paroliers étaient en français), il a été mis en

évidence que les informations linguistiques de haut niveau se sont associées aux informations

acoustiques et linguistiques de bas niveau pour perturber l’accès au lexique des mots cibles

français. Dans l’Expérience 5, à présent que l’italien devient une langue intelligible pour les

participants, nous souhaitons déterminer si les informations linguistiques de haut niveau des

masqueurs paroliers italiens perturbent l’accès au lexique des mots cibles français. Si tel est le

cas, nous examinerons si les participants sont affectés de façon équivalente par les masqueurs

paroliers générés dans leur langue native (français) et par ceux produits dans leur langue

seconde (italien) ; autrement dit, nous chercherons à déterminer si l’une des situations

d’écoute génère des interférences linguistiques plus fortes que l’autre.


124

2. Méthode

2.1. Stimuli

Les 162 stimuli utilisés dans l’Expérience 5 (annexes 3 et 4) étaient exactement

identiques à ceux utilisés dans les Expériences 3 & 4 (items cibles et masqueurs). Nous

rappelons que les stimuli ont été obtenus en insérant chacun des 81 mots cibles et chacun des

81 pseudo-mots cibles à 2,5 sec du début d’un masqueur de 4 sec (parolier ou de bruit

fluctuant) qui pouvait être produit en français, irlandais ou italien.

Dans l’Expérience 5, le Rapport Signal sur Bruit entre les items cibles et les masqueurs était

fixé à -5 dB par Matlab. Ainsi le niveau sonore des items cibles était plus faible (65 dB) que

celui des masqueurs (70 dB).


Dans l’Expérience 5, les variables manipulées étaient identiques à celles des

Expériences 3 & 4. Ainsi, nous retrouvons :






pseudo-mots ;


Le plan expérimental était le suivant : P24*L3*T2*N2. Etant donné que seules les performances

des participants obtenues avec les mots cibles ont été inclues dans les analyses statistiques, le

plan d’analyse était le suivant : P24*L3*T2. Nous avions donc 6 conditions expérimentales.


125


La procédure expérimentale était exactement identique à celle des Expériences 3 & 4.

Les participants devaient réaliser une tâche de décision lexicale sur les items cibles insérés

dans les masqueurs. Ils devaient identifier le plus vite possible et en faisant le moins d’erreurs


2.4. Participants

Vingt-quatre volontaires de langue maternelle française qui parlent l’italien comme

langue seconde ont participé à l’Expérience 5. Ces participants ont suivi un enseignement de

la langue italienne pendant une durée moyenne de 8 ans et reçoivent encore aujourd’hui des

cours d’italien (à l’université, par l’intermédiaire d’un institut culturel, échanges avec la

famille et/ou amis résidants en Italie). Ils étaient âgés de 18 à 34 ans, aucun n’avait suivi

d’enseignement de gaélique irlandais, et aucun ne souffrait de trouble auditif ni de trouble du

langage. Les participants ont été dédommagés pour leur participation.

3. Résultats



(ANOVA) ont été menées sur les performances des participants natifs du français parlant

l’italien comme L2. Pour la première ANOVA, les TRs moyens ont été mesurés pour les mots

cibles correctement identifiés dans chaque condition expérimentale (Tableau 11). Une

transformation inverse a été réalisée sur les moyennes de TRs afin d’harmoniser les données.

Les essais pour lesquels les participants ont fait des erreurs (34,1%), n’ont pas répondu dans

le temps imparti de 4500 ms (9,4%), ainsi que les essais pour lesquels les TRs étaient

inférieurs à 300 ms (0,3%) n’ont pas été inclus dans l’analyse. Ainsi, la première analyse a

considéré comme variable dépendante les TRs inverses et comme variables intra-sujets la

Langue des masqueurs (à 3 modalités : irlandais, italien et français) et le Type de bruit dans le

masqueur (à 2 modalités : parole et bruit fluctuant). Dans la seconde ANOVA, les taux

d’erreurs moyens (Tableau 12) constituaient la variable dépendante et les variables intra-


126

sujets étaient les mêmes que dans la première ANOVA. Pour plus de clarté, ce sont les TRs

moyens qui ont été utilisés pour décrire et représenter graphiquement les données.




indiqués.



Moyennes 1199 1262 1180 1240 1495 1306

Ecart-types 247,63 247,11 232,27 287,95 484,61 295,40



L’analyse de variance a révélé que l’effet principal de la Langue des masqueurs était

significatif (F(2,46) = 12.82, p < .001). En moyenne, les TRs étaient plus courts avec les

masqueurs irlandais (1219 ms ; ET = 266,48) et français (1243 ms ; ET = 270,48), ils étaient

plus longs avec les masqueurs italiens (1378 ms ; ET = 398,35).


L’effet principal du Type de bruit dans le masqueur de 133 ms est également ressorti

significatif à l’ANOVA (F(1,23) = 17.43, p < .001). En moyenne, les masqueurs paroliers ont

entraîné des TRs plus longs (1347 ms ; ET = 378,25) que les masqueurs de bruit fluctuant

(1214 ms ; ET = 241,57).


L’ANOVA a indiqué que l’interaction simple entre les deux facteurs Langue des

masqueurs et Type de bruit était tendancielle (F(2,46) = 2.68, p = .08). Les comparaisons

post-hoc réalisées avec le test HSD de Tukey ont montré que l’effet du Type de bruit dans le

masqueur était significatif pour l’italien (p < .005) ainsi que pour le français (p < .05). Les

comparaisons post-hoc ont également indiqué qu’avec les masqueurs paroliers, une différence


127

significative était présente entre l’irlandais et l’italien (p < .001) ainsi qu’entre le français et

l’italien (p = .02). En revanche, avec les masqueurs de bruit fluctuant, il n’y avait aucune

différence significative entre les langues. Ces résultats sont reportés dans la Figure 18.


moyens (en ms) à -5 dB, pour les participants natifs du français parlant l’italien en L2, en

fonction de la Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont

reportées. Le symbole ‘ * ’ indique une différence significative entre les deux types de bruits

(parole et bruit fluctuant) pour l’italien et le français. Des différences significatives sont


masqueurs paroliers italiens et français.






Moyennes 27,56 40,38 29,81 34,62 39,74 32,37

Ecart-types 12,81 16,40 11,18 15,38 18,66 16,35


128



L’effet principal de la Langue des masqueurs est ressorti significatif à l’analyse de

variance (F(2,46) = 7.3, p = .002). En moyenne, les participants ont fait moins d’erreurs

lorsque les masqueurs étaient produits en irlandais (31,09% ; ET = 14,45) et en français

(31,09% ; ET = 13,92), et plus d’erreurs avec les masqueurs italiens (40,06% ; ET = 17,38).


L’ANOVA n’a pas indiqué d’effet principal significatif du Type de bruit dans le

masqueur (F(1,23) = 1.5, n.s.). Les taux d’erreurs moyens étaient proches entre les masqueurs

paroliers (35,58% ; ET = 16,9) et les masqueurs de bruit fluctuant (32,59% ; ET = 14,6).


L’interaction simple entre les deux facteurs Langue des masqueurs et Type de bruit

n’est pas ressortie significative à l’ANOVA (F(2,46) = 1.04, n.s.). Les comparaisons post-hoc

avec le test HSD de Tukey ont indiqué que l’effet du Type de bruit n’était présent pour

aucune des langues. Les comparaisons post-hoc ont également révélé qu’avec du bruit

fluctuant dans les masqueurs, il y avait une différence significative entre l’irlandais et l’italien

(p = .02). Aucune différence significative entre les langues n’a été observée avec les

masqueurs paroliers.

4. Discussion


Dans l’Expérience 5, des participants natifs du français qui parlent l’italien comme L2

ont réalisé la même tâche de décision lexicale que les participants monolingues français de

l’Expérience 3. Les mots cibles français étaient insérés avec un RSB de -5 dB dans les

masqueurs paroliers français, irlandais et italiens ainsi que dans les masqueurs de bruit

fluctuant générés à partir des masqueurs paroliers dans chacune des trois langues manipulées.


129

Maintenant que l’italien est une langue connue pour les participants et donc intelligible, il

était question d’examiner si les informations linguistiques de haut niveau présentes dans les

masqueurs paroliers italiens sont impliquées dans la perturbation de l’accès au lexique des

mots cibles français. Il s’agissait également de comparer les temps de réaction obtenus avec

les masqueurs paroliers français, irlandais et italiens, afin de déterminer si le niveau de

connaissances des participants pour les langues concurrentes (langue native (français), langue

seconde (italien) ou langue inconnue (irlandais)) influencerait la vitesse de l’accès au lexique

des mots cibles français.


Les résultats de l’Expérience 5 ont révélé que selon la langue des masqueurs paroliers,

les interférences qui ont perturbé l’accès au lexique des mots cibles français ont impliqué des

informations de natures différentes. Concernant les masqueurs paroliers français et italiens,

les informations acoustiques et linguistiques de bas niveau ainsi que les informations

linguistiques de haut niveau qu’ils contiennent ont ralenti l’accès au lexique des mots cibles

français. En effet, une différence significative entre les temps de réaction obtenus avec les

deux types de masqueurs (parolier et bruit fluctuant) a été mise en évidence pour le français et

l’italien. En revanche, pour l’irlandais, l’identification des mots cibles français semble avoir

été principalement perturbée par les informations acoustiques et linguistiques de bas niveau

présentes dans les masqueurs paroliers irlandais ; aucune différence significative n’a été

observée entre les temps de réaction obtenus avec les deux types de masqueurs irlandais.

Cette différence entre les langues (français, irlandais et italien), quant à la nature des

informations qui ont perturbé l’accès au lexique des mots cibles, serait due au fait que pour les

participants, le français et l’italien sont des langues connues (respectivement leur langue

native et leur langue seconde) contrairement à l’irlandais (langue qui ne leur a jamais été

enseignée). Les informations linguistiques de haut niveau présentes dans les masqueurs

paroliers sont donc entrées en compétition avec les mots cibles lorsque la langue des

masqueurs paroliers était intelligible pour les participants (français et italien) plutôt que non

intelligible (irlandais).

4.3. Masqueurs paroliers français (L1) versus italiens (L2)


130

Dans la situation de la parole dans la parole, les masqueurs paroliers italiens ont

entraîné des temps de réaction significativement plus longs que les masqueurs paroliers

français et irlandais. Ce résultat indique que les masqueurs paroliers français et italiens, bien

qu’ils aient produit des interférences impliquant des informations de mêmes natures (des

informations acoustiques et linguistiques de bas niveau ainsi que des informations

linguistiques de haut niveau), n’ont pas perturbé l’accès au lexique des mots cibles français

avec la même efficacité. Il a fallu plus de temps pour identifier les mots cibles français

lorsque les masqueurs paroliers étaient générés dans la L2 des participants (italien) plutôt que

dans leur langue native (français).

Nous nous sommes alors demandés si les effets des informations linguistiques de haut niveau

mis en évidence pour les masqueurs paroliers français et italiens étaient différents. Pour

répondre à cette question, nous avons effectué une analyse de variance à mesures répétées sur

les temps de réaction inverses obtenus pour les deux types de masqueurs (parolier et bruit

fluctuant) uniquement avec le français et l’italien ; les données obtenues avec l’irlandais n’ont

pas été prises en compte. Cette analyse a considéré comme variable aléatoire les participants

et comme variables intra-sujets la Langue des masqueurs (à 2 modalités : français et italien) et

le Type de bruit dans le masqueur (à 2 modalités : parole et bruit fluctuant). Cette analyse a

indiqué un effet principal significatif de la Langue des masqueurs (F(1,23) = 11.51, p < .005)

ainsi qu’un effet principal significatif du Type de bruit dans le masqueur (F(1,23) = 26.89, p <

.001). En revanche, l’interaction simple entre ces deux facteurs n’est pas ressortie

significative à l’ANOVA (F(1,23) = .43, n.s.), suggérant que l’effet des informations

linguistiques de haut niveau des masqueurs paroliers italiens ne semble pas être différent de

celui des informations linguistiques de haut niveau des masqueurs paroliers français. Le

niveau de connaissances des participants pour la langue de la parole concurrente (langue

native versus langue seconde) ne semble pas avoir eu d’influence.

Les temps de réaction significativement plus longs obtenus avec les masqueurs

paroliers italiens plutôt qu’avec les masqueurs paroliers français pourraient être expliqués par

la façon dont nous avons élaboré les stimuli. Nous rappelons que dans notre paradigme

expérimental, 4 locuteurs composent les masqueurs paroliers. Hoen et al. (2007) ont montré

que, jusqu’à 4 locuteurs, certains mots sont encore disponibles. Dans la condition où l’essai

commence avec un masqueur parolier en italien (L2 des participants), des traitements

linguistiques sont engagés sur les mots extraits du masqueur. Or Weber & Cutler (2004), ont


131

mis en évidence que l’identification de mots produits dans une L2 entraîne l’activation de

compétiteurs appartenant au lexique mental de la L2 ainsi que l’activation de compétiteurs du

lexique mental de la langue native. Ainsi, avec un masqueur parolier italien, le nombre total

de compétiteurs activés devrait être plus élevé qu’avec un masqueur parolier en français

(langue native des participants) ; avec ce dernier, seuls des compétiteurs du lexique mental de

la langue native seraient activés. L’identification du mot cible inséré dans un masqueur

parolier devrait être plus lente avec un masqueur parolier italien plutôt qu’avec un masqueur

parolier français ; ce qui expliquerait nos résultats.

Néanmoins, dans notre expérience, nous ne pouvons pas exclure la présence d’un biais

attentionnel. En effet, au moment du recrutement des participants, nous avons recherché des

participants natifs du français qui parlaient l’italien comme L2. Cette précision concernant

l’italien comme L2 a pu influencer les participants dans leur façon de réaliser la tâche. Les

participants n’avaient d’informations que sur la consigne à exécuter (répondre le plus vite

possible et en faisant le moins d’erreurs possible si le mot cible appartient à la langue

française), ils ne connaissaient pas l’objet de l’étude. Lorsqu’un masqueur parolier italien était

présenté, les participants, en pensant que leurs connaissances de l’italien était un critère

important pour participer à cette étude, pourrait s’être davantage focalisés sur les informations

des masqueurs paroliers italiens, occasionnant davantage de difficultés pour repérer le mot

cible français et l’extraire du masqueur parolier italien.

Afin de contrôler la présence de ce biais attentionnel, une possibilité serait de réaliser cette

tâche de décision lexicale en Italie, avec le même matériel expérimental : des mots cibles

français insérés dans les masqueurs paroliers et dans les masqueurs de bruit fluctuant dans les

trois langues manipulées (français, irlandais et italien). Des participants natifs du français qui

vivent en Italie pour leurs études ou pour leur travail seraient sélectionnés. Afin de les

recruter, nous préciserions uniquement que nous cherchons des participants de langue

maternelle française qui n’ont jamais reçu d’enseignement de gaélique irlandais. Quant à leur

niveau d’italien, étant donné qu’ils sont amenés à pratiquer cette langue quotidiennement,

nous n’aurions pas besoin de préciser que nous cherchons des participants parlant l’italien

comme L2. Nous pourrions ainsi éviter un éventuel biais attentionnel.

Récemment, Brouwer et al. (2012) ont, eux-aussi comparé les effets de masque de

masqueurs paroliers générés dans une langue native ou dans une langue seconde. Ils ont


132

proposé à des participants natifs de l’allemand qui parlent l’anglais comme L2, de réaliser une

tâche d’intelligibilité sur des phrases cibles produites dans leur langue native. Ces dernières

étaient insérées dans des masqueurs paroliers à 2 locuteurs qui parlaient en allemand (langue

native des participants) ou en anglais (L2). Les auteurs ont observé des performances

significativement plus faibles avec les masqueurs paroliers en allemand plutôt qu’avec les

masqueurs paroliers en anglais. Ainsi dans l’étude de Brouwer et al. (2012), les masqueurs

paroliers générés dans la langue native des participants (allemand) ont eu un effet de masque

plus important que les masqueurs paroliers produits dans la L2 (anglais). Dans notre

expérience, nous avons obtenu des résultats différents puisque les participants ont davantage

été affectés par les masqueurs paroliers générés dans leur L2 (italien) que par ceux produits

dans leur langue native (français).

Cependant, il est clair que l’étude de Brouwer et al. (2012) et la nôtre ont exploré la situation

de la parole dans la parole en utilisant des paradigmes expérimentaux différents, ce qui

pourrait expliquer la divergence de résultats. Tout d’abord, pour la parole cible, Brouwer et al.

(2012) ont présenté des phrases alors que nous avons utilisé des mots isolés. Etant donné que

des interférences syntaxiques et sémantiques peuvent intervenir lors du traitement d’une

phrase et influencer les réponses des participants, dans notre paradigme nous avions préféré

utiliser des mots isolés afin de nous affranchir de ce type d’interférences. Il en découle une

seconde différence entre les deux études, le moment auquel le signal cible est inséré dans le

signal concurrent. Dans l’étude de Brouwer et al. (2012), la phrase cible commence 500 ms

après le début du masqueur, alors que dans notre étude, le mot cible est présenté 2,5 sec après

le début du masqueur. Une troisième différence concerne le nombre de locuteurs présents

dans les masqueurs paroliers : 2 locuteurs pour Brouwer et al. (2012), 4 locuteurs dans notre

expérience. L’effet de masque informationnel des masqueurs paroliers composés de 2

locuteurs est plus faible que celui des masqueurs paroliers à 4 locuteurs. En effet, avec 2

locuteurs dans le masqueur, l’auditeur peut s’aider de la fréquence fondamentale (F0) des

voix des locuteurs afin de séparer le signal cible du signal concurrent, ce qui réduit l’effet de

masque informationnel du signal de parole concurrent (Brungart et al., 2001). Avec 4

locuteurs, les caractéristiques vocales des locuteurs sont moins accessibles. Enfin, Brouwer et

al. (2012) ont testé une tâche d’intelligibilité alors que dans l’Expérience 5, nous avons utilisé

une tâche de décision lexicale. Cette dernière a pour caractéristique de capturer les

interférences entre les deux flux de parole concurrents durant l’accès au lexique des mots

cibles. Quant à la tâche d’intelligibilité, elle laisse place à des traitements post-lexicaux dont


133

nous avons montré l’influence sur les performances des participants dans les Expériences 2 &

3. Ainsi, ces différences entre l’étude de Brouwer et al. (2012) et l’Expérience 5 suffisent

probablement à expliquer la divergence de résultats.

4.4. Conclusions

L’Expérience 5 a testé des participants natifs du français qui parlent l’italien comme

L2 et a montré que ces participants ont davantage été affectés par les masqueurs paroliers

générés dans leur L2 (italien) plutôt que par ceux produits dans leur langue native (français).

Néanmoins, les masqueurs paroliers français et italiens ont produit des interférences

impliquant des informations de mêmes natures : des informations acoustiques et linguistiques

de bas niveau ainsi que des informations linguistiques de haut niveau.

Ainsi, ces résultats complètent ceux obtenus dans l’Expérience 3 menée auprès de participants

natifs du français qui ne connaissaient ni l’irlandais ni l’italien (participants monolingues). Le

matériel expérimental était exactement identique dans les Expériences 3 & 5. Pour les

participants monolingues français, un effet des informations linguistiques de haut niveau a été

mis en évidence uniquement pour les masqueurs paroliers générés en français, c’est-à-dire

pour les masqueurs paroliers qui ont été générés dans la seule langue intelligible pour les

participants ; ils n’ont jamais reçu d’enseignement de l’italien ni de l’irlandais. Les résultats

de l’Expérience 5 obtenus avec les participants français qui parlent italien en L2 confirment

que lorsque la langue de la parole concurrente est intelligible, les informations linguistiques

de haut niveau s’associent aux informations acoustiques et linguistiques de bas niveau pour

perturber l’accès au lexique des mots cibles.

5. Comparaison des Expériences 3 & 5

Nous allons comparer dans une même analyse statistique les résultats obtenus par les

participants natifs du français qui parlent italien comme L2 (Expérience 5) à ceux des

participants monolingues natifs du français (Expérience 3) ; ces résultats sont reportés dans

les Tableaux 13 et 14. Du fait de leur niveau de connaissances différent pour l’italien, des

patterns de résultats différents entre les deux groupes de participants ont été révélés pour les

masqueurs paroliers et les masqueurs de bruit fluctuant italiens. En effet, dans l’Expérience 5,

nous avons observé une différence significative entre les temps de réaction obtenus avec les


134

deux types de masqueurs italiens, alors que dans l’Expérience 3, cette différence significative

n’était pas présente. Les informations linguistiques de haut niveau des masqueurs paroliers

italiens ont donc ralenti l’identification des mots cibles français uniquement dans l’Expérience

5. Nous souhaitons examiner cette différence entre les deux groupes de participants à l’aide

d’une analyse de variance. Celle-ci sera menée sur les temps de réaction obtenus par les deux

groupes. L’ANOVA nous permettra également d’identifier si d’autres différences sont

présentes entre les deux groupes de participants, notamment des différences dans les temps de

réaction obtenus avec les deux types de masqueurs (parolier et bruit fluctuant) français et

irlandais.

Plus précisément, nous allons effectuer une analyse de variance sur les temps de réaction

inverses des deux groupes de participants. Etant donné que dans l’Expérience 5, les données

ont été harmonisées à l’aide d’une transformation inverse, nous avons appliqué cette dernière

aux données de l’Expérience 3. L’ANOVA a considéré les variables suivantes : le facteur

Groupe (à 2 modalités : participants français monolingues et participants français avec

l’italien comme L2), le facteur Langue des masqueurs (à 3 modalités : français, irlandais et

italien) et le facteur Type de bruit dans le masqueur (à 2 modalités : parole et bruit fluctuant).

Les groupes de participants étaient exactement identiques à ceux des Expériences 3 & 5, il y

avait 30 participants français monolingues et 24 participants français qui parlent l’italien

comme L2.

Tableaux 13 et 14 : Temps de réaction moyens (en ms) obtenus pour les mots cibles

correctement identifiés dans chacune des six conditions expérimentales, pour les participants

monolingues français (Tableau 13) et pour les participants français parlant l’italien en L2

(Tableau 14). Les écart-types sont également indiqués.

Tableau 13 Masqueurs de bruit fluctuant Masqueurs paroliers


Moyennes 1125 1216 1161 1167 1262 1272

Ecart-types 166,98 252,94 204,04 188,19 260,50 225,72



Moyennes 1199 1262 1180 1240 1495 1306

Ecart-types 247,63 247,11 232,27 287,95 484,61 295,40


135


Effet du Groupe

L’analyse de variance a indiqué que l’effet principal du Groupe n’était pas significatif

(F(1,52) = 1.8, n.s.). En effet, les TRs moyens obtenus par les participants monolingues natifs

du français (1201 ms ; ET = 222,56) étaient proches de ceux des participants natifs du

français qui parlent l’italien comme L2 (1280 ms ; ET = 323,24).


L’effet principal de la Langue des masqueurs est ressorti significatif à l’ANOVA

(F(2,104) = 16.037, p < .001). En moyenne, les TRs étaient plus courts lorsque les masqueurs

étaient produits en irlandais (1179 ms ; ET = 223,44) et en français (1228 ms ; ET = 243,12)

plutôt qu’en italien (1301 ms ; ET = 332,54).


L’ANOVA a également révélé un effet principal significatif du Type de bruit dans le

masqueur (F(1,52) = 27.67, p < .001). En moyenne, les masqueurs paroliers ont entraîné des

TRs plus longs (1284 ms ; ET = 308,70) que les masqueurs de bruit fluctuant (1188 ms ; ET =

226,02).


Groupe * Langue des masqueurs

L’interaction simple entre les facteurs Groupe et Langue des masqueurs a été révélée

comme significative à l’analyse de variance (F(2,104) = 3.23, p < .05). Les comparaisons

post-hoc effectuées avec le test HSD de Tukey ont révélé que l’effet du Groupe était présent

uniquement avec l’italien (p < .005).

Groupe * Type de bruit

L’interaction simple entre les facteurs Groupe et Type de bruit est ressortie comme

tendancielle à l’ANOVA (F(1,52) = 3.11, p = .08).


136

Type de bruit * Langue des masqueurs

L’analyse de variance a indiqué que l’interaction simple entre les facteurs Type de

bruit et Langue des masqueurs était tendancielle (F(2,104) = 2.62, p = .08).

L’analyse de variance a montré que l’interaction double entre les trois facteurs

manipulés était tendancielle à l’ANOVA (F(2,104) = 3.66, p = .07). Les comparaisons post-

hoc effectuées avec le test HSD de Tukey ont indiqué que la seule différence significative

entre les TRs des deux groupes de participants a été observée avec les masqueurs paroliers

italiens (p = .001), l’accès au lexique des mots cibles français était plus long pour les

participants natifs du français qui parlent italien en L2 plutôt que pour les participants

monolingues natifs du français (voir Figure 19). Les comparaisons post-hoc ont également

montré que pour les participants monolingues français, l’effet du Type de bruit était présent

uniquement pour le français (p = .03) ; pour les participants français qui parlent l’italien

comme L2, l’effet du Type de bruit était significatif pour l’italien (p < .005) et pour le

français (p = .04).


moyens (en ms) à -5 dB, pour les participants monolingues français (Expérience 3) et pour les

participants natifs du français parlant l’italien en L2 (Expérience 5), en fonction de la Langue


137

des masqueurs (irlandais, italien et français). Les erreurs standard sont reportées. Le symbole

‘ * ’ indique une différence significative entre les deux types de bruits (parole et bruit

fluctuant) pour l’italien (Expérience 5) et pour le français (Expériences 3 & 5). Les TRs

moyens obtenus avec les masqueurs paroliers italiens dans l’Expérience 5 sont indiqués en

vert, ils sont significativement différents de ceux obtenus dans l’Expérience 3 pour la même

condition expérimentale.

5.3. Discussion de la comparaison

Dans cette partie, il s’agissait de comparer les temps de réaction obtenus par deux

groupes de participants qui se différencient uniquement par leur niveau de connaissances de

l’italien. En effet, pour un groupe de participants l’italien est une langue inconnue

(Expérience 3), alors que pour l’autre groupe l’italien est une langue seconde (Expérience 5).

Ces deux groupes de participants ont réalisé la même tâche de décision lexicale sur des mots

cibles français insérés dans des masqueurs paroliers et des masqueurs de bruit fluctuant

générés en français, irlandais et italien. Dans l’Expérience 3, l’italien était une langue non

intelligible pour les participants monolingues français, seuls les masqueurs paroliers français

ont produit des interférences qui ont impliqué des informations linguistiques de haut niveau

ainsi que des informations acoustiques et linguistiques de bas niveau. Dans l’Expérience 5,

pour les participants français qui parlent italien comme L2, un effet des informations

linguistiques de haut niveau s’est ajouté à celui des informations acoustiques et linguistiques

de bas niveau, pour les masqueurs paroliers français ainsi que pour les masqueurs paroliers

italiens. L’objectif de cette comparaison était d’une part, d’examiner cette différence de

résultats pour les masqueurs paroliers italiens dans une même analyse de variance, et d’autre

part de déterminer si d’autres différences sont notables entre les patterns de résultats des deux

groupes de participants.

L’analyse de variance a en effet indiqué une différence significative entre les deux

groupes de participants pour les masqueurs paroliers italiens. Les participants français qui

parlent l’italien comme L2 (Expérience 5) ont eu des temps de réaction significativement plus

longs que les participants monolingues français (Expérience 3). Autrement dit, les temps de

réaction étaient plus longs lorsque l’italien était intelligible pour les participants, des

interférences linguistiques de haut niveau ont été produites en plus des interférences

acoustiques et linguistiques de bas niveau.


138

Aucune autre différence dans les temps de réaction des deux groupes de participants n’a été

signalée, indiquant que les participants français avec de l’italien comme L2 ont eu un pattern

de résultats similaire à celui des participants monolingues français. Le seul paramètre qui

varie entre ces deux groupes de participants, à savoir leur niveau de connaissances pour

l’italien, est responsable de la seule différence de performances entre ces groupes.

Dans l’Expérience 6, nous nous intéresserons aux interférences linguistiques lorsque le

message cible sera produit dans une L2. Etant donné l’augmentation du nombre de personnes

amenées à communiquer dans leur langue seconde plutôt que dans leur langue native, étudier

la situation de la parole dans la parole lorsque le message cible est produit dans une L2 paraît

pertinent. Par ailleurs, nous pourrons observer dans quelle mesure le niveau de connaissances

des participants pour la langue de la parole cible peut entraîner une évolution des patterns de

résultats jusqu’à présent obtenus.


139

K) EXPERIENCE 6

1. Objectifs

Dans les Expériences 1 à 5, tous les participants étaient natifs du français. Ils ont ainsi

réalisé la tâche d’intelligibilité (Expériences 1 & 2) ou la tâche de décision lexicale

(Expériences 3, 4 & 5) avec des mots cibles produits dans leur langue native (français). Dans

l’Expérience 6, des participants natifs de l’italien qui parlent le français comme L2 seront

recrutés. Ils réaliseront la même tâche de décision lexicale que les participants des

Expériences 3 & 5, des mots cibles français seront insérés dans des masqueurs paroliers à 4

locuteurs en français, irlandais et italiens ainsi que dans des masqueurs de bruit fluctuant

générés à partir des masqueurs paroliers dans chaque langue ; le RSB sera fixé à -5 dB.

Autrement dit, dans l’Expérience 6, même si la langue native des participants est l’italien,

nous leur présenterons des mots cibles français ; les participants réaliseront alors la tâche de

décision lexicale dans leur L2. De plus, à la suite de la tâche de décision lexicale (phase test),

nous ferons passer un post-test aux participants. Nous leur présenterons à nouveau les mots et

les pseudo-mots cibles mais cette fois-ci, en l’absence des masqueurs (dans le silence).

Comme dans la phase test, les participants devront répondre si l’item cible est un mot qui

existe dans la langue française, en prenant leur temps ; nous ne tiendrons pas compte des

temps de réaction. Avec ce post-test, il s’agit de différencier, pour chacun des participants, les

mots cibles français qui sont effectivement connus de ceux qui ne le sont pas. Sur cette base,

nous analyserons dans la phase test, les temps de réaction pour les mots cibles correctement

identifiés, uniquement lorsque ces derniers sont connus des participants.

Avec l’Expérience 6, nous cherchons à nouveau à compléter nos résultats. En effet, jusqu’à

présent, nous avons examiné l’impact des interférences linguistiques produites par la parole

concurrente sur l’intelligibilité d’un message cible produit dans une langue native. Dans

l’Expérience 6, nous nous intéresserons aux interférences linguistiques lorsque le message

cible sera produit dans une langue seconde. Dans l’Expérience 5, nous avons manipulé le

niveau de connaissances des participants pour la langue des masqueurs paroliers. Nous avons

observé que les participants natifs du français qui parlent l’italien en L2, ont davantage été

affectés par les masqueurs paroliers générés dans leur L2 que par ceux générés dans leur

langue native. Dans l’Expérience 6, nous comparerons également les temps de réaction des


140

participants qui seront obtenus avec les masqueurs paroliers produits dans leur L2 (français), à

ceux qui seront obtenus avec les masqueurs paroliers produits dans leur langue native (italien)

lorsque les mots cibles seront perçus dans leur L2. Nous chercherons à identifier si les

masqueurs paroliers ralentiront plus l’identification des mots cibles français lorsqu’ils seront

produits dans une langue plutôt que dans une autre (langue native versus langue seconde).

2. Méthode

2.1. Stimuli

Les 162 stimuli utilisés dans l’Expérience 6 (annexes 3 et 4) étaient exactement

identiques à ceux utilisés dans les Expériences 3, 4 & 5 (items cibles et masqueurs). Nous

rappelons que les stimuli ont été obtenus en insérant chacun des 81 mots cibles et chacun des

81 pseudo-mots cibles à 2,5 sec du début d’un masqueur de 4 sec (parolier ou de bruit

fluctuant) qui pouvait être produit en français, irlandais ou italien.

Dans l’Expérience 6, comme dans les Expériences 3 & 5, le RSB entre les items cibles et les

masqueurs était fixé à -5 dB à l’aide du logiciel Matlab.


Dans l’Expérience 6, les variables manipulées étaient identiques à celles des

Expériences 3, 4 & 5 :






pseudo-mots ;



141

Le plan expérimental était le suivant : P24*L3*T2*N2. N’ont été inclues dans les analyses

statistiques que les performances des participants obtenues avec les mots cibles, le plan

d’analyse était alors le suivant : P24*L3*T2. Nous avions 6 conditions expérimentales.


La procédure expérimentale était exactement identique à celle des Expériences 3, 4 &

5. Les participants devaient réaliser une tâche de décision lexicale sur les items cibles insérés

dans les masqueurs. Ils devaient identifier le plus vite possible et en faisant le moins d’erreurs


2.4. Participants

Vingt-quatre volontaires de langue maternelle italienne qui parlent le français comme

langue seconde ont participé à l’Expérience 6. Tous ont rempli un questionnaire concernant la

durée de leur apprentissage de la langue française et le nombre d’années d’immersion en

France. Il ressort de ce questionnaire que les participants ont suivi un enseignement de la

langue française pendant une durée moyenne de 8 ans ½. Au moment de leur recrutement

pour cette expérience, cela faisait en moyenne 5 ans qu’ils vivaient en France pour leur travail

ou pour poursuivre leurs études ; leur pratique du français était alors soutenue. Ils étaient âgés

de 18 à 39 ans, aucun n’avait suivi d’enseignement de gaélique irlandais, et aucun ne souffrait

de trouble auditif ni de trouble du langage. Leur participation a été dédommagée.

3. Résultats

3.1. Post-test

En moyenne, 73% (ET = 12) des mots cibles français ont été reconnus par les

participants. Concernant l’analyse des temps de réaction obtenus dans la phase test, nous

n’avons analysé que ceux obtenus pour les mots cibles correctement identifiés lorsque ces

derniers étaient connus des participants.


142

3.2. Phase test

Deux analyses de variance à mesures répétées (ANOVA) ont été menées sur les

performances des participants natifs de l’italien parlant le français comme L2. Pour la

première ANOVA, les TRs moyens ont été mesurés pour les mots cibles correctement

identifiés et connus des participants (Tableau 15). Comme dans l’expérience précédente et

afin d’harmoniser les données, une transformation inverse a été réalisée sur les moyennes de

TRs. Les essais pour lesquels les participants ont fait des erreurs (34,3%), n’ont pas répondu

dans le temps imparti de 4500 ms (7,5%), ainsi que les essais pour lesquels les TRs étaient

inférieurs à 300 ms (0,2%) n’ont pas été inclus dans l’analyse. Ainsi, la première ANOVA a

considéré comme variable dépendante les TRs inverses, et comme variables intra-sujets la

Langue des masqueurs (à 3 modalités : irlandais, italien et français) et le Type de bruit dans le

masqueur (à 2 modalités : parole et bruit fluctuant). Une seconde analyse de variance a

également été menée en considérant les taux d’erreurs (Tableau 16) comme variable

dépendante ; les variables intra-sujets étaient les mêmes que dans la première ANOVA. Pour

la clarté, ce sont les TRs moyens qui ont été utilisés pour décrire et représenter graphiquement

les données.




indiqués.



Moyennes 1376 1510 1441 1447 1841 1659

Ecart-types 368,81 349,10 395,37 409,15 716,97 460,14



L’analyse de variance a signalé que l’effet principal de la Langue des masqueurs est

ressorti significatif à l’ANOVA (F(2,46) = 11.84, p < .0001). En moyenne, les masqueurs


143

italiens et français ont entraîné des TRs plus longs (respectivement 1676 ms , ET = 582,43; et

1550 ms, ET = 438,39) que les masqueurs irlandais (1412 ms ; ET = 387,03).


L’analyse de variance a également montré que l’effet principal du Type de bruit dans

le masqueur de 207 ms était significatif (F(1,23) = 21.99, p = .0001). En moyenne, les

participants ont été plus lents avec les masqueurs paroliers (1649 ms ; ET = 561,8) qu’avec

les masqueurs de bruit fluctuant (1442 ms ; ET = 370,43).



pas ressortie significative à l’ANOVA (F(2,46) = 1.32, n.s.). Les comparaisons post-hoc avec

le test HSD de Tukey ont montré que l’effet du Type de bruit dans le masqueur était

tendanciel pour le français (p = .06) et significatif pour l’italien (p = .05). Les comparaisons

post-hoc ont également indiqué qu’avec les masqueurs paroliers, une différence significative

était présente entre l’irlandais et le français (p = .05) ainsi qu’entre l’irlandais et l’italien (p =

.001). Avec les masqueurs de bruit fluctuant, aucune différence significative entre les langues

n’a été signalée. Les résultats sont reportés dans la Figure 20.


144


moyens (en ms) à -5 dB, pour les participants natifs de l’italien parlant le français en L2, en



(parole et bruit fluctuant) pour l’italien et une différence tendancielle pour le français. Des








Moyennes 29,75 36,74 27,71 40,34 45,68 25,90

Ecart-types 17,75 19,12 11,82 19,62 20,40 17,58




masqueurs (F(2,46) = 13.58, p < .0001). En moyenne, les taux d’erreurs étaient plus faibles

avec les masqueurs français (26,8% ; ET = 14,85) et plus élevés avec de l’irlandais (35,05% ;

ET = 19,27) et de l’italien (41,21% ; ET = 20,07).


L’effet principal du Type de bruit dans le masqueur de 5,9% a été indiqué comme

tendanciel à l’ANOVA (F(1,23) = 3.41, p = .08). En moyenne, les participants ont fait plus

d’erreurs avec les masqueurs paroliers (37,31% ; ET = 20,75) plutôt qu’avec les masqueurs de

bruit fluctuant (31,4% ; ET = 16,76).



pas ressortie significative à l’analyse de variance (F(2,46) = 2.19, n.s.). Les comparaisons


145

post-hoc avec le test HSD de Tukey ont montré que l’effet du Type du bruit n’était significatif

pour aucune des langues. Avec les masqueurs paroliers, les comparaisons post-hoc ont mis en

évidence une différence significative entre l’irlandais et le français (p = .03), ainsi qu’entre

l’italien et le français (p = .001). Avec les masqueurs de bruit fluctuant, aucune différence

significative entre les langues n’a été signalée.

4. Discussion


Dans l’Expérience 6, la tâche de décision lexicale sur les mots cibles français insérés

dans les deux types de masqueurs (parolier et bruit fluctuant) générés dans les trois langues

manipulées (français, irlandais et italien), a été proposée à des participants natifs de l’italien

qui parlent le français comme L2. Notre objectif était d’explorer la situation de la parole dans

la parole lorsque le message cible était produit non plus dans la langue native des participants

mais dans leur L2. De plus, du fait que pour ces participants l’italien et le français sont

intelligibles (langue native et langue seconde), il était aussi question d’observer l’effet du

niveau de connaissances pour la langue concurrente sur la vitesse d’accès au lexique de mots

cibles produits dans la L2 des participants.


L’analyse des résultats a mis en évidence une différence significative entre les temps

de réaction obtenus avec les masqueurs paroliers et ceux obtenus avec les masqueurs de bruit

fluctuant pour l’italien et le français. Cela suggère que les informations linguistiques de haut

niveau ainsi que les informations acoustiques et linguistiques de bas niveau présentes dans les

masqueurs paroliers italiens et français ont perturbé l’accès au lexique des mots cibles

français. Concernant l’irlandais, l’absence de différence significative entre les temps de

réaction obtenus avec les deux types de masqueurs (parolier et bruit fluctuant) a indiqué que

les informations linguistiques de haut niveau présentes dans les masqueurs paroliers irlandais

n’auraient pas produit d’interférences. Ainsi, ces résultats ont montré que les informations

linguistiques de haut niveau se sont associées aux informations acoustiques et linguistiques de


146

bas niveau uniquement lorsque la langue des masqueurs paroliers était intelligible pour les

participants (italien et français).

Afin de déterminer si les effets des informations linguistiques de haut niveau révélés

pour les masqueurs paroliers italiens et français sont différents, nous avons réalisé une analyse

de variance à mesures répétées sur les temps de réaction inverses obtenus avec les deux types

de masqueurs (parolier et bruit fluctuant) en français et en italien. Les résultats obtenus en

irlandais n’ont pas été inclus dans l’ANOVA. Cette dernière a considéré les participants

comme variable aléatoire et les facteurs Langue des masqueurs (à 2 modalités : français et

italien) et Type de bruit (à 2 modalités : parole et bruit fluctuant) comme variables intra-

sujets. L’ANOVA a révélé un effet principal significatif de la Langue des masqueurs (F(1,23)

= 4.51, p = .04) ainsi qu’un effet principal significatif du Type de bruit dans le masqueur

(F(1,23) = 32.32, p < .0001). L’interaction simple entre ces deux facteurs n’est pas ressortie

significative à l’ANOVA (F(1,23) = .002, n.s.), suggérant que l’effet des informations

linguistiques de haut niveau des masqueurs paroliers italiens (langue native) ne serait

significativement pas différent de celui des informations linguistiques de haut niveau

présentes dans les masqueurs paroliers français (L2). Le niveau de connaissances des

participants pour la langue concurrente (langue native vs. langue seconde) n’aurait pas

influencé l’effet des informations linguistiques de haut niveau présentes dans les masqueurs.

Ce pattern de résultats est similaire à celui observé dans l’Expérience 5 menée avec des

participants natifs du français qui parlent italien comme L2. Pour ces deux expériences, l’effet

des informations linguistiques de haut niveau a été présent quelle que soit la langue

intelligible dans les masqueurs paroliers : français ou italien. Autrement dit, le pattern de

résultats était similaire, que la langue des mots cibles ait été parlée dans la langue native des

participants (Expérience 5) ou dans leur L2 (Expérience 6).

4.3. Masqueurs paroliers italiens (L1) versus français (L2)

Dans la situation de la parole dans la parole (c’est-à-dire lorsque les mots cibles étaient

insérés uniquement dans les masqueurs paroliers), les temps de réaction des participants pour

décider si le mot cible existait dans la langue française ont été influencés par la langue des

masqueurs paroliers. En effet, les temps de réaction étaient significativement plus longs avec

les masqueurs paroliers italiens et français plutôt qu’avec les masqueurs paroliers irlandais.


147

Ainsi, l’accès au lexique des mots cibles français a davantage été ralenti lorsque le signal de

parole concurrent était produit dans une langue intelligible pour les participants (italien et

français) plutôt que dans une langue non intelligible (irlandais). De plus, l’analyse statistique

n’a pas indiqué de différence significative entre les temps de réaction observés avec les

masqueurs paroliers italiens et ceux observés avec les masqueurs paroliers français, suggérant

que les participants n’ont pas été plus affectés par leur langue native que par leur langue

seconde.

En revanche, l’analyse effectuée sur les taux d’erreurs des participants a indiqué que les

masqueurs paroliers italiens ont conduit à des taux d’erreurs significativement plus élevés que

les masqueurs paroliers français. Afin d’être en mesure d’interpréter ce résultat, nous aurions

besoin d’acquérir plus de données. En effet, bien que le taux d’erreurs moyen des participants

soit constant au cours de nos différentes expériences (34%), celui obtenu dans l’Expérience 6

est issu d’un plus petit nombre de données que ceux obtenus lors des expériences précédentes.

Dans l’Expérience 6, le post-test nous a conduit à ne retenir que les résultats obtenus pour les

mots cibles effectivement connus des participants, soit 73% des mots. Cette différence entre

l’Expérience 6 et les expériences précédentes quant à la quantité du nombre d’erreurs à

analyser a pu biaiser les résultats.

Dans l’Expérience 5, des participants natifs du français qui parlent l’italien comme L2

ont été recrutés et nous avons étudié l’effet du niveau de connaissances des participants pour

la langue concurrente sur des mots cibles parlés dans leur langue native. Des temps de

réaction significativement plus longs ont été observés avec les masqueurs paroliers générés

dans la L2 des participants (italien) plutôt que dans leur langue native (français). Afin

d’expliquer ces résultats, nous avions pris en considération le fait que des mots présents dans

les masqueurs paroliers peuvent être extraits (Hoen et al., 2007). Lorsque le masqueur est

produit dans une langue seconde, les mots extraits de ce masqueur, lors de leur identification,

activeraient des compétiteurs appartenant à la fois au lexique mental de la L2 ainsi que des

compétiteurs appartenant au lexique mental de la langue native (Weber & Cutler, 2004). Le

nombre total de compétiteurs serait alors plus important que lorsque le masqueur parolier est

généré dans une langue native.

Selon cette hypothèse, nous aurions dû, dans l’Expérience 6, observer des temps de réaction

significativement plus courts avec les masqueurs paroliers en italien (langue native) plutôt

qu’avec les masqueurs paroliers en français (langue seconde). Le nombre de compétiteurs


148

devrait être plus faible avec les masqueurs paroliers en italien puisqu’il s’agit de la langue

native des participants, des compétiteurs d’un seul lexique devraient être activés. Or,

contrairement à nos attentes, des temps de réaction équivalents ont été observés entre les

masqueurs paroliers français et italiens.

Cela pourrait être dû au fait que les mots cibles étaient parlés dans la L2 des participants

(français). Pendant leur identification, des compétiteurs des deux lexiques mentaux auraient

été activés (lexiques de la langue native et de la langue seconde). Ainsi, l’identification des

mots cibles aurait été plus lente, non pas à cause d’un grand nombre de compétiteurs activés

par les masqueurs paroliers, mais du fait d’un grand nombre de compétiteurs activés suite à

l’identification d’un mot cible dans une L2.

Cette question concernant l’effet du niveau de connaissances pour la langue

concurrente dans la situation de la parole dans la parole avec un message cible généré dans la

L2 des participants, a été abordée par Garcia Lecumberri & Cooke (2006) ainsi que par Van

Engen (2010). Dans l’étude de Garcia Lecumberri & Cooke (2006), des participants natifs de

l’espagnol parlant l’anglais comme L2 ont réalisé une tâche d’intelligibilité de consonnes

cibles anglaises masquées par de la parole produite par 1 locuteur natif de l’espagnol (langue

native des participants) ou par 1 locuteur natif de l’anglais (L2 des participants). Les auteurs

ont observé que les participants ont été affectés de manière équivalente par la parole

concurrente, qu’elle ait été produite dans leur langue native (espagnol) ou dans leur langue

seconde (anglais).

Un pattern de résultats différent a été mis en lumière dans l’étude de Van Engen (2010). Des

participants natifs du mandarin parlant l’anglais comme L2 ont réalisé une tâche

d’intelligibilité de phrases cibles anglaises insérées dans des masqueurs paroliers à 2 locuteurs

générés en mandarin (langue native des participants) ou en anglais (L2 des participants). Les

participants ont davantage été affectés par les masqueurs paroliers générés dans leur L2

(anglais) que par ceux générés dans leur langue native (mandarin). Dans son article, Van

Engen (2010) explique que la divergence entre ses résultats et ceux observés par Garcia

Lecumberri & Cooke (2006) pourrait être due à des différences dans les paradigmes

expérimentaux utilisés dans ces deux études. Par exemple, concernant la parole cible, alors

que Garcia Lecumberri & Cooke ont utilisé des consonnes, Van Engen a exploré des

traitements langagiers de plus haut niveau en utilisant des phrases. Ensuite, Van Engen a

généré des masqueurs paroliers composés de 2 locuteurs alors que Garcia Lecumberri &


149

Cooke n’ont masqué la parole cible qu’avec 1 locuteur. Van Engen explique qu’avec 2

locuteurs dans le signal concurrent, l’accès à la parole cible serait davantage réduit qu’avec 1

seul locuteur, ce qui rendrait l’effet des informations linguistiques du signal concurrent plus

observable.

Les effets de masque des langues concurrentes intelligibles (langue native et langue seconde)

étaient donc différents selon le paradigme expérimental utilisé. Nos résultats rejoignent ceux

mis en évidence par Garcia Lecumberri & Cooke (2006), bien que dans notre étude, nous

ayons utilisé un paradigme expérimental encore différent de ceux utilisés dans les deux études

évoquées ci-dessus. Nous avons en effet observé que les participants ont été autant affectés

par les masqueurs paroliers générés dans leur langue native (italien) que par ceux produits

dans leur langue seconde (français).

4.4. Conclusions

Dans l’Expérience 6, nous avons examiné l’effet du niveau de connaissances pour la

langue concurrente sur la vitesse d’accès au lexique de mots cibles présentés dans la langue

seconde des participants. Les masqueurs paroliers ont été générés dans la langue native des

participants (italien), dans leur langue seconde (français) ou dans une langue non connue

(irlandais). Les résultats ont confirmé que les masqueurs paroliers générés dans les langues

intelligibles pour les participants (italien et français) ont produit des interférences qui ont

impliqué des informations acoustiques et linguistiques de bas niveau ainsi que des

informations linguistiques de haut niveau. Les résultats ont également révélé que les

masqueurs paroliers italiens et français ont perturbé la vitesse d’accès au lexique des mots

cibles français avec la même efficacité ; le niveau de connaissances des participants pour la

langue concurrente n’est donc pas entré en jeu. Dans l’Expérience 5, le niveau de

connaissances des participants pour la langue concurrente avait influencé les résultats

observés pour les temps de réaction. Nous pouvons conclure que le niveau de connaissances

de la langue concurrente n’a pas eu le même effet lorsque les mots cibles ont été présentés

dans la langue native des participants (Expérience 5) ou dans leur langue seconde (Expérience

6).


150

5. Comparaison des Expériences 5 & 6

Dans la partie théorique, nous avons présenté des études qui se sont intéressées à la

compréhension d’une langue seconde dans le silence ou en présence de bruits concurrents.

Ces études ont montré qu’il est moins facile d’identifier des mots cibles produits dans une L2

plutôt que dans une langue native. En effet, certains sons de la L2 restent plus difficiles à

différencier que d’autres, même lorsque les participants ont acquis un bon niveau de la L2

(voir par exemple Pallier et al., 2001). De plus, l’identification d’un mot active un plus grand

nombre de compétiteurs lorsqu’il est produit dans une L2 plutôt que dans une langue native ;

un mot dans une L2 active des compétiteurs appartenant au lexique mental de la L2 et au

lexique mental de la langue native (Weber & Cutler, 2004). Il en résulte que les participants

souffrent davantage de la présence de bruits concurrents lorsqu’ils identifient de la parole

dans une langue seconde plutôt que dans une langue native ; et ce, que le bruit concurrent ne

produise qu’un effet de masque énergétique, ou qu’il produise en plus un effet de masque

informationnel (Garcia Lecumberri & Cooke, 2006 ; Cooke et al., 2008).

Dans cette partie, nous souhaitons observer dans quelle mesure les participants natifs

de l’italien parlant le français comme L2 ont davantage souffert de la présence des masqueurs

lors de l’identification des mots cibles français (mots produits dans leur L2), par rapport aux

participants natifs du français parlant l’italien comme L2 ; ce dernier groupe ayant eu à

identifier les mots cibles dans leur langue native (Expérience 5). Pour cela, nous allons

comparer les temps de réaction obtenus par ces deux groupes de participants (Tableaux 17 et

18) au sein d’une même analyse de variance. Nous examinerons si des temps de réaction plus

longs pour les participants natifs de l’italien parlant le français comme L2 ont été obtenus

pour les deux types de masqueurs (parolier et bruit fluctuant), à savoir lorsque des

interférences de natures différentes ont été produites par les masqueurs. Afin de faciliter la

lecture, nous réduisons les appellations « participants natifs de l’italien parlant le français

comme L2 » à « participants natifs de l’italien » ; et « participants natifs du français parlant

l’italien comme L2 » à « participants natifs du français ».

Plus précisément, cette ANOVA va comparer les temps de réaction inverses des participants.

Les variables suivantes ont été considérées : le facteur Groupe (à 2 modalités : participants

natifs du français et participants natifs de l’italien), le facteur Langue des masqueurs (à 3

modalités : français, irlandais et italien) et le facteur Type de bruit dans le masqueur (à 2

modalités : parole et bruit fluctuant). Les deux groupes de participants étaient exactement


151

identiques à ceux testés dans les Expériences 5 & 6, ils étaient composés de 24 participants

chacun.



natifs du français (Tableau 17) et pour les participants natifs de l’italien (Tableau 18). Les

écart-types sont également indiqués.



Moyennes 1199 1262 1180 1240 1495 1306

Ecart-types 247,63 247,11 232,27 287,95 484,61 295,40



Moyennes 1376 1510 1441 1447 1841 1659

Ecart-types 368,81 349,10 395,37 409,15 716,97 460,14


Effet du Groupe

L’effet principal du Groupe de 345,27 ms est ressorti significatif à l’analyse de

variance (F(1,46) = 9.03, p < .005). En moyenne, les participants natifs du français étaient

plus rapides (1201 ms ; ET = 222,56) que les participants natifs de l’italien (1546 ms; ET =

485,39).


L’ANOVA nous a indiqué un effet principal significatif de la Langue des masqueurs

(F(2,92) = 23, p < .0001). En moyenne, les masqueurs irlandais ont entraîné des TRs plus

courts (1264 ms ; ET = 317,43) que les masqueurs français (1365 ms ; ET = 372,77) et

italiens (1433 ms ; ET = 482,26).


L’effet principal du Type de bruit dans le masqueur de 129 ms est également ressorti

significatif à l’ANOVA (F(1,46) = 39.35, p < .0001). Les TRs moyens étaient plus longs avec


152

les masqueurs paroliers (1418 ms ; ET = 459,45) qu’avec les masqueurs de bruit fluctuant

(1290 ms ; ET = 322,70).


Groupe * Langue des masqueurs

L’ANOVA n’a pas révélé d’interaction simple significative entre les facteurs Groupe

et Langue des masqueurs (F(2,92) = 1.44, n.s.). Les comparaisons post-hoc effectuées avec le

test HSD de Tukey ont montré que l’effet du Groupe était présent pour chacune des langues

manipulées (p < .001 pour chacune d’elle).

Groupe * Type de bruit

L’interaction simple entre les facteurs Groupe et Type de bruit dans le masqueur n’est

pas ressortie significative à l’ANOVA (F(1,46) = .2, n.s.). Les comparaisons post-hoc

effectuées avec le test HSD de Tukey ont indiqué que l’effet du Groupe était présent pour les

masqueurs paroliers (p = .0001) ainsi que pour les masqueurs de bruit fluctuant (p = .0002).

Type de bruit * Langue des masqueurs

L’analyse de variance a mis en évidence une interaction simple significative entre les

facteurs Type de bruit et Langue des masqueurs (F(2,92) = 3.52, p < .05). Les comparaisons

post-hoc effectuées avec le test HSD de Tukey ont révélé que l’effet du Type de bruit était

significatif pour l’italien (p = .0002) ainsi que pour le français (p = .001).

D’après l’analyse de variance, l’interaction double entre les trois facteurs manipulés

n’est pas significative (F(2,92) = .07, n.s.). Les comparaisons post-hoc effectuées avec le test

HSD de Tukey ont révélé que pour chacune des six conditions expérimentales, les TRs étaient

significativement différents entre les deux groupes de participants ; ils étaient

significativement plus longs pour les participants natifs de l’italien que pour les participants

natifs du français.


153


moyens (en ms) à -5 dB, pour les participants natifs du français de l’Expérience 5 (appellation

« Natif Fr ») et pour les participants natifs de l’italien de l’Expérience 6 (appellation « Natif It

»), en fonction de la Langue des masqueurs (irlandais, italien et français). Le symbole ‘ * ’

indique une différence significative entre les deux types de bruits (parole et bruit fluctuant)

pour l’italien et pour le français (Expériences 5 & 6). Pour plus de clarté, nous n’avons pas

indiqué les différences significatives présentes entre les deux groupes de participants pour

chacune des six conditions expérimentales.

5.3. Discussion de la comparaison

La littérature a mis en évidence que la compréhension de la parole est plus difficile

dans une langue seconde que dans une langue native ; cette difficulté s’accentue en présence

de bruits concurrents. Dans cette partie, il était question d’observer la difficulté des

participants natifs de l’italien lors de la réalisation de la tâche de décision lexicale sur les mots

cibles produits dans leur L2. Pour cela, nous avons comparé dans une même analyse de

variance, leur temps de réaction à ceux des participants natifs du français testés dans

l’Expérience 5. Cette comparaison devait également nous indiquer si les masqueurs paroliers

et les masqueurs de bruit fluctuant ont tous les deux affectés les participants natifs de l’italien.

L’analyse des résultats a révélé un effet principal significatif du Groupe et a indiqué

que pour chacune des six conditions expérimentales, les participants natifs de l’italien ont

obtenu des temps de réaction significativement plus longs que les participants natifs du


154

français. Ainsi, la tâche de décision lexicale était plus difficile à réaliser lorsque les mots

cibles étaient produits dans une L2 (Expérience 6) plutôt que dans une langue native

(Expérience 5). Nos résultats sont donc en accord avec ceux mis en évidence dans la

littérature (Garcia Lecumberri & Cooke, 2006 ; Cooke et al., 2008). La comparaison des

résultats a également indiqué que les participants natifs de l’italien ont eu des temps de

réaction plus longs que les participants natifs du français, quelque soit le type de bruit présent

dans les masqueurs : du bruit fluctuant, composé uniquement d’informations acoustiques et

linguistiques de bas niveau, ou de la parole, avec des informations linguistiques de haut

niveau en plus des informations acoustiques et linguistiques de bas niveau.

Pour les deux groupes de participants (natifs de l’italien et natifs du français), un effet

des informations linguistiques de haut niveau a été révélé pour les masqueurs paroliers italiens

et français. Nous nous sommes demandés si les informations linguistiques de haut niveau

présentes dans les masqueurs paroliers italiens et français ont été plus pénalisantes pour les

participants natifs de l’italien que pour les participants natifs du français. Pour cela, nous

avons effectué deux analyses de variance sur les temps de réaction inverses obtenus par les

deux groupes de participants. La première ANOVA a pris en compte les temps de réaction

inverses des deux groupes de participants obtenus avec les deux types de masqueurs générés

en français (parolier et bruit fluctuant). Dans la seconde ANOVA, ce sont les temps de

réaction inverses pour les deux types de masqueurs produits en italien qui ont été considérés.

Dans les deux ANOVA, le facteur Groupe (à 2 modalités : participants natifs du français et

participants natifs de l’italien) et le facteur Type de bruit dans le masqueur (à 2 modalités :

masqueurs paroliers français et masqueurs de bruit fluctuant français) ont été pris en compte.

La première ANOVA, lorsque les masqueurs étaient en français, a indiqué un effet principal

significatif du Type de bruit dans le masqueur (F(1,23) = 23.86, p < .0001) ainsi qu’un effet

principal significatif du Groupe (F(1,23) = 12.22, p = .001). En revanche, l’interaction simple

entre ces deux facteurs n’est pas ressortie significative à l’ANOVA (F(1,23) = .29, n.s.),

indiquant que l’effet des informations linguistiques de haut niveau des masqueurs paroliers

français ne semble pas avoir été plus pénalisant pour les participants natifs de l’italien que

pour les participants natifs du français.

La seconde ANOVA, avec les masqueurs en italien, a révélé que l’effet principal du Type de

bruit dans le masqueur était ressorti significatif à l’ANOVA (F(1,23) = 8.21, p < .01), comme

l’effet principal du Groupe (F(1,23) = 20.40, p < .001). L’interaction simple entre ces deux


155

facteurs n’est pas ressortie significative (F(1,23) = .0004, n.s.), suggérant que l’effet des

informations linguistiques de haut niveau mis en évidence pour les masqueurs paroliers

italiens ne semble pas avoir été plus important pour les participants natifs de l’italien que pour

les participants natifs du français.

Les résultats de ces deux ANOVA suggèrent que les temps de réaction plus longs observés

pour les participants natifs de l’italien pourraient principalement être expliqués par la

difficulté que ces participants ont eu à réaliser la tâche de décision lexicale dans leur langue

seconde, plutôt que par des effets plus importants des informations linguistiques de haut

niveau présentes dans les masqueurs paroliers italiens et français.

Discussion générale

156

DISCUSSION GENERALE

Dans cette thèse, nous nous sommes intéressés à une situation fréquente lorsque nous

communiquons, celle où du bruit environnant est présent alors que nous cherchons à

comprendre le message de notre interlocuteur (message cible). Dans le cas où le bruit

concurrent est un bruit de parole (télévision, discussion voisine), des interférences de nature

linguistique vont perturber notre compréhension du message cible. En effet, les informations

linguistiques du bruit concurrent, même si elles ne sont pas pertinentes pour l’auditeur, vont

être traitées et identifiées en même temps que les informations linguistiques du message cible.

Dans cette thèse, il s’agissait d’utiliser la situation de la parole dans la parole afin d’examiner

et de caractériser les interférences linguistiques qui ont lieu dans cette situation d’écoute.

Nous avons élaboré notre travail expérimental en trois étapes. Dans une première

étape, nous avons mis au point un paradigme expérimental adapté à l’étude des interférences

linguistiques intervenant dans la situation de la parole dans la parole avec de la parole cible en

français. Dans une seconde étape, nous avons cherché à déterminer si des interférences sous-

lexicales d’ordre phonémique peuvent être repérées dans cette situation d’écoute. Enfin dans

une troisième étape, nous avons complété notre approche sur les interférences linguistiques en

examinant la situation de la parole dans la parole lorsque le message cible était produit dans la

langue seconde des participants plutôt que dans leur langue native.

Etape 1

Dans une première expérience, afin de mettre en place notre paradigme expérimental,

nous avons pris pour base l’étude de Van Engen & Bradlow (2007). Dans le but d’examiner

un effet des interférences linguistiques, ces auteurs ont manipulé la langue de la parole

concurrente. Ainsi, les masqueurs paroliers étaient produits dans la langue native des

participants, comme la parole cible, ou dans une langue qui était inconnue. Plus précisément,

des participants natifs de l’anglais ont réalisé une tâche d’intelligibilité avec des phrases cibles

anglaises insérées dans des masqueurs paroliers en anglais ou en mandarin. Les auteurs ont

observé des performances significativement plus faibles avec les masqueurs paroliers générés

dans la langue native des participants (anglais) plutôt qu’avec les masqueurs paroliers générés


157

dans la langue non connue (mandarin). De plus, parmi les erreurs des participants, Van Engen

& Bradlow ont observé des mots appartenant aux masqueurs paroliers anglais à la place des

mots cibles. Des interférences linguistiques ont donc eu lieu, en particulier des interférences

lexicales, lorsque la parole concurrente était produite dans la langue intelligible pour les

participants (anglais). Avec les masqueurs paroliers en mandarin, les informations lexicales

n’étant pas intelligibles, elles n’ont pas créé d’interférence.

Dans notre première expérience, nous avons demandé à des participants natifs du

français de réaliser une tâche d’intelligibilité avec des mots cibles français insérés dans des

masqueurs paroliers générés dans leur langue native (français) ou dans une langue non connue

(gaélique irlandais). Notre objectif était de répliquer, avec de la parole cible en français,

l’effet de la langue des masqueurs paroliers observé dans l’étude de Van Engen & Bradlow

(2007). Jusqu’à présent, cet effet a été mis en évidence lorsque la langue de la parole cible

était de l’allemand (Rhebergen et al., 2005) ou de l’anglais (Garcia Lecumberri & Cooke,

2006 ; Van Engen & Bradlow, 2007). Nos premiers résultats ont révélé la présence

d’interférences linguistiques avec les masqueurs paroliers générés dans la langue intelligible

pour les participants (français). Les performances étaient significativement plus faibles avec

les masqueurs paroliers français plutôt qu’avec les masqueurs paroliers irlandais ; de plus, des

mots appartenant aux masqueurs paroliers français ont été retranscrits à la place des mots

cibles. Nos résultats sont ainsi en accord avec ceux obtenus par Van Engen & Bradlow

(2007).

Dans cette Expérience 1, nous avons manipulé d’autres facteurs que la langue des

masqueurs paroliers ; nous avons fait varier le Rapport Signal sur Bruit (RSB) entre les mots

cibles et les masqueurs, ainsi que le nombre de locuteurs dans le masqueur. Nous avons vu

que ces facteurs permettent de moduler l’effet des interférences linguistiques ; notamment, cet

effet peut être réduit avec des valeurs de RSB positives ou lorsque le nombre de locuteurs

dans le masqueur devient élevé. Par exemple, dans leur étude, Van Engen & Bradlow (2007)

ont testé les valeurs de RSB suivantes : +5, 0 et -5 dB. L’effet de la langue des masqueurs

paroliers (langue native versus langue non connue) était présent uniquement à 0 dB et à -5 dB.

Autrement dit, l’effet des interférences linguistiques produit par les masqueurs paroliers

générés dans la langue intelligible n’a été observé que lorsque le niveau sonore des phrases

cibles était équivalent ou inférieur au niveau sonore des masqueurs paroliers. Une explication

serait qu’avec un RSB positif, la ségrégation entre les flux de parole concurrents est plus


158

facile, ce qui rendrait l’effet des interférences linguistiques moins observable. Dans notre

paradigme, nous avons donc fixé le RSB à -5 dB et à 0 dB. L’effet de la langue des masqueurs

paroliers (français versus gaélique irlandais) était présent pour ces deux valeurs de RSB ;

néanmoins, il était plus important à -5 dB plutôt qu’à 0 dB.

Quant au nombre de locuteurs dans le masqueur, Van Engen & Bradlow (2007) ont généré

des masqueurs paroliers à 2 et à 6 locuteurs. L’effet de la langue des masqueurs n’était présent

qu’avec 2 locuteurs. Cela pourrait être dû au fait que la saturation spectro-temporelle du

signal concurrent devient plus importante avec l’augmentation du nombre de locuteurs,

l’accès aux informations linguistiques des masqueurs ainsi que leur effet de masque sur

l’intelligibilité de la parole cible seraient alors réduits. Les résultats obtenus par Hoen et al.

(2007) semblent confirmer cette idée. Ces auteurs ont masqué des mots cibles français avec

des masqueurs paroliers français composés de 4, 6 ou 8 locuteurs. Parmi leurs erreurs, les

participants ont retranscrit à la place des mots cibles, des mots appartenant aux masqueurs, et

ce, uniquement lorsque les masqueurs étaient composés de 4 locuteurs. Ces résultats

suggèrent qu’à partir d’un certain nombre de locuteurs, 6 locuteurs (comme pour Van Engen

& Bradlow, 2007), l’effet des interférences linguistiques est réduit du fait que les informations

linguistiques du masqueur sont moins accessibles. Pour ces raisons, dans notre paradigme

expérimental, nous avons utilisé des masqueurs paroliers composés de 2 et de 4 locuteurs.

Nos résultats ont confirmé la présence de l’effet de la langue des masqueurs paroliers avec 2

et 4 locuteurs, et donc la présence d’un effet des informations linguistiques pour les

masqueurs paroliers générés dans la langue intelligible. Nos résultats ont également indiqué

que l’effet de la langue des masqueurs n’était pas plus important pour une de ces deux

valeurs.

Dans cette première étape, nous avons vérifié que lorsque la parole cible est produite

en français, des interférences lexicales sont produites par les masqueurs paroliers générés dans

la langue intelligible des participants. Nous avons aussi identifié les conditions

expérimentales permettant d’explorer plus avant les interférences linguistiques. C’est ainsi

que, dans la seconde étape, nous avons gardé les conditions expérimentales pour lesquelles le

RSB est fixé à -5 dB ; en effet, c’est pour cette valeur de RSB que l’effet de la langue des

masqueurs était le plus important dans la première étape. Nous avons également préféré

conserver les conditions à 4 locuteurs plutôt que celles à 2 locuteurs ; les caractéristiques

vocales des locuteurs étant moins prépondérantes avec 4 locuteurs.


159

Etape 2

Après avoir mis en évidence les interférences linguistiques produites par les

masqueurs paroliers générés dans une langue intelligible, nous avons cherché à les

caractériser. Jusqu’à présent, des interférences lexicales (Van Engen & Bradlow, 2007 ; Hoen

et al., 2007 ; Boulenger et al., 2010) ont été révélées. Dans les études de Van Engen &

Bradlow (2007) et de Hoen et al. (2007), les interférences lexicales ont été mises en lumière

en analysant les erreurs commises par les participants lors d’une tâche d’intelligibilité. Les

auteurs ont observé que des mots présents dans les masqueurs paroliers ont été retranscrits à la

place des mots du signal cible. Dans l’étude de Boulenger et al. (2010), c’est en manipulant la

fréquence d’occurrence des mots présents dans les masqueurs paroliers que des interférences

lexicales ont été révélées. Les auteurs ont observé que les masqueurs paroliers composés de

mots très fréquents ont un effet de masque plus important que les masqueurs paroliers

composés de mots peu fréquents. Les participants sont ainsi sensibles aux informations

lexicales présentes dans la parole concurrente.

Dans cette thèse, il était question de déterminer si des interférences sous-lexicales

telles que des interférences phonémiques peuvent avoir lieu dans la situation de la parole dans

la parole. Trois expériences (Expériences 2, 3 & 4) ont été menées afin de répondre à cette

question. Au fil de ces trois expériences, nous avons fait évoluer les conditions

expérimentales de notre paradigme expérimental et nous les avons testées avec une tâche

d’intelligibilité (Expérience 2) puis avec une tâche de décision lexicale (Expériences 3 & 4).

Afin de tester l’hypothèse des interférences phonémiques, nous avons utilisé une

troisième langue, l’italien, qui avait le statut de langue non connue pour les participants,

comme le gaélique irlandais. Cela nous a permis de manipuler le pourcentage de phonèmes

communs entre la langue de la parole cible (également langue native des participants) et la

langue de la parole concurrente. Ce pourcentage est de 100% avec les masqueurs paroliers

français, de 60% avec les masqueurs paroliers italiens et de 18% avec les masqueurs paroliers

irlandais. Nous avons ainsi testé l’hypothèse selon laquelle plus le pourcentage de phonèmes

communs est élevé, plus l’effet des interférences phonémiques est important. Cette hypothèse

nous a permis à la fois d’explorer plus avant la nature des interférences linguistiques produites

par les masqueurs paroliers générés dans une langue intelligible, ainsi que d’examiner si les

masqueurs paroliers produits dans une langue non intelligible peuvent produire des

interférences sous-lexicales. En effet, les informations lexicales de ces masqueurs n’étant pas


160

intelligibles, elles n’interfèrent pas avec l’intelligibilité de la parole cible. En revanche, étant

donné que nous retrouvons 60% de phonèmes français dans l’inventaire phonémique de

l’italien et 18% de phonèmes français dans l’inventaire phonémique de l’irlandais, nous

pouvions nous demander si ces phonèmes communs entre la langue cible et la langue

concurrente peuvent perturber l’intelligibilité des mots cibles.

Ensuite, nous avons pris en compte le fait qu’un signal de parole, de par sa

composition, peut produire des interférences linguistiques ainsi que des interférences

acoustiques. Etant donné que nous souhaitions nous focaliser sur les interférences

linguistiques de haut niveau des masqueurs paroliers, nous avons ajouté des masqueurs de

bruit fluctuant à notre paradigme expérimental (Festen & Plomp, 1990 ; Dole et al., 2009).

Ces deux types de masqueurs partagent les mêmes informations acoustiques (informations

spectrales) et linguistiques de bas niveau (fluctuations temporelles lentes) ; seuls les

masqueurs paroliers possèdent des informations linguistiques de haut niveau (phonèmes,

syllabes et mots). Nous avons généré ces masqueurs de bruit fluctuant à partir des masqueurs

paroliers à 4 locuteurs dans chacune des trois langues manipulées (français, irlandais et

italien). Dans chacune de nos expériences, nous avons analysé les résultats observés dans la

situation de la parole dans la parole, afin de déterminer avec quelle langue présente dans les

masqueurs paroliers l’identification des mots cibles a été la plus difficile. Puis, afin

d’examiner la nature des interférences produites par les masqueurs paroliers, nous avons

comparé les résultats obtenus avec les masqueurs paroliers à ceux obtenus avec les masqueurs

de bruit fluctuant. Des performances significativement différentes avec les deux types de

masqueurs (parolier et bruit fluctuant) indiquent que les informations linguistiques de haut

niveau présentes dans les masqueurs paroliers interfèrent avec l’intelligibilité de la parole

cible. Ainsi, dans le cas où un effet des interférences linguistiques de haut niveau était mis en

évidence pour les masqueurs paroliers français, irlandais et italiens, nous souhaitions

examiner si cet effet était sensiblement proportionnel au pourcentage de phonèmes communs

entre la langue de la parole cible et la langue de la parole concurrente.

Le paradigme expérimental comptait donc une troisième langue ainsi qu’un second type de

masqueurs. Les mots cibles français étaient insérés dans des masqueurs paroliers et dans des

masqueurs de bruit fluctuant produits en français, en irlandais et en italien.

Dans l’Expérience 2, nous avons testé ce paradigme expérimental avec une tâche

d’intelligibilité, comme dans l’Expérience 1. Les masqueurs paroliers étaient composés de 4

locuteurs et le RSB entre les mots cibles et les masqueurs était fixé à -5 dB. Les résultats ont


161

indiqué que les masqueurs paroliers générés dans les trois langues (français, irlandais et

italien) ont produit des interférences impliquant des informations linguistiques de haut niveau

ainsi que des informations acoustiques et linguistiques de bas niveau. En revanche, les écarts

de performances entre les deux types de masqueurs (parolier et bruit fluctuant) n’étaient pas

proportionnels aux pourcentages de phonèmes communs entre la langue cible et la langue

concurrente. Or, dans le cas où les masqueurs paroliers produisent des interférences

phonémiques, nous nous attendions à ce que l’effet des informations linguistiques de haut

niveau soit le plus important avec les masqueurs paroliers français, plus faible avec les

masqueurs paroliers italiens, et encore plus faible avec les masqueurs paroliers irlandais.

Un moyen d’approfondir le questionnement sur les interférences phonémiques

intervenant dans la situation de la parole dans la parole, serait de modifier le codage des

réponses des participants et de passer d’un codage lexical à un codage phonémique. Jusqu’à

présent, nous avons réalisé un codage lexical, le mot cible retranscrit était correctement

reconnu par les participants ou non reconnu. Mais lors du dépouillement des résultats, nous

avons remarqué la présence de réponses partielles (une partie du mot cible seulement a été

correctement identifiée). Pour le mot cible « parent », les participants ont par exemple

retranscrit le mot « hareng » ou uniquement la syllabe « pa ». Ces réponses partielles ont été

codées comme des erreurs (c’est-à-dire comme mot non reconnu), les phonèmes correctement

identifiés n’ont donc pas été pris en compte. Exploiter ces réponses partielles pourrait nous

aider à examiner les compétitions phonémiques. Dans un nouveau codage des réponses, il ne

s’agirait plus de coter les réponses en tant que mot reconnu / non reconnu, mais en tant que

phonème reconnu / non reconnu. Cette cotation serait appliquée uniquement pour les réponses

des participants obtenues dans la situation de la parole dans la parole (conditions où les mots

cibles étaient insérés dans les masqueurs paroliers). Pour chaque participant, les pourcentages

de phonèmes cibles correctement retranscrits lorsque les masqueurs paroliers sont générés en

français, en irlandais et en italien seraient obtenus. Nous pourrions déterminer si le

pourcentage de phonèmes cibles correctement retranscrits est influencé par la distance

phonémique de la langue des masqueurs paroliers avec la langue cible ; le pourcentage de

phonèmes cibles correctement retranscrits est-il plus faible lorsque le pourcentage de

phonèmes communs entre la langue cible et la langue des masqueurs paroliers est important ?

Notons cependant que cette nouvelle cotation des résultats nécessite que certains paramètres

du paradigme expérimental soient affinés. En effet, bien que tous les mots cibles soient

dissyllabiques, ils ne comportent pas tous le même nombre de phonèmes (par exemple, le mot


162

« ballon » possède quatre phonèmes alors que le mot « prairie » en possède cinq). De plus,

tous les phonèmes présents dans la langue française ne sont pas apparus dans les mots cibles

le même nombre de fois et leur place dans les mots cibles n’était pas contrôlée.

Notons cependant que dans la tâche d’intelligibilité, des interférences d’ordre

linguistique autres que des interférences phonémiques peuvent intervenir et dissimuler l’effet

des interférences phonémiques. Il pourrait notamment s’agir d’interférences post-lexicales,

expliquées par le type de tâche que nous avons utilisé. En effet, avec la tâche d’intelligibilité,

il était demandé aux participants de retranscrire le mot cible entendu à la fin de l’essai. Or, du

temps s’écoulait entre la fin de présentation du mot cible et la fin du masqueur pendant lequel

des interférences post-lexicales ont pu entrer en jeu.

Dans l’Expérience 3, nous avons préféré utiliser une tâche de décision lexicale pour tester

l’hypothèse des compétitions phonémiques en remplacement de la tâche d’intelligibilité. Nous

avons présenté aux participants les mots cibles français ainsi que des pseudo-mots construits à

partir des mots. Ils devaient décider le plus rapidement possible et en commettant le moins

d’erreurs possible, si l’item cible appartenait à la langue française. Cette tâche nous a alors

permis de capturer les interférences produites par les masqueurs français, irlandais et italiens

pendant l’accès au lexique des mots cibles. Alors que la tâche d’intelligibilité est caractérisée

de tâche « off-line », la tâche de décision lexicale est de type « on-line ». Avec cette dernière,

nous avons observé un effet des informations linguistiques de haut niveau uniquement pour

les masqueurs paroliers français, c’est-à-dire seulement pour les masqueurs paroliers générés

dans une langue intelligible pour les participants. Pour les masqueurs paroliers générés dans

les langues non intelligibles pour les participants (irlandais et italien), les unités linguistiques

de haut niveau n’auraient pas interféré sur l’intelligibilité de la parole cible ; les masqueurs

paroliers irlandais et italiens auraient produit des interférences n’impliquant que des

informations acoustiques et linguistiques de bas niveau. De plus, concernant les résultats

obtenus avec les masqueurs paroliers (situation de la parole dans la parole), nous avons

observé des temps de réaction significativement plus courts avec les masqueurs paroliers

irlandais ; les temps de réaction n’étaient significativement pas différents entre les masqueurs

paroliers italiens et français.

Plusieurs constats résultent alors de l’Expérience 3. Tout d’abord, nous avons obtenu

un résultat inattendu avec les masqueurs paroliers italiens. En effet, ces derniers ont eu un

effet de masque aussi important que les masqueurs paroliers français. Autrement dit, l’italien,


163

qui a pourtant un statut de langue non intelligible pour les participants, a perturbé

l’identification des mots cibles français avec autant d’efficacité que le français, langue native

des participants. La tâche de décision lexicale ayant révélé que seuls les masqueurs paroliers

français ont produit des interférences impliquant des informations linguistiques de haut

niveau, il résulte que l’italien et le français ont eu des effets de masque équivalents tout en

produisant des interférences impliquant des informations de natures différentes.

Nous avons également observé que les masqueurs paroliers irlandais et italiens ont

entrainé des temps de réaction significativement différents. Les participants ont été

significativement plus rapides avec les masqueurs paroliers irlandais qu’avec les masqueurs

paroliers italiens. De plus, les informations linguistiques de haut niveau des masqueurs

paroliers irlandais et italiens n’ont pas perturbé l’accès au lexique des mots cibles français.

Ainsi, les phonèmes français présents dans les inventaires phonémiques de l’irlandais et de

l’italien, et donc présents dans les masqueurs paroliers irlandais et italiens (18% de phonèmes

communs entre l’irlandais et le français, 60% entre l’italien et le français), n’auraient pas

perturbé l’identification des mots cibles français. Les temps de réaction significativement plus

courts avec les masqueurs paroliers irlandais plutôt qu’avec les masqueurs paroliers italiens

pourraient donc être expliqués par des différences entre l’irlandais et l’italien au niveau de

leurs informations acoustiques et linguistiques de bas niveau. Notamment, ces deux langues

diffèrent au niveau de leur rythme. Alors que l’irlandais est une langue accentuelle, l’italien et

le français sont des langues syllabiques. Ainsi, l’accès au lexique des mots cibles français

aurait davantage été perturbé par les masqueurs paroliers générés dans une langue dont le

rythme est identique à celui de la langue cible (français et italiens) plutôt dans une langue

dont le rythme est différent (voir les travaux de Reel & Hicks, 2012). Afin d’éclaircir cette

hypothèse, nous pourrions envisager de modifier notre paradigme expérimental. Les langues

utilisées (une intelligible, les deux autres inintelligibles) auraient le même rythme. Autrement

dit pour les deux langues inintelligibles, le rythme ne serait plus différent, comme c’est le cas

pour l’irlandais et l’italien (langue syllabique versus accentuelle), mais identique. Nous

pourrions par exemple, comparer l’effet de masque de l’italien à celui de l’espagnol et

déterminer si l’espagnol perturbe l’accès au lexique des mots cibles français avec autant

d’efficacité que l’italien.

En minimisant l’effet des traitements post-lexicaux, la tâche de décision lexicale

utilisée dans l’Expérience 3 nous a permis d’examiner plus finement la nature des


164

interférences produites par les masqueurs paroliers français, irlandais et italiens. Alors que la

tâche d’intelligibilité de l’Expérience 2 nous a indiqué que les informations linguistiques de

haut niveau présentes dans les masqueurs paroliers français, irlandais et italiens avaient

interféré avec l’intelligibilité de la parole cible, la tâche de décision lexicale nous a permis

d’identifier que seuls les masqueurs paroliers générés dans la langue intelligible pour les

participants (français) ont produit des interférences impliquant des informations linguistiques

de haut niveau en plus des informations acoustiques et linguistiques de bas niveau.

Afin d’examiner plus avant les résultats obtenus avec les masqueurs paroliers français

et italiens, nous avons mené une dernière expérience dans cette deuxième étape (Expérience

4). Nous voulions réduire le taux d’erreurs moyens des participants et déterminer si avec plus

de données à analyser, nous pourrions en apprendre davantage sur les résultats obtenus avec

les masqueurs paroliers français et italiens.

Dans l’Expérience 4, nous avons rendu la situation d’écoute moins difficile pour les

participants. Le RSB entre les mots cibles et les masqueurs n’était plus fixé à -5 dB mais à 0

dB ; le niveau sonore des mots cibles n’était plus inférieur à celui des masqueurs mais

équivalent. Dans cette expérience, nous n’avons modifié que cette condition expérimentale.

Le taux d’erreurs a effectivement diminué ; il est passé de 34,1% à 22,1%. En revanche, cette

situation d’écoute semble être moins appropriée que celle à -5 dB pour examiner les

interférences produites dans la situation de la parole dans la parole. En effet, nous n’avons pas

retrouvé l’effet des informations linguistiques de haut niveau des masqueurs paroliers

français, il a été réduit. De même pour les effets des informations acoustiques et linguistiques

de bas niveau révélés dans l’Expérience 3, les temps de réaction des masqueurs paroliers

irlandais et italiens n’étaient plus significativement différents. Nous avions donc davantage de

données à analyser, en revanche la situation d’écoute à 0 dB ne nous a pas permis d’explorer

plus avant les effets de masque équivalents des masqueurs paroliers italiens et français.

Etape 3

Dans cette étape, deux expériences ont été menées dans le but de compléter les

résultats obtenus dans les expériences précédentes. Dans les Expériences 5 & 6, nous avons

manipulé le niveau de connaissances des participants pour les langues des masqueurs

paroliers ; deux langues parmi les trois manipulées étaient intelligibles pour les participants


165

(français et italien) au lieu d’une (français) comme dans les expériences précédentes. Dans ce

but, l’Expérience 5 a été menée auprès de participants natifs du français qui parlent l’italien

comme langue seconde (L2) ; dans l’Expérience 6, ce sont des participants natifs de l’italien

qui parlent le français comme L2 qui ont été sélectionnés. Enfin, dans ces deux expériences,

nous avons présenté aux participants les mêmes conditions expérimentales que dans

l’Expérience 3 ; les mots cibles français étaient insérés avec un RSB de -5 dB dans les

masqueurs paroliers (4 locuteurs) et dans les masqueurs de bruit fluctuant générés en français,

en irlandais et en italien. Ainsi, les participants de l’Expérience 5 ont réalisé la tâche de

décision lexicale dans leur langue native et les participants de l’Expérience 6 l’ont réalisée

dans leur langue seconde.

Dans l’Expérience 5, les résultats ont indiqué des différences significatives entre les

temps de réaction obtenus avec les masqueurs paroliers et ceux obtenus avec les masqueurs de

bruit fluctuant pour le français et l’italien. Ces résultats complètent ainsi ceux de l’Expérience

3 en confirmant que lorsque les masqueurs paroliers sont générés dans une langue intelligible

pour les participants (Expérience 3 : français ; Expérience 5 : français et italien), ils

produisent des interférences impliquant des informations linguistiques de haut niveau ainsi

que des informations acoustiques et linguistiques de bas niveau. Pour les masqueurs paroliers

produits dans une langue non connue pour les participants (Expérience 3 : irlandais et italien ;

Expérience 5 : irlandais), seules les informations acoustiques et linguistiques de bas niveau

interfèrent avec l’intelligibilité des mots cibles.

Dans une même analyse de variance, nous avons comparé les résultats obtenus par les

participants monolingues natifs du français (Expérience 3) à ceux des participants natifs du

français qui parlent l’italien comme L2 (Expérience 5). Dans les deux expériences, le matériel

expérimental proposé était identique, seul le niveau de connaissances des participants pour la

langue italienne était différent (langue intelligible versus non intelligible). L’analyse a

confirmé une différence significative entre les deux groupes de participants pour les

masqueurs paroliers italiens ; aucune autre différence n’a été signalée entre ces deux groupes.

De plus, dans l’Expérience 5, manipuler des masqueurs paroliers générés dans la langue

native des participants (français) et dans leur langue seconde (italien), nous a permis de

déterminer si l’accès au lexique des mots cibles français a davantage été perturbé dans une

condition plutôt que dans une autre. Les résultats ont indiqué que les temps de réaction des

participants étaient significativement plus longs avec les masqueurs paroliers générés dans

leur L2 (italien) plutôt que dans leur langue native (français). Ces résultats pourraient être


166

expliqués par le fait qu’avec les masqueurs paroliers générés dans la L2 des participants, les

interférences linguistiques seraient plus fortes qu’avec les masqueurs paroliers produits dans

une langue native. Jusqu’à 4 locuteurs dans les masqueurs paroliers, certains mots peuvent

être extraits et traités (Hoen et al., 2007). Or, nous avons vu dans la partie théorique que

l’identification de mots produits dans une langue seconde active un plus grand nombre de

compétiteurs que l’identification de mots produits dans une langue native (Weber & Cutler,

2004). Ainsi, les temps de réaction des participants auraient été plus longs avec les masqueurs

paroliers en italien (L2), du fait que les mots extraits de ces masqueurs auraient activé un plus

grand nombre de compétiteurs (compétiteurs des lexiques mentaux de la langue native et de la

L2). Les interférences linguistiques auraient, dans ce cas, été plus fortes et auraient davantage

perturbé l’accès au lexique des mots cibles français que les mots extraits des masqueurs

paroliers produits en français (langue native).

Afin d’approfondir ce point et tester cette hypothèse, il faudrait partir en Italie et mener une

expérience « miroir » à celle de l’Expérience 5. Nous proposerions la tâche de décision

lexicale à des participants natifs de l’italien parlant le français comme langue seconde. Les

masqueurs paroliers et les masqueurs de bruit fluctuant générés dans les trois langues seraient

exactement identiques à ceux utilisés dans l’Expérience 5. Cependant, les mots cibles seraient

produits en italien plutôt qu’en français. Comme dans l’Expérience 5, les participants

réaliseraient la tâche de décision lexicale dans leur langue native. Dans le cas où les temps de

réaction des participants sont significativement plus longs avec les masqueurs paroliers en

français (L2) plutôt qu’avec les masqueurs paroliers en italien (langue native), l’hypothèse

selon laquelle les mots extraits des masqueurs paroliers générés dans la L2 des participants

(français) activent un plus grand nombre de compétiteurs lors de leur identification que les

mots extraits des masqueurs paroliers dans la langue native des participants (italien) ne

pourrait pas être rejetée.

Enfin, dans l’Expérience 5, nous ne pouvons exclure la présence d’un biais

attentionnel. En effet, lors du recrutement des participants, nous avons indiqué que nous

cherchions des personnes natives du français en précisant qu’ils devaient parler l’italien

comme langue seconde. Cette précision a pu influencer les participants qui se seraient alors

davantage focalisés sur les masqueurs paroliers italiens. Afin de maîtriser ce biais

attentionnel, une solution serait de réaliser l’Expérience 5 en Italie, le matériel expérimental

ne serait pas modifié et nous pourrions le présenter à des participants natifs du français partis


167

vivre en Italie. Il ne serait pas donc nécessaire de préciser que nous cherchons des participants

qui parlent l’italien comme langue seconde, le biais attentionnel pourrait être ainsi contrôlé.

Dans l’Expérience 6, nous avons poursuivi l’examen des interférences linguistiques

intervenant dans la situation de la parole dans la parole et la comparaison des effets de

masque de masqueurs paroliers générés dans une langue native, une langue seconde et une

langue non intelligible. Dans cette expérience, les participants étaient natifs de l’italien et

parlaient le français comme langue seconde. Nous leur avons présenté la même tâche et les

mêmes conditions expérimentales qu’aux participants des Expériences 3 & 5 ; ils ont ainsi

réalisé la tâche de décision lexicale avec des mots cibles français, c’est-à-dire avec des mots

produits dans leur langue seconde. Les résultats ont à nouveau confirmé que les masqueurs

paroliers produisent des interférences impliquant des informations linguistiques de haut

niveau ainsi que des informations acoustiques et linguistiques de bas niveau, dès lors qu’ils

sont générés dans une langue intelligible pour les participants (masqueurs paroliers italiens et

français).

Les résultats ont également montré qu’il n’y avait pas de différence significative entre les

temps de réaction obtenus avec les masqueurs paroliers italiens et ceux obtenus avec les

masqueurs paroliers français ; la situation d’écoute n’était donc pas plus difficile, que les

masqueurs paroliers aient été générés dans la L2 des participants (français) ou dans leur

langue native (italien). Ce résultat est donc différent de celui observé dans l’Expérience 5

lorsque la tâche a été réalisée avec des mots cibles produits dans la langue native des

participants ; nous avions observé des temps de réaction significativement plus longs pour les

masqueurs paroliers dans la L2 plutôt que dans la langue native. Dans l’Expérience 6,

l’absence de différence significative entre les temps de réaction obtenus avec les masqueurs

paroliers italiens et ceux observés avec les masqueurs paroliers français pourrait être due au

fait que l’identification des mots cibles produits dans la langue seconde des participants, a

activé un nombre de compétiteurs relativement équivalents, et ce, quelle que soit la langue des

masqueurs paroliers (italien et français). L’identification de ces mots aurait activé des

compétiteurs appartenant au lexique mental de la langue native ainsi que des compétiteurs

appartenant au lexique mental de la langue seconde. Il ressort des Expériences 5 & 6 que

l’effet du niveau de connaissances des participants pour la langue concurrente était différent

selon que la parole cible ait été produite dans la langue native des participants ou dans leur

langue seconde.


168

Dans une même analyse de variance, nous avons comparé les performances des participants

natifs de l’italien qui parlent le français comme L2 (Expérience 6) à ceux des participants

natifs du français parlant l’italien comme L2 (Expérience 5). Nous avons observé que pour

chacune des conditions expérimentales, les participants natifs de l’italien ont eu des temps de

réaction significativement plus longs que les participants natifs du français. L’identification

des mots cibles était donc plus longue lorsqu’ils étaient produits dans une langue seconde

plutôt que dans une langue native. Nos résultats sont en accord avec ceux de la littérature

(Garcia Lecumberri & Cooke, 2006 ; Cooke et al., 2008 ; Van Engen, 2010).

En conclusion, dans cette dernière étape, nous avons étudié les interférences

linguistiques intervenant dans la situation de la parole dans la parole, en manipulant le niveau

de connaissances des participants à la fois pour la langue de la parole concurrente ainsi que

pour la langue de la parole cible. Dans ces deux expériences, les masqueurs paroliers générés

dans les langues intelligibles pour les participants (français, italien) ont produit des

interférences impliquant des informations linguistiques de haut niveau en plus des

informations acoustiques et linguistiques de bas niveau.

Dans la dernière partie de cette thèse, nous avons eu à sélectionner des participants

parlant deux langues (français et italien) afin de manipuler le niveau de connaissances des

participants pour la langue des masqueurs paroliers ainsi que pour la langue de la parole cible.

Ces objectifs n’incluaient pas l’étude du bilinguisme à proprement parlé (Paradis & Genesee,

1996 ; Paradis & Navarro, 2003 ; Meisel, 2004 ; Costa, Heij & Navarrete, 2006 ; Costa,

Hernandez, Costa-Faidella & Sebastian-Gallés, 2009 ; Hernandez, Costa, Fuentes, Vivas &

Sebastian-Gallés, 2010 ; Paradis, Genesee & Crago, 2011 ; Pérez-Vidal, 2011 ; Paradis,

2012). Notre paradigme expérimental nous permettrait néanmoins d’approcher cette

problématique. Pour avancer plus avant, il faudrait par exemple, au lieu de sélectionner des

participants natifs de l’italien vivant en France depuis en moyenne 5 ans (Expérience 6),

recruter des participants natifs de l’italien qui sont en immersion en France depuis plus

longtemps. Nous leur proposerions la tâche de décision lexicale avec les mots cibles en

français, c’est-à-dire avec les mots cibles produits dans leur langue seconde. Nous

comparerions leurs temps de réaction à ceux des participants de l’Expérience 6 ainsi qu’à

ceux de participants natifs du français qui ont réalisé la tâche de décision lexicale dans leur

langue native (par exemple les participants de l’Expérience 5). Nous pourrions déterminer si


169

les temps de réaction deviennent plus courts à mesure que la période d’immersion en France

augmente, autrement dit avec l’augmentation de la durée de pratique de la langue seconde.

Nous observerions dans quelle mesure une langue seconde peut devenir la langue dominante

des participants. Si tel est le cas, nous pourrions nous attendre à ce que les temps de réaction

des participants se rapprochent de ceux des participants réalisant la tâche de décision lexicale

avec des mots cibles produits dans leur langue native. Nous pourrions également examiner, si

l’amélioration des temps de réaction concerne les deux types de masqueurs, ou si cette

amélioration concerne en premier les masqueurs de bruit fluctuant, ces derniers étant

dépourvus d’informations linguistiques de haut niveau. Cette possible expérience,

questionnant sur le passage d’une langue seconde à une langue dominante, permettrait

d’aborder la notion de plasticité neuronale des réseaux langagiers (Lenneberg, 1967 ; Johnson

& Newport, 1989 ; Pallier et al., 2003).

Conclusion

170

CONCLUSION

Dans cette thèse, nous avons exploré la situation de la parole dans la parole afin de

caractériser les interférences produites par des masqueurs paroliers lors de la présentation de

mots cibles français. Dans une première série d’expériences, les masqueurs paroliers étaient

générés dans une langue intelligible pour les participants (français) ou dans des langues non

connues (gaélique irlandais et italien). De plus, deux types de tâches ont été utilisés : une

tâche d’intelligibilité (à -5 dB) puis une tâche de décision lexicale (à -5 dB et à 0 dB). A -5 dB

pour les deux tâches, les masqueurs paroliers italiens ont, de façon inattendue, perturbé

l’identification des mots cibles français avec autant d’efficacité que les masqueurs paroliers

français. Les masqueurs paroliers irlandais ont conduit, eux, à des performances

significativement plus élevées. La tâche de décision lexicale, en minimisant l’effet des

traitements post-lexicaux, s’est avérée plus précise que la tâche d’intelligibilité pour identifier

la nature des interférences produites par les masqueurs paroliers. Elle nous a indiqué que seuls

les masqueurs paroliers générés dans la langue intelligible (français) ont produit des

interférences impliquant des informations linguistiques de haut niveau en plus des

informations acoustiques et linguistiques de bas niveau. Il en résulte tout d’abord que les

masqueurs paroliers irlandais et italiens n’ont pas produit d’interférences lexicales ni sous-

lexicales, mais uniquement des interférences acoustiques et linguistiques de bas niveau.

Ensuite, les masqueurs paroliers générés en italien (langue non connue) ont eu un effet de

masque équivalent aux masqueurs paroliers générés en français (langue connue), tout en

produisant des interférences de natures différentes. Dans une seconde série d’expériences,

nous avons fait varier le niveau de connaissances des participants pour la langue de la parole

cible ainsi que pour la langue des masqueurs paroliers. Les résultats ont confirmé que

l’identification des mots cibles a été plus difficile lorsqu’ils étaient produits dans une langue

seconde plutôt que dans une langue native. Concernant les masqueurs paroliers, ils étaient

générés dans la langue native des participants, dans leur langue seconde ou dans une langue

non connue. Dans les langues intelligibles, les masqueurs paroliers ont produit des

interférences linguistiques de haut niveau en plus des interférences acoustiques et

linguistiques de bas niveau. De plus, ces masqueurs paroliers ont eu des effets de masque

différents lorsque les mots cibles étaient produits dans une langue native, et des effets de

masque équivalents lorsque les mots cibles étaient produits dans une langue seconde.

Références

171

REFERENCES

Aoyama, K., Flege, J. E., Guion, S. G., Akahane-Yamada, R., & Yamada, T. (2004).

Perceived phonetic dissimilarity and L2 speech learning: the case of Japonese /r/ and English

/l/ and /r/. Journal of Phonetics, 32, 233-250.

Assmann, P., & Summerfield, Q. (2004). The perception of speech under adverse

conditions. In S. Greenberg, W. A. Ainsworth, & A. N. Popper (Eds.), Speech Processing in

the Auditory System. New York: Springer-Verlag.

Best, C. T. (1995). A direct realist view of cross-language speech perception. In W.

Strange (Ed.), Speech Perception and Linguistic Experience: Issues in Cross-Language

Research (pp. 171–204). Timonium, MD: York Press.

Best, C. T. & Strange, W. (1992). Effects of phonological and phonetic factors on cross-

language perception of approximants. Journal of Phonetics, 20, 305-330.

Blumenfeld, H. K., & Marian, V. (2007). Constraints on parallel activation in bilingual

spoken language processing: Examining proficiency and lexical status using eye-tracking.

Language and Cognitive processes, 22(5), 633-660.

Boersma, P., & Weenink, D. (2013). Praat: doing phonetics by computer [Computer

program]. Version 5.3.57. En ligne http://www.praat.org/, consulté le 28 Octobre 2013.

Bolia, R. S., Nelson, W. T., Ericson, M. A., & Simpson, B. D. (2000). A speech corpus

for multitalker communications research. Journal of the Acoustical Society of America, 107,

1065-1066.

Boulenger, V., Hoen, M., Ferragne, E., Pellegrino, F., & Meunier, F. (2010). Real-time

lexical competitions during speech-in-speech comprehension. Speech Communication, 52,

246–253.

Bradlow, A. R., Clopper, C., Smiljanic, R., & Walter, M. A. (2010). A perceptual

phonetic similarity space for languages: Evidence from five native language listener

groups. Speech Communication, 52, 930-942.

Broersma, M. (2005). Perception of familiar contrasts in unfamiliar positions. Journal

of the Acoustical Society of America, 117, 3890-3901.

http://www.praat.org/

Références

172

Broersma, M. (2012). Increased lexical activation and reduced competition in second-

language listening. Language and Cognitive Processes, 27, 1205-1224.

Broersma, M., & Cutler, A. (2011). Competition dynamics of second-language

listening. Quarterly Journal of Experimental Psychology, 64, 74-95.

Broersma, M., & Scharenborg, O. (2010). Native and non-native listeners’ perception of

English consonants in different types of noise. Speech Communication, 52, 980-995.

Brokx, J. P. L., & Nooteboom, S. G. (1982). Intonation and the perceptual separation of

simultaneous voices. Journal of Phonetics, 10(1), 23-36.

Bronkhorst, A. (2000). The cocktail party phenomenon: A review of research on speech

intelligibility in multiple-talker conditions. Acustica, 86, 117–128.

Bronkhorst, A. W., & Plomp, R. (1992). Effect of multiple speechlike maskers on

binaural speech recognition in normal and impaired hearing. Journal of the Acoustical Society

of America, 92, 3132-3139.

Brouwer, S., Van Engen, K. J., Calandruccio, L., & Bradlow, A. R. (2012). Linguistic

contributions to speech-on-speech masking for native and non-native listeners: Language

familiarity and semantic content. Journal of the Acoustical Society of America, 131(2), 1449-

1464.

Brungart, D. S. (2001). Informational and energetic masking effects in the perception of

two simultaneous talkers. Journal of the Acoustical Society of America, 109(3), 1101-1109.

Brungart, D. S., Chang, P. S., Simpson, B. D., & Wang, D. (2006). Isolating the

energetic component of speech-on-speech masking with ideal time-frequency segregation.

Journal of the Acoustical Society of America, 120(6), 4007-4018.

Brungart, D. S., Simpson, B. D., Ericson, M. A., & Scott, K. R. (2001). Informational

and energetic masking effects in the perception of multiple simultaneous talkers. Journal of

the Acoustical Society of America, 110(5), 2527-2538.

Calandruccio, L., Dhar, S., & Bradlow, A. R. (2010a). Speech-on-speech masking with

variable access to the linguistic content of the masker speech. Journal of the Acoustical

Society of America, 128(2), 860-869.

Références

173

Calandruccio, L., Van Engen, K., Dhar, S., & Bradlow, A. R. (2010b). The

effectiveness of clear speech as a masker. Journal of Speech, Language, and Hearing

Research, 53, 1458-1471.

Cherry, E. C. (1953). Some experiments on the recognition of speech, with one and with

two ears. Journal of the Acoustical Society of America, 25(5), 975-979.

Cooke, M. (2006). A glimpsing model of speech perception in noise. Journal of the

Acoustical Society of America, 119(3), 1562-1573.

Cooke, M., Garcia Lecumberri, M. L., & Barker, J. (2008). The foreign language

cocktail party problem: Energetic and informational masking effects in non-native speech

perception. Journal of the Acoustical Society of America, 123(1), 414-427.

Costa, A., Heij, W. L., & Navarrete, E. (2006). The dynamics of bilingual lexical

access. Bilingualism: Language and Cognition, 9(2), 137-151.

Costa, A., Hernandez, M., Costa-Faidella, J., & Sebastian-Gallés, N. (2009). On the

bilingual advantage in conflict processing: Now you see it, now you don’t. Cognition, 113,

135-149.

Cutler, A., Mehler, J., Norris, D., & Segui, J. (1983). A language-specific

comprehension strategy. Nature, 304, 159-160.

Cutler, A. Mehler, J., Norris, D., & Segui, J. (1986). The syllable’s differing role in the

segmentation of French and English. Journal of Memory and Language, 25, 385-400.

Cutler, A., Otake, T. (2004). Pseudo-homophony in non-native listening. Paper

presented to the 75th meeting of the Acoustical Society of America, New York.

Cutler, A., Weber, A., & Otake, T. (2006). Asymmetric mapping from phonetic to

lexical representations in second-language listening. Journal of Phonetics, 34, 269-284.

Darwin, C. J. (2008). Listening to speech in the presence of other sounds. Philosophical

Transactions: Biological Sciences, 363, 1011-1021.

Darwin, C. J., Brungart, D. S., & Simpson, B. D. (2003). Effects of fundamental

frequency and vocal-tract length changes on attention to one of two simultaneous talkers.

Journal of the Acoustical Society of America, 114, 2913-2922.

Références

174

Dole, M., Hoen, M., & Meunier, F. (2009). Effect of contralateral noise of energetic and

informational masking on speech-in-speech intelligibility. Proceedings of Interspeech,

Brighton, U.K.

Dole, M., Hoen, M., & Meunier, F. (2012). Speech-in-noise perception in adults with

dyslexia : Effects of background type and listening configuration. Neuropsychologia, 50(7),

1543-1552.

Dufour, S., & Frauenfelder, U.H. (2007). L’activation et la sélection lexicales lors de la

reconnaissance des mots parlés : Modèles théoriques et données expérimentales. Année

psychologique, 107, 87-111.

Festen, J. M., & Plomp, R. (1990). Effects of fluctuating noise and interfering speech on

the speech-reception threshold for impaired and normal hearing. Journal of the Acoustical

Society of America, 88(4), 1725-1736.

Flege, J. E. (1995). Second language speech learning: Theory, findings, and problems.

In W. Strange (Ed.), Speech Perception and Linguistic Experience: Issues in Cross-language

Research (pp. 233-277). Timonium, MD: York Press.

Fleuriot, P., Garnier, S. & Lorenzi, C. (2009). Effets d’une lésion cochléaire sur

l’intelligibilité de la parole dans le bruit : Rôle des informations temporelles de structure fine.

Les Cahiers de l’Audition, 20(4), 27-32.

Florentine, M. (1985). Speech perception in noise by fluent, non-native listeners.

Journal of the Acoustical Society of America, 77, S106.

Florentine, M., Buus, S., Scharf, B., & Canevet, G. (1984). Speech reception thresholds

in noise for native and non-native listeners. Journal of the Acoustical Society of America, 75,

S84.

Forster, K. I., & Forster, J. C. (2003). DMDX: A windows display program with

millisecond accuracy. Behavior Research Methods, Instruments, & Computers, 35, 116-124.

Frauenfelder, U. H. (1996). Computational models of spoken word recognition. In T.

Dijkstra & K. De Smedt (Eds.), Computational psycholinguistics: Symbolic and subsymbolic

models of language processing. Londres: Harvester Press.

http://www.indiana.edu/~clcl/Q550_WWW/Papers/ForsterEtAl(2003).pdf

http://www.indiana.edu/~clcl/Q550_WWW/Papers/ForsterEtAl(2003).pdf

Références

175

Freyman, R. L., Balakrishnan, U., & Helfer, K. S. (2004). Effect of number of masking

talkers and auditory priming on informational masking in speech recognition. Journal of the


Freyman, R. L., Helfer, K. S., McCall, D. D., & Clifton, R. K. (1999). The role of

perceived spatial separation in the unmasking of speech. Journal of the Acoustical Society of

America,106, 3578-3588.

Füllgrabe, C., Berthommier, F., & Lorenzi, C. (2006). Masking release for consonant

features in temporally fluctuating background noise. Hearing Research, 211, 74-84.

Garcia Lecumberri, M. L., & Cooke, M. (2006). Effect of masker type on native and

non-native consonant perception in noise. Journal of the Acoustical Society of America,

119(4), 2445-2454.

Garcia Lecumberri, M. L., Cooke, M., & Cutler, A. (2010). Non-native speech

perception in adverse conditions: A review. Speech Communication, 52, 864-886.

Gaudrain, E. (2008). Rôle de la ségrégation séquentielle pour la séparation de voix

concurrentes. Thèse de doctorat en Acoustique. Université Lyon1 - Claude Bernard, Lyon,

France.

Gnansia, D., de Cheveigné, A., & Lorenzi, C. (2009). Intelligibilité dans le bruit et

démasquage de la parole chez les sujets normo-entendants, malentendants et implantés

cochléaires. Les Cahiers de l’Audition, 22(6), 9-42.

Goto, H. (1971). Auditory perception by normal Japanese adults of the sounds “l” and

“r”. Neuropsychologia, 9, 317-323.

Hallé, P. A., Best, C. T., & Levitt, A. (1999). Phonetic vs. phonological influences on

French listeners’ perception of American English approximants. Journal of Phonetics, 27,

281-306.

Hernandez, M., Costa, A., Fuentes, L. J., Vivas, A. B., Sebastian-Gallés, N. (2010). The

impact of bilingualism on the executive control and orienting networks of attention.

Bilingualism: Language and Cognition, 13(03), 315-325.

Hoen, M., Meunier, F., Grataloup, C., Pellegrino, F., Grimault, N., Perrin, F., Perrot, X.,

& Collet, L. (2007). Phonetic and lexical interferences in informational masking during

speech-in-speech comprehension. Speech communication, 49, 905-916.

Références

176

Howard-Jones, P. A., & Rosen, S. (1993a). The perception of speech in fluctuating

noise. Acustica, 78, 258-272.

Howard-Jones, P. A., & Rosen, S. (1993b). Uncomodulated glimpsing in

‘checkerboard’ noise. Journal of the Acoustical Society of America, 93, 2915-2922.

Iverson, P., Kuhl, P. K., Akahane-Yamada, R., Diesch, E., Tohkura, Y., Kettermann, A.,

& Siebert, C. (2003). A perceptual interference account of acquisition difficulties for non-

native phonemes. Cognition, 87, B47-B57.

Johnson, J. S., & Newport, E. L. (1989). Critical period effects in second language

learning: The influence of maturational state on the acquisition of English as a second

language. Cognitive Psychology, 21, 60-99.

Kidd, G. Jr., Mason, C. R., Rohtla, T. L., & Deliwala, P. S. (1998). Release from

masking due to spatial separation of sources in the identification of nonspeech auditory

patterns. Journal of the Acoustical Society of America, 104(1), 422-431.

Lenneberg, E. H. (1967). Biological Foundations of Language. New York: Wiley.

Lorenzi, C., Husson, M., Ardoint, M., & Debruille, X. (2006). Speech masking release

in listeners with flat hearing loss: Effects of masker fluctuation rate on identification scores

and phonetic feature reception. International Journal of Audiology, 45, 487-495.

Luce, P., Pisoni, D., & Goldinger, S. (1990). Similarity neighbourhoods of spoken

words. In G. Altmann (Ed.), Cognitive Models of Speech Perception: Psycholinguistic and

Computational Perspectives (pp 122-147). Cambridge, MA: MIT Press.

Maddison, I., Flavier, S., Marsico E. & Pellegrino, F. (2011). LAPSyD: Lyon-

Albuquerque Phonological Systems Databases. En ligne http://www.lapsyd.ddl.ish-

lyon.cnrs.fr/, consulté le 28 Octobre 2013.

Marian, V., & Spivey, M. (2003a). Bilingual and monolingual processing of competing

lexical items. Applied Psycholinguistics, 24, 173-193.

Marian, V., & Spivey, M. (2003b). Competing activation in bilingual language

processing: Within- and between-language competition. Bilingualism: Language and

Cognition, 6, 97-115.

Références

177

Marslen-Wilson, W. D. (1987). Functional parallelism in spoken word-recognition.

Cognition, 25, 71-102.

Marslen-Wilson, W. D. (1990). Activation, competition, and frequency in lexical

access. In G. T. M. Altmann (Ed.), Cognitive models of speech processing: Psycholinguistics

and Computational Perspectives (pp. 148–172). Cambridge, MA: MIT Press.

Marslen-Wilson, W. D., & Welsh, A. (1978). Processing interactions and lexical access

during word recognition in continuous speech. Cognitive Psychology, 10, 29-63.

Mayo, L. H., Florentine, M., & Buus, S. (1997). Age of second language acquisition

and perception of speech in noise. Journal of Speech, Language & Hearing Research, 40,

686-693.

McClelland, J. L., & Elman, J. L. (1986). The TRACE model of speech perception.

Cognitive Psychology, 18, 1-86.

McClelland, J. L., & Rumelhart, D. E. (1981). An interactive activation model of

context effects in letter perception: Part 1. An Account of Basic Findings. Psychological

Review, 88, 375-407.

Meador, D., Flege, J. E., & MacKay, I. R. A. (2000). Factors affecting the recognition

of words in a second language. Bilingualism: Language & Cogniton, 3, 55-67.

Meisel, J. M. (2004). The bilingual child. In T. K. Bhatia & W. C. Ritchie (Eds), The

handbook of bilingualism (pp. 91-113). Oxford: Blackwell Publishing Ltd.

Miller, G. A. (1947). The masking of speech. Psychological Bulletin, 44, 105-129.

Miller, G. A., & Licklider, J. C. A. (1950). The Intelligibility of interrupted speech.

Journal of the Acoustical Society of America, 22, 167-173.

Nazzi, T., Bertoncini, J., & Mehler, J. (1998). Language discrimination by newborns:

Towards an understanding of the role of rhythm. Journal of Experimental Psychology:

Human Perception and Performance, 24(3), 756-766.

Nazzi, T., Jusczyk, P. W., & Johnson, E. K. (2000). Language discrimination by

English-learning 5-month-olds: Effects of rhythm and familiarity. Journal of Memory and

Language, 43, 1-19.

http://jimflege.com/files/Meador_Flege_factors_affecting_B_L_C_2000.pdf

Références

178

New, B., Pallier, C., Brysbaert, M. & Ferrand, L. (2004). Lexique 2: A new French

lexical database. Behavior Research Methods, Instruments, & Computers, 36(3), 516-524.

Nilsson, M., Soli, S. D., & Sullivan, J. A., (1994). Development of the hearing in noise

test for the measurement of speech reception thresholds in quiet and in noise. Journal of the


Norris, D. (1994). Shortlist: A connectionist model of continuous speech recognition.

Cognition, 52, 189-234.

Pallier, C., Bosch, L., & Sebastian-Gallés, N. (1997). A limit on behavioral plasticity in

vowel acquisition. Cognition, 64, B9-B17.

Pallier, C., Colomé, A., & Sebastian-Gallés, N. (2001). The influence of native-

language phonology on lexical access: Exemplar-based versus abstract lexical entries.

Psychological Science, 12(6), 445-9.

Pallier, C., Dehaene, S., Poline, J. B., LeBihan, D., Argenti, A. M., Dupoux, E. &

Mehler, J. (2003). Brain imaging of language plasticity in Adults: Can a second language

replace the first? Cerebral Cortex, 13, 155-161.

Paradis, J. (2012). Cross-linguistic influence and code-switching. In B. Goldstein (Ed.),

Bilingual Language Development and Disorders in Spanish-English Speakers (2nd ed.) (pp

73-91). Baltimore: Brookes Publishing.

Paradis, J., & Genesee, F. (1996). Syntactic acquisition in bilingual children:

Autonomous or interdependent? Studies in Second Language Acquisition, 18, 1-25.

Paradis, J., Genesee, F., & Crago, M. (2011). Dual language development and

disorders: A handbook on bilingualism and second language learning (2nd Edition).

Baltimore, MD: Brookes.

Paradis, J., & Navarro, S. (2003). Subject realization and crosslinguistic interference in

the bilingual acquisition of Spanish and English. Journal of Child Language, 30, 371-393.

Payton, K. L., Uchanski, R. M., & Braida, L. D. (1994). Intelligibility of conversational

and clear speech in noise and reverberation for listeners with normal and impaired hearing.


Références

179

Pérez-Vidal, C. (2011). Language acquisition in three different contexts of learning:

Formal instruction, Study Abroad and Semi-immersion (CLIL). In Y. Ruiz de Zarobe, J. M.

Sierra & F. Gallardo del Puerto (Eds.), Content and Foreign Language Integrated Learning:

Contributions to Multilingualism in European Contexts (pp. 25-35). Bern/Berlin: Peter Lang.

Pollack, I. (1975). Auditory informational masking. Journal of the Acoustical Society of

America, 57, S5.

Ramus, F. (1999a). Rythme des langues et acquisition du langage. Thèse de doctorat.

EHESS, Paris, France.

Ramus, F., Nespor, M. & Mehler. J. (1999b). Correlates of linguistic rhythm in the

speech signal. Cognition, 73, 265-292.

Reel, L. A., & Hicks, C. B. (2012). Selective auditory attention in adults: Effects of

rhythmic structure of the competing language. Journal of Speech, Language & Hearing

Research, 55(1), 89-104.

Rhebergen, K. S., Versfeld, N. J., & Dreschler, W. A. (2005). Release from

informational masking by time reversal of native and non-native interfering speech. Journal

of the Acoustical Society of America, 118(3), 1274-1277.

Rhebergen, K. S., Versfeld, N. J., & Dreschler, W. A. (2006). Extended speech

intelligibility index for the prediction of the speech reception threshold in fluctuating noise.


Rogers, C. L., Lister, J. J., Febo, D. M., Besing, J. M., & Abrams, H. B. (2006). Effects

of bilingualism, noise, and reverberation on speech perception by listeners with normal

hearing. Applied Psycholinguistics, 27, 465-485.

Rosen, S. (1992). Temporal information in speech: Acoustic, auditory and linguistic

aspects. Philosophical Transactions: Biological Sciences, 336(1278), 367-373.

Sebastian-Gallés, N., & Soto-Faraco, S. (1999). On-line processing of native and non-

native phonemic contrasts in early bilinguals. Cognition, 72(2), 112-123.

Schouten, M. E. H. (1975). Native-language interference in the perception of second-

language vowels: An investigation of certain aspects of the acquisition of a second language.

Unpublished doctoral dissertation, Utrecht University, The Netherlands.

http://www.lscp.net/persons/ramus/these/index.html

Références

180

Simpson, S. A., & Cook, M. (2005). Consonant identification in N-talker babble is a

nonmonotonic function of N. Journal of the Acoustical Society of America, 118(5), 2775-

2778.

Spivey, M., & Marian, V. (1999). Cross talk between native and second languages:

partial activation of an irrelevant lexicon. Psychological Science, 10, 281-284.

Strange, W. (1995). Speech Perception and Linguistic Experience: Issues in Cross-

Language Research. Timonium, MD: York Press.

Strange, W., & Dittmann, S. (1984). Effects of discrimination training on the perception

of /r-l/ by Japanese adults learning English. Perception & Psychophysics, 36(2), 131-145.

Studebaker, G. A. (1985). A “rationalized” arcsine transform. Journal of Speech and

Hearing Research, 28(3), 455-462.

Summers, V., & Leek, M. R. (1998). F0 processing and the separation of competing

speech signals by listeners with normal hearing and with hearing loss. Journal of Speech,

Language & Hearing Research, 41(6), 1294-306.

Taft, M., & Hambly, G. (1986). Exploring the Cohort Model of spoken word

recognition. Cognition, 22, 259-282.

Vaissière, J. (2006). La phonétique. Paris : Presses Universitaires de France.

Van Engen, K. J. (2010). Similarity and familiarity: Second language sentence

recognition in first- and second-language multi-talker babble. Speech Communication, 52,

943-953.

Van Engen, K. J., & Bradlow, A. R. (2007). Sentence recognition in native- and

foreign-language multi-talker background noise. Journal of the Acoustical Society of America,

121(1), 519-526.

Weber, A., & Broersma, M. (2012). Spoken word recognition in second language

acquisition. In C. A. Chapelle (Ed.), The Encyclopedia of Applied Linguistics. Bognor Regis:

Wiley-Blackwell.

Weber, A., & Cutler, A. (2004). Lexical competition in non-native spoken-word

recognition. Journal of Memory and Language, 50, 1-25.

http://www.ncbi.nlm.nih.gov/pubmed?term=Strange%20W%5BAuthor%5D&cauthor=true&cauthor_uid=6514522

http://www.ncbi.nlm.nih.gov/pubmed?term=Dittmann%20S%5BAuthor%5D&cauthor=true&cauthor_uid=6514522

181

ANNEXES

Annexes

182

ANNEXE 1 : Matériel expérimental de l’Expérience 1

Mots cibles utilisés dans l’Expérience 1.

Entraînement

bémol

carie

coiffeur

jardin

manteau

nageur

pavé

rabot

Phase test

balai château juron purée

ballon chaton képi radeau

bandit chemin lacet radis

baquet cheveu lagon raisin

bateau chevreau laitue raison

bâton chiffon landau rallye

beignet climat leçon râteau

bévue cobra loquet ravin

bidet côté lundi rebond

bijou couffin matin réseau

bison crapaud médias rotin

blaireau crédit mégot ruban

blouson débit menton sachet

bonnet défi nougat safran

bouchon dragée palet salon

boulon dragon parent sirop

bouton faisan pari sosie

buffet félin pâté stylo

cabri filet patin taureau

cachet frelon pichet tiret

cachot furet pigeon torrent

caddie galet pinson tricot

cadeau gallon piquet trognon

café garrot plateau troupeau

cageot gâteau poney trousseau

caisson genou poteau tunnel

câlin gigot poulet vallée

canaux grelot poumon vallon

carton guenon prairie venin

chaînon jambon projet verrou

chalet javelot pruneau vessie

chameau jeton puma wagon

Annexes

183

ANNEXE 2 : Matériel expérimental de l’Expérience 2

Mots cibles utilisés dans l’Expérience 2.

Entraînement

bateau

chameau

filet

lundi

raison

venin

Phase test

ballon debit poteau

bandit dragee poulet

bemol dragon projet

bevue faisan pruneau

bidet galet puree

bijou gallon rabot

bison garrot radis

blouson gateau raisin

bonnet grelot rallye

bouchon guenon rateau

caddie kepi ravin

cafe lagon reseau

caisson laitue rotin

calin landau ruban

canaux manteau safran

carie medias salon

carton nageur sirop

chainon parent sosie

chalet pari stylo

chaton patin tiret

chemin pichet torrent

cheveu pigeon tricot

chevreau pinson trousseau

chiffon piquet tunnel

climat plateau vallee

coiffeur poney wagon

Annexes

184

ANNEXE 3 : Matériel expérimental des Expériences 3 à 6

Mots cibles utilisés dans les Expériences 3 à 6.

Entraînement

bateau

filet

raison

Phase test

ballon debit poteau

bandit dragee poulet

bemol dragon projet

bevue faisan pruneau

bidet galet puree

bijou gallon rabot

bison garrot radis

blouson gateau raisin

bonnet grelot rallye

bouchon guenon rateau

caddie kepi ravin

cafe lagon reseau

caisson laitue rotin

calin landau ruban

canaux manteau safran

carie medias salon

carton nageur sirop

chainon parent sosie

chalet pari stylo

chaton patin tiret

chemin pichet torrent

cheveu pigeon tricot

chevreau pinson trousseau

chiffon piquet tunnel

climat plateau vallee

coiffeur poney wagon

Annexes

185

ANNEXE 4 : Matériel expérimental des Expériences 3 à 6 (suite)

Pseudo-mots cibles utilisés dans les Expériences 3 à 6.

Entraînement

fuquet

jateau

trouri

Phase test

bameau deteau pouson

banton drason prodia

bason draton puga

bedit fiton punon

bife gacon puteau

bilon gafi racot

blougeot gassie rafin

bocher keron railee

boumol lalo raiteau

bouteau landi rapaud

cagon lasin rasie

cailon leret remon

callye lobra ruquet

cannet luncet sagot

carjou manrie sarop

carrent mefran sigon

caton menvin tignet

chadi paseau trifin

chaison paton trolet

chanin patue trouchet

chebri piret tusan

cherent pirie vadeau

coveu platin vegnon

crallon pogeon vellon

crelai polet veree

demat pouchot wateau

Annexes

186

ANNEXE 5 : Liste des Tableaux

1) Tableaux de la Partie Théorique

Tableau 1 : Principales caractéristiques des modèles psycholinguistiques présentés.

Tableau 2 : Conditions expérimentales présentées aux quatre groupes de participants dans

l’étude de Van Engen & Bradlow (2007).

Tableau 3 : Récapitulatif des études présentées ayant manipulé la langue des masqueurs

paroliers.

2) Tableaux de la Partie Expérimentale


obtenus dans chacune des huit conditions expérimentales. Les écart-types sont également

indiqués.

Tableau 5 : Principales caractéristiques des trois langues manipulées dans l’Expérience 2.


obtenus dans chacune des six conditions expérimentales. Les écart-types sont également

indiqués.



indiqués.





indiqués.





indiqués.



Annexes

187



monolingues français (Tableau 13) et pour les participants français parlant l’italien en L2

(Tableau 14). Les écart-types sont également indiqués.



indiqués.





natifs du français (Tableau 17) et pour les participants natifs de l’italien (Tableau 18). Les

écart-types sont également indiqués.

Annexes

188

ANNEXE 6 : Liste des Figures

1) Figures de la Partie Théorique

Figure 1 : Représentation schématique du modèle TRACE (McClelland & Elman, 1986).

(Extraite de Frauenfelder, 1996).

Figure 2 : Pourcentages d’identifications correctes des consonnes cibles, pour les masqueurs

paroliers (« natural babble ») et les masqueurs de bruit fluctuant (« babble-modulated

noise »), en fonction du nombre de locuteurs. (Extraite de Simpson & Cooke, 2005).

Figure 3 : Figure illustrant les trois conditions d’écoute testées dans l’étude de Dole et al.

(2012) : monaurale, dichotique et spatialisée. (Extraite de Dole et al., 2012).

Figure 4 : Niveau de démasquage obtenu en fonction du Rapport Signal sur Bruit (« SNR »

en dB). (Extraite de Miller & Licklider, 1950).

Figure 5 : Figure représentant un signal de parole (en bleu) inséré dans un bruit stationnaire

(en rouge à gauche) ou dans un bruit fluctuant (en rouge à droite). (Extraite de Fleuriot,

Garnier & Lorenzi, 2007).

Figure 6 : Taux de retranscriptions correctes obtenus avec les trois types de masqueurs : du

bruit stationnaire (« BBN » pour « stationary broadband noise »), du bruit fluctuant

(« SN » pour « fluctuating speech-shaped noise »), des masqueurs paroliers (« Cock » pour

« Cocktail noise »). (Extraite de Dole et al., 2009).

Figure 7 : Pourcentages de fixations envers l’objet cible (« English target (kitten) »), l’objet

compétiteur (« Dutch compétiteur (kist) ») et les objets distracteurs (« Distractor (flower) »),

en fonction du temps (en ms). Le graphique (a) représente les résultats des participants natifs

du néerlandais qui parlent l’anglais comme L2 ; le graphique (b), les résultats des participants

anglais monolingues. (Extraite de Weber & Cutler, 2004).

Figure 8 : Pourcentages d’identifications correctes des consonnes cibles présentées : dans le

silence (« quiet »), en présence des masqueurs paroliers à un locuteur natif de l’anglais

(« english ») ou de l’espagnol (« spanish »), avec du bruit stationnaire (« ssn »), et des

masqueurs paroliers anglais à 8 locuteurs (« babble »). Les performances des participants

anglais monolingues sont indiquées par la lettre N, celles des participants natifs de l’espagnol

qui parlent anglais en L2 par les lettres NN. (Extraite de Garcia Lecumberri & Cooke, 2006).

Figure 9 : Pourcentages d’identifications correctes des mots cibles en présence des

masqueurs paroliers à 1 locuteur identique à celui des phrases cibles (« same talker »),

différent mais de même sexe (« same gender »), de sexe différent (« different gender »). La

lettre N est utilisée pour les performances des participants natifs de l’anglais, et les lettres NN

pour les participants natifs de l’espagnol. (Extraite de Cooke et al., 2008).

Annexes

189

Figure 10 : Valeurs de RSB nécessaires à 50% d’identifications correctes des phrases cibles,

pour les participants natifs de l’anglais (« English listeners ») et natifs du mandarin

(« Mandarin listeners »). (Extraite de Van Engen, 2010).

Figure 11 : Pourcentages de mots cibles correctement identifiés en présence des masqueurs

paroliers anglais (« English babble ») et mandarins (« Mandarin babble »), pour les quatre

valeurs de HINT sélectionnées. Les performances des participants natifs de l’anglais sont

reportées à gauche, celles des participants natifs du mandarin à droite. (Extraite de Van

Engen, 2010).

2) Figures de la Partie Expérimentale

Figure 12 : Mot cible inséré à 2,5 sec dans un masqueur parolier de 4 sec à 4 voix (deux

femmes et deux hommes).

Figure 13 : Effet de la Langue des masqueurs paroliers (français et gaélique irlandais) sur les

pourcentages moyens de retranscriptions correctes des mots cibles en fonction du RSB (-5 dB

et 0 dB). Les erreurs standard ont été reportées. Le symbole ‘ * ’ signale une différence

significative entre les masqueurs paroliers français et irlandais à -5 dB ainsi qu’à 0 dB.

Figure 14 : Spectrogrammes d'un masqueur parolier composé de quatre locuteurs (à gauche)

et de sa forme resynthétisée en bruit fluctuant (à droite). (Figures réalisées à l'aide du logiciel

Adobe Audition 3.0).

Figure 15 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les

pourcentages moyens de retranscriptions correctes des mots cibles à -5 dB, en fonction de la

Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont reportées. Le

symbole ‘ * ’ indique une différence significative entre les deux types de bruits (parole et

bruit fluctuant) pour l’irlandais, l’italien et le français. Des différences significatives sont


masqueurs paroliers irlandais et français. Pour la clarté, la différence significative entre les

masqueurs de bruit fluctuant irlandais et français et celle entre les masqueurs de bruit

fluctuant irlandais et italiens ne figurent pas sur le graphique.


moyens (en ms) à -5 dB, en fonction de la Langue des masqueurs (irlandais, italien et

français). Les erreurs standard sont reportées. Le symbole ‘ * ’ indique une différence

significative entre les deux types de bruits (parole et bruit fluctuant) pour le français. Des


italiens, ainsi qu’entre les masqueurs paroliers irlandais et français. Figure 17 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs

moyens (en ms) à 0 dB, en fonction de la Langue des masqueurs (irlandais, italien et français).

Les erreurs standard sont reportées. Le symbole ‘ * ’ indique une différence significative entre

les masqueurs paroliers irlandais et français.


moyens (en ms) à -5 dB, pour les participants natifs du français parlant l’italien en L2, en

Annexes

190



(parole et bruit fluctuant) pour l’italien et le français. Des différences significatives sont


masqueurs paroliers italiens et français.


moyens (en ms) à -5 dB, pour les participants monolingues français (Expérience 3) et pour les

participants natifs du français parlant l’italien en L2 (Expérience 5), en fonction de la Langue

des masqueurs (irlandais, italien et français). Les erreurs standard sont reportées. Le symbole

‘ * ’ indique une différence significative entre les deux types de bruits (parole et bruit

fluctuant) pour l’italien (Expérience 5) et pour le français (Expériences 3 & 5). Les TRs

moyens obtenus avec les masqueurs paroliers italiens dans l’Expérience 5 sont indiqués en

vert, ils sont significativement différents de ceux obtenus dans l’Expérience 3 pour la même

condition expérimentale.


moyens (en ms) à -5 dB, pour les participants natifs de l’italien parlant le français en L2, en



(parole et bruit fluctuant) pour l’italien et une différence tendancielle pour le français. Des




moyens (en ms) à -5 dB, pour les participants natifs du français de l’Expérience 5 (appellation

« Natif Fr ») et pour les participants natifs de l’italien de l’Expérience 6 (appellation « Natif It

»), en fonction de la Langue des masqueurs (irlandais, italien et français). Le symbole ‘ * ’

indique une différence significative entre les deux types de bruits (parole et bruit fluctuant)

pour l’italien et pour le français (Expériences 5 & 6). Pour plus de clarté, nous n’avons pas

indiqué les différences significatives présentes entre les deux groupes de participants pour

chacune des six conditions expérimentales.

Documents

COMPREHENSION DE LA PAROLE DANS LA PAROLE - Les thèses …