Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Université Lumière Lyon 2 - Université de Lyon
Ecole doctorale Neurosciences et Cognition
Thèse en vue de l’obtention du titre de Docteur en Psychologie Cognitive
COMPREHENSION DE LA PAROLE DANS LA PAROLE :
UNE APPROCHE INTER-LANGUES POUR EVALUER LES
INTERFERENCES LINGUISTIQUES DURANT LA COMPREHENSION
Aurore GAUTREAU
Sous la direction de Fanny MEUNIER
Composition du jury :
Dr Josiane BERTONCINI (examinateur)
Dr Christian FULLGRABE (rapporteur)
Dr Fanny MEUNIER (directrice de thèse)
Dr Jean-Luc SCHWARTZ (examinateur)
Pr Elsa SPINELLI (rapporteur)
Soutenue le 20 Décembre 2013
1
REMERCIEMENTS
Je remercie chaleureusement ma directrice de thèse, Fanny Meunier, de la confiance
qu’elle m’a accordée pour travailler sur ce projet de recherche qui m’a tant plu. Merci pour
tout ce que vous m’avez appris.
Je remercie également Michel Hoen, pour sa collaboration sur ce projet de recherche. Merci
de m’avoir fait progresser.
Un grand merci à Josiane Bertoncini, Christian Füllgrabe, Jean-Luc Schwartz et Elsa Spinelli,
d’avoir montré de l’intérêt pour mon travail de thèse en acceptant de faire partie du jury.
Je remercie Olivier Bertrand de m’avoir accueillie au sein du Centre de Recherche en
Neurosciences de Lyon, ainsi que Tatjana Nazir de m’avoir accueillie au sein du Laboratoire
sur le Langage, le Cerveau et la Cognition (L2C2).
Merci à Martine Theillère et à Christiane Battoue pour leur disponibilité et leur gentillesse.
Mille mercis aux membres du groupe SpiN, pour leur aide et pour les échanges que nous
avons eus.
Merci à tous les étudiants, doctorants, chercheurs et autres membres du L2C2 pour leur bonne
humeur et leurs sourires.
Je remercie Daniel Zagar de m’avoir donné l’envie de faire de la recherche.
Merci à tous les volontaires qui ont participé à mes études, ainsi qu’à tous les locuteurs des
différentes langues que j’ai enregistrés.
Merci Stéphane, pour ton amitié.
Je remercie infiniment mes parents, mon frère, mes grands-parents et Sofiane pour leur
présence et leur soutien.
Ce travail de thèse a été réalisé grâce à une allocation de recherche financée par la
Délégation Générale de l’Armement conjointement avec l’ERC (European Research
Council) dans le cadre du projet SpiN n° 209234 dirigé par Fanny Meunier.
Résumé
2
RESUME
Cette thèse s’est intéressée aux interférences linguistiques intervenant dans la situation
de la parole dans la parole, en comparant l’effet de masque de masqueurs paroliers générés
dans une langue intelligible pour les participants (français) à celui de masqueurs paroliers
générés dans des langues non connues (gaélique irlandais et italien), sur l’identification de
mots cibles français. Une tâche de décision lexicale à -5 dB nous a permis d’observer des
résultats significativement différents entre les masqueurs paroliers générés dans les langues
inconnues (irlandais et italien), avec les masqueurs paroliers italiens qui ont réduit
l’intelligibilité des mots cibles français avec la même efficacité que les masqueurs paroliers
français, alors que les masqueurs paroliers irlandais ont conduit aux performances les plus
élevées. L’utilisation de masqueurs de bruit fluctuant générés à partir de chacun des
masqueurs paroliers, a montré que seuls les masqueurs paroliers générés dans une langue
intelligible ont produit des interférences linguistiques de haut niveau en plus d’interférences
acoustiques et linguistiques de bas niveau. Ainsi, la différence de performances observée
entre les masqueurs paroliers irlandais et italiens serait expliquée au niveau acoustique et non
à un niveau linguistique. De plus, bien que les masqueurs paroliers italiens et français aient eu
des effets de masque équivalents, leurs interférences étaient de natures différentes. Lorsque
l’italien devient intelligible pour les participants, les masqueurs paroliers italiens, comme
ceux générés en français, produisent des interférences linguistiques de haut niveau, et ce, que
les mots cibles soient produits dans la langue native des participants ou dans leur langue
seconde.
Mots-clés : compréhension de la parole dans la parole, inter-langues, bruit fluctuant,
interférences linguistiques de haut niveau, tâche de décision lexicale, accès au lexique, langue
seconde.
Abstract
3
ABSTRACT
This research aimed to explore the linguistic interference that occurs during the
speech-in-speech situation, by comparing the masking effects of speech backgrounds that
were produced in an intelligible language for the participants (i.e., French), to the masking
effects of speech backgrounds that were produced in unknown foreign languages (i.e., Irish
and Italian), on the identification of French target words. At -5 dB SNR, a lexical decision
task revealed significantly divergent results with the unknown languages (i.e., Irish and
Italian), with Italian and French speech backgrounds hindering French target word
identification to a similar extent, whereas Irish speech backgrounds led to significantly better
performances. Using fluctuating noise backgrounds derived from each speech background
signals, showed that only the speech backgrounds generated in an intelligible language (i.e.,
French) produced linguistic interference of high level in addition to acoustic interference and
linguistic interference of low level. Thus, the difference observed between the speech
backgrounds in Irish and Italian can be explained at an acoustic level but not at a linguistic
level. Moreover, although the speech backgrounds in French and in Italian had equivalent
masking effects on French word identification, the nature of their interference was different.
When Italian became intelligible to the participants, the speech backgrounds in Italian
produced linguistic interference of high level like those generated in French, with the target
words produced in the native language to the participants or in their second language.
Key-words: speech-in-speech comprehension, multilingual, fluctuating noise, linguistic
interference of high level, lexical decision task, lexical access, second language.
Table des matières
4
TABLE DES MATIERES
REMERCIEMENTS .................................................................................................................. 1
RESUME .................................................................................................................................... 2
ABSTRACT ............................................................................................................................... 3
TABLE DES MATIERES ......................................................................................................... 4
PREAMBULE ............................................................................................................................ 7
PARTIE THEORIQUE ............................................................................................................ 10
A) LES MODELES DE TRAITEMENT DU LANGAGE PARLE .................................. 12
1. Le modèle de la Cohorte ............................................................................................ 12
1.1. Cohort I (Marslen-Wilson & Welsh, 1978) ....................................................... 12
1.2. Cohort II (Marslen-Wilson, 1987, 1990) ........................................................... 13
2. Le modèle TRACE (McClelland & Elman, 1986) .................................................... 14
3. Le modèle Short List (Norris, 1994) ......................................................................... 16
4. Le modèle NAM (Luce, Pisoni & Goldinger, 1990) ................................................. 17
5. Conclusions ............................................................................................................... 18
B) LA SITUATION DE LA PAROLE DANS LA PAROLE ........................................... 20
1. Deux types d’effets de masque .................................................................................. 20
1.1. Définition de l’effet de masque énergétique ...................................................... 20
1.2. Définition de l’effet de masque informationnel ................................................. 21
2. Ségrégation des signaux concurrents ......................................................................... 21
2.1. Rapport Signal sur Bruit (RSB) ......................................................................... 21
2.2. Nombre de locuteurs dans le masqueur .............................................................. 22
2.3. Fréquence fondamentale (F0) ............................................................................. 25
2.4. Localisation spatiale ........................................................................................... 28
3. Effet de masque informationnel ................................................................................ 30
3.1. Manipuler la nature des masqueurs .................................................................... 30
3.1.1. Bruit stationnaire ......................................................................................... 30
3.1.2. Bruit fluctuant ............................................................................................. 31
3.2. Manipuler le style parolier des masqueurs ......................................................... 36
3.3. Manipuler la langue des masqueurs ................................................................... 38
4. Interférences linguistiques ......................................................................................... 41
Table des matières
5
4.1. Interférences lexicales ........................................................................................ 41
4.2. Interférences sémantiques .................................................................................. 42
C) INTELLIGIBILITE DE LA PAROLE DANS UNE LANGUE SECONDE ............... 44
1. Intelligibilité d’une L2 dans le silence ...................................................................... 44
1.1. Difficulté à différencier certains sons ................................................................ 44
1.2. Plus de compétiteurs ........................................................................................... 46
2. Intelligibilité d’une L2 dans le bruit .......................................................................... 49
2.1. Plus difficile dans une L2 que dans une langue native ...................................... 49
2.2. Masqueurs paroliers dans une L2 versus dans une langue native ...................... 52
D) SYNTHESE ET PROBLEMATIQUE GENERALE .................................................... 56
1. Synthèse ..................................................................................................................... 56
2. Problématique ............................................................................................................ 57
PARTIE EXPERIMENTALE .................................................................................................. 60
E) EXPERIENCE 1 ........................................................................................................... 62
1. Objectifs ..................................................................................................................... 62
2. Méthode ..................................................................................................................... 64
3. Résultats ..................................................................................................................... 69
4. Discussion .................................................................................................................. 72
F) EXPERIENCE 2 ........................................................................................................... 80
1. Objectifs ..................................................................................................................... 80
2. Méthode ..................................................................................................................... 82
3. Résultats ..................................................................................................................... 86
4. Discussion .................................................................................................................. 88
G) EXPERIENCE 3 ........................................................................................................... 95
1. Objectifs ..................................................................................................................... 95
2. Méthode ..................................................................................................................... 95
3. Résultats ..................................................................................................................... 98
4. Discussion ................................................................................................................ 102
H) EXPERIENCE 4 ......................................................................................................... 109
1. Objectifs ................................................................................................................... 109
2. Méthode ................................................................................................................... 109
3. Résultats ................................................................................................................... 111
4. Discussion ................................................................................................................ 114
Table des matières
6
I) BILAN DES EXPERIENCES 1, 2, 3 & 4 .................................................................. 118
J) EXPERIENCE 5 ......................................................................................................... 123
1. Objectifs ................................................................................................................... 123
2. Méthode ................................................................................................................... 124
3. Résultats ................................................................................................................... 125
4. Discussion ................................................................................................................ 128
5. Comparaison des Expériences 3 & 5 ....................................................................... 133
K) EXPERIENCE 6 ......................................................................................................... 139
1. Objectifs ................................................................................................................... 139
2. Méthode ................................................................................................................... 140
3. Résultats ................................................................................................................... 141
4. Discussion ................................................................................................................ 145
5. Comparaison des Expériences 5 & 6 ....................................................................... 150
DISCUSSION GENERALE .................................................................................................. 156
CONCLUSION ...................................................................................................................... 170
REFERENCES ....................................................................................................................... 171
ANNEXES ............................................................................................................................. 181
ANNEXE 1 : Matériel expérimental de l’Expérience 1 ..................................................... 182
ANNEXE 2 : Matériel expérimental de l’Expérience 2 ..................................................... 183
ANNEXE 3 : Matériel expérimental des Expériences 3 à 6 ............................................... 184
ANNEXE 4 : Matériel expérimental des Expériences 3 à 6 (suite) ................................... 185
ANNEXE 5 : Liste des Tableaux ....................................................................................... 186
ANNEXE 6 : Liste des Figures .......................................................................................... 188
Préambule
7
PREAMBULE
La compréhension de la parole est une tâche naturelle et nous la réalisons de façon
automatique ; cependant, elle reste complexe. D’une part, le signal de parole est caractérisé
par une grande variabilité. Il peut être produit dans une même langue avec des accents
régionaux différents, il peut aussi être produit avec un débit plus ou moins rapide ; enfin, des
erreurs de prononciation peuvent être commises. D’autre part, la parole est rarement perçue
dans des conditions optimales puisque du bruit environnant est souvent présent, réduisant
ainsi l’intelligibilité du message cible. Ce bruit concurrent peut être d’origine purement
acoustique lorsqu’il s’agit par exemple de bruits de la rue, il peut aussi être porteur
d’informations linguistiques et acoustiques, notamment lorsqu’une discussion a lieu à
proximité. Dans ce travail de thèse, nous nous intéresserons à la compréhension de la parole
lorsque cette dernière sera présentée simultanément avec un autre bruit de parole.
La situation de la parole dans la parole a souvent été utilisée afin d’étudier les
phénomènes de ségrégation entre les signaux de parole en compétition. Dans cette thèse, c’est
sous un autre angle que nous nous sommes intéressés à cette situation d’écoute ; nous avons
décidé d’examiner les interférences produites par la parole concurrente sur l’intelligibilité de
la parole cible. Lorsque la ségrégation entre les signaux de parole concurrents est ardue, il
arrive que les informations acoustiques et linguistiques présentes dans la parole concurrente
perturbent la compréhension du message cible. La parole concurrente produit alors deux types
d’interférences : des interférences acoustiques et des interférences linguistiques. Nous nous
focaliserons en particulier sur les interférences linguistiques.
Lorsque l’auditeur tente d’identifier un message cible, les informations linguistiques de la
parole concurrente ne sont pas pertinentes. Par conséquent, elles vont interférer sur
l’intelligibilité du message cible dans la mesure où elles vont être traitées en même temps que
les informations linguistiques de la parole cible.
L’identification d’un signal de parole correspond à l’appariement de ce dernier aux
représentations de mots stockés en mémoire. Les modèles psycholinguistiques du traitement
du langage parlé, élaborés sur la base de résultats obtenus dans le silence, postulent que
l’identification d’un signal de parole résulte de compétitions entre différentes unités
linguistiques. Ainsi, dans la situation de la parole dans la parole, lorsque le message cible et la
Préambule
8
parole concurrente sont perçues, il est possible que des compétitions linguistiques aient lieu
pendant le processus d’identification de chacun des signaux (message cible et parole
concurrente).
Quelques études s’intéressent aux compétitions linguistiques entre les signaux de
parole concurrents et cherchent à identifier quels types d’unités linguistiques interfèrent avec
l’identification de la parole cible. Jusqu’à présent, des interférences au niveau lexical ont été
mises en évidence en manipulant la langue de la parole concurrente (Van Engen & Bradlow,
2007). Cette dernière correspond à la langue native des participants ou à une langue qui leur
est inconnue et donc non intelligible. Lorsque la parole concurrente est produite dans la
langue native, les mots qui la composent sont intelligibles, ils sont identifiés et confondus
avec les mots du message cible. Dans cette thèse, nous manipulerons la langue de la parole
concurrente afin de déterminer si des compétitions au niveau phonémique ont lieu.
Organisation de la partie théorique
La partie théorique sera composée de trois parties. Dans la première partie, nous
commencerons par présenter certains modèles psycholinguistiques du traitement du langage
parlé. Nous observerons de quelles façons ces modèles envisagent les compétitions entre les
différentes unités linguistiques. Dans la seconde partie, nous présenterons des travaux
existants sur la situation de la parole dans la parole. Nous ferons un point des connaissances
actuelles sur cette situation d’écoute et nous verrons que plusieurs paramètres peuvent être
manipulés afin de mieux la cerner. Enfin, dans la dernière partie, nous nous intéresserons à la
situation spécifique de la parole dans la parole lorsque le message cible est produit dans une
L2 plutôt que dans une langue native.
Organisation de la partie expérimentale
Dans la partie expérimentale, nous présenterons six expériences menées au cours de la
thèse. Pour chacune d’elles, il était question d’explorer les interférences linguistiques
produites par la parole concurrente et de déterminer dans quelle situation d’écoute elles sont
les plus efficaces. Dans l’Expérience 1, nous avons pris pour base le paradigme expérimental
développé dans l’étude de Van Engen & Bradlow (2007), la parole concurrente était produite
Préambule
9
dans la langue native des participants, comme le signal cible, ou dans une langue inconnue. Il
s’agissait de répliquer les résultats de cette étude avec de la parole cible produite en français
plutôt qu’en anglais. Dans les Expériences 2 à 4, nos objectifs étaient d’une part d’optimiser
le paradigme expérimental utilisé afin d’explorer la situation de la parole dans la parole, et
d’autre part, de repérer si les phonèmes présents dans les signaux de parole concurrents
entrent en compétition. Dans les Expériences 5 & 6, nous avons fait varier le niveau de
connaissances des participants pour la langue de la parole concurrente. Nous avons utilisé la
langue native des participants et leur langue seconde (L2) en tant que langues intelligibles.
L’Expérience 6 nous a également permis d’étudier la situation de la parole dans la parole
lorsque le message cible est produit dans une L2.
10
PARTIE THEORIQUE
11
Partie théorique Les modèles de traitement du langage parlé
12
A) LES MODELES DE TRAITEMENT DU LANGAGE PARLE
La compréhension du langage parlé résulte de la reconnaissance presque immédiate
des mots ; celle-ci étant décrite comme un appariement entre le signal de parole qui est perçu
et les représentations linguistiques stockées en mémoire. Au cours de cet appariement, des
compétitions entre des unités linguistiques ont lieu ; celles-ci sont décrites dans plusieurs
modèles psycholinguistiques qui rendent compte de la reconnaissance du langage parlé dans
le silence. Dans cette partie, nous présenterons le modèle de la Cohorte dans sa version
originale (Marslen-Wilson & Welsh, 1978) et sa version révisée (Marslen-Wilson, 1987,
1990), ainsi que les modèles TRACE (McClelland & Elman, 1986), Short List (Norris, 1994)
et NAM (Luce, Pisoni & Goldinger, 1990). Nous retrouverons un point commun entre les
modèles, tous postulent qu’à la présentation d’un signal de parole, deux opérations de base se
mettent en place : l’activation de candidats lexicaux compatibles avec le signal de parole, puis
la sélection du candidat qui s’apparie le mieux avec l’information du signal. Nous nous
intéresserons à la façon dont chacun d’eux envisage les compétitions entre les unités
linguistiques. Ceci attirera particulièrement notre attention puisque dans cette thèse, nous
examinerons les compétitions linguistiques pendant la compréhension de la parole dans la
parole, c’est-à-dire dans une situation où le signal de parole n’est pas présenté dans le silence
mais simultanément avec d’autres signaux de parole.
1. Le modèle de la Cohorte
1.1. Cohort I (Marslen-Wilson & Welsh, 1978)
Le modèle de la Cohorte version I, aussi appelé « Active Direct Access Model », est le
premier modèle spécifique au traitement du langage parlé. L’unité linguistique intermédiaire
entre le signal de parole et les entrées lexicales est le phonème. Ce modèle accorde un statut
privilégié au début des mots, en ce sens qu’il considère que seule l’information portée par les
premiers phonèmes du signal de parole va entraîner l’activation des candidats lexicaux. De
plus, Cohort I met l’accent sur le déroulement temporel de l’accès au lexique ; le signal de
parole est analysé de façon séquentielle et continue, c’est-à-dire au fur et à mesure qu’il arrive
au système perceptif. Ce modèle propose que l’identification d’un mot se déroule en deux
Partie théorique Les modèles de traitement du langage parlé
13
phases : la phase de contact et la phase de sélection. A l’apparition d’un signal de parole, le
premier phonème de ce signal est traité. Un ensemble de candidats lexicaux commençant par
ce phonème va alors être activé pour former la « cohorte ». Ne peuvent avoir le statut de
candidats lexicaux que les mots qui s’apparient parfaitement avec le premier phonème du
signal ; le modèle ne tolère aucune déviation du signal de parole. Puis, au fur et à mesure de la
progression du signal, les candidats qui ne sont plus compatibles au signal vont être éliminés,
la « cohorte » va ainsi se réduire jusqu’à ce qu’il ne reste plus qu’un seul candidat. Cette
phase de sélection s’effectue ainsi par un processus bottom-up, de bas en haut, c’est
l’information entrante (informations sensorielles) qui désactive les candidats lexicaux.
Lorsqu’il ne reste plus qu’un seul candidat, on parle du point de reconnaissance du mot, ou
point d’unicité. Celui-ci peut se situer avant la fin du signal de parole. Par exemple, la
séquence de phonèmes /kroko/ est suffisante pour identifier le mot « crocodile », en effet dans
la langue française, il n’y a pas d’autre mot commençant par cette séquence de phonèmes.
Ainsi, ce modèle postule que les mots peuvent être reconnus dès que l’information acoustico-
phonétique est suffisante.
Diverses critiques ont été apportées à ce modèle. Tout d’abord, Cohort I postule que le
nombre de candidats dans la « cohorte » ainsi que leur fréquence d’occurrence n’affecteraient
pas la reconnaissance du mot. Cependant, il a été mis en évidence qu’un mot fréquent était
plus rapidement reconnu qu’un mot peu fréquent (Taft & Hambly, 1986). Une autre critique
concerne les mots dont le premier phonème est incorrectement prononcé. Ce modèle ne leur
permet pas d’être sélectionnés pour faire partie de la « cohorte », ils ne peuvent alors pas être
reconnus. Une version révisée de ce modèle, Cohort II, a été proposée par Marslen-Wilson en
1987.
1.2. Cohort II (Marslen-Wilson, 1987, 1990)
Dans cette version révisée du modèle de la Cohorte, Marslen-Wilson (1987, 1990)
propose que ce ne soit plus le phonème qui représente la base de l’appariement entre le signal
de parole et les entrées lexicales, mais les traits phonétiques (niveau inférieur). L’appariement
entre le signal de parole et les entrées lexicales n’a alors plus besoin d’être parfait ; malgré
une erreur de prononciation, un mot va pouvoir être reconnu. Les mots dont les premiers
phonèmes sont voisins de ceux du mot à reconnaître vont également faire partie de la
« cohorte » ; ainsi « chigarette » va pouvoir être identifié comme « cigarette ». Dans Cohort
Partie théorique Les modèles de traitement du langage parlé
14
II, un niveau d’activation est attribué à chaque candidat présent dans la « cohorte ». Ce niveau
d’activation dépendra du degré d’appariement du candidat avec le signal de parole. Un
candidat est sélectionné lorsque son niveau d’activation dépasse d’une différence critique
celui des candidats concurrents. Cohort II intègre également la notion de fréquence
d’occurrence des candidats lexicaux, celle-ci va influencer le niveau d’activation des
candidats. Plus précisément, la fréquence d’occurrence va influencer le temps nécessaire pour
que le signal de parole soit reconnu (mot cible). Dufour & Frauenfelder (2007) expliquent que
lorsque le mot cible possède un compétiteur de plus haute fréquence, le niveau d’activation de
ce dernier est plus élevé. Lorsque les informations sensorielles sont suffisantes pour identifier
le mot cible, il faudra plus de temps pour que le niveau d’activation du mot cible dépasse
d’une valeur significative celui du compétiteur.
Dans Cohort II, les principes fondamentaux du modèle de la Cohorte sont préservés. En effet,
le signal acoustique est analysé de façon séquentielle et continue, la « cohorte » est formée sur
la base des informations sensorielles. Les compétitions lexicales sont engendrées par un
processus d’inhibition bottom-up, il n’y a pas de confrontation directe entre les candidats
lexicaux. Dans la version révisée du modèle, l’unité de base devient le trait phonétique, la
notion de niveau d’activation est intégrée ainsi que le paramètre de fréquence d’occurrence
des candidats lexicaux.
2. Le modèle TRACE (McClelland & Elman, 1986)
Le modèle TRACE est un modèle connexionniste basé sur le principe d’activation
interactive proposé par McClelland et Rumelhart (1981) dans le domaine de la reconnaissance
visuelle des mots. TRACE comporte trois niveaux successifs représentant trois types
d’unités : les traits phonétiques, les phonèmes et les mots. Les traits phonétiques et les
phonèmes sont donc les unités intermédiaires entre le signal de parole et les entrées lexicales.
Les unités sont organisées hiérarchiquement et le flux d’informations circule à la fois de façon
ascendante et de façon descendante ; le modèle est ainsi entièrement dynamique et interactif.
Ces unités sont également interconnectées, par des connexions facilitatrices entre les niveaux
ainsi que par des connexions inhibitrices à l’intérieur d’un même niveau (voir Figure 1).
Partie théorique Les modèles de traitement du langage parlé
15
Figure 1 : Représentation schématique du modèle TRACE (McClelland & Elman, 1986).
(Extraite de Frauenfelder, 1996).
Comme dans le modèle de la Cohorte, le signal de parole est traité de façon continue.
En revanche, alors que le modèle de la Cohorte postule que les candidats lexicaux ne sont
activés que par le début du signal de parole, TRACE ne privilégie aucune portion du signal,
les candidats lexicaux sont activés à chaque portion du signal perçue. TRACE prend ainsi en
compte le fait que dans le langage parlé, les frontières entre les mots ne sont pas saillantes.
Dans ce modèle, le nombre de candidats activés est alors plus important ; des candidats qui ne
débutent pas comme le signal de parole peuvent être activés, par exemple pour le mot cible
« coulisse », le mot « lisse » sera un candidat.
Lorsque le signal de parole est perçu, un processus ascendant s’opère, les traits phonétiques
sont analysés et vont activer les phonèmes qui les contiennent. L’activation d’un phonème
entraîne à son tour l’activation de tous les mots qui comportent ce phonème. Un processus
descendant a également lieu, les mots vont renforcer le niveau d’activation des phonèmes, ces
derniers renforçant eux-mêmes le niveau d’activation des traits phonétiques. A chaque fois
qu’une nouvelle portion du signal est perçue, le processus ascendant recommence, de
Partie théorique Les modèles de traitement du langage parlé
16
nouveaux candidats lexicaux sont activés. Prenons l’exemple du mot « bateau ». Le phonème
[b] va activer tous les mots qui contiennent ce phonème quelque soit sa place dans le mot.
Lorsque le phonème [a] est ensuite activé, les mots qui contiennent le phonème [b] restent
activés, les mots qui contiennent le phonème [a] sont activés à leur tour. Mais les mots qui
contiennent les phonèmes [b] et [a] à la suite auront le niveau d’activation le plus élevé. C’est
par un processus d’inhibition latérale que les mots activés entrent en compétition. Les mots
les plus activés inhibent plus fortement les autres candidats. Un mot sera reconnu lorsque son
niveau d’activation est suffisamment supérieur à celui des autres mots en compétition.
Dans ce modèle, des candidats lexicaux peuvent être activés en tout point du signal de parole.
De plus, les compétitions entre les candidats lexicaux sont directes. Une critique faite au
modèle TRACE concerne le nombre de candidats lexicaux activés. Il semble coûteux de
devoir gérer instantanément une si grande quantité de candidats.
3. Le modèle Short List (Norris, 1994)
Le modèle Short List postule que l’identification des mots résulte de deux
étapes distinctes : une première étape de sélection des candidats lexicaux, inspirée du modèle
de la Cohorte ; et une seconde étape inspirée du modèle TRACE, dans laquelle les candidats
lexicaux entrent en compétition. Dans Short List, l’unité intermédiaire entre le signal de
parole et les entrées lexicales est le phonème. Lors de la première étape, les phonèmes perçus
vont activer des candidats lexicaux dont le nombre sera limité puisque seuls les mots
compatibles avec l’information sensorielle seront sélectionnés ; on parle alors d’une petite
liste de candidats : la « Short List ». Plus précisément, à chaque phonème, un score
d’ajustement entre le candidat lexical et le signal de parole va s’opérer. Un bon appariement
sera codé positivement (+ 1) et un défaut d’appariement sera codé négativement (- 3). Les
auteurs ont fourni l’exemple suivant : pour le signal d’entrée /k/ /a/ /t/, les mots « cat » et
« catalog » obtiennent un score identique (+ 1 + 1 + 1) = + 3 ; du fait de leur défaut
d’appariement sur le troisième phonème, les mots « cap » et « captain » quant à eux auront un
score plus faible de (+ 1 + 1 - 3) = - 1. Nous retrouvons le processus d’inhibition bottom-up
proposé par le modèle de la Cohorte ; c’est l’information entrante qui influence le devenir du
candidat lexical. De plus, ce score d’ajustement permet à Short List de tenir compte des
erreurs de prononciation.
Partie théorique Les modèles de traitement du langage parlé
17
Dans la seconde étape, les candidats de la « Short List » vont s’inhiber entre eux ; c’est l’étape
des compétitions lexicales. Nous retrouvons des inhibitions latérales comme dans le modèle
TRACE. Celles-ci seront les plus fortes entre les mots ayant obtenu les scores d’ajustement
les plus élevés, c’est-à-dire entre les mots qui ont le plus de phonèmes en commun.
Dans Short List, des candidats lexicaux sont activés à chaque nouvelle information entrante.
Le processus d’inhibition bottom-up et le calcul d’ajustement permettent à ce modèle de
contrôler le nombre de candidats lexicaux activés et de pallier ainsi au problème du modèle
TRACE. Des inhibitions latérales permettent au mot cible d’être reconnu.
4. Le modèle NAM (Luce, Pisoni & Goldinger, 1990)
Le modèle NAM inclut, comme le modèle TRACE, des mots qui ne débutent pas
comme le signal de parole. En effet, dans le modèle « Neighborhood Activation Model », soit
« modèle à activation du voisinage », tous les mots proches de l’item cible (voisins) vont être
activés. On entend par voisins, tous les mots qui peuvent être obtenus par addition, délétion,
ou substitution d’un phonème, autrement dit tous les mots similaires au mot cible à un
phonème près quelque soit sa place dans le mot. De plus, dans NAM, la fréquence
d’occurrence de chaque voisin est prise en compte.
L’identification du mot cible résulte d’un calcul de probabilités influencé par le nombre de
voisins et leur fréquence. Plus précisément, des valeurs décisionnelles vont être calculées par
des unités de décision propre à chaque candidat ; ces unités de décision étant renseignées par
des informations issues de trois sources : 1) des informations provenant de patterns acoustico-
phonétiques ; 2) des informations lexicales ; 3) des informations concernant le niveau général
d’activité de l’ensemble du système de décision. Concernant les patterns acoustico-
phonétiques, ils sont stockés en mémoire à long terme et sont activés lorsqu’ils sont
compatibles avec le signal de parole, et ce dès la présentation de ce dernier. Il s’agit d’une
étape pré-lexicale du traitement de la parole. Ces patterns acoustico-phonétiques activent les
unités de décision de manière directe. Quant aux informations lexicales, elles renseignent sur
la fréquence des mots et permettent d’ajuster le niveau d’activation des unités de décision. La
fréquence des mots n’a pas d’effet pendant l’étape pré-lexicale mais une fois que les patterns
acoustico-phonétiques auront activé l’ensemble des compétiteurs. La valeur décisionnelle
attribuée à chaque compétiteur va être réajustée par les unités de décision au fur et à mesure
du déroulement du signal de parole. Un mot sera reconnu lorsque son poids (valeur) dépasse
Partie théorique Les modèles de traitement du langage parlé
18
le poids des autres compétiteurs d’une valeur critique, il est alors placé en mémoire à court
terme. Le modèle NAM propose ainsi un calcul de probabilités afin d’identifier le mot cible.
Il n’y a pas de confrontation directe entre les candidats lexicaux, les compétitions lexicales ne
sont pas issues d’un processus d’inhibitions latérales.
5. Conclusions
Les modèles présentés proposent que les compétitions entre les candidats lexicaux
soient engendrées par un processus d’inhibition bottom-up et/ou par des inhibitions latérales
entre les candidats. Avec le processus d’inhibition bottom-up, seule l’information sensorielle
gère les compétitions lexicales ; elle désactive directement les candidats lexicaux qui ne sont
plus compatibles avec l’information du signal (Cohort I), ou elle influence le niveau
d’activation (Cohort II) ou le score d’ajustement attribué à chaque candidat (Short List).
Lorsque des inhibitions latérales sont impliquées, les candidats s’affrontent directement entre
eux (TRACE). Le modèle Short List combine les inhibitions bottom-up et les inhibitions
latérales.
D’autres différences entre les modèles sont observées, notamment en ce qui concerne la partie
du signal de parole qui génère l’activation des candidats lexicaux. Pour le modèle de la
Cohorte, dans sa version originale et sa version révisée, seule l’information portée par le
début du signal peut activer les candidats lexicaux. Les autres modèles ne privilégient aucune
portion du signal de parole, les candidats peuvent être activés en tout point du signal.
Les modèles postulent également que le signal de parole n’est pas apparié aux représentations
lexicales stockées en mémoire de façon directe, des unités sous lexicales serviraient
d’intermédiaires. La nature de ces unités varie selon les modèles, il peut s’agir de patterns
acoustico-phonétiques (NAM), des traits phonétiques (Cohort II) ou des phonèmes (Cohort I,
TRACE, Short List). Les principales caractéristiques des modèles que nous avons décrits sont
résumées dans le Tableau 1 ci-dessous.
Partie théorique Les modèles de traitement du langage parlé
19
Tableau 1 : Principales caractéristiques des modèles psycholinguistiques présentés.
Modèle Unité intermédiaire Importance du
début du signal
Diffusion de
l’activation
Inhibitions
latérales
Cohort I phonème oui ascendante non
Cohort II trait phonétique oui ascendante non
TRACE phonème non ascendante et
descendante oui
Short List phonème non ascendante oui
NAM patterns acoustico-
phonétiques non ascendante non
Ces modèles ont envisagé la reconnaissance de la parole et les compétitions
linguistiques qui ont lieu pendant cette tâche dans une situation d’écoute où l’auditeur perçoit
la parole dans le silence, sans prendre en considération le fait qu’en situation d’écoute
écologique, la parole est souvent perçue simultanément avec d’autres signaux sonores. Dans
cette thèse, nous nous intéresserons à la situation dans laquelle l’auditeur est gêné par du bruit
concurrent lorsqu’il percevra des signaux de parole. Plus précisément, nous étudierons la
situation de la parole dans la parole. Cette situation d’écoute semble être pertinente en
psycholinguistique puisque des compétitions linguistiques seront générées lorsque le message
cible sera identifié alors même que la parole concurrente sera traitée. Les compétitions
linguistiques issues du traitement de la parole concurrente vont interférer sur les processus
d’identification de la parole cible.
Partie théorique La situation de la parole dans la parole
20
B) LA SITUATION DE LA PAROLE DANS LA PAROLE
Il n’est pas rare qu’en situation naturelle, le langage parlé soit bruité par des sons
environnementaux comme une discussion voisine (au restaurant, dans un amphithéâtre…),
une télévision ou une radio qui fonctionne à proximité, ou encore les bruits de la rue. Ces sons
concurrents affectent la compréhension de la parole. La difficulté à comprendre la parole cible
ne sera pas la même que les sons concurrents proviennent d’un bruit de parole ou qu’ils
proviennent d’un bruit purement acoustique. Ce travail de thèse porte un intérêt particulier à
la compréhension de la parole cible dégradée par de la parole. Il semblerait que les
informations linguistiques présentes dans la parole du bruit de fond gênent la compréhension
du message transmis. Nous chercherons à identifier les propriétés linguistiques qui perturbent
la parole cible et nous nous intéresserons donc à la situation de la parole dans la parole.
Cherry (1953) fut le premier à décrire le phénomène « Cocktail Party ». Le bruit
Cocktail Party est composé de la parole cible à laquelle sont ajoutés un ou plusieurs autres
signaux de parole. Nous appelons « masqueur » l’ensemble de ces signaux concurrents. Le
masqueur dégrade le message de la parole cible. Le phénomène « Cocktail Party » renvoie à
une capacité à extraire et à comprendre un signal de parole cible parmi d’autres signaux
concurrents. Dans la situation de la parole dans la parole, deux types d’effets de masque sont
produits par le signal de parole concurrent : un effet de masque énergétique et un effet de
masque informationnel. (Pollack, 1975 ; Bronkhorst, 2000 ; Brungart, 2001 ; Brungart,
Chang, Simpson & Wang, 2006 ; Darwin, 2008).
1. Deux types d’effets de masque
1.1. Définition de l’effet de masque énergétique
Le masque énergétique intervient dès lors qu’un bruit concurrent, qu’il soit parolier ou
purement acoustique, est produit en présence de la parole cible. Les informations spectro-
temporelles du bruit concurrent se superposent au moins partiellement à celles de la parole
cible en temps et en fréquence. Le masque énergétique se produit à un niveau périphérique,
dès la cochlée.
Partie théorique La situation de la parole dans la parole
21
1.2. Définition de l’effet de masque informationnel
On parle d’effet de masque informationnel lorsque la parole cible est dégradée par un
bruit concurrent de même nature. Autrement dit, ce type d’effet de masque est propre à la
situation de la parole dans la parole. Les informations linguistiques contenues dans la parole
concurrente vont interférer sur l’intelligibilité de la parole cible ; car même si elles ne sont pas
pertinentes pour l’auditeur, elles vont être traitées automatiquement et simultanément avec les
informations linguistiques de la parole cible qui elles, sont pertinentes. Des interférences entre
ces différentes informations linguistiques sont ainsi produites. Le masque informationnel
intervient au niveau du système auditif central.
2. Ségrégation des signaux concurrents
Une meilleure intelligibilité du message cible est constatée lorsque la ségrégation entre
la parole cible et la parole concurrente est facilitée. Nous allons voir que le Rapport Signal sur
Bruit fixé entre la parole cible et la parole concurrente ainsi que le nombre de locuteurs
présents dans le bruit de fond sont des facteurs qui influencent la ségrégation entre les deux
flux de parole concurrents. De même, les auditeurs peuvent s’appuyer sur certaines
caractéristiques vocales des voix cibles et concurrentes, telles que leur fréquence
fondamentale (F0), et s’aider de la localisation spatiale des signaux concurrents pour extraire
plus facilement le message cible du bruit de fond.
2.1. Rapport Signal sur Bruit (RSB)
Le Rapport Signal sur Bruit (RSB) correspond au rapport entre le niveau sonore de la
parole cible et le niveau sonore de la parole du masqueur. Il est exprimé en Décibels.
L’intelligibilité de la parole cible est influencée par le RSB fixé entre les deux flux de parole
concurrents. Il est plus facile d’extraire la parole cible du bruit de fond lorsqu’elle est produite
à un niveau sonore plus élevé que celui du bruit de fond. Plus le RSB entre le parole cible et le
masqueur diminue, plus l’intelligibilité de la parole cible est réduite.
Par exemple, Hoen et al. (2007) ont réalisé une tâche d’intelligibilité avec des mots
cibles qui ont été insérés dans des masqueurs paroliers avec les valeurs de RSB suivantes : +6,
+3, 0 ou -3 dB. Les masqueurs paroliers étaient composés de 4, 6 ou 8 locuteurs. Les auteurs
Partie théorique La situation de la parole dans la parole
22
ont observé que la difficulté à récupérer le message cible a augmenté progressivement avec la
diminution du RSB.
Brungart (2001) a exploré l’effet du RSB sur l’intelligibilité de phrases cibles lorsque
celles-ci étaient dégradées par deux types de masqueurs : des masqueurs paroliers à 1 locuteur
unique et des masqueurs de bruit modulé. L’auteur a comparé les performances des
participants pour une gamme de RSB allant +15 dB à -12 dB. Concernant le locuteur des
masqueurs paroliers, il pouvait s’agir de la même personne que le locuteur cible, ou d’une
personne différente qui était de même sexe ou de sexe différent que le locuteur cible. Les
masqueurs de bruit modulé ne produisent qu’un effet de masque énergétique alors que les
masqueurs paroliers produisent un effet de masque informationnel en plus d’un effet de
masque énergétique. Brungart a observé une diminution de l’intelligibilité des phrases cibles
avec la diminution du RSB ; elle n’a pas été identique selon que les masqueurs ont produit
uniquement un effet de masque énergétique (masqueurs de bruit modulé) ou un effet de
masque informationnel en plus d’un effet de masque énergétique (masqueurs paroliers).
Concernant les masqueurs de bruit modulé, les performances des participants n’ont pas été
affectées de +15 dB à -3 dB, puis elles ont diminué de façon linéaire de -3 dB jusqu’à -12 dB.
Pour les masqueurs paroliers, des résultats différents ont été mis en évidence. Lorsque le
locuteur du masqueur était identique au locuteur cible ou de même sexe, un pattern de
résultats identiques a été obtenu. Les performances sont restées très élevées de +15 dB à +9
dB, puis elles ont chuté rapidement de façon linéaire de +9 dB à 0 dB. De 0 dB à -12 dB elles
se sont stabilisées. Toutefois, les performances étaient plus faibles lorsque le locuteur cible et
le locuteur du masqueur était la même personne. Lorsque le locuteur du masqueur était de
sexe différent, les performances n’ont chuté que de 20% de +15 dB à -12 dB, cette diminution
était progressive sur l’ensemble de la gamme de RSB. Ainsi dans cette étude, Brungart a mis
en évidence l’effet du RSB sur l’intelligibilité de la parole cible. A partir de -3 dB l’effet de
masque énergétique était présent (masqueurs de bruit modulé) ; les performances ont ensuite
diminué de façon monotone. Ceci n’a pas été le cas lorsqu’un effet de masque informationnel
était associé à un effet de masque énergétique (masqueurs paroliers).
2.2. Nombre de locuteurs dans le masqueur
Il a été mis en évidence que plus le nombre de locuteurs augmente, plus la
compréhension de la parole cible est difficile. Miller (1947) a mis au point la première étude
Partie théorique La situation de la parole dans la parole
23
faisant varier le nombre de locuteurs dans le bruit de fond. Cet auteur a évalué l’intelligibilité
de la parole cible en mesurant le SRT, « Speech Reception Threshold », qui correspond à la
valeur de RSB nécessaire pour que le pourcentage d’identifications correctes de mots cibles
atteigne 50%. Miller (1947) a observé une augmentation nécessaire du RSB avec
l’augmentation du nombre de locuteurs dans le masqueur. Cette augmentation a été constatée
de 1 à 2 locuteurs, puis de 2 à 4 locuteurs, ainsi que de 6 à 8 locuteurs. Le niveau sonore du
signal cible a dû être augmenté par rapport au niveau sonore du signal concurrent (RSB) avec
l’augmentation du nombre de locuteurs afin de maintenir les pourcentages d’identifications
correctes à 50%. L’augmentation du nombre de locuteurs a donc entraîné une dégradation du
message cible de plus en plus importante.
Simpson & Cooke (2005) ont eux aussi examiné l’effet du nombre de locuteurs dans le
masqueur sur l’intelligibilité de la parole cible. Ils ont mesuré les performances de
participants avec une tâche d’identification de consonnes cibles présentées dans un ensemble
de type VCV (Voyelle/Consonne/Voyelle). Ces consonnes étaient dégradées par deux types
de masqueurs : des masqueurs paroliers dont le nombre de locuteurs variait de 1 à 512, et des
masqueurs de bruit fluctuant. Ces derniers sont composés uniquement des informations
spectrales et temporelles des masqueurs paroliers, les informations linguistiques sont limitées.
La Figure 2 représente les résultats obtenus dans cette étude.
Partie théorique La situation de la parole dans la parole
24
Figure 2 : Pourcentages d’identifications correctes des consonnes cibles, pour les masqueurs
paroliers (« natural babble ») et les masqueurs de bruit fluctuant (« babble-modulated
noise »), en fonction du nombre de locuteurs. (Extraite de Simpson & Cooke, 2005).
Avec les masqueurs paroliers, les auteurs ont observé une diminution non linéaire des
performances avec l’augmentation du nombre de locuteurs. Plus précisément, les
performances ont chuté rapidement de 85% à 40% de 1 à 8 locuteurs, elles se sont ensuite
stabilisées de 8 à 128 locuteurs. Enfin, elles sont repassées à 50% pour 512 locuteurs. Avec
les masqueurs de bruit fluctuant (générés à partir des masqueurs paroliers), les performances
ont chuté rapidement de 85% à 55% de 1 à 6 locuteurs ; de 6 à 512 locuteurs, elles ont
diminué lentement pour arriver à 50% d’identifications correctes. Pour 512 locuteurs, les deux
types de masqueurs ont donc conduit au même pourcentage d’identifications correctes. C’est à
partir de 3 locuteurs qu’un écart de performances entre les deux types de masqueurs (parolier
et bruit fluctuant) a été observé. Cet écart étant le plus important avec 8 locuteurs dans les
masqueurs (18%), il serait expliqué par le fait que les masqueurs paroliers produisent un effet
de masque informationnel contrairement aux masqueurs de bruit fluctuant qui ne possèdent
pas d’informations linguistiques.
Pour ces deux types de masqueurs, les performances ont chuté avec l’augmentation du
nombre de locuteurs du fait d’une saturation spectro-temporelle du signal de plus en plus
importante. Le système auditif réussirait de moins en moins à réaliser une ségrégation des
Partie théorique La situation de la parole dans la parole
25
signaux concurrents avec l’augmentation du nombre de locuteurs dans le bruit de fond,
réduisant ainsi l’intelligibilité de la parole cible.
Les résultats de l’étude de Hoen et al. (2007) ont conforté l’idée d’une saturation
spectro-temporelle du signal avec l’augmentation du nombre de locuteurs dans le masqueur.
Dans leur étude, des mots cibles français ont été insérés dans des masqueurs paroliers
composés de 4, 6 ou 8 locuteurs. Les participants devaient effectuer une tâche d’intelligibilité
en rapportant les mots cibles. Les auteurs ont observé que les performances les plus faibles
ont été obtenues avec 4 locuteurs, suggérant que dans cette condition d’écoute, l’effet de
masque informationnel était le plus important. De plus, dans cette condition, et non pas avec 6
ou 8 locuteurs, certains mots présents dans les masqueurs paroliers ont été retranscrits à la
place des mots cibles, indiquant que même si chacun des 4 locuteurs ne peut être ni suivi ni
compris, certains mots du masqueur sont encore disponibles. En revanche dans cette
expérience, à partir de 6 locuteurs, la saturation spectro-temporelle du signal devient
prégnante (effet de masque énergétique grandissant). Les informations linguistiques présentes
dans le signal concurrent sont moins accessibles, l’effet de masque informationnel est donc
plus faible ; l’accès aux informations telle que la fréquence fondamentale des locuteurs (voir
paragraphe suivant) est également réduit, ce qui rend la ségrégation plus difficile. Dans le
même temps, on observe un lissage de l’enveloppe spectrale et temporelle du signal avec
l’augmentation du nombre de locuteurs dans le masqueur. Le système auditif ne peut alors
plus s’aider des fluctuations temporelles présentes dans les masqueurs pour extraire des
fragments du signal cible, ces fluctuations temporelles étant moins saillantes.
Dans le travail expérimental de cette thèse, nous tiendrons compte de ce phénomène
de saturation spectro-temporelle du signal. Nous utiliserons des masqueurs paroliers
composés de 4 locuteurs au plus, afin d’optimiser l’observation des interférences
linguistiques.
2.3. Fréquence fondamentale (F0)
La fréquence fondamentale (F0) correspond à la hauteur d’un son. Un son complexe
tel que la parole peut être décomposé en plusieurs sons élémentaires, appelés harmoniques,
dont les fréquences respectives sont des multiples de la F0 (loi de Fourier). Chaque personne
Partie théorique La situation de la parole dans la parole
26
possède sa propre valeur de F0 ; cependant, nous pouvons situer la F0 des femmes aux
alentours de 240 Hz et celle des hommes aux alentours de 120 Hz (Vaissière, 2006).
Dans la situation de la parole dans la parole, lorsque la F0 du locuteur de la parole
cible est différente de la F0 des locuteurs du bruit de fond, la ségrégation entre les deux flux
de parole est facilitée, ce qui améliore l’intelligibilité du message cible. Cet effet de la F0 a
été mis en évidence dans des études où le signal de parole concurrent est manipulé, soit en
rendant son contenu sémantique incongru (Brokx & Nooteboom, 1982) soit en lui supprimant
les informations lexicales et sémantiques (Gaudrain, 2008), mais aussi dans des études où le
signal de parole concurrent n’est pas modifié (Darwin, Brungart & Simpson, 2003). Nous
allons détailler les études de Brokx & Nooteboom (1982) et de Gaudrain (2008).
Brokx & Nooteboom (1982) ont élaboré une tâche d’intelligibilité de phrases cibles
allemandes dégradées par des masqueurs paroliers allemands à 1 locuteur. Les masqueurs
paroliers étaient composés de phrases sémantiquement incongrues. Le locuteur des masqueurs
paroliers et le locuteur des phrases cibles étaient la même personne ; cependant pour les
masqueurs paroliers, la F0 du locuteur était fixée à 100 Hz alors que pour les phrases cibles, la
F0 du locuteur était manipulée et pouvait prendre une des six valeurs de F0 suivantes : 100,
103, 106, 109, 120 ou 200 Hz. Le pourcentage de bonnes réponses était de 40% lorsque la F0
des phrases cibles et celle des masqueurs paroliers étaient équivalentes. Ce pourcentage de
bonnes réponses n’a cessé de s’améliorer au fur et à mesure que la F0 des phrases cibles a
augmenté, et il a atteint les 60% lorsque la F0 des phrases cibles était à 120 Hz (ce qui est
équivaut à 3 demi-tons). En revanche, pour une valeur de F0 à 200 Hz, les performances ont
chuté ; lorsque la valeur de F0 est double, une « fusion » des deux signaux s’opère et rend la
ségrégation à nouveau plus difficile.
Au cours de sa thèse, Gaudrain (2008) a observé des résultats similaires à l’aide d’une
tâche d’intelligibilité de mots cibles français monosyllabiques masqués par de la parole en
français inversée temporellement ; cette dernière étant dépourvue d’informations lexicales et
sémantiques. Les mots cibles et les masqueurs ont été produits par des locuteurs masculins
différents. La F0 des mots cibles est restée fixée à 100 Hz, seule la F0 des masqueurs a été
manipulée, elle était de 100, 134, 179 ou de 240 Hz. L’intelligibilité des mots cibles s’est
améliorée avec l’augmentation de la différence de F0 entre les mots cibles et les masqueurs de
parole inversée. Sans différence de F0 entre les signaux concurrents, le pourcentage de bonnes
réponses était de 50%, il est passé à plus de 60% lorsqu’un écart de 5 demi-tons (F0 des
Partie théorique La situation de la parole dans la parole
27
masqueurs à 134 Hz) était présent entre les mots cibles et les masqueurs. (Voir aussi Summers
& Leek, 1998.)
Les deux études que nous venons d’évoquer se sont intéressées à l’effet de la F0 des
locuteurs sur l’intelligibilité de la parole cible lorsque le signal concurrent était produit par un
locuteur unique. D’autres études ont utilisé des masqueurs paroliers composés de plus d’un
locuteur et ont montré que l’effet de la F0 (ségrégation plus facile lorsque la F0 de la cible et
celle du masqueur sont différentes plutôt qu’identiques) est réduit lorsque le nombre de
locuteurs dans le masqueur augmente. Par exemple dans leur paradigme, Brungart, Simpson,
Ericson & Scott (2001) ont manipulé le nombre de locuteurs dans le masqueur, le RSB entre
la parole cible et la parole concurrente ainsi que le genre des locuteurs. Les participants ont
réalisé une tâche d’intelligibilité sur des phrases cibles anglaises masquées par des masqueurs
paroliers anglais composés de 2 ou de 3 locuteurs. Dans un masqueur, tous les locuteurs
étaient de même sexe ; ils étaient de même sexe ou de sexe différent de celui du locuteur des
phrases cibles. Concernant le RSB, la gamme de valeurs suivante a été manipulée : de -12 dB
à +15 dB par pas de 3 dB. Les phrases cibles ainsi que les phrases utilisées pour générer les
masqueurs provenaient d’un corpus développé par Bolia, Nelson, Ericson & Simpson (2000).
Leur structure commune était la suivante : « Ready (call-sign)? Go to (color) (number) now »
; avec 8 indicatifs possibles (par exemple : Arrow, Baron, Charlie…), 4 couleurs (blue, green,
red, white) et 8 chiffres (de 1 à 8). Une phrase possible était « Ready Baron? Go to green
eight now ». Les participants étaient informés que la phrase cible commençait par « Ready
Baron? » et que les deux ou trois phrases des masqueurs débutaient avec un des 7 autres
indicatifs possibles. Les participants devaient sélectionner sur un écran d’ordinateur la couleur
et le numéro cités dans la phrase cible. Les auteurs ont comparé les résultats à ceux d’une
précédente étude de Brungart (2001) dans laquelle les mêmes phrases cibles étaient dégradées
par un locuteur unique (de même sexe ou de sexe différent de celui du locuteur des phrases
cibles). Les résultats de ces deux études ont permis d’observer que l’effet de la F0 a diminué
avec l’augmentation du nombre de locuteurs dans le masqueur pour les valeurs de RSB
extrêmes (les plus basses et les plus élevées). Plus le nombre de locuteurs a augmenté, moins
les participants ont pu prendre avantage de la différence de genre (différence de F0) entre le
locuteur du signal cible et les locuteurs des masqueurs paroliers. En effet, les caractéristiques
vocales des locuteurs sont de moins en moins accessibles avec l’augmentation du nombre de
Partie théorique La situation de la parole dans la parole
28
locuteurs. Les performances ont diminué, la ségrégation des flux concurrents étant plus
difficile.
Dans la partie expérimentale de cette thèse, afin de limiter les effets de ségrégation
entre les signaux concurrents, chaque locuteur aura sa propre valeur de F0. Nous utiliserons
des masqueurs paroliers à 2 voix féminines, dont les F0 seront proches de 205 Hz et de 225
Hz. Nous produirons également des masqueurs paroliers à 4 voix. Pour cela, nous utiliserons à
nouveau les 2 voix féminines dont les F0 sont proches de 205 Hz et de 225 Hz et nous
ajouterons 2 voix masculines avec des F0 proches de 105 Hz et de 125 Hz. La F0 de la voix
cible sera elle, à 240 Hz.
2.4. Localisation spatiale
La ségrégation entre la parole cible et la parole concurrente est facilitée lorsque ces
deux flux de parole concurrents sont séparés dans l’espace. Cet effet de la localisation spatiale
a été exploré en présentant aux participants le signal cible et le signal concurrent via un
casque auditif de façons dichotique, monaurale et spatialisée (Dole, Hoen & Meunier, 2012),
ou bien en présentant les signaux concurrents via un même haut-parleur ou via deux haut-
parleurs séparés par une distance angulaire différente (Kidd, Mason, Rohtla & Deliwala,
1998 ; Freyman, Helfer, McCall & Clifton, 1999).
Dans leur étude, Dole et al. (2012) ont demandé à des participants natifs du français de
réaliser une tâche d’intelligibilité sur des mots cibles français insérés dans des masqueurs
paroliers français composés de 4 locuteurs. Les stimuli étaient présentés aux participants via
un casque auditif. Trois conditions d’écoute ont été générées : dichotique, monaurale et
spatialisée. Dans la condition d’écoute dichotique, les mots cibles étaient présentés dans une
oreille à un niveau sonore fixé à 65 dB, et les masqueurs dans l’autre oreille à 45 dB. Dans
cette condition d’écoute, la séparation spatiale de la cible et du masqueur est maximale. Dans
la situation d’écoute monaurale, les mots cibles et les masqueurs sont présentés dans une seule
et même oreille à 65 dB. Enfin, dans la situation d’écoute spatialisée, les mots cibles étaient
présentés dans une seule oreille à 65 dB, et les masqueurs dans les deux oreilles, à 65 dB dans
l’oreille où les mots cibles étaient également présentés, à 45 dB dans l’autre oreille. Voir ci-
dessous la Figure 3 représentant les trois conditions d’écoute.
Partie théorique La situation de la parole dans la parole
29
Figure 3 : Figure illustrant les trois conditions d’écoute testées dans l’étude de Dole et al.
(2012) : monaurale, dichotique et spatialisée. (Extraite de Dole et al., 2012).
Les auteurs ont observé un effet de la localisation spatiale sur les pourcentages de
retranscriptions correctes des mots cibles français. En effet, les pourcentages de bonnes
réponses étaient de 98% dans la condition d’écoute dichotique, c’est-à-dire lorsque la
séparation spatiale entre les mots cibles et les masqueurs paroliers était maximale. Les
performances ont diminué dans la condition d’écoute spatialisée, avec 80% de retranscriptions
correctes. Les performances étaient les plus faibles dans la condition monaurale (70%)
lorsqu’aucun repère spatial n’était fourni aux participants. Dans cette condition d’écoute, la
ségrégation entre les signaux concurrents est plus difficile, ce qui réduit l’intelligibilité du
signal cible. Le système auditif doit alors s’aider d’autres indices que les indices spatiaux,
comme par exemple la fréquence fondamentale des voix des différents locuteurs.
Il a également été montré que cet effet de la localisation spatiale varie selon que le
masqueur produit ou pas un effet de masque informationnel. Dans l’étude de Kidd et al.
(1998), les participants devaient identifier non pas des stimuli paroliers comme cibles, mais
des tons. Deux types de bruits ont été utilisés comme masqueurs : du bruit à large bande, qui
ne produit qu’un effet de masque énergétique, ou des tons qui produisent un effet de masque
informationnel en plus d’un effet de masque énergétique puisque ces signaux sont de même
nature que les signaux cibles. Le signal cible était présenté via un haut-parleur situé en face
des participants. La localisation spatiale des masqueurs par rapport au signal cible variait de
0° à 180° (90° à droite, 90° à gauche). Les résultats ont révélé des performances
d’identification du signal cible plus élevées à mesure que la séparation spatiale augmentait.
Néanmoins, cet avantage était moindre lorsque les masqueurs ne produisaient qu’un effet de
masque énergétique (bruit à large bande) plutôt que lorsque les masqueurs produisaient en
plus un effet de masque informationnel (tons).
Partie théorique La situation de la parole dans la parole
30
Des résultats semblables ont été observés dans l’étude de Freyman et al. (1999) avec
des stimuli paroliers. Le signal cible correspondait à des phrases sémantiquement incongrues.
Il était dégradé par des masqueurs paroliers à 1 locuteur qui produisent des effets de masque
informationnel et énergétique, ou par des masqueurs de « speech-spectrum noise » dépourvus
d’informations linguistiques et qui ne produisent donc qu’un effet de masque énergétique. Ces
masqueurs étaient présentés via le même haut-parleur que le signal cible ou via un haut-
parleur situé 60° à droite. La séparation spatiale des signaux concurrents a entraîné une plus
forte amélioration des performances avec les masqueurs paroliers plutôt qu’avec les
masqueurs de « speech-spectrum noise ». L’avantage d’une séparation spatiale entre le signal
cible et le signal concurrent est plus important lorsque le signal concurrent produit un effet de
masque informationnel en plus d’un effet de masque énergétique (voir également Freyman,
Balakrishnan & Helfer, 2004).
Dans nos études, les participants seront équipés d’un casque auditif et une seule
situation d’écoute sera mise en place, tous les stimuli seront présentés de façon diotique.
Autrement dit, la cible et le masqueur seront présentés tous les deux dans les deux oreilles. En
ne testant que cette condition d’écoute, nous souhaitons nous affranchir d’un effet de la
localisation spatiale.
3. Effet de masque informationnel
Plusieurs études ont cherché à mettre en lumière l’effet de masque informationnel.
Pour cela, certains auteurs ont fait varier : la nature du bruit présent dans les masqueurs (bruit
stationnaire (Garcia Lecumberri & Cooke, 2006), bruit fluctuant (Dole, Hoen & Meunier,
2009 ; Broersma & Scharenborg, 2010)), le style parolier des masqueurs (Calandruccio, Van
Engen, Dhar & Bradlow, 2010b), ou la langue des masqueurs paroliers (Rhebergen, Versfeld
& Dreschler, 2005 ; Garcia Lecumberri & Cooke, 2006 ; Van Engen & Bradlow, 2007).
3.1. Manipuler la nature des masqueurs
3.1.1. Bruit stationnaire
Partie théorique La situation de la parole dans la parole
31
Afin d’examiner un effet de masque informationnel, Garcia Lecumberri & Cooke
(2006) ont demandé à des participants natifs de l’anglais de réaliser une tâche d’identification
de consonnes cibles anglaises présentées dans le silence ou dégradées par différents types de
masqueurs : (a) des masqueurs paroliers à 1 locuteur, natif de l’anglais ou de l’espagnol ; (b)
des masqueurs paroliers à 8 locuteurs natifs de l’anglais ; (c) des masqueurs de bruit
stationnaire. Contrairement aux masqueurs paroliers, à 1 et à 8 locuteurs, qui produisent un
effet de masque informationnel en plus d’un effet de masque énergétique, les masqueurs de
bruit stationnaire ne produisent qu’un effet de masque énergétique. En effet, ils ont été
générés à partir de masqueurs paroliers de sorte qu’ils ne partagent avec eux que les
informations spectrales ; les informations linguistiques ainsi que les fluctuations temporelles
ont été supprimées. Les meilleures performances ont été obtenues dans le silence, puis avec
les masqueurs paroliers à 1 locuteur. Les performances étaient un peu plus faibles avec les
masqueurs de bruit stationnaire et encore plus faibles avec les masqueurs paroliers à 8
locuteurs. L’effet de masque énergétique des masqueurs paroliers à 1 locuteur est plus faible
que celui des masqueurs paroliers à 8 locuteurs (en effet, plus le nombre de locuteurs
augmente, plus la saturation spectro-temporelle du signal est importante), qui est lui-même
plus faible que l’effet de masque énergétique des masqueurs de bruit stationnaire. Les auteurs
ont alors expliqué les performances plus élevées des participants avec les masqueurs de bruit
stationnaire plutôt qu’avec les masqueurs paroliers à 8 locuteurs par le fait que ces derniers
contiennent des informations linguistiques, ils produisent donc un effet de masque
informationnel qui réduit l’intelligibilité des consonnes cibles ; ce qui n’est pas le cas lorsque
les masqueurs sont composés uniquement d’informations spectrales (bruit stationnaire). Avec
les masqueurs paroliers à 1 locuteur, bien qu’un effet de masque informationnel soit présent,
il est fortement réduit par une ségrégation facilitée ; les participants peuvent par exemple
s’aider d’indices tels que la F0 des locuteurs.
3.1.2. Bruit fluctuant
Dans l’étude que nous venons de détailler, Garcia Lecumberri & Cooke (2006) ont
manipulé des masqueurs de bruit stationnaire de sorte que ces derniers ne conservent que les
informations spectrales de la parole. D’autres types de masqueurs dépourvus d’informations
linguistiques peuvent être générés, comme par exemple des masqueurs de bruit fluctuant qui
conservent les informations spectrales de la parole ainsi que les fluctuations temporelles. Le
Partie théorique La situation de la parole dans la parole
32
bruit fluctuant semble être un masqueur moins efficace que le bruit stationnaire. Miller &
Licklider (1950) ont observé de meilleures performances lors d’une tâche d’identification de
signaux paroliers en présence d’un masqueur composé de bruit fluctuant plutôt que de bruit
stationnaire. Le RSB était également manipulé. La Figure 4 ci-dessous représente les
différences de performances (exprimées en pourcentages), appelées aussi « démasquage »,
obtenues avec les masqueurs de bruit fluctuant et les masqueurs de bruit stationnaire. Pour des
valeurs négatives de RSB, l’avantage du bruit fluctuant sur le bruit stationnaire était le plus
important ; le démasquage a diminué progressivement avec l’augmentation du RSB.
Figure 4 : Niveau de démasquage obtenu en fonction du Rapport Signal sur Bruit (« SNR »
en dB). (Extraite de Miller & Licklider, 1950).
Nous retrouvons également une meilleure intelligibilité du signal cible avec les
masqueurs de bruit fluctuant plutôt qu’avec les masqueurs de bruit stationnaire dans l’étude
de Broersma & Scharenborg (2010). Ce résultat serait expliqué par la présence des
fluctuations temporelles dans les masqueurs de bruit fluctuant, et de leur absence dans les
masqueurs de bruit stationnaire. Les fluctuations temporelles entraînent des maxima et des
minima d’énergie (voir Figure 5). En particulier, les minima d’énergie, aussi appelés
« vallées », rendent le bruit fluctuant moins masquant et permettent au système auditif
d’extraire des fragments du signal cible (Festen & Plomp, 1990 ; Bronkhorst & Plomp, 1992 ;
Howard-Jones & Rosen, 1993a, 1993b ; Assmann & Summerfield, 2004 ; Cooke, 2006 ;
Füllgrabe, Berthommier & Lorenzi, 2006 ; Lorenzi, Husson, Ardoint & Debruille, 2006 ;
Rhebergen, Versfeld & Dreschler, 2006 ; Gnansia, Cheveigné & Lorenzi, 2009).
Partie théorique La situation de la parole dans la parole
33
Figure 5 : Figure représentant un signal de parole (en bleu) inséré dans un bruit stationnaire
(en rouge à gauche) ou dans un bruit fluctuant (en rouge à droite). (Extraite de Fleuriot,
Garnier & Lorenzi, 2007).
Dans notre groupe de recherche, Dole et al. (2009) ont masqué des mots cibles
français avec trois types de masqueurs : des masqueurs paroliers, des masqueurs de bruit
fluctuant et des masqueurs de bruit stationnaire. Les masqueurs paroliers français étaient
composés de 4 locuteurs. Les masqueurs de bruit fluctuant ont été générés à partir des
masqueurs paroliers ; ils possèdent les mêmes informations spectro-temporelles tout en étant
dépourvus d’informations linguistiques. Enfin, les masqueurs de bruit stationnaire ne
possèdent que des informations spectrales ; ils ont également été générés à partir des
masqueurs paroliers. Ainsi, les masqueurs de bruit fluctuant et de bruit stationnaire partagent
les mêmes informations spectrales.
Dans l’étude de Broersma & Scharenborg (2010), les masqueurs de bruit fluctuant étaient
générés à partir de masqueurs paroliers composés d’1 locuteur ; ici Dole et al. (2009) ont
généré les masqueurs de bruit fluctuant à partir des masqueurs paroliers à 4 locuteurs. Les
résultats observés par Dole et al. (2009) sont représentés dans la Figure 6 ci-dessous.
Partie théorique La situation de la parole dans la parole
34
Figure 6 : Taux de retranscriptions correctes obtenus avec les trois types de masqueurs : du
bruit stationnaire (« BBN » pour « stationary broadband noise »), du bruit fluctuant
(« SN » pour « fluctuating speech-shaped noise »), des masqueurs paroliers (« Cock » pour
« Cocktail noise »). (Extraite de Dole et al., 2009).
Les résultats ont montré un effet du type de bruit dans le masqueur avec des
performances significativement différentes d’un masqueur à l’autre. Les taux de
retranscriptions correctes étaient les plus faibles avec les masqueurs paroliers. Ceci est dû au
fait que ce type de masqueurs produit un effet de masque informationnel et un effet de
masque énergétique, contrairement aux deux autres types de masqueurs qui ne produisent
qu’un effet masque énergétique. Les performances étaient ensuite plus élevées avec les
masqueurs de bruit fluctuant et plus élevées encore avec les masqueurs de bruit stationnaire.
Ce résultat ne correspond pas aux attentes des auteurs. Etant donné que les masqueurs de bruit
fluctuant possèdent des fluctuations temporelles et donc des minima d’énergie (les
« vallées ») permettant d’extraire des fragments du signal cible, le pourcentage de
retranscriptions correctes aurait dû être plus élevé avec les masqueurs de bruit fluctuant plutôt
qu’avec les masqueurs de bruit stationnaire. Cependant, les auteurs expliquent ce résultat par
le fait que les masqueurs de bruit fluctuant ont été générés à partir de masqueurs paroliers à 4
locuteurs, pour lesquels la saturation spectro-temporelle est plus importante que pour des
masqueurs composés d’1 locuteur (Broersma & Scharenborg, 2010). Ainsi, les fluctuations
temporelles de chacun des locuteurs s’accumulant, les maxima d’énergie se superposent aux
Partie théorique La situation de la parole dans la parole
35
minima d’énergie, lissant ainsi le signal concurrent. Les masqueurs de bruit fluctuant
semblent produire alors un effet de masque énergétique plus important que celui des
masqueurs de bruit stationnaire, contrairement à l’hypothèse des auteurs.
Dans cette thèse et plus précisément à partir de l’Expérience 2, nous utiliserons des
masqueurs de bruit fluctuant en plus des masqueurs paroliers. Nous les préférons aux
masqueurs de bruit stationnaire car ils permettent une analyse plus fine de l’effet de masque
informationnel et donc des interférences linguistiques. En effet, la différence entre les
masqueurs paroliers et les masqueurs de bruit fluctuant réside dans le fait que ces derniers
sont dépourvus d’informations linguistiques de haut niveau.
Les fluctuations temporelles de la parole peuvent être décomposées en fluctuations
temporelles lentes de moins de 50 Hz (environ) et en fluctuations temporelles plus rapides, de
plus de 50 Hz. Selon Rosen (1992) (voir aussi Gnansia et al., 2009), les fluctuations
temporelles lentes représenteraient l’enveloppe d’amplitude du signal et seraient porteuses des
informations concernant le rythme global du signal de parole. Quant aux fluctuations
temporelles plus rapides, elles correspondraient à la périodicité ainsi qu’à la structure
temporelle fine du signal. La périodicité reflète notamment l’information sur la fréquence
fondamentale (F0) ; la structure temporelle fine porterait notamment les informations telles
que le lieu d’articulation et le mode d’articulation.
Pour générer les masqueurs de bruit fluctuant, nous nous appuierons sur les méthodes
utilisées dans notre groupe de recherche (Dole et al., 2009). Les masqueurs de bruit fluctuant
seront générés à partir des masqueurs paroliers, seules les informations spectrales et les
fluctuations temporelles lentes seront conservées. Les masqueurs de bruit fluctuant produiront
alors des interférences qui impliqueront des informations acoustiques et linguistiques de bas
niveau ; les informations acoustiques étant les informations spectrales, et les informations
linguistiques de bas niveau étant les informations portées par les fluctuations temporelles
lentes, c’est-à-dire le rythme. Les masqueurs paroliers seront les seuls à produire des
interférences qui impliqueront les informations linguistiques de haut niveau en plus des
informations acoustiques et linguistiques de bas niveau ; parmi les informations linguistiques
de haut niveau, nous trouvons les phonèmes, les syllabes, les mots et les informations
sémantiques.
Partie théorique La situation de la parole dans la parole
36
3.2. Manipuler le style parolier des masqueurs
Il a été montré que l’intelligibilité d’un message cible est améliorée lorsque celui-ci est
produit dans un style parolier clair plutôt que dans un style parolier conversationnel typique
(Payton, Uchanski & Braida, 1994). Dans un style parolier clair, le locuteur parle comme si la
personne à qui il s’adresse a des difficultés à le comprendre. Calandruccio et al. (2010b) se
sont alors demandés quel serait l’impact de masqueurs paroliers produits dans un style clair
sur l’intelligibilité de la parole cible par rapport à des masqueurs paroliers produits dans un
style conversationnel. Les auteurs ont formulé deux hypothèses : (a) soit les masqueurs
paroliers produits dans un style clair auront un effet de masque plus important que les
masqueurs paroliers au style conversationnel, (b) soit ils auront un effet de masque plus
faible. L’hypothèse (a) s’appuie sur le fait que les mots prononcés dans un style clair sont plus
intelligibles, ils seraient alors de plus forts distracteurs pour les participants que les mots
prononcés dans un style conversationnel. Dans ce cas, des interférences linguistiques seraient
mises en avant. L’hypothèse (b) quant à elle, propose qu’il serait plus facile d’extraire la
parole cible avec les masqueurs paroliers au style clair puisque leurs fluctuations temporelles
seraient plus exagérées, c’est-à-dire plus saillantes, que celles des masqueurs paroliers au
style conversationnel ; notamment les minima d’énergie seraient plus larges (la durée des
« vallées » serait plus longue) et permettraient d’extraire plus facilement le signal cible
(Festen & Plomp, 1990 ; Gnansia et al. 2009).
Dans une première expérience, les auteurs ont testé l’hypothèse (a) en demandant à des
participants natifs de l’anglais de réaliser une tâche d’intelligibilité sur des phrases cibles
anglaises dégradées par des masqueurs paroliers à 2 locuteurs générés en anglais (langue
native) ou en croate (langue inconnue des participants). Pour générer ces masqueurs paroliers,
des locuteurs natifs de l’anglais et des locuteurs natifs du croate ont lu des phrases dans un
style clair ou conversationnel. L’hypothèse (a) sera validée dans le cas où les performances
sont équivalentes entre les masqueurs paroliers croates au style clair et ceux au style
conversationnel, et que des performances plus faibles sont observées avec les masqueurs
paroliers anglais au style clair plutôt qu’avec ceux au style conversationnel. Les phrases cibles
ont elles aussi été produites dans un style clair ou conversationnel. Le Rapport Signal sur
Bruit était manipulé, il était de -3 dB ou de -5 dB. Les résultats ont montré un effet du RSB,
un effet de la langue des masqueurs ainsi qu’un effet du style parolier des phrases cibles. En
effet, les performances étaient plus faibles avec un RSB de -5 dB plutôt qu’avec un RSB de -3
Partie théorique La situation de la parole dans la parole
37
dB ; elles étaient plus faibles avec les masqueurs paroliers anglais plutôt qu’avec les
masqueurs paroliers en croate ; enfin les participants ont eu plus de difficultés avec les
phrases cibles produites dans un style conversationnel plutôt que dans un style clair. En
revanche, l’effet du style parolier des masqueurs n’était pas présent, quelle que soit la langue
des masqueurs, le RSB ou le style parolier des phrases cibles. L’hypothèse (a), selon laquelle
les masqueurs paroliers au style clair seraient de plus forts distracteurs pour les participants
n’a donc pas été validée. Dans ce paradigme expérimental, manipuler le style parolier des
masqueurs n’a pas permis de mettre en évidence un effet de masque informationnel.
Une seconde expérience a été mise en place pour tester l’hypothèse (b), selon laquelle les
masqueurs paroliers au style clair seraient moins efficaces que les masqueurs paroliers au
style conversationnel. Les masqueurs paroliers étaient cette fois-ci composés d’1 locuteur
unique anglais, qui parlait dans un style clair ou conversationnel. Des masqueurs de bruit
fluctuant ont également été générés à partir des masqueurs paroliers aux styles clair et
conversationnel, de telle sorte qu’ils possèdent les mêmes informations spectrales et
temporelles tout en étant dépourvus d’informations linguistiques. L’hypothèse (b) sera validée
si les performances des participants sont plus faibles avec les masqueurs de bruit fluctuant au
style conversationnel plutôt qu’avec ceux au style clair. Le RSB était à nouveau manipulé (-8
dB et -10 dB pour les masqueurs de bruit fluctuant, -14 dB et -16 dB pour les masqueurs
paroliers), ainsi que le style parolier des phrases cibles (styles paroliers clair et
conversationnel). Avec les masqueurs paroliers, les performances n’étaient significativement
pas différentes qu’ils aient été générés dans un style clair ou conversationnel. De plus, l’effet
du RSB n’était pas significatif, seul l’effet du style parolier des phrases cibles a été mis en
évidence. Avec les masqueurs de bruit fluctuant, la tâche était aussi difficile que le style soit
clair ou conversationnel. L’effet du RSB et celui du style parolier des phrases cibles étaient
significatifs. Ces résultats ont donc suggéré que les différences de fluctuations temporelles
entre les masqueurs de bruit fluctuant au style clair et ceux au style conversationnel n’ont pas
influencé l’intelligibilité de la parole cible. Il semble qu’entre les masqueurs paroliers au style
clair et ceux au style conversationnel, d’autres différences acoustiques que des différences de
fluctuations temporelles soient présentes.
Dans nos expériences, nous utiliserons des masqueurs paroliers au style
conversationnel de manière à ce que la situation d’écoute générée dans notre paradigme
expérimental s’approche le plus possible d’une situation écologique.
Partie théorique La situation de la parole dans la parole
38
3.3. Manipuler la langue des masqueurs
La première étude à faire varier la langue de la parole concurrente a été menée par
Rhebergen et al. (2005). Des participants de langue maternelle allemande ont réalisé une tâche
d’intelligibilité avec des phrases cibles allemandes. Les masqueurs paroliers étaient produits
par une locutrice unique, native du suédois (une langue inconnue des participants) ou de
l’allemand (langue native des participants). Les résultats des participants ont montré des
performances plus élevées avec les masqueurs paroliers générés dans une langue inconnue
(suédois) plutôt qu’avec des masqueurs paroliers générés dans leur langue native (allemand).
Des résultats similaires ont été mis en évidence dans l’étude de Garcia Lecumberri &
Cooke (2006). Lors d’une tâche d’intelligibilité de consonnes cibles anglaises, des
participants natifs de l’anglais ont eu des meilleures performances en présence de masqueurs
paroliers (à 1 locuteur) générés en espagnol, une langue qui ne leur a jamais été enseignée,
plutôt qu’en présence de masqueurs paroliers anglais (langue native). En effet, les
informations linguistiques de la langue inconnue n’étant pas intelligibles pour les participants,
ces informations ne perturbent pas l’intelligibilité des phrases cibles.
La célèbre étude de Van Engen & Bradlow (2007) a fait suite aux deux études
évoquées ci-dessus. Ces auteurs se sont intéressés à l’effet de masque informationnel en
manipulant à la fois la langue des masqueurs paroliers, le RSB, ainsi que le nombre de
locuteurs dans les masqueurs. Les auteurs ont montré que l’effet de masque informationnel
n’est observable que dans certaines situations d’écoute. Nous allons détailler cette étude car
elle constitue la base de notre travail expérimental.
Une tâche d’intelligibilité (retranscrire par écrit) de phrases cibles anglaises a été proposée à
des participants natifs de l’anglais. Les phrases cibles étaient insérées dans des masqueurs
paroliers générés en anglais (langue native) ou en mandarin (langue inconnue). Ces
masqueurs étaient composés de 2 ou de 6 locuteurs. Les phrases présentes dans les masqueurs
paroliers étaient sémantiquement incongrues. Les phrases cibles étaient insérées 500 ms après
le début des masqueurs, avec un RSB de +5 dB, 0 dB ou -5 dB. Nous rappelons qu’un RSB
positif indique que le niveau sonore de la cible est plus élevé que le niveau sonore du
masqueur. Quatre groupes différents de participants ont été constitués. Pour chaque groupe, 4
conditions expérimentales parmi les 12 possibles ont été présentées ; il y avait 16 phrases
cibles par condition expérimentale. Les participants commençaient toujours par entendre les
situations d’écoute les plus favorables. Ainsi, l’expérience débutait avec la valeur de RSB la
Partie théorique La situation de la parole dans la parole
39
plus élevée (+5 dB ou 0 dB) et avec les masqueurs paroliers générés dans la langue inconnue
des participants (mandarin). Le Tableau 2 ci-dessous récapitule les conditions expérimentales
de cette étude.
Tableau 2 : Conditions expérimentales présentées aux quatre groupes de participants dans
l’étude de Van Engen & Bradlow (2007).
1° condition 2° condition 3° condition 4° condition
Nombre de locuteurs Mandarin Anglais Mandarin Anglais
Groupe 1 6 +5 dB +5 dB 0 dB 0 dB
Groupe 2 6 0 dB 0 dB -5 dB -5 dB
Groupe 3 2 +5 dB +5 dB 0 dB 0 dB
Groupe 4 2 0 dB 0 dB -5 dB -5 dB
Les auteurs ont fait l’hypothèse que l’intelligibilité des phrases cibles anglaises devrait
être plus faible avec les masqueurs paroliers anglais (langue native) plutôt qu’avec ceux
générés en mandarin (langue non connue). De plus, ils s’attendaient à ce que les performances
diminuent avec l’augmentation du nombre de locuteurs dans les masqueurs paroliers (2 versus
6), ainsi qu’avec la diminution du RSB (+5 dB, 0 dB et -5 dB).
Les résultats ont en effet montré des performances plus faibles avec 6 locuteurs dans les
masqueurs paroliers plutôt qu’avec 2 locuteurs, et des performances qui ont chuté avec la
diminution du RSB. Cela a confirmé que l’intelligibilité de la parole cible a été réduite à
mesure que le nombre de locuteurs des masqueurs a augmenté et à mesure que le niveau
sonore de la cible a diminué par rapport au niveau sonore des masqueurs. Concernant l’effet
de la langue des masqueurs paroliers, il était significatif uniquement avec les masqueurs
paroliers à 2 locuteurs et lorsque le RSB était de 0 dB et de -5 dB ; les performances étaient
plus faibles avec les masqueurs paroliers en anglais plutôt qu’avec ceux en mandarin.
Autrement dit, les masqueurs paroliers ont eu un effet de masque plus important lorsqu’ils
étaient générés dans la langue native des participants plutôt que dans une langue inconnue.
Les informations linguistiques des masqueurs paroliers anglais étant intelligibles, elles ont
interférées sur l’intelligibilité du message cible. Il est à préciser que l’effet de la langue des
masqueurs était présent à 0 dB, mais uniquement lorsque cette condition suivait la condition à
+5 dB, c’est-à-dire lorsqu’elle représentait une situation d’écoute plus difficile pour les
participants. Cela ne concernait donc que les groupes 1 et 3. Lorsque les groupes 2 et 4
Partie théorique La situation de la parole dans la parole
40
entendaient les conditions à 0 dB puis celles à -5 dB, l’effet de la langue des masqueurs
n’était pas présent à 0 dB. Enfin, l’absence d’effet de la langue des masqueurs avec 6
locuteurs serait due au fait qu’avec l’augmentation du nombre de locuteurs, la densité
spectrale et temporelle du signal est plus importante (en accord avec les résultats rapportés par
Hoen et al., 2007). Un effet de masque énergétique plus important réduit l’accès au contenu
linguistique des masqueurs paroliers ainsi que leur effet de masque informationnel.
Le Tableau 3 ci-dessous regroupe les différentes études citées dans la partie théorique, ayant
manipulé la langue des masqueurs paroliers.
Tableau 3 : Récapitulatif des études présentées ayant manipulé la langue des masqueurs
paroliers.
Etudes Nature de la
cible
Langue de
la cible
Langue des
masqueurs
Nombre de
locuteurs
Rhebergen et al.
(2005) phrases allemand allemand / suédois 1
Garcia Lecumberri &
Cooke (2006) VCV anglais anglais / espagnol 1
Van Engen & Bradlow
(2007) phrases anglais anglais / mandarin 2 et 6
Calandruccio et al.
(2010b) phrases anglais anglais / croate 2
Brouwer et al.
(2012) phrases anglais anglais / néerlandais 2
Dans cette thèse, nous manipulerons la langue de la parole concurrente afin de mettre
en évidence un effet de masque informationnel dans la situation de la parole dans la parole.
Nous évaluerons l’intelligibilité de mots cibles produits dans la langue native de participants
français. Comme pour les études évoquées ci-dessus, la parole concurrente sera produite dans
la langue native des participants, ou dans des langues qui leur sont inconnues. Nous avons
choisi de générer des masqueurs paroliers en français (langue native) ainsi qu’en gaélique
irlandais et en italien (langues inconnues). Les masqueurs paroliers seront composés de 2 et
de 4 locuteurs.
Partie théorique La situation de la parole dans la parole
41
4. Interférences linguistiques
Les études que nous venons de décrire ont mis en évidence l’effet de masque
informationnel. Cependant, il n’a pas encore été identifié si ce sont les informations sous-
lexicales telles que les phonèmes et les syllabes, ou bien si ce sont les informations lexicales
(mots) et sémantiques des masqueurs paroliers qui sont responsables de cet effet. Nous allons
présenter deux études qui ont révélé des interférences impliquant des informations lexicales
(Boulenger, Hoen, Ferragne, Pellegrino & Meunier, 2010) et sémantiques (Brouwer, Van
Engen, Calandruccio & Bradlow, 2012).
4.1. Interférences lexicales
Boulenger et al. (2010) se sont intéressés aux interférences lexicales pendant la
situation de la parole dans la parole en faisant varier la fréquence d’occurrence des mots
présents dans les masqueurs paroliers. Les auteurs ont cherché à déterminer dans quelle
mesure la fréquence d’occurrence des mots dans le signal concurrent interfère sur
l’intelligibilité de la parole cible. En effet, si les participants sont sensibles à l’information
lexicale des masqueurs paroliers, alors les performances de ces participants devraient varier
en fonction de la fréquence d’occurrence des mots présents dans les masqueurs paroliers.
Ainsi, les auteurs ont prédit que les masqueurs paroliers composés de mots très fréquents
devraient davantage interférer sur l’intelligibilité de la parole cible que les masqueurs
paroliers composés de mots peu fréquents ; les mots très fréquents étant pour les modèles
théoriques de plus forts compétiteurs pour l’accès au lexique que les mots peu fréquents. Des
participants français ont réalisé une tâche de décision lexicale sur des mots cibles français
insérés dans des masqueurs paroliers qui étaient composés de mots très fréquents ou peu
fréquents (mots sélectionnés dans la base de données Lexique 2, New, Pallier, Brysbaert &
Ferrand, 2004). Le nombre de locuteurs présents dans les masqueurs paroliers a également été
manipulé, ils étaient 2, 4, 6 ou 8 locuteurs. Les auteurs ont observé un effet du nombre de
locuteurs, les temps de réaction étaient significativement plus rapides avec 2 locuteurs dans
les masqueurs plutôt qu’avec 4, 6 ou 8 locuteurs ; il n’y avait pas de différence significative
entre ces trois dernières conditions. Un effet de la fréquence d’occurrence des mots était
également présent, les temps de réaction étaient significativement plus longs lorsque les
masqueurs paroliers étaient composés de mots très fréquents plutôt que de mots peu fréquents,
Partie théorique La situation de la parole dans la parole
42
mais uniquement avec 2 et 8 locuteurs dans les masqueurs. Avec 2 locuteurs, les informations
linguistiques des masqueurs paroliers étant encore intelligibles, l’effet de la fréquence
d’occurrence des mots a pu s’exprimer. En revanche à 8 locuteurs, le contenu linguistique des
masqueurs est moins accessible, la saturation spectrale et temporelle du signal étant plus
importante. Afin de comprendre la présence surprenante de l’effet de fréquence d’occurrence
des mots dans la condition à 8 locuteurs, les auteurs ont réalisé des analyses acoustiques et ont
mis en évidence des différences acoustiques/énergétiques entre les mots très fréquents et les
mots peu fréquents avec 8 locuteurs dans les masqueurs. Finalement, les résultats ont montré
que lorsque le masqueur était composé de peu de locuteurs (2 locuteurs), des compétitions
lexicales ont été déclenchées ; ces dernières ont été plus fortes lorsque le signal concurrent
était composé de mots très fréquents.
4.2. Interférences sémantiques
Afin de mettre en évidence des interférences sémantiques dans la situation de la parole
dans la parole, Brouwer et al. (2012) ont utilisé le même type de tâche que dans l’étude de
Van Engen & Bradlow (2007). Des participants natifs de l’anglais ont été recrutés pour
réaliser une tâche d’intelligibilité avec des phrases cibles anglaises. Ces dernières étaient
insérées dans des masqueurs paroliers à 2 locuteurs, natifs de l’anglais (langue native des
participants) ou natifs du néerlandais (langue inconnue des participants). Notons qu’à la
différence de Van Engen & Bradlow (2007), Brouwer et al. (2012) ont testé du néerlandais,
qui est plus proche de l’anglais (même origine, similarités phonétiques) que le mandarin (voir
aussi Bradlow, Clopper, Smiljanic & Walter, 2010). Les auteurs ont également manipulé le
contenu sémantique des masqueurs paroliers ; ces derniers étaient composés de phrases
sémantiquement acceptables ou sémantiquement incongrues. A -5 dB, les résultats ont révélé
un effet de la langue des masqueurs, les participants ont eu de meilleures performances
lorsque les masqueurs paroliers étaient générés dans une langue qui leur était inconnue
(néerlandais) plutôt que dans leur langue native (anglais). Brouwer et al. (2012) ont donc
obtenu un effet de la langue des masqueurs similaire à celui de Van Engen & Bradlow (2007),
bien que le néerlandais soit plus proche de l’anglais que le mandarin. Cette étude montre ainsi
que l’intelligibilité de la parole cible est meilleure dès lors que la langue concurrente est
inintelligible. Les résultats ont également montré que l’effet du contenu sémantique n’était
présent qu’avec les masqueurs paroliers anglais (langue native) ; les performances étaient
Partie théorique La situation de la parole dans la parole
43
significativement plus élevées lorsque les phrases étaient sémantiquement incongrues plutôt
que lorsqu’elles étaient sémantiquement acceptables. En revanche avec les masqueurs
paroliers en néerlandais, les performances étaient équivalentes que le contenu sémantique soit
acceptable ou pas. En effet, étant donné que les participants ne comprenaient pas le contenu
linguistique en néerlandais, ils n’ont pas été affectés par les informations sémantiques de la
parole concurrente. L’étude de Brouwer et al. (2012) a ainsi mis en évidence l’intervention
d’interférences sémantiques lorsque la parole concurrente est intelligible.
Boulenger et al. (2010) ainsi que Brouwer et al. (2012) ont mis en lumière,
respectivement, des interférences lexicales et des interférences sémantiques. Dans la partie
expérimentale de cette thèse, nous nous intéresserons aux interférences qui impliquent des
informations linguistiques sous-lexicales. Plus précisément, notre objectif sera de déterminer
si des interférences phonémiques peuvent être repérées dans la situation de la parole dans la
parole. Pour cela, nous manipulerons le pourcentage de phonèmes communs entre la langue
des masqueurs paroliers et la langue de la parole cible (également langue native des
participants). Dans le cas où les participants sont sensibles à l’information phonémique des
masqueurs paroliers, plus ce pourcentage de phonèmes communs sera élevé, plus les
interférences phonémiques seront importantes, ce qui réduira l’intelligibilité de la parole cible.
Nous utiliserons des masqueurs paroliers en français, en gaélique irlandais et en italien. Le
pourcentage de phonèmes communs entre les langues cible et concurrente sera de 100% pour
les masqueurs paroliers français (langue native), de 60% pour les masqueurs paroliers italiens,
et de 18% pour les masqueurs paroliers en gaélique irlandais.
Partie théorique Intelligibilité de la parole dans une langue seconde
44
C) INTELLIGIBILITE DE LA PAROLE DANS UNE LANGUE SECONDE
La compréhension de la parole dans la parole est une tâche difficile. Les interférences
linguistiques produites par le bruit de parole concurrent sont en partie responsables de cette
difficulté en réduisant l’intelligibilité du message cible. Qu’en est-il des interférences
linguistiques lorsque le message cible est produit dans une langue seconde (L2), les
interférences linguistiques sont-elles plus pénalisantes ? Dans la partie expérimentale de cette
thèse, nous explorerons la situation de la parole dans la parole lorsque le message cible sera
produit dans la L2 des participants et nous examinerons les interférences linguistiques qui
interviennent dans cette situation d’écoute.
1. Intelligibilité d’une L2 dans le silence
Le nombre de personnes qui communiquent dans leur L2 est en augmentation. Par
exemple, il est maintenant fréquent de partir travailler à l’étranger et ainsi, d’être amené à
utiliser quotidiennement une langue autre que sa langue native. La compréhension de la
parole s’avère plus difficile lorsqu’elle est produite dans une L2 plutôt que dans la langue
native (Weber & Broersma, 2012). En effet, certains sons (plus précisément certains
contrastes phonétiques) restent plus difficiles à différencier que d’autres, et ce, même lorsque
l’on pratique la L2 depuis plusieurs années. De plus, un mot produit dans une L2 active un
plus grand nombre de compétiteurs, il est alors reconnu plus lentement qu’un mot parlé dans
une langue native.
1.1. Difficulté à différencier certains sons
La difficulté à identifier des mots présentés dans une L2 peut tout d’abord être
expliquée par le fait que certains sons de la L2 sont plus difficiles à différencier que d’autres
(Best, 1995 ; Flege, 1995 ; Strange, 1995 ; Broersma, 2005). La paire de consonnes /r/ - /l/
représente l’exemple le plus célèbre de sons difficiles à différencier pour des personnes
natives du japonais qui communiquent en anglais (Goto, 1971 ; Strange & Dittmann, 1984 ;
Iverson et al., 2003 ; Aoyama, Flege, Guion, Akahane-Yamada, & Yamada, 2004 ; Cutler &
Otake, 2004). En effet, les consonnes /r/ et /l/ n’étant pas présentes dans les langues asiatiques
Partie théorique Intelligibilité de la parole dans une langue seconde
45
telles que le japonais et le mandarin, les natifs de ces langues ont des difficultés à créer des
catégories phonémiques distinctes pour ces consonnes. Lorsque les mots anglais « rock » et
« lock », ou « road » et « load », qui ne diffèrent qu’au niveau du contraste /r/ - /l/ sont
présentés aux personnes natives du japonais, les deux mots sont considérés comme des
homophones. Plus précisément, les phonèmes /r/ et /l/ seraient assimilées au phonème /l/ car
ce dernier est phonétiquement plus proche du phonème japonais /ɾ/ que le phonème /r/.
Cette difficulté concerne également les voyelles. Par exemple, les personnes natives du
néerlandais qui communiquent en anglais sont en difficulté pour différencier les phonèmes /æ/
- /ɛ/ (Schouten, 1975 ; Broersma & Cutler, 2011). A l’aide d’une tâche d’amorçage « cross-
modal » (modalités auditive et visuelle), Broersma (2012) a présenté à des participants natifs
du néerlandais qui parlent l’anglais comme L2 ainsi qu’à des participants monolingues natifs
de l’anglais, des paires de mots anglais trisyllabiques tels que : daffodil – deficit. Pour chaque
paire, les deux mots commencent par le même onset mais la voyelle qui suit est différente ;
par exemple l’onset /d/ sera suivi de /æ/ ou de /ɛ/. Ce contraste a été choisi car, comme
mentionné ci-dessus, il est difficile à différencier pour des participants néerlandais qui
apprennent à parler l’anglais. Pour chaque paire, un seul mot constituera la cible et sera
présenté visuellement sur un écran d’ordinateur ; par exemple daffodil. Avant la présentation
visuelle de chaque mot cible, une amorce auditive est présentée aux participants. Trois types
d’amorces auditives ont été générés : (a) les amorces identiques qui correspondent exactement
au début du mot cible : daffo venant de daffodil ; (b) les amorces différentes qui
correspondent exactement au début de l’autre mot de la paire : defi venant de deficit ; (c) les
amorces contrôles qui correspondent au début d’un mot n’ayant pas de lien avec les mots de
la paire : moni venant de monitor. Les deux groupes de participants (participants monolingues
natifs de l’anglais et participants natifs du néerlandais qui parlent l’anglais comme L2) ont
réalisé une tâche de décision lexicale, ils devaient décider si le mot cible écrit sur l’écran
d’ordinateur existait dans la langue anglaise. Ainsi, les participants natifs de l’anglais ont
réalisé la tâche dans leur langue native, alors que les participants natifs du néerlandais ont
réalisé la tâche dans leur L2. Les résultats ont montré que les amorces identiques ont facilité
l’identification des mots cibles pour les deux groupes de participants. Pour les participants
natifs de l’anglais, les amorces différentes n’ont pas facilité l’identification des mots cibles.
En effet pour ces participants, les catégories phonémiques pour le contraste /æ/ - // étant
distinctes, le système auditif a perçu que la voyelle qui suivait l’onset était différente dans
l’amorce et dans le mot cible. Cependant, pour les participants natifs du néerlandais,
Partie théorique Intelligibilité de la parole dans une langue seconde
46
les amorces différentes ont facilité l’identification des mots cibles. Etant donné que le
contraste /æ/ - // est difficile à différencier pour ces participants, les amorces différentes ont
eu le même effet que les amorces identiques.
Créer des catégories phonémiques distinctes peut être difficile même lorsque l’on
atteint un haut niveau d’expertise de la L2 (Pallier, Bosch & Sebastian-Gallés, 1997 ;
Sebastian-Gallés & Soto-Faroco, 1999 ; Pallier, Colomé & Sebastian-Gallés, 2001). Par
exemple, Pallier et al. (2001) ont recruté des participants natifs de l’espagnol qui parlent le
catalan comme L2 depuis au moins 15 ans. Ils ont comparé leurs performances à celles de
participants natifs du catalan qui parlent l’espagnol comme L2. Ces deux groupes de
participants ont réalisé une tâche de décision lexicale sur des mots et pseudo-mots catalans
présentés auditivement. Les auteurs ont sélectionné des mots composés de contrastes catalans
difficiles à différencier pour des natifs de l’espagnol (/e/ - /ε/, /s/ - /z/). Sur la base de ces
contrastes, des paires de mots catalans ont été formées, les mots d’une paire n’étant différents
qu’au niveau de ces contrastes. Par exemple pour le contraste /e/ - /ε/, le mot composé du
phonème /e/ était présenté en premier, puis dans un autre essai, le mot composé du phonème
/ε/ était à son tour présenté. Les auteurs s’appuient sur le fait que dans une tâche de décision
lexicale, les effets de répétition sont robustes ; les temps de réaction sont toujours plus rapides
lorsqu’un même mot est présenté une seconde fois. Les participants natifs du catalan, c’est-à-
dire les participants qui ont réalisé la tâche dans leur langue native, n’ont pas obtenu des
temps de réaction plus courts pour le 2ème
mot de la paire, indiquant qu’ils ont traité
différemment les phonèmes /e/ et /ε/. En revanche, les participants natifs de l’espagnol ont eu
des temps de réaction plus courts pour le 2ème
mot de la paire qui a donc été considéré comme
une répétition du premier mot. Dans cette étude, bien que les participants natifs de l’espagnol
pratiquent le catalan depuis au moins 15 ans, les catégories phonémiques de certains
phonèmes ne sont toujours pas distinctes.
1.2. Plus de compétiteurs
Lorsqu’un auditeur ne parvient pas à réaliser des catégories phonémiques distinctes
dans sa L2, un plus grand nombre de compétiteurs serait activé lors de l’identification d’un
mot cible. Garcia Lecumberri, Cooke & Cutler (2010) ont fourni un exemple concernant des
personnes natives d’une langue asiatique qui apprennent à parler l’anglais. Etant donné que
Partie théorique Intelligibilité de la parole dans une langue seconde
47
ces personnes ont des difficultés pour différencier les sons /r/ et /l/, le début du mot anglais
« regis- » peut activer des candidats lexicaux qui commencent aussi bien par /l/ que par /r/,
par exemple : « legislate, register ». Ce n’est qu’à partir du sixième phonème qu’une
différenciation entre les deux mots va se faire (voir aussi Cutler, Weber & Otake, 2006).
De plus, un plus grand nombre de compétiteurs seraient activés lors de l’identification
de mots présentés dans une L2, ces derniers activeraient en parallèle à la fois des compétiteurs
du lexique mental de la L2, mais aussi des compétiteurs du lexique mental de la langue native.
Ceci a par exemple été mis en évidence par Weber & Cutler (2004) dans une étude utilisant
un paradigme d’eye-tracking qui permet d’exploiter les mouvements oculaires des
participants envers les objets présentés sur l’écran d’ordinateur (voir également Spivey &
Marian, 1999 ; Marian & Spivey, 2003a, 2003b ; Blumenfeld & Marian, 2007). Dans l’étude
de Weber & Cutler (2004), deux groupes de participants ont été testés : (a) des participants
natifs du néerlandais qui parlent l’anglais comme L2 ; (b) des participants natifs de l’anglais
qui ne connaissent pas le néerlandais. Les auteurs leur ont fait écouter un nom d’objet en
anglais qui était inséré à la fin d’une consigne ; par exemple « Click on the kitten », le mot
cible étant « kitten ». Ensuite, les participants devaient identifier cet objet cible sur un écran
où figuraient également trois autres objets. Pour un de ces trois objets, le nom en néerlandais
avait un début phonémiquement similaire au nom de l’objet cible : « kist », il s’agissait du
compétiteur. Pour ce même objet, le nom en anglais (« chest ») n’avait pas de lien
phonémique avec le nom de l’objet cible. Pour les deux autres objets, les noms en anglais et
en néerlandais n’avaient pas de lien avec le nom de l’objet cible ; ils étaient des distracteurs,
par exemple « flower / bloem » et « swing / schommel ». Les auteurs ont utilisé la localisation
et les temps de latence des mouvements des yeux vers les objets pour évaluer l’accès au
lexique du mot cible inséré à la fin de la consigne auditive.
Les résultats des participants natifs du néerlandais qui parlent l’anglais comme L2 sont
représentés dans la Figure 7 (graphique a), ceux des participants natifs de l’anglais
monolingues dans la Figure 7 (graphique b) ci-dessous.
Partie théorique Intelligibilité de la parole dans une langue seconde
48
Figure 7 : Pourcentages de fixations envers l’objet cible (« English target (kitten) »), l’objet
compétiteur (« Dutch compétiteur (kist) ») et les objets distracteurs (« Distractor (flower) »),
en fonction du temps (en ms). Le graphique (a) représente les résultats des participants natifs
du néerlandais qui parlent l’anglais comme L2 ; le graphique (b), les résultats des participants
anglais monolingues. (Extraite de Weber & Cutler, 2004).
Partie théorique Intelligibilité de la parole dans une langue seconde
49
Concernant les participants natifs du néerlandais (graphique a), les résultats ont montré
que les pourcentages de fixations envers l’objet cible, le compétiteur et les distracteurs ont
commencé à diverger à partir de 300 ms. Entre 300 et 800 ms, le pourcentage de fixations
était le plus important pour l’objet cible. Les résultats ont également révélé que pour cette
période, le pourcentage de fixations pour le compétiteur était significativement plus important
que celui obtenu pour les distracteurs, confirmant que la présentation auditive des mots cibles
produits dans la L2 des participants (anglais) a activé des compétiteurs de leur langue native
(néerlandais) ; et ce, même lorsque cette dernière n’était pas la langue avec laquelle la tâche
était réalisée (langue pertinente). Pour les participants anglais monolingues (graphique b), les
pourcentages de fixations entre les différents objets ont commencé à diverger avant 300 ms.
Rapidement, ils étaient significativement plus élevés pour l’objet cible. Les pourcentages de
fixations pour le compétiteur et pour les distracteurs n’étaient pas différents.
2. Intelligibilité d’une L2 dans le bruit
Les études décrites ci-dessus suggèrent qu’il est moins facile de communiquer dans
une L2 plutôt que dans une langue native du fait de la difficulté à différencier certains sons et
du fait de la présence d’un plus grand nombre de compétiteurs qui ralentissent l’identification
des mots. Pour ces raisons, les personnes qui communiquent dans leur L2 sont davantage
affectées par la présence de bruits concurrents que les personnes qui communiquent dans leur
langue native ; et ce, que le bruit concurrent soit purement acoustique ou qu’il soit composé
d’informations linguistiques et acoustiques. Notamment, les études de Garcia Lecumberri &
Cooke (2006) et de Cooke, Garcia Lecumberri & Barker (2008) confortent cette idée. (Voir
aussi Florentine, Buus, Scharf & Canevet, 1984 ; Florentine, 1985 ; Mayo, Florentine & Buus,
1997 ; Meador, Flege & MacKay, 2000 ; Rogers, Lister, Febo, Besing & Abrams, 2006.)
2.1. Plus difficile dans une L2 que dans une langue native
Garcia Lecumberri & Cooke (2006) ont proposé une tâche d’identification de
consonnes cibles à des participants natifs de l’anglais ainsi qu’à des participants natifs de
l’espagnol qui parlent l’anglais comme L2. Dans la partie B, nous avons décrit les résultats de
cette étude pour un des deux groupes, le groupe des participants natifs de l’anglais. Nous
rappelons rapidement le paradigme expérimental. Les consonnes cibles étaient présentées
Partie théorique Intelligibilité de la parole dans une langue seconde
50
dans le silence ou en présence de différents types de masqueurs : (1) des masqueurs paroliers
à 1 locuteur natif de l’anglais ou de l’espagnol ; (2) des masqueurs paroliers à 8 locuteurs
natifs de l’anglais ; (3) des masqueurs de bruit stationnaire. Les masqueurs paroliers
produisent des effets de masque énergétique et informationnel, les masqueurs de bruit
stationnaire produisent uniquement un effet de masque énergétique.
Les résultats des deux groupes de participants (participants natifs de l’anglais et participants
natifs de l’espagnol qui parlent l’anglais comme L2) sont représentés ci-dessous dans la
Figure 8.
Figure 8 : Pourcentages d’identifications correctes des consonnes cibles présentées : dans le
silence (« quiet »), en présence des masqueurs paroliers à un locuteur natif de l’anglais
(« english ») ou de l’espagnol (« spanish »), avec du bruit stationnaire (« ssn »), et des
masqueurs paroliers anglais à 8 locuteurs (« babble »). Les performances des participants
anglais monolingues sont indiquées par la lettre N, celles des participants natifs de l’espagnol
qui parlent anglais en L2 par les lettres NN. (Extraite de Garcia Lecumberri & Cooke, 2006).
Les auteurs ont observé un pattern de résultats similaire entre les deux groupes de
participants. L’ordre des performances, des plus élevées aux plus faibles, était le suivant :
dans le silence, avec les masqueurs paroliers à 1 locuteur (natif de l’anglais ou de l’espagnol),
avec les masqueurs de bruit stationnaire et enfin en présence des masqueurs paroliers anglais
à 8 locuteurs. Néanmoins, pour chaque condition expérimentale, les participants natifs de
l’espagnol qui parlent l’anglais comme L2 ont eu de plus faibles performances que les
Partie théorique Intelligibilité de la parole dans une langue seconde
51
participants natifs de l’anglais. Autrement dit, les participants qui ont réalisé la tâche dans leur
L2 (participants natifs de l’espagnol) ont davantage été affectés par la présence des
masqueurs. De plus, l’écart de performances entre les deux groupes de participants a
augmenté à mesure que la tâche devenait plus difficile. Cet écart était le plus important avec
les masqueurs paroliers anglais à 8 locuteurs. Contrairement aux masqueurs de bruit
stationnaire qui ne produisent qu’un effet de masque énergétique, les masqueurs paroliers
anglais à 8 locuteurs produisent en plus un effet de masque informationnel. Il apparaît ainsi
que les participants natifs de l’espagnol ont davantage souffert du masque informationnel que
les participants natifs de l’anglais.
Dans leur étude, Cooke et al. (2008) ont étudié la compréhension de la parole dans une
L2 en utilisant uniquement des masqueurs composés d’informations linguistiques et
acoustiques (masqueurs paroliers à 1 locuteur) et en manipulant le RSB. Des participants
natifs de l’espagnol qui parlent l’anglais comme L2 ainsi que des participants natifs de
l’anglais devaient identifier des phrases cibles anglaises, et plus précisément certains mots
présents dans ces phrases cibles, qui étaient masquées par 1 locuteur concurrent natif de
l’anglais. Ce dernier était identique ou différent du locuteur des phrases cibles (de même sexe
ou de sexe différent). Les valeurs de RSB manipulées étaient les suivantes : de -9 dB à +16
dB. Pour chaque condition expérimentale, les participants natifs de l’espagnol ont été plus
affectés par les masqueurs paroliers que les participants natifs de l’anglais. L’écart de
performances entre les deux groupes a augmenté à mesure que le RSB diminuait, c’est-à-dire
avec la diminution du niveau sonore du signal cible par rapport au niveau sonore du signal
concurrent ; la situation d’écoute devenant de plus en plus difficile. La Figure 9 ci-dessous
illustre les résultats de cette étude.
Partie théorique Intelligibilité de la parole dans une langue seconde
52
Figure 9 : Pourcentages d’identifications correctes des mots cibles en présence des
masqueurs paroliers à 1 locuteur identique à celui des phrases cibles (« same talker »),
différent mais de même sexe (« same gender »), de sexe différent (« different gender »). La
lettre N est utilisée pour les performances des participants natifs de l’anglais, et les lettres NN
pour les participants natifs de l’espagnol. (Extraite de Cooke et al., 2008).
2.2. Masqueurs paroliers dans une L2 versus dans une langue native
Dans la situation de la parole dans la parole, nous pouvons faire varier le niveau de
connaissances des participants pour la langue de la parole cible : les participants identifient la
parole cible produite dans leur langue native ou dans leur L2. Nous venons de voir que
l’intelligibilité d’une langue seconde est plus difficile que celle d’une langue native, quelque
soit la nature du bruit concurrent.
Il est également possible de faire varier le niveau de connaissances des participants pour la
langue des masqueurs paroliers. Jusqu’à présent (partie B), nous avons présenté des travaux
dont l’objectif était de mettre en évidence un effet de masque informationnel en manipulant la
langue des masqueurs paroliers ; celle-ci correspondait à la langue native des participants ou à
une langue qui leur était inconnue. Ainsi, les informations linguistiques présentes dans les
masqueurs paroliers étaient soit intelligibles, soit inintelligibles. Nous allons décrire l’étude de
Van Engen (2010), dans laquelle des masqueurs paroliers ont été générés dans deux langues
intelligibles pour les participants, leur langue native et leur langue seconde.
Partie théorique Intelligibilité de la parole dans une langue seconde
53
Van Engen (2010) a testé deux groupes de participants, des participants natifs du
mandarin qui parlent l’anglais comme L2, ainsi que des participants natifs de l’anglais. Dans
un premier temps, afin de régler le RSB, des phrases cibles anglaises insérées dans des
masqueurs de bruit stationnaire ont été présentées aux deux groupes de participants. L’auteur
utilise ainsi le « Hearing In Noise Test » (HINT, Nilsson, Soli & Sullivan, 1994) qui permet
d’estimer les valeurs de RSB pour lesquelles les participants peuvent identifier correctement
50% des mots constituant les phrases cibles. Van Engen a constaté qu’un RSB plus élevé était
nécessaire pour les participants natifs du mandarin que pour les participants natifs de
l’anglais, confirmant que les masqueurs sont plus efficaces lorsqu’il s’agit d’identifier de la
parole cible produite dans une L2 plutôt que dans une langue native. Voir la Figure 10 ci-
dessous.
Figure 10 : Valeurs de RSB nécessaires à 50% d’identifications correctes des phrases cibles,
pour les participants natifs de l’anglais (« English listeners ») et natifs du mandarin
(« Mandarin listeners »). (Extraite de Van Engen, 2010).
A l’issue de ce test, Van Engen a retenu deux valeurs de HINT (« RSB de base »), une pour
chaque groupe de participants. Ces valeurs de HINT ont été modulées de -6 dB à +3 dB, par
pas de 3 dB (HINT -6 dB, HINT -3dB, HINT +0 dB, HINT +3 dB). Ce procédé permet de
s’intéresser à l’effet de RSB sans se focaliser sur sa valeur.
Dans un deuxième temps, des phrases cibles anglaises étaient insérées dans des masqueurs
paroliers à 2 locuteurs générés en mandarin ou en anglais. Ainsi, pour les participants natifs
de l’anglais, la parole cible était produite dans leur langue native ; les masqueurs paroliers ont
été générés dans leur langue native (anglais) ou dans une langue inconnue (mandarin).
Partie théorique Intelligibilité de la parole dans une langue seconde
54
Concernant les participants natifs du mandarin qui parlent l’anglais comme L2, la parole cible
était produite dans leur L2, et les masqueurs paroliers étaient générés dans leur langue native
(mandarin) ou dans leur L2 (anglais) ; les informations linguistiques étaient intelligibles pour
les deux types de masqueurs. Les résultats sont représentés dans la Figure 11 ci-dessous.
Figure 11 : Pourcentages de mots cibles correctement identifiés en présence des masqueurs
paroliers anglais (« English babble ») et mandarins (« Mandarin babble »), pour les quatre
valeurs de HINT sélectionnées. Les performances des participants natifs de l’anglais sont
reportées à gauche, celles des participants natifs du mandarin à droite. (Extraite de Van
Engen, 2010).
Concernant les participants natifs de l’anglais, ils ont obtenu des performances
significativement plus élevées lorsque la langue des masqueurs paroliers était inintelligible
(mandarin) plutôt qu’intelligible (anglais). Cet effet de la langue des masqueurs a été observé
pour les valeurs de HINT les plus élevées. Concernant les participants natifs du mandarin qui
ont réalisé la tâche avec de la parole cible produite dans leur L2 (anglais), de meilleures
performances ont été observées avec les masqueurs paroliers en mandarin plutôt qu’en
anglais, et ce, uniquement pour les valeurs extrêmes de HINT (valeurs la plus basse et la plus
élevée). Autrement dit, les masqueurs paroliers produits dans la L2 des participants (anglais)
ont été plus efficaces que les masqueurs paroliers générés dans leur langue native (mandarin).
Il ressort de cette étude que les masqueurs paroliers générés dans la langue native des
participants et ceux générés dans leur langue seconde n’ont pas affecté de façon équivalente
l’intelligibilité de la parole cible produite dans la langue seconde des participants.
Dans cette thèse, nous manipulerons le niveau de connaissances des participants pour
la langue de la parole cible ainsi que le niveau de connaissances des participants pour la
Partie théorique Intelligibilité de la parole dans une langue seconde
55
langue des masqueurs paroliers. Nous testerons deux groupes de participants : des participants
natifs du français qui parlent l’italien comme L2 et des participants natifs de l’italien qui
parlent le français comme L2. Des mots cibles français seront insérés dans des masqueurs
paroliers générés en français, en irlandais et en italien. Ainsi, les participants natifs du français
devront identifier des mots cibles produits dans leur langue native alors que les participants
natifs de l’italien réaliseront la tâche dans leur L2. Concernant les masqueurs paroliers, ils
seront générés dans la langue native des participants (groupe 1 : français, groupe 2 : italien),
dans leur langue seconde (groupe 1 : italien, groupe 2 : français) ou dans une langue qui leur
est inconnue (groupes 1 et 2 : irlandais). Nous explorerons ainsi la situation de la parole dans
la parole lorsque le message cible sera produit dans la langue native ou dans la L2 des
participants, et nous déterminerons dans quelle situation d’écoute les interférences
linguistiques seront les plus efficaces (masqueurs paroliers générés dans la langue native, dans
la langue seconde ou dans une langue inconnue).
Partie théorique Synthèse et problématique générale
56
D) SYNTHESE ET PROBLEMATIQUE GENERALE
1. Synthèse
La situation de la parole dans la parole représente une situation d’écoute écologique.
Ainsi elle a suscité l’intérêt de nombreuses études, essentiellement dans le domaine de la
psycho-acoustique mais aussi, comme nous l’avons vu, dans le domaine de la
psycholinguistique.
Dans la situation de la parole dans la parole, deux types d’effets de masque ont été définis : un
effet de masque énergétique, qui correspond à des interférences entre les informations
spectrales et temporelles des signaux en compétition ; et un effet de masque informationnel
pour lequel des interférences interviennent entre les informations linguistiques des signaux
concurrents.
Un ensemble d’études s’est focalisé sur les phénomènes de ségrégation entre le signal
cible et le signal concurrent. Plus la ségrégation est facilitée, plus l’intelligibilité du message
cible est bonne. Plusieurs indices peuvent aider l’auditeur à réaliser la ségrégation. Nous
avons évoqué :
(a) le Rapport Signal sur Bruit entre le signal cible et le signal concurrent : plus le niveau
sonore du signal cible est élevé par rapport au niveau sonore du signal concurrent, plus
l’intelligibilité du signal cible est meilleure ;
(b) le nombre de locuteurs dans les masqueurs : plus il est important, plus l’effet de masque
du signal concurrent est efficace, ce qui réduit l’intelligibilité du message cible ;
(c) la fréquence fondamentale (F0) des différents locuteurs : l’intelligibilité du message cible
est améliorée lorsque le locuteur du signal cible et celui des masqueurs ont une F0 différente ;
(d) la localisation spatiale du signal concurrent par rapport à celle du signal cible : plus le
signal concurrent est éloigné du signal cible, plus les performances sont élevées.
Certains paramètres de la situation de la parole dans la parole ont été manipulés afin de
mettre en évidence un effet de masque informationnel. Notamment, différents types de
masqueurs ont été générés en plus des masqueurs paroliers : des masqueurs de bruit
stationnaire et des masqueurs de bruit fluctuant. Ces deux types de masqueurs sont générés à
Partie théorique Synthèse et problématique générale
57
partir de masqueurs paroliers, le bruit stationnaire n’en conserve que les informations
spectrales et le bruit fluctuant conserve les informations spectrales ainsi que les fluctuations
temporelles. C’est en observant des performances significativement plus faibles avec les
masqueurs paroliers plutôt qu’avec les masqueurs de bruit stationnaire ou de bruit fluctuant
que l’effet de masque informationnel produit par les masqueurs paroliers est mis en lumière ;
ces masqueurs étant les seuls à posséder des informations linguistiques.
Un effet masque informationnel a également été observé en faisant varier la langue dans
laquelle les masqueurs paroliers sont générés ; il peut s’agir de la langue native des
participants ou d’une langue qui leur est inconnue. L’intelligibilité de la parole cible est
meilleure avec des masqueurs paroliers produits dans une langue non connue ; les
informations linguistiques n’étant pas intelligibles pour les participants, elles n’interfèrent pas
sur l’intelligibilité de la parole cible.
Enfin, certains travaux ont cherché à identifier quels types d’informations
linguistiques interfèrent sur l’intelligibilité du message cible : les informations
sémantiques, les mots, les syllabes, les phonèmes. Nous avons présenté une première étude
(Boulenger et al., 2010) qui a mis en évidence des interférences d’ordre lexical en faisant
varier la fréquence d’occurrence des mots présents dans les masqueurs paroliers.
L’intelligibilité du message cible était plus élevée lorsque les masqueurs paroliers étaient
composés de mots peu fréquents que lorsqu’ils étaient composés de mots très fréquents, ces
derniers étant de plus forts compétiteurs. Dans une seconde étude (Brouwer et al., 2012), ce
sont des interférences sémantiques qui ont été mises en avant. Les masqueurs paroliers au
contenu sémantique incongru ont moins affecté l’intelligibilité du message cible que les
masqueurs paroliers dont le contenu sémantique était acceptable.
2. Problématique
Dans cette thèse, nous examinerons les interférences linguistiques qui interviennent
dans la situation de la parole dans la parole et nous chercherons à les caractériser. Notre
démarche se fera en trois étapes :
1) Lors de la première étape, des mots cibles français seront insérés dans des masqueurs
paroliers générés en français (langue native des participants) ou en gaélique irlandais (langue
Partie théorique Synthèse et problématique générale
58
inconnue). Notre objectif sera de vérifier que les résultats obtenus avec de la parole cible en
français répliquent ceux observés dans la littérature, à savoir un effet de masque plus
important pour des masqueurs paroliers produits dans la langue native des participants plutôt
que pour des masqueurs paroliers produits dans une langue inconnue. Nous manipulerons
également certains paramètres de la situation d’écoute, tels que le RSB entre le signal cible et
le signal concurrent ainsi que le nombre de locuteurs dans les masqueurs paroliers. Il sera
question d’identifier les conditions expérimentales qui nous permettront, dans les étapes
suivantes, d’explorer le plus favorablement possible les interférences linguistiques.
2) Dans la seconde étape, nous chercherons à déterminer s’il nous est possible de repérer
des interférences phonémiques dans la situation de la parole dans la parole. Pour cela, les
mots cibles seront insérés dans des masqueurs paroliers en français (langue native) ainsi que
dans des masqueurs paroliers en gaélique irlandais et en italien (deux langues inconnues).
Ainsi, le pourcentage de phonèmes communs entre la langue des masqueurs paroliers et la
langue native des participants sera manipulé (100% avec les masqueurs paroliers français,
80% avec ceux en italien, 18% avec ceux en irlandais). Nous testerons l’hypothèse selon
laquelle plus ce pourcentage est élevé, plus les interférences phonémiques seront importantes.
Nous utiliserons également des masqueurs de bruit fluctuant qui nous permettront d’analyser
plus finement l’hypothèse des compétitions phonémiques.
3) Enfin, dans la dernière étape, le niveau de connaissances des participants pour les
langues des masqueurs paroliers sera manipulé. Au lieu de ne tester que des participants
monolingues, nous présenterons notre paradigme expérimental à des participants natifs du
français qui parlent l’italien comme langue seconde, ainsi qu’à des participants natifs de
l’italien qui parlent le français comme langue seconde. Nous chercherons à déterminer si les
masqueurs paroliers générés dans la langue seconde et dans la langue native des participants
interfèreront de façon équivalente sur l’intelligibilité du message cible. Tester des participants
natifs de l’italien qui parlent le français comme langue seconde sera l’opportunité d’explorer
la situation de la parole dans la parole lorsque le message cible est produit dans une langue
seconde.
59
60
PARTIE EXPERIMENTALE
61
Partie expérimentale Expérience 1
62
E) EXPERIENCE 1
1. Objectifs
Dans cette thèse, nous nous intéressons aux interférences linguistiques qui
interviennent dans la situation de la parole dans la parole. Dans la partie théorique, nous avons
décrit des études qui ont manipulé la langue des masqueurs paroliers afin d’examiner les
interférences linguistiques. Il s’agissait d’utiliser la langue native des participants ou une
langue qui leur était inconnue. La parole cible, quant à elle, était produite dans leur langue
native. Il a été montré que l’intelligibilité de la parole cible est réduite lorsque la langue de la
parole concurrente est intelligible pour les participants plutôt que non intelligible. Ces travaux
ont été menés avec de la parole cible produite en allemand (Rhebergen et al., 2005) ou en
anglais (Garcia Lecumberri & Cooke, 2006 ; Van Engen & Bradlow, 2007 ; Calandruccio et
al., 2010b). Dans notre première expérience, nous explorerons la situation de la parole dans la
parole avec des mots cibles en français. Nous vérifierons que l’intelligibilité des mots cibles
français sera plus faible avec des masqueurs paroliers en français (langue native des
participants) plutôt qu’avec des masqueurs paroliers en gaélique irlandais, langue non connue
des participants (et donc non intelligible). Dans ce cas, nous aurons confirmé l’effet de la
langue des masqueurs mis en évidence dans la littérature.
Nous manipulerons également le Rapport Signal sur Bruit (RSB) entre les mots cibles
et les masqueurs paroliers ainsi que le nombre de locuteurs présents dans les masqueurs
paroliers. Nous utiliserons des valeurs de RSB de 0 dB et de -5 dB. En effet pour ces valeurs,
Van Engen & Bradlow (2007) ont observé des différences significatives entre les
performances obtenues avec les masqueurs paroliers en anglais (langue native) et celles
obtenues avec les masqueurs paroliers en mandarin (langue non connue). Dans notre
expérience, nous nous attendons tout d’abord à ce que les performances des participants
soient plus élevées à 0 dB plutôt qu’à -5 dB ; la situation d’écoute étant plus favorable avec
un RSB à 0 dB plutôt qu’à -5 dB puisque le niveau sonore des mots cibles sera équivalent à
celui des masqueurs paroliers plutôt qu’inférieur. Ensuite, dans le cas où l’effet de la langue
des masqueurs (français versus irlandais) est observé, nous examinerons s’il sera influencé par
Partie expérimentale Expérience 1
63
le RSB : sera-t-il plus important pour une des deux valeurs de RSB manipulées (0 dB ou -5
dB) ?
Concernant le nombre de locuteurs présents dans les masqueurs paroliers, nous nous
appuierons sur les résultats des études de Van Engen & Bradlow (2007) et de Hoen et al.
(2007) et nous utiliserons des masqueurs paroliers à 2 et à 4 locuteurs. En effet, c’est avec 2
locuteurs dans les masqueurs que Van Engen & Bradlow (2007) ont observé des différences
significatives entre les performances obtenues avec les masqueurs paroliers anglais et celles
avec les masqueurs paroliers mandarins. Avec 6 locuteurs dans les masqueurs paroliers,
l’effet de la langue des masqueurs n’était plus présent. Ce résultat est dû au fait qu’avec 2
locuteurs, les informations linguistiques présentes dans les masqueurs paroliers sont plus
accessibles qu’avec 6 locuteurs et peuvent davantage interférer sur l’intelligibilité de la parole
cible. Plus le nombre de locuteurs dans le masqueur parolier augmente, plus la saturation
spectro-temporelle du signal est importante, ce qui réduit l’accès aux informations
linguistiques du masqueur parolier et l’effet de masque de ce dernier.
De leur côté, Hoen et al. (2007) ont évalué l’intelligibilité de mots cibles français dégradés par
des masqueurs paroliers français à 4, 6 et 8 locuteurs. Avec les masqueurs paroliers à 4
locuteurs, les participants ont retranscrit des mots présents dans les masqueurs paroliers à la
place des mots cibles. Ce type d’erreurs de retranscriptions n’a pas été observé avec les
masqueurs paroliers à 6 et 8 locuteurs. Les résultats de cette étude montrent, comme ceux de
l’étude de Van Engen & Bradlow (2007), qu’à partir d’un certain nombre de locuteurs dans le
masqueur, 6 locuteurs, l’accès aux informations linguistiques du signal concurrent est réduit,
rendant ainsi leur effet de masque plus faible. Nous utiliserons donc également des masqueurs
paroliers à 4 locuteurs.
Dans notre expérience, nous observerons si l’effet de la langue des masqueurs paroliers est
présent pour les masqueurs paroliers à 2 et 4 locuteurs et s’il varie en fonction du nombre de
locuteurs.
L’Expérience 1 a donc pour objectif de vérifier s’il est possible de répliquer l’effet de
la langue des masqueurs avec de la parole cible en français. La présence de cet effet nous
permettra d’observer un effet de masque informationnel et donc un effet des interférences
linguistiques. Il est aussi question de définir une situation expérimentale pertinente et adaptée
qui nous permette dès l’Expérience 2, d’explorer plus avant la nature des informations
linguistiques qui interfèrent sur l’intelligibilité du message cible. C’est pourquoi, pour le RSB
Partie expérimentale Expérience 1
64
comme pour le nombre de locuteurs dans les masqueurs, nous manipulerons deux valeurs, 0
dB et -5 dB, 2 et 4 locuteurs. Pour la suite de nos travaux, nous conserverons les valeurs pour
lesquelles l’effet de la langue des masqueurs aura été le plus important, c’est-à-dire que nous
sélectionnerons les conditions d’écoute les plus favorables à l’étude des interférences
linguistiques.
2. Méthode
2.1. Stimuli
Cent trente-six stimuli ont été générés dans l’Expérience 1, en mixant chacun des 136
mots cibles à un masqueur parolier (composé de 2 ou de 4 locuteurs) qui était produit en
français ou en irlandais.
2.1.1. Mots cibles
Cent trente-six mots français dissyllabiques (annexe 1) ont été sélectionnés dans la
base de données Lexique 2 (New et al., 2004). La fréquence moyenne de ces noms communs
variait de 0,20 à 566,49 occurrences par million de mots ; la moyenne étant de 31,16 et
l’écart-type de 75,36.
Ces mots ont été prononcés par une locutrice de langue maternelle française âgée de 28 ans,
différente des locutrices enregistrées pour générer les masqueurs paroliers français.
L’enregistrement s’est déroulé dans une salle insonorisée du laboratoire Dynamique Du
Langage à Lyon à l’aide d’un microphone (Micro SE 2200A) et du logiciel enregistreur
Audacity. Chaque mot était sauvegardé dans un fichier au format .wav indépendant. Les
fichiers ont ensuite été normalisés à l’aide du logiciel Praat (Boersma & Weenink, 2013) ;
l’intensité moyenne de chacun des signaux (RMS) était mesurée puis ramenée à 70 dB-A,
niveau sonore moyen d’une discussion.
2.1.2. Masqueurs paroliers
Partie expérimentale Expérience 1
65
Le roman Le Petit Prince, d’Antoine de Saint Exupéry, a été choisi pour réaliser les
masqueurs paroliers. Ce roman a été sélectionné car il a été traduit par des professionnels dans
de nombreuses langues dont le gaélique irlandais.
Les chapitres 1, 4, 5, 8 et 16 ont été sélectionnés car ils comportent peu de dialogues. Le but
étant d’obtenir des phrases avec peu d’intonation afin que certaines phrases du masqueur
n’attirent pas davantage l’attention du participant que d’autres phrases du masqueur. Ces
chapitres ont été enregistrés en français et en gaélique irlandais.
Masqueurs paroliers en français
Quatre locutrices et 6 locuteurs de langue maternelle française âgés de 22 à 32 ans ont
lu les chapitres sélectionnés. Les enregistrements étaient individuels et ont eu lieu dans une
salle insonorisée du laboratoire Dynamique Du Langage à Lyon. Le matériel était composé
d’un microphone (Micro SE 2200A) et du logiciel enregistreur Audacity. Chaque chapitre
constituait une piste et était sauvegardé au format .wav. Les enregistrements de chacun des
locuteurs ont été écoutés à l’aide du logiciel Praat. Les enregistrements de 2 locutrices et de 2
locuteurs dont le style parolier était standard et le plus naturel (pas de prosodie exagérée, pas
d’accent régional) ont été conservés.
Masqueurs paroliers en gaélique irlandais
Trois locutrices et 3 locuteurs de langue maternelle gaélique âgés de 20 à 31 ans ont lu
les chapitres sélectionnés. Les enregistrements étaient individuels et ont eu lieu dans une salle
d’enregistrements de musiques à la Radio Gaélique à Dublin. Le matériel était composé de
l’enregistreur numérique Zoom H2. Chaque chapitre constituait une piste et était sauvegardé
au format .wav. Les enregistrements de 2 locutrices et de 2 locuteurs ont été sélectionnés
selon les mêmes critères que pour les voix des masqueurs français.
Pour les 2 langues manipulées (français et gaélique irlandais), les enregistrements de
chacun des 4 locuteurs ont été traités avec Praat selon le protocole suivant : (a) suppression
des silences et des pauses excédant 500 ms, de façon à ce que l’apparition d’un mot cible ne
coïncide pas avec des minima d’énergie (phénomène appelé « écoute dans les vallées »,
Festen & Plomp, 1990 ; Gnansia et al., 2009) présents dans les fluctuations temporelles du
masqueur parolier ; (b) suppression des phrases contenant des erreurs de prononciation ou des
noms propres ; (c) normalisation du niveau sonore à 70 dB-A.
Partie expérimentale Expérience 1
66
Afin d’éviter des différences dans les caractéristiques vocales des locutrices et des locuteurs
sélectionnés à travers les deux langues manipulées (français et gaélique irlandais), les
fréquences fondamentales (F0) des voix féminines françaises et irlandaises ont été
normalisées aux plus proches valeurs suivantes : 205 Hz et 225 Hz ; les voix masculines
françaises et irlandaises ont été normalisées aux plus proches valeurs de : 105 Hz et 125 Hz.
Ceci a été réalisé en utilisant le « built-in pitch manipulation tool » dans Praat. Les voix
féminines étaient fixées à des valeurs de F0 (205 Hz et 225 Hz) différentes de celle de la voix
cible (240 Hz) afin d’éviter des problèmes de ségrégation de la voix cible féminine parmi les
voix féminines concurrentes. Chaque enregistrement de chacun des locuteurs a ensuite été
attentivement écouté afin de vérifier que la normalisation ne les ait pas dégradés.
Un programme informatique réalisé sous Praat nous a permis d’extraire de façon aléatoire des
séquences de 4 secondes parmi les enregistrements de chacun des locuteurs dans les deux
langues manipulées. A partir de ces séquences de 4 secondes, nous avons généré des
masqueurs à 2 voix et à 4 voix en français et en gaélique irlandais. Les masqueurs français à 2
voix ont été générés en mixant une séquence de 4 sec de chacune des 2 locutrices (séquences
sélectionnées de façon aléatoire). La même procédure a été appliquée pour obtenir les
masqueurs irlandais à 2 voix. Les masqueurs français à 4 voix étaient le résultat du mixage
d’une séquence de 4 sec de chacun des 4 locuteurs. De même pour les masqueurs irlandais à 4
voix.
Afin de ne pas présenter plusieurs fois les mêmes séquences de masqueurs paroliers, 34
masqueurs paroliers à 2 locuteurs différents et 34 masqueurs paroliers à 4 locuteurs différents
ont été générés dans chacune des 2 langues (français et irlandais).
Chaque mot cible a été inséré à 2,5 sec du début d’un masqueur de 4 sec à l’aide du logiciel
Matlab. Tous les participants ont ainsi été exposés pendant la même durée au masqueur
parolier seul avant que le mot cible ne soit présenté, comme le montre la Figure 12.
Le Rapport Signal sur Bruit (RSB) a été fixé en utilisant à nouveau Matlab. Une condition
expérimentale (RSB à 0 dB) consistait à présenter les mots cibles avec le même niveau sonore
que les masqueurs et dans ce cas le stimulus (mot cible inséré dans un masqueur) était à 70
Partie expérimentale Expérience 1
67
dB. Dans l’autre condition expérimentale (RSB à -5 dB), les mots cibles avaient un niveau
sonore inférieur que celui des masqueurs paroliers, dans ce cas les mots cibles étaient à 65 dB
et les masqueurs paroliers à 70 dB.
Figure 12 : Mot cible inséré à 2,5 sec dans un masqueur parolier de 4 sec à 4 voix (deux
femmes et deux hommes).
2.2. Conditions expérimentales
Dans l’Expérience 1, les variables manipulées étaient :
- L le facteur fixe à mesures répétées « Langue des masqueurs » à 2 modalités, français et
gaélique irlandais ;
- N le facteur fixe à mesures répétées « Nombre de locuteurs » dans le masqueur à 2
modalités, 2 locuteurs et 4 locuteurs ;
- R le facteur fixe à mesures répétées « Rapport Signal sur Bruit » à 2 modalités, -5 dB et 0
dB ;
- P le facteur aléatoire « Participants » à 40 modalités.
Il en résulte le plan expérimental suivant : P40*L2*N2*R2. Nous avions donc 8 conditions
expérimentales. Le plan d’analyse était identique au plan expérimental. La variable
dépendante correspondait au pourcentage de mots cibles correctement retranscrits.
Partie expérimentale Expérience 1
68
2.3. Liste de mots
Parmi les 136 mots cibles sélectionnés, 8 ont été utilisés pour la phase d’entraînement,
un mot pour illustrer chaque condition expérimentale. Pour s’assurer que les 128 mots cibles
restants soient présentés dans chacune des 8 conditions expérimentales, 8 listes
expérimentales différentes ont été générées. Par exemple dans la liste 1, le mot « ballon » a
été présenté dans la condition « masqueur français, 2 locuteurs, -5 dB », dans la liste 2,
« ballon » a été présenté dans la condition « masqueur français, 2 locuteurs, 0 dB », dans la
liste 3 il a été présenté dans la condition « masqueur français, 4 locuteurs, -5 dB ». Dans les
listes 4, 5, 6, 7 et 8, il a été présenté respectivement, dans les conditions « masqueur français,
4 locuteurs, 0 dB », « masqueur irlandais, 2 locuteurs, -5 dB », « masqueur irlandais, 2
locuteurs, 0 dB », « masqueur irlandais, 4 locuteurs, -5 dB », « masqueur irlandais, 4
locuteurs, 0 dB ». Ainsi, à travers les 8 listes, chacun des 128 mots cibles a été présenté dans
toutes les conditions expérimentales. Chaque participant n’entendait qu’une seule liste de
sorte que les mots cibles ne soient présentés qu’une fois pour éviter les effets de répétition.
Ainsi, nous avions dans chacune des listes, 16 mots par condition expérimentale. A l’intérieur
de chacune des listes, l’ordre de présentation des stimuli (un mot cible inséré dans un
masqueur) était randomisé à chaque passation.
2.4. Procédure expérimentale
Les participants ont été testés individuellement dans une salle d’expérimentation face à
un écran d’ordinateur. Ils portaient un casque audio (Sennheiser HD 448) avec lequel les
stimuli ont été délivrés de façon diotique (présentation identique pour chacune des deux
oreilles) à un niveau d’écoute confortable (65 dB SPL), contrôlé à l’aide d’une oreille
artificielle. Le logiciel DMDx (Forster & Forster, 2003) a été utilisé pour la présentation des
stimuli. La tâche des participants consistait à écouter les stimuli, repérer le mot cible et le
retranscrire. La consigne était donnée oralement puis apparaissait à l’écran au début de
l’expérience.
« Une étoile va s’afficher au centre de l’écran. Puis vous entendrez une séquence sonore
composée d’un mot cible présenté dans différents types de bruits. Vous devez repérer ce mot.
Puis ‘Répondez’ s’inscrira sur l’écran. Vous devez écrire le mot que vous avez entendu.
Appuyez sur la barre espace pour passer à la séquence suivante ».
Partie expérimentale Expérience 1
69
Chaque stimulus ne pouvait être entendu qu’une seule fois. Avant la phase test, l’expérience a
débuté par une phase d’entraînement durant laquelle les participants se familiarisaient au
mode de présentation des stimuli et à la voix cible. Chaque participant avait la possibilité de
débuter l’expérience dès qu’il le souhaitait en appuyant sur la barre espace. Il appuyait à
nouveau sur celle-ci après avoir retranscrit chaque mot cible, le stimulus suivant démarrait.
Les participants n’étaient pas limités dans le temps. L’expérience durait de 30 à 40 minutes.
2.5. Participants
Quarante participants de langue maternelle française, âgés de 18 à 30 ans ont passé
l’Expérience 1. Aucun ne connaissait le gaélique irlandais, aucun n’avait reçu d’enseignement
de cette langue. De plus, aucun ne souffrait de trouble auditif ni de trouble du langage. Tous
étaient volontaires et ont été dédommagés pour leur participation.
3. Résultats
Tous les participants et tous les mots cibles de la phase test ont été inclus dans
l’analyse, soit 40 participants et 128 mots cibles. Les réponses écrites des participants ont été
codées (soit correctes, soit fausses) puis transformées en performances numériques. Le
pourcentage de retranscriptions correctes par participant a été ainsi obtenu.
Les fautes d’orthographe n’ont pas été prises en compte dès lors qu’une syllabe était restituée
correctement au niveau phonologique. Par exemple, l’item « crapaud » a été considéré comme
correcte même si celui-ci a été écrit « crapeau ».
Dans le but d’effectuer une analyse de variance sur nos données, nous avons réalisé une
transformation arcsinus RAU sur les performances brutes collectées (mot reconnu = 1, mot
non identifié = 0). Cette transformation est préconisée par Studebaker (1985) afin d’obtenir
une répartition gaussienne des données et entrer ainsi dans les critères de validité de
l’ANOVA. Cette transformation des données en arcsinus RAU est généralement appliquée
dans les études portant sur la situation de la parole dans la parole (voir par exemple Van
Engen & Bradlow, 2007).
Partie expérimentale Expérience 1
70
Une analyse de variance à mesures répétées a été menée sur les scores RAU, en considérant
comme variable aléatoire les participants et comme variables intra-sujets : la Langue des
masqueurs (à 2 modalités : le français et le gaélique irlandais), le Nombre de locuteurs (à 2
modalités : 2 et 4 locuteurs dans le masqueur) et le Rapport Signal sur Bruit (à 2 modalités : -
5 dB et 0 dB). Cette ANOVA a été réalisée sous le logiciel Statistica, comme toutes les
analyses de variance qui ont été effectuées dans la suite des travaux de cette thèse.
Pour la clarté, les pourcentages de réponses correctes ont été utilisés pour décrire et
représenter graphiquement les données. Ils sont notamment reportés dans le Tableau 4.
Tableau 4 : Pourcentages moyens de retranscriptions correctes des mots cibles français
obtenus dans chacune des huit conditions expérimentales. Les écart-types sont également
indiqués.
Masqueurs paroliers irlandais Masqueurs paroliers français
-5 dB 0 dB -5 dB 0 dB
Nb locuteurs 2 4 2 4 2 4 2 4
Moyennes 60,56 55,64 91,58 91,56 38,75 35,16 79,84 84,24
Ecart-types 11,60 13,66 6,83 6,42 12,60 15,16 11,37 8,45
3.1. Effets principaux
Effet de la Langue des masqueurs
Les résultats ont montré un effet principal de la Langue des masqueurs de 15,33% qui
est apparu significatif à l’analyse de variance (F(1,39) = 202.39, p < .001). En moyenne, les
pourcentages de retranscriptions correctes étaient plus faibles lorsque les masqueurs paroliers
étaient produits en français (59,5% ; écart-type (ET) = 25,69) plutôt qu’en gaélique irlandais
(74,83% ; ET = 19,64).
Effet du Rapport Signal sur Bruit
Les résultats ont également indiqué un effet principal du Rapport Signal sur Bruit de
39%. Cet effet est apparu significatif à l’analyse de variance (F(1,39) = 873.59, p < .001). De
plus faibles performances ont été obtenues lorsque le RSB était fixé à -5 dB (47,52% ; ET =
17,06) plutôt qu’à 0 dB (86,81% ; ET = 9,8).
Partie expérimentale Expérience 1
71
Effet du Nombre de locuteurs
L’analyse de variance n’a révélé aucun effet significatif du Nombre de locuteurs dans
le masqueur (F(1,39) = 0.68, n.s.). En effet, les performances moyennes des participants
étaient très proches qu’il y ait 2 locuteurs (67,69% ; ET = 22,79) ou 4 locuteurs concurrents
(66,64% ; ET = 25,38).
3.2. Interactions simples et double
Langue des masqueurs * RSB
L’ANOVA nous a indiqué une interaction simple significative entre le facteur Langue
des masqueurs et le facteur RSB (F(1,39) = 22.23, p < .001). Les comparaisons post-hoc
réalisées avec le test HSD de Tukey ont montré que l’effet de la Langue des masqueurs était
significatif à -5 dB (p = .0001) ainsi qu’à 0 dB (p = .0001). Comme le montre la Figure 13,
l’effet de la Langue des masqueurs était plus important à -5 dB (21%) plutôt qu’à 0 dB (10%).
Figure 13 : Effet de la Langue des masqueurs paroliers (français et gaélique irlandais) sur les
pourcentages moyens de retranscriptions correctes des mots cibles en fonction du RSB (-5 dB
et 0 dB). Les erreurs standard ont été reportées. Le symbole ‘ * ’ signale une différence
significative entre les masqueurs paroliers français et irlandais à -5 dB ainsi qu’à 0 dB.
Partie expérimentale Expérience 1
72
RSB * Nombre de locuteurs
L’ANOVA a mis en évidence une interaction simple significative entre les facteurs
RSB et Nombre de locuteurs (F(1,39) = 5.79, p = .02). Les comparaisons post-hoc réalisées
avec le test HSD de Tukey ont montré que l’effet du RSB était significatif avec 2 locuteurs
dans le masqueur (p = .0001) ainsi qu’avec 4 locuteurs (p = .0001). Cet effet du RSB était de
43% avec 4 locuteurs et de 38% avec 2 locuteurs.
Langue des masqueurs * Nombre de locuteurs
L’interaction simple entre le facteur Langue des masqueurs et le facteur Nombre de
locuteurs n’est pas ressortie significative lors de l’ANOVA (F(1,39) = 1.82, n.s.).
L’analyse de variance n’a pas révélé d’interaction double significative entre les trois facteurs
manipulés (F(1,39) = 0,49, n.s.).
4. Discussion
4.1. Rappel des objectifs
L’Expérience 1 a évalué l’intelligibilité de mots cibles français insérés dans des
masqueurs paroliers composés de 2 ou de 4 locuteurs qui parlaient dans la langue native des
participants (français) ou dans une langue qui leur était inconnue (gaélique irlandais). Le
niveau sonore des mots cibles était identique à celui des masqueurs paroliers (0 dB) ou
inférieur (-5 dB).
Tout d’abord, nous voulions déterminer si l’intelligibilité des mots cibles français serait plus
faible avec les masqueurs paroliers français plutôt qu’avec les masqueurs paroliers irlandais.
Nous voulions aussi vérifier que les performances des participants seraient plus faibles avec
un RSB de -5 dB entre les mots cibles et les masqueurs paroliers plutôt qu’avec un RSB à 0
dB. Dans le cas où l’effet de la Langue des masqueurs serait significatif, il était question de
déterminer si cet effet serait plus important pour une des deux valeurs de RSB (-5 dB et 0 dB).
Il s’agissait enfin d’examiner si le nombre de locuteurs dans le masqueur (2 ou 4 locuteurs)
allait faire varier l’effet de la Langue des masqueurs.
Partie expérimentale Expérience 1
73
4.2. Effet de la Langue des masqueurs
L’analyse des résultats a mis en évidence une plus faible intelligibilité des mots cibles
français lorsque les masqueurs paroliers étaient produits en français plutôt qu’en gaélique
irlandais. Autrement dit, la situation d’écoute était plus difficile lorsque les masqueurs
paroliers étaient produits dans la langue native des participants (français) plutôt que dans une
langue qui leur était inconnue (gaélique irlandais).
Cet effet de la Langue des masqueurs a tout d’abord été mis en évidence par Rhebergen et al.
(2005), lorsque des participants natifs de l’allemand ont moins bien identifié des phrases
cibles allemandes dégradées par des masqueurs paroliers allemands plutôt que suédois (langue
inconnue des participants). L’effet de la Langue des masqueurs a également été testé auprès
de participants natifs de l’anglais lors de tâches d’intelligibilité de paroles cibles anglaises
(des consonnes dans l’étude de Garcia Lecumberri & Cooke (2006), des phrases pour Van
Engen & Bradlow (2007) et Calandruccio et al. (2010b)). L’effet a été retrouvé puisque de
plus faibles performances ont été observées avec les masqueurs paroliers générés dans la
langue native des participants (anglais) plutôt qu’avec les masqueurs générés dans une langue
inconnue des participants, telle que l’espagnol (Garcia Lecumberri & Cooke, 2006), le
mandarin (Van Engen & Bradlow, 2007), le croate (Calandruccio et al., 2010b). Dans
l’Expérience 1, nous avons confirmé l’effet de la Langue des masqueurs avec des participants
natifs du français et des mots cibles français.
Lorsque les masqueurs paroliers sont produits dans la langue native des participants, les
informations linguistiques présentes dans les masqueurs paroliers sont intelligibles et entrent
en compétition avec les informations linguistiques de la parole cible. Plus précisément,
certains mots vont être extraits des masqueurs paroliers et vont être identifiés. Pendant leur
identification, des candidats lexicaux vont être activés et vont entrer en compétition. Ces
compétitions linguistiques vont interférer sur l’identification des mots cibles. Les masqueurs
paroliers produisent alors un effet de masque informationnel qui s’ajoute à l’effet de masque
énergétique.
L’effet de masque informationnel a été exploré par Calandruccio, Dhar & Bradlow (2010a),
en proposant à des participants natifs de l’anglais une tâche d’intelligibilité avec des phrases
cibles anglaises et cinq types de masqueurs paroliers, chacun avec un niveau d’intelligibilité
différent. Plus précisément, pour deux conditions extrêmes d’intelligibilité, des masqueurs
Partie expérimentale Expérience 1
74
paroliers ont été générés en anglais (langue native des participants) ou en mandarin (langue
inconnue des participants) par des locuteurs natifs de ces langues (conditions expérimentales
identiques à celles testées dans l’étude de Van Engen & Bradlow (2007)). Les masqueurs
paroliers anglais étaient alors totalement intelligibles pour les participants et les masqueurs
paroliers en mandarin totalement inintelligibles. Pour trois conditions intermédiaires
d’intelligibilité, des masqueurs paroliers anglais faiblement, modérément et fortement
intelligibles ont été produits. Pour cela, les auteurs ont demandé à des locuteurs natifs du
mandarin de parler dans leur langue seconde : l’anglais. Leurs productions dans la langue
anglaise ont été définies comme étant faiblement, modérément ou fortement intelligibles. Ces
cinq conditions d’intelligibilité ont permis aux auteurs de tester l’hypothèse selon laquelle
l’intelligibilité de la parole cible diminuerait avec l’augmentation du niveau d’intelligibilité
des masqueurs paroliers. Les résultats ont révélé que la situation d’écoute était la plus difficile
avec les masqueurs paroliers anglais générés par les locuteurs natifs de l’anglais ; autrement
dit lorsque les masqueurs paroliers étaient totalement intelligibles. En ce qui concerne les
masqueurs paroliers anglais produits par les locuteurs natifs du mandarin (faiblement,
modérément et fortement intelligibles), l’intelligibilité des phrases cibles a significativement
diminué avec l’augmentation du niveau d’intelligibilité des masqueurs. Finalement, les
différences de performances observées dans cette étude peuvent être expliquées par le niveau
d’intelligibilité des masqueurs paroliers. Plus les masqueurs paroliers étaient intelligibles, plus
les interférences linguistiques entre les deux flux de parole concurrents étaient importantes
(effet de masque plus important), diminuant ainsi l’intelligibilité des phrases cibles.
Dans l’Expérience 1, lors du codage des réponses écrites des participants, nous avons
observé, parmi les erreurs commises, que des mots présents dans les masqueurs paroliers
français ont été retranscrits à la place des mots cibles français. Nous appelons ce type
d’erreurs de retranscription des intrusions. Ces dernières ont déjà été signalées dans les études
évoquées précédemment (notamment dans l’étude de Van Engen & Bradlow, 2007). Lorsque
les masqueurs paroliers sont générés dans une langue intelligible pour les participants, les
informations linguistiques de ces masqueurs paroliers, et plus précisément les mots, font
intrusion pendant le traitement de la parole cible.
A partir de ces observations, Van Engen & Bradlow (2007) ont voulu déterminer si les
interférences linguistiques ne concernaient que les informations du niveau lexical (mots) ou si
des informations du niveau sous-lexical (phonèmes, syllabes) seraient également impliquées.
Partie expérimentale Expérience 1
75
Pour répondre à cette question, les auteurs ont masqué des phrases cibles anglaises avec deux
types de masqueurs paroliers anglais : un premier type avec des phrases correctes, un second
type composé de phrases incorrectes obtenues en remplaçant certains mots par des pseudo-
mots (manipulation des onsets, codas ou voyelles). La tâche des participants étaient de
retranscrire les phrases cibles anglaises. Les résultats n’ont montré aucune différence
significative entre les performances obtenues avec les deux types de masqueurs paroliers
anglais, suggérant que les intrusions ne concerneraient pas uniquement les informations du
niveau lexical ; les informations sous-lexicales encore présentes dans les pseudo-mots
entreraient également en interférence lors du traitement des phrases cibles.
Cependant, les auteurs ont fait remarquer que les pseudo-mots utilisés dans cette expérience
étaient très similaires aux mots ; en effet, ils ont été obtenus en ne remplaçant que certains
phonèmes (par exemple la phrase : « Your tedious beacon lifted our cab » est devenue « Your
bedious reacon loofted our bab »). Cette similarité entre les pseudo-mots et les mots a pu
entraîner une activation du lexique lorsque les pseudo-mots étaient présentés. Ici, dans
l’exemple, le deuxième mot de la phrase sémantiquement correcte « tedious » a été remplacé
par le pseudo-mot « bedious », or le début de ce pseudo-mot a pu activer le mot « bed ».
Effectivement, les auteurs ont noté que les participants avaient fréquemment retranscrit des
mots existants qui ressemblaient aux pseudo-mots présents dans les masqueurs paroliers.
Cette similarité pourrait expliquer l’absence de différence entre les performances obtenues
avec les deux types de masqueurs (phrases correctes vs. phrases constituées de pseudo-mots).
Ainsi, afin de déterminer si les interférences linguistiques n’impliquent que des informations
du niveau lexical ou si des informations du niveau sous-lexical sont également impliquées,
d’autres paradigmes expérimentaux peuvent être élaborés. Dans l’Expérience 2, notre objectif
sera de tester si les interférences linguistiques ont lieu au niveau phonémique.
Pour les masqueurs paroliers produits dans une langue intelligible (français), nous
avons observé qu’un effet de masque informationnel était présent en plus d’un effet de
masque énergétique ; cela étant confirmé par le fait que certains mots présents dans les
masqueurs paroliers français ont été retranscrits à la place des mots cibles français. En
revanche, pour les masqueurs paroliers générés dans la langue inconnue des participants
(irlandais), les résultats ne nous permettent pas d’exclure la possibilité que ces masqueurs
paroliers puissent aussi produire un effet de masque informationnel. Les résultats ont
uniquement montré que les pourcentages de retranscriptions correctes étaient
Partie expérimentale Expérience 1
76
significativement plus élevés avec les masqueurs paroliers irlandais plutôt qu’avec les
masqueurs paroliers français, et qu’aucun mot appartenant aux masqueurs paroliers irlandais
n’a été retranscrit à la place des mots cibles français (cela étant expliqué par le fait que
l’irlandais est une langue inintelligible pour les participants). Or, nous pourrions envisager
que les phonèmes présents dans le signal de parole concurrent contribuent à la dégradation de
l’intelligibilité de la parole cible. En effet, chaque langue possède des phonèmes qui lui sont
propres et des phonèmes qu’elle partage avec d’autres langues. D’après Maddieson, Flavier,
Marsico & Pellegrino (2011), 18% des phonèmes français seraient présents dans l’inventaire
phonémique du gaélique irlandais. Ainsi, même si les informations lexicales des masqueurs
paroliers irlandais sont inintelligibles pour les participants, ces derniers pourraient traiter les
phonèmes français présents dans les masqueurs paroliers irlandais. Ces phonèmes entreraient
en compétition avec les phonèmes des mots cibles français. Dans l’Expérience 2, nous
testerons cette hypothèse plus avant.
4.3. Effet du Rapport Signal sur Bruit
L’Expérience 1 a mis en évidence un effet significatif du Rapport Signal sur Bruit
(RSB), avec des performances significativement plus faibles à -5 dB plutôt qu’à 0 dB. La
situation d’écoute était donc plus difficile lorsque le niveau sonore des mots cibles était
inférieur au niveau sonore des masqueurs paroliers plutôt qu’équivalent. Ceci est cohérent
avec les résultats observés dans la littérature selon lesquels l’intelligibilité de la parole cible
serait influencée par le niveau de RSB fixé entre les deux flux concurrents ; plus le niveau
sonore de la parole cible serait faible par rapport au niveau sonore de la parole concurrente
(plus le RSB est faible), plus l’intelligibilité de la parole cible serait réduite. Par exemple,
dans une tâche d’intelligibilité de phrases cibles anglaises dégradées par des masqueurs
paroliers anglais composés de 2 ou de 3 locuteurs, Brungart (2001) a fait varier le RSB entre
les deux flux de parole concurrents par pas de 3 dB, de +15 dB à -12 dB. Il a observé une
diminution progressive des performances à mesure que le RSB diminuait. Hoen et al. (2007)
se sont également intéressés à cet effet du RSB en fixant le RSB entre des mots cibles français
et des masqueurs paroliers français à +6, +3, 0 ou -3 dB. La difficulté à récupérer le message
cible a augmenté progressivement avec la diminution du RSB.
Partie expérimentale Expérience 1
77
Les résultats de l’Expérience 1 ont également montré une interaction significative entre les
facteurs Langue des masqueurs et RSB. L’effet de la Langue des masqueurs (taux de
retranscriptions correctes significativement plus élevés avec les masqueurs paroliers irlandais
qu’avec les masqueurs paroliers français) était présent pour les deux valeurs de RSB
manipulées (-5 dB et 0 dB), et celui-ci était plus important à -5 dB plutôt qu’à 0 dB.
Autrement dit, l’écart de performances observé entre les masqueurs paroliers français et
irlandais a été fonction du RSB fixé entre les deux flux de paroles concurrents ; c’est lorsque
la situation d’écoute était la plus difficile (à -5 dB) que l’écart de performances était le plus
important.
Ce résultat est en accord avec les résultats de la littérature. En effet, d’autres études ont
également mis en évidence que la situation d’écoute à -5 dB est la plus favorable pour révéler
les différences entre les effets de masque des langues manipulées (langue native des
participants versus langue inconnue). En effet, Van Engen & Bradlow (2007) puis
Calandruccio et al. (2010a) ont observé des effets de masque significativement différents
entre des masqueurs paroliers anglais et mandarins uniquement lorsque le RSB était fixé à -5
dB. Dans l’étude de Van Engen & Bradlow (2007), l’intelligibilité de phrases cibles anglaises
était évaluée lorsque ces dernières étaient insérées dans les masqueurs paroliers anglais et
mandarins à 2 locuteurs. Pour un groupe de participants, le RSB était d’abord fixé à 0 dB puis
à -5 dB. Les auteurs ont observé des performances significativement plus faibles avec les
masqueurs paroliers anglais plutôt qu’avec les masqueurs paroliers mandarins uniquement à -
5 dB ; cette différence significative de performances n’était pas présente lorsque le RSB était
de 0 dB. Calandruccio et al. (2010a) ont eux aussi comparé les effets de masque de masqueurs
paroliers anglais et mandarins sur l’intelligibilité de phrases cibles anglaises avec des RSB de
-5 dB et de -3 dB. Ces auteurs ont donc testé un RSB de -3 dB qui est plus proche de -5 dB
que le RSB de 0 dB utilisé dans l’étude ci-dessus. Calandruccio et al. (2010a) ont retrouvé des
performances significativement différentes entre les masqueurs paroliers anglais et mandarins
à -5 dB mais pas à -3 dB.
En tenant compte des résultats des deux études ci-dessus ainsi que ceux observés dans
l’Expérience 1, nous avons choisi, pour l’Expérience 2, de poursuivre notre étude de la
situation de la parole dans la parole en fixant le RSB entre les mots cibles français et les
masqueurs paroliers uniquement à -5 dB. Cette situation d’écoute semble être plus favorable
pour explorer plus avant les interférences linguistiques entre les deux flux de parole
Partie expérimentale Expérience 1
78
concurrents et notamment pour déterminer si celles-ci peuvent avoir lieu au niveau
phonémique.
4.4. Effet du Nombre de locuteurs
Dans l’Expérience 1, l’effet principal du Nombre de locuteurs dans le masqueur n’est
pas ressorti significatif à l’ANOVA, suggérant que les participants n’ont pas été plus affectés
par les masqueurs paroliers à 4 locuteurs que par ceux composés de 2 locuteurs. Les résultats
nous ont également indiqué que l’effet de la Langue des masqueurs était présent avec 2 et 4
locuteurs dans les masqueurs, mais qu’il n’était significativement pas différent selon le
nombre de locuteurs. Tout d’abord, cette absence d’interaction significative entre les facteurs
Langue des masqueurs et Nombre de locuteurs pourrait être due au fait que dans les deux
situations d’écoute (2 et 4 locuteurs), le niveau de saturation spectro-temporelle du masqueur
parolier est suffisamment faible pour que les informations linguistiques qui y sont présentes
puissent interférer efficacement sur l’intelligibilité de la parole cible. Ensuite, cette absence
d’interaction significative ne nous indique pas un nombre de locuteurs optimal avec lequel il
convient de générer les masqueurs paroliers afin d’obtenir une situation d’écoute favorable
pour explorer les interférences linguistiques. Comme nous devions faire un choix afin de
réduire le nombre de conditions expérimentales dans l’Expérience 2, nous avons décidé
d’utiliser uniquement les masqueurs paroliers à 4 locuteurs pour lesquels les caractéristiques
vocales des locuteurs sont moins prépondérantes que dans la situation à 2 locuteurs dans les
masqueurs paroliers. En effet, il a été montré qu’avec 2 locuteurs, les participants peuvent
s’aider de la fréquence fondamentale (F0) des différents locuteurs pour mieux extraire le
message cible (voir par exemple Brungart et al., 2001).
4.5. Conclusions
A présent que nous avons répliqué l’effet de la Langue des masqueurs mis en évidence
dans la littérature avec de la parole cible française et des masqueurs paroliers français et
irlandais, nous pouvons, dans l’expérience suivante, explorer plus avant les interférences
linguistiques qui ont lieu entre les deux flux de parole concurrents. Plus précisément, nous
allons tester l’hypothèse selon laquelle les interférences linguistiques impliqueraient les
informations d’ordre phonémique. Les résultats de l’Expérience 1 nous ont indiqué que la
Partie expérimentale Expérience 1
79
situation d’écoute avec un RSB de -5 dB entre le signal cible et le signal concurrent nous
permettrait d’explorer les compétitions phonémiques le plus favorablement possible. Quant au
nombre de locuteurs présents dans les masqueurs paroliers, l’effet de la Langue des
masqueurs n’a pas varié avec 2 ou 4 locuteurs. Toutefois, il nous semble que la situation la
plus appropriée pour examiner les compétitions phonémiques soit celle où 4 locuteurs
composent les masqueurs paroliers, car les caractéristiques vocales des locuteurs concurrents
y sont moins prépondérantes que dans les masqueurs paroliers à 2 locuteurs.
Partie expérimentale Expérience 2
80
F) EXPERIENCE 2
1. Objectifs
Dans l’Expérience 2, notre objectif est de caractériser les interférences linguistiques
qui ont lieu entre la parole cible et la parole concurrente. Plus précisément, nous cherchons à
déterminer si les masqueurs paroliers produisent des interférences qui impliquent les
informations linguistiques d’ordre phonémique.
Dans l’Expérience 1, nous avons utilisé une tâche d’intelligibilité sur des mots cibles français
et nous avons identifié une situation d’écoute qui semble être favorable pour tester
l’hypothèse des compétitions phonémiques : des mots cibles insérés dans des masqueurs
paroliers à 4 locuteurs avec un Rapport Signal sur Bruit (RSB) de -5 dB. Dans l’Expérience 2,
nous prenons pour base cette situation d’écoute et nous ajoutons certains paramètres,
notamment une troisième langue (l’italien) ainsi qu’un deuxième type de masqueurs (des
masqueurs de bruit fluctuant).
En plus du français et du gaélique irlandais, déjà présents dans le paradigme
expérimental, nous incluons l’italien en tant que langue non connue des participants (langue
non intelligible), au même titre que l’irlandais. Néanmoins, d’après leur inventaire
phonémique, ces deux langues ne sont pas aussi proches de la langue native des participants
(le français). D’après Maddieson et al. (2011), la langue française possède 35 phonèmes (14
voyelles et 21 consonnes) et l’italien en possède 30 (7 voyelles et 23 consonnes). Nous
retrouvons 18 phonèmes du français (7 voyelles et 11 consonnes) dans l’inventaire
phonémique de l’italien, soit 60% de phonèmes communs entre la langue native et l’italien.
Le gaélique irlandais possède 69 phonèmes (20 voyelles, 45 consonnes et 4 semi-consonnes),
nous retrouvons 13 phonèmes français (4 voyelles et 9 consonnes) dans l’inventaire
phonémique de l’irlandais, soit 18% de phonèmes communs entre la langue native et le
gaélique irlandais. Sur la base de ces inventaires phonémiques, l’italien est une langue plus
proche du français que le gaélique irlandais.
Bien que, dans cette expérience, nous nous focalisons sur la distance phonémique de la langue
concurrente avec la langue native des participants, il convient de noter que l’italien est
également proche du français par son origine et son système rythmique (voir Tableau 5). En
Partie expérimentale Expérience 2
81
effet, alors que le gaélique irlandais est une langue celtique et une langue accentuelle, l’italien
est une langue romane et une langue syllabique comme le français (Ramus, 1999a, 1999b).
Tableau 5 : Principales caractéristiques des trois langues manipulées dans l’Expérience 2.
français italien gaélique irlandais
Distance phonémique 100% 60% 18%
Rythme langue syllabique langue syllabique langue accentuelle
Origine langue romane langue romane langue celtique
Dans l’Expérience 2, des masqueurs paroliers seront donc générés dans la langue native des
participants (français) ainsi que dans deux langues qui leur sont inconnues : l’italien qui est
phonémiquement proche du français et l’irlandais qui est phonémiquement éloigné du
français. Nous voulons tout d’abord confirmer l’effet de la langue des masqueurs paroliers et
observer si les pourcentages de retranscriptions correctes des mots cibles français seront plus
faibles avec les masqueurs paroliers français (langue native) plutôt qu’avec les masqueurs
paroliers irlandais et italiens (langues inconnues). Ensuite, nous voulons déterminer si la
distance phonémique de l’irlandais et de l’italien avec la langue native des participants
(français) influencera les performances des participants. Jusqu’à présent, seule l’opposition
entre une langue connue et une langue non connue a été testée. Les pourcentages de
retranscriptions correctes seront-ils plus faibles lorsque les masqueurs paroliers seront générés
en italien plutôt qu’en gaélique irlandais ? C’est-à-dire lorsque les masqueurs paroliers seront
produits dans une langue concurrente qui est phonémiquement proche de la langue native
(italien) plutôt que dans une langue phonémiquement éloignée (irlandais). Nous testerons
ainsi l’hypothèse des compétitions phonémiques selon laquelle plus le pourcentage de
phonèmes communs entre la langue native et la langue concurrente est important, plus le
pourcentage de phonèmes identifiés dans le masqueur parolier sera important ; ce qui
engendrera des compétitions phonémiques plus nombreuses, rendant ainsi la situation
d’écoute plus difficile.
Dans la situation de la parole dans la parole, les masqueurs paroliers produisent un
effet de masque énergétique mais aussi un effet de masque informationnel. L’effet de masque
énergétique correspond à un recouvrement (au moins partiel) des informations spectro-
temporelles du signal concurrent sur celles du signal cible. Quant à l’effet de masque
informationnel, il reflète, dans la situation de la parole dans la parole, les interférences
Partie expérimentale Expérience 2
82
produites par les informations linguistiques du signal concurrent sur l’intelligibilité des
informations linguistiques du signal cible. Dans l’Expérience 2, nous allons différencier deux
types d’interférences produits par le masque informationnel : les interférences qui impliquent
les informations linguistiques de bas niveau (telles que le rythme) et celles qui impliquent les
informations linguistiques de haut niveau (phonèmes, syllabes, mots). En dissociant ces deux
types d’interférences, nous pourrons examiner plus précisément si des compétitions au niveau
phonémique ont lieu, les phonèmes étant des informations linguistiques de haut niveau. Pour
cela, nous produirons des masqueurs de bruit fluctuant en plus des masqueurs paroliers
(Festen & Plomp, 1990). Les masqueurs de bruit fluctuant seront générés à partir des
masqueurs paroliers français, irlandais et italiens, de telle sorte qu’ils partagent les mêmes
informations acoustiques (spectrales) et linguistiques de bas niveau (fluctuations temporelles
lentes) que les masqueurs paroliers, mais en supprimant les informations linguistiques de haut
niveau. Ainsi, lorsque pour une langue, des performances significativement différentes seront
observées entre les deux types de masqueurs (parolier versus bruit fluctuant), cela suggèrera
que les informations linguistiques de haut niveau présentes dans le masqueur parolier auront
participé à la dégradation des mots cibles français en plus des informations acoustiques et
linguistiques de bas niveau. Parmi les informations linguistiques de haut niveau se trouvent
des phonèmes mais aussi des syllabes, des mots. Alors dans le cas où les compétitions
linguistiques impliqueraient les phonèmes, nous nous attendons à ce que l’effet des
informations linguistiques de haut niveau des masqueurs paroliers soit lié au pourcentage de
phonèmes communs entre la langue concurrente et la langue native (effet plus important avec
les masqueurs paroliers français, plus faible avec les masqueurs paroliers italiens, encore plus
faible avec les masqueurs paroliers irlandais). Si de tels résultats sont observés, ils indiqueront
que les masqueurs paroliers générés dans une langue inintelligible pour les participants
(irlandais et italien) auront produit des interférences impliquant des informations linguistiques
sous-lexicales telles que les phonèmes.
2. Méthode
2.1. Stimuli
Partie expérimentale Expérience 2
83
Quatre-vingt-quatre stimuli ont été utilisés dans l’Expérience 2. Chacun des 84 mots
cibles a été inséré dans un masqueur (parolier ou de bruit fluctuant) qui était produit en
français, en irlandais ou en italien.
2.1.1. Mots cibles
Quatre-vingt-quatre mots français dissyllabiques (annexe 2) ont été sélectionnés parmi
les 136 mots cibles utilisés dans l’Expérience 1. Les mots ont été sélectionnés de sorte qu’ils
soient équilibrés en fréquence (moyenne = 23,97 ; ET = 48,56).
2.1.2. Masqueurs paroliers
Masqueurs paroliers en français et en gaélique irlandais
Dans l’Expérience 2, 14 masqueurs paroliers français à 4 voix étaient nécessaires.
Nous les avons sélectionnés au hasard parmi les 34 masqueurs paroliers français à 4 voix qui
ont été générés dans l’Expérience 1. De même pour le gaélique irlandais, 14 masqueurs
paroliers à 4 voix ont été choisis au hasard parmi les 34 générés dans l’Expérience 1.
Masqueurs paroliers en italien
Trois locutrices et 3 locuteurs de langue maternelle italienne âgés de 21 à 35 ans, ont
lu les mêmes chapitres que les locutrices et les locuteurs français et irlandais. Les
enregistrements ont eu lieu dans les mêmes conditions et avec le même matériel que pour les
locutrices et locuteurs français. Chaque chapitre constituait une piste et était sauvegardé au
format .wav. Les enregistrements de 2 locutrices et de 2 locuteurs ont été sélectionnés selon
les mêmes critères que pour les voix des masqueurs paroliers français et irlandais.
Les masqueurs paroliers italiens à 4 voix ont été générés en suivant la même méthode que
celle décrite dans l’Expérience 1 pour les masqueurs paroliers français et irlandais à 4 voix.
Tout d’abord, les enregistrements de chacun des 4 locuteurs italiens ont été modifiés avec
Praat selon le protocole suivant : (a) suppression des silences et des pauses excédant 500 ms,
(b) suppression des phrases contenant des erreurs de prononciation ou des noms propres, (c)
normalisation du niveau sonore à 70 dB-A.
Partie expérimentale Expérience 2
84
Les F0 des voix des 4 locuteurs ont également été normalisées aux plus proches valeurs de
205 Hz et 225 Hz pour les voix féminines italiennes, et aux plus proches valeurs de 105 Hz et
125 Hz pour les voix masculines italiennes.
Ensuite, des séquences de 4 sec ont été extraites aléatoirement des enregistrements de chacun
des 4 locuteurs italiens. Les masqueurs paroliers à 4 voix ont été obtenus en mixant une
séquence de 4 secondes sélectionnée de façon aléatoire de chacun des 4 locuteurs. Au total, 14
masqueurs paroliers italiens à 4 voix ont été générés.
2.1.3. Masqueurs de bruit fluctuant
Afin d’obtenir des masqueurs de bruit fluctuant dont les propriétés énergétiques sont
comparables à celles des masqueurs paroliers à 4 voix, nous avons dérivé 42 masqueurs de
bruit fluctuant directement à partir des 42 masqueurs paroliers à 4 voix mentionnés ci-dessus
(14 masqueurs paroliers pour chacune des 3 langues manipulées). A l’aide du programme
Matlab, l’enveloppe temporelle des masqueurs paroliers a été extraite sous 60 Hz afin d’en
dériver les fluctuations dynamiques lentes. Puis par une transformée de Fourier (FFT),
l’énergie spectrale du signal d’origine a été calculée et la distribution de phases en a été
extraite. Les phases ont été redistribuées de façon aléatoire, puis réinjectées dans l’enveloppe
temporelle du signal d’origine. Ainsi, l’énergie du signal restait la même mais distribuée
différemment, ce qui a eu pour effet de détruire les informations d’ordre linguistique, comme
l’illustre la Figure 14.
Figure 14 : Spectrogrammes d'un masqueur parolier composé de quatre locuteurs (à gauche)
et de sa forme resynthétisée en bruit fluctuant (à droite). (Figures réalisées à l'aide du logiciel
Adobe Audition 3.0).
Partie expérimentale Expérience 2
85
Avec le logiciel Matlab, chaque mot cible a été inséré à 2,5 sec du début d’un masqueur de 4
sec (parolier ou bruit fluctuant). Dans l’Expérience 2, le Rapport Signal sur Bruit entre le mot
cible et le masqueur était toujours de -5 dB, le niveau sonore du mot cible était fixé à 65 dB et
celui du masqueur à 70 dB.
2.2. Conditions expérimentales
Dans l’Expérience 2, les variables manipulées étaient les suivantes :
- L le facteur fixe à mesures répétées « Langue des masqueurs » à 3 modalités, français,
gaélique irlandais et italien ;
- T le facteur fixe à mesures répétées « Type de bruit » dans le masqueur à 2 modalités, parole
et bruit fluctuant ;
- P le facteur aléatoire « Participants » à 30 modalités.
Il en résulte le plan expérimental suivant : P30*L3*T2. Nous avions donc 6 conditions
expérimentales. Le plan d’analyse était identique au plan expérimental. La variable
dépendante correspondait au pourcentage de mots cibles correctement retranscrits.
2.2.1. Liste de mots
Parmi les 84 mots cibles sélectionnés, 6 ont été utilisés pour la phase d’entraînement,
un mot pour chaque condition expérimentale. Pour s’assurer que les 78 mots cibles restants
soient présentés dans chacune des 6 conditions expérimentales, 6 listes expérimentales
différentes ont été générées, sur le même principe que celui utilisé dans l’Expérience 1. Par
exemple dans la liste 1, le mot « ballon » a été présenté dans la condition « masqueur parolier
français », dans la liste 2, « ballon » a été présenté dans la condition « masqueur parolier
irlandais », dans la liste 3 il a été présenté dans la condition « masqueur parolier italien ».
Dans les listes 4, 5 et 6 il a été présenté dans les conditions « masqueur de bruit fluctuant
français », « masqueur de bruit fluctuant irlandais », « masqueur de bruit fluctuant italien »,
respectivement. Ainsi, à travers les 6 listes, chacun des 78 mots cibles a été présenté dans
toutes les conditions expérimentales. Chaque participant n’entendait qu’une seule liste de
sorte que les mots cibles ne soient présentés qu’une fois pour éviter les effets de répétition.
Ainsi, dans chacune des listes, nous avions 13 mots par condition expérimentale. A l’intérieur
Partie expérimentale Expérience 2
86
de chacune des listes, l’ordre de présentation des stimuli était randomisé pour chaque
passation.
2.2.2. Procédure expérimentale
La procédure expérimentale était exactement identique à celle de l’Expérience 1. Les
stimuli étaient présentés un à un, les participants devaient repérer les mots cibles et les
retranscrire.
2.2.3. Participants
Trente volontaires de langue maternelle française, âgés de 19 à 30 ans ont participé à
l’Expérience 2. Tous étaient différents des participants de l’Expérience 1. Aucun ne
connaissait le gaélique irlandais ni l’italien car aucun n’avait suivi d’enseignement de ces
deux langues. De plus, aucun ne souffrait de trouble auditif ni de trouble du langage. Leur
participation a été dédommagée.
3. Résultats
Tous les participants et tous les mots cibles de la phase test ont été inclus dans
l’analyse, soit 30 participants et 78 mots cibles. Comme pour l’Expérience 1, les réponses
écrites des participants ont été codées (soit correctes, soit fausses) puis transformées en
performances numériques afin d’obtenir le pourcentage de retranscriptions correctes par
participant. Comme dans l’Expérience 1, les fautes d’orthographe n’ont pas été prises en
compte dès lors qu’une syllabe était restituée correctement au niveau phonologique. Une
transformation arcsinus RAU (Studebaker, 1985) sur les performances brutes collectées (mot
reconnu coté 1, mot non identifié coté 0) a été réalisée.
Une analyse de variance à mesures répétées a été conduite sur les résultats de l’Expérience 2,
en considérant comme variable aléatoire les participants, comme variable dépendante les
scores RAU et comme variables intra-sujets : la Langue du masqueur (à 3 modalités :
irlandais, italien et français) et le Type de bruit dans le masqueur (à 2 modalités : parole et
Partie expérimentale Expérience 2
87
bruit fluctuant). Pour la clarté, les pourcentages de réponses correctes (voir Tableau 6) ont été
utilisés pour décrire et représenter graphiquement les données.
Tableau 6 : Pourcentages moyens de retranscriptions correctes des mots cibles français
obtenus dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 73,59 55,64 61,54 56,92 36,92 34,36
Ecart-types 10,44 12,88 13,40 12,22 9,35 12,89
3.1. Effets principaux
Effet de la Langue du masqueur
L’analyse de variance a révélé un effet principal significatif de la Langue des
masqueurs (F(2,58) = 41.74, p < .0001). En moyenne, les pourcentages de retranscriptions
correctes étaient plus élevés lorsque les masqueurs étaient produits en irlandais (65,26% ; ET
= 14,06) plutôt qu’en français (47,95% ; ET = 18,91) ou en italien (46,28% ; ET = 14,62).
Effet du Type de bruit
L’effet principal du Type de bruit dans le masqueur de 21% est également ressorti
significatif à l’ANOVA (F(1,29) = 149.51, p < .0001). En moyenne, les performances étaient
plus faibles avec les masqueurs paroliers (42,74% ; ET = 15,3) qu’avec les masqueurs de bruit
fluctuant (63,59% ; ET = 14,3).
3.2. Interaction simple
L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit est
ressortie significative à l’ANOVA (F(2,58) = 3.35, p < .05). Les comparaisons post-hoc
réalisées avec le test HSD de Tukey ont montré que l’effet du Type de bruit dans le masqueur
était significatif pour chacune des langues manipulées (irlandais, italien et français). Les
comparaisons post-hoc ont également mis en évidence que dans les conditions où les
masqueurs étaient composés de bruit fluctuant, des performances significativement différentes
ont été observées entre l’irlandais et l’italien (p < .001), ainsi qu’entre l’irlandais et le français
Partie expérimentale Expérience 2
88
(p < .001). Lorsque les masqueurs étaient composés de parole, nous avons retrouvé des
différences significatives dans les performances entre les mêmes langues : entre l’irlandais et
l’italien (p < .001), entre l’irlandais et le français (p < .001). Ces résultats sont reportés dans la
Figure 15.
Figure 15 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les
pourcentages moyens de retranscriptions correctes des mots cibles à -5 dB, en fonction de la
Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont reportées. Le
symbole ‘ * ’ indique une différence significative entre les deux types de bruits (parole et
bruit fluctuant) pour l’irlandais, l’italien et le français. Des différences significatives sont
également présentes entre les masqueurs paroliers irlandais et italiens, ainsi qu’entre les
masqueurs paroliers irlandais et français. Pour la clarté, la différence significative entre les
masqueurs de bruit fluctuant irlandais et français et celle entre les masqueurs de bruit
fluctuant irlandais et italiens ne figurent pas sur le graphique.
4. Discussion
4.1. Rappel des objectifs
Dans l’Expérience 2, les mots cibles français étaient insérés dans des masqueurs
paroliers produits dans la langue native des participants (français) ou dans deux langues qu’ils
ne connaissaient pas (gaélique irlandais et italien). Les mots cibles étaient également insérés
Partie expérimentale Expérience 2
89
dans des masqueurs de bruit fluctuant, générés à partir des masqueurs paroliers français,
irlandais et italiens. Les masqueurs de bruit fluctuant ne partagent que les informations
acoustiques et linguistiques de bas niveau avec les masqueurs paroliers.
Tout d’abord, nous voulions vérifier que l’intelligibilité des mots cibles français serait plus
faible avec les masqueurs paroliers français qu’avec les masqueurs paroliers irlandais et
italiens. Ensuite, nous voulions déterminer si les masqueurs paroliers irlandais et italiens
conduiraient à des résultats équivalents ou si les performances des participants seraient
influencées par la distance phonémique de ces langues avec la langue native des participants
(français) ; l’italien étant phonémiquement plus proche du français que l’irlandais. Enfin, en
comparant les performances obtenues avec les masqueurs paroliers et les masqueurs de bruit
fluctuant pour chacune des trois langues manipulées, il était question d’examiner si les
informations linguistiques de haut niveau présentes dans les masqueurs paroliers français,
irlandais et italiens ont joué un rôle dans le masquage des mots cibles français.
4.2. Situation de la parole dans la parole
Les résultats de l’Expérience 2 ont révélé que dans la situation de la parole dans la
parole (c’est-à-dire lorsque les mots cibles étaient insérés dans les masqueurs paroliers),
l’intelligibilité des mots cibles français a été influencée par la langue des masqueurs paroliers.
Des langues ont davantage masqué les mots cibles français que d’autres. C’est le cas du
français et de l’italien, qui ont entraîné des pourcentages de retranscriptions correctes
significativement plus faibles que l’irlandais.
Ainsi, dans l’Expérience 2, les masqueurs paroliers français et irlandais ont conduit au même
pattern de résultats que dans l’Expérience 1. Les masqueurs paroliers générés en irlandais,
c’est-à-dire dans une langue inconnue pour les participants (et donc inintelligible), ont eu un
effet de masque significativement plus faible (autrement dit des performances
significativement plus élevées ont été observées) que les masqueurs paroliers produits dans la
langue native des participants (français).
Dans l’Expérience 2, nous avons inclus l’italien qui, comme l’irlandais, est une langue
inconnue pour les participants (et donc inintelligible). Cependant l’italien n’a pas conduit aux
mêmes résultats que l’irlandais. Avec les masqueurs paroliers italiens, les pourcentages de
retranscriptions correctes des mots cibles français étaient significativement plus faibles
qu’avec les masqueurs paroliers irlandais et équivalents à ceux obtenus avec les masqueurs
Partie expérimentale Expérience 2
90
paroliers français. Ce résultat montre tout d’abord que les deux langues inconnues pour les
participants (italien et irlandais) ont eu un effet de masque significativement différent. Ce
résultat indique également que l’italien, langue inintelligible car inconnue des participants, a
eu un effet de masque équivalent à celui de la langue native des participants (français). Ce
résultat observé avec les masqueurs paroliers italiens est inattendu puisqu’il ne correspond pas
à l’effet de la Langue des masqueurs mis en évidence jusqu’à présent dans la littérature,
lorsque la langue native était de l’allemand et la langue inconnue du suédois (Rhebergen et
al., 2005), ou lorsque la langue native était de l’anglais et la langue inconnue de l’espagnol
(Garcia Lecumberri & Cooke, 2006), du mandarin (Van Engen & Bradlow, 2007), ou du
croate (Calandruccio et al., 2010b). Ces études ont mis en lumière un effet de masque plus
faible sur la parole cible pour la langue inconnue et inintelligible que pour la langue native.
Le plus faible pourcentage de retranscriptions correctes obtenu avec les masqueurs paroliers
italiens plutôt qu’avec les masqueurs paroliers irlandais pourrait être dû au fait que l’italien
est phonémiquement plus proche de la langue native que l’irlandais ; 60% des phonèmes
français sont retrouvés dans l’inventaire phonémique italien alors que seulement 18% des
phonèmes français sont présents dans l’inventaire phonémique de l’irlandais. Ainsi,
l’hypothèse serait que plus le pourcentage de phonèmes communs entre la langue native et la
langue concurrente serait grand, plus les interférences phonémiques entre les signaux
concurrents seraient importantes.
Cependant, avant d’explorer davantage l’hypothèse des compétitions phonémiques entre les
deux flux de parole concurrents, regardons tout d’abord les résultats obtenus avec les
masqueurs de bruit fluctuant afin de vérifier que les informations linguistiques de haut niveau
(phonèmes, syllabes, mots) présentes dans les masqueurs paroliers français, irlandais et
italiens ont été impliquées dans la dégradation du signal cible. Le bruit fluctuant a été généré à
partir des masqueurs paroliers dans les trois langues manipulées (français, irlandais, italien).
Pour chacune des langues, les deux types de masqueurs (parolier versus bruit fluctuant)
partagent les mêmes informations spectrales et temporelles ainsi que les mêmes informations
linguistiques de bas niveau ; seuls les masqueurs paroliers possèdent des informations
linguistiques de haut niveau. Notre idée était de comparer, pour chacune des langues, les
pourcentages de retranscriptions correctes obtenus avec les deux types de masqueurs (parolier
versus bruit fluctuant). Des performances significativement différentes indiqueront que les
Partie expérimentale Expérience 2
91
informations linguistiques de haut niveau présentes dans les masqueurs paroliers ont été
impliquées dans la dégradation du signal cible.
4.3. Nature des interférences
L’analyse statistique a révélé une interaction significative entre les facteurs Type de
bruit dans le masqueur et Langue des masqueurs et a indiqué que l’effet du Type de bruit était
présent pour chacune des langues manipulées (français, irlandais et italien).
Ceci nous a tout d’abord confirmé que la situation d’écoute a été plus facile avec les
masqueurs de bruit fluctuant plutôt qu’avec les masqueurs paroliers, c’est-à-dire lorsque les
informations linguistiques de haut niveau n’étaient pas présentes dans le signal concurrent.
Cette différence significative entre les deux types de masqueurs (parolier versus bruit
fluctuant) présente pour les trois langues manipulées a également montré que les informations
linguistiques de haut niveau présentes dans les masqueurs paroliers français, irlandais et
italiens sont entrées en compétition avec les informations linguistiques des mots cibles
français.
Nous nous sommes alors demandés si cet effet des informations linguistiques de haut niveau
était proportionnel au pourcentage de phonèmes communs entre la langue native des
participants et la langue concurrente (60% de phonèmes communs entre le français et l’italien,
18% entre le français et l’irlandais). En effet, dans le cas où les interférences linguistiques
auraient lieu au niveau phonémique, nous pourrions nous attendre à ce que l’effet des
informations linguistiques de haut niveau soit le plus important pour les masqueurs paroliers
français, un peu plus faible pour les masqueurs paroliers italiens, et plus faible encore pour les
masqueurs paroliers irlandais. Pour cela, nous avons soustrait, pour chaque participant et pour
chacune des trois langues manipulées (français, irlandais et italien), les pourcentages moyens
de retranscriptions correctes des mots cibles obtenus avec les masqueurs de bruit fluctuant à
ceux obtenus avec les masqueurs paroliers. Nous avons ainsi obtenu les différences de
performances pour chacune des trois langues. En moyenne, elles étaient de 27,18% pour le
français, de 18,72% pour l’italien et de 16,67% pour l’irlandais. Les différences de
performances obtenues pour l’italien étant proches de celles observées pour l’irlandais, nous
avons mené une analyse de variance afin de déterminer si les différences de performances
observées pour l’italien et l’irlandais étaient significativement différentes. Une ANOVA à
mesures répétées a été effectuée, non pas sur les différences de pourcentages moyens de
Partie expérimentale Expérience 2
92
retranscriptions correctes mais sur les différences de scores RAU moyens. L’ANOVA a
considéré comme variable aléatoire les participants et comme variable intra-sujets la Langue
des masqueurs (à 3 modalités : le français, le gaélique irlandais et l’italien). Le plan d’analyse
était le suivant : P30*L3. L’ANOVA a confirmé que l’effet principal de la Langue des
masqueurs était significatif (F(2,58) = 3.35, p < .05). Les comparaisons post-hoc effectuées
avec le test HSD de Tukey ont révélé que les différences de performances moyennes étaient
significativement différentes uniquement entre l’irlandais et le français. Autrement dit, entre
l’italien et l’irlandais ainsi qu’entre l’italien et le français, les différences de performances
n’étaient pas significativement différentes. Cette analyse n’a alors pas indiqué que les effets
des informations linguistiques de haut niveau étaient proportionnels au pourcentage de
phonèmes communs entre la langue native des participants et la langue concurrente. Cela
suggère que l’effet des interférences linguistiques observé ne s’expliquerait pas uniquement
par des compétitions au niveau phonémique. D’autres interférences d’ordre linguistique
auraient lieu, comme par exemple des interférences post-lexicales, qui seraient expliquées par
le type de tâche que nous avons utilisé dans cette expérience (tâche d’intelligibilité), et dont
l’effet pourrait s’ajouter à celui des compétitions phonémiques.
Dans cette expérience, de même que dans la précédente, nous avons utilisé une tâche
d’intelligibilité dans laquelle les participants devaient retranscrire le mot cible entendu une
fois que le stimulus était terminé. Chaque mot cible était inséré à 2,5 secondes du début du
masqueur et leur présentation se terminait avant la fin du masqueur qui lui durait 4 secondes.
Ainsi, du temps s’écoulait entre la fin de présentation du mot cible et la fin du masqueur,
durant lequel des traitements post-lexicaux peuvent avoir lieu et influencer la réponse finale
des participants. Ces traitements post-lexicaux impliquent des connaissances explicites sur le
langage et des habiletés métalinguistiques. La tâche d’intelligibilité est alors caractérisée de
tâche « off-line » puisqu’elle permet de mesurer la pertinence des réponses obtenues une fois
que les processus de reconnaissance du mot cible impliqués dans l’accès au lexique sont
terminés.
Afin de limiter l’effet des interférences post-lexicales et d’explorer les interférences
linguistiques qui ont lieu entre les deux flux de parole concurrents pendant l’accès au lexique
des mots cibles, nous avons décidé dans l’Expérience 3, de tester les mêmes conditions
expérimentales que dans l’Expérience 2, mais avec une tâche de décision lexicale. Nous
demanderons aux participants de décider le plus rapidement possible et en commettant le
Partie expérimentale Expérience 2
93
moins d’erreurs possible si le mot cible existe dans la langue française. Ainsi, nous
obtiendrons des temps de réaction qui nous informeront sur la rapidité avec laquelle les mots
cibles auront été reconnus, reflétant la rapidité avec laquelle ces mots auront été activés dans
le lexique. Plus les temps de réaction seront longs, plus les mots cibles auront été reconnus
lentement du fait des interférences produites par le signal concurrent. Alors que la tâche
d’intelligibilité est une tâche « off-line », la tâche de décision lexicale est caractérisée de tâche
« on-line ». Par ailleurs, la validité de la tâche de décision lexicale pour explorer la situation
de la parole dans la parole a déjà été mise en évidence. Boulenger et al. (2010) ont utilisé une
tâche de décision lexicale afin d’étudier l’effet de la fréquence des mots (haute versus faible
fréquence) présents dans les masqueurs paroliers sur la vitesse d’accès au lexique de mots
cibles français. Dans l’Expérience 3, la tâche de décision lexicale nous permettra d’explorer
de façon plus précise les interférences phonémiques entre les deux flux de parole concurrents
puisque l’effet des interférences post-lexicales sera limité.
4.4. Conclusions
Dans l’Expérience 2, les masqueurs paroliers produits en irlandais, c’est-à-dire dans
une langue inconnue pour les participants, ont conduit à des résultats attendus puisqu’ils ont
eu un effet de masque plus faible que les masqueurs paroliers français (langue native). En
revanche, des résultats surprenants ont été observés avec les masqueurs paroliers générés en
italien, autre langue non connue des participants. En effet, les masqueurs paroliers italiens ont
entraîné des pourcentages de retranscriptions correctes équivalents à ceux observés avec les
masqueurs paroliers français. Ainsi, les deux langues inconnues des participants (irlandais et
italien) ont eu des effets de masque significativement différents. La distance phonémique de
l’italien et de l’irlandais avec la langue native pourrait expliquer ces résultats. L’italien étant
phonémiquement plus proche de la langue native (français) que l’irlandais, les compétitions
phonémiques ont pu être plus importantes en présence des masqueurs paroliers italiens.
Néanmoins, nous ne sommes pas en mesure de valider ou d’invalider cette hypothèse. En
effet, bien que la comparaison des performances obtenues avec les masqueurs paroliers et les
masqueurs de bruit fluctuant ait mis en évidence un effet des informations linguistiques de
haut niveau pour chacune des trois langues manipulées (français, irlandais et italien), cet effet
n’était pas proportionnel au pourcentage de phonèmes communs entre la langue concurrente
et la langue native, suggérant que d’autres types d’interférences, telles que des interférences
Partie expérimentale Expérience 2
94
post-lexicales, pourraient également intervenir. C’est pourquoi dans l’Expérience 3, nous
testerons les mêmes conditions expérimentales que dans la présente expérience mais avec une
tâche de décision lexicale qui nous permettra d’explorer les interférences linguistiques entre
les deux flux de parole concurrents pendant l’accès au lexique et minimisera l’effet des
interférences post-lexicales.
Partie expérimentale Expérience 3
95
G) EXPERIENCE 3
1. Objectifs
Dans cette Expérience 3, nous utiliserons une tâche de décision lexicale plutôt qu’une
tâche d’intelligibilité (Expériences 1 & 2) afin d’explorer les interférences linguistiques qui
ont lieu dans la situation de la parole dans la parole. Plus précisément, la tâche de décision
lexicale nous permettra de capturer ces interférences linguistiques pendant l’accès au lexique
des mots cibles français ; nous cherchons à les caractériser plus finement. Les traitements
post-lexicaux devraient être minimisés, nous continuerons ainsi de tester l’hypothèse des
compétitions phonémiques selon laquelle l’identification des mots cibles français serait
influencée par le pourcentage de phonèmes communs entre la langue native des participants et
la langue de la parole concurrente ; plus ce pourcentage sera élevé plus les interférences
phonémiques seront importantes. Enfin, nous serons attentifs aux résultats qui seront obtenus
avec les masqueurs paroliers produits en italien (langue non connue des participants), ces
derniers ayant eu, dans l’expérience précédence, un effet de masque équivalent aux
masqueurs paroliers générés en français (langue native).
2. Méthode
2.1. Stimuli
Dans l’Expérience 3, 162 stimuli ont été générés en mixant chacun des 81 mots cibles
et chacun des 81 pseudo-mots cibles à un masqueur (parolier ou de bruit fluctuant) produit en
français, en irlandais ou en italien.
2.1.1. Items cibles
Quatre-vingt-un mots français dissyllabiques (annexe 3) ont été sélectionnés parmi les
84 mots utilisés dans l’Expérience 2 (fréquence d’occurrence moyenne = 24,45 ; ET = 49,52).
Plus précisément, les 3 mots qui n’ont pas été retenus étaient des mots utilisés dans la phase
d’entraînement de l’Expérience 2. Quatre-vingt-un pseudo-mots (annexe 4) ont été construits
Partie expérimentale Expérience 3
96
à partir des 136 mots utilisés dans l’Expérience 1, en respectant les règles phonotactiques de
la langue française, comme par exemple « trouchet ».
De façon à ce que les pseudo-mots soient prononcés par la même voix que les mots, nous
avons réenregistré la totalité des items cibles : mots et pseudo-mots. Pour ce faire, une
locutrice de langue maternelle française âgée de 21 ans (différente de celle qui avait enregistré
les mots cibles dans les expériences précédentes) a été recrutée. L’enregistrement a eu lieu
dans les mêmes conditions et avec le même matériel que pour la locutrice et les
enregistrements précédents.
2.1.2. Masqueurs
Masqueurs paroliers en français, en irlandais et en italien
Dans l’Expérience 3, 27 masqueurs paroliers à 4 voix étaient nécessaires pour chacune
des 3 langues manipulées (français, irlandais et italien). Les masqueurs paroliers français et
irlandais ont été sélectionnés au hasard parmi ceux générés dans l’Expérience 1. Pour les
masqueurs paroliers italiens, seulement 14 avaient été créés dans l’Expérience 2, 13 nouveaux
masqueurs paroliers italiens ont donc été générés selon la même méthode que celle décrite
dans les expériences précédentes.
Masqueurs de bruit fluctuant en français, en irlandais et en italien
Vingt-sept masqueurs de bruit fluctuant pour chacune des 3 langues manipulées ont
été utilisés dans l’Expérience 3. Treize nouveaux masqueurs de bruit fluctuant par langue ont
été générés afin de compléter les 14 masqueurs de bruit fluctuant pour chacune des 3 langues
qui ont été utilisés dans l’Expérience 2.
Dans l’Expérience 3, comme dans l’Expérience 2, chaque item cible était inséré à 2,5 sec du
début d’un masqueur de 4 sec avec un Rapport Signal sur Bruit de -5 dB (le niveau sonore du
mot cible était fixé à 65 dB et celui du masqueur à 70 dB). Cette opération a été effectuée
sous le logiciel Matlab.
2.2. Conditions expérimentales
Dans l’Expérience 3, les variables manipulées étaient les suivantes :
Partie expérimentale Expérience 3
97
- L le facteur fixe à mesures répétées « Langue des masqueurs » à 3 modalités, français,
gaélique irlandais et italien ;
- T le facteur fixe à mesures répétées « Type de bruit » dans le masqueur à 2 modalités, parole
et bruit fluctuant ;
- N le facteur fixe à mesures répétées « Nature des items cibles » à 2 modalités, mots et
pseudo-mots ;
- P le facteur aléatoire « Participants » à 30 modalités.
Le plan expérimental était le suivant : P30*L3*T2*N2. Les analyses statistiques menées ci-
dessous n’ont pris en compte que les performances des participants obtenues avec les mots
cibles. Nous avions donc 6 conditions expérimentales, le plan d’analyse était le suivant :
P30*L3*T2.
2.3. Liste d’items
Parmi les 162 stimuli sélectionnés (81 mots cibles et 81 pseudo-mots cibles), 6 (3 mots
et 3 pseudo-mots) ont été utilisés pour la phase d’entraînement, un pour chaque condition
expérimentale. Pour s’assurer que les 156 items cibles restants (78 mots cibles et 78 pseudo-
mots cibles) soient présentés dans chacune des 6 conditions expérimentales, 6 listes
expérimentales différentes ont été générées selon le même principe que celui utilisé dans les
expériences précédentes. Par exemple dans la liste 1, le mot « ballon » et le pseudo-mot
« trouchet » ont été présentés dans la condition « masqueur parolier français », dans la liste 2,
« ballon » et « trouchet » ont été présentés dans la condition « masqueur parolier irlandais »,
dans la liste 3, ils ont été présentés dans la condition « masqueur parolier italien ». Dans les
listes 4, 5 et 6, ils ont été présentés dans les conditions « masqueur de bruit fluctuant français
», « masqueur de bruit fluctuant irlandais », « masqueur de bruit fluctuant italien »,
respectivement. Ainsi, à travers les 6 listes, chacun des 78 mots cibles et chacun des 78
pseudo-mots cibles ont été présentés dans toutes les conditions expérimentales. Chaque
participant n’entendait qu’une seule liste de sorte que les mots cibles et les pseudo-mots cibles
ne soient présentés qu’une fois pour éviter les effets de répétition. Ainsi, nous avions dans
chaque liste, 13 mots et 13 pseudo-mots par condition expérimentale. A l’intérieur de chacune
des listes, l’ordre de présentation des stimuli était randomisé pour chaque passation.
Partie expérimentale Expérience 3
98
2.4. Procédure expérimentale
Les participants ont été testés dans les mêmes conditions que dans les Expériences 1 &
2. Les stimuli étaient également délivrés de façon diotique à un niveau d’écoute confortable
(65 dB SPL), excepté qu’ils ont été présentés avec le logiciel E-prime (Psychology Software
Tools, Inc., Pittsburgh, PA, USA). Il était demandé aux participants de réaliser une tâche de
décision lexicale sur les items cibles qui étaient insérés dans les masqueurs. Les participants
devaient décider le plus vite possible et en commettant le moins d’erreurs possible, si l’item
cible était un mot de la langue française en appuyant sur une des deux touches du clavier
sélectionnées. La consigne était donnée oralement puis apparaissait à l’écran au début de
l’expérience.
« Une étoile va s’afficher au centre de l’écran. Puis vous entendrez une séquence sonore
composée d’un mot cible présenté dans différents types de bruits. Dès que vous avez repéré ce
mot, vous devez répondre le plus vite possible et en commettant le moins d’erreurs possible si
ce mot existe dans la langue française ou s’il n’existe pas. Vous donnerez votre réponse en
appuyant sur une des deux touches sélectionnées. Appuyez sur la barre espace pour passer à
la séquence suivante ».
Comme dans les expériences précédentes, chaque stimulus ne pouvait être entendu qu’une
seule fois. Une phase d’entraînement précédait la phase test. Les participants démarraient
l’expérience dès qu’ils le souhaitaient en appuyant sur la barre espace. Ils appuyaient à
nouveau sur celle-ci après avoir répondu, le stimulus suivant commençait. L’expérience durait
en moyenne 30 minutes.
2.5. Participants
Trente volontaires de langue maternelle française, âgés de 18 à 27 ans ont participé à
l’Expérience 3. Aucun n’avait participé aux Expériences 1 & 2, aucun ne parlait, ne
comprenait ou n’avait suivi d’enseignement de gaélique irlandais ni d’italien, et aucun ne
souffrait de trouble auditif ni de trouble du langage. Ils ont été dédommagés pour leur
participation.
3. Résultats
Partie expérimentale Expérience 3
99
Tous les participants et tous les mots cibles de la phase test ont été inclus dans les
analyses, soit 30 participants et 78 mots cibles. Deux analyses de variance à mesures répétées
(ANOVA) ont été conduites sur les performances des participants à -5 dB. Pour la première
analyse, les Temps de Réaction moyens (TRs : intervalle de temps en millisecondes entre le
début du mot cible et le moment où le participant presse le bouton) ont été mesurés pour les
mots cibles correctement identifiés dans chaque condition expérimentale (Tableau 7). Les
essais pour lesquels les participants ont fait des erreurs (34,1%), n’ont pas répondu dans le
temps imparti de 4500 ms (4,3%), ainsi que les essais pour lesquels les TRs étaient inférieurs
à 300 ms (0,2%) n’ont pas été inclus dans l’analyse. Ainsi, la première ANOVA a considéré
comme variable dépendante les TRs, et comme variable intra-sujets la Langue des masqueurs
(à 3 modalités : irlandais, italien et français) et le Type de bruit dans le masqueur (à 2
modalités : parole et bruit fluctuant). Dans la seconde ANOVA, les taux d’erreurs moyens
(Tableau 8) constituaient la variable dépendante et les variables intra-sujets étaient les mêmes
que dans la première ANOVA.
3.1. Analyse statistique des moyennes de TRs
Tableau 7 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement
identifiés dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 1125 1216 1161 1167 1262 1272
Ecart-types 166,98 252,94 204,04 188,19 260,50 225,72
3.2. Effets principaux
Effet de la Langue du masqueur
L’analyse de variance a révélé un effet principal significatif de la Langue des
masqueurs (F(2,58) = 5.83, p < .005). En moyenne, les participants ont été plus rapides avec
les masqueurs irlandais (1146 ms ; ET = 177,68), et plus lents avec les masqueurs français
(1217 ms ; ET = 220,43) et italiens (1240 ms ; ET = 255,65).
Partie expérimentale Expérience 3
100
Effet du Type de bruit
L’ANOVA a également indiqué que l’effet principal de 67 ms du Type de bruit dans
le masqueur était significatif (F(1,29) = 8.92, p = .005). Les masqueurs paroliers ont entraîné
des TRs moyens plus longs (1234 ms ; ET = 229,12) que les masqueurs de bruit fluctuant
(1167 ms ; ET = 211,89).
3.3. Interaction simple
L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit n’est
pas ressortie significative à l’ANOVA (F(2,58) = 1.25, n.s.). Les comparaisons post-hoc
effectuées avec le test HSD de Tukey ont montré que l’effet du Type de bruit n’était
significatif qu’avec le français (p = .02). Les comparaisons post-hoc ont également mis en
évidence qu’avec les masqueurs paroliers, une différence significative était présente entre
l’irlandais et le français (p < .05), ainsi qu’une différence tendancielle entre l’irlandais et
l’italien (p = .07). En revanche, lorsque les masqueurs étaient composés de bruit fluctuant,
aucune différence entre les langues n’a atteint le seuil de significativité. Les résultats sont
reportés dans la Figure 16 ci-dessous.
Figure 16 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, en fonction de la Langue des masqueurs (irlandais, italien et
Partie expérimentale Expérience 3
101
français). Les erreurs standard sont reportées. Le symbole ‘ * ’ indique une différence
significative entre les deux types de bruits (parole et bruit fluctuant) pour le français. Des
différences significatives sont également présentes entre les masqueurs paroliers irlandais et
italiens, ainsi qu’entre les masqueurs paroliers irlandais et français.
3.4. Analyse statistique des taux d’erreurs
Tableau 8 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions
expérimentales. Les écart-types sont également indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 28,21 37,18 27,69 31,79 43,85 35,64
Ecart-types 15,56 14,99 12,39 14,53 19,29 16,47
3.4.1. Effets principaux
Effet de la Langue des masqueurs
L’effet principal de la Langue des masqueurs est ressorti significatif à l’ANOVA
(F(2,58) = 9.29, p < .001). En moyenne, les participants ont fait moins d’erreurs avec les
masqueurs irlandais (30% ; ET = 15,04) et français (31,67% ; ET = 14,99) et un peu plus
d’erreurs avec les masqueurs italiens (40,51% ; ET = 17,45).
Effet du Type de bruit
L'ANOVA a également montré un effet principal significatif du Type de bruit dans le
masqueur de 6,06% (F(1,29) = 5.49, p < .05). En moyenne, les masqueurs paroliers ont
entraîné des taux d’erreurs plus élevés (37,09% ; ET = 17,43) que les masqueurs de bruit
fluctuant (31,03% ; ET = 14,88).
3.4.2. Interaction simple
L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit n’est
pas ressortie significative à l’ANOVA (F(2,58) = 0.52, n.s.). Les comparaisons post-hoc
réalisées avec le test HSD de Tukey ont révélé que l’effet du Type de bruit n’était significatif
pour aucune des trois langues manipulées. Avec les masqueurs de bruit fluctuant, les
comparaisons post-hoc ont montré une différence significative entre le français et l’italien (p
Partie expérimentale Expérience 3
102
= .04), ainsi qu’une différence tendancielle entre l’irlandais et l’italien (p = .06). Avec les
masqueurs paroliers, seule une différence significative entre l’irlandais et l’italien a été
signalée (p < .005).
4. Discussion
4.1. Rappel des objectifs
Dans l’Expérience 3, une tâche de décision lexicale a été utilisée afin d’examiner et de
comparer l’impact des masqueurs paroliers produits en français (langue native des
participants), en irlandais ou en italien (langues non connues) sur la vitesse d’accès au lexique
des mots cibles français. Des masqueurs de bruit fluctuant ont également été utilisés pour
masquer les mots cibles et nous renseigner quant à la nature des informations impliquées par
les interférences produites par les masqueurs paroliers générés dans les trois langues
manipulées (français, irlandais et italien). Une différence significative entre les temps de
réaction obtenus avec les masqueurs paroliers et les masqueurs de bruit fluctuant indiqueront
que les informations linguistiques de haut niveau présentes dans les masqueurs paroliers se
seront associées aux informations acoustiques et linguistiques de bas niveau pour perturber
l’accès au lexique des mots cibles français.
4.2. Situation de la parole dans la parole
L’analyse de résultats a révélé que la vitesse d’accès au lexique des mots cibles
français a été influencée par la langue des masqueurs paroliers. Les participants ont mis
significativement plus de temps pour décider si les mots cibles existaient dans la langue
française lorsque les masqueurs paroliers étaient produits en français et en italien plutôt qu’en
irlandais.
Tout d’abord, ces résultats montrent que les deux langues inconnues et inintelligibles pour les
participants (irlandais et italien) n’ont pas perturbé l’identification des mots cibles français de
façon équivalente ; les masqueurs paroliers irlandais ont eu un effet de masque
significativement plus faible que celui des masqueurs paroliers italiens. Ensuite, les
masqueurs paroliers produits en italien, langue inconnue et inintelligible pour les participants,
ont perturbé l’identification des mots cibles français avec la même efficacité que les
Partie expérimentale Expérience 3
103
masqueurs paroliers générés en français, langue native des participants ; les temps de réaction
obtenus avec les masqueurs paroliers italiens et français n’étaient significativement pas
différents.
Des résultats attendus ont donc d’abord été observés avec le français, la situation d’écoute
était difficile lorsque la langue concurrente était la langue native des participants, puis avec
l’irlandais, la tâche a été réalisée plus facilement qu’avec le français (pour des résultats
similaires voir Rhebergen et al., 2005 ; Garcia Lecumberri & Cooke, 2006 ; Van Engen &
Bradlow, 2007 ; Calandruccio et al., 2010b). En revanche, l’italien a conduit à des résultats
surprenants avec un effet de masque équivalent à celui de la langue native des participants
(français).
Dans la situation de la parole dans la parole (avec les masqueurs paroliers français, irlandais
et italiens), la tâche de décision lexicale utilisée dans cette Expérience 3 a mis en lumière le
même type de pattern de résultats que la tâche d’intelligibilité de l’Expérience 2 ; et ce, bien
que les données acquises avec ces deux tâches ne soient pas de même nature : des temps de
réaction avec la tâche de décision lexicale, des pourcentages de retranscriptions correctes avec
la tâche d’intelligibilité.
Regardons à présent les résultats obtenus lorsque les mots cibles français étaient
insérés dans les masqueurs de bruit fluctuant dans les trois langues manipulées (français,
irlandais et italien). Intéressons nous plus précisément à la comparaison des temps de réaction
moyens obtenus avec les deux types de masqueurs (parolier et bruit fluctuant) afin de
déterminer si la tâche de décision lexicale a mis en avant un effet des informations
linguistiques de haut niveau présentes dans les masqueurs paroliers français, irlandais et
italiens.
4.3. Nature des interférences
L’analyse des résultats a montré que l’effet du Type de bruit dans le masqueur était
présent uniquement pour le français. Les temps de réaction étaient significativement plus
courts avec les masqueurs de bruit fluctuant plutôt qu’avec les masqueurs paroliers ; ce qui
confirme que les informations linguistiques de haut niveau présentes dans les masqueurs
paroliers français ont participé au ralentissement de l’accès au lexique des mots cibles français
en plus des informations acoustiques et linguistiques de bas niveau. En revanche, pour
Partie expérimentale Expérience 3
104
l’italien et l’irlandais, il n’y avait pas de différence significative entre les temps de réaction
obtenus avec les deux types de masqueurs (parolier et bruit fluctuant), indiquant que l’accès
au lexique des mots cibles français a été principalement perturbé par les informations
acoustiques et linguistiques de bas niveau présentes dans les masqueurs paroliers irlandais et
italiens.
Il ressort de ces résultats que les informations linguistiques de haut niveau présentes dans les
masqueurs paroliers ont interféré sur l’accès au lexique des mots cibles français uniquement
lorsque la langue des masqueurs paroliers était intelligible pour les participants (français). De
plus, les phonèmes que l’irlandais et l’italien ont en commun avec la langue native (18% de
phonèmes communs entre l’irlandais et le français, 60% entre l’italien et le français) ne
semblent donc pas avoir été impliqués dans les interférences produites par les masqueurs
paroliers irlandais et italiens. Ceci est en accord avec les études (Best & Strange, 1992 ; Hallé,
Best & Levitt, 1999) qui ont rapporté que la production d’un phonème commun à plusieurs
langues varie au niveau articulatoire selon la langue dans laquelle il est produit, ce qui conduit
à des perceptions différentes de ce phonème. Dans notre cas, les phonèmes communs entre le
français et l’irlandais ainsi que ceux communs entre le français et l’italien ne seraient pas
entrés en compétition car même s’ils sont catégorisés de la même façon dans l’Alphabet
Phonétique International, ils ont pu être produits et perçus différemment.
Nous rappelons que dans la situation de la parole dans la parole, des temps de réaction
significativement plus longs ont été observés avec les masqueurs paroliers italiens plutôt
qu’avec les masqueurs paroliers irlandais. Etant donné l’absence de différence significative
entre les temps de réaction obtenus avec les deux types de masqueurs (parolier et bruit
fluctuant) en irlandais et en italien, la différence significative de temps de réaction observée
entre les masqueurs paroliers italiens et irlandais serait expliquée par des différences dans les
informations acoustiques et linguistiques de bas niveau entre ces deux langues.
Notamment, ces deux langues ont un système rythmique différent ; l’italien est une langue
syllabique comme le français, alors que l’irlandais est une langue accentuelle. L’italien et le
français ont donc un rythme syllabique régulier alors que pour l’irlandais la durée des syllabes
est variable et le rythme est donné par les syllabes accentuées. L’utilisation du rythme des
langues dans le traitement de la parole a notamment été mise en évidence par de nombreux
auteurs lors de situations d’écoute silencieuses (Cutler, Mehler, Norris & Segui, 1983, 1986 ;
Nazzi, Bertoncini & Mehler, 1998 ; Nazzi, Jusczyk & Johnson, 2000). Dans notre expérience,
Partie expérimentale Expérience 3
105
une hypothèse pourrait donc être que l’accès au lexique des mots cibles français a davantage
été perturbé par les masqueurs paroliers lorsque ces derniers étaient produits dans une langue
dont le système rythmique était identique à celui de la langue cible (mots cibles français
insérés dans des masqueurs paroliers italiens) plutôt que différent (mots cibles français insérés
dans des masqueurs paroliers irlandais). L’étude de Reel & Hicks (2012) vient soutenir cette
hypothèse. Ces auteurs ont demandé à des participants natifs de l’anglais de répéter des
phrases cibles anglaises masquées par des masqueurs paroliers à 2 locuteurs générés dans
quatre langues différentes : en anglais, en allemand, en espagnol ou en français ; les trois
dernières langues étant des langues inconnues pour les participants. L’allemand comme
l’anglais sont des langues accentuelles, alors que l’espagnol et le français sont toutes les deux
des langues syllabiques. Les auteurs ont observé que les participants ont eu moins de
difficultés à réaliser la tâche avec les masqueurs paroliers espagnols et français qu’avec les
masqueurs paroliers anglais et allemands, autrement dit lorsque la langue concurrente avait un
système rythmique différent de celui de la langue cible. Les résultats ont également montré
des performances équivalentes entre les masqueurs paroliers anglais et allemands, bien que
l’anglais soit la langue native des participants et l’allemand une langue qu’ils ne connaissent
pas. Les auteurs suggèrent alors que dans leur paradigme expérimental, les participants ont
davantage été sensibles au rythme de la langue concurrente plutôt qu’à l’intelligibilité de
celle-ci.
Cette différence entre l’italien et l’irlandais au niveau du système rythmique pourrait
expliquer à la fois la différence significative révélée entre les temps de réaction obtenus avec
les masqueurs paroliers italiens et les masqueurs paroliers irlandais, ainsi que la différence
significative observée entre les taux d’erreurs obtenus avec ces mêmes masqueurs paroliers.
En effet, l’analyse des taux moyens d’erreurs a indiqué que les masqueurs paroliers italiens
ont conduit à un taux d’erreurs significativement plus élevé que les masqueurs paroliers
irlandais. Etant donné que l’effet du Type de bruit dans le masqueur n’était significatif pour
aucune des langues manipulées, des différences dans les informations acoustiques et
linguistiques de bas niveau, comme par exemple une différence de système rythmique entre
l’italien et l’irlandais, pourraient être la cause de cette différence significative entre les taux
d’erreurs.
Par ailleurs, il est remarquable que les masqueurs de bruit fluctuant italiens aient également
conduit à un taux d’erreurs significativement plus élevé que les masqueurs de bruit fluctuant
français. Cela pourrait être dû à la plus grande difficulté ressentie par les participants pour
Partie expérimentale Expérience 3
106
extraire le mot cible des masqueurs. En effet, dans la tâche de décision lexicale, des erreurs
peuvent être commises quant à la décision à prendre (décider si l’item appartient à la langue
française), ainsi que des erreurs liées à la ségrégation des flux ; autrement dit, des erreurs
entraînées par la difficulté à extraire le mot cible du signal concurrent. Ainsi, il aurait été plus
difficile d’extraire les mots cibles avec les masqueurs de bruit fluctuant italiens plutôt qu’avec
ceux générés en français. Par exemple, les participants n’auraient réussi à extraire qu’une
partie du mot, les conduisant à une prise de décision incorrecte. Etant donné que les
différences entre les taux d’erreurs ont été entraînées par des masqueurs de bruit fluctuant, ces
différences seraient expliquées par des différences acoustiques et linguistiques de bas niveau
entre les langues italienne et française. Des différences quant à la place de l’accent tonique
sont notables, bien que ces langues soient toutes deux des langues syllabiques et romanes.
La situation de la parole dans la parole a montré des effets de masque
significativement différents entre les deux langues inconnues et inintelligibles (irlandais et
italien), mais aussi des effets de masque équivalents entre le français, langue native des
participants, et l’italien, langue inconnue et inintelligible pour les participants. Etant donné
qu’un effet des informations linguistiques de haut niveau a été mis en lumière seulement pour
les masqueurs paroliers français, il apparaît que le français et l’italien ont pénalisé
l’identification des mots cibles français de façon équivalente mais avec des interférences qui
ont impliqué des informations de natures différentes. Contrairement à l’italien qui a produit
des interférences qui n’ont impliqué que des informations acoustiques et linguistiques de bas
niveau, le français a en plus produit des interférences qui ont impliqué des informations
linguistiques de haut niveau.
4.4. Tâche de décision lexicale versus tâche d’intelligibilité
Les résultats de l’Expérience 3 concernant la nature des informations impliquées par
les interférences produites par les masqueurs paroliers français, irlandais et italiens ne
correspondent pas à ceux observés dans l’Expérience 2. Dans l’expérience précédente, un
effet des informations linguistiques de haut niveau était présent pour chacune des trois
langues manipulées. Nous avions même, à partir de ce résultat, cherché à déterminer si les
interférences linguistiques produites par les masqueurs paroliers dans les trois langues avaient
lieu au niveau phonémique.
Partie expérimentale Expérience 3
107
Cette différence entre les Expériences 2 & 3 peut être expliquée par le fait que ces deux
expériences ont utilisé des tâches différentes ; dans l’Expérience 2 il s’agissait d’une tâche
d’intelligibilité et dans l’Expérience 3 d’une tâche de décision lexicale. Lorsque nous nous
intéressons uniquement aux conditions dans lesquelles les mots cibles étaient insérés dans les
masqueurs paroliers (c’est-à-dire dans la situation de la parole dans la parole), les deux tâches
ont mis en avant un pattern de résultats similaire : les masqueurs paroliers français et italiens
ont dégradé plus fortement l’identification des mots cibles français que les masqueurs
paroliers irlandais. En revanche, ces deux tâches ont indiqué des résultats divergents quant à
la nature des informations impliquées par les interférences produites par les masqueurs
paroliers dans les trois langues. Cette divergence dans les résultats serait expliquée par le fait
que ces deux tâches capturent les processus cognitifs à des moments différents. Alors que la
tâche de décision lexicale mesure la vitesse d’accès au lexique des mots cibles, la tâche
d’intelligibilité évalue la compréhension une fois que les traitements perceptifs impliqués
dans l’accès au lexique ont été exécutés. Cela suggère que dans l’Expérience 2, l’effet des
informations linguistiques de haut niveau mis en évidence pour les masqueurs paroliers
irlandais et italiens, correspondrait à un effet des interférences post-lexicales que la tâche
d’intelligibilité prend en compte. La tâche de décision lexicale dans l’Expérience 3 ayant
indiqué que les masqueurs paroliers irlandais et italiens ne produiraient que des interférences
acoustiques ou linguistiques de bas niveau, la différence de performances que ces masqueurs
paroliers ont engendrée serait due à des différences dans les caractéristiques acoustiques et
linguistiques de bas niveau entre ces langues, comme par exemple des différences au niveau
de leur système rythmique.
En indiquant que les masqueurs paroliers irlandais et italiens auraient produit uniquement des
interférences qui ont impliqué des informations acoustiques et linguistiques de bas niveau, la
tâche de décision lexicale de l’Expérience 3 suggère que manipuler des langues inintelligibles
selon leur distance phonémique avec la langue native des participants ne permet pas de tester
l’hypothèse des compétitions phonémiques entre les deux flux de parole concurrents.
4.5. Conclusions
Dans l’Expérience 3, une tâche de décision lexicale a été utilisée afin de capturer les
interférences entre les signaux de parole concurrents pendant l’accès au lexique des mots
cibles français. Une comparaison des temps de réaction obtenus avec les masqueurs paroliers
Partie expérimentale Expérience 3
108
et les masqueurs de bruit fluctuant pour chacune des trois langues manipulées (français,
irlandais et italien) a mis en évidence un effet des informations linguistiques de haut niveau
uniquement pour les masqueurs paroliers français. Cela suggère tout d’abord que les
masqueurs paroliers générés dans les deux langues inconnues des participants (irlandais et
italien) ont entraîné des temps de réaction significativement différents, mais les interférences
qu’ils ont produites ont impliqué des informations de mêmes natures, à savoir des
informations acoustiques et linguistiques de bas niveau. Ensuite, concernant les masqueurs
paroliers français et italiens, bien qu’ils aient ralenti l’accès au lexique des mots cibles
français aussi fortement, leurs interférences ont impliqué des informations de natures
différentes. Les informations acoustiques et linguistiques de bas niveau ainsi que les
informations linguistiques de haut niveau des masqueurs paroliers français ont perturbé
l’accès au lexique des mots cibles français, alors que pour les masqueurs paroliers italiens, les
informations linguistiques de haut niveau ne seraient pas entrées en compétition avec les mots
cibles.
Dans cette expérience, la tâche de décision lexicale a entraîné un pourcentage moyen
d’erreurs de 34,1%, ce qui est élevé par rapport au pourcentage moyen d’environ 10% qui est
généralement observé dans une tâche de décision lexicale réalisée dans le silence. Dans
l’Expérience 4, nous allons utiliser à nouveau la tâche de décision lexicale et tester les mêmes
conditions expérimentales que dans l’Expérience 3 mais en fixant le Rapport Signal sur Bruit
entre les mots cibles français et les masqueurs à 0 dB au lieu de -5 dB; le niveau sonore des
mots cibles sera alors équivalent au niveau sonore des masqueurs au lieu d’être plus faible.
Nous nous attendons à ce que les pourcentages moyens d’erreurs diminuent, et il sera question
d’examiner si les patterns de résultats à 0 dB évolueront par rapport à ceux observés à -5 dB
ou s’ils resteront similaires ; patterns qui concernent les temps de réaction observés dans la
situation de la parole dans la parole ainsi que la nature des informations impliquées par les
interférences produites par les masqueurs paroliers.
Partie expérimentale Expérience 4
109
H) EXPERIENCE 4
1. Objectifs
Dans les expériences précédentes, des effets de masque équivalents ont été mis en
évidence pour les masqueurs paroliers français et italiens. L’Expérience 3 a précisé que ces
masqueurs paroliers avaient produit des interférences de natures différentes ; seules les
informations linguistiques de haut niveau des masqueurs paroliers français auraient interféré
sur l’identification des mots cibles français. Dans cette Expérience 4, nous souhaitons obtenir
plus de précisions sur ce pattern de résultats. Une possibilité est de rendre la tâche de décision
lexicale moins difficile et ainsi de pouvoir exploiter un plus grand nombre de données. Pour
cela, nous allons utiliser la tâche de décision lexicale de l’expérience précédente et tester les
mêmes conditions expérimentales, mais avec un RSB de 0 dB au lieu de -5 dB ; la situation
d’écoute devrait être facilitée pour les participants et nous nous attendons à un taux d’erreurs
moyen plus faible. Nous observerons également si les résultats qui seront obtenus avec les
masqueurs paroliers irlandais et les masqueurs de bruit fluctuant dans les trois langues
manipulées évolueront avec le passage à 0 dB.
2. Méthode
2.1. Stimuli
Les 162 stimuli utilisés dans l’Expérience 4 (items cibles et masqueurs) étaient
exactement identiques à ceux générés dans l’Expérience 3 (annexes 3 et 4). Ces 162 stimuli
ont été obtenus en mixant chacun des 81 mots cibles et chacun des 81 pseudo-mots cibles à un
masqueur (parolier ou de bruit fluctuant) produit en français, irlandais ou italien, selon la
méthode décrite dans l’Expérience 3.
Dans l’Expérience 4, le Rapport Signal sur Bruit a été fixé à 0 dB et non pas à -5 dB comme
dans l’Expérience 3, le niveau sonore des items cibles était donc identique au niveau sonore
des masqueurs.
Partie expérimentale Expérience 4
110
2.2. Conditions expérimentales
Dans l’Expérience 4, les variables manipulées étaient les mêmes que dans
l’Expérience 3. Nous les rappelons :
- L le facteur fixe à mesures répétées « Langue du masqueur » à 3 modalités, français,
gaélique irlandais et italien ;
- T le facteur fixe à mesures répétées « Type de bruit » dans le masqueur à 2 modalités, parole
et bruit fluctuant ;
- N le facteur fixe à mesures répétées « Nature des items cibles » à 2 modalités, mots et
pseudo-mots ;
- P le facteur aléatoire « Participants » à 28 modalités.
Le plan expérimental était le suivant : P28*L3*T2*N2. Les analyses statistiques qui ont été
réalisées pour l’Expérience 4 n’ont pris en compte que les performances des participants
obtenues avec les mots cibles. Nous avions donc 6 conditions expérimentales, le plan
d’analyse était le suivant : P28*L3*T2.
2.3. Procédure expérimentale
La procédure expérimentale était exactement identique à celle de l’Expérience 3. Les
participants devaient réaliser une tâche de décision lexicale sur les items cibles insérés dans
les masqueurs. Ils devaient identifier le plus vite possible et en faisant le moins d’erreurs
possible si l’item cible était un mot de la langue française.
2.4. Participants
Vingt-huit volontaires de langue maternelle française, âgés de 18 à 32 ans ont participé
à l’Expérience 4. Aucun n’avait participé aux 3 expériences précédentes, aucun n’avait suivi
d’enseignement de gaélique irlandais ni d’italien, et aucun ne souffrait de trouble auditif ni de
trouble du langage. Leur participation a été dédommagée.
Partie expérimentale Expérience 4
111
3. Résultats
Tous les participants et tous les mots cibles de la phase test ont été inclus dans les
analyses, soit 28 participants et 78 mots cibles. Deux analyses de variance à mesures répétées
(ANOVA) ont été menées sur les performances des participants à 0 dB. Pour la première
analyse, les TRs moyens ont été mesurés pour les mots cibles correctement identifiés dans
chaque condition expérimentale (Tableau 9). Les essais pour lesquels les participants ont fait
des erreurs (22,1%), n’ont pas répondu dans le temps imparti de 4500 ms (0,8%), ainsi que les
essais pour lesquels les TRs étaient inférieurs à 300 ms (0,2%) n’ont pas été inclus dans
l’analyse. Ainsi, la première ANOVA a considéré comme variable dépendante les TRs, et
comme variables intra-sujets la Langue des masqueurs (à 3 modalités : irlandais, italien et
français) et le Type de bruit dans le masqueur (à 2 modalités : parole et bruit fluctuant). Dans
la seconde ANOVA, les taux d’erreurs moyens (Tableau 10) constituaient la variable
dépendante et les variables intra-sujets étaient les mêmes que dans la première ANOVA.
3.1. Analyse statistique des moyennes de TRs
Tableau 9 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement
identifiés dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 1043 1086 1094 1058 1108 1139
Ecart-types 155,35 201,28 169,18 151,53 186,26 182,69
3.1.1. Effets principaux
Effet de la Langue des masqueurs
L’analyse de variance a révélé un effet principal significatif de la Langue des
masqueurs (F(2,54) = 7.12, p < .001). Les participants ont été plus rapides lorsque les
masqueurs étaient produits en irlandais (1051 ms ; ET = 152,23) et plus lents avec les
masqueurs italiens (1097 ms ; ET = 192,48) et français (1117 ms ; ET = 175,87).
Partie expérimentale Expérience 4
112
Effet du Type de bruit
L’effet principal du Type de bruit dans le masqueur n’est pas ressorti significatif à
l’ANOVA (F(1,27) = 3.13, n.s.). Les TRs moyens étaient proches que, les mots cibles aient
été insérés dans des masqueurs paroliers (1102 ms ; ET = 175,3) ou dans des masqueurs de
bruit fluctuant (1075 ms ; ET = 175,63).
3.1.2. Interaction simple
L’analyse de variance n’a pas indiqué d’interaction simple significative entre les deux
facteurs Langue des masqueurs et Type de bruit (F(2,54) = 0.3, n.s.). Les comparaisons post-
hoc réalisées avec le test HSD de Tukey ont montré que l’effet du Type de bruit dans le
masqueur n’était significatif pour aucune des trois langues manipulées. Avec les masqueurs
paroliers, les comparaisons post-hoc ont révélé une différence significative entre l’irlandais et
le français (p = .05), c’est-à-dire entre les langues qui ont conduit aux performances extrêmes.
Enfin, avec les masqueurs de bruit fluctuant, aucune différence entre les langues n’a été
révélée. Les résultats sont reportés dans la Figure 17 ci-dessous.
Figure 17 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à 0 dB, en fonction de la Langue des masqueurs (irlandais, italien et français).
Les erreurs standard sont reportées. Le symbole ‘ * ’ indique une différence significative entre
les masqueurs paroliers irlandais et français.
Partie expérimentale Expérience 4
113
3.2. Analyse statistique des taux d’erreurs
Tableau 10 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions
expérimentales. Les écart-types sont également indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 17,58 27,20 17,03 20,88 26,10 23,63
Ecart-types 12,88 13,32 12,09 12,71 12,27 13,56
3.2.1. Effets principaux
Effet de la Langue des masqueurs
L’analyse de variance a indiqué un effet principal significatif de la Langue des
masqueurs (F(2,54) = 5.89, p < .005). En moyenne, les taux d’erreurs étaient plus faibles
avec les masqueurs irlandais (19,23% ; ET = 12,79) et français (20,33% ; ET = 13,16), et plus
élevés avec les masqueurs italiens (26,65% ; ET = 12,7).
Effet du Type de bruit
L’effet principal du Type de bruit dans le masqueur n’est pas ressorti significatif à
l’analyse de variance (F(1,27) = 2.02, n.s.). Les taux d’erreurs étaient proches entre les
masqueurs paroliers (23,53% ; ET = 12,88) et les masqueurs de bruit fluctuant (20,6% ; ET =
13,47).
3.2.2. Interaction simple
L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit n’a pas
été signalée comme significative à l’ANOVA (F(2,54) = 1.3, n.s.). Les comparaisons post-hoc
avec le test HSD de Tukey ont indiqué que l’effet du Type de bruit dans le masqueur n’était
significatif pour aucune des trois langues. Les comparaisons post-hoc ont également montré
qu’avec les masqueurs de bruit fluctuant, une différence significative a été observée entre le
français et l’italien (p = .04) ainsi qu’une différence tendancielle entre l’irlandais et l’italien (p
= .06). Avec les masqueurs paroliers, aucune différence entre les langues n’a été mise en
évidence.
Partie expérimentale Expérience 4
114
4. Discussion
4.1. Rappel des objectifs
Dans l’Expérience 4, nous avons testé les mêmes conditions expérimentales que dans
l’Expérience 3, mais dans une situation d’écoute plus favorable ; les items cibles étaient
insérés dans des masqueurs paroliers et des masqueurs de bruit fluctuant générés en français,
en irlandais et en italien, avec un RSB fixé à 0 dB au lieu de -5 dB (Expérience 3). Il était
question d’examiner si les pourcentages d’erreurs des participants allaient diminuer, et si une
évolution des résultats entre un RSB à -5 dB (Expérience 3) et un RSB à 0 dB serait
engendrée. Plus précisément, dans cette partie, nous porterons un intérêt particulier aux
résultats obtenus avec les masqueurs paroliers français et italiens qui, dans l’expérience
précédente, ont eu des effets de masque équivalents bien qu’ils aient produit des interférences
de natures différentes.
4.2. Taux d’erreurs moyens
Dans la situation d’écoute à 0 dB, le taux d’erreurs des participants a effectivement
diminué. Même s’il reste plus élevé que celui observé dans une tâche de décision lexicale
réalisée dans le silence (estimé environ à 10%), le taux d’erreurs moyen des participants est
passé de 34,1% (pourcentage obtenu à -5 dB) à 22,1%.
Qu’en est-il des temps de réaction moyens obtenus dans la situation de la parole dans la
parole et de la nature des interférences produites par les masqueurs paroliers français,
irlandais et italiens ?
4.3. Situation de la parole dans la parole
Dans l’Expérience 4 avec un RSB fixé à 0 dB, l’analyse des résultats a indiqué des
temps de réaction significativement différents uniquement entre les masqueurs paroliers
irlandais et français. Les masqueurs paroliers italiens ont entraîné des temps de réaction qui ne
différaient significativement pas de ceux observés avec les masqueurs paroliers irlandais et
français. Plus précisément, les masqueurs paroliers irlandais ont conduit aux temps de
Partie expérimentale Expérience 4
115
réaction les plus courts, et les masqueurs paroliers français aux temps de réaction les plus
longs.
Ce pattern de résultats obtenu avec un RSB de 0 dB entre les mots cibles et les masqueurs est
différent de celui observé dans l’Expérience 3 lorsque le RSB était fixé à -5 dB. En effet, dans
l’expérience précédente, l’accès au lexique des mots cibles français était aussi long avec les
masqueurs paroliers italiens qu’avec ceux générés en français, et significativement plus court
avec les masqueurs paroliers irlandais. Il semblerait que la situation d’écoute à 0 dB soit
moins favorable que la situation d’écoute à -5 dB pour mettre en évidence des différences
entre les langues (notamment entre l’irlandais et l’italien), et entre leur niveau de perturbation
sur l’accès au lexique des mots cibles français.
De plus dans l’Expérience 1, nous avons étudié la situation de la parole dans la parole
avec une tâche d’intelligibilité et nous avons comparé les effets de masque de masqueurs
paroliers français et irlandais lorsque le RSB entre les mots cibles et les masqueurs paroliers
était fixé à -5 dB ou à 0 dB. Nous avons observé des pourcentages moyens de retranscriptions
correctes significativement plus élevés avec les masqueurs paroliers irlandais qu’avec les
masqueurs paroliers français, et ce pour les deux valeurs de RSB manipulées (-5 dB et 0 dB) ;
néanmoins, cet effet de la Langue des masqueurs était plus important à -5 dB plutôt qu’à 0
dB. Ainsi, en tenant compte des résultats obtenus avec la tâche d’intelligibilité de
l’Expérience 1, de ceux observés avec la tâche de décision lexicale utilisée dans l’Expérience
3 (à -5 dB) et de ceux révélés dans la présente expérience (à 0 dB), la situation d’écoute à -5
dB semble être la plus pertinente pour révéler les différences entre les effets de masque des
masqueurs paroliers français, irlandais et italiens.
Les résultats des études antérieures sont en accord avec cette idée. Les études de Van
Engen & Bradlow (2007) et de Calandruccio et al. (2010b) ont été menées auprès de
participants natifs de l’anglais qui devaient réaliser une tâche d’intelligibilité sur des phrases
cibles anglaises dégradées par des masqueurs paroliers à 2 locuteurs générés en anglais et en
mandarin. Des performances significativement différentes ont été observées entre les
masqueurs paroliers anglais et mandarins uniquement à -5 dB, cette différence significative a
disparu lorsque le RSB est passé à -3 dB (Calandruccio et al., 2010b) et à 0 dB (Van Engen &
Bradlow, 2007).
Partie expérimentale Expérience 4
116
Intéressons nous à présent aux résultats obtenus avec les masqueurs de bruit fluctuant
et plus précisément aux résultats de la comparaison des temps de réaction obtenus avec les
deux types de masqueurs (parolier et bruit fluctuant). Déterminons si le passage d’un RSB de
-5 dB à un RSB de 0 dB a eu un impact sur la nature des informations présentes dans les
masqueurs paroliers français, irlandais et italiens qui sont entrées en compétition avec la
parole cible.
4.4. Nature des interférences
Nos résultats ont indiqué que l’effet du Type de bruit dans le masqueur n’était présent
pour aucune des trois langues manipulées (français, irlandais et italien). Cette absence de
différence significative entre les temps de réaction moyens obtenus avec les deux types de
masqueurs (parolier et bruit fluctuant) pour chacune des langues révèle que les informations
linguistiques de haut niveau présentes dans les masqueurs paroliers français, irlandais et
italiens n’ont pas perturbé l’accès au lexique des mots cibles français ; seules les informations
acoustiques et linguistiques de bas niveau ont influencé les temps de réaction des participants.
Ce pattern de résultats obtenu à 0 dB ne confirme pas celui observé dans l’Expérience
3 à -5 dB. En effet, dans l’expérience précédente, un effet des informations linguistiques de
haut niveau a été mis en évidence pour les masqueurs paroliers générés dans la langue
française (langue native) et donc dans la seule langue intelligible pour les participants. Ici à 0
dB, les masqueurs paroliers français ont produit des interférences qui n’ont pas impliqué les
informations linguistiques de haut niveau. Une explication serait qu’à 0 dB, la ségrégation
entre les deux flux de parole concurrents étant plus facile, les participants pourraient extraire
le signal cible du signal concurrent avec moins de difficulté. L’effet d’interférence des
informations linguistiques de haut niveau des masqueurs paroliers serait alors réduit.
Quant à la nature des informations impliquées par les interférences produites par les
masqueurs paroliers irlandais et italiens, nous retrouvons à 0 dB comme à -5 dB, l’absence de
différence significative entre les temps de réaction obtenus avec les deux types de masqueurs
(parolier et bruit fluctuant), ce qui indique que seules les informations acoustiques et
linguistiques de bas niveau des masqueurs paroliers irlandais et italiens ont perturbé l’accès au
lexique des mots cibles français. Néanmoins, une différence apparaît entre les situations
d’écoute à -5 dB et à 0 dB. En effet, à -5 dB (Expérience 3), les masqueurs paroliers italiens
Partie expérimentale Expérience 4
117
ont conduit à des temps de réaction significativement plus élevés que les masqueurs paroliers
irlandais. Or à 0 dB, il n’y a plus de différence significative entre les temps de réaction
obtenus avec les masqueurs paroliers irlandais et italiens. Ainsi à 0 dB, bien que des effets des
informations acoustiques et linguistiques de bas niveau aient été observés pour les masqueurs
paroliers irlandais et italiens, ces effets seraient réduits, ce qui expliquerait l’absence de
différence significative entre les temps de réaction obtenus avec les masqueurs paroliers
irlandais et italiens. Ces effets d’interférences seraient réduits et non pas annulés ou
supprimés. En effet, une différence de temps de réaction entre les masqueurs paroliers
irlandais et français est tout de même mise en évidence. A nouveau, le fait que la ségrégation
entre les deux flux concurrents soit plus facile à 0 dB qu’à -5 dB pourrait expliquer les
patterns de résultats différents observés entre les situations d’écoute à -5 dB et à 0 dB.
4.5. Conclusions
Dans l’Expérience 4, la situation d’écoute à 0 dB (niveau sonore des mots cibles
équivalent à celui des masqueurs) a permis de réduire le pourcentage d’erreurs des
participants. Néanmoins, cette situation d’écoute ne se révèle pas être la plus favorable pour
explorer la nature des informations présentes dans les masqueurs paroliers qui perturbent
l’accès au lexique des mots cibles. En effet, l’effet des informations linguistiques de haut
niveau présent pour les masqueurs paroliers français à -5 dB (Expérience 3) a été réduit en
passant à 0 dB. Une réduction de l’effet des informations acoustiques et linguistiques de bas
niveau a également été observée pour les masqueurs paroliers italiens et irlandais. Dans cette
expérience, bien que le nombre de données à analyser soit plus important (diminution du taux
d’erreurs moyen des participants), nous n’avons pas pu obtenir d’informations
supplémentaires concernant les effets de masque équivalents des masqueurs paroliers français
et italiens (Expérience 3). Pour ces raisons, dans les expériences suivantes, nous n’utiliserons
plus la situation d’écoute à 0 dB mais la situation d’écoute à -5 dB.
Partie expérimentale Bilan des Expériences 1, 2, 3 & 4
118
I) BILAN DES EXPERIENCES 1, 2, 3 & 4
Dans cette thèse, nous nous intéressons aux interférences linguistiques qui
interviennent dans la situation de la parole dans la parole, notre objectif étant de les
caractériser. Suite aux quatre premières expériences, et avant de passer aux Expériences 5 &
6, rappelons nos objectifs et faisons un bilan des résultats obtenus.
Expérience 1
Dans l’Expérience 1, des mots cibles français étaient insérés dans des masqueurs
paroliers à 2 et à 4 locuteurs générés en français et en gaélique irlandais, le français étant la
langue native des participants et le gaélique irlandais une langue qui leur est inconnue (et
donc inintelligible). Le RSB était de -5 dB ou de 0 dB. Les participants devaient retranscrire
le mot cible entendu. En accord avec les résultats mis en évidence dans la littérature, nous
avons confirmé que l’intelligibilité des mots cibles français a été plus faible avec les
masqueurs paroliers générés dans la langue intelligible pour les participants (français) plutôt
que dans la langue inconnue (irlandais). En effet, les informations linguistiques des
masqueurs paroliers français étant intelligibles, elles ont interféré sur l’intelligibilité des mots
cibles français. Ceci étant notamment mis en évidence par le fait que les participants ont
retranscrit certains mots présents dans les masqueurs paroliers français à la place des mots
cibles français.
Expérience 2
Dans l’Expérience 2, il était question de déterminer si seules les informations lexicales
produisent des interférences ou si les informations sous-lexicales peuvent elles aussi entrer en
compétition avec la parole cible. Nous avons testé plus particulièrement l’hypothèse selon
laquelle les interférences linguistiques interviendraient au niveau phonémique. L’objectif était
d’explorer plus avant les interférences linguistiques produites par les masqueurs paroliers
générés dans une langue intelligible, mais aussi d’en connaître davantage sur les interférences
produites par les masqueurs paroliers générés dans une langue inintelligible. En effet, ces
masqueurs pour lesquels aucune intrusion lexicale n’est observée (c’est-à-dire que dans les
Partie expérimentale Bilan des Expériences 1, 2, 3 & 4
119
erreurs de retranscription des participants, nous n’avons pas observé de mots appartenant aux
masqueurs paroliers irlandais à la place des mots cibles français), ne produisent-ils qu’un effet
de masque énergétique ou leurs informations d’ordre phonémique pourraient-elles également
participer à la dégradation du message cible ? Nous avons testé l’hypothèse des interférences
phonémiques en incluant une deuxième langue inconnue des participants : l’italien. La langue
italienne est plus proche du français que l’irlandais selon plusieurs critères tels que le système
rythmique ou l’origine. Cependant, nous avons choisi l’italien pour sa distance phonémique
avec le français. En effet, dans l’inventaire phonémique de l’italien, nous retrouvons 60% des
phonèmes du français. L’irlandais est plus éloigné du français puisque seulement 18% des
phonèmes français sont présents dans l’inventaire phonémique de l’irlandais (Maddieson et
al., 2011). Selon l’hypothèse des interférences phonémiques, plus le pourcentage de
phonèmes communs entre la langue cible et la langue concurrente sera élevé, plus les
interférences phonémiques seront importantes, ce qui réduira l’intelligibilité des mots cibles
français. Dans cette Expérience 2, les masqueurs paroliers étaient composés de 4 locuteurs et
le RSB était fixé à -5 dB. Nous avons retrouvé des performances significativement plus
faibles avec les masqueurs paroliers français qu’avec les masqueurs paroliers irlandais. Nous
avons également observé des performances équivalentes entre les masqueurs paroliers
français et les masqueurs paroliers italiens, ce qui est surprenant puisque l’italien est une
langue non intelligible pour les participants et le français leur langue native.
Dans l’Expérience 2, nous avons pris en compte le fait que dans la situation de la
parole dans la parole, le masque informationnel produit au moins deux types d’interférences :
celles qui impliquent les informations linguistiques de bas niveau (rythme) et celles qui
impliquent les informations linguistiques de haut niveau (phonèmes, syllabes, mots). Afin
d’explorer plus favorablement les interférences linguistiques de haut niveau, nous avons
utilisé un deuxième type de masqueurs : des masqueurs de bruit fluctuant. Ils ont été générés à
partir des masqueurs paroliers français, irlandais, italiens, et ne partagent que les informations
acoustiques et linguistiques de bas niveau avec ces masqueurs paroliers ; les informations
linguistiques de haut niveau ont été supprimées. Des différences significatives de
pourcentages de retranscriptions correctes ont été révélées entre les deux types de masqueurs
(parolier et bruit fluctuant) pour chacune des trois langues manipulées, suggérant que les
informations linguistiques de haut niveau présentes dans les masqueurs paroliers français,
irlandais et italiens se sont associées aux informations acoustiques et linguistiques de bas
niveau pour dégrader l’intelligibilité des mots cibles français. Des analyses statistiques
Partie expérimentale Bilan des Expériences 1, 2, 3 & 4
120
complémentaires ont indiqué que ces effets des informations linguistiques de haut niveau
n’étaient pas proportionnels au pourcentage de phonèmes communs entre la langue cible et la
langue concurrente, suggérant que des interférences linguistiques autres que des interférences
phonémiques interviendraient, comme par exemple des interférences post-lexicales. Ces
dernières seraient dues à la tâche d’intelligibilité que nous avons utilisée pour tester notre
paradigme expérimental. En effet, les participants doivent retranscrire le mot cible une fois
que l’essai est terminé. Entre la fin de présentation du mot cible et la fin de l’essai, du temps
s’écoule pendant lequel des traitements post-lexicaux peuvent avoir lieu et influencer la
réponse finale des participants.
Expérience 3
Dans l’Expérience 3, au lieu d’utiliser une tâche d’intelligibilité, nous avons testé
notre paradigme expérimental avec une tâche de décision lexicale qui a pour caractéristique
de minimiser l’effet des interférences post-lexicales ; elle nous a permis de tester l’hypothèse
des interférences phonémiques durant l’accès au lexique des mots cibles français. Concernant
les masqueurs paroliers, la tâche de décision lexicale a mis en lumière le même pattern de
résultats que la tâche d’intelligibilité : la situation d’écoute était plus facile avec les
masqueurs paroliers irlandais et aussi difficile avec les masqueurs paroliers italiens qu’avec
les masqueurs paroliers français. En revanche, concernant la nature des interférences, la tâche
de décision lexicale a indiqué des résultats différents de ceux observés avec la tâche
d’intelligibilité dans l’Expérience 2 puisqu’un effet des informations linguistiques de haut
niveau n’a été révélé que pour les masqueurs paroliers français. Il ressort tout d’abord de
l’Expérience 3, que l’effet des informations linguistiques de haut niveau n’est intervenu que
lorsque la langue des masqueurs paroliers était intelligible. Les masqueurs paroliers français
et italiens auraient donc perturbé l’accès au lexique des mots cibles français avec autant
d’efficacité mais avec des interférences de natures différentes ; les masqueurs paroliers
italiens n’auraient produit que des interférences acoustiques et linguistiques de bas niveau.
Ensuite, concernant les masqueurs paroliers produits dans les deux langues inconnues des
participants (irlandais et italien), ils n’ont pas dégradé aussi efficacement la parole cible mais
leurs interférences ont impliqué des informations de mêmes natures : des informations
acoustiques et linguistiques de bas niveau. Les phonèmes communs entre le français et
l’irlandais ainsi que ceux communs entre le français et l’italien, ne semblent pas avoir créé
Partie expérimentale Bilan des Expériences 1, 2, 3 & 4
121
d’interférences pendant l’accès au lexique des mots cibles français. La tâche de décision
lexicale s’est avérée être plus précise que la tâche d’intelligibilité en minimisant l’effet des
traitements post-lexicaux. Elle nous a permis d’écarter l’hypothèse selon laquelle, dans notre
paradigme expérimental, les masqueurs paroliers générés dans les langues inconnues des
participants produiraient des interférences phonémiques.
Expérience 4
Dans l’Expérience 4, afin de déterminer s’il est possible d’obtenir davantage
d’informations avec la tâche de décision lexicale, nous avons testé le même paradigme
expérimental à 0 dB. Nous avons observé un pattern de résultats différent de celui à -5 dB.
En effet, avec les masqueurs paroliers, les temps de réaction étaient significativement
différents uniquement entre l’irlandais et le français. Les temps de réaction entre les deux
langues inconnues des participants (irlandais et italien) n’étaient plus significativement
différents. De plus, l’effet des informations linguistiques de haut niveau produit par les
masqueurs paroliers français à -5 dB dans l’Expérience 3, n’était plus présent dans cette
expérience à 0 dB. Etant donné l’absence de différence significative entre les masqueurs
paroliers irlandais et italiens, les effets des informations acoustiques et linguistiques de bas
niveau de ces masqueurs paroliers ont, eux aussi, été réduits. Ce pattern de résultat pourrait
être expliqué par le fait qu’à 0 dB, la ségrégation entre le signal cible et le signal concurrent
est plus facile qu’à -5 dB.
Expériences 5 & 6
Dans nos deux dernières expériences, les Expériences 5 & 6, notre objectif est de nous
focaliser sur le pattern de résultats observé avec les masqueurs paroliers français et italiens à
-5 dB ; ils ont perturbé l’accès au lexique des mots cibles français avec autant d’efficacité
mais avec des interférences de natures différentes. Nous utiliserons à nouveau la tâche de
décision lexicale et nous testerons le même paradigme expérimental, à savoir des mots cibles
français insérés dans des masqueurs paroliers à 4 locuteurs produits en français, irlandais,
italiens, ou dans des masqueurs de bruit fluctuant générés à partir des masqueurs paroliers
dans chacune des trois langues manipulées. Le RSB sera de -5 dB. La différence entre
l’Expérience 3 et les Expériences 5 & 6 concernera les participants sélectionnés, et plus
Partie expérimentale Bilan des Expériences 1, 2, 3 & 4
122
précisément leur niveau de connaissance du français et de l’italien. Dans l’Expérience 5, nous
testerons un groupe de participants natifs du français qui parlent l’italien comme langue
seconde. A présent que l’italien est une langue intelligible pour ces participants, nous
examinerons si un effet des informations linguistiques de haut niveau sera produit par les
masqueurs paroliers italiens. Dans l’Expérience 6, la tâche de décision lexicale sera réalisée
par des participants natifs de l’italien qui parlent le français comme langue seconde. Cette
expérience sera ainsi l’occasion de tester notre paradigme expérimental lorsque les mots
cibles français seront produits dans la langue seconde des participants. Nous observerons si
des effets des informations linguistiques de haut niveau seront produits par les masqueurs
paroliers italiens et français, et nous les comparerons. Dans l’Expérience 5 comme dans
l’Expérience 6, nous explorerons l’accès au lexique des mots cibles français lorsque les
masqueurs paroliers seront produits dans la langue native des participants (Expérience 5 :
français, Expérience 6 : italien), dans leur langue seconde (Expérience 5 : italien, Expérience
6 : français) ou dans une langue qui leur est inconnue (Expériences 5 & 6 : irlandais).
Partie expérimentale Expérience 5
123
J) EXPERIENCE 5
1. Objectifs
Dans les Expériences 1 à 4, seuls les masqueurs paroliers produits en français étaient
intelligibles pour les participants. En effet, ces derniers étaient natifs du français et n’avaient
aucune connaissance du gaélique irlandais ni de l’italien. Dans l’Expérience 5, les masqueurs
paroliers générés en italien seront eux aussi intelligibles pour les participants. Nous
recruterons des participants natifs du français qui parlent l’italien comme langue seconde
(L2) ; le gaélique irlandais gardera le statut de langue non connue (non intelligible). Utiliser
ce groupe de participants nous permettra de faire évoluer notre paradigme expérimental
puisque nous allons faire varier, pour la langue de la parole concurrente, le niveau de
connaissances des participants, c’est-à-dire leur niveau d’expertise. Ainsi, la tâche de décision
lexicale sera proposée avec des mots cibles français qui seront insérés dans des masqueurs
paroliers générés dans la langue native des participants (français), dans leur langue seconde
(italien) et dans une langue qui leur est inconnue (irlandais). Nous testerons les mêmes
conditions expérimentales que dans l’Expérience 3 : les mots cibles seront insérés avec un
Rapport Signal sur Bruit de -5 dB dans les masqueurs paroliers, ces derniers seront composés
de 4 locuteurs. Des masqueurs de bruit fluctuant générés à partir des masqueurs paroliers
français, irlandais et italiens, seront également utilisés.
L’objectif de l’Expérience 5 est de compléter les résultats de l’Expérience 3. Dans cette
dernière, lorsque la langue des masqueurs paroliers était intelligible pour les
participants (c’est-à-dire lorsque les masqueurs paroliers étaient en français), il a été mis en
évidence que les informations linguistiques de haut niveau se sont associées aux informations
acoustiques et linguistiques de bas niveau pour perturber l’accès au lexique des mots cibles
français. Dans l’Expérience 5, à présent que l’italien devient une langue intelligible pour les
participants, nous souhaitons déterminer si les informations linguistiques de haut niveau des
masqueurs paroliers italiens perturbent l’accès au lexique des mots cibles français. Si tel est le
cas, nous examinerons si les participants sont affectés de façon équivalente par les masqueurs
paroliers générés dans leur langue native (français) et par ceux produits dans leur langue
seconde (italien) ; autrement dit, nous chercherons à déterminer si l’une des situations
d’écoute génère des interférences linguistiques plus fortes que l’autre.
Partie expérimentale Expérience 5
124
2. Méthode
2.1. Stimuli
Les 162 stimuli utilisés dans l’Expérience 5 (annexes 3 et 4) étaient exactement
identiques à ceux utilisés dans les Expériences 3 & 4 (items cibles et masqueurs). Nous
rappelons que les stimuli ont été obtenus en insérant chacun des 81 mots cibles et chacun des
81 pseudo-mots cibles à 2,5 sec du début d’un masqueur de 4 sec (parolier ou de bruit
fluctuant) qui pouvait être produit en français, irlandais ou italien.
Dans l’Expérience 5, le Rapport Signal sur Bruit entre les items cibles et les masqueurs était
fixé à -5 dB par Matlab. Ainsi le niveau sonore des items cibles était plus faible (65 dB) que
celui des masqueurs (70 dB).
2.2. Conditions expérimentales
Dans l’Expérience 5, les variables manipulées étaient identiques à celles des
Expériences 3 & 4. Ainsi, nous retrouvons :
- L le facteur fixe à mesures répétées « Langue des masqueurs » à 3 modalités, français,
gaélique irlandais et italien ;
- T le facteur fixe à mesures répétées « Type de bruit » dans le masqueur à 2 modalités, parole
et bruit fluctuant ;
- N le facteur fixe à mesures répétées « Nature des items cibles » à 2 modalités, mots et
pseudo-mots ;
- P le facteur aléatoire « Participants » à 24 modalités.
Le plan expérimental était le suivant : P24*L3*T2*N2. Etant donné que seules les performances
des participants obtenues avec les mots cibles ont été inclues dans les analyses statistiques, le
plan d’analyse était le suivant : P24*L3*T2. Nous avions donc 6 conditions expérimentales.
Partie expérimentale Expérience 5
125
2.3. Procédure expérimentale
La procédure expérimentale était exactement identique à celle des Expériences 3 & 4.
Les participants devaient réaliser une tâche de décision lexicale sur les items cibles insérés
dans les masqueurs. Ils devaient identifier le plus vite possible et en faisant le moins d’erreurs
possible si l’item cible était un mot de la langue française.
2.4. Participants
Vingt-quatre volontaires de langue maternelle française qui parlent l’italien comme
langue seconde ont participé à l’Expérience 5. Ces participants ont suivi un enseignement de
la langue italienne pendant une durée moyenne de 8 ans et reçoivent encore aujourd’hui des
cours d’italien (à l’université, par l’intermédiaire d’un institut culturel, échanges avec la
famille et/ou amis résidants en Italie). Ils étaient âgés de 18 à 34 ans, aucun n’avait suivi
d’enseignement de gaélique irlandais, et aucun ne souffrait de trouble auditif ni de trouble du
langage. Les participants ont été dédommagés pour leur participation.
3. Résultats
Tous les participants et tous les mots cibles de la phase test ont été inclus dans les
analyses, soit 24 participants et 78 mots cibles. Deux analyses de variance à mesures répétées
(ANOVA) ont été menées sur les performances des participants natifs du français parlant
l’italien comme L2. Pour la première ANOVA, les TRs moyens ont été mesurés pour les mots
cibles correctement identifiés dans chaque condition expérimentale (Tableau 11). Une
transformation inverse a été réalisée sur les moyennes de TRs afin d’harmoniser les données.
Les essais pour lesquels les participants ont fait des erreurs (34,1%), n’ont pas répondu dans
le temps imparti de 4500 ms (9,4%), ainsi que les essais pour lesquels les TRs étaient
inférieurs à 300 ms (0,3%) n’ont pas été inclus dans l’analyse. Ainsi, la première analyse a
considéré comme variable dépendante les TRs inverses et comme variables intra-sujets la
Langue des masqueurs (à 3 modalités : irlandais, italien et français) et le Type de bruit dans le
masqueur (à 2 modalités : parole et bruit fluctuant). Dans la seconde ANOVA, les taux
d’erreurs moyens (Tableau 12) constituaient la variable dépendante et les variables intra-
Partie expérimentale Expérience 5
126
sujets étaient les mêmes que dans la première ANOVA. Pour plus de clarté, ce sont les TRs
moyens qui ont été utilisés pour décrire et représenter graphiquement les données.
3.1. Analyse statistique des moyennes de TRs
Tableau 11 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement
identifiés dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 1199 1262 1180 1240 1495 1306
Ecart-types 247,63 247,11 232,27 287,95 484,61 295,40
3.1.1. Effets principaux
Effet de la Langue des masqueurs
L’analyse de variance a révélé que l’effet principal de la Langue des masqueurs était
significatif (F(2,46) = 12.82, p < .001). En moyenne, les TRs étaient plus courts avec les
masqueurs irlandais (1219 ms ; ET = 266,48) et français (1243 ms ; ET = 270,48), ils étaient
plus longs avec les masqueurs italiens (1378 ms ; ET = 398,35).
Effet du Type de bruit
L’effet principal du Type de bruit dans le masqueur de 133 ms est également ressorti
significatif à l’ANOVA (F(1,23) = 17.43, p < .001). En moyenne, les masqueurs paroliers ont
entraîné des TRs plus longs (1347 ms ; ET = 378,25) que les masqueurs de bruit fluctuant
(1214 ms ; ET = 241,57).
3.1.2. Interaction simple
L’ANOVA a indiqué que l’interaction simple entre les deux facteurs Langue des
masqueurs et Type de bruit était tendancielle (F(2,46) = 2.68, p = .08). Les comparaisons
post-hoc réalisées avec le test HSD de Tukey ont montré que l’effet du Type de bruit dans le
masqueur était significatif pour l’italien (p < .005) ainsi que pour le français (p < .05). Les
comparaisons post-hoc ont également indiqué qu’avec les masqueurs paroliers, une différence
Partie expérimentale Expérience 5
127
significative était présente entre l’irlandais et l’italien (p < .001) ainsi qu’entre le français et
l’italien (p = .02). En revanche, avec les masqueurs de bruit fluctuant, il n’y avait aucune
différence significative entre les langues. Ces résultats sont reportés dans la Figure 18.
Figure 18 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, pour les participants natifs du français parlant l’italien en L2, en
fonction de la Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont
reportées. Le symbole ‘ * ’ indique une différence significative entre les deux types de bruits
(parole et bruit fluctuant) pour l’italien et le français. Des différences significatives sont
également présentes entre les masqueurs paroliers irlandais et italiens, ainsi qu’entre les
masqueurs paroliers italiens et français.
3.2. Analyse statistique des taux d’erreurs
Tableau 12 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions
expérimentales. Les écart-types sont également indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 27,56 40,38 29,81 34,62 39,74 32,37
Ecart-types 12,81 16,40 11,18 15,38 18,66 16,35
Partie expérimentale Expérience 5
128
3.2.1. Effets principaux
Effet de la Langue des masqueurs
L’effet principal de la Langue des masqueurs est ressorti significatif à l’analyse de
variance (F(2,46) = 7.3, p = .002). En moyenne, les participants ont fait moins d’erreurs
lorsque les masqueurs étaient produits en irlandais (31,09% ; ET = 14,45) et en français
(31,09% ; ET = 13,92), et plus d’erreurs avec les masqueurs italiens (40,06% ; ET = 17,38).
Effet du Type de bruit
L’ANOVA n’a pas indiqué d’effet principal significatif du Type de bruit dans le
masqueur (F(1,23) = 1.5, n.s.). Les taux d’erreurs moyens étaient proches entre les masqueurs
paroliers (35,58% ; ET = 16,9) et les masqueurs de bruit fluctuant (32,59% ; ET = 14,6).
3.2.2. Interaction simple
L’interaction simple entre les deux facteurs Langue des masqueurs et Type de bruit
n’est pas ressortie significative à l’ANOVA (F(2,46) = 1.04, n.s.). Les comparaisons post-hoc
avec le test HSD de Tukey ont indiqué que l’effet du Type de bruit n’était présent pour
aucune des langues. Les comparaisons post-hoc ont également révélé qu’avec du bruit
fluctuant dans les masqueurs, il y avait une différence significative entre l’irlandais et l’italien
(p = .02). Aucune différence significative entre les langues n’a été observée avec les
masqueurs paroliers.
4. Discussion
4.1. Rappel des objectifs
Dans l’Expérience 5, des participants natifs du français qui parlent l’italien comme L2
ont réalisé la même tâche de décision lexicale que les participants monolingues français de
l’Expérience 3. Les mots cibles français étaient insérés avec un RSB de -5 dB dans les
masqueurs paroliers français, irlandais et italiens ainsi que dans les masqueurs de bruit
fluctuant générés à partir des masqueurs paroliers dans chacune des trois langues manipulées.
Partie expérimentale Expérience 5
129
Maintenant que l’italien est une langue connue pour les participants et donc intelligible, il
était question d’examiner si les informations linguistiques de haut niveau présentes dans les
masqueurs paroliers italiens sont impliquées dans la perturbation de l’accès au lexique des
mots cibles français. Il s’agissait également de comparer les temps de réaction obtenus avec
les masqueurs paroliers français, irlandais et italiens, afin de déterminer si le niveau de
connaissances des participants pour les langues concurrentes (langue native (français), langue
seconde (italien) ou langue inconnue (irlandais)) influencerait la vitesse de l’accès au lexique
des mots cibles français.
4.2. Nature des interférences
Les résultats de l’Expérience 5 ont révélé que selon la langue des masqueurs paroliers,
les interférences qui ont perturbé l’accès au lexique des mots cibles français ont impliqué des
informations de natures différentes. Concernant les masqueurs paroliers français et italiens,
les informations acoustiques et linguistiques de bas niveau ainsi que les informations
linguistiques de haut niveau qu’ils contiennent ont ralenti l’accès au lexique des mots cibles
français. En effet, une différence significative entre les temps de réaction obtenus avec les
deux types de masqueurs (parolier et bruit fluctuant) a été mise en évidence pour le français et
l’italien. En revanche, pour l’irlandais, l’identification des mots cibles français semble avoir
été principalement perturbée par les informations acoustiques et linguistiques de bas niveau
présentes dans les masqueurs paroliers irlandais ; aucune différence significative n’a été
observée entre les temps de réaction obtenus avec les deux types de masqueurs irlandais.
Cette différence entre les langues (français, irlandais et italien), quant à la nature des
informations qui ont perturbé l’accès au lexique des mots cibles, serait due au fait que pour les
participants, le français et l’italien sont des langues connues (respectivement leur langue
native et leur langue seconde) contrairement à l’irlandais (langue qui ne leur a jamais été
enseignée). Les informations linguistiques de haut niveau présentes dans les masqueurs
paroliers sont donc entrées en compétition avec les mots cibles lorsque la langue des
masqueurs paroliers était intelligible pour les participants (français et italien) plutôt que non
intelligible (irlandais).
4.3. Masqueurs paroliers français (L1) versus italiens (L2)
Partie expérimentale Expérience 5
130
Dans la situation de la parole dans la parole, les masqueurs paroliers italiens ont
entraîné des temps de réaction significativement plus longs que les masqueurs paroliers
français et irlandais. Ce résultat indique que les masqueurs paroliers français et italiens, bien
qu’ils aient produit des interférences impliquant des informations de mêmes natures (des
informations acoustiques et linguistiques de bas niveau ainsi que des informations
linguistiques de haut niveau), n’ont pas perturbé l’accès au lexique des mots cibles français
avec la même efficacité. Il a fallu plus de temps pour identifier les mots cibles français
lorsque les masqueurs paroliers étaient générés dans la L2 des participants (italien) plutôt que
dans leur langue native (français).
Nous nous sommes alors demandés si les effets des informations linguistiques de haut niveau
mis en évidence pour les masqueurs paroliers français et italiens étaient différents. Pour
répondre à cette question, nous avons effectué une analyse de variance à mesures répétées sur
les temps de réaction inverses obtenus pour les deux types de masqueurs (parolier et bruit
fluctuant) uniquement avec le français et l’italien ; les données obtenues avec l’irlandais n’ont
pas été prises en compte. Cette analyse a considéré comme variable aléatoire les participants
et comme variables intra-sujets la Langue des masqueurs (à 2 modalités : français et italien) et
le Type de bruit dans le masqueur (à 2 modalités : parole et bruit fluctuant). Cette analyse a
indiqué un effet principal significatif de la Langue des masqueurs (F(1,23) = 11.51, p < .005)
ainsi qu’un effet principal significatif du Type de bruit dans le masqueur (F(1,23) = 26.89, p <
.001). En revanche, l’interaction simple entre ces deux facteurs n’est pas ressortie
significative à l’ANOVA (F(1,23) = .43, n.s.), suggérant que l’effet des informations
linguistiques de haut niveau des masqueurs paroliers italiens ne semble pas être différent de
celui des informations linguistiques de haut niveau des masqueurs paroliers français. Le
niveau de connaissances des participants pour la langue de la parole concurrente (langue
native versus langue seconde) ne semble pas avoir eu d’influence.
Les temps de réaction significativement plus longs obtenus avec les masqueurs
paroliers italiens plutôt qu’avec les masqueurs paroliers français pourraient être expliqués par
la façon dont nous avons élaboré les stimuli. Nous rappelons que dans notre paradigme
expérimental, 4 locuteurs composent les masqueurs paroliers. Hoen et al. (2007) ont montré
que, jusqu’à 4 locuteurs, certains mots sont encore disponibles. Dans la condition où l’essai
commence avec un masqueur parolier en italien (L2 des participants), des traitements
linguistiques sont engagés sur les mots extraits du masqueur. Or Weber & Cutler (2004), ont
Partie expérimentale Expérience 5
131
mis en évidence que l’identification de mots produits dans une L2 entraîne l’activation de
compétiteurs appartenant au lexique mental de la L2 ainsi que l’activation de compétiteurs du
lexique mental de la langue native. Ainsi, avec un masqueur parolier italien, le nombre total
de compétiteurs activés devrait être plus élevé qu’avec un masqueur parolier en français
(langue native des participants) ; avec ce dernier, seuls des compétiteurs du lexique mental de
la langue native seraient activés. L’identification du mot cible inséré dans un masqueur
parolier devrait être plus lente avec un masqueur parolier italien plutôt qu’avec un masqueur
parolier français ; ce qui expliquerait nos résultats.
Néanmoins, dans notre expérience, nous ne pouvons pas exclure la présence d’un biais
attentionnel. En effet, au moment du recrutement des participants, nous avons recherché des
participants natifs du français qui parlaient l’italien comme L2. Cette précision concernant
l’italien comme L2 a pu influencer les participants dans leur façon de réaliser la tâche. Les
participants n’avaient d’informations que sur la consigne à exécuter (répondre le plus vite
possible et en faisant le moins d’erreurs possible si le mot cible appartient à la langue
française), ils ne connaissaient pas l’objet de l’étude. Lorsqu’un masqueur parolier italien était
présenté, les participants, en pensant que leurs connaissances de l’italien était un critère
important pour participer à cette étude, pourrait s’être davantage focalisés sur les informations
des masqueurs paroliers italiens, occasionnant davantage de difficultés pour repérer le mot
cible français et l’extraire du masqueur parolier italien.
Afin de contrôler la présence de ce biais attentionnel, une possibilité serait de réaliser cette
tâche de décision lexicale en Italie, avec le même matériel expérimental : des mots cibles
français insérés dans les masqueurs paroliers et dans les masqueurs de bruit fluctuant dans les
trois langues manipulées (français, irlandais et italien). Des participants natifs du français qui
vivent en Italie pour leurs études ou pour leur travail seraient sélectionnés. Afin de les
recruter, nous préciserions uniquement que nous cherchons des participants de langue
maternelle française qui n’ont jamais reçu d’enseignement de gaélique irlandais. Quant à leur
niveau d’italien, étant donné qu’ils sont amenés à pratiquer cette langue quotidiennement,
nous n’aurions pas besoin de préciser que nous cherchons des participants parlant l’italien
comme L2. Nous pourrions ainsi éviter un éventuel biais attentionnel.
Récemment, Brouwer et al. (2012) ont, eux-aussi comparé les effets de masque de
masqueurs paroliers générés dans une langue native ou dans une langue seconde. Ils ont
Partie expérimentale Expérience 5
132
proposé à des participants natifs de l’allemand qui parlent l’anglais comme L2, de réaliser une
tâche d’intelligibilité sur des phrases cibles produites dans leur langue native. Ces dernières
étaient insérées dans des masqueurs paroliers à 2 locuteurs qui parlaient en allemand (langue
native des participants) ou en anglais (L2). Les auteurs ont observé des performances
significativement plus faibles avec les masqueurs paroliers en allemand plutôt qu’avec les
masqueurs paroliers en anglais. Ainsi dans l’étude de Brouwer et al. (2012), les masqueurs
paroliers générés dans la langue native des participants (allemand) ont eu un effet de masque
plus important que les masqueurs paroliers produits dans la L2 (anglais). Dans notre
expérience, nous avons obtenu des résultats différents puisque les participants ont davantage
été affectés par les masqueurs paroliers générés dans leur L2 (italien) que par ceux produits
dans leur langue native (français).
Cependant, il est clair que l’étude de Brouwer et al. (2012) et la nôtre ont exploré la situation
de la parole dans la parole en utilisant des paradigmes expérimentaux différents, ce qui
pourrait expliquer la divergence de résultats. Tout d’abord, pour la parole cible, Brouwer et al.
(2012) ont présenté des phrases alors que nous avons utilisé des mots isolés. Etant donné que
des interférences syntaxiques et sémantiques peuvent intervenir lors du traitement d’une
phrase et influencer les réponses des participants, dans notre paradigme nous avions préféré
utiliser des mots isolés afin de nous affranchir de ce type d’interférences. Il en découle une
seconde différence entre les deux études, le moment auquel le signal cible est inséré dans le
signal concurrent. Dans l’étude de Brouwer et al. (2012), la phrase cible commence 500 ms
après le début du masqueur, alors que dans notre étude, le mot cible est présenté 2,5 sec après
le début du masqueur. Une troisième différence concerne le nombre de locuteurs présents
dans les masqueurs paroliers : 2 locuteurs pour Brouwer et al. (2012), 4 locuteurs dans notre
expérience. L’effet de masque informationnel des masqueurs paroliers composés de 2
locuteurs est plus faible que celui des masqueurs paroliers à 4 locuteurs. En effet, avec 2
locuteurs dans le masqueur, l’auditeur peut s’aider de la fréquence fondamentale (F0) des
voix des locuteurs afin de séparer le signal cible du signal concurrent, ce qui réduit l’effet de
masque informationnel du signal de parole concurrent (Brungart et al., 2001). Avec 4
locuteurs, les caractéristiques vocales des locuteurs sont moins accessibles. Enfin, Brouwer et
al. (2012) ont testé une tâche d’intelligibilité alors que dans l’Expérience 5, nous avons utilisé
une tâche de décision lexicale. Cette dernière a pour caractéristique de capturer les
interférences entre les deux flux de parole concurrents durant l’accès au lexique des mots
cibles. Quant à la tâche d’intelligibilité, elle laisse place à des traitements post-lexicaux dont
Partie expérimentale Expérience 5
133
nous avons montré l’influence sur les performances des participants dans les Expériences 2 &
3. Ainsi, ces différences entre l’étude de Brouwer et al. (2012) et l’Expérience 5 suffisent
probablement à expliquer la divergence de résultats.
4.4. Conclusions
L’Expérience 5 a testé des participants natifs du français qui parlent l’italien comme
L2 et a montré que ces participants ont davantage été affectés par les masqueurs paroliers
générés dans leur L2 (italien) plutôt que par ceux produits dans leur langue native (français).
Néanmoins, les masqueurs paroliers français et italiens ont produit des interférences
impliquant des informations de mêmes natures : des informations acoustiques et linguistiques
de bas niveau ainsi que des informations linguistiques de haut niveau.
Ainsi, ces résultats complètent ceux obtenus dans l’Expérience 3 menée auprès de participants
natifs du français qui ne connaissaient ni l’irlandais ni l’italien (participants monolingues). Le
matériel expérimental était exactement identique dans les Expériences 3 & 5. Pour les
participants monolingues français, un effet des informations linguistiques de haut niveau a été
mis en évidence uniquement pour les masqueurs paroliers générés en français, c’est-à-dire
pour les masqueurs paroliers qui ont été générés dans la seule langue intelligible pour les
participants ; ils n’ont jamais reçu d’enseignement de l’italien ni de l’irlandais. Les résultats
de l’Expérience 5 obtenus avec les participants français qui parlent italien en L2 confirment
que lorsque la langue de la parole concurrente est intelligible, les informations linguistiques
de haut niveau s’associent aux informations acoustiques et linguistiques de bas niveau pour
perturber l’accès au lexique des mots cibles.
5. Comparaison des Expériences 3 & 5
Nous allons comparer dans une même analyse statistique les résultats obtenus par les
participants natifs du français qui parlent italien comme L2 (Expérience 5) à ceux des
participants monolingues natifs du français (Expérience 3) ; ces résultats sont reportés dans
les Tableaux 13 et 14. Du fait de leur niveau de connaissances différent pour l’italien, des
patterns de résultats différents entre les deux groupes de participants ont été révélés pour les
masqueurs paroliers et les masqueurs de bruit fluctuant italiens. En effet, dans l’Expérience 5,
nous avons observé une différence significative entre les temps de réaction obtenus avec les
Partie expérimentale Expérience 5
134
deux types de masqueurs italiens, alors que dans l’Expérience 3, cette différence significative
n’était pas présente. Les informations linguistiques de haut niveau des masqueurs paroliers
italiens ont donc ralenti l’identification des mots cibles français uniquement dans l’Expérience
5. Nous souhaitons examiner cette différence entre les deux groupes de participants à l’aide
d’une analyse de variance. Celle-ci sera menée sur les temps de réaction obtenus par les deux
groupes. L’ANOVA nous permettra également d’identifier si d’autres différences sont
présentes entre les deux groupes de participants, notamment des différences dans les temps de
réaction obtenus avec les deux types de masqueurs (parolier et bruit fluctuant) français et
irlandais.
Plus précisément, nous allons effectuer une analyse de variance sur les temps de réaction
inverses des deux groupes de participants. Etant donné que dans l’Expérience 5, les données
ont été harmonisées à l’aide d’une transformation inverse, nous avons appliqué cette dernière
aux données de l’Expérience 3. L’ANOVA a considéré les variables suivantes : le facteur
Groupe (à 2 modalités : participants français monolingues et participants français avec
l’italien comme L2), le facteur Langue des masqueurs (à 3 modalités : français, irlandais et
italien) et le facteur Type de bruit dans le masqueur (à 2 modalités : parole et bruit fluctuant).
Les groupes de participants étaient exactement identiques à ceux des Expériences 3 & 5, il y
avait 30 participants français monolingues et 24 participants français qui parlent l’italien
comme L2.
Tableaux 13 et 14 : Temps de réaction moyens (en ms) obtenus pour les mots cibles
correctement identifiés dans chacune des six conditions expérimentales, pour les participants
monolingues français (Tableau 13) et pour les participants français parlant l’italien en L2
(Tableau 14). Les écart-types sont également indiqués.
Tableau 13 Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 1125 1216 1161 1167 1262 1272
Ecart-types 166,98 252,94 204,04 188,19 260,50 225,72
Tableau 14 Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 1199 1262 1180 1240 1495 1306
Ecart-types 247,63 247,11 232,27 287,95 484,61 295,40
Partie expérimentale Expérience 5
135
5.1. Effets principaux
Effet du Groupe
L’analyse de variance a indiqué que l’effet principal du Groupe n’était pas significatif
(F(1,52) = 1.8, n.s.). En effet, les TRs moyens obtenus par les participants monolingues natifs
du français (1201 ms ; ET = 222,56) étaient proches de ceux des participants natifs du
français qui parlent l’italien comme L2 (1280 ms ; ET = 323,24).
Effet de la Langue des masqueurs
L’effet principal de la Langue des masqueurs est ressorti significatif à l’ANOVA
(F(2,104) = 16.037, p < .001). En moyenne, les TRs étaient plus courts lorsque les masqueurs
étaient produits en irlandais (1179 ms ; ET = 223,44) et en français (1228 ms ; ET = 243,12)
plutôt qu’en italien (1301 ms ; ET = 332,54).
Effet du Type de bruit
L’ANOVA a également révélé un effet principal significatif du Type de bruit dans le
masqueur (F(1,52) = 27.67, p < .001). En moyenne, les masqueurs paroliers ont entraîné des
TRs plus longs (1284 ms ; ET = 308,70) que les masqueurs de bruit fluctuant (1188 ms ; ET =
226,02).
5.2. Interactions simples et double
Groupe * Langue des masqueurs
L’interaction simple entre les facteurs Groupe et Langue des masqueurs a été révélée
comme significative à l’analyse de variance (F(2,104) = 3.23, p < .05). Les comparaisons
post-hoc effectuées avec le test HSD de Tukey ont révélé que l’effet du Groupe était présent
uniquement avec l’italien (p < .005).
Groupe * Type de bruit
L’interaction simple entre les facteurs Groupe et Type de bruit est ressortie comme
tendancielle à l’ANOVA (F(1,52) = 3.11, p = .08).
Partie expérimentale Expérience 5
136
Type de bruit * Langue des masqueurs
L’analyse de variance a indiqué que l’interaction simple entre les facteurs Type de
bruit et Langue des masqueurs était tendancielle (F(2,104) = 2.62, p = .08).
L’analyse de variance a montré que l’interaction double entre les trois facteurs
manipulés était tendancielle à l’ANOVA (F(2,104) = 3.66, p = .07). Les comparaisons post-
hoc effectuées avec le test HSD de Tukey ont indiqué que la seule différence significative
entre les TRs des deux groupes de participants a été observée avec les masqueurs paroliers
italiens (p = .001), l’accès au lexique des mots cibles français était plus long pour les
participants natifs du français qui parlent italien en L2 plutôt que pour les participants
monolingues natifs du français (voir Figure 19). Les comparaisons post-hoc ont également
montré que pour les participants monolingues français, l’effet du Type de bruit était présent
uniquement pour le français (p = .03) ; pour les participants français qui parlent l’italien
comme L2, l’effet du Type de bruit était significatif pour l’italien (p < .005) et pour le
français (p = .04).
Figure 19 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, pour les participants monolingues français (Expérience 3) et pour les
participants natifs du français parlant l’italien en L2 (Expérience 5), en fonction de la Langue
Partie expérimentale Expérience 5
137
des masqueurs (irlandais, italien et français). Les erreurs standard sont reportées. Le symbole
‘ * ’ indique une différence significative entre les deux types de bruits (parole et bruit
fluctuant) pour l’italien (Expérience 5) et pour le français (Expériences 3 & 5). Les TRs
moyens obtenus avec les masqueurs paroliers italiens dans l’Expérience 5 sont indiqués en
vert, ils sont significativement différents de ceux obtenus dans l’Expérience 3 pour la même
condition expérimentale.
5.3. Discussion de la comparaison
Dans cette partie, il s’agissait de comparer les temps de réaction obtenus par deux
groupes de participants qui se différencient uniquement par leur niveau de connaissances de
l’italien. En effet, pour un groupe de participants l’italien est une langue inconnue
(Expérience 3), alors que pour l’autre groupe l’italien est une langue seconde (Expérience 5).
Ces deux groupes de participants ont réalisé la même tâche de décision lexicale sur des mots
cibles français insérés dans des masqueurs paroliers et des masqueurs de bruit fluctuant
générés en français, irlandais et italien. Dans l’Expérience 3, l’italien était une langue non
intelligible pour les participants monolingues français, seuls les masqueurs paroliers français
ont produit des interférences qui ont impliqué des informations linguistiques de haut niveau
ainsi que des informations acoustiques et linguistiques de bas niveau. Dans l’Expérience 5,
pour les participants français qui parlent italien comme L2, un effet des informations
linguistiques de haut niveau s’est ajouté à celui des informations acoustiques et linguistiques
de bas niveau, pour les masqueurs paroliers français ainsi que pour les masqueurs paroliers
italiens. L’objectif de cette comparaison était d’une part, d’examiner cette différence de
résultats pour les masqueurs paroliers italiens dans une même analyse de variance, et d’autre
part de déterminer si d’autres différences sont notables entre les patterns de résultats des deux
groupes de participants.
L’analyse de variance a en effet indiqué une différence significative entre les deux
groupes de participants pour les masqueurs paroliers italiens. Les participants français qui
parlent l’italien comme L2 (Expérience 5) ont eu des temps de réaction significativement plus
longs que les participants monolingues français (Expérience 3). Autrement dit, les temps de
réaction étaient plus longs lorsque l’italien était intelligible pour les participants, des
interférences linguistiques de haut niveau ont été produites en plus des interférences
acoustiques et linguistiques de bas niveau.
Partie expérimentale Expérience 5
138
Aucune autre différence dans les temps de réaction des deux groupes de participants n’a été
signalée, indiquant que les participants français avec de l’italien comme L2 ont eu un pattern
de résultats similaire à celui des participants monolingues français. Le seul paramètre qui
varie entre ces deux groupes de participants, à savoir leur niveau de connaissances pour
l’italien, est responsable de la seule différence de performances entre ces groupes.
Dans l’Expérience 6, nous nous intéresserons aux interférences linguistiques lorsque le
message cible sera produit dans une L2. Etant donné l’augmentation du nombre de personnes
amenées à communiquer dans leur langue seconde plutôt que dans leur langue native, étudier
la situation de la parole dans la parole lorsque le message cible est produit dans une L2 paraît
pertinent. Par ailleurs, nous pourrons observer dans quelle mesure le niveau de connaissances
des participants pour la langue de la parole cible peut entraîner une évolution des patterns de
résultats jusqu’à présent obtenus.
Partie expérimentale Expérience 6
139
K) EXPERIENCE 6
1. Objectifs
Dans les Expériences 1 à 5, tous les participants étaient natifs du français. Ils ont ainsi
réalisé la tâche d’intelligibilité (Expériences 1 & 2) ou la tâche de décision lexicale
(Expériences 3, 4 & 5) avec des mots cibles produits dans leur langue native (français). Dans
l’Expérience 6, des participants natifs de l’italien qui parlent le français comme L2 seront
recrutés. Ils réaliseront la même tâche de décision lexicale que les participants des
Expériences 3 & 5, des mots cibles français seront insérés dans des masqueurs paroliers à 4
locuteurs en français, irlandais et italiens ainsi que dans des masqueurs de bruit fluctuant
générés à partir des masqueurs paroliers dans chaque langue ; le RSB sera fixé à -5 dB.
Autrement dit, dans l’Expérience 6, même si la langue native des participants est l’italien,
nous leur présenterons des mots cibles français ; les participants réaliseront alors la tâche de
décision lexicale dans leur L2. De plus, à la suite de la tâche de décision lexicale (phase test),
nous ferons passer un post-test aux participants. Nous leur présenterons à nouveau les mots et
les pseudo-mots cibles mais cette fois-ci, en l’absence des masqueurs (dans le silence).
Comme dans la phase test, les participants devront répondre si l’item cible est un mot qui
existe dans la langue française, en prenant leur temps ; nous ne tiendrons pas compte des
temps de réaction. Avec ce post-test, il s’agit de différencier, pour chacun des participants, les
mots cibles français qui sont effectivement connus de ceux qui ne le sont pas. Sur cette base,
nous analyserons dans la phase test, les temps de réaction pour les mots cibles correctement
identifiés, uniquement lorsque ces derniers sont connus des participants.
Avec l’Expérience 6, nous cherchons à nouveau à compléter nos résultats. En effet, jusqu’à
présent, nous avons examiné l’impact des interférences linguistiques produites par la parole
concurrente sur l’intelligibilité d’un message cible produit dans une langue native. Dans
l’Expérience 6, nous nous intéresserons aux interférences linguistiques lorsque le message
cible sera produit dans une langue seconde. Dans l’Expérience 5, nous avons manipulé le
niveau de connaissances des participants pour la langue des masqueurs paroliers. Nous avons
observé que les participants natifs du français qui parlent l’italien en L2, ont davantage été
affectés par les masqueurs paroliers générés dans leur L2 que par ceux générés dans leur
langue native. Dans l’Expérience 6, nous comparerons également les temps de réaction des
Partie expérimentale Expérience 6
140
participants qui seront obtenus avec les masqueurs paroliers produits dans leur L2 (français), à
ceux qui seront obtenus avec les masqueurs paroliers produits dans leur langue native (italien)
lorsque les mots cibles seront perçus dans leur L2. Nous chercherons à identifier si les
masqueurs paroliers ralentiront plus l’identification des mots cibles français lorsqu’ils seront
produits dans une langue plutôt que dans une autre (langue native versus langue seconde).
2. Méthode
2.1. Stimuli
Les 162 stimuli utilisés dans l’Expérience 6 (annexes 3 et 4) étaient exactement
identiques à ceux utilisés dans les Expériences 3, 4 & 5 (items cibles et masqueurs). Nous
rappelons que les stimuli ont été obtenus en insérant chacun des 81 mots cibles et chacun des
81 pseudo-mots cibles à 2,5 sec du début d’un masqueur de 4 sec (parolier ou de bruit
fluctuant) qui pouvait être produit en français, irlandais ou italien.
Dans l’Expérience 6, comme dans les Expériences 3 & 5, le RSB entre les items cibles et les
masqueurs était fixé à -5 dB à l’aide du logiciel Matlab.
2.2. Conditions expérimentales
Dans l’Expérience 6, les variables manipulées étaient identiques à celles des
Expériences 3, 4 & 5 :
- L le facteur fixe à mesures répétées « Langue des masqueurs » à 3 modalités, français,
gaélique irlandais et italien ;
- T le facteur fixe à mesures répétées « Type de bruit » dans le masqueur à 2 modalités, parole
et bruit fluctuant ;
- N le facteur fixe à mesures répétées « Nature des items cibles » à 2 modalités, mots et
pseudo-mots ;
- P le facteur aléatoire « Participants » à 24 modalités.
Partie expérimentale Expérience 6
141
Le plan expérimental était le suivant : P24*L3*T2*N2. N’ont été inclues dans les analyses
statistiques que les performances des participants obtenues avec les mots cibles, le plan
d’analyse était alors le suivant : P24*L3*T2. Nous avions 6 conditions expérimentales.
2.3. Procédure expérimentale
La procédure expérimentale était exactement identique à celle des Expériences 3, 4 &
5. Les participants devaient réaliser une tâche de décision lexicale sur les items cibles insérés
dans les masqueurs. Ils devaient identifier le plus vite possible et en faisant le moins d’erreurs
possible si l’item cible était un mot de la langue française.
2.4. Participants
Vingt-quatre volontaires de langue maternelle italienne qui parlent le français comme
langue seconde ont participé à l’Expérience 6. Tous ont rempli un questionnaire concernant la
durée de leur apprentissage de la langue française et le nombre d’années d’immersion en
France. Il ressort de ce questionnaire que les participants ont suivi un enseignement de la
langue française pendant une durée moyenne de 8 ans ½. Au moment de leur recrutement
pour cette expérience, cela faisait en moyenne 5 ans qu’ils vivaient en France pour leur travail
ou pour poursuivre leurs études ; leur pratique du français était alors soutenue. Ils étaient âgés
de 18 à 39 ans, aucun n’avait suivi d’enseignement de gaélique irlandais, et aucun ne souffrait
de trouble auditif ni de trouble du langage. Leur participation a été dédommagée.
3. Résultats
3.1. Post-test
En moyenne, 73% (ET = 12) des mots cibles français ont été reconnus par les
participants. Concernant l’analyse des temps de réaction obtenus dans la phase test, nous
n’avons analysé que ceux obtenus pour les mots cibles correctement identifiés lorsque ces
derniers étaient connus des participants.
Partie expérimentale Expérience 6
142
3.2. Phase test
Deux analyses de variance à mesures répétées (ANOVA) ont été menées sur les
performances des participants natifs de l’italien parlant le français comme L2. Pour la
première ANOVA, les TRs moyens ont été mesurés pour les mots cibles correctement
identifiés et connus des participants (Tableau 15). Comme dans l’expérience précédente et
afin d’harmoniser les données, une transformation inverse a été réalisée sur les moyennes de
TRs. Les essais pour lesquels les participants ont fait des erreurs (34,3%), n’ont pas répondu
dans le temps imparti de 4500 ms (7,5%), ainsi que les essais pour lesquels les TRs étaient
inférieurs à 300 ms (0,2%) n’ont pas été inclus dans l’analyse. Ainsi, la première ANOVA a
considéré comme variable dépendante les TRs inverses, et comme variables intra-sujets la
Langue des masqueurs (à 3 modalités : irlandais, italien et français) et le Type de bruit dans le
masqueur (à 2 modalités : parole et bruit fluctuant). Une seconde analyse de variance a
également été menée en considérant les taux d’erreurs (Tableau 16) comme variable
dépendante ; les variables intra-sujets étaient les mêmes que dans la première ANOVA. Pour
la clarté, ce sont les TRs moyens qui ont été utilisés pour décrire et représenter graphiquement
les données.
3.3. Analyse statistique des moyennes de TRs
Tableau 15 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement
identifiés dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 1376 1510 1441 1447 1841 1659
Ecart-types 368,81 349,10 395,37 409,15 716,97 460,14
3.3.1. Effets principaux
Effet de la Langue des masqueurs
L’analyse de variance a signalé que l’effet principal de la Langue des masqueurs est
ressorti significatif à l’ANOVA (F(2,46) = 11.84, p < .0001). En moyenne, les masqueurs
Partie expérimentale Expérience 6
143
italiens et français ont entraîné des TRs plus longs (respectivement 1676 ms , ET = 582,43; et
1550 ms, ET = 438,39) que les masqueurs irlandais (1412 ms ; ET = 387,03).
Effet du Type de bruit
L’analyse de variance a également montré que l’effet principal du Type de bruit dans
le masqueur de 207 ms était significatif (F(1,23) = 21.99, p = .0001). En moyenne, les
participants ont été plus lents avec les masqueurs paroliers (1649 ms ; ET = 561,8) qu’avec
les masqueurs de bruit fluctuant (1442 ms ; ET = 370,43).
3.3.2. Interaction simple
L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit n’est
pas ressortie significative à l’ANOVA (F(2,46) = 1.32, n.s.). Les comparaisons post-hoc avec
le test HSD de Tukey ont montré que l’effet du Type de bruit dans le masqueur était
tendanciel pour le français (p = .06) et significatif pour l’italien (p = .05). Les comparaisons
post-hoc ont également indiqué qu’avec les masqueurs paroliers, une différence significative
était présente entre l’irlandais et le français (p = .05) ainsi qu’entre l’irlandais et l’italien (p =
.001). Avec les masqueurs de bruit fluctuant, aucune différence significative entre les langues
n’a été signalée. Les résultats sont reportés dans la Figure 20.
Partie expérimentale Expérience 6
144
Figure 20 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, pour les participants natifs de l’italien parlant le français en L2, en
fonction de la Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont
reportées. Le symbole ‘ * ’ indique une différence significative entre les deux types de bruits
(parole et bruit fluctuant) pour l’italien et une différence tendancielle pour le français. Des
différences significatives sont également présentes entre les masqueurs paroliers irlandais et
italiens, ainsi qu’entre les masqueurs paroliers irlandais et français.
3.4. Analyse statistique des taux d’erreurs
Tableau 16 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions
expérimentales. Les écart-types sont également indiqués.
Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 29,75 36,74 27,71 40,34 45,68 25,90
Ecart-types 17,75 19,12 11,82 19,62 20,40 17,58
3.4.1. Effets principaux
Effet de la Langue des masqueurs
L’analyse de variance a révélé un effet principal significatif de la Langue des
masqueurs (F(2,46) = 13.58, p < .0001). En moyenne, les taux d’erreurs étaient plus faibles
avec les masqueurs français (26,8% ; ET = 14,85) et plus élevés avec de l’irlandais (35,05% ;
ET = 19,27) et de l’italien (41,21% ; ET = 20,07).
Effet du Type de bruit
L’effet principal du Type de bruit dans le masqueur de 5,9% a été indiqué comme
tendanciel à l’ANOVA (F(1,23) = 3.41, p = .08). En moyenne, les participants ont fait plus
d’erreurs avec les masqueurs paroliers (37,31% ; ET = 20,75) plutôt qu’avec les masqueurs de
bruit fluctuant (31,4% ; ET = 16,76).
3.4.2. Interaction simple
L’interaction simple entre les facteurs Langue des masqueurs et Type de bruit n’est
pas ressortie significative à l’analyse de variance (F(2,46) = 2.19, n.s.). Les comparaisons
Partie expérimentale Expérience 6
145
post-hoc avec le test HSD de Tukey ont montré que l’effet du Type du bruit n’était significatif
pour aucune des langues. Avec les masqueurs paroliers, les comparaisons post-hoc ont mis en
évidence une différence significative entre l’irlandais et le français (p = .03), ainsi qu’entre
l’italien et le français (p = .001). Avec les masqueurs de bruit fluctuant, aucune différence
significative entre les langues n’a été signalée.
4. Discussion
4.1. Rappel des objectifs
Dans l’Expérience 6, la tâche de décision lexicale sur les mots cibles français insérés
dans les deux types de masqueurs (parolier et bruit fluctuant) générés dans les trois langues
manipulées (français, irlandais et italien), a été proposée à des participants natifs de l’italien
qui parlent le français comme L2. Notre objectif était d’explorer la situation de la parole dans
la parole lorsque le message cible était produit non plus dans la langue native des participants
mais dans leur L2. De plus, du fait que pour ces participants l’italien et le français sont
intelligibles (langue native et langue seconde), il était aussi question d’observer l’effet du
niveau de connaissances pour la langue concurrente sur la vitesse d’accès au lexique de mots
cibles produits dans la L2 des participants.
4.2. Nature des interférences
L’analyse des résultats a mis en évidence une différence significative entre les temps
de réaction obtenus avec les masqueurs paroliers et ceux obtenus avec les masqueurs de bruit
fluctuant pour l’italien et le français. Cela suggère que les informations linguistiques de haut
niveau ainsi que les informations acoustiques et linguistiques de bas niveau présentes dans les
masqueurs paroliers italiens et français ont perturbé l’accès au lexique des mots cibles
français. Concernant l’irlandais, l’absence de différence significative entre les temps de
réaction obtenus avec les deux types de masqueurs (parolier et bruit fluctuant) a indiqué que
les informations linguistiques de haut niveau présentes dans les masqueurs paroliers irlandais
n’auraient pas produit d’interférences. Ainsi, ces résultats ont montré que les informations
linguistiques de haut niveau se sont associées aux informations acoustiques et linguistiques de
Partie expérimentale Expérience 6
146
bas niveau uniquement lorsque la langue des masqueurs paroliers était intelligible pour les
participants (italien et français).
Afin de déterminer si les effets des informations linguistiques de haut niveau révélés
pour les masqueurs paroliers italiens et français sont différents, nous avons réalisé une analyse
de variance à mesures répétées sur les temps de réaction inverses obtenus avec les deux types
de masqueurs (parolier et bruit fluctuant) en français et en italien. Les résultats obtenus en
irlandais n’ont pas été inclus dans l’ANOVA. Cette dernière a considéré les participants
comme variable aléatoire et les facteurs Langue des masqueurs (à 2 modalités : français et
italien) et Type de bruit (à 2 modalités : parole et bruit fluctuant) comme variables intra-
sujets. L’ANOVA a révélé un effet principal significatif de la Langue des masqueurs (F(1,23)
= 4.51, p = .04) ainsi qu’un effet principal significatif du Type de bruit dans le masqueur
(F(1,23) = 32.32, p < .0001). L’interaction simple entre ces deux facteurs n’est pas ressortie
significative à l’ANOVA (F(1,23) = .002, n.s.), suggérant que l’effet des informations
linguistiques de haut niveau des masqueurs paroliers italiens (langue native) ne serait
significativement pas différent de celui des informations linguistiques de haut niveau
présentes dans les masqueurs paroliers français (L2). Le niveau de connaissances des
participants pour la langue concurrente (langue native vs. langue seconde) n’aurait pas
influencé l’effet des informations linguistiques de haut niveau présentes dans les masqueurs.
Ce pattern de résultats est similaire à celui observé dans l’Expérience 5 menée avec des
participants natifs du français qui parlent italien comme L2. Pour ces deux expériences, l’effet
des informations linguistiques de haut niveau a été présent quelle que soit la langue
intelligible dans les masqueurs paroliers : français ou italien. Autrement dit, le pattern de
résultats était similaire, que la langue des mots cibles ait été parlée dans la langue native des
participants (Expérience 5) ou dans leur L2 (Expérience 6).
4.3. Masqueurs paroliers italiens (L1) versus français (L2)
Dans la situation de la parole dans la parole (c’est-à-dire lorsque les mots cibles étaient
insérés uniquement dans les masqueurs paroliers), les temps de réaction des participants pour
décider si le mot cible existait dans la langue française ont été influencés par la langue des
masqueurs paroliers. En effet, les temps de réaction étaient significativement plus longs avec
les masqueurs paroliers italiens et français plutôt qu’avec les masqueurs paroliers irlandais.
Partie expérimentale Expérience 6
147
Ainsi, l’accès au lexique des mots cibles français a davantage été ralenti lorsque le signal de
parole concurrent était produit dans une langue intelligible pour les participants (italien et
français) plutôt que dans une langue non intelligible (irlandais). De plus, l’analyse statistique
n’a pas indiqué de différence significative entre les temps de réaction observés avec les
masqueurs paroliers italiens et ceux observés avec les masqueurs paroliers français, suggérant
que les participants n’ont pas été plus affectés par leur langue native que par leur langue
seconde.
En revanche, l’analyse effectuée sur les taux d’erreurs des participants a indiqué que les
masqueurs paroliers italiens ont conduit à des taux d’erreurs significativement plus élevés que
les masqueurs paroliers français. Afin d’être en mesure d’interpréter ce résultat, nous aurions
besoin d’acquérir plus de données. En effet, bien que le taux d’erreurs moyen des participants
soit constant au cours de nos différentes expériences (34%), celui obtenu dans l’Expérience 6
est issu d’un plus petit nombre de données que ceux obtenus lors des expériences précédentes.
Dans l’Expérience 6, le post-test nous a conduit à ne retenir que les résultats obtenus pour les
mots cibles effectivement connus des participants, soit 73% des mots. Cette différence entre
l’Expérience 6 et les expériences précédentes quant à la quantité du nombre d’erreurs à
analyser a pu biaiser les résultats.
Dans l’Expérience 5, des participants natifs du français qui parlent l’italien comme L2
ont été recrutés et nous avons étudié l’effet du niveau de connaissances des participants pour
la langue concurrente sur des mots cibles parlés dans leur langue native. Des temps de
réaction significativement plus longs ont été observés avec les masqueurs paroliers générés
dans la L2 des participants (italien) plutôt que dans leur langue native (français). Afin
d’expliquer ces résultats, nous avions pris en considération le fait que des mots présents dans
les masqueurs paroliers peuvent être extraits (Hoen et al., 2007). Lorsque le masqueur est
produit dans une langue seconde, les mots extraits de ce masqueur, lors de leur identification,
activeraient des compétiteurs appartenant à la fois au lexique mental de la L2 ainsi que des
compétiteurs appartenant au lexique mental de la langue native (Weber & Cutler, 2004). Le
nombre total de compétiteurs serait alors plus important que lorsque le masqueur parolier est
généré dans une langue native.
Selon cette hypothèse, nous aurions dû, dans l’Expérience 6, observer des temps de réaction
significativement plus courts avec les masqueurs paroliers en italien (langue native) plutôt
qu’avec les masqueurs paroliers en français (langue seconde). Le nombre de compétiteurs
Partie expérimentale Expérience 6
148
devrait être plus faible avec les masqueurs paroliers en italien puisqu’il s’agit de la langue
native des participants, des compétiteurs d’un seul lexique devraient être activés. Or,
contrairement à nos attentes, des temps de réaction équivalents ont été observés entre les
masqueurs paroliers français et italiens.
Cela pourrait être dû au fait que les mots cibles étaient parlés dans la L2 des participants
(français). Pendant leur identification, des compétiteurs des deux lexiques mentaux auraient
été activés (lexiques de la langue native et de la langue seconde). Ainsi, l’identification des
mots cibles aurait été plus lente, non pas à cause d’un grand nombre de compétiteurs activés
par les masqueurs paroliers, mais du fait d’un grand nombre de compétiteurs activés suite à
l’identification d’un mot cible dans une L2.
Cette question concernant l’effet du niveau de connaissances pour la langue
concurrente dans la situation de la parole dans la parole avec un message cible généré dans la
L2 des participants, a été abordée par Garcia Lecumberri & Cooke (2006) ainsi que par Van
Engen (2010). Dans l’étude de Garcia Lecumberri & Cooke (2006), des participants natifs de
l’espagnol parlant l’anglais comme L2 ont réalisé une tâche d’intelligibilité de consonnes
cibles anglaises masquées par de la parole produite par 1 locuteur natif de l’espagnol (langue
native des participants) ou par 1 locuteur natif de l’anglais (L2 des participants). Les auteurs
ont observé que les participants ont été affectés de manière équivalente par la parole
concurrente, qu’elle ait été produite dans leur langue native (espagnol) ou dans leur langue
seconde (anglais).
Un pattern de résultats différent a été mis en lumière dans l’étude de Van Engen (2010). Des
participants natifs du mandarin parlant l’anglais comme L2 ont réalisé une tâche
d’intelligibilité de phrases cibles anglaises insérées dans des masqueurs paroliers à 2 locuteurs
générés en mandarin (langue native des participants) ou en anglais (L2 des participants). Les
participants ont davantage été affectés par les masqueurs paroliers générés dans leur L2
(anglais) que par ceux générés dans leur langue native (mandarin). Dans son article, Van
Engen (2010) explique que la divergence entre ses résultats et ceux observés par Garcia
Lecumberri & Cooke (2006) pourrait être due à des différences dans les paradigmes
expérimentaux utilisés dans ces deux études. Par exemple, concernant la parole cible, alors
que Garcia Lecumberri & Cooke ont utilisé des consonnes, Van Engen a exploré des
traitements langagiers de plus haut niveau en utilisant des phrases. Ensuite, Van Engen a
généré des masqueurs paroliers composés de 2 locuteurs alors que Garcia Lecumberri &
Partie expérimentale Expérience 6
149
Cooke n’ont masqué la parole cible qu’avec 1 locuteur. Van Engen explique qu’avec 2
locuteurs dans le signal concurrent, l’accès à la parole cible serait davantage réduit qu’avec 1
seul locuteur, ce qui rendrait l’effet des informations linguistiques du signal concurrent plus
observable.
Les effets de masque des langues concurrentes intelligibles (langue native et langue seconde)
étaient donc différents selon le paradigme expérimental utilisé. Nos résultats rejoignent ceux
mis en évidence par Garcia Lecumberri & Cooke (2006), bien que dans notre étude, nous
ayons utilisé un paradigme expérimental encore différent de ceux utilisés dans les deux études
évoquées ci-dessus. Nous avons en effet observé que les participants ont été autant affectés
par les masqueurs paroliers générés dans leur langue native (italien) que par ceux produits
dans leur langue seconde (français).
4.4. Conclusions
Dans l’Expérience 6, nous avons examiné l’effet du niveau de connaissances pour la
langue concurrente sur la vitesse d’accès au lexique de mots cibles présentés dans la langue
seconde des participants. Les masqueurs paroliers ont été générés dans la langue native des
participants (italien), dans leur langue seconde (français) ou dans une langue non connue
(irlandais). Les résultats ont confirmé que les masqueurs paroliers générés dans les langues
intelligibles pour les participants (italien et français) ont produit des interférences qui ont
impliqué des informations acoustiques et linguistiques de bas niveau ainsi que des
informations linguistiques de haut niveau. Les résultats ont également révélé que les
masqueurs paroliers italiens et français ont perturbé la vitesse d’accès au lexique des mots
cibles français avec la même efficacité ; le niveau de connaissances des participants pour la
langue concurrente n’est donc pas entré en jeu. Dans l’Expérience 5, le niveau de
connaissances des participants pour la langue concurrente avait influencé les résultats
observés pour les temps de réaction. Nous pouvons conclure que le niveau de connaissances
de la langue concurrente n’a pas eu le même effet lorsque les mots cibles ont été présentés
dans la langue native des participants (Expérience 5) ou dans leur langue seconde (Expérience
6).
Partie expérimentale Expérience 6
150
5. Comparaison des Expériences 5 & 6
Dans la partie théorique, nous avons présenté des études qui se sont intéressées à la
compréhension d’une langue seconde dans le silence ou en présence de bruits concurrents.
Ces études ont montré qu’il est moins facile d’identifier des mots cibles produits dans une L2
plutôt que dans une langue native. En effet, certains sons de la L2 restent plus difficiles à
différencier que d’autres, même lorsque les participants ont acquis un bon niveau de la L2
(voir par exemple Pallier et al., 2001). De plus, l’identification d’un mot active un plus grand
nombre de compétiteurs lorsqu’il est produit dans une L2 plutôt que dans une langue native ;
un mot dans une L2 active des compétiteurs appartenant au lexique mental de la L2 et au
lexique mental de la langue native (Weber & Cutler, 2004). Il en résulte que les participants
souffrent davantage de la présence de bruits concurrents lorsqu’ils identifient de la parole
dans une langue seconde plutôt que dans une langue native ; et ce, que le bruit concurrent ne
produise qu’un effet de masque énergétique, ou qu’il produise en plus un effet de masque
informationnel (Garcia Lecumberri & Cooke, 2006 ; Cooke et al., 2008).
Dans cette partie, nous souhaitons observer dans quelle mesure les participants natifs
de l’italien parlant le français comme L2 ont davantage souffert de la présence des masqueurs
lors de l’identification des mots cibles français (mots produits dans leur L2), par rapport aux
participants natifs du français parlant l’italien comme L2 ; ce dernier groupe ayant eu à
identifier les mots cibles dans leur langue native (Expérience 5). Pour cela, nous allons
comparer les temps de réaction obtenus par ces deux groupes de participants (Tableaux 17 et
18) au sein d’une même analyse de variance. Nous examinerons si des temps de réaction plus
longs pour les participants natifs de l’italien parlant le français comme L2 ont été obtenus
pour les deux types de masqueurs (parolier et bruit fluctuant), à savoir lorsque des
interférences de natures différentes ont été produites par les masqueurs. Afin de faciliter la
lecture, nous réduisons les appellations « participants natifs de l’italien parlant le français
comme L2 » à « participants natifs de l’italien » ; et « participants natifs du français parlant
l’italien comme L2 » à « participants natifs du français ».
Plus précisément, cette ANOVA va comparer les temps de réaction inverses des participants.
Les variables suivantes ont été considérées : le facteur Groupe (à 2 modalités : participants
natifs du français et participants natifs de l’italien), le facteur Langue des masqueurs (à 3
modalités : français, irlandais et italien) et le facteur Type de bruit dans le masqueur (à 2
modalités : parole et bruit fluctuant). Les deux groupes de participants étaient exactement
Partie expérimentale Expérience 6
151
identiques à ceux testés dans les Expériences 5 & 6, ils étaient composés de 24 participants
chacun.
Tableaux 17 et 18 : Temps de réaction moyens (en ms) obtenus pour les mots cibles
correctement identifiés dans chacune des six conditions expérimentales, pour les participants
natifs du français (Tableau 17) et pour les participants natifs de l’italien (Tableau 18). Les
écart-types sont également indiqués.
Tableau 17 Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 1199 1262 1180 1240 1495 1306
Ecart-types 247,63 247,11 232,27 287,95 484,61 295,40
Tableau 18 Masqueurs de bruit fluctuant Masqueurs paroliers
irlandais italien français irlandais italien français
Moyennes 1376 1510 1441 1447 1841 1659
Ecart-types 368,81 349,10 395,37 409,15 716,97 460,14
5.1. Effets principaux
Effet du Groupe
L’effet principal du Groupe de 345,27 ms est ressorti significatif à l’analyse de
variance (F(1,46) = 9.03, p < .005). En moyenne, les participants natifs du français étaient
plus rapides (1201 ms ; ET = 222,56) que les participants natifs de l’italien (1546 ms; ET =
485,39).
Effet de la Langue des masqueurs
L’ANOVA nous a indiqué un effet principal significatif de la Langue des masqueurs
(F(2,92) = 23, p < .0001). En moyenne, les masqueurs irlandais ont entraîné des TRs plus
courts (1264 ms ; ET = 317,43) que les masqueurs français (1365 ms ; ET = 372,77) et
italiens (1433 ms ; ET = 482,26).
Effet du Type de bruit
L’effet principal du Type de bruit dans le masqueur de 129 ms est également ressorti
significatif à l’ANOVA (F(1,46) = 39.35, p < .0001). Les TRs moyens étaient plus longs avec
Partie expérimentale Expérience 6
152
les masqueurs paroliers (1418 ms ; ET = 459,45) qu’avec les masqueurs de bruit fluctuant
(1290 ms ; ET = 322,70).
5.2. Interactions simples et double
Groupe * Langue des masqueurs
L’ANOVA n’a pas révélé d’interaction simple significative entre les facteurs Groupe
et Langue des masqueurs (F(2,92) = 1.44, n.s.). Les comparaisons post-hoc effectuées avec le
test HSD de Tukey ont montré que l’effet du Groupe était présent pour chacune des langues
manipulées (p < .001 pour chacune d’elle).
Groupe * Type de bruit
L’interaction simple entre les facteurs Groupe et Type de bruit dans le masqueur n’est
pas ressortie significative à l’ANOVA (F(1,46) = .2, n.s.). Les comparaisons post-hoc
effectuées avec le test HSD de Tukey ont indiqué que l’effet du Groupe était présent pour les
masqueurs paroliers (p = .0001) ainsi que pour les masqueurs de bruit fluctuant (p = .0002).
Type de bruit * Langue des masqueurs
L’analyse de variance a mis en évidence une interaction simple significative entre les
facteurs Type de bruit et Langue des masqueurs (F(2,92) = 3.52, p < .05). Les comparaisons
post-hoc effectuées avec le test HSD de Tukey ont révélé que l’effet du Type de bruit était
significatif pour l’italien (p = .0002) ainsi que pour le français (p = .001).
D’après l’analyse de variance, l’interaction double entre les trois facteurs manipulés
n’est pas significative (F(2,92) = .07, n.s.). Les comparaisons post-hoc effectuées avec le test
HSD de Tukey ont révélé que pour chacune des six conditions expérimentales, les TRs étaient
significativement différents entre les deux groupes de participants ; ils étaient
significativement plus longs pour les participants natifs de l’italien que pour les participants
natifs du français.
Partie expérimentale Expérience 6
153
Figure 21 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, pour les participants natifs du français de l’Expérience 5 (appellation
« Natif Fr ») et pour les participants natifs de l’italien de l’Expérience 6 (appellation « Natif It
»), en fonction de la Langue des masqueurs (irlandais, italien et français). Le symbole ‘ * ’
indique une différence significative entre les deux types de bruits (parole et bruit fluctuant)
pour l’italien et pour le français (Expériences 5 & 6). Pour plus de clarté, nous n’avons pas
indiqué les différences significatives présentes entre les deux groupes de participants pour
chacune des six conditions expérimentales.
5.3. Discussion de la comparaison
La littérature a mis en évidence que la compréhension de la parole est plus difficile
dans une langue seconde que dans une langue native ; cette difficulté s’accentue en présence
de bruits concurrents. Dans cette partie, il était question d’observer la difficulté des
participants natifs de l’italien lors de la réalisation de la tâche de décision lexicale sur les mots
cibles produits dans leur L2. Pour cela, nous avons comparé dans une même analyse de
variance, leur temps de réaction à ceux des participants natifs du français testés dans
l’Expérience 5. Cette comparaison devait également nous indiquer si les masqueurs paroliers
et les masqueurs de bruit fluctuant ont tous les deux affectés les participants natifs de l’italien.
L’analyse des résultats a révélé un effet principal significatif du Groupe et a indiqué
que pour chacune des six conditions expérimentales, les participants natifs de l’italien ont
obtenu des temps de réaction significativement plus longs que les participants natifs du
Partie expérimentale Expérience 6
154
français. Ainsi, la tâche de décision lexicale était plus difficile à réaliser lorsque les mots
cibles étaient produits dans une L2 (Expérience 6) plutôt que dans une langue native
(Expérience 5). Nos résultats sont donc en accord avec ceux mis en évidence dans la
littérature (Garcia Lecumberri & Cooke, 2006 ; Cooke et al., 2008). La comparaison des
résultats a également indiqué que les participants natifs de l’italien ont eu des temps de
réaction plus longs que les participants natifs du français, quelque soit le type de bruit présent
dans les masqueurs : du bruit fluctuant, composé uniquement d’informations acoustiques et
linguistiques de bas niveau, ou de la parole, avec des informations linguistiques de haut
niveau en plus des informations acoustiques et linguistiques de bas niveau.
Pour les deux groupes de participants (natifs de l’italien et natifs du français), un effet
des informations linguistiques de haut niveau a été révélé pour les masqueurs paroliers italiens
et français. Nous nous sommes demandés si les informations linguistiques de haut niveau
présentes dans les masqueurs paroliers italiens et français ont été plus pénalisantes pour les
participants natifs de l’italien que pour les participants natifs du français. Pour cela, nous
avons effectué deux analyses de variance sur les temps de réaction inverses obtenus par les
deux groupes de participants. La première ANOVA a pris en compte les temps de réaction
inverses des deux groupes de participants obtenus avec les deux types de masqueurs générés
en français (parolier et bruit fluctuant). Dans la seconde ANOVA, ce sont les temps de
réaction inverses pour les deux types de masqueurs produits en italien qui ont été considérés.
Dans les deux ANOVA, le facteur Groupe (à 2 modalités : participants natifs du français et
participants natifs de l’italien) et le facteur Type de bruit dans le masqueur (à 2 modalités :
masqueurs paroliers français et masqueurs de bruit fluctuant français) ont été pris en compte.
La première ANOVA, lorsque les masqueurs étaient en français, a indiqué un effet principal
significatif du Type de bruit dans le masqueur (F(1,23) = 23.86, p < .0001) ainsi qu’un effet
principal significatif du Groupe (F(1,23) = 12.22, p = .001). En revanche, l’interaction simple
entre ces deux facteurs n’est pas ressortie significative à l’ANOVA (F(1,23) = .29, n.s.),
indiquant que l’effet des informations linguistiques de haut niveau des masqueurs paroliers
français ne semble pas avoir été plus pénalisant pour les participants natifs de l’italien que
pour les participants natifs du français.
La seconde ANOVA, avec les masqueurs en italien, a révélé que l’effet principal du Type de
bruit dans le masqueur était ressorti significatif à l’ANOVA (F(1,23) = 8.21, p < .01), comme
l’effet principal du Groupe (F(1,23) = 20.40, p < .001). L’interaction simple entre ces deux
Partie expérimentale Expérience 6
155
facteurs n’est pas ressortie significative (F(1,23) = .0004, n.s.), suggérant que l’effet des
informations linguistiques de haut niveau mis en évidence pour les masqueurs paroliers
italiens ne semble pas avoir été plus important pour les participants natifs de l’italien que pour
les participants natifs du français.
Les résultats de ces deux ANOVA suggèrent que les temps de réaction plus longs observés
pour les participants natifs de l’italien pourraient principalement être expliqués par la
difficulté que ces participants ont eu à réaliser la tâche de décision lexicale dans leur langue
seconde, plutôt que par des effets plus importants des informations linguistiques de haut
niveau présentes dans les masqueurs paroliers italiens et français.
Discussion générale
156
DISCUSSION GENERALE
Dans cette thèse, nous nous sommes intéressés à une situation fréquente lorsque nous
communiquons, celle où du bruit environnant est présent alors que nous cherchons à
comprendre le message de notre interlocuteur (message cible). Dans le cas où le bruit
concurrent est un bruit de parole (télévision, discussion voisine), des interférences de nature
linguistique vont perturber notre compréhension du message cible. En effet, les informations
linguistiques du bruit concurrent, même si elles ne sont pas pertinentes pour l’auditeur, vont
être traitées et identifiées en même temps que les informations linguistiques du message cible.
Dans cette thèse, il s’agissait d’utiliser la situation de la parole dans la parole afin d’examiner
et de caractériser les interférences linguistiques qui ont lieu dans cette situation d’écoute.
Nous avons élaboré notre travail expérimental en trois étapes. Dans une première
étape, nous avons mis au point un paradigme expérimental adapté à l’étude des interférences
linguistiques intervenant dans la situation de la parole dans la parole avec de la parole cible en
français. Dans une seconde étape, nous avons cherché à déterminer si des interférences sous-
lexicales d’ordre phonémique peuvent être repérées dans cette situation d’écoute. Enfin dans
une troisième étape, nous avons complété notre approche sur les interférences linguistiques en
examinant la situation de la parole dans la parole lorsque le message cible était produit dans la
langue seconde des participants plutôt que dans leur langue native.
Etape 1
Dans une première expérience, afin de mettre en place notre paradigme expérimental,
nous avons pris pour base l’étude de Van Engen & Bradlow (2007). Dans le but d’examiner
un effet des interférences linguistiques, ces auteurs ont manipulé la langue de la parole
concurrente. Ainsi, les masqueurs paroliers étaient produits dans la langue native des
participants, comme la parole cible, ou dans une langue qui était inconnue. Plus précisément,
des participants natifs de l’anglais ont réalisé une tâche d’intelligibilité avec des phrases cibles
anglaises insérées dans des masqueurs paroliers en anglais ou en mandarin. Les auteurs ont
observé des performances significativement plus faibles avec les masqueurs paroliers générés
dans la langue native des participants (anglais) plutôt qu’avec les masqueurs paroliers générés
Discussion générale
157
dans la langue non connue (mandarin). De plus, parmi les erreurs des participants, Van Engen
& Bradlow ont observé des mots appartenant aux masqueurs paroliers anglais à la place des
mots cibles. Des interférences linguistiques ont donc eu lieu, en particulier des interférences
lexicales, lorsque la parole concurrente était produite dans la langue intelligible pour les
participants (anglais). Avec les masqueurs paroliers en mandarin, les informations lexicales
n’étant pas intelligibles, elles n’ont pas créé d’interférence.
Dans notre première expérience, nous avons demandé à des participants natifs du
français de réaliser une tâche d’intelligibilité avec des mots cibles français insérés dans des
masqueurs paroliers générés dans leur langue native (français) ou dans une langue non connue
(gaélique irlandais). Notre objectif était de répliquer, avec de la parole cible en français,
l’effet de la langue des masqueurs paroliers observé dans l’étude de Van Engen & Bradlow
(2007). Jusqu’à présent, cet effet a été mis en évidence lorsque la langue de la parole cible
était de l’allemand (Rhebergen et al., 2005) ou de l’anglais (Garcia Lecumberri & Cooke,
2006 ; Van Engen & Bradlow, 2007). Nos premiers résultats ont révélé la présence
d’interférences linguistiques avec les masqueurs paroliers générés dans la langue intelligible
pour les participants (français). Les performances étaient significativement plus faibles avec
les masqueurs paroliers français plutôt qu’avec les masqueurs paroliers irlandais ; de plus, des
mots appartenant aux masqueurs paroliers français ont été retranscrits à la place des mots
cibles. Nos résultats sont ainsi en accord avec ceux obtenus par Van Engen & Bradlow
(2007).
Dans cette Expérience 1, nous avons manipulé d’autres facteurs que la langue des
masqueurs paroliers ; nous avons fait varier le Rapport Signal sur Bruit (RSB) entre les mots
cibles et les masqueurs, ainsi que le nombre de locuteurs dans le masqueur. Nous avons vu
que ces facteurs permettent de moduler l’effet des interférences linguistiques ; notamment, cet
effet peut être réduit avec des valeurs de RSB positives ou lorsque le nombre de locuteurs
dans le masqueur devient élevé. Par exemple, dans leur étude, Van Engen & Bradlow (2007)
ont testé les valeurs de RSB suivantes : +5, 0 et -5 dB. L’effet de la langue des masqueurs
paroliers (langue native versus langue non connue) était présent uniquement à 0 dB et à -5 dB.
Autrement dit, l’effet des interférences linguistiques produit par les masqueurs paroliers
générés dans la langue intelligible n’a été observé que lorsque le niveau sonore des phrases
cibles était équivalent ou inférieur au niveau sonore des masqueurs paroliers. Une explication
serait qu’avec un RSB positif, la ségrégation entre les flux de parole concurrents est plus
Discussion générale
158
facile, ce qui rendrait l’effet des interférences linguistiques moins observable. Dans notre
paradigme, nous avons donc fixé le RSB à -5 dB et à 0 dB. L’effet de la langue des masqueurs
paroliers (français versus gaélique irlandais) était présent pour ces deux valeurs de RSB ;
néanmoins, il était plus important à -5 dB plutôt qu’à 0 dB.
Quant au nombre de locuteurs dans le masqueur, Van Engen & Bradlow (2007) ont généré
des masqueurs paroliers à 2 et à 6 locuteurs. L’effet de la langue des masqueurs n’était présent
qu’avec 2 locuteurs. Cela pourrait être dû au fait que la saturation spectro-temporelle du
signal concurrent devient plus importante avec l’augmentation du nombre de locuteurs,
l’accès aux informations linguistiques des masqueurs ainsi que leur effet de masque sur
l’intelligibilité de la parole cible seraient alors réduits. Les résultats obtenus par Hoen et al.
(2007) semblent confirmer cette idée. Ces auteurs ont masqué des mots cibles français avec
des masqueurs paroliers français composés de 4, 6 ou 8 locuteurs. Parmi leurs erreurs, les
participants ont retranscrit à la place des mots cibles, des mots appartenant aux masqueurs, et
ce, uniquement lorsque les masqueurs étaient composés de 4 locuteurs. Ces résultats
suggèrent qu’à partir d’un certain nombre de locuteurs, 6 locuteurs (comme pour Van Engen
& Bradlow, 2007), l’effet des interférences linguistiques est réduit du fait que les informations
linguistiques du masqueur sont moins accessibles. Pour ces raisons, dans notre paradigme
expérimental, nous avons utilisé des masqueurs paroliers composés de 2 et de 4 locuteurs.
Nos résultats ont confirmé la présence de l’effet de la langue des masqueurs paroliers avec 2
et 4 locuteurs, et donc la présence d’un effet des informations linguistiques pour les
masqueurs paroliers générés dans la langue intelligible. Nos résultats ont également indiqué
que l’effet de la langue des masqueurs n’était pas plus important pour une de ces deux
valeurs.
Dans cette première étape, nous avons vérifié que lorsque la parole cible est produite
en français, des interférences lexicales sont produites par les masqueurs paroliers générés dans
la langue intelligible des participants. Nous avons aussi identifié les conditions
expérimentales permettant d’explorer plus avant les interférences linguistiques. C’est ainsi
que, dans la seconde étape, nous avons gardé les conditions expérimentales pour lesquelles le
RSB est fixé à -5 dB ; en effet, c’est pour cette valeur de RSB que l’effet de la langue des
masqueurs était le plus important dans la première étape. Nous avons également préféré
conserver les conditions à 4 locuteurs plutôt que celles à 2 locuteurs ; les caractéristiques
vocales des locuteurs étant moins prépondérantes avec 4 locuteurs.
Discussion générale
159
Etape 2
Après avoir mis en évidence les interférences linguistiques produites par les
masqueurs paroliers générés dans une langue intelligible, nous avons cherché à les
caractériser. Jusqu’à présent, des interférences lexicales (Van Engen & Bradlow, 2007 ; Hoen
et al., 2007 ; Boulenger et al., 2010) ont été révélées. Dans les études de Van Engen &
Bradlow (2007) et de Hoen et al. (2007), les interférences lexicales ont été mises en lumière
en analysant les erreurs commises par les participants lors d’une tâche d’intelligibilité. Les
auteurs ont observé que des mots présents dans les masqueurs paroliers ont été retranscrits à la
place des mots du signal cible. Dans l’étude de Boulenger et al. (2010), c’est en manipulant la
fréquence d’occurrence des mots présents dans les masqueurs paroliers que des interférences
lexicales ont été révélées. Les auteurs ont observé que les masqueurs paroliers composés de
mots très fréquents ont un effet de masque plus important que les masqueurs paroliers
composés de mots peu fréquents. Les participants sont ainsi sensibles aux informations
lexicales présentes dans la parole concurrente.
Dans cette thèse, il était question de déterminer si des interférences sous-lexicales
telles que des interférences phonémiques peuvent avoir lieu dans la situation de la parole dans
la parole. Trois expériences (Expériences 2, 3 & 4) ont été menées afin de répondre à cette
question. Au fil de ces trois expériences, nous avons fait évoluer les conditions
expérimentales de notre paradigme expérimental et nous les avons testées avec une tâche
d’intelligibilité (Expérience 2) puis avec une tâche de décision lexicale (Expériences 3 & 4).
Afin de tester l’hypothèse des interférences phonémiques, nous avons utilisé une
troisième langue, l’italien, qui avait le statut de langue non connue pour les participants,
comme le gaélique irlandais. Cela nous a permis de manipuler le pourcentage de phonèmes
communs entre la langue de la parole cible (également langue native des participants) et la
langue de la parole concurrente. Ce pourcentage est de 100% avec les masqueurs paroliers
français, de 60% avec les masqueurs paroliers italiens et de 18% avec les masqueurs paroliers
irlandais. Nous avons ainsi testé l’hypothèse selon laquelle plus le pourcentage de phonèmes
communs est élevé, plus l’effet des interférences phonémiques est important. Cette hypothèse
nous a permis à la fois d’explorer plus avant la nature des interférences linguistiques produites
par les masqueurs paroliers générés dans une langue intelligible, ainsi que d’examiner si les
masqueurs paroliers produits dans une langue non intelligible peuvent produire des
interférences sous-lexicales. En effet, les informations lexicales de ces masqueurs n’étant pas
Discussion générale
160
intelligibles, elles n’interfèrent pas avec l’intelligibilité de la parole cible. En revanche, étant
donné que nous retrouvons 60% de phonèmes français dans l’inventaire phonémique de
l’italien et 18% de phonèmes français dans l’inventaire phonémique de l’irlandais, nous
pouvions nous demander si ces phonèmes communs entre la langue cible et la langue
concurrente peuvent perturber l’intelligibilité des mots cibles.
Ensuite, nous avons pris en compte le fait qu’un signal de parole, de par sa
composition, peut produire des interférences linguistiques ainsi que des interférences
acoustiques. Etant donné que nous souhaitions nous focaliser sur les interférences
linguistiques de haut niveau des masqueurs paroliers, nous avons ajouté des masqueurs de
bruit fluctuant à notre paradigme expérimental (Festen & Plomp, 1990 ; Dole et al., 2009).
Ces deux types de masqueurs partagent les mêmes informations acoustiques (informations
spectrales) et linguistiques de bas niveau (fluctuations temporelles lentes) ; seuls les
masqueurs paroliers possèdent des informations linguistiques de haut niveau (phonèmes,
syllabes et mots). Nous avons généré ces masqueurs de bruit fluctuant à partir des masqueurs
paroliers à 4 locuteurs dans chacune des trois langues manipulées (français, irlandais et
italien). Dans chacune de nos expériences, nous avons analysé les résultats observés dans la
situation de la parole dans la parole, afin de déterminer avec quelle langue présente dans les
masqueurs paroliers l’identification des mots cibles a été la plus difficile. Puis, afin
d’examiner la nature des interférences produites par les masqueurs paroliers, nous avons
comparé les résultats obtenus avec les masqueurs paroliers à ceux obtenus avec les masqueurs
de bruit fluctuant. Des performances significativement différentes avec les deux types de
masqueurs (parolier et bruit fluctuant) indiquent que les informations linguistiques de haut
niveau présentes dans les masqueurs paroliers interfèrent avec l’intelligibilité de la parole
cible. Ainsi, dans le cas où un effet des interférences linguistiques de haut niveau était mis en
évidence pour les masqueurs paroliers français, irlandais et italiens, nous souhaitions
examiner si cet effet était sensiblement proportionnel au pourcentage de phonèmes communs
entre la langue de la parole cible et la langue de la parole concurrente.
Le paradigme expérimental comptait donc une troisième langue ainsi qu’un second type de
masqueurs. Les mots cibles français étaient insérés dans des masqueurs paroliers et dans des
masqueurs de bruit fluctuant produits en français, en irlandais et en italien.
Dans l’Expérience 2, nous avons testé ce paradigme expérimental avec une tâche
d’intelligibilité, comme dans l’Expérience 1. Les masqueurs paroliers étaient composés de 4
locuteurs et le RSB entre les mots cibles et les masqueurs était fixé à -5 dB. Les résultats ont
Discussion générale
161
indiqué que les masqueurs paroliers générés dans les trois langues (français, irlandais et
italien) ont produit des interférences impliquant des informations linguistiques de haut niveau
ainsi que des informations acoustiques et linguistiques de bas niveau. En revanche, les écarts
de performances entre les deux types de masqueurs (parolier et bruit fluctuant) n’étaient pas
proportionnels aux pourcentages de phonèmes communs entre la langue cible et la langue
concurrente. Or, dans le cas où les masqueurs paroliers produisent des interférences
phonémiques, nous nous attendions à ce que l’effet des informations linguistiques de haut
niveau soit le plus important avec les masqueurs paroliers français, plus faible avec les
masqueurs paroliers italiens, et encore plus faible avec les masqueurs paroliers irlandais.
Un moyen d’approfondir le questionnement sur les interférences phonémiques
intervenant dans la situation de la parole dans la parole, serait de modifier le codage des
réponses des participants et de passer d’un codage lexical à un codage phonémique. Jusqu’à
présent, nous avons réalisé un codage lexical, le mot cible retranscrit était correctement
reconnu par les participants ou non reconnu. Mais lors du dépouillement des résultats, nous
avons remarqué la présence de réponses partielles (une partie du mot cible seulement a été
correctement identifiée). Pour le mot cible « parent », les participants ont par exemple
retranscrit le mot « hareng » ou uniquement la syllabe « pa ». Ces réponses partielles ont été
codées comme des erreurs (c’est-à-dire comme mot non reconnu), les phonèmes correctement
identifiés n’ont donc pas été pris en compte. Exploiter ces réponses partielles pourrait nous
aider à examiner les compétitions phonémiques. Dans un nouveau codage des réponses, il ne
s’agirait plus de coter les réponses en tant que mot reconnu / non reconnu, mais en tant que
phonème reconnu / non reconnu. Cette cotation serait appliquée uniquement pour les réponses
des participants obtenues dans la situation de la parole dans la parole (conditions où les mots
cibles étaient insérés dans les masqueurs paroliers). Pour chaque participant, les pourcentages
de phonèmes cibles correctement retranscrits lorsque les masqueurs paroliers sont générés en
français, en irlandais et en italien seraient obtenus. Nous pourrions déterminer si le
pourcentage de phonèmes cibles correctement retranscrits est influencé par la distance
phonémique de la langue des masqueurs paroliers avec la langue cible ; le pourcentage de
phonèmes cibles correctement retranscrits est-il plus faible lorsque le pourcentage de
phonèmes communs entre la langue cible et la langue des masqueurs paroliers est important ?
Notons cependant que cette nouvelle cotation des résultats nécessite que certains paramètres
du paradigme expérimental soient affinés. En effet, bien que tous les mots cibles soient
dissyllabiques, ils ne comportent pas tous le même nombre de phonèmes (par exemple, le mot
Discussion générale
162
« ballon » possède quatre phonèmes alors que le mot « prairie » en possède cinq). De plus,
tous les phonèmes présents dans la langue française ne sont pas apparus dans les mots cibles
le même nombre de fois et leur place dans les mots cibles n’était pas contrôlée.
Notons cependant que dans la tâche d’intelligibilité, des interférences d’ordre
linguistique autres que des interférences phonémiques peuvent intervenir et dissimuler l’effet
des interférences phonémiques. Il pourrait notamment s’agir d’interférences post-lexicales,
expliquées par le type de tâche que nous avons utilisé. En effet, avec la tâche d’intelligibilité,
il était demandé aux participants de retranscrire le mot cible entendu à la fin de l’essai. Or, du
temps s’écoulait entre la fin de présentation du mot cible et la fin du masqueur pendant lequel
des interférences post-lexicales ont pu entrer en jeu.
Dans l’Expérience 3, nous avons préféré utiliser une tâche de décision lexicale pour tester
l’hypothèse des compétitions phonémiques en remplacement de la tâche d’intelligibilité. Nous
avons présenté aux participants les mots cibles français ainsi que des pseudo-mots construits à
partir des mots. Ils devaient décider le plus rapidement possible et en commettant le moins
d’erreurs possible, si l’item cible appartenait à la langue française. Cette tâche nous a alors
permis de capturer les interférences produites par les masqueurs français, irlandais et italiens
pendant l’accès au lexique des mots cibles. Alors que la tâche d’intelligibilité est caractérisée
de tâche « off-line », la tâche de décision lexicale est de type « on-line ». Avec cette dernière,
nous avons observé un effet des informations linguistiques de haut niveau uniquement pour
les masqueurs paroliers français, c’est-à-dire seulement pour les masqueurs paroliers générés
dans une langue intelligible pour les participants. Pour les masqueurs paroliers générés dans
les langues non intelligibles pour les participants (irlandais et italien), les unités linguistiques
de haut niveau n’auraient pas interféré sur l’intelligibilité de la parole cible ; les masqueurs
paroliers irlandais et italiens auraient produit des interférences n’impliquant que des
informations acoustiques et linguistiques de bas niveau. De plus, concernant les résultats
obtenus avec les masqueurs paroliers (situation de la parole dans la parole), nous avons
observé des temps de réaction significativement plus courts avec les masqueurs paroliers
irlandais ; les temps de réaction n’étaient significativement pas différents entre les masqueurs
paroliers italiens et français.
Plusieurs constats résultent alors de l’Expérience 3. Tout d’abord, nous avons obtenu
un résultat inattendu avec les masqueurs paroliers italiens. En effet, ces derniers ont eu un
effet de masque aussi important que les masqueurs paroliers français. Autrement dit, l’italien,
Discussion générale
163
qui a pourtant un statut de langue non intelligible pour les participants, a perturbé
l’identification des mots cibles français avec autant d’efficacité que le français, langue native
des participants. La tâche de décision lexicale ayant révélé que seuls les masqueurs paroliers
français ont produit des interférences impliquant des informations linguistiques de haut
niveau, il résulte que l’italien et le français ont eu des effets de masque équivalents tout en
produisant des interférences impliquant des informations de natures différentes.
Nous avons également observé que les masqueurs paroliers irlandais et italiens ont
entrainé des temps de réaction significativement différents. Les participants ont été
significativement plus rapides avec les masqueurs paroliers irlandais qu’avec les masqueurs
paroliers italiens. De plus, les informations linguistiques de haut niveau des masqueurs
paroliers irlandais et italiens n’ont pas perturbé l’accès au lexique des mots cibles français.
Ainsi, les phonèmes français présents dans les inventaires phonémiques de l’irlandais et de
l’italien, et donc présents dans les masqueurs paroliers irlandais et italiens (18% de phonèmes
communs entre l’irlandais et le français, 60% entre l’italien et le français), n’auraient pas
perturbé l’identification des mots cibles français. Les temps de réaction significativement plus
courts avec les masqueurs paroliers irlandais plutôt qu’avec les masqueurs paroliers italiens
pourraient donc être expliqués par des différences entre l’irlandais et l’italien au niveau de
leurs informations acoustiques et linguistiques de bas niveau. Notamment, ces deux langues
diffèrent au niveau de leur rythme. Alors que l’irlandais est une langue accentuelle, l’italien et
le français sont des langues syllabiques. Ainsi, l’accès au lexique des mots cibles français
aurait davantage été perturbé par les masqueurs paroliers générés dans une langue dont le
rythme est identique à celui de la langue cible (français et italiens) plutôt dans une langue
dont le rythme est différent (voir les travaux de Reel & Hicks, 2012). Afin d’éclaircir cette
hypothèse, nous pourrions envisager de modifier notre paradigme expérimental. Les langues
utilisées (une intelligible, les deux autres inintelligibles) auraient le même rythme. Autrement
dit pour les deux langues inintelligibles, le rythme ne serait plus différent, comme c’est le cas
pour l’irlandais et l’italien (langue syllabique versus accentuelle), mais identique. Nous
pourrions par exemple, comparer l’effet de masque de l’italien à celui de l’espagnol et
déterminer si l’espagnol perturbe l’accès au lexique des mots cibles français avec autant
d’efficacité que l’italien.
En minimisant l’effet des traitements post-lexicaux, la tâche de décision lexicale
utilisée dans l’Expérience 3 nous a permis d’examiner plus finement la nature des
Discussion générale
164
interférences produites par les masqueurs paroliers français, irlandais et italiens. Alors que la
tâche d’intelligibilité de l’Expérience 2 nous a indiqué que les informations linguistiques de
haut niveau présentes dans les masqueurs paroliers français, irlandais et italiens avaient
interféré avec l’intelligibilité de la parole cible, la tâche de décision lexicale nous a permis
d’identifier que seuls les masqueurs paroliers générés dans la langue intelligible pour les
participants (français) ont produit des interférences impliquant des informations linguistiques
de haut niveau en plus des informations acoustiques et linguistiques de bas niveau.
Afin d’examiner plus avant les résultats obtenus avec les masqueurs paroliers français
et italiens, nous avons mené une dernière expérience dans cette deuxième étape (Expérience
4). Nous voulions réduire le taux d’erreurs moyens des participants et déterminer si avec plus
de données à analyser, nous pourrions en apprendre davantage sur les résultats obtenus avec
les masqueurs paroliers français et italiens.
Dans l’Expérience 4, nous avons rendu la situation d’écoute moins difficile pour les
participants. Le RSB entre les mots cibles et les masqueurs n’était plus fixé à -5 dB mais à 0
dB ; le niveau sonore des mots cibles n’était plus inférieur à celui des masqueurs mais
équivalent. Dans cette expérience, nous n’avons modifié que cette condition expérimentale.
Le taux d’erreurs a effectivement diminué ; il est passé de 34,1% à 22,1%. En revanche, cette
situation d’écoute semble être moins appropriée que celle à -5 dB pour examiner les
interférences produites dans la situation de la parole dans la parole. En effet, nous n’avons pas
retrouvé l’effet des informations linguistiques de haut niveau des masqueurs paroliers
français, il a été réduit. De même pour les effets des informations acoustiques et linguistiques
de bas niveau révélés dans l’Expérience 3, les temps de réaction des masqueurs paroliers
irlandais et italiens n’étaient plus significativement différents. Nous avions donc davantage de
données à analyser, en revanche la situation d’écoute à 0 dB ne nous a pas permis d’explorer
plus avant les effets de masque équivalents des masqueurs paroliers italiens et français.
Etape 3
Dans cette étape, deux expériences ont été menées dans le but de compléter les
résultats obtenus dans les expériences précédentes. Dans les Expériences 5 & 6, nous avons
manipulé le niveau de connaissances des participants pour les langues des masqueurs
paroliers ; deux langues parmi les trois manipulées étaient intelligibles pour les participants
Discussion générale
165
(français et italien) au lieu d’une (français) comme dans les expériences précédentes. Dans ce
but, l’Expérience 5 a été menée auprès de participants natifs du français qui parlent l’italien
comme langue seconde (L2) ; dans l’Expérience 6, ce sont des participants natifs de l’italien
qui parlent le français comme L2 qui ont été sélectionnés. Enfin, dans ces deux expériences,
nous avons présenté aux participants les mêmes conditions expérimentales que dans
l’Expérience 3 ; les mots cibles français étaient insérés avec un RSB de -5 dB dans les
masqueurs paroliers (4 locuteurs) et dans les masqueurs de bruit fluctuant générés en français,
en irlandais et en italien. Ainsi, les participants de l’Expérience 5 ont réalisé la tâche de
décision lexicale dans leur langue native et les participants de l’Expérience 6 l’ont réalisée
dans leur langue seconde.
Dans l’Expérience 5, les résultats ont indiqué des différences significatives entre les
temps de réaction obtenus avec les masqueurs paroliers et ceux obtenus avec les masqueurs de
bruit fluctuant pour le français et l’italien. Ces résultats complètent ainsi ceux de l’Expérience
3 en confirmant que lorsque les masqueurs paroliers sont générés dans une langue intelligible
pour les participants (Expérience 3 : français ; Expérience 5 : français et italien), ils
produisent des interférences impliquant des informations linguistiques de haut niveau ainsi
que des informations acoustiques et linguistiques de bas niveau. Pour les masqueurs paroliers
produits dans une langue non connue pour les participants (Expérience 3 : irlandais et italien ;
Expérience 5 : irlandais), seules les informations acoustiques et linguistiques de bas niveau
interfèrent avec l’intelligibilité des mots cibles.
Dans une même analyse de variance, nous avons comparé les résultats obtenus par les
participants monolingues natifs du français (Expérience 3) à ceux des participants natifs du
français qui parlent l’italien comme L2 (Expérience 5). Dans les deux expériences, le matériel
expérimental proposé était identique, seul le niveau de connaissances des participants pour la
langue italienne était différent (langue intelligible versus non intelligible). L’analyse a
confirmé une différence significative entre les deux groupes de participants pour les
masqueurs paroliers italiens ; aucune autre différence n’a été signalée entre ces deux groupes.
De plus, dans l’Expérience 5, manipuler des masqueurs paroliers générés dans la langue
native des participants (français) et dans leur langue seconde (italien), nous a permis de
déterminer si l’accès au lexique des mots cibles français a davantage été perturbé dans une
condition plutôt que dans une autre. Les résultats ont indiqué que les temps de réaction des
participants étaient significativement plus longs avec les masqueurs paroliers générés dans
leur L2 (italien) plutôt que dans leur langue native (français). Ces résultats pourraient être
Discussion générale
166
expliqués par le fait qu’avec les masqueurs paroliers générés dans la L2 des participants, les
interférences linguistiques seraient plus fortes qu’avec les masqueurs paroliers produits dans
une langue native. Jusqu’à 4 locuteurs dans les masqueurs paroliers, certains mots peuvent
être extraits et traités (Hoen et al., 2007). Or, nous avons vu dans la partie théorique que
l’identification de mots produits dans une langue seconde active un plus grand nombre de
compétiteurs que l’identification de mots produits dans une langue native (Weber & Cutler,
2004). Ainsi, les temps de réaction des participants auraient été plus longs avec les masqueurs
paroliers en italien (L2), du fait que les mots extraits de ces masqueurs auraient activé un plus
grand nombre de compétiteurs (compétiteurs des lexiques mentaux de la langue native et de la
L2). Les interférences linguistiques auraient, dans ce cas, été plus fortes et auraient davantage
perturbé l’accès au lexique des mots cibles français que les mots extraits des masqueurs
paroliers produits en français (langue native).
Afin d’approfondir ce point et tester cette hypothèse, il faudrait partir en Italie et mener une
expérience « miroir » à celle de l’Expérience 5. Nous proposerions la tâche de décision
lexicale à des participants natifs de l’italien parlant le français comme langue seconde. Les
masqueurs paroliers et les masqueurs de bruit fluctuant générés dans les trois langues seraient
exactement identiques à ceux utilisés dans l’Expérience 5. Cependant, les mots cibles seraient
produits en italien plutôt qu’en français. Comme dans l’Expérience 5, les participants
réaliseraient la tâche de décision lexicale dans leur langue native. Dans le cas où les temps de
réaction des participants sont significativement plus longs avec les masqueurs paroliers en
français (L2) plutôt qu’avec les masqueurs paroliers en italien (langue native), l’hypothèse
selon laquelle les mots extraits des masqueurs paroliers générés dans la L2 des participants
(français) activent un plus grand nombre de compétiteurs lors de leur identification que les
mots extraits des masqueurs paroliers dans la langue native des participants (italien) ne
pourrait pas être rejetée.
Enfin, dans l’Expérience 5, nous ne pouvons exclure la présence d’un biais
attentionnel. En effet, lors du recrutement des participants, nous avons indiqué que nous
cherchions des personnes natives du français en précisant qu’ils devaient parler l’italien
comme langue seconde. Cette précision a pu influencer les participants qui se seraient alors
davantage focalisés sur les masqueurs paroliers italiens. Afin de maîtriser ce biais
attentionnel, une solution serait de réaliser l’Expérience 5 en Italie, le matériel expérimental
ne serait pas modifié et nous pourrions le présenter à des participants natifs du français partis
Discussion générale
167
vivre en Italie. Il ne serait pas donc nécessaire de préciser que nous cherchons des participants
qui parlent l’italien comme langue seconde, le biais attentionnel pourrait être ainsi contrôlé.
Dans l’Expérience 6, nous avons poursuivi l’examen des interférences linguistiques
intervenant dans la situation de la parole dans la parole et la comparaison des effets de
masque de masqueurs paroliers générés dans une langue native, une langue seconde et une
langue non intelligible. Dans cette expérience, les participants étaient natifs de l’italien et
parlaient le français comme langue seconde. Nous leur avons présenté la même tâche et les
mêmes conditions expérimentales qu’aux participants des Expériences 3 & 5 ; ils ont ainsi
réalisé la tâche de décision lexicale avec des mots cibles français, c’est-à-dire avec des mots
produits dans leur langue seconde. Les résultats ont à nouveau confirmé que les masqueurs
paroliers produisent des interférences impliquant des informations linguistiques de haut
niveau ainsi que des informations acoustiques et linguistiques de bas niveau, dès lors qu’ils
sont générés dans une langue intelligible pour les participants (masqueurs paroliers italiens et
français).
Les résultats ont également montré qu’il n’y avait pas de différence significative entre les
temps de réaction obtenus avec les masqueurs paroliers italiens et ceux obtenus avec les
masqueurs paroliers français ; la situation d’écoute n’était donc pas plus difficile, que les
masqueurs paroliers aient été générés dans la L2 des participants (français) ou dans leur
langue native (italien). Ce résultat est donc différent de celui observé dans l’Expérience 5
lorsque la tâche a été réalisée avec des mots cibles produits dans la langue native des
participants ; nous avions observé des temps de réaction significativement plus longs pour les
masqueurs paroliers dans la L2 plutôt que dans la langue native. Dans l’Expérience 6,
l’absence de différence significative entre les temps de réaction obtenus avec les masqueurs
paroliers italiens et ceux observés avec les masqueurs paroliers français pourrait être due au
fait que l’identification des mots cibles produits dans la langue seconde des participants, a
activé un nombre de compétiteurs relativement équivalents, et ce, quelle que soit la langue des
masqueurs paroliers (italien et français). L’identification de ces mots aurait activé des
compétiteurs appartenant au lexique mental de la langue native ainsi que des compétiteurs
appartenant au lexique mental de la langue seconde. Il ressort des Expériences 5 & 6 que
l’effet du niveau de connaissances des participants pour la langue concurrente était différent
selon que la parole cible ait été produite dans la langue native des participants ou dans leur
langue seconde.
Discussion générale
168
Dans une même analyse de variance, nous avons comparé les performances des participants
natifs de l’italien qui parlent le français comme L2 (Expérience 6) à ceux des participants
natifs du français parlant l’italien comme L2 (Expérience 5). Nous avons observé que pour
chacune des conditions expérimentales, les participants natifs de l’italien ont eu des temps de
réaction significativement plus longs que les participants natifs du français. L’identification
des mots cibles était donc plus longue lorsqu’ils étaient produits dans une langue seconde
plutôt que dans une langue native. Nos résultats sont en accord avec ceux de la littérature
(Garcia Lecumberri & Cooke, 2006 ; Cooke et al., 2008 ; Van Engen, 2010).
En conclusion, dans cette dernière étape, nous avons étudié les interférences
linguistiques intervenant dans la situation de la parole dans la parole, en manipulant le niveau
de connaissances des participants à la fois pour la langue de la parole concurrente ainsi que
pour la langue de la parole cible. Dans ces deux expériences, les masqueurs paroliers générés
dans les langues intelligibles pour les participants (français, italien) ont produit des
interférences impliquant des informations linguistiques de haut niveau en plus des
informations acoustiques et linguistiques de bas niveau.
Dans la dernière partie de cette thèse, nous avons eu à sélectionner des participants
parlant deux langues (français et italien) afin de manipuler le niveau de connaissances des
participants pour la langue des masqueurs paroliers ainsi que pour la langue de la parole cible.
Ces objectifs n’incluaient pas l’étude du bilinguisme à proprement parlé (Paradis & Genesee,
1996 ; Paradis & Navarro, 2003 ; Meisel, 2004 ; Costa, Heij & Navarrete, 2006 ; Costa,
Hernandez, Costa-Faidella & Sebastian-Gallés, 2009 ; Hernandez, Costa, Fuentes, Vivas &
Sebastian-Gallés, 2010 ; Paradis, Genesee & Crago, 2011 ; Pérez-Vidal, 2011 ; Paradis,
2012). Notre paradigme expérimental nous permettrait néanmoins d’approcher cette
problématique. Pour avancer plus avant, il faudrait par exemple, au lieu de sélectionner des
participants natifs de l’italien vivant en France depuis en moyenne 5 ans (Expérience 6),
recruter des participants natifs de l’italien qui sont en immersion en France depuis plus
longtemps. Nous leur proposerions la tâche de décision lexicale avec les mots cibles en
français, c’est-à-dire avec les mots cibles produits dans leur langue seconde. Nous
comparerions leurs temps de réaction à ceux des participants de l’Expérience 6 ainsi qu’à
ceux de participants natifs du français qui ont réalisé la tâche de décision lexicale dans leur
langue native (par exemple les participants de l’Expérience 5). Nous pourrions déterminer si
Discussion générale
169
les temps de réaction deviennent plus courts à mesure que la période d’immersion en France
augmente, autrement dit avec l’augmentation de la durée de pratique de la langue seconde.
Nous observerions dans quelle mesure une langue seconde peut devenir la langue dominante
des participants. Si tel est le cas, nous pourrions nous attendre à ce que les temps de réaction
des participants se rapprochent de ceux des participants réalisant la tâche de décision lexicale
avec des mots cibles produits dans leur langue native. Nous pourrions également examiner, si
l’amélioration des temps de réaction concerne les deux types de masqueurs, ou si cette
amélioration concerne en premier les masqueurs de bruit fluctuant, ces derniers étant
dépourvus d’informations linguistiques de haut niveau. Cette possible expérience,
questionnant sur le passage d’une langue seconde à une langue dominante, permettrait
d’aborder la notion de plasticité neuronale des réseaux langagiers (Lenneberg, 1967 ; Johnson
& Newport, 1989 ; Pallier et al., 2003).
Conclusion
170
CONCLUSION
Dans cette thèse, nous avons exploré la situation de la parole dans la parole afin de
caractériser les interférences produites par des masqueurs paroliers lors de la présentation de
mots cibles français. Dans une première série d’expériences, les masqueurs paroliers étaient
générés dans une langue intelligible pour les participants (français) ou dans des langues non
connues (gaélique irlandais et italien). De plus, deux types de tâches ont été utilisés : une
tâche d’intelligibilité (à -5 dB) puis une tâche de décision lexicale (à -5 dB et à 0 dB). A -5 dB
pour les deux tâches, les masqueurs paroliers italiens ont, de façon inattendue, perturbé
l’identification des mots cibles français avec autant d’efficacité que les masqueurs paroliers
français. Les masqueurs paroliers irlandais ont conduit, eux, à des performances
significativement plus élevées. La tâche de décision lexicale, en minimisant l’effet des
traitements post-lexicaux, s’est avérée plus précise que la tâche d’intelligibilité pour identifier
la nature des interférences produites par les masqueurs paroliers. Elle nous a indiqué que seuls
les masqueurs paroliers générés dans la langue intelligible (français) ont produit des
interférences impliquant des informations linguistiques de haut niveau en plus des
informations acoustiques et linguistiques de bas niveau. Il en résulte tout d’abord que les
masqueurs paroliers irlandais et italiens n’ont pas produit d’interférences lexicales ni sous-
lexicales, mais uniquement des interférences acoustiques et linguistiques de bas niveau.
Ensuite, les masqueurs paroliers générés en italien (langue non connue) ont eu un effet de
masque équivalent aux masqueurs paroliers générés en français (langue connue), tout en
produisant des interférences de natures différentes. Dans une seconde série d’expériences,
nous avons fait varier le niveau de connaissances des participants pour la langue de la parole
cible ainsi que pour la langue des masqueurs paroliers. Les résultats ont confirmé que
l’identification des mots cibles a été plus difficile lorsqu’ils étaient produits dans une langue
seconde plutôt que dans une langue native. Concernant les masqueurs paroliers, ils étaient
générés dans la langue native des participants, dans leur langue seconde ou dans une langue
non connue. Dans les langues intelligibles, les masqueurs paroliers ont produit des
interférences linguistiques de haut niveau en plus des interférences acoustiques et
linguistiques de bas niveau. De plus, ces masqueurs paroliers ont eu des effets de masque
différents lorsque les mots cibles étaient produits dans une langue native, et des effets de
masque équivalents lorsque les mots cibles étaient produits dans une langue seconde.
Références
171
REFERENCES
Aoyama, K., Flege, J. E., Guion, S. G., Akahane-Yamada, R., & Yamada, T. (2004).
Perceived phonetic dissimilarity and L2 speech learning: the case of Japonese /r/ and English
/l/ and /r/. Journal of Phonetics, 32, 233-250.
Assmann, P., & Summerfield, Q. (2004). The perception of speech under adverse
conditions. In S. Greenberg, W. A. Ainsworth, & A. N. Popper (Eds.), Speech Processing in
the Auditory System. New York: Springer-Verlag.
Best, C. T. (1995). A direct realist view of cross-language speech perception. In W.
Strange (Ed.), Speech Perception and Linguistic Experience: Issues in Cross-Language
Research (pp. 171–204). Timonium, MD: York Press.
Best, C. T. & Strange, W. (1992). Effects of phonological and phonetic factors on cross-
language perception of approximants. Journal of Phonetics, 20, 305-330.
Blumenfeld, H. K., & Marian, V. (2007). Constraints on parallel activation in bilingual
spoken language processing: Examining proficiency and lexical status using eye-tracking.
Language and Cognitive processes, 22(5), 633-660.
Boersma, P., & Weenink, D. (2013). Praat: doing phonetics by computer [Computer
program]. Version 5.3.57. En ligne http://www.praat.org/, consulté le 28 Octobre 2013.
Bolia, R. S., Nelson, W. T., Ericson, M. A., & Simpson, B. D. (2000). A speech corpus
for multitalker communications research. Journal of the Acoustical Society of America, 107,
1065-1066.
Boulenger, V., Hoen, M., Ferragne, E., Pellegrino, F., & Meunier, F. (2010). Real-time
lexical competitions during speech-in-speech comprehension. Speech Communication, 52,
246–253.
Bradlow, A. R., Clopper, C., Smiljanic, R., & Walter, M. A. (2010). A perceptual
phonetic similarity space for languages: Evidence from five native language listener
groups. Speech Communication, 52, 930-942.
Broersma, M. (2005). Perception of familiar contrasts in unfamiliar positions. Journal
of the Acoustical Society of America, 117, 3890-3901.
Références
172
Broersma, M. (2012). Increased lexical activation and reduced competition in second-
language listening. Language and Cognitive Processes, 27, 1205-1224.
Broersma, M., & Cutler, A. (2011). Competition dynamics of second-language
listening. Quarterly Journal of Experimental Psychology, 64, 74-95.
Broersma, M., & Scharenborg, O. (2010). Native and non-native listeners’ perception of
English consonants in different types of noise. Speech Communication, 52, 980-995.
Brokx, J. P. L., & Nooteboom, S. G. (1982). Intonation and the perceptual separation of
simultaneous voices. Journal of Phonetics, 10(1), 23-36.
Bronkhorst, A. (2000). The cocktail party phenomenon: A review of research on speech
intelligibility in multiple-talker conditions. Acustica, 86, 117–128.
Bronkhorst, A. W., & Plomp, R. (1992). Effect of multiple speechlike maskers on
binaural speech recognition in normal and impaired hearing. Journal of the Acoustical Society
of America, 92, 3132-3139.
Brouwer, S., Van Engen, K. J., Calandruccio, L., & Bradlow, A. R. (2012). Linguistic
contributions to speech-on-speech masking for native and non-native listeners: Language
familiarity and semantic content. Journal of the Acoustical Society of America, 131(2), 1449-
1464.
Brungart, D. S. (2001). Informational and energetic masking effects in the perception of
two simultaneous talkers. Journal of the Acoustical Society of America, 109(3), 1101-1109.
Brungart, D. S., Chang, P. S., Simpson, B. D., & Wang, D. (2006). Isolating the
energetic component of speech-on-speech masking with ideal time-frequency segregation.
Journal of the Acoustical Society of America, 120(6), 4007-4018.
Brungart, D. S., Simpson, B. D., Ericson, M. A., & Scott, K. R. (2001). Informational
and energetic masking effects in the perception of multiple simultaneous talkers. Journal of
the Acoustical Society of America, 110(5), 2527-2538.
Calandruccio, L., Dhar, S., & Bradlow, A. R. (2010a). Speech-on-speech masking with
variable access to the linguistic content of the masker speech. Journal of the Acoustical
Society of America, 128(2), 860-869.
Références
173
Calandruccio, L., Van Engen, K., Dhar, S., & Bradlow, A. R. (2010b). The
effectiveness of clear speech as a masker. Journal of Speech, Language, and Hearing
Research, 53, 1458-1471.
Cherry, E. C. (1953). Some experiments on the recognition of speech, with one and with
two ears. Journal of the Acoustical Society of America, 25(5), 975-979.
Cooke, M. (2006). A glimpsing model of speech perception in noise. Journal of the
Acoustical Society of America, 119(3), 1562-1573.
Cooke, M., Garcia Lecumberri, M. L., & Barker, J. (2008). The foreign language
cocktail party problem: Energetic and informational masking effects in non-native speech
perception. Journal of the Acoustical Society of America, 123(1), 414-427.
Costa, A., Heij, W. L., & Navarrete, E. (2006). The dynamics of bilingual lexical
access. Bilingualism: Language and Cognition, 9(2), 137-151.
Costa, A., Hernandez, M., Costa-Faidella, J., & Sebastian-Gallés, N. (2009). On the
bilingual advantage in conflict processing: Now you see it, now you don’t. Cognition, 113,
135-149.
Cutler, A., Mehler, J., Norris, D., & Segui, J. (1983). A language-specific
comprehension strategy. Nature, 304, 159-160.
Cutler, A. Mehler, J., Norris, D., & Segui, J. (1986). The syllable’s differing role in the
segmentation of French and English. Journal of Memory and Language, 25, 385-400.
Cutler, A., Otake, T. (2004). Pseudo-homophony in non-native listening. Paper
presented to the 75th meeting of the Acoustical Society of America, New York.
Cutler, A., Weber, A., & Otake, T. (2006). Asymmetric mapping from phonetic to
lexical representations in second-language listening. Journal of Phonetics, 34, 269-284.
Darwin, C. J. (2008). Listening to speech in the presence of other sounds. Philosophical
Transactions: Biological Sciences, 363, 1011-1021.
Darwin, C. J., Brungart, D. S., & Simpson, B. D. (2003). Effects of fundamental
frequency and vocal-tract length changes on attention to one of two simultaneous talkers.
Journal of the Acoustical Society of America, 114, 2913-2922.
Références
174
Dole, M., Hoen, M., & Meunier, F. (2009). Effect of contralateral noise of energetic and
informational masking on speech-in-speech intelligibility. Proceedings of Interspeech,
Brighton, U.K.
Dole, M., Hoen, M., & Meunier, F. (2012). Speech-in-noise perception in adults with
dyslexia : Effects of background type and listening configuration. Neuropsychologia, 50(7),
1543-1552.
Dufour, S., & Frauenfelder, U.H. (2007). L’activation et la sélection lexicales lors de la
reconnaissance des mots parlés : Modèles théoriques et données expérimentales. Année
psychologique, 107, 87-111.
Festen, J. M., & Plomp, R. (1990). Effects of fluctuating noise and interfering speech on
the speech-reception threshold for impaired and normal hearing. Journal of the Acoustical
Society of America, 88(4), 1725-1736.
Flege, J. E. (1995). Second language speech learning: Theory, findings, and problems.
In W. Strange (Ed.), Speech Perception and Linguistic Experience: Issues in Cross-language
Research (pp. 233-277). Timonium, MD: York Press.
Fleuriot, P., Garnier, S. & Lorenzi, C. (2009). Effets d’une lésion cochléaire sur
l’intelligibilité de la parole dans le bruit : Rôle des informations temporelles de structure fine.
Les Cahiers de l’Audition, 20(4), 27-32.
Florentine, M. (1985). Speech perception in noise by fluent, non-native listeners.
Journal of the Acoustical Society of America, 77, S106.
Florentine, M., Buus, S., Scharf, B., & Canevet, G. (1984). Speech reception thresholds
in noise for native and non-native listeners. Journal of the Acoustical Society of America, 75,
S84.
Forster, K. I., & Forster, J. C. (2003). DMDX: A windows display program with
millisecond accuracy. Behavior Research Methods, Instruments, & Computers, 35, 116-124.
Frauenfelder, U. H. (1996). Computational models of spoken word recognition. In T.
Dijkstra & K. De Smedt (Eds.), Computational psycholinguistics: Symbolic and subsymbolic
models of language processing. Londres: Harvester Press.
Références
175
Freyman, R. L., Balakrishnan, U., & Helfer, K. S. (2004). Effect of number of masking
talkers and auditory priming on informational masking in speech recognition. Journal of the
Acoustical Society of America, 115(5), 2246-2256.
Freyman, R. L., Helfer, K. S., McCall, D. D., & Clifton, R. K. (1999). The role of
perceived spatial separation in the unmasking of speech. Journal of the Acoustical Society of
America,106, 3578-3588.
Füllgrabe, C., Berthommier, F., & Lorenzi, C. (2006). Masking release for consonant
features in temporally fluctuating background noise. Hearing Research, 211, 74-84.
Garcia Lecumberri, M. L., & Cooke, M. (2006). Effect of masker type on native and
non-native consonant perception in noise. Journal of the Acoustical Society of America,
119(4), 2445-2454.
Garcia Lecumberri, M. L., Cooke, M., & Cutler, A. (2010). Non-native speech
perception in adverse conditions: A review. Speech Communication, 52, 864-886.
Gaudrain, E. (2008). Rôle de la ségrégation séquentielle pour la séparation de voix
concurrentes. Thèse de doctorat en Acoustique. Université Lyon1 - Claude Bernard, Lyon,
France.
Gnansia, D., de Cheveigné, A., & Lorenzi, C. (2009). Intelligibilité dans le bruit et
démasquage de la parole chez les sujets normo-entendants, malentendants et implantés
cochléaires. Les Cahiers de l’Audition, 22(6), 9-42.
Goto, H. (1971). Auditory perception by normal Japanese adults of the sounds “l” and
“r”. Neuropsychologia, 9, 317-323.
Hallé, P. A., Best, C. T., & Levitt, A. (1999). Phonetic vs. phonological influences on
French listeners’ perception of American English approximants. Journal of Phonetics, 27,
281-306.
Hernandez, M., Costa, A., Fuentes, L. J., Vivas, A. B., Sebastian-Gallés, N. (2010). The
impact of bilingualism on the executive control and orienting networks of attention.
Bilingualism: Language and Cognition, 13(03), 315-325.
Hoen, M., Meunier, F., Grataloup, C., Pellegrino, F., Grimault, N., Perrin, F., Perrot, X.,
& Collet, L. (2007). Phonetic and lexical interferences in informational masking during
speech-in-speech comprehension. Speech communication, 49, 905-916.
Références
176
Howard-Jones, P. A., & Rosen, S. (1993a). The perception of speech in fluctuating
noise. Acustica, 78, 258-272.
Howard-Jones, P. A., & Rosen, S. (1993b). Uncomodulated glimpsing in
‘checkerboard’ noise. Journal of the Acoustical Society of America, 93, 2915-2922.
Iverson, P., Kuhl, P. K., Akahane-Yamada, R., Diesch, E., Tohkura, Y., Kettermann, A.,
& Siebert, C. (2003). A perceptual interference account of acquisition difficulties for non-
native phonemes. Cognition, 87, B47-B57.
Johnson, J. S., & Newport, E. L. (1989). Critical period effects in second language
learning: The influence of maturational state on the acquisition of English as a second
language. Cognitive Psychology, 21, 60-99.
Kidd, G. Jr., Mason, C. R., Rohtla, T. L., & Deliwala, P. S. (1998). Release from
masking due to spatial separation of sources in the identification of nonspeech auditory
patterns. Journal of the Acoustical Society of America, 104(1), 422-431.
Lenneberg, E. H. (1967). Biological Foundations of Language. New York: Wiley.
Lorenzi, C., Husson, M., Ardoint, M., & Debruille, X. (2006). Speech masking release
in listeners with flat hearing loss: Effects of masker fluctuation rate on identification scores
and phonetic feature reception. International Journal of Audiology, 45, 487-495.
Luce, P., Pisoni, D., & Goldinger, S. (1990). Similarity neighbourhoods of spoken
words. In G. Altmann (Ed.), Cognitive Models of Speech Perception: Psycholinguistic and
Computational Perspectives (pp 122-147). Cambridge, MA: MIT Press.
Maddison, I., Flavier, S., Marsico E. & Pellegrino, F. (2011). LAPSyD: Lyon-
Albuquerque Phonological Systems Databases. En ligne http://www.lapsyd.ddl.ish-
lyon.cnrs.fr/, consulté le 28 Octobre 2013.
Marian, V., & Spivey, M. (2003a). Bilingual and monolingual processing of competing
lexical items. Applied Psycholinguistics, 24, 173-193.
Marian, V., & Spivey, M. (2003b). Competing activation in bilingual language
processing: Within- and between-language competition. Bilingualism: Language and
Cognition, 6, 97-115.
Références
177
Marslen-Wilson, W. D. (1987). Functional parallelism in spoken word-recognition.
Cognition, 25, 71-102.
Marslen-Wilson, W. D. (1990). Activation, competition, and frequency in lexical
access. In G. T. M. Altmann (Ed.), Cognitive models of speech processing: Psycholinguistics
and Computational Perspectives (pp. 148–172). Cambridge, MA: MIT Press.
Marslen-Wilson, W. D., & Welsh, A. (1978). Processing interactions and lexical access
during word recognition in continuous speech. Cognitive Psychology, 10, 29-63.
Mayo, L. H., Florentine, M., & Buus, S. (1997). Age of second language acquisition
and perception of speech in noise. Journal of Speech, Language & Hearing Research, 40,
686-693.
McClelland, J. L., & Elman, J. L. (1986). The TRACE model of speech perception.
Cognitive Psychology, 18, 1-86.
McClelland, J. L., & Rumelhart, D. E. (1981). An interactive activation model of
context effects in letter perception: Part 1. An Account of Basic Findings. Psychological
Review, 88, 375-407.
Meador, D., Flege, J. E., & MacKay, I. R. A. (2000). Factors affecting the recognition
of words in a second language. Bilingualism: Language & Cogniton, 3, 55-67.
Meisel, J. M. (2004). The bilingual child. In T. K. Bhatia & W. C. Ritchie (Eds), The
handbook of bilingualism (pp. 91-113). Oxford: Blackwell Publishing Ltd.
Miller, G. A. (1947). The masking of speech. Psychological Bulletin, 44, 105-129.
Miller, G. A., & Licklider, J. C. A. (1950). The Intelligibility of interrupted speech.
Journal of the Acoustical Society of America, 22, 167-173.
Nazzi, T., Bertoncini, J., & Mehler, J. (1998). Language discrimination by newborns:
Towards an understanding of the role of rhythm. Journal of Experimental Psychology:
Human Perception and Performance, 24(3), 756-766.
Nazzi, T., Jusczyk, P. W., & Johnson, E. K. (2000). Language discrimination by
English-learning 5-month-olds: Effects of rhythm and familiarity. Journal of Memory and
Language, 43, 1-19.
Références
178
New, B., Pallier, C., Brysbaert, M. & Ferrand, L. (2004). Lexique 2: A new French
lexical database. Behavior Research Methods, Instruments, & Computers, 36(3), 516-524.
Nilsson, M., Soli, S. D., & Sullivan, J. A., (1994). Development of the hearing in noise
test for the measurement of speech reception thresholds in quiet and in noise. Journal of the
Acoustical Society of America, 95(2), 1085-1099.
Norris, D. (1994). Shortlist: A connectionist model of continuous speech recognition.
Cognition, 52, 189-234.
Pallier, C., Bosch, L., & Sebastian-Gallés, N. (1997). A limit on behavioral plasticity in
vowel acquisition. Cognition, 64, B9-B17.
Pallier, C., Colomé, A., & Sebastian-Gallés, N. (2001). The influence of native-
language phonology on lexical access: Exemplar-based versus abstract lexical entries.
Psychological Science, 12(6), 445-9.
Pallier, C., Dehaene, S., Poline, J. B., LeBihan, D., Argenti, A. M., Dupoux, E. &
Mehler, J. (2003). Brain imaging of language plasticity in Adults: Can a second language
replace the first? Cerebral Cortex, 13, 155-161.
Paradis, J. (2012). Cross-linguistic influence and code-switching. In B. Goldstein (Ed.),
Bilingual Language Development and Disorders in Spanish-English Speakers (2nd ed.) (pp
73-91). Baltimore: Brookes Publishing.
Paradis, J., & Genesee, F. (1996). Syntactic acquisition in bilingual children:
Autonomous or interdependent? Studies in Second Language Acquisition, 18, 1-25.
Paradis, J., Genesee, F., & Crago, M. (2011). Dual language development and
disorders: A handbook on bilingualism and second language learning (2nd Edition).
Baltimore, MD: Brookes.
Paradis, J., & Navarro, S. (2003). Subject realization and crosslinguistic interference in
the bilingual acquisition of Spanish and English. Journal of Child Language, 30, 371-393.
Payton, K. L., Uchanski, R. M., & Braida, L. D. (1994). Intelligibility of conversational
and clear speech in noise and reverberation for listeners with normal and impaired hearing.
Journal of the Acoustical Society of America, 95(3), 1581-1592.
Références
179
Pérez-Vidal, C. (2011). Language acquisition in three different contexts of learning:
Formal instruction, Study Abroad and Semi-immersion (CLIL). In Y. Ruiz de Zarobe, J. M.
Sierra & F. Gallardo del Puerto (Eds.), Content and Foreign Language Integrated Learning:
Contributions to Multilingualism in European Contexts (pp. 25-35). Bern/Berlin: Peter Lang.
Pollack, I. (1975). Auditory informational masking. Journal of the Acoustical Society of
America, 57, S5.
Ramus, F. (1999a). Rythme des langues et acquisition du langage. Thèse de doctorat.
EHESS, Paris, France.
Ramus, F., Nespor, M. & Mehler. J. (1999b). Correlates of linguistic rhythm in the
speech signal. Cognition, 73, 265-292.
Reel, L. A., & Hicks, C. B. (2012). Selective auditory attention in adults: Effects of
rhythmic structure of the competing language. Journal of Speech, Language & Hearing
Research, 55(1), 89-104.
Rhebergen, K. S., Versfeld, N. J., & Dreschler, W. A. (2005). Release from
informational masking by time reversal of native and non-native interfering speech. Journal
of the Acoustical Society of America, 118(3), 1274-1277.
Rhebergen, K. S., Versfeld, N. J., & Dreschler, W. A. (2006). Extended speech
intelligibility index for the prediction of the speech reception threshold in fluctuating noise.
Journal of the Acoustical Society of America, 120(6), 3988-3997.
Rogers, C. L., Lister, J. J., Febo, D. M., Besing, J. M., & Abrams, H. B. (2006). Effects
of bilingualism, noise, and reverberation on speech perception by listeners with normal
hearing. Applied Psycholinguistics, 27, 465-485.
Rosen, S. (1992). Temporal information in speech: Acoustic, auditory and linguistic
aspects. Philosophical Transactions: Biological Sciences, 336(1278), 367-373.
Sebastian-Gallés, N., & Soto-Faraco, S. (1999). On-line processing of native and non-
native phonemic contrasts in early bilinguals. Cognition, 72(2), 112-123.
Schouten, M. E. H. (1975). Native-language interference in the perception of second-
language vowels: An investigation of certain aspects of the acquisition of a second language.
Unpublished doctoral dissertation, Utrecht University, The Netherlands.
Références
180
Simpson, S. A., & Cook, M. (2005). Consonant identification in N-talker babble is a
nonmonotonic function of N. Journal of the Acoustical Society of America, 118(5), 2775-
2778.
Spivey, M., & Marian, V. (1999). Cross talk between native and second languages:
partial activation of an irrelevant lexicon. Psychological Science, 10, 281-284.
Strange, W. (1995). Speech Perception and Linguistic Experience: Issues in Cross-
Language Research. Timonium, MD: York Press.
Strange, W., & Dittmann, S. (1984). Effects of discrimination training on the perception
of /r-l/ by Japanese adults learning English. Perception & Psychophysics, 36(2), 131-145.
Studebaker, G. A. (1985). A “rationalized” arcsine transform. Journal of Speech and
Hearing Research, 28(3), 455-462.
Summers, V., & Leek, M. R. (1998). F0 processing and the separation of competing
speech signals by listeners with normal hearing and with hearing loss. Journal of Speech,
Language & Hearing Research, 41(6), 1294-306.
Taft, M., & Hambly, G. (1986). Exploring the Cohort Model of spoken word
recognition. Cognition, 22, 259-282.
Vaissière, J. (2006). La phonétique. Paris : Presses Universitaires de France.
Van Engen, K. J. (2010). Similarity and familiarity: Second language sentence
recognition in first- and second-language multi-talker babble. Speech Communication, 52,
943-953.
Van Engen, K. J., & Bradlow, A. R. (2007). Sentence recognition in native- and
foreign-language multi-talker background noise. Journal of the Acoustical Society of America,
121(1), 519-526.
Weber, A., & Broersma, M. (2012). Spoken word recognition in second language
acquisition. In C. A. Chapelle (Ed.), The Encyclopedia of Applied Linguistics. Bognor Regis:
Wiley-Blackwell.
Weber, A., & Cutler, A. (2004). Lexical competition in non-native spoken-word
recognition. Journal of Memory and Language, 50, 1-25.
181
ANNEXES
Annexes
182
ANNEXE 1 : Matériel expérimental de l’Expérience 1
Mots cibles utilisés dans l’Expérience 1.
Entraînement
bémol
carie
coiffeur
jardin
manteau
nageur
pavé
rabot
Phase test
balai château juron purée
ballon chaton képi radeau
bandit chemin lacet radis
baquet cheveu lagon raisin
bateau chevreau laitue raison
bâton chiffon landau rallye
beignet climat leçon râteau
bévue cobra loquet ravin
bidet côté lundi rebond
bijou couffin matin réseau
bison crapaud médias rotin
blaireau crédit mégot ruban
blouson débit menton sachet
bonnet défi nougat safran
bouchon dragée palet salon
boulon dragon parent sirop
bouton faisan pari sosie
buffet félin pâté stylo
cabri filet patin taureau
cachet frelon pichet tiret
cachot furet pigeon torrent
caddie galet pinson tricot
cadeau gallon piquet trognon
café garrot plateau troupeau
cageot gâteau poney trousseau
caisson genou poteau tunnel
câlin gigot poulet vallée
canaux grelot poumon vallon
carton guenon prairie venin
chaînon jambon projet verrou
chalet javelot pruneau vessie
chameau jeton puma wagon
Annexes
183
ANNEXE 2 : Matériel expérimental de l’Expérience 2
Mots cibles utilisés dans l’Expérience 2.
Entraînement
bateau
chameau
filet
lundi
raison
venin
Phase test
ballon debit poteau
bandit dragee poulet
bemol dragon projet
bevue faisan pruneau
bidet galet puree
bijou gallon rabot
bison garrot radis
blouson gateau raisin
bonnet grelot rallye
bouchon guenon rateau
caddie kepi ravin
cafe lagon reseau
caisson laitue rotin
calin landau ruban
canaux manteau safran
carie medias salon
carton nageur sirop
chainon parent sosie
chalet pari stylo
chaton patin tiret
chemin pichet torrent
cheveu pigeon tricot
chevreau pinson trousseau
chiffon piquet tunnel
climat plateau vallee
coiffeur poney wagon
Annexes
184
ANNEXE 3 : Matériel expérimental des Expériences 3 à 6
Mots cibles utilisés dans les Expériences 3 à 6.
Entraînement
bateau
filet
raison
Phase test
ballon debit poteau
bandit dragee poulet
bemol dragon projet
bevue faisan pruneau
bidet galet puree
bijou gallon rabot
bison garrot radis
blouson gateau raisin
bonnet grelot rallye
bouchon guenon rateau
caddie kepi ravin
cafe lagon reseau
caisson laitue rotin
calin landau ruban
canaux manteau safran
carie medias salon
carton nageur sirop
chainon parent sosie
chalet pari stylo
chaton patin tiret
chemin pichet torrent
cheveu pigeon tricot
chevreau pinson trousseau
chiffon piquet tunnel
climat plateau vallee
coiffeur poney wagon
Annexes
185
ANNEXE 4 : Matériel expérimental des Expériences 3 à 6 (suite)
Pseudo-mots cibles utilisés dans les Expériences 3 à 6.
Entraînement
fuquet
jateau
trouri
Phase test
bameau deteau pouson
banton drason prodia
bason draton puga
bedit fiton punon
bife gacon puteau
bilon gafi racot
blougeot gassie rafin
bocher keron railee
boumol lalo raiteau
bouteau landi rapaud
cagon lasin rasie
cailon leret remon
callye lobra ruquet
cannet luncet sagot
carjou manrie sarop
carrent mefran sigon
caton menvin tignet
chadi paseau trifin
chaison paton trolet
chanin patue trouchet
chebri piret tusan
cherent pirie vadeau
coveu platin vegnon
crallon pogeon vellon
crelai polet veree
demat pouchot wateau
Annexes
186
ANNEXE 5 : Liste des Tableaux
1) Tableaux de la Partie Théorique
Tableau 1 : Principales caractéristiques des modèles psycholinguistiques présentés.
Tableau 2 : Conditions expérimentales présentées aux quatre groupes de participants dans
l’étude de Van Engen & Bradlow (2007).
Tableau 3 : Récapitulatif des études présentées ayant manipulé la langue des masqueurs
paroliers.
2) Tableaux de la Partie Expérimentale
Tableau 4 : Pourcentages moyens de retranscriptions correctes des mots cibles français
obtenus dans chacune des huit conditions expérimentales. Les écart-types sont également
indiqués.
Tableau 5 : Principales caractéristiques des trois langues manipulées dans l’Expérience 2.
Tableau 6 : Pourcentages moyens de retranscriptions correctes des mots cibles français
obtenus dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Tableau 7 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement
identifiés dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Tableau 8 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions
expérimentales. Les écart-types sont également indiqués.
Tableau 9 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement
identifiés dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Tableau 10 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions
expérimentales. Les écart-types sont également indiqués.
Tableau 11 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement
identifiés dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Tableau 12 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions
expérimentales. Les écart-types sont également indiqués.
Annexes
187
Tableaux 13 et 14 : Temps de réaction moyens (en ms) obtenus pour les mots cibles
correctement identifiés dans chacune des six conditions expérimentales, pour les participants
monolingues français (Tableau 13) et pour les participants français parlant l’italien en L2
(Tableau 14). Les écart-types sont également indiqués.
Tableau 15 : Temps de réaction moyens (en ms) obtenus pour les mots cibles correctement
identifiés dans chacune des six conditions expérimentales. Les écart-types sont également
indiqués.
Tableau 16 : Pourcentages moyens d’erreurs obtenus dans chacune des six conditions
expérimentales. Les écart-types sont également indiqués.
Tableaux 17 et 18 : Temps de réaction moyens (en ms) obtenus pour les mots cibles
correctement identifiés dans chacune des six conditions expérimentales, pour les participants
natifs du français (Tableau 17) et pour les participants natifs de l’italien (Tableau 18). Les
écart-types sont également indiqués.
Annexes
188
ANNEXE 6 : Liste des Figures
1) Figures de la Partie Théorique
Figure 1 : Représentation schématique du modèle TRACE (McClelland & Elman, 1986).
(Extraite de Frauenfelder, 1996).
Figure 2 : Pourcentages d’identifications correctes des consonnes cibles, pour les masqueurs
paroliers (« natural babble ») et les masqueurs de bruit fluctuant (« babble-modulated
noise »), en fonction du nombre de locuteurs. (Extraite de Simpson & Cooke, 2005).
Figure 3 : Figure illustrant les trois conditions d’écoute testées dans l’étude de Dole et al.
(2012) : monaurale, dichotique et spatialisée. (Extraite de Dole et al., 2012).
Figure 4 : Niveau de démasquage obtenu en fonction du Rapport Signal sur Bruit (« SNR »
en dB). (Extraite de Miller & Licklider, 1950).
Figure 5 : Figure représentant un signal de parole (en bleu) inséré dans un bruit stationnaire
(en rouge à gauche) ou dans un bruit fluctuant (en rouge à droite). (Extraite de Fleuriot,
Garnier & Lorenzi, 2007).
Figure 6 : Taux de retranscriptions correctes obtenus avec les trois types de masqueurs : du
bruit stationnaire (« BBN » pour « stationary broadband noise »), du bruit fluctuant
(« SN » pour « fluctuating speech-shaped noise »), des masqueurs paroliers (« Cock » pour
« Cocktail noise »). (Extraite de Dole et al., 2009).
Figure 7 : Pourcentages de fixations envers l’objet cible (« English target (kitten) »), l’objet
compétiteur (« Dutch compétiteur (kist) ») et les objets distracteurs (« Distractor (flower) »),
en fonction du temps (en ms). Le graphique (a) représente les résultats des participants natifs
du néerlandais qui parlent l’anglais comme L2 ; le graphique (b), les résultats des participants
anglais monolingues. (Extraite de Weber & Cutler, 2004).
Figure 8 : Pourcentages d’identifications correctes des consonnes cibles présentées : dans le
silence (« quiet »), en présence des masqueurs paroliers à un locuteur natif de l’anglais
(« english ») ou de l’espagnol (« spanish »), avec du bruit stationnaire (« ssn »), et des
masqueurs paroliers anglais à 8 locuteurs (« babble »). Les performances des participants
anglais monolingues sont indiquées par la lettre N, celles des participants natifs de l’espagnol
qui parlent anglais en L2 par les lettres NN. (Extraite de Garcia Lecumberri & Cooke, 2006).
Figure 9 : Pourcentages d’identifications correctes des mots cibles en présence des
masqueurs paroliers à 1 locuteur identique à celui des phrases cibles (« same talker »),
différent mais de même sexe (« same gender »), de sexe différent (« different gender »). La
lettre N est utilisée pour les performances des participants natifs de l’anglais, et les lettres NN
pour les participants natifs de l’espagnol. (Extraite de Cooke et al., 2008).
Annexes
189
Figure 10 : Valeurs de RSB nécessaires à 50% d’identifications correctes des phrases cibles,
pour les participants natifs de l’anglais (« English listeners ») et natifs du mandarin
(« Mandarin listeners »). (Extraite de Van Engen, 2010).
Figure 11 : Pourcentages de mots cibles correctement identifiés en présence des masqueurs
paroliers anglais (« English babble ») et mandarins (« Mandarin babble »), pour les quatre
valeurs de HINT sélectionnées. Les performances des participants natifs de l’anglais sont
reportées à gauche, celles des participants natifs du mandarin à droite. (Extraite de Van
Engen, 2010).
2) Figures de la Partie Expérimentale
Figure 12 : Mot cible inséré à 2,5 sec dans un masqueur parolier de 4 sec à 4 voix (deux
femmes et deux hommes).
Figure 13 : Effet de la Langue des masqueurs paroliers (français et gaélique irlandais) sur les
pourcentages moyens de retranscriptions correctes des mots cibles en fonction du RSB (-5 dB
et 0 dB). Les erreurs standard ont été reportées. Le symbole ‘ * ’ signale une différence
significative entre les masqueurs paroliers français et irlandais à -5 dB ainsi qu’à 0 dB.
Figure 14 : Spectrogrammes d'un masqueur parolier composé de quatre locuteurs (à gauche)
et de sa forme resynthétisée en bruit fluctuant (à droite). (Figures réalisées à l'aide du logiciel
Adobe Audition 3.0).
Figure 15 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les
pourcentages moyens de retranscriptions correctes des mots cibles à -5 dB, en fonction de la
Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont reportées. Le
symbole ‘ * ’ indique une différence significative entre les deux types de bruits (parole et
bruit fluctuant) pour l’irlandais, l’italien et le français. Des différences significatives sont
également présentes entre les masqueurs paroliers irlandais et italiens, ainsi qu’entre les
masqueurs paroliers irlandais et français. Pour la clarté, la différence significative entre les
masqueurs de bruit fluctuant irlandais et français et celle entre les masqueurs de bruit
fluctuant irlandais et italiens ne figurent pas sur le graphique.
Figure 16 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, en fonction de la Langue des masqueurs (irlandais, italien et
français). Les erreurs standard sont reportées. Le symbole ‘ * ’ indique une différence
significative entre les deux types de bruits (parole et bruit fluctuant) pour le français. Des
différences significatives sont également présentes entre les masqueurs paroliers irlandais et
italiens, ainsi qu’entre les masqueurs paroliers irlandais et français. Figure 17 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à 0 dB, en fonction de la Langue des masqueurs (irlandais, italien et français).
Les erreurs standard sont reportées. Le symbole ‘ * ’ indique une différence significative entre
les masqueurs paroliers irlandais et français.
Figure 18 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, pour les participants natifs du français parlant l’italien en L2, en
Annexes
190
fonction de la Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont
reportées. Le symbole ‘ * ’ indique une différence significative entre les deux types de bruits
(parole et bruit fluctuant) pour l’italien et le français. Des différences significatives sont
également présentes entre les masqueurs paroliers irlandais et italiens, ainsi qu’entre les
masqueurs paroliers italiens et français.
Figure 19 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, pour les participants monolingues français (Expérience 3) et pour les
participants natifs du français parlant l’italien en L2 (Expérience 5), en fonction de la Langue
des masqueurs (irlandais, italien et français). Les erreurs standard sont reportées. Le symbole
‘ * ’ indique une différence significative entre les deux types de bruits (parole et bruit
fluctuant) pour l’italien (Expérience 5) et pour le français (Expériences 3 & 5). Les TRs
moyens obtenus avec les masqueurs paroliers italiens dans l’Expérience 5 sont indiqués en
vert, ils sont significativement différents de ceux obtenus dans l’Expérience 3 pour la même
condition expérimentale.
Figure 20 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, pour les participants natifs de l’italien parlant le français en L2, en
fonction de la Langue des masqueurs (irlandais, italien et français). Les erreurs standard sont
reportées. Le symbole ‘ * ’ indique une différence significative entre les deux types de bruits
(parole et bruit fluctuant) pour l’italien et une différence tendancielle pour le français. Des
différences significatives sont également présentes entre les masqueurs paroliers irlandais et
italiens, ainsi qu’entre les masqueurs paroliers irlandais et français.
Figure 21 : Effet du Type de bruit dans le masqueur (parole et bruit fluctuant) sur les TRs
moyens (en ms) à -5 dB, pour les participants natifs du français de l’Expérience 5 (appellation
« Natif Fr ») et pour les participants natifs de l’italien de l’Expérience 6 (appellation « Natif It
»), en fonction de la Langue des masqueurs (irlandais, italien et français). Le symbole ‘ * ’
indique une différence significative entre les deux types de bruits (parole et bruit fluctuant)
pour l’italien et pour le français (Expériences 5 & 6). Pour plus de clarté, nous n’avons pas
indiqué les différences significatives présentes entre les deux groupes de participants pour
chacune des six conditions expérimentales.