Upload
toinette-bresson
View
105
Download
0
Embed Size (px)
Citation preview
1
Traitement des sons de parole(5)
Catégorisation
et
Accès au lexique
2
Segmentation du flux acoustique
La parole forme un flux sonore continu qu’il est nécessaire de segmenter en phonèmes, en syllabes, en mots
3
Catégorisation des sons de parole
• La langue française comporte environ 37 phonèmes (15 voyelles, 19 consonnes et 3 semi-consonnes). La réalisation acoustique de ces phonèmes est très variable d’où la nécessité pour le système auditif de catégoriser, c’est-à-dire de ramener une grande variation de productions vocales à un nombre de classes restreint.
• On appelle phones ou allophones les réalisations acoustiques des sons de parole (phonétique). Les paramètres acoustiques et phonétiques des sons de paroles sont continus.
• On appelle phonèmes les catégories distinctives d’une langue (phonologie). Dans le domaine de la phonologie, les sons de paroles constituent des catégories discrètes.
• Catégoriser c’est donc introduire une discontinuité perceptive dans un continuum physique.
4
Lieux d’articulation
5
Développement de la perception des sons de parole
Eimas et al. (1971) paradigme d’habituation.
Comme celle de l’adulte, la perception des bébés est catégorielle. A 6 mois, les bébés catégorisent correctement un contraste phonétique anglais ou hindi. A 11-13 mois (ou adulte) ils catégorisent correctement le contraste de leur langue.
anglais
hindi
6
Parole et apprentissage• L'apprentissage du langage par les nourrissons est grandement facilité
par leurs remarquables capacités perceptives : par exemple, ils sont capables de distinguer dès la naissance un grand nombre de contrastes phonétiques (comme /ba/ et /pa/), et sont également capables de distinguer.différentes langues, si elles ont des structures rythmiques différentes.
• Des singes (tamarins) manifestent les mêmes performances discriminatives des sons de parole Language discrimination by human newborns and by cotton-top tamarin monkeys, Franck Ramus, Marc D.Hauser, Cory Miller, Dylan Morris, Jacques Mehler, Science, 2000, 288(5464), 349-351.
• Cependant, il n’est pas attesté que les discrimination des deux espèces se font sur les mêmes indices acoustiques.
• Le traitement des sons de parole se spécifie par la familiarisation avec la langue maternelle qui affecte déjà le babillage (de Boysson-Bardies B. (1996) Comment la parole vient aux enfants. Paris, Ed. Odile Jacob.
7
Le Temps d’Attaque vocalVoice Onset Time = VOT
http://www.ac.wwu.edu/~mseilo/c573/unit7/VOT.PDF
Lorsque on prononce des syllabes (CV) contrastant un son voisé et un son non voisé comme /ba/ vs. /pa/ on peut, avec des sons synthétiques faire varier de manière continue le délai de voisement de la voyelle.
http://www1.ldc.lu.se/logopedi/department/andy/Perturbations/VOT.html
"En pil"
"En bil"
ba pa
da ta
ga ka
Le VOT est l’intervalle temporel séparant le relâchement de l’air lors de la prononciation de la consonne et le début du voisement de la voyelle
8
Le contraste /ba/ - /pa/en anglais
9
• Le VOT peut être négatif, nul ou positif.• Il est nul quand le début de la vibration des cordes vocales est synchrone avec
l’explosion consonantique• Il est positif quand la vibration commence après le relâchement des articulateurs• Il est négatif quand la vibration commence avant le relâchement des articulateurs
Anglais Français
/pa/
/ba/
10
voyelle
11
consonne
http://www.bsos.umd.edu/hesp/newman/Newman_classes/Newman300/webpages/categperc.htm
12
13
Catégorisation dans la langue seconde
/é/ /è/
Comparaison de la catégorisation d’un contraste phonétique existant en catalan et pas en espagnol
Ces données indiquent que l'exposition même précoce à une seconde langue n'est pas suffisante pour en maîtriser parfaitement le système phonologique. Elles révèlent que les représentations phonologiques, une fois mises en place, sont peu plastiques même à un très jeune âge.
Pallier, C., Bosch, L., & Sebastian-Gallés, N. (1997) A limit on behavioral plasticity in speech perception. Cognition, 64(3), B9-B17.
14
La syllabe
• Les mots ne sont une somme de phonèmes, ils ont, au moins dans certaines langues comme le français, une structure syllabique.
• Tâche de détection d’un phonème avec mesure des temps de réaction. Le mot contient-il (oui ou non) le phonème /p/ ?
capture caprice
Le TR sera plus court dans le cas de capture que dans le cas de caprice car dans le premier cas le phonème cible appartient à la première syllabe et dans le second à la seconde syllabe
15
Le lexique mental
• Définition : c’est l’ensemble des mots d’une langue possédé par un individu
• Plusieurs questions :
Format : phonologique, orthographique ?
Structure : alphabétique, fréquentielle, multidimensionnel ?
Accès : différentes théories
Paradigme expérimental : la décision lexicale
présentation écrite pour un bon contrôle de la durée de présentation. Elle suppose transcodage graphème-phonème
16
Décision lexicale
Des chaînes de caractères sont présentées brièvement sur l’écran. Le sujet doit décider le plus rapidement possible s’il s’agit de mots de sa langue ou de non-mots. Le pourcentage de réponses correctes et le temps de réaction sont mesurés.
Les mots sont sélectionnés de manière à tester une hypothèse spécifique, par exemple l’effet de la fréquence de ces mots dans la langue.
Les non-mots sont fabriqués selon des règles précises :
- tirage au hasard des lettres
- respect de la fréquence des digrammes
- prononciabilité
- etc.
chetchatctoh
http://grove.ufl.edu/~tomomi/Intro/Lecture27/sld005.htm
17
580600620640660680700720740
reac
tion
tim
e (m
s)
High Prob Low Prob
Lexical Decision
WordNonWord
mot
non-mot
Tem
ps
de
Ré
acti
on
(m
s)
Rôle des non-mots
• Lettres au hasard : TRmot > TRnon-mot
baton - tbonw
Non-mot prononçables : TRmot < TRnon-mot
baton - badon
Pour des présentations auditives, les non-mots sont nécessairement prononçables !
babel.ling.nwu.edu/~lidz/teaching/ cogsci210/processing.ppt
18
Effet de la fréquence des mots
1 2 3 4 5 6
Frequency Category (Frequent -- Infrequent)
Behavioral Data: Reaction Time
Categories (n/Million):
1: 7002: 1403: 30 4: 6 5: 1 6: .2
Temps de Réaction (ms)
babel.ling.nwu.edu/~lidz/teaching/ cogsci210/processing.ppt
Catégories de fréquences des mots
Tem
ps
de R
éact
ion
« m
ots
»
19
Modèles d’accès au lexique
• Modèle LAFS de Klatt (1988) lexical access from spectra
• Modèle de cohorte Marslen-Wilson
• Modèle de Trace de McClelland et Elman
20
LAFS Klatt• Le lexique mental serait constitué
des traces des spectres de fréquence des mots prononcés
• La procédure de reconnaissance consisterait en un appariement du spectre actuel du mot entendu avec la trace mnésique du spectre
• Il y aurait accès direct au lexique sans segmentation ni catégorisation
« four scores and seven years ago »
21
Modèle de CohorteMarslen-Wilson
table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire
« vo-
table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire
table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire
table chaise chien moineau éléphant vocable vote vocal vocalise volage vocation volant vocabulaire
« vo-ca« vo-ca-bu« vo-ca-bu-laire
L'information acoustique et phonétique arrive séquentiellement. Un mot isolé ne peut être identifié qu'à partir du moment où il est seul compatible
avec l'information déjà disponible.
Les premières syllabes activent la cohorte des mots candidats les comprenant. Plus il y a de syllabes prononcées, plus la cohorte se rétrécit. Le mot peut être reconnu avant qu’il ait fini d’être prononcé. Le point d’identification est la fin de la syllabe qui ne laisse plus qu’un seul candidat.
Exemple : le mot « vocabulaire »
Point d’identification
Lexique Mental
22
Modèle TraceMcClelland et Elman (1986)
C’est un modèle de type connexionniste qui distingue trois grandes étapes de traitement : les traits (graphiques ou acoustiques), les lettres ou les phonèmes et enfin les mots. Il s’agit d’un modèle interactif, à la fois ascendant et descendant.
Exemple avec mot : « MOVE »
Etape 1: activation des traits graphiques ou acoustiques contenus dans le stimulus et inhibition des autres
Etape 2 : activation des lettres ou des phonèmes contenus dans le mot et inhibition des autres
Etape 3 : activation des mots contenant les mêmes lettres ou les mêmes phonèmes et inhibition des autres
23
Conclusions
La perception des sons de parole est un exemple des mécanismes de traitement de l’information. Ceci implique une série d’étapes de traitements:
- traitements acoustiques
- traitements phonétiques (surtout articulatoires )
- traitements phonémiques
- accès au lexique
A chaque étape, divers traitements peuvent s’effectuer en parallèle