L’analyse en unités de base du discours – pourquoi et comment
Liesbeth Degand, Anne Catherine Simon
Problématique: unités syntaxiques, unités prosodiques et … unités de base du discours
H1 Les BDU sont les étapes de production et de traitement du discours (fonction cognitive) (van Dijk 1997; Berrendonner 2004)
H2 Ni la complétude syntaxique (Roulet 1991), ni la complétude prosodique (Chafe 1994) n'est une condition suffisante pour délimiter une BDU (Halford 1996, Selting 2000)
H2' Il existe différents types de BDU selon la manière dont syntaxe et prosodie sont conformées
H3 Les types de BDU se distribuent différemment selon les genres de discours
H3' Les types de BDU correspondent à des stratégies discursives
Plan de la contribution
1. Principes d'analyse et méthodologie
2. Annotation prosodique, et discussion
3. Annotation syntaxique, et discussion
4. Les BDU dans le corpus Anita Musso
5. Discussion
Remerciements
Anne Dister, Jean-Philippe Goldman, Piet Mertens, Hubert Naets, Jean-Denis Spinel
1. Principes d'analyse et méthodologie
• analyse et annotation autonomes des niveaux syntaxique et prosodique
• la mise en relation des 2 niveaux génère un niveau spécifique qui correspond à l'organisation proprement discursive
Outils
• fichier d'annotation (TEXTGRID) + fichier son (WAV)
• automatisation (scripts)– alignement (phones, syll, words) du texte au son (Goldman)
– pré-détection des frontières intonatives (Mertens&Simon)
– mise en relation des niveaux d'annotation– description quantifiée
• annotation manuelle– unités de rection, séquences fonctionnelles– validation des frontières intonatives
2. Annotation prosodique
Unités prosodiques majeures (///), intermédiaires (//) et mineures (/)
• alternance des tours et critères acoustiques (Lacheret-Dujour & Victorri 2002; Simon et al. 2008)
• automatisation de l'annotation (Mertens&Simon): 85.5% des frontières détectées (score inférieur sur la conversation)
majeure - changement de locuteur
- pause silencieuse > 200 ms- non précédée d'une marque
d'hésitation
- ou dur rel > 3- ou montée mélodique > 10 ST- ou contour de finalité
///
intermédiaire - dur rel > 2- ou f0 rise (intrasyll) > 4 ST- ou f0 moyenne > 5 ST
//
mineure - syll dur > 40 ms- et dur rel > 1.5- (légère montée mélodique)
/
2. Annotation prosodique, discussion
• non-fiabilité d'une approche tout automatique aujourd'hui– problèmes de traitement acoustique– difficulté de poser des seuils (adaptation au locuteur,
pondération, etc.)
• subjectivité du travail (de validation) de l'annotation
• dans notre annotation, pas (encore) de statut spécifique pour les contours de finalité (de type B-B-)
2. Annotation prosodique, discussion
Exemples• montée + écart mélodiques marqués, sans pause
niveau // réinterprété en niveau ///
2. Annotation prosodique, discussion
Exemples• frontière /// recatégorisée en hesi
2. Annotation prosodique, discussion
Exemples• contour descendant de finalité niveau ///
(difficile à modéliser et à détecter automatiquement)
3. Annotation syntaxique, unités de rection
• Une UR est organisée autour d’un noyau (en général un verbe tensé)
• Une UR est composée du verbe (nom) recteur et des éléments régis par celui-ci
• Les éléments non régis entrent linéairement dans la composition d’une urc+
urc unité de rection complète
uri unité de rection inachevée
ura unité de rection averbale
ure unité de rection elliptique
urc+ unité incluant un élément non régi
Exemples d'unités de rection
URC <parce que> [(je pense) (que je suis très malade)]
URI [(faudrait je)] URE [(il y a) (un côté de facilité de passer devant sa
voiture)] <et> [(de se dire)]
URA [(sur ce domaine) (oui)]URC+ [(comme) (j’ai jamais fait quasi de vélo) (de ma vie)
<euh> (en tant que vraie parisienne et en étant très peu partie à la campagne) (je suis pas pas très à l’aise)]
[(il faut) (quand même)md (me mettre) (des limites)]
3. Annotation syntaxique, séquences
• séquences maximales « qui représentent les constituants fonctionnels rencontrés dans les textes sans entrer dans le détail de leur composition » (Bilger & Campione 2002: 118)
• toute séquence peut faire l’objet – d’expansions: liste, adjectif, participe passé, relative, etc. – de mise en dispositif (extraction, binarisation, pseudoclivée…)
SS séquence sujet
SV séquence verbe
SO séquence objet
SR séquence rection
SA adjoint
insert unité de rection qui interrompt une unité en cours
Exemples de séquences
<parce que>md [(je pense)SV (que je suis très malade)SO]
<à mon avis>A [(c’est pas très malin)SV]
[(il faut)SV (quand même)md (me mettre)SV-suite (des limites)SO (pour m’empêcher de prendre la voiture)SRd]
3. Annotation syntaxique, remarques
• les adverbes de modalité, marqueurs de discours (y compris les connecteurs) et hésitations sont annotés au niveau des séquences
• au niveau des unités de rection, ils sont "sortis" uniquement lorsqu'ils se situent entre deux unités de rection, sinon ils restent intégrés dans une URC+
3. Annotation syntaxique, discussion
3.1. Séquences régie / adjoint
• je suis pour en rentrant dans un processus que je n’aime pas trop vis-à-vis de moi(SV) (SRd) ou (SV) (A)
• je le sais que je suis perdante(SV) (A) ou (SV) (SRd), parce que tous les auteurs ne s'accordent pas sur le caractère (non) régi des "doubles marquages à droite"
3. Annotation syntaxique, discussion
3.2. URI ou URC avec autoréparation?
• un cas clair d'URI[(faudrait je)] [(c'est une habitude) (en tous cas) (que j’aimerais changer)]
• URC avec autoréparation?<euh> [(il y a) (quand même)]URI? [(il y a il y a) (des sous) (sur le compte)]
[(il faut me mettre) (des li)] [(il faut) (quand même) (me mettre) (des limites) (pour … )]
[(elles)] <non> <non> [(elles ont tendance à)] <hum> <non> <non> [(elles adorent marcher)]
3. Annotation syntaxique, discussion
3.3. Présence/absence du "que" et conséquence sur l'analyse • présence de "que"
[(c'est une habitude)SS (en tous cas)md (que j’aimerais changer)SV]urc+ (dispositif, insert)
[(je pense)SV (que je suis très malade)SO]urc
• absence de "que"[(je me conditionne) (dans mon appartement) (en me disant)]urc [(j’y vais à pied)]urc
[(sur le coup) (je me dis)]urc [(je vais mettre) (cinq minutes)]urc
4. Les BDU dans le corpus Anita Musso
Types de BDU (Degand & Simon 2009)
• BDU-c congruente: une unité de rection correspond à une unité prosodique majeure
• BDU-s groupée par la syntaxe: plusieurs unités prosodiques majeures correspondent à une unité de rection
• BDU-i groupée par l'intonation: plusieurs unités de rection correspondent à une unité prosodique majeure
• BDU-a adjoint: un élément non régi est autonomisé dans une unité prosodique majeure
• BDU-x mixtes
4.1. Illustrations dans le corpus
BDU-C [(combien de fois) (ça m’est arrivé///)]
BDU-S [(je suis pour///) (en rentrant// dans un processus que je n’aime pas trop vis-à-vis de moi///)]
BDU-I [(moi)] [(ma voiture)] [(elle est garée) (dans la rue//)] [(j’ai) (un stationnement résident///)]
BDU-A <c’est-à-dire que///>
BDU-X [(sur le coup///) (je me dis//)] [(je vais mettre) (cinq minutes///)]
4.2. Distribution des types de BDU
Distribution des types de BDU
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
politique journal radio conférence conversation Musso
BDU a
BDU x
BDU i
BDU s
BDU c
4.3. Description quantifiée des unités
Genre politiquejournal
radio conférence conversation Musso
# tokens/BDU
16.9 20.5 26.7 16.2 15.9
(11.1) (12,3) (17.8) (11.1) (11.5)
# tokens/ u. rection
15.6 16.7 15.1 6.2 6.2
(11.1) (11.3) (13.7) (6.3) (5.3)
# tokens/ séquence
6 5.6 6.9 3.6 3.3
(7.1) (6) (9.3) (3.2) (2.58)
# séquences/BDU 1.1 1.2 1.7 2.4 2.3
5. Discussion, structure interne des BDU
Les types de BDU correspondent à des stratégies discursives
• BDU-C: présentation de l'information d'une manière directe et relativement neutre
• BDU-I: créer une macro-unité informationnelle• BDU-S: style emphatique; style didactique; planification
discursive • BDU-A: régulation (interactionnelle ou métadiscursive)
5. Discussion, unités régulatives
Selon Chafe (1994: 64), les regulatory units régulent le développement du discours, au niveau interactionnel, modal ou textuel (métadiscours)
A quoi correspondent les regulatory units dans notre typologie?
• les BDU-a• Les URI internes à des BDU leur donnent-elles un statut
spécifique? En d'autres termes, faut-il distinguer les BDU formées d'URC/URE de celles formées d'URI?
5. Discussion, enchainement entre BDU
Hypothèses• il existe des relations de cohérence d'une nature spécifique
entre BDU – telles qu'on peut les décrire dans un modèle de la structure du discours (RST, modèle genevois)
• les BDU sont les empans d'interprétation pour construire le modèle du texte et le modèle de la situation (Van Dijk)
Merci de votre attention!