Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Introduction Approches et Classifications Données Notions proches Ailleurs
Reformulations et paraphrasesSéminaire M1/M2 Sciences du Langage
Natalia Grabarhttp://natalia.grabar.perso.sfr.fr/
CNRS STL UMR8163
2013-2014
1/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Déroulement du cours
1 12 heures, travaux théoriques et pratiques
21 jan, 28 jan, 4 fév, 11 fév, ?séminaire partagé avec F Tayalati (+ 12h)
2 Travail avec les documents et les données linguistiques
en français, anglais...
3 Lecture d’articles
4 Contrôle continu
2/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Plan du cours
1 Introduction
2 Approches et Classifications
3 Données
4 Notions proches
5 Ailleurs
3/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Dire la même chose autrement
1 Il est ici depuis 2 heures
2
3
4
5
6
4/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Dire la même chose autrement
1 Il est ici depuis 2 heures
2 La route a été déviée par la gendarmerie
3
4
5
6
5/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Dire la même chose autrement
1 Il est ici depuis 2 heures
2 La route a été déviée par la gendarmerie
3 Pierre est respecté par tout le monde
4
5
6
6/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Dire la même chose autrement
1 Il est ici depuis 2 heures
2 La route a été déviée par la gendarmerie
3 Pierre est respecté par tout le monde
4 De battre mon coeur s’est arrêté
5
6
7/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Dire la même chose autrement
1 Il est ici depuis 2 heures
2 La route a été déviée par la gendarmerie
3 Pierre est respecté par tout le monde
4 De battre mon coeur s’est arrêté
5 carré
6
8/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Dire la même chose autrement
1 Il est ici depuis 2 heures
2 La route a été déviée par la gendarmerie
3 Pierre est respecté par tout le monde
4 De battre mon coeur s’est arrêté
5 carré
6 céphalée
9/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Étymologie
para- : à côté de, le long de
phrasis : action d’exprimer par la parole, discours
10/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Définition
Paraphraser :
reformuler de texte en conservant le sens ;produire un texte cible à partir d’un texte source afin declarifier, expliciter ou développer certains aspects
Peux comprendre d’autres phénomènes linguistiques :
synonymievariation terminologique (souvent morpho-syntaxique)...
11/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Pourquoi paraphraser ?
Compétence linguistique des locuteurs
témoigne de la compréhension
Ne pas rester bloquer :
remplacer un mot, qui ne vient pas, par un autre ou par uneexpression
Varier le discours
Éviter les répétitions
Exposer les idées plus précisément
Expliquer mieux
Développer/abréger les propos
Changer de style ou de registre
...
Production vs reconnaissance
12/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Difficultés
Paradoxe :
dire la même chose, etdire autre chose en même temps
Toute modification de forme implique une modification desens...
Scalaire ou continuum
Acceptabilité des paraphrases
Formalisation de la paraphrase
13/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Difficultés
14/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Difficultés
personne qui pratique la loi criminelle
avocat de la loi criminelle
personne criminelle qui pratique la loi
personne qui exerce la loi criminelle
personne qui pratique la loi de manière criminelle
praticien de la loi criminelle
personne criminelle qui exerce la loi
personne qui applique la loi criminelle
juriste qui applique la loi criminelle
15/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Approches et Classifications
1 Dimensions de la paraphrase
2 Approches linguistiques de la paraphrase
3 Classifications de la paraphrase
4 Relations impliquées dans la paraphrase
16/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Dimensions de la paraphrase
1 Niveau de langue :
linguistique (syntaxique, sémantique), discursif et énonciatif
2 Taille d’unités couvertes par la paraphrase
lexicale, sous-phrastique, phrastique
3 Types de transformations :
morphologique, sémantique, syntaxique, lexico-syntaxique...
4 Types de connaissances requises5 Registre de langue :
spécialisé, non spécialisé
6 Degré d’équivalence7 Langue :
traductions
17/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Niveau de langueApproche à dominance syntaxique
+ courant transformationnel : école de Zellig Harris (Harris,1968)
∼ courant générativiste : école de Noam Chomsky (Chomsky,1965)
à lexique constant :
Il est facile de contenter JeanJean est facile à contenterContenter Jean c’est facile
18/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Niveau de langueApproche à dominance syntaxique
Grammaire et règles de réécriture ou transformationsyntaxique
Paul lit le livreLe livre est lu par PaulN1 V N2 → N2 être Vpp par N1
Paraphrase = système complet de transformations dans lalimite de la grammaire
Approche limitée aux phénomènes syntaxiques
les phénomènes lexicaux non pris en chargeremplacement d’un mot dans une phrase par son synonyme
⇒ Apparition de la sémantique générative (McCawley, 1968)
19/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Niveau de langueApproche à dominance sémantique
Courants qui visent à reconstruire un modèle global del’activité de langage par les sujets
(Melčuk, 1984 1999; Melčuk, 1988; Martin, 1976), (Pottier,1974; Culioli, 1976; Milicevic, 2007)
Objectifs :
répertorier les formes linguistiques de la paraphraseanalyser finement les relations sémantiques qui unissent lesparaphrases
TST (Melčuk, 1984 1999) : Langue comme un système deparaphrasage
Les approches négligent souvent le rôle du contexte
20/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Niveau de langueApproche discursive et énonciative
Théorie de l’énonciation (Culioli, 1976; Fuchs, 1982)
Activité métalinguistique spontanée
Objectifs :
ne pas se limiter à une analyse purement linguistiqueprendre en compte le contexte de l’énonciation
Paraphraser c’est se livrer à une activité de reformulation, parlaquelle on restitue le sens d’un discours (énoncé ou texte)déjà produit.
La paraphrase ne se comprend qu’en situation decommunication réelle faisant intervenir un contexte communet identifié.
21/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Niveau de langueApproche discursive et énonciative
Paraphrase linguistique vs contextuelle :
. . . ce que nous avons qui est très précieux ce sont des rushsc’est-à-dire euh l’intégralité euh de ce qui a été tourné par lesréalisateurs et qui n’est parfois pas repris en montage et quidonnent donc l’idée de la globalité du travail fait par unréalisateur. . . et depuis toujours les ouvriers sont confrontés au mêmeproblème : comment comment débiter au mieux c’est-à-direproprement et rapidement les blocs de beurre ;
22/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Taille d’entités couvertes par la paraphraseDifférents types de paraphrases selon leur taille (Fløttum, 1995;Bouamor, 2012) :
Paraphrase lexicale :se situe par rapport au mot,des unités lexicales individuelles ont la même signification,synonymes {bouquin, livre}, hyperonymes {bâtiment, maison} ;
Paraphrase sous phrastique :l’équivalence se fait sur dessyntagmes, des tournures de phrases ou des fragments de textes :
Il a envie de, Il aimerait bienX ne doute pas de Y, X est sûr de Y
Paraphrase phrastique :deux phrases ou énoncés représentent un même contenusémantiqueau niveau de la phrase complète :
Pourriez-vous me donner cette information ?Seriez-vous en mesure de me fournir cerenseignement ?23/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Types de transformations
Différents types de paraphrases selon les transformationslinguistiques effectuées :
Paraphrase sémantique :
utilisée pour adapter sa façon de parler ou s’exprimer de façonplus appropriée ou encore pour clarifier leurs pensées (Melčuk,1988) :
Pierre a enlevé son manteau.Pierre a ôté son manteau.
Paraphrase syntaxique :
a pour condition le changement de la catégorie syntaxique,nominalisation : adjectif → nom,passivation : phrase active → phrase passive ;
Paraphrase lexico-syntaxique (Bouamor, 2012) :
modification de la structure de phrase d’origine (niveausyntaxique),changement des unités lexicales employées (niveau lexical).
24/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Discours ou Registre de langue
Il existe les langues de spécialité (médecine, économie,juridique, cuisine...) et la langue générale
Les langues de spécialité ont le lexique et la syntaxeparticuliers (Sinclair, 1994)
La mise en parallèle des expressions de deux registres(spécialisé et non spécialisé)
permet d’établir les équivalences inter-discours
25/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Discours ou Registre de langue
(Cartoni & Deléger, 2011)
retard de cicatrisation/retarder la cicatrisation,apports caloriques/apport en calories,calculer les doses/doses sont calculées,efficacité est renforcée/renforcer son efficacité
(Deléger & Zweigenbaum, 2008) :
consommation régulière/consommer de façonrégulière,gêne à la lecture/empêche de lire,évolution de l’affection/la maladie évolue
(Zeng & Tse, 2006)
{myocardial infarction, heart attack},{abortion, termination of pregnancy},{acrodynia, pink disease}
26/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Langue
Traduction : paraphrase interlangue ou interlinguistique(Fuchs, 1982; Milicevic, 2007)
établissement d’équivalences interlangues{livre, book}{lecture, reading}{pets, animaux domestiques}
27/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Travaux et Classifications de la paraphrase
(Jakobson, 1956)
(Harris, 1976)
(Ungeheuer, 1969)
(Apresian, 1973)
(Melčuk, 1984 1999)
(Honeck, 1971)
(Martin, 1976)
(Dras, 1999)
(Barzilay & Elhadad, 2003)
(Milicevic, 2007)
(Fujita, 2010)
(Vila et al., 2011)
(Bhagat & Hovy, 2013)28/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphraseRéactions au stimulus “ hutte ” (Jakobson, 1956)
paraphrase
syntagmatique
paradigmatique
contiguïté
similaritéantonymes
synonymes
métonymie
tautologie
métaphore
contiguïté
similarité
29/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Relations impliquées dans la paraphraseRéactions au stimulus “ hutte ” (Jakobson, 1956)
Paradigmatique :Contigüıté :
métonymie : chaume, paille, pauvreté
Similarité :
tautologie : huttesynonymie : cabane, cahuteantonymie : palaismétaphore : antre, terrier
Syntagmatique :Contigüıté :
a brûlé
Similarité :
est une pauvre petite maison
30/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Harris, 1976)
Dans la cadre de l’analyse du discours :
notion de transformationune relation d’équivalence entre phrasesqu’on établit à partir de l’analyse des cooccurrences
Équivalent = équivalent dans un environnement donné
Équivalence = les schémas de phrases
Il y a relation de transformation entre deux schémas dephrases
si l’échelle d’acceptabilité de leurs réalisations respectivesdemeure inchangée
Transformations orientées :
la variante la plus simple et la plus productive est considéréecomme source de la transformationI say this → This say Imais pas vice-versa
31/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Harris, 1976)
paraphrase
pronominalisations
permutations
attachements
effacements
variantes bi−univoques
variantes multivoques
32/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Harris, 1976)
Paraphrases syntaxiques
Variantes “ multivoques ” :pronominalisations :
Il a pris un gros stylo et j’ai pris un petit styloIl a pris un gros stylo et j’en ai pris un petit
effacements :
Un pot qui est en verre qui est bleu et craqueléUn pot en verre bleu et craquelé
Variantes “ bi-univoques ” :attachements :
J’ordonne que tu te lavesLave-toi !
permutations :
Jean, parce qu’elle lui a téléphoné, est parti en hâteParce qu’elle lui a téléphoné, Jean est parti en hâte
33/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Ungeheuer, 1969)
variation maximale
variation totale
variation minimale
paraphrase
transformation syntaxique avec conservation lexicale
changement lexical d’ordre rhétorique
réduction ou expansion d’un mot
changement synonymique
34/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Ungeheuer, 1969)
Variation minimale :réduction ou expansion d’un mot :
Je mange tout le fromage/Je mange le fromageIl aime les fleurs/Il aime les belles fleurs
transformation syntaxique avec conservation lexicale :
Je le bats/Il est battu par moi
changement synonymique :
Je le vois/Je le regarde/Je le remarque
changement lexical d’ordre rhétorique :
Il habite chez moi/Il vit sous mon toit
Variation totale :
J’ai faim/Dépêche-toi de préparer à manger !
Variation maximale :
résumé d’un texte entier en une phrasedéveloppement d’une phrase en un texte
35/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Apresian, 1973)
paraphrase
transformation lexicale
transformation syntaxique à lexique constant
36/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Apresian, 1973)
Transformation syntaxique à lexique constant :
changements dans les relations syntaxiqueschangements dans l’ordre des motschangements dans le statut dérivationnel-flexionnel des mots
37/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Apresian, 1973)
Transformation lexicale :passage à la converse :
C’est plus un planificateur qu’un rêveur/C’est moins un rêveurqu’un planificateur
passage à l’antonyme :
Tout le monde se souvient/Personne n’a oublié
passage à un terme générique suivi d’un modificateur :
Il murmure/Il parle dans un murmur
passage à une dérivé :
Il m’aide/Il me donne de l’aide
passage à un mot relié sémantiquement :
Il régna 30 ans/Il occupa le trône pendant 30 ans
passage au “ code sémantique ” :
Personne ne vint, à part lui/Il fut le seul à venir
passage à un synonyme lexical :
La distance entre eux fut réduite de moitié/La distance entreeux fut coupée de moitié
38/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
Théorie Sens-Texte (TST), élaborée à partir des années 60
Paraphrase : cadre théorique pour la construction de modèlesdes langues
le sens langagier : l’invariant des paraphrasesla langue : un mécanisme de production de paraphrases
Visée universelle : principes généraux applicables à plusieurslangues
russe, français, anglaismodèle logique
Couverture de 7 niveaux de la langue
Importance du niveau lexical
Dictionnaire explicatif et combinatoire (DEC) :
dérivés sémantiques de mots et leurs collocationsproduction d’un texte à partir d’un sens
39/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
Définition de 67 fonctions lexicales de paraphrasage
Fonction lexicale (FL) : fonction au sens mathématique duterme
une correspondance f qui associe à une lexie L, appeléel’argument de f , un ensemble de lexies f (L), la valeur de fcomme cette fonction n’opère qu’avec des lexies, il s’agit defonctions lexicales
Fonction lexicale :
normale : applicable plusieurs lexiesdégénérée : applicable à une seule lexie
Intensification :
pleurer/comme une Madeleinepluie/glosse
40/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL : outils formels pour la modélisation de :relations lexicales, notamment des phénomènes decooccurrence lexicale restreinte (collocations)
se mettre le doigt dans l’oeilcordon bleu
dérivation sémantique lexicale
prison / prisonnierprison / incarcérer
FL : sens dont l’expression est phraséologiquement liée parune lexie (argument, mot-clé de la FL)
41/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
Les FL jouent un double rôle dans la description linguistique :les FL servent à décrire les relations lexicales dans le lexiqued’une langue :
les relations paradigmatiques et les relations syntagmatiquesentre les lexies ;concerne directement le dictionnaire : il représente unproblème lexicographique avant tout.
les FL servent à décrire la synonymie entre phrases basée surles relations sémantiques entre lexies, c’est-à-dire lesparaphrases lexicalesrelève de la sémantique et de la syntaxe profonde
Les règles de paraphrasage (= les équations sémantiques entreFL) sont d’une importance primordiale
42/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
La fonction lexicale f est dite standard ssi :f est définie pour un grand nombre d’arguments. Autrementdit, f a une vaste cooccurrence sémantique : le sens (f ) estsuffisamment abstrait et général pour être compatible avecbeaucoup d’autres sens ;f possède un grand nombre de valeurs différentes. Autrementdit, l’ensemble de toutes les valeurs de f pour tous lesarguments est suffisamment grand.
sinon : fonction lexicale non standardsens spécialisé, domaines lexicaux particuliers/de couleur marron/ :
koriqnevy� [koričnevyj] (général)kari� [karij] (yeux)temnorusy� [tëmnorusyj] ou kaxtanovy� [kaštanovyj](cheveux)gnedo� [gnedoj] (cheval)
café crème (au lait, arrosé, irlandais, ...) ; nuit blanche
FL syntagmatiques et paradigmatiques43/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
X = COD, Y = actant/sujet
FL paradigmatiques visent la NOMINATION/SÉLECTIONLEXICALE
Comment appelle-t-on l’objet / la situation X , apparenté/e àY ? quand on veut parler de X , ET NON PAS de Y
FL syntagmatiques visent la COMBINATOIRE LEXICALE
Comment appelle-t-on l’action/la caractéristique/l’attribut Xde Y ? quand on veut parler de Y et de X en même temps
44/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
Les FL paradigmatiques n’ont pas la capacité d’apparâıtredans le texte avec leurs mots-clés
S1(crime) = criminel
Les FL syntagmatiques ont la capacité d’apparâıtre dans letexte avec leurs mots-clés
Magn(dormir) = comme une souche
45/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
paraphrase
paradigmatique
dérivations syntaxiques (S A V Adv)
dérivations actantielles (S A Adv)
qualificatifs d’actants potentiels (Able Qual)
relations de substitution (Syn Anti Contr Conv Gener)
prédicateur (Pred)
verbes phasaux (Incep Cont Fin)
verbes aspectuels (Prox Perf Result)
verbes causatifs (Caus Liqu Perm)
verbes introducteurs d’une nouvelle situation (Involv Manif Sympt)
verbes divers (Prepar Son)
prépositions liées au mot−clé (Instr Loc Propt)
noms quasi−synonymes (Figur Gener)
noms quasi−méronymes (Sing Mult Cap Equip Centr Culm Germ)
modifieurs adjectivaux et adverbiaux (Magn Bon Ver Posi Epit Plus Minus Pejor)
syntagmatique
verbes ayant un sens négatif (Degrad Excess Obstr Nocer)
verbes supports (Oper Func Labor)
verbes de réalisation (Real Fact Labreal)
dérivations circonstancielles (instr med res mod loc)
ordre typique (Imper)
46/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
un moyen de description de collocations
un outil très efficace pour la description de ce qu’on pourraitappeler les “ dérivations sémantiques ” du mot clé L
les synonymes et les quasi-synonymes de L, ses antonymes etquasiantonymes, ses conversifs et quasi-conversifs...
47/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Relations de substitution Syn, Anti, Contr, Convijk , Generp
Dérivations syntaxiques S0, A0, V0, Adv0
Dérivations actantielles Si , Ai , Advi
Dérivations circonstancielles Sinstr , Smed , Sres , Smod
Qualificatifs d’actants potentiels Ablei , Quali
Ordre typique Imper
(synthèse de (Alonso Ramos & Tutin, 1996))
48/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Syn : synonyme exactSyn(avion) = appareil
Syn⊃ : quasi-synonyme plus spécifique (plus riche)Syn⊃(respect) = vénération
Syn⊂ : quasi-synonyme moins spécifique (plus général)Syn⊂(vénération) = respect
Syn∩ : quasi-synonyme avec une intersection non vide de sensSyn∩(seconder) = assister
49/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Conv : conversiflexème qui dénote une relation converse de la relation expriméepar le mot clé de cette FLles indices donnent l’ordre des actants SyntP associés auconversif relativement à l’ordre des actants SyntP associés aumot clé du conversif, qui est toujours ”123”
Conv21(crainde) = effrayer
Conv21(avant) = après
Conv3214∩(vendre) = acheter
50/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Anti : antonyme exactAnti(respect) = irrespect
Anti⊃ : quasi-antonyme plus spécifiqueAnti⊃(désespoir) =
Anti⊂ : quasi-antonyme moins spécifiqueAnti⊂(mépris) =
Anti∩ : quasi-antonyme avec une intersection non vide desens
Anti∩(aider) =
51/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Anti : antonyme exactAnti(respect) = irrespect
Anti⊃ : quasi-antonyme plus spécifiqueAnti⊃(désespoir) = espoir
Anti⊂ : quasi-antonyme moins spécifiqueAnti⊂(mépris) = respect
Anti∩ : quasi-antonyme avec une intersection non vide desens
Anti∩(aider) = gêner
52/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Contr : contrastifContr(d’acier) = de veloursContr(mer) = terreContr(tête) = coeur
53/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Gener : mot générique pour LGener(gaz) = substance [gazeuse]Gener(pistolet) = arme à feuGener(république) =Gener(colère) =Gener(chou) =
54/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Gener : mot générique pour LGener(gaz) = substance [gazeuse]Gener(pistolet) = arme à feuGener(république) = état [républicain]Gener(colère) = sentiment [de ∼]Gener(chou) = légume
55/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Dérivés syntaxiques du mot clé sans changement du sens
dérivation au sens sémantique
S : nomS(acheter) = achatS(tomber) =
V : verbeV(promesse) =
A : adjectifA(école) =A(ville) =
Adv : adverbeAdv(honnête) =
56/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Dérivés syntaxiques du mot clé sans changement du sens
dérivation au sens sémantique
S : nomS(acheter) = achatS(tomber) = chute
V : verbeV(promesse) = promettre
A : adjectifA(école) = scolaireA(ville) = urbain
Adv : adverbeAdv(honnête) = honnêtement
57/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Fonctions nominales : nom typique pour le premier, deuxième,troisième, etc. actant SyntP du mot clé
S1(crime) = criminelS2(crime) = victimeS1(acheter) = acheteurS2(acheter) = achatS3(acheter) = vendeurS4(acheter) = prix
Sinstr , Sloc , Smed , Smod , Sresnom typique pour le circonstant exprimant l’instrument, le lieu,le moyen, le mode et le résultat
58/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Fonctions adjectivales : modificateur typique pour le premier,deuxième, troisième, etc. actant SyntP du mot clé
A1(mépris) = plein, rempli [de ∼]A1(chercher) = en quête [de N]A2(mépris) = couvert [de ∼]A2(diriger) = sous la direction [de N]
AbleAble1 : qui peut (facilement) avoir/faire/...
Able1(pleurer) = pleurnichardAble1(peur) = peureux
Able2 : qu’on peut (facilement) soumettre à...)/(qui peut(facilement) causer...)
Able2(dissoudre) = solubleAble2(peur) = effrayant
...59/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL paradigmatiques :
Qual : qui entrâıne Ablei avec une forte probabilitéQual(mentir) = malhonnêteQual(tromper) = näıf
Imper :Imper(secourir) = Au secours !, SOSImper(tirer) = feu !
60/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Verbes supports Operi , Funci , Laborij
Verbes de réalisation Reali , Facti , Labrealij
Prédicateur Pred
Verbes phasaux Incep, Cont, Fin
Verbes causatifs Caus, Liqu, Perm
Verbes aspectuels Prox, Perf, Result
Verbes introducteurs d’une nouvelle situation Involv, Manif, Symptijk
Verbes ayant un sens négatif Degrad, Excess, Obstr, Nocer
Verbes divers Prepar, Son
Modifieurs adjectivaux et adverbiaux Magn, Bon, Ver, Posi, Epit, Plus,Minus, Pejor
Prépositions liées au mot-clé Instr, Locin/ab/ad , Propt
Noms quasi-synonymes Figur, Gener
Noms quasi-méronymes Sing, Mult, Cap, Equip, Centr, Culm, Germ
(synthèse de (Alonso Ramos & Tutin, 1996))61/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Magn est un intensificateur :Magn(riposte) = foudroyanteMagn(sourd) = comme un potMagn(cri) =Magn(fort) =Magn(soûl) =Magn(apprécier) =Magn(ivre) =
62/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Magn est un intensificateur :Magn(riposte) = foudroyanteMagn(sourd) = comme un potMagn(cri) = d’orfraie / avec pousserMagn(fort) = comme un TurcMagn(soûl) = comme un Polonais, comme une grive (unebarrique, une bourrique)Magn(apprécier) = grandementMagn(ivre) = -mort
63/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Oper1 est un verbe sémantiquement vide (ou vidé de son sensdans le contexte de son mot clé) :
1 le mot clé comme son complément d’objet direct (COdir) ouprincipal (si le verbe n’est pas transitif), c’est-à-dire commeson actant Synt(axique) P(rofond) II ;
2 l’actant SyntPI potentiel du mot clé comme son sujetsyntaxique, donc comme son actant SyntPI
Oper1(plainte) = porter [∼]
64/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Oper1(plainte) = porter [∼]Oper1(cri) =
Oper1(grippe) =
Oper1(désespoir) =
Oper1(efforts) =
Oper1(ordre) =
Oper1(suprématie) =
Oper1(regard) =
Oper1(précaution) =
65/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Oper1(plainte) = porter [∼]Oper1(cri) = pousser [ART ∼]Oper1(grippe) = avoir [ART ∼]Oper1(désespoir) = être [au ∼]Oper1(efforts) = déployer [ART ∼]Oper1(ordre) = donner [à N ART ∼]Oper1(suprématie) = détenir, exercer [sur N ART ∼]Oper1(regard) = jeter [à N ART ∼]Oper1(précaution) = prendre [ART ∼]
66/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Epit : épithète courante sémantiquement videEpit(océan) = immenseEpit(gagnant) = heureuxEpit(défier) = ouvertement
Figur : métaphore codifiée par la langue dont la combinaisonavec le mot clé est un synonyme plus spécifique du mot clé(expression figurée de ...)
Figur(fumée) = rideau [de ∼]Figur(oubli) = voile [de l’∼]
67/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Sing : un quantum régulier deSing(flotte) = navireSing(ail) = gousseSing(riz) = grain [de ∼]
Mult : ensemble régulier deMult(navire) = flotteMult(chien) = meute [de ∼s]Mult(abeille) = essaim, nuée [de ∼]Mult(barbares) = horde [de ∼s]Mult(oiseau) = volée [de ∼s]Mult(foin) = botte [de ∼]
68/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Cap : chef deCap(université) = recteur [de ART ∼]Cap(orchestre) = chef [d’∼]Cap(bordel) = madameCap(avion) = commandantCap(navire) = capitaine [de ART ∼]Cap(théâtre) = directeur [de ART ∼]
Equip : équipe deEquip(université) = personnel [de ART ∼]Equip(orchestre) = musiciens [de ART ∼]Equip(bordel) = fillesEquip(navire, avion) = équipage [de ART ∼]Equip(théâtre) = troupe [de ART ∼]
69/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
FL syntagmatiques :
Centr : le centre de, le milieu deCentr(problème) = coeur [du ∼]
Culm : culmination deCulm(joie) = au comble [de la ∼]Culm(colère) = paroxysme [de la ∼]
Real : réaliser les ”objectifs” inhérents de la choseReal1(peine) = infliger [ART ∼]Real2(peine) = purger [ART ∼]Real(piège) = donner, tomber [dans ART ∼]Real(ordre) = exécuter [ART ∼]Real(rêve) = se réaliser
70/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Melčuk, 1984 1999)
Combinaison de FL :
AntiMagn(majorité) = courte, faible
AntiVer(reprocher) = à tord
AntiBon(choix) = malheureux
AntiReal3(ordre) = défier
Magn+Figur(haine) = feu [de la ∼]Magn+Figur(feu) = déluge [de ∼]AntiMagn+Figur(espoir) = lueur [d’∼]AntiMagn+Figur(hésitation) = ombre [d’une ∼]ImperContReal(téléphone) = Ne quittez pas !
71/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Honeck, 1971)
paraphrase
transformationnelle
lexicale
formalexicale
72/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Honeck, 1971)
Description à haut niveau des paraphrases
Paraphrase transformationnelle :
la structure de surface de la phrase ou du segment d’origineest inchangée,seuls les mots utilisés sont modifiésLe chat a mangé la souris/La souris a été mangée par le chat
Paraphrase lexicale :
la structure de surface de la phrase ou du segment d’origineest conservée,certains mots pleins sont remplacés par un synonyme,Le chat a mangé la souris/Le félin a dévoré la souris
Paraphrase formalexicale :
la structure de surface est modifiée,les mots pleins de la phrase ou le segment de base sont aussimodifiés,Le chat a mangé la souris/Le rongeur a été dévoré par le minou
73/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Martin, 1976)
Mise en évidence les difficultés de définir la paraphrase
Deux phrases Pi et Pj seront dites en relation de paraphrasesi, pour tout locuteur et en toute situation, Pi estlogiquement équivalente à Pj .
L’équivalence logique fait référence aux trois propriétésmathématiques :
symétrie, transitivité, réflexivité
... la reformulation en discours est une relation qui ne vérifieaucune des trois propriétés suivantes : transitivité, symétrie etréflexivité ... (Fuchs, 1994; Levrat & Amghar, 1995)
74/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Martin, 1976)
(Fuchs, 1994; Levrat & Amghar, 1995) :Symétrie : La relation R est symétrique ssi E1 est en relationavec E2, et E2 est lui aussi en relation avec E1
synonymie,on considère souvent la paraphrase comme un contenu étendude la phrase initiale ;
Transitivité : La relation R est transitive ssi E1 est en relationavec E2, lui-même en relation avec E3, et E1 est aussi enrelation avec E3
policier/flic, policier/poulet → flic/pouletla succession des paraphrases induit des déformationssémantiques, ce qui fait perdre la transitivité des phrases ;
Réflexivité : La relation R est réflexive ssi E1 est en relationavec lui-même
autonymie, énoncés définitoiresune phrase est rarement considérée comme paraphrased’elle-même.
75/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Dras, 1999)
paraphrase
changement de relation
suppression
déplacement de proposition
changement d’emphase
changement de perspective
76/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Dras, 1999)
Changement de perspective :
changement dans la façon dont les éléments de texte sontreprésentésremplacement d’un verbe par un adjectifCe manuscrit peut être lu./Ce manuscrit est lisible.
Changement d’emphase :
changement de la structure syntaxique d’une phrase enmodifiant son focuspassage de la voix active à la voix passiveMaman a servi le repas./Le repas a été servi par maman.conversion de la phrase sous forme de phrase pseudo-clivéeLe chat a bu tout le lait./Celui qui a bu tout le lait, c’est lechat.
77/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Dras, 1999)
Changement de relation :changement de connexion entre les propositions des phrasesUne étude conduite par � Gallup Poll � a indiqué qu’unAméricain sur quatre croit aux fantômes./Une étude a étéconduite par le � Gallup Poll �. Elle a indiqué qu’unAméricain sur quatre croit aux fantômes.
Suppression :suppression d’éléments périphériques de la phrase d’origineles paraphrases sont unidirectionnellesLa situation de guerre a affecté de nombreuses personnes./Laguerre a affecté de nombreuses personnes.
Déplacement de proposition :changement de la position de quelques expressions dans laphraseL’étudiant a copié les schémas importants avant de rendre lelivre./Avant de rendre le livre, l’étudiant a copié les schémasimportants
78/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Barzilay & Elhadad, 2003)
paraphrase
atomique lexicale
composite transformations lexicales
transformations syntaxiques
opération d’édition
79/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Barzilay & Elhadad, 2003)
Paraphrase atomique :
unités lexicales non décomposables (mots ou petits segments)niveau lexical
Paraphrase composite :
constructions qui peuvent être décomposées en de plus petitesunités (phrases et segments complexes)modifications de haut niveau affectant la phrase d’origine :
opérations d’éditiontransformations syntaxiques et lexicales
80/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
Modélisation de la paraphrase en se basant sur la TST
Paraphrase linguistique
Paraphrase entre les phrases (quasi)synonymesParaphrase approximative
ne possédant pas nécessairement un sens absolument identique
La paraphrase est définie selon deux aspects :une relation de (quasi-)synonymie entre phrases, dans sonaspect statique,une opération permettant de produire des phrases(quasi-)synonymes, dans son aspect dynamique.
Modélisation de la capacité paraphrastique d’un locuteurrevient à proposer des règles linguistiques décrivantformellement les liens paraphrastiques :
X est sûr de YX ne doute pas de YY est un fait certain pour XY ne soulève chez X aucun doute
81/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
La synonymie exacte des expressions langagières est très rare
La synonymie ou la paraphrase approximative(quasi-synonymie) est très répandue (omniprésente)
Les différences sémantiques :
peuvent toujours être trouvées entre deux expressions
Dans la communication quotidienne :
ces différences sont ignorées par les locuteursdans des conditions contextuelles appropriéesil suffit que deux phrases soient approximativement synonymespour qu’elles soient considérées comme des paraphrases
82/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
La complexité des faits de paraphrase s’explique par :
la multiplicité des paramètres qui interviennent dans leparaphrasagel’extrême richesse des moyens linguistiques synonymiques(moyens paraphrastiques)
83/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
paraphrase
types de moyens d’expression utilisés
exactitude du lien paraphrastique
mode de production
dimensions de sens impliquées
type de connaissances mis en jeu
cognitive/contextuelle
linguistique
propositionnellecommunicative
rhétoriquelexicale
morphologiquesyntaxique
exacteapproximative
virtuelle
reformulative
84/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
Type de connaissances mis en jeu pour leur production
Données pragmatiquescontextuelles :
Depuis une centaine d’années, les températures du globetendent à augmenterDepuis 1900, les températures du globe tendent à augmenter
actes illocutoires :
I wouldn’t, if I was youDon’t
actes perlocutoire :
La poubelle est pleine.Va vider la poubelle.
85/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
Type de connaissances mis en jeu pour leur production
Connaissances näıves sur le monde
Il portait des bottes ab̂ımées.Ses bottes avaient besoin d’être réparées.
Connaissances encyclopédiques
Baudelaire aimait les chats.L’auteur des “ Fleurs du mal ” aimait les chats.
Capacités logiques/arithmétiques, etc. du locuteur
Baltazar n’est pas fiable.Baltazar peut te laisser en plan
86/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
Type de connaissances mis en jeu pour leur production
Paraphrase linguistique
Are you being served ?Is anybody looking after you ?Is anybody taking care of you ?Are you being attended to ?Are you being seen to ?
87/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
Dimensions de sens impliquées
Propositionnelle, communicative, rhétorique
Smoking increases the risk of cancer by 50% :
p : causationc :r : neutre
For a smoker, the risk of cancer is 50% higher. :
p : pas de causationc : mise en avant plan du Thème (fumeurs)r : neutre
If you smoke, your risk of cancer is 50% higher. :
p : implicationc :r : personnalisée
88/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
Types de moyens d’expression utilisés
lexical
morphologique
syntaxique
...
89/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
Exactitude du lien paraphrastique
exacteles phrases sont synonymes complets, mais contiennent leséléments qui ne le sont pas
Il faut analyser ce phénomène.Il faut effectuer une analyse de ce phénomène.
approximativeavec inclusion de sens
Baltazar walked quickly across the road.Baltazar hurried across the road.
avec intersection de sens
The victim was stabbed to death.The victim was killed with a knife.
90/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Milicevic, 2007)
Mode de production
virtuelle
fixer un sensproduire toutes les paraphrases possiblesacceptées par les règlesD’avoir pris ce médicament a calmé B.La prise de ce médicament a calmé B.La prise de ce médicament a fait se calmer B.
reformulativel’accent est mis sur la reformulation soit du sens initial soit desphrases obtenues
D’avoir pris ce médicament a calmé B.Ce médicament a calmé B.Suite à la prise de ce médicament, Baltazar s’est calmé.Parce qu’il a pris ce médicament, Baltazar s’est calmé.
91/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Typologie assez générale et exhaustive
Linguistiquement fondée et axée sur la dénotation
La typologie comporte cinq classes de paraphrases :
extraphrastiques, extra-clausales, syntaxiques,morpho-syntaxiques et lexicales.
Distinction entre classes : portée sémantique et degré degénéralité des paraphrases
92/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
paraphrase
syntaxique
morpho−syntaxique
lexicale
extra−clausale
extraphrastique
93/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Extraphrastique :séparation de clauses relatives
Sm̊aland, which is located to the south-west of Stockholm, iscalled “The Kingdom of Glass”. The reason is that there aresixteen glass manufacturers in this area.Sm̊aland is located to the south-west of Stockholm. It iscalled “The Kingdom of Glass”. The reason is that there aresixteen glass manufacturers in this area.
Remplacement de conjonction
Note down the number. Otherwise, you may forget it.Note down the number. If not, you may forget it.
94/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Extra-clausale :phrases clivées/non clivées :
It was his best suit that John wore to the dance last night.John wore his best suit to the dance last night.
changement tête/expansion :
The conference venue is the building whose roof is red.The conference venue is the building with red roof.
déplacement de la négation :
Your application is canceled if you do not reply.Your application is not canceled if you reply.
Phrases imbriquées ou coordonnées, réordonnancements, etc.
95/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Syntaxiqueinversion :
If I had money enough,...Had I money enough,..
déplacement d’adverbes :
She can speak English fluently.She can fluently speak English.
paraphrase de la négation :
He drank nothing but famous spirits.All he drank were famous spirits.
...
96/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Lexicale :nom/adjectif :
There’s a risk of receiving a severe wound.There’s a possibility of receiving serious injure.
verbe/GV :
Emma burst into tears and he tried to comfort her.Emma cried, and he tried to console her.
grand GV :
Real Sociedad snapped a two-game losing streak.Real Sociedad got points for the first time in three games.
97/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Morpho-syntaxique (Levin, 1993) :passif/actif :
The riddle is solved by him.He solved the riddle.
changement de locatif :John smeared paint on the wall.John smeared the wall with paint.
changement de réciproque :The car collided with the bicycle.The car and the bicycle collided.
changement de datif :Bill sold a car to Tom.Bill sold Tom a car.
changement de source :The well gushed oil.Oil gushed from the well.
transitivité/implication :Janet broke the cup.The cup broke.
98/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Morpho-syntaxique :construction avec un verbe support, Nom/Verb, Adj/Adv :
Employment showed a sharp decrease.Employment decreased sharply.
Adj/Verbe :
I visited a priest in the old temple.I visited a priest in the olden(ed) temple.
Adj/Nom :
I feel drowsy.I have a drowsiness.
99/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Morpho-syntaxique (alternances structurelles) :déplacement de la tête (GN), Nom/Verbe
We need an improvement of recycling system.We need an improved recycling system.
déplacement de la tête (GV), Verbe/Adv, Nom/Verbe
He hurried to check it.He checked it in a hurry.
déplacement du quantifieur
We performed two transactions in this morning.We performed transactions twice in this morning.
100/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Fujita, 2010)
Pour plusieurs variations
besoin de ressources sémantiques (FrameNet, VerbNet...)
101/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
Classification selon les modifications linguistiques
Proposer une description linguistique
plutôt qu’une classification longue, grossièreet incomplète
2 niveaux
9 types de paraphrases
5 classes
Une paraphrase peut concerner plusieurs types :
said / toldlexique et syntaxe
102/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
paraphrase
syntaxique
sémantique
discursive
morphologique
lexicale
antonymescomplémentaires
converses
synonymes
synthétiques/analytiques
suppressions
dérivation
flexion
103/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
Changements basés sur le lexique :
substitution avec la même polarité (synonymes) :
substitutions exactes/approximativesGoogle bought YouTube./Google acquired YouTubeThey were 9./They were around 10.substitutions inducteur/agent induitThe pilot took off despite the stormy weather./The plane tookoff despite the stormy weather.
substitution avec la polarité opposée (antonymes,complémentaires, converses) :
antonymie plus la négationI am leaving./I am not staying.compensation par l’antonymie d’autres changementsOnly 20% of the participants arrived on time./Most of theparticipants arrived lateinversion d’argument et substitution conversiveGoogle bought YouTube./YouTube was sold to Google.
104/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
Changements basés sur le lexique :
la suppression consiste en substitution d’un segment de textepar rienles suppressions peuvent être lexicales, non-lexicales ousemilexicales :
I like eating chocolate./I like chocolate.Actually, you shouldn’t be here./You shouldn’t be here
substitutions synthétiques/analytiques : unités simples par lesunités complexes :
ajout d’un verbe supportSteven attempted to stop playing Hearts./Steven made anattempt to stop playing Heartsajout de spécificationIdeas is all I need to write an article./A sequence of ideas is allI need to write an article.expressions composéesI prefer wildlife television documentaries./I prefer televisiondocumentaries about wildlife105/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
Changements basés sur la morphologie :
réorganization syntaxique, alternations de la diathèseFlexion :
In 1492 Columbus reached America.In 1492 Columbus reaches America.
Dérivation :
I know that Olds founded GM.I know about the foundation of GM by Olds.
106/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
Changements basés sur la syntaxe :
réorganization syntaxique, alternations de la diathèse
active/passive :John loves Mary.Mary is loved by John.transitivitéThe laundry sways in the breeze./The breeze makes thelaundry sways.positionsThe section chief filled Japanese sake into the cup./Thesection chief filled the cup with Japanese sake
107/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
Changements basés sur la sémantique :
même sens, lexicalisations différentes :
Bill flew across the ocean.Bill crossed the ocean by plane.The increase of prices accompanies the crise.The prices increase with the crise.Barbara excels at teaching.Barbara teaches well.
108/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
Changements basés sur le discours :
changement de la structure de la phrase
un grand éventail de réorganisations :mots grammaticaux :
He wanted to eat nothing but apples.All he wanted to eat were apples.
suppression de la relative :
Joe wants the blazer which was designed by BMW.Joe wants the blazer designed by BMW.
segmentation/combinaison de phrases :
He is willing to leave. This made Gillian upset.His willingness to leave made Gillian upset.
109/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Vila et al., 2011)
Typologie relativement simple et opérationnelle
Pas d’inférences contextuelles
Typologie linguistique
110/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
paraphrase
changement de modalitéchangement d’aspect
changement de temps
substitution verbe−préposition/nom
conversion verbe/adverbe
conversion verbe/adjectif
conversion verbe/nom
substitution de synonymessubstitution d’antonymes
substitution de converses
changement de personne
changement de voix
substitution de pronom/co−référent
répétition/ellipse
variations des mots grammaticaux
substitution générique/spécifique
substitution de métaphore
substitution partie/tout
implication sémantique
connaissances externes
équivalence numérique approximative
substitution agent/action
substitution manipulateur/engin ou instrument
substitution verbe/nom d’agent, de patient ou d’instrument
111/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
Substitution de synonymes :
synonymes appropriés au contexte, génitifs (’s/of/of the...),plésionymes,Google bought YouTube./Google acquired YouTube.Chris is slim./Chris is slender./Chris is skinny.
Substitution d’antonymes :
antonyme accompagné par la négation ou un autre élément denégationla substitution peut être accompanée par ajout/suppression demots grammaticaux :Pat ate./Pat did not starve.
Substitution de converses :
converse, qui inverse les relations entre les constituantsla substitution peut être accompagnée par ajout/suppressionde mots grammaticaux et la restructuration de la phrase :Google bought YouTube./YouTube was sold to Google.
112/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
Changement de voix :
voix active / voix passive ou le contrairela substitution peut être accompagnée par ajout/suppressionde mots grammaticaux et la restructuration de la phrasela paraphrase a souvent un sens plus réduit :Pat loves Chris./Chris is loved by Pat.
Changement de personne :
personne grammaticalela substitution peut être accompagnée par ajout/suppressionde mots grammaticaux et la restructuration de la phrase :Pat said, “I like football.”/Pat said that he liked football.
Substitution de pronom/co-référent :
substitution d’un pronoun par un groupe nominalla paraphrase a souvent un sens plus réduit :Pat likes Chris, because she is smart./Pat likes Chris, becauseChris is smart.
113/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
Répétition/ellipse :ellipses ou les constructions elliptiquesla paraphrase a souvent un sens plus réduit :Pat can run fast and Chris can run fast, too./Pat can run fastand Chris can, too.
Variations des mots grammaticaux :changement de mots grammaticaux sans changement de lasémantiquecela implique le remplacement, la suppression ou l’ajout deverbes, de prépositions ou de déterminants :Results of the competition have been declared./Results for thecompetition have been declared.Pat showed a nice demo./Pat’s demo was nice.
Substitution agent/action :replacement du nom d’agent par le nom d’action et le contrairela substitution peut être accompagnée par ajout/suppressionde mots grammaticaux :I dislike rash drivers./I dislike rash driving.
114/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
Substitution verbe/nom d’agent, de patient ou d’instrument :
la substitution peut être accompagnée par ajout/suppressionde mots grammaticaux et la restructuration de la phrasePat teaches Chris./Pat is Chris’s teacher.Pat teaches Chris./Chris is Pat’s student.Pat tiled his bathroom floor./Pat installed tiles on hisbathroom floor.
Substitution manipulateur/engin ou instrument :
la substitution peut être accompagnée par ajout/suppressionde mots grammaticaux :The pilot took off despite the stormy weather./The plane tookoff despite the stormy weather.
115/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
Substitution générique/spécifique :substitution hyperonyme/hyponyme en fait partiesouvent génère des quasi-paraphrases :I dislike rash drivers./I dislike rash motorists.Pat is flying in this weekend./Pat is flying in this Saturday.
Substitution de métaphore :replacement de noms par sa métaphore, et le contrairela substitution peut être accompagnée par ajout/suppressionde mots grammaticaux :I had to drive through fog today./I had to drive througha wall of fog today.Immigrants have used this network to send cash./Immigrantshave used this network to send stashes of cash.
Substitution partie/tout :la substitution peut être accompagnée par ajout/suppressionde mots grammaticaux :American airplanes pounded the Taliban defenses./Americanairforce pounded the Taliban defenses.
116/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
Les substitutions peuvent être accompagnées parajout/suppression de mots grammaticaux et la restructurationde la phrase
Conversion verbe/nom :
The police interrogated the suspects./The police subjected thesuspects to an interrogation.The virus spread over two weeks./Two weeks saw a spreadingof the virus.
Conversion verbe/adjectif :
Pat loves Chris./Chris is lovable to Pat.
Conversion verbe/adverbe :
Pat boasted about his work./Pat spoke boastfully about hiswork.
Conversion nom/adjectif :
I’ll fly by the end of June./I’ll fly late June.117/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
Les substitutions peuvent être accompagnées parajout/suppression de mots grammaticaux et la restructurationde la phraseSubstitution verbe-préposition/nom :
The finalists will play in Giants stadium./Giants stadium willbe the playground for the finalists.
Changement de temps :peut générer des quasi-paraphrasespeut être sémantiquement moins précis :Pat loved Chris./Pat loves Chris.
Changement d’aspect :Pat is flying in today./Pat flies in today.
Changement de modalité :peut générer des quasi-paraphrasespeut être sémantiquement moins précis :Google must buy YouTube./Google bought YouTube.The government wants to boost the economy./Thegovernment hopes to boost the economy.118/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Classifications de la paraphrase(Bhagat & Hovy, 2013)
Implication sémantique :peut générer des quasi-paraphrases :Google is in talks to buy YouTube./Google bought YouTube.The Marines are fighting the terrorists./The Marines areeliminating the terrorists.
Équivalence numérique approximative :peut générer des quasi-paraphrases :At least 23 U.S. soldiers were killed in Iraq lastmonth./About 25 U.S. soldiers were killed in Iraq last month.Disneyland is 32 miles from here./Disneyland isaround 30 minutes from here.
Connaissances externes :peut générer des quasi-paraphrases :We must work hard to win this election./The Democrats mustwork hard to win this election.The government declared victory in Iraq./Bush declared victoryin Iraq.
119/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Relations impliquées dans la paraphrase
La relation de paraphrase est établie entre deux séquenceschaque fois qu’un sujet parlant produit ou reconnâıt Ycomme une reformulation paraphrastique de X .
En fonction de la sensibilité du locuteur et des données :
équivalenceidentificationapproximationspécification, ajoutsous-spécification/généralisation, suppression...
120/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Approches linguistiques de la paraphrase
1 Niveau de langue :
syntaxique, sémantique, discursif et énonciatif
2 Taille d’unités couvertes par la paraphrase
lexicale, sous-phrastique, phrastique
3 Types de transformations :
sémantique, syntaxique, lexico-syntaxique
4 Registre de langue :
spécialisé, non spécialisésoutenu, parlé...
5 Langue :
traductions
121/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Types de données pour étudier la paraphrase
Données étudiées :
doivent être évocateurs ou indicateurs de la paraphrase
Critères de jugement sur la paraphrase
122/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Types de données pour étudier la paraphrase
Intuition du linguiste
Interrogation de locuteurs
Exploitation de dictionnaires, thesaurus
Règles de mise en relation
Étude de corpus
123/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Types de données pour étudier la paraphrase
Intuition du linguisteInterrogation de locuteurs
Exploitation de dictionnaires, thesaurus...
Règles de mise en relationÉtude de corpus
124/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Intuition du linguiste
Données obtenues suite à une construction théorique
Introspection : se demander si
deux phrases sont, ou non, des paraphrasesconstruire des paraphrases d’une phrase de départ
Critiques :
données réelles : enquêtes auprès des locuteursconsensus : ... La question est de savoir si ces relations établiespar les linguistes sont, ou non, représentatives des locuteursnatifs. (Prideaux & Baker, 1974)
125/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Interrogation de locuteurs
Données obtenues suite à l’étude des cas concrets
Interrogation des locuteurs :
existe-t-il une relation de paraphrase ?variation syntaxique
Il est courant que les personnes interrogées ne s’accordent pasentre elles...
Difficulté :
types de questions posées aux locuteursnombre de locuteurs interrogésanalyser les jugements des locuteurs
acceptabilité et ambigüıtécertains locuteurs sont rigides, d’autres plus laxistes... (Smaby,1971)
... on rencontre la diversité des réactions des locuteurs d’unemême langue, on se heurte au caractère irréductiblementsubjectif de ces réactions. (Fuchs, 1982)
126/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Interrogation de locuteurs
Questions posées aux locuteurs :
Procédure analytique :
interpréter (reconnâıtre) les séquencessont-elles décodées comme paraphrastiques ou non ?logiquecourant générativisteaffirmation/infirmation
Procédure synthétique
produire des séquences paraphrasant une séquence donnéerhétoriqueapproches discursivesobtention de nouvelles données
127/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Interrogation de locuteurs
Questions posées aux locuteurs :
Question explicite
production ou identification de paraphrases avec conservationdu sensintrospectionquestionnement direct
ces séquences ont-elles le même sens, ou pas ?classez les séquences selon une échelle de plus ou moinsgrande proximité sémantique
Question implicite
production ou identification de paraphrases sans avoirconscience de le fairecommentaires d’images, d’une situation formelle...substituabilité :
pouvez-vous remplacer cette séquence par une autre, dans lecontexte donné, sans changer le sens ?
128/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Interrogation de locuteurs
Rôle des locuteurs
Distinguer ce qui :
dépend du système langagierrelève des locuteurs
129/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Exploitation de dictionnaires
Section synonymie dans les dictionnaires traditionnels
Ressources électroniques de synonymes récentes :WordNet (Fellbaum, 1998)
02526085 : achieve, accomplish, attain, reach05793554 : basis, base, cornerstone, foundation, ...
VerbNetVerbOcean...
Ressources électroniques avec d’autres relations :CELEX (Burnage, 1990) : relations morphologiques
anglais, allemand, néerlandais
130/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relation
Test de substitution
Question sous-jacente
Règles de ré-écriture
Variation morpho-syntaxique
Faster
Compositionnalité
Analyse morphologique
131/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relation
Règles souvent établies manuellement
plus ou moins génériques
Orientées sur la théorie, le matériel...
Orientées sur les types de relations à établir
132/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationTest de substitution
Si deux phrases ou syntagmes sont synonymes :
ils doivent être substituables dans au moins quelques contextessans changer la signification du texte
133/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationQuestion sous-jacente
(Milicevic, 2007)
Si deux phrases sont synonymes :
étant donné une question sous-jacenteelles doivent y répondre toutes les deux
Phrases déclaratives1 Baudelaire aimait les chats.2 L’auteur des “ Fleurs du mal ” aimait les chats.3 Google is in talks to buy YouTube.4 Google bought YouTube.5 The Marines are fighting the terrorists.6 The Marines are eliminating the terrorists.
134/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationRègles de ré-écriture (Harris, 1976)
Det N1 V Det N2
Det N2 Vaux Vppe Det Prep N1
135/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationRègles de ré-écriture (Harris, 1976)
Det N1 V Det N2
Det N2 Vaux Vppe Det Prep N1
Le chat mange la souris
La souris est mangée par le chat
136/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationRègles de ré-écriture (Harris, 1976)
Det N1 V Det N2
Det N2 Vaux Vppe Det Prep N1
Le chat mange la souris
La souris est mangée par le chat
Il neige en hiver. / En hiver, il neige.
137/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationVariation morpho-syntaxique
Variation morpho-syntaxique :
souvent étudiée en relation avec les terminologies et les termes{sténose aortique, sténose de l’aorte}
Connaissances requises :
ressources morphologiquesrègles de transformations spécifiques
138/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationFaster (Jacquemin, 1999)
Recherche de termes et de leurs variantes morpho-syntaxiques :
Analyseur syntaxique robuste
Reconnaissance en corpus de termes contrôlés
=⇒ Identification de variantes de termesUn ensemble élaboré de métarègles :
pour le repérage de différents types de variation
Grammaire Syntagmatique Généralisée (HPSG) :
avec unification des structures de traits
139/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationFaster (Jacquemin, 1999)
Types de variantes morpho-syntaxiques :
Variantes syntaxiques :
mesure de volume et de fluxvariante de coordination de mesure de flux
Variantes morpho-syntaxiques :
flux de sève mesurés, mesure quotidiennement le fluxvariantes verbales de mesure de flux
⇐= relation morphologique entre mesure/NOM et mesurer/VERVariantes sémantico-syntaxiques :
évaluation du fluxvariante sémantico-syntaxique de mesure de flux⇐= proximité sémantique entre mesure et évaluation
140/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationFaster (Jacquemin, 1999)
Outil d’indexation automatique contrôlée
Acquisition massive de candidats termes n’est pas son objectifpremier
Une première liste de termes disponible
Exploitation de cette liste pour reconnâıtre des variantes determes :
enrichissement de la liste
141/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationCompositionnalité (Hamon et al., 1998)
Relations de synonymie entre termes complexes
Principe de compositionnalité
Hypothèse de la propagation compositionnelle de relations desynonymie
Deux termes complexes sont considérés comme synonymes sileurs composants sont identiques ou synonymes
Ressources lexicales existantes :
thesaurus, dictionnaires de langue générale
142/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationCompositionnalité (Hamon et al., 1998)
Types de substitutions :
Variation sur l’expansion :
les têtes sont identiques et les expansions sontsynonymesaction de protection / action de sauvegarde
Variation sur la tête :
les têtes sont synonymes et les expansions sontidentiquescapacité faible / puissance faible
Variation sur la tête et l’expansion :
les têtes sont synonymes et les expansions sontsynonymesclassement d’équipement / classification dematériel
143/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationCompositionnalité (Hamon et al., 1998)
Relation voir de Le petit Robert
calibre / qualité, bon / beau
Relation de synonymie entre les termes complexes
bon calibre et belle qualité(variation sur la tête et l’expansion)
Relation pertinente dans le domaine de la médecinecardiovasculaire
144/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationAnalyse morphologique
Termes et mots médicaux ont souvent une morphologie richemyocardial, acrodynie, cholecystectomie
Cause principale de l’opacité sémantique des termes
Exploiter cette caractéristique pour expliciter les termes
Recherche automatique de paraphrase au niveaumorphologique
myocarde/heart muscle
Objectifs : aide à la lecture, simplification
Hypothèse : les messages de forum contiennent les élémentsnécessaires
Les explicitations pourraient être plus faciles que les termes
145/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationAnalyse morphologique
Termes/mots médicaux simples :
anatomie (616 termes),anormalités et pathologies (2 283 termes)procédures (1 271 terms)
Corpus :
forum Les diabétiques :839 fils de discussion, 6 982 messages, 624 571 motsforum Diabetes Doctissimo :22 532 fils de discussion, 560 066 messages, 35 059 868 mots
Ressources linguistiques :
synonymes (Le Robert)relations associatives (ressources distributionnelles)
FreDist (Anguiano et al., 2011)Les voisins de Le Monde (Bourigault et al., 2002)Les voisins de Wikipédia
146/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationAnalyse morphologique
TreeTagger : étiquetage morpho-syntaxique (Schmid, 1994)est VER :pres êtreantiinflammatoire PRO :POS antiinflammatoire
FLEMM : lemmatiseur et correcteur morphologique (Namer,2000)
est VER(pres) :3p :s :pst :ind être :3gantiinflammatoire NOM : :s antiinflammatoire
DériF : analyseur morpho-semantique (Namer, 2003)
angioblastique/ADJ[ [ angi N* ] [ blast N* ] ique ADJ ](angioblastique/ADJ, [angi,N*] :blast/N*)Qui est en relation avec cellule embryonnaire et vaisseau
Reformulation en français :
angi → artèreblast → cellule embryonnaire
147/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationAnalyse morphologique
1 Mapping direct :
mots français, qui correspondent à la reformulation, sontrecherchéssi une phrase contient tous les mots : la phrase est retenue
2 Mapping indirect :
mots français sont enrichis avec les ressources linguistiqueschaque mot et son cluster sont recherchéssi une phrase contient un mot de chaque cluster : la phrase estretenue
148/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationAnalyse morphologique
Recherche de paraphrases :
La présence du terme n’est pas indispensable
Terms composés uniquement
GN, GV
Difficulté liée à la segmentation en phrases
Liens syntaxiques et sémantiques entre les composants
149/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationAnalyse morphologique
Mapping direct :
dorsalgie : douleur dans le dos
myélocyte : cellules dans la moelle osseuse
lombalgie : douleurs dans les reins
glycohémoglobine : quantité de sucre par litre de sang
gastralgie : douleurs à l’estomac
desmorrhexie : rupture des ligaments
hépatite : inflammation du foie
...
150/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationAnalyse morphologique
Mapping indirect :
spondylopathie : les vertèbres ont été touchées
néphropathie : avoir mal aux reins
cardialgie : problèmes du coeur
151/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Règles de mise en relationAnalyse morphologique
Comparaison entre les méthodes :
Définitions et gloses sont complémentaires
Comparaison avec Dérif :corpus : moins exhaustif et moins opaque (les thématiques, lataille... des corpus)Dérif : plus exhaustif et plus opaque (règles très générales pourla génération de gloses)myélocyte
(Partie de – Type particulier de) cellule en rapport avec le(s)moellecellules dans la moelle osseuse
desmorrhexierupture (du – liée au) ligamentrupture des ligaments
glycohémoglobine(Partie de – Type particulier de) hémoglobine en rapport avecle(s) sucrequantité de sucre par litre de sang
152/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Étude de corpus
Corpus monolingues
Corpus monolingues parallèles
Corpus bilingues parallèles
Corpus comparables
153/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Étude de corpus
Données obtenues suite au dépouillement de corpus
Données source :
ouvrages, littérature scientifiquesites webpresses
Matériel : étude possible de phénomènes différents
Difficulté :
détecter et extraire la paraphrase
154/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Étude de corpusCorpus monolingues
Corpus tout-venant
Indicateurs intra-corpus :
approches distributionnelles
Marqueurs de paraphrasage :
définitionsreformulationsdiscursives (genre...)
Connaissances externes :
ressources linguistiques et sémantiques
155/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Étude de corpusApproches distributionnelles
Issues des travaux de travaux de (Harris, 1968)
Mots similaires apparaissent dans des contextes similaires
Approche paradigmatique
156/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Étude de corpusApproches distributionnelles
Classes de mots/termes
Sens des unités lexicales⇐= rapprochement contextuelRelations de dépendance syntaxiqueobjet de, sujet de, etc.
Indices lexicaux
Différents types de relations
Similarité sémantique entre les classes
large : small, important, major, great, various, main, different,field, newpatient : case, group, child, day, treatment, woman
157/213 Natalia Grabar
Introduction Approches et Classifications Données Notions proches Ailleurs
Étude de corpusApproches distributionnelles
(Grefenstette, 1994)
Typage manuel