221
Introduction Approches et Classifications Donn´ ees Notions proches Ailleurs Reformulations et paraphrases eminaire M1/M2 Sciences du Langage Natalia Grabar http://natalia.grabar.perso.sfr.fr/ CNRS STL UMR8163 2013-2014 1/213 Natalia Grabar

Reformulations et paraphrases Séminaire M1/M2 Sciences du Langagenatalia.grabar.free.fr/cours/paraphrase.pdf · 1 V N 2!N 2 ^etre V pp par N 1 Paraphrase = syst eme complet de transformations

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Reformulations et paraphrasesSéminaire M1/M2 Sciences du Langage

    Natalia Grabarhttp://natalia.grabar.perso.sfr.fr/

    CNRS STL UMR8163

    2013-2014

    1/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Déroulement du cours

    1 12 heures, travaux théoriques et pratiques

    21 jan, 28 jan, 4 fév, 11 fév, ?séminaire partagé avec F Tayalati (+ 12h)

    2 Travail avec les documents et les données linguistiques

    en français, anglais...

    3 Lecture d’articles

    4 Contrôle continu

    2/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Plan du cours

    1 Introduction

    2 Approches et Classifications

    3 Données

    4 Notions proches

    5 Ailleurs

    3/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Dire la même chose autrement

    1 Il est ici depuis 2 heures

    2

    3

    4

    5

    6

    4/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Dire la même chose autrement

    1 Il est ici depuis 2 heures

    2 La route a été déviée par la gendarmerie

    3

    4

    5

    6

    5/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Dire la même chose autrement

    1 Il est ici depuis 2 heures

    2 La route a été déviée par la gendarmerie

    3 Pierre est respecté par tout le monde

    4

    5

    6

    6/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Dire la même chose autrement

    1 Il est ici depuis 2 heures

    2 La route a été déviée par la gendarmerie

    3 Pierre est respecté par tout le monde

    4 De battre mon coeur s’est arrêté

    5

    6

    7/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Dire la même chose autrement

    1 Il est ici depuis 2 heures

    2 La route a été déviée par la gendarmerie

    3 Pierre est respecté par tout le monde

    4 De battre mon coeur s’est arrêté

    5 carré

    6

    8/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Dire la même chose autrement

    1 Il est ici depuis 2 heures

    2 La route a été déviée par la gendarmerie

    3 Pierre est respecté par tout le monde

    4 De battre mon coeur s’est arrêté

    5 carré

    6 céphalée

    9/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Étymologie

    para- : à côté de, le long de

    phrasis : action d’exprimer par la parole, discours

    10/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Définition

    Paraphraser :

    reformuler de texte en conservant le sens ;produire un texte cible à partir d’un texte source afin declarifier, expliciter ou développer certains aspects

    Peux comprendre d’autres phénomènes linguistiques :

    synonymievariation terminologique (souvent morpho-syntaxique)...

    11/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Pourquoi paraphraser ?

    Compétence linguistique des locuteurs

    témoigne de la compréhension

    Ne pas rester bloquer :

    remplacer un mot, qui ne vient pas, par un autre ou par uneexpression

    Varier le discours

    Éviter les répétitions

    Exposer les idées plus précisément

    Expliquer mieux

    Développer/abréger les propos

    Changer de style ou de registre

    ...

    Production vs reconnaissance

    12/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Difficultés

    Paradoxe :

    dire la même chose, etdire autre chose en même temps

    Toute modification de forme implique une modification desens...

    Scalaire ou continuum

    Acceptabilité des paraphrases

    Formalisation de la paraphrase

    13/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Difficultés

    14/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Difficultés

    personne qui pratique la loi criminelle

    avocat de la loi criminelle

    personne criminelle qui pratique la loi

    personne qui exerce la loi criminelle

    personne qui pratique la loi de manière criminelle

    praticien de la loi criminelle

    personne criminelle qui exerce la loi

    personne qui applique la loi criminelle

    juriste qui applique la loi criminelle

    15/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Approches et Classifications

    1 Dimensions de la paraphrase

    2 Approches linguistiques de la paraphrase

    3 Classifications de la paraphrase

    4 Relations impliquées dans la paraphrase

    16/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Dimensions de la paraphrase

    1 Niveau de langue :

    linguistique (syntaxique, sémantique), discursif et énonciatif

    2 Taille d’unités couvertes par la paraphrase

    lexicale, sous-phrastique, phrastique

    3 Types de transformations :

    morphologique, sémantique, syntaxique, lexico-syntaxique...

    4 Types de connaissances requises5 Registre de langue :

    spécialisé, non spécialisé

    6 Degré d’équivalence7 Langue :

    traductions

    17/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Niveau de langueApproche à dominance syntaxique

    + courant transformationnel : école de Zellig Harris (Harris,1968)

    ∼ courant générativiste : école de Noam Chomsky (Chomsky,1965)

    à lexique constant :

    Il est facile de contenter JeanJean est facile à contenterContenter Jean c’est facile

    18/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Niveau de langueApproche à dominance syntaxique

    Grammaire et règles de réécriture ou transformationsyntaxique

    Paul lit le livreLe livre est lu par PaulN1 V N2 → N2 être Vpp par N1

    Paraphrase = système complet de transformations dans lalimite de la grammaire

    Approche limitée aux phénomènes syntaxiques

    les phénomènes lexicaux non pris en chargeremplacement d’un mot dans une phrase par son synonyme

    ⇒ Apparition de la sémantique générative (McCawley, 1968)

    19/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Niveau de langueApproche à dominance sémantique

    Courants qui visent à reconstruire un modèle global del’activité de langage par les sujets

    (Melčuk, 1984 1999; Melčuk, 1988; Martin, 1976), (Pottier,1974; Culioli, 1976; Milicevic, 2007)

    Objectifs :

    répertorier les formes linguistiques de la paraphraseanalyser finement les relations sémantiques qui unissent lesparaphrases

    TST (Melčuk, 1984 1999) : Langue comme un système deparaphrasage

    Les approches négligent souvent le rôle du contexte

    20/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Niveau de langueApproche discursive et énonciative

    Théorie de l’énonciation (Culioli, 1976; Fuchs, 1982)

    Activité métalinguistique spontanée

    Objectifs :

    ne pas se limiter à une analyse purement linguistiqueprendre en compte le contexte de l’énonciation

    Paraphraser c’est se livrer à une activité de reformulation, parlaquelle on restitue le sens d’un discours (énoncé ou texte)déjà produit.

    La paraphrase ne se comprend qu’en situation decommunication réelle faisant intervenir un contexte communet identifié.

    21/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Niveau de langueApproche discursive et énonciative

    Paraphrase linguistique vs contextuelle :

    . . . ce que nous avons qui est très précieux ce sont des rushsc’est-à-dire euh l’intégralité euh de ce qui a été tourné par lesréalisateurs et qui n’est parfois pas repris en montage et quidonnent donc l’idée de la globalité du travail fait par unréalisateur. . . et depuis toujours les ouvriers sont confrontés au mêmeproblème : comment comment débiter au mieux c’est-à-direproprement et rapidement les blocs de beurre ;

    22/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Taille d’entités couvertes par la paraphraseDifférents types de paraphrases selon leur taille (Fløttum, 1995;Bouamor, 2012) :

    Paraphrase lexicale :se situe par rapport au mot,des unités lexicales individuelles ont la même signification,synonymes {bouquin, livre}, hyperonymes {bâtiment, maison} ;

    Paraphrase sous phrastique :l’équivalence se fait sur dessyntagmes, des tournures de phrases ou des fragments de textes :

    Il a envie de, Il aimerait bienX ne doute pas de Y, X est sûr de Y

    Paraphrase phrastique :deux phrases ou énoncés représentent un même contenusémantiqueau niveau de la phrase complète :

    Pourriez-vous me donner cette information ?Seriez-vous en mesure de me fournir cerenseignement ?23/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Types de transformations

    Différents types de paraphrases selon les transformationslinguistiques effectuées :

    Paraphrase sémantique :

    utilisée pour adapter sa façon de parler ou s’exprimer de façonplus appropriée ou encore pour clarifier leurs pensées (Melčuk,1988) :

    Pierre a enlevé son manteau.Pierre a ôté son manteau.

    Paraphrase syntaxique :

    a pour condition le changement de la catégorie syntaxique,nominalisation : adjectif → nom,passivation : phrase active → phrase passive ;

    Paraphrase lexico-syntaxique (Bouamor, 2012) :

    modification de la structure de phrase d’origine (niveausyntaxique),changement des unités lexicales employées (niveau lexical).

    24/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Discours ou Registre de langue

    Il existe les langues de spécialité (médecine, économie,juridique, cuisine...) et la langue générale

    Les langues de spécialité ont le lexique et la syntaxeparticuliers (Sinclair, 1994)

    La mise en parallèle des expressions de deux registres(spécialisé et non spécialisé)

    permet d’établir les équivalences inter-discours

    25/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Discours ou Registre de langue

    (Cartoni & Deléger, 2011)

    retard de cicatrisation/retarder la cicatrisation,apports caloriques/apport en calories,calculer les doses/doses sont calculées,efficacité est renforcée/renforcer son efficacité

    (Deléger & Zweigenbaum, 2008) :

    consommation régulière/consommer de façonrégulière,gêne à la lecture/empêche de lire,évolution de l’affection/la maladie évolue

    (Zeng & Tse, 2006)

    {myocardial infarction, heart attack},{abortion, termination of pregnancy},{acrodynia, pink disease}

    26/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Langue

    Traduction : paraphrase interlangue ou interlinguistique(Fuchs, 1982; Milicevic, 2007)

    établissement d’équivalences interlangues{livre, book}{lecture, reading}{pets, animaux domestiques}

    27/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Travaux et Classifications de la paraphrase

    (Jakobson, 1956)

    (Harris, 1976)

    (Ungeheuer, 1969)

    (Apresian, 1973)

    (Melčuk, 1984 1999)

    (Honeck, 1971)

    (Martin, 1976)

    (Dras, 1999)

    (Barzilay & Elhadad, 2003)

    (Milicevic, 2007)

    (Fujita, 2010)

    (Vila et al., 2011)

    (Bhagat & Hovy, 2013)28/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphraseRéactions au stimulus “ hutte ” (Jakobson, 1956)

    paraphrase

    syntagmatique

    paradigmatique

    contiguïté

    similaritéantonymes

    synonymes

    métonymie

    tautologie

    métaphore

    contiguïté

    similarité

    29/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Relations impliquées dans la paraphraseRéactions au stimulus “ hutte ” (Jakobson, 1956)

    Paradigmatique :Contigüıté :

    métonymie : chaume, paille, pauvreté

    Similarité :

    tautologie : huttesynonymie : cabane, cahuteantonymie : palaismétaphore : antre, terrier

    Syntagmatique :Contigüıté :

    a brûlé

    Similarité :

    est une pauvre petite maison

    30/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Harris, 1976)

    Dans la cadre de l’analyse du discours :

    notion de transformationune relation d’équivalence entre phrasesqu’on établit à partir de l’analyse des cooccurrences

    Équivalent = équivalent dans un environnement donné

    Équivalence = les schémas de phrases

    Il y a relation de transformation entre deux schémas dephrases

    si l’échelle d’acceptabilité de leurs réalisations respectivesdemeure inchangée

    Transformations orientées :

    la variante la plus simple et la plus productive est considéréecomme source de la transformationI say this → This say Imais pas vice-versa

    31/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Harris, 1976)

    paraphrase

    pronominalisations

    permutations

    attachements

    effacements

    variantes bi−univoques

    variantes multivoques

    32/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Harris, 1976)

    Paraphrases syntaxiques

    Variantes “ multivoques ” :pronominalisations :

    Il a pris un gros stylo et j’ai pris un petit styloIl a pris un gros stylo et j’en ai pris un petit

    effacements :

    Un pot qui est en verre qui est bleu et craqueléUn pot en verre bleu et craquelé

    Variantes “ bi-univoques ” :attachements :

    J’ordonne que tu te lavesLave-toi !

    permutations :

    Jean, parce qu’elle lui a téléphoné, est parti en hâteParce qu’elle lui a téléphoné, Jean est parti en hâte

    33/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Ungeheuer, 1969)

    variation maximale

    variation totale

    variation minimale

    paraphrase

    transformation syntaxique avec conservation lexicale

    changement lexical d’ordre rhétorique

    réduction ou expansion d’un mot

    changement synonymique

    34/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Ungeheuer, 1969)

    Variation minimale :réduction ou expansion d’un mot :

    Je mange tout le fromage/Je mange le fromageIl aime les fleurs/Il aime les belles fleurs

    transformation syntaxique avec conservation lexicale :

    Je le bats/Il est battu par moi

    changement synonymique :

    Je le vois/Je le regarde/Je le remarque

    changement lexical d’ordre rhétorique :

    Il habite chez moi/Il vit sous mon toit

    Variation totale :

    J’ai faim/Dépêche-toi de préparer à manger !

    Variation maximale :

    résumé d’un texte entier en une phrasedéveloppement d’une phrase en un texte

    35/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Apresian, 1973)

    paraphrase

    transformation lexicale

    transformation syntaxique à lexique constant

    36/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Apresian, 1973)

    Transformation syntaxique à lexique constant :

    changements dans les relations syntaxiqueschangements dans l’ordre des motschangements dans le statut dérivationnel-flexionnel des mots

    37/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Apresian, 1973)

    Transformation lexicale :passage à la converse :

    C’est plus un planificateur qu’un rêveur/C’est moins un rêveurqu’un planificateur

    passage à l’antonyme :

    Tout le monde se souvient/Personne n’a oublié

    passage à un terme générique suivi d’un modificateur :

    Il murmure/Il parle dans un murmur

    passage à une dérivé :

    Il m’aide/Il me donne de l’aide

    passage à un mot relié sémantiquement :

    Il régna 30 ans/Il occupa le trône pendant 30 ans

    passage au “ code sémantique ” :

    Personne ne vint, à part lui/Il fut le seul à venir

    passage à un synonyme lexical :

    La distance entre eux fut réduite de moitié/La distance entreeux fut coupée de moitié

    38/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    Théorie Sens-Texte (TST), élaborée à partir des années 60

    Paraphrase : cadre théorique pour la construction de modèlesdes langues

    le sens langagier : l’invariant des paraphrasesla langue : un mécanisme de production de paraphrases

    Visée universelle : principes généraux applicables à plusieurslangues

    russe, français, anglaismodèle logique

    Couverture de 7 niveaux de la langue

    Importance du niveau lexical

    Dictionnaire explicatif et combinatoire (DEC) :

    dérivés sémantiques de mots et leurs collocationsproduction d’un texte à partir d’un sens

    39/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    Définition de 67 fonctions lexicales de paraphrasage

    Fonction lexicale (FL) : fonction au sens mathématique duterme

    une correspondance f qui associe à une lexie L, appeléel’argument de f , un ensemble de lexies f (L), la valeur de fcomme cette fonction n’opère qu’avec des lexies, il s’agit defonctions lexicales

    Fonction lexicale :

    normale : applicable plusieurs lexiesdégénérée : applicable à une seule lexie

    Intensification :

    pleurer/comme une Madeleinepluie/glosse

    40/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL : outils formels pour la modélisation de :relations lexicales, notamment des phénomènes decooccurrence lexicale restreinte (collocations)

    se mettre le doigt dans l’oeilcordon bleu

    dérivation sémantique lexicale

    prison / prisonnierprison / incarcérer

    FL : sens dont l’expression est phraséologiquement liée parune lexie (argument, mot-clé de la FL)

    41/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    Les FL jouent un double rôle dans la description linguistique :les FL servent à décrire les relations lexicales dans le lexiqued’une langue :

    les relations paradigmatiques et les relations syntagmatiquesentre les lexies ;concerne directement le dictionnaire : il représente unproblème lexicographique avant tout.

    les FL servent à décrire la synonymie entre phrases basée surles relations sémantiques entre lexies, c’est-à-dire lesparaphrases lexicalesrelève de la sémantique et de la syntaxe profonde

    Les règles de paraphrasage (= les équations sémantiques entreFL) sont d’une importance primordiale

    42/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    La fonction lexicale f est dite standard ssi :f est définie pour un grand nombre d’arguments. Autrementdit, f a une vaste cooccurrence sémantique : le sens (f ) estsuffisamment abstrait et général pour être compatible avecbeaucoup d’autres sens ;f possède un grand nombre de valeurs différentes. Autrementdit, l’ensemble de toutes les valeurs de f pour tous lesarguments est suffisamment grand.

    sinon : fonction lexicale non standardsens spécialisé, domaines lexicaux particuliers/de couleur marron/ :

    koriqnevy� [koričnevyj] (général)kari� [karij] (yeux)temnorusy� [tëmnorusyj] ou kaxtanovy� [kaštanovyj](cheveux)gnedo� [gnedoj] (cheval)

    café crème (au lait, arrosé, irlandais, ...) ; nuit blanche

    FL syntagmatiques et paradigmatiques43/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    X = COD, Y = actant/sujet

    FL paradigmatiques visent la NOMINATION/SÉLECTIONLEXICALE

    Comment appelle-t-on l’objet / la situation X , apparenté/e àY ? quand on veut parler de X , ET NON PAS de Y

    FL syntagmatiques visent la COMBINATOIRE LEXICALE

    Comment appelle-t-on l’action/la caractéristique/l’attribut Xde Y ? quand on veut parler de Y et de X en même temps

    44/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    Les FL paradigmatiques n’ont pas la capacité d’apparâıtredans le texte avec leurs mots-clés

    S1(crime) = criminel

    Les FL syntagmatiques ont la capacité d’apparâıtre dans letexte avec leurs mots-clés

    Magn(dormir) = comme une souche

    45/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    paraphrase

    paradigmatique

    dérivations syntaxiques (S A V Adv)

    dérivations actantielles (S A Adv)

    qualificatifs d’actants potentiels (Able Qual)

    relations de substitution (Syn Anti Contr Conv Gener)

    prédicateur (Pred)

    verbes phasaux (Incep Cont Fin)

    verbes aspectuels (Prox Perf Result)

    verbes causatifs (Caus Liqu Perm)

    verbes introducteurs d’une nouvelle situation (Involv Manif Sympt)

    verbes divers (Prepar Son)

    prépositions liées au mot−clé (Instr Loc Propt)

    noms quasi−synonymes (Figur Gener)

    noms quasi−méronymes (Sing Mult Cap Equip Centr Culm Germ)

    modifieurs adjectivaux et adverbiaux (Magn Bon Ver Posi Epit Plus Minus Pejor)

    syntagmatique

    verbes ayant un sens négatif (Degrad Excess Obstr Nocer)

    verbes supports (Oper Func Labor)

    verbes de réalisation (Real Fact Labreal)

    dérivations circonstancielles (instr med res mod loc)

    ordre typique (Imper)

    46/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    un moyen de description de collocations

    un outil très efficace pour la description de ce qu’on pourraitappeler les “ dérivations sémantiques ” du mot clé L

    les synonymes et les quasi-synonymes de L, ses antonymes etquasiantonymes, ses conversifs et quasi-conversifs...

    47/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Relations de substitution Syn, Anti, Contr, Convijk , Generp

    Dérivations syntaxiques S0, A0, V0, Adv0

    Dérivations actantielles Si , Ai , Advi

    Dérivations circonstancielles Sinstr , Smed , Sres , Smod

    Qualificatifs d’actants potentiels Ablei , Quali

    Ordre typique Imper

    (synthèse de (Alonso Ramos & Tutin, 1996))

    48/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Syn : synonyme exactSyn(avion) = appareil

    Syn⊃ : quasi-synonyme plus spécifique (plus riche)Syn⊃(respect) = vénération

    Syn⊂ : quasi-synonyme moins spécifique (plus général)Syn⊂(vénération) = respect

    Syn∩ : quasi-synonyme avec une intersection non vide de sensSyn∩(seconder) = assister

    49/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Conv : conversiflexème qui dénote une relation converse de la relation expriméepar le mot clé de cette FLles indices donnent l’ordre des actants SyntP associés auconversif relativement à l’ordre des actants SyntP associés aumot clé du conversif, qui est toujours ”123”

    Conv21(crainde) = effrayer

    Conv21(avant) = après

    Conv3214∩(vendre) = acheter

    50/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Anti : antonyme exactAnti(respect) = irrespect

    Anti⊃ : quasi-antonyme plus spécifiqueAnti⊃(désespoir) =

    Anti⊂ : quasi-antonyme moins spécifiqueAnti⊂(mépris) =

    Anti∩ : quasi-antonyme avec une intersection non vide desens

    Anti∩(aider) =

    51/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Anti : antonyme exactAnti(respect) = irrespect

    Anti⊃ : quasi-antonyme plus spécifiqueAnti⊃(désespoir) = espoir

    Anti⊂ : quasi-antonyme moins spécifiqueAnti⊂(mépris) = respect

    Anti∩ : quasi-antonyme avec une intersection non vide desens

    Anti∩(aider) = gêner

    52/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Contr : contrastifContr(d’acier) = de veloursContr(mer) = terreContr(tête) = coeur

    53/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Gener : mot générique pour LGener(gaz) = substance [gazeuse]Gener(pistolet) = arme à feuGener(république) =Gener(colère) =Gener(chou) =

    54/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Gener : mot générique pour LGener(gaz) = substance [gazeuse]Gener(pistolet) = arme à feuGener(république) = état [républicain]Gener(colère) = sentiment [de ∼]Gener(chou) = légume

    55/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Dérivés syntaxiques du mot clé sans changement du sens

    dérivation au sens sémantique

    S : nomS(acheter) = achatS(tomber) =

    V : verbeV(promesse) =

    A : adjectifA(école) =A(ville) =

    Adv : adverbeAdv(honnête) =

    56/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Dérivés syntaxiques du mot clé sans changement du sens

    dérivation au sens sémantique

    S : nomS(acheter) = achatS(tomber) = chute

    V : verbeV(promesse) = promettre

    A : adjectifA(école) = scolaireA(ville) = urbain

    Adv : adverbeAdv(honnête) = honnêtement

    57/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Fonctions nominales : nom typique pour le premier, deuxième,troisième, etc. actant SyntP du mot clé

    S1(crime) = criminelS2(crime) = victimeS1(acheter) = acheteurS2(acheter) = achatS3(acheter) = vendeurS4(acheter) = prix

    Sinstr , Sloc , Smed , Smod , Sresnom typique pour le circonstant exprimant l’instrument, le lieu,le moyen, le mode et le résultat

    58/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Fonctions adjectivales : modificateur typique pour le premier,deuxième, troisième, etc. actant SyntP du mot clé

    A1(mépris) = plein, rempli [de ∼]A1(chercher) = en quête [de N]A2(mépris) = couvert [de ∼]A2(diriger) = sous la direction [de N]

    AbleAble1 : qui peut (facilement) avoir/faire/...

    Able1(pleurer) = pleurnichardAble1(peur) = peureux

    Able2 : qu’on peut (facilement) soumettre à...)/(qui peut(facilement) causer...)

    Able2(dissoudre) = solubleAble2(peur) = effrayant

    ...59/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL paradigmatiques :

    Qual : qui entrâıne Ablei avec une forte probabilitéQual(mentir) = malhonnêteQual(tromper) = näıf

    Imper :Imper(secourir) = Au secours !, SOSImper(tirer) = feu !

    60/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Verbes supports Operi , Funci , Laborij

    Verbes de réalisation Reali , Facti , Labrealij

    Prédicateur Pred

    Verbes phasaux Incep, Cont, Fin

    Verbes causatifs Caus, Liqu, Perm

    Verbes aspectuels Prox, Perf, Result

    Verbes introducteurs d’une nouvelle situation Involv, Manif, Symptijk

    Verbes ayant un sens négatif Degrad, Excess, Obstr, Nocer

    Verbes divers Prepar, Son

    Modifieurs adjectivaux et adverbiaux Magn, Bon, Ver, Posi, Epit, Plus,Minus, Pejor

    Prépositions liées au mot-clé Instr, Locin/ab/ad , Propt

    Noms quasi-synonymes Figur, Gener

    Noms quasi-méronymes Sing, Mult, Cap, Equip, Centr, Culm, Germ

    (synthèse de (Alonso Ramos & Tutin, 1996))61/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Magn est un intensificateur :Magn(riposte) = foudroyanteMagn(sourd) = comme un potMagn(cri) =Magn(fort) =Magn(soûl) =Magn(apprécier) =Magn(ivre) =

    62/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Magn est un intensificateur :Magn(riposte) = foudroyanteMagn(sourd) = comme un potMagn(cri) = d’orfraie / avec pousserMagn(fort) = comme un TurcMagn(soûl) = comme un Polonais, comme une grive (unebarrique, une bourrique)Magn(apprécier) = grandementMagn(ivre) = -mort

    63/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Oper1 est un verbe sémantiquement vide (ou vidé de son sensdans le contexte de son mot clé) :

    1 le mot clé comme son complément d’objet direct (COdir) ouprincipal (si le verbe n’est pas transitif), c’est-à-dire commeson actant Synt(axique) P(rofond) II ;

    2 l’actant SyntPI potentiel du mot clé comme son sujetsyntaxique, donc comme son actant SyntPI

    Oper1(plainte) = porter [∼]

    64/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Oper1(plainte) = porter [∼]Oper1(cri) =

    Oper1(grippe) =

    Oper1(désespoir) =

    Oper1(efforts) =

    Oper1(ordre) =

    Oper1(suprématie) =

    Oper1(regard) =

    Oper1(précaution) =

    65/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Oper1(plainte) = porter [∼]Oper1(cri) = pousser [ART ∼]Oper1(grippe) = avoir [ART ∼]Oper1(désespoir) = être [au ∼]Oper1(efforts) = déployer [ART ∼]Oper1(ordre) = donner [à N ART ∼]Oper1(suprématie) = détenir, exercer [sur N ART ∼]Oper1(regard) = jeter [à N ART ∼]Oper1(précaution) = prendre [ART ∼]

    66/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Epit : épithète courante sémantiquement videEpit(océan) = immenseEpit(gagnant) = heureuxEpit(défier) = ouvertement

    Figur : métaphore codifiée par la langue dont la combinaisonavec le mot clé est un synonyme plus spécifique du mot clé(expression figurée de ...)

    Figur(fumée) = rideau [de ∼]Figur(oubli) = voile [de l’∼]

    67/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Sing : un quantum régulier deSing(flotte) = navireSing(ail) = gousseSing(riz) = grain [de ∼]

    Mult : ensemble régulier deMult(navire) = flotteMult(chien) = meute [de ∼s]Mult(abeille) = essaim, nuée [de ∼]Mult(barbares) = horde [de ∼s]Mult(oiseau) = volée [de ∼s]Mult(foin) = botte [de ∼]

    68/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Cap : chef deCap(université) = recteur [de ART ∼]Cap(orchestre) = chef [d’∼]Cap(bordel) = madameCap(avion) = commandantCap(navire) = capitaine [de ART ∼]Cap(théâtre) = directeur [de ART ∼]

    Equip : équipe deEquip(université) = personnel [de ART ∼]Equip(orchestre) = musiciens [de ART ∼]Equip(bordel) = fillesEquip(navire, avion) = équipage [de ART ∼]Equip(théâtre) = troupe [de ART ∼]

    69/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    FL syntagmatiques :

    Centr : le centre de, le milieu deCentr(problème) = coeur [du ∼]

    Culm : culmination deCulm(joie) = au comble [de la ∼]Culm(colère) = paroxysme [de la ∼]

    Real : réaliser les ”objectifs” inhérents de la choseReal1(peine) = infliger [ART ∼]Real2(peine) = purger [ART ∼]Real(piège) = donner, tomber [dans ART ∼]Real(ordre) = exécuter [ART ∼]Real(rêve) = se réaliser

    70/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Melčuk, 1984 1999)

    Combinaison de FL :

    AntiMagn(majorité) = courte, faible

    AntiVer(reprocher) = à tord

    AntiBon(choix) = malheureux

    AntiReal3(ordre) = défier

    Magn+Figur(haine) = feu [de la ∼]Magn+Figur(feu) = déluge [de ∼]AntiMagn+Figur(espoir) = lueur [d’∼]AntiMagn+Figur(hésitation) = ombre [d’une ∼]ImperContReal(téléphone) = Ne quittez pas !

    71/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Honeck, 1971)

    paraphrase

    transformationnelle

    lexicale

    formalexicale

    72/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Honeck, 1971)

    Description à haut niveau des paraphrases

    Paraphrase transformationnelle :

    la structure de surface de la phrase ou du segment d’origineest inchangée,seuls les mots utilisés sont modifiésLe chat a mangé la souris/La souris a été mangée par le chat

    Paraphrase lexicale :

    la structure de surface de la phrase ou du segment d’origineest conservée,certains mots pleins sont remplacés par un synonyme,Le chat a mangé la souris/Le félin a dévoré la souris

    Paraphrase formalexicale :

    la structure de surface est modifiée,les mots pleins de la phrase ou le segment de base sont aussimodifiés,Le chat a mangé la souris/Le rongeur a été dévoré par le minou

    73/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Martin, 1976)

    Mise en évidence les difficultés de définir la paraphrase

    Deux phrases Pi et Pj seront dites en relation de paraphrasesi, pour tout locuteur et en toute situation, Pi estlogiquement équivalente à Pj .

    L’équivalence logique fait référence aux trois propriétésmathématiques :

    symétrie, transitivité, réflexivité

    ... la reformulation en discours est une relation qui ne vérifieaucune des trois propriétés suivantes : transitivité, symétrie etréflexivité ... (Fuchs, 1994; Levrat & Amghar, 1995)

    74/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Martin, 1976)

    (Fuchs, 1994; Levrat & Amghar, 1995) :Symétrie : La relation R est symétrique ssi E1 est en relationavec E2, et E2 est lui aussi en relation avec E1

    synonymie,on considère souvent la paraphrase comme un contenu étendude la phrase initiale ;

    Transitivité : La relation R est transitive ssi E1 est en relationavec E2, lui-même en relation avec E3, et E1 est aussi enrelation avec E3

    policier/flic, policier/poulet → flic/pouletla succession des paraphrases induit des déformationssémantiques, ce qui fait perdre la transitivité des phrases ;

    Réflexivité : La relation R est réflexive ssi E1 est en relationavec lui-même

    autonymie, énoncés définitoiresune phrase est rarement considérée comme paraphrased’elle-même.

    75/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Dras, 1999)

    paraphrase

    changement de relation

    suppression

    déplacement de proposition

    changement d’emphase

    changement de perspective

    76/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Dras, 1999)

    Changement de perspective :

    changement dans la façon dont les éléments de texte sontreprésentésremplacement d’un verbe par un adjectifCe manuscrit peut être lu./Ce manuscrit est lisible.

    Changement d’emphase :

    changement de la structure syntaxique d’une phrase enmodifiant son focuspassage de la voix active à la voix passiveMaman a servi le repas./Le repas a été servi par maman.conversion de la phrase sous forme de phrase pseudo-clivéeLe chat a bu tout le lait./Celui qui a bu tout le lait, c’est lechat.

    77/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Dras, 1999)

    Changement de relation :changement de connexion entre les propositions des phrasesUne étude conduite par � Gallup Poll � a indiqué qu’unAméricain sur quatre croit aux fantômes./Une étude a étéconduite par le � Gallup Poll �. Elle a indiqué qu’unAméricain sur quatre croit aux fantômes.

    Suppression :suppression d’éléments périphériques de la phrase d’origineles paraphrases sont unidirectionnellesLa situation de guerre a affecté de nombreuses personnes./Laguerre a affecté de nombreuses personnes.

    Déplacement de proposition :changement de la position de quelques expressions dans laphraseL’étudiant a copié les schémas importants avant de rendre lelivre./Avant de rendre le livre, l’étudiant a copié les schémasimportants

    78/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Barzilay & Elhadad, 2003)

    paraphrase

    atomique lexicale

    composite transformations lexicales

    transformations syntaxiques

    opération d’édition

    79/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Barzilay & Elhadad, 2003)

    Paraphrase atomique :

    unités lexicales non décomposables (mots ou petits segments)niveau lexical

    Paraphrase composite :

    constructions qui peuvent être décomposées en de plus petitesunités (phrases et segments complexes)modifications de haut niveau affectant la phrase d’origine :

    opérations d’éditiontransformations syntaxiques et lexicales

    80/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    Modélisation de la paraphrase en se basant sur la TST

    Paraphrase linguistique

    Paraphrase entre les phrases (quasi)synonymesParaphrase approximative

    ne possédant pas nécessairement un sens absolument identique

    La paraphrase est définie selon deux aspects :une relation de (quasi-)synonymie entre phrases, dans sonaspect statique,une opération permettant de produire des phrases(quasi-)synonymes, dans son aspect dynamique.

    Modélisation de la capacité paraphrastique d’un locuteurrevient à proposer des règles linguistiques décrivantformellement les liens paraphrastiques :

    X est sûr de YX ne doute pas de YY est un fait certain pour XY ne soulève chez X aucun doute

    81/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    La synonymie exacte des expressions langagières est très rare

    La synonymie ou la paraphrase approximative(quasi-synonymie) est très répandue (omniprésente)

    Les différences sémantiques :

    peuvent toujours être trouvées entre deux expressions

    Dans la communication quotidienne :

    ces différences sont ignorées par les locuteursdans des conditions contextuelles appropriéesil suffit que deux phrases soient approximativement synonymespour qu’elles soient considérées comme des paraphrases

    82/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    La complexité des faits de paraphrase s’explique par :

    la multiplicité des paramètres qui interviennent dans leparaphrasagel’extrême richesse des moyens linguistiques synonymiques(moyens paraphrastiques)

    83/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    paraphrase

    types de moyens d’expression utilisés

    exactitude du lien paraphrastique

    mode de production

    dimensions de sens impliquées

    type de connaissances mis en jeu

    cognitive/contextuelle

    linguistique

    propositionnellecommunicative

    rhétoriquelexicale

    morphologiquesyntaxique

    exacteapproximative

    virtuelle

    reformulative

    84/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    Type de connaissances mis en jeu pour leur production

    Données pragmatiquescontextuelles :

    Depuis une centaine d’années, les températures du globetendent à augmenterDepuis 1900, les températures du globe tendent à augmenter

    actes illocutoires :

    I wouldn’t, if I was youDon’t

    actes perlocutoire :

    La poubelle est pleine.Va vider la poubelle.

    85/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    Type de connaissances mis en jeu pour leur production

    Connaissances näıves sur le monde

    Il portait des bottes ab̂ımées.Ses bottes avaient besoin d’être réparées.

    Connaissances encyclopédiques

    Baudelaire aimait les chats.L’auteur des “ Fleurs du mal ” aimait les chats.

    Capacités logiques/arithmétiques, etc. du locuteur

    Baltazar n’est pas fiable.Baltazar peut te laisser en plan

    86/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    Type de connaissances mis en jeu pour leur production

    Paraphrase linguistique

    Are you being served ?Is anybody looking after you ?Is anybody taking care of you ?Are you being attended to ?Are you being seen to ?

    87/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    Dimensions de sens impliquées

    Propositionnelle, communicative, rhétorique

    Smoking increases the risk of cancer by 50% :

    p : causationc :r : neutre

    For a smoker, the risk of cancer is 50% higher. :

    p : pas de causationc : mise en avant plan du Thème (fumeurs)r : neutre

    If you smoke, your risk of cancer is 50% higher. :

    p : implicationc :r : personnalisée

    88/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    Types de moyens d’expression utilisés

    lexical

    morphologique

    syntaxique

    ...

    89/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    Exactitude du lien paraphrastique

    exacteles phrases sont synonymes complets, mais contiennent leséléments qui ne le sont pas

    Il faut analyser ce phénomène.Il faut effectuer une analyse de ce phénomène.

    approximativeavec inclusion de sens

    Baltazar walked quickly across the road.Baltazar hurried across the road.

    avec intersection de sens

    The victim was stabbed to death.The victim was killed with a knife.

    90/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Milicevic, 2007)

    Mode de production

    virtuelle

    fixer un sensproduire toutes les paraphrases possiblesacceptées par les règlesD’avoir pris ce médicament a calmé B.La prise de ce médicament a calmé B.La prise de ce médicament a fait se calmer B.

    reformulativel’accent est mis sur la reformulation soit du sens initial soit desphrases obtenues

    D’avoir pris ce médicament a calmé B.Ce médicament a calmé B.Suite à la prise de ce médicament, Baltazar s’est calmé.Parce qu’il a pris ce médicament, Baltazar s’est calmé.

    91/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Typologie assez générale et exhaustive

    Linguistiquement fondée et axée sur la dénotation

    La typologie comporte cinq classes de paraphrases :

    extraphrastiques, extra-clausales, syntaxiques,morpho-syntaxiques et lexicales.

    Distinction entre classes : portée sémantique et degré degénéralité des paraphrases

    92/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    paraphrase

    syntaxique

    morpho−syntaxique

    lexicale

    extra−clausale

    extraphrastique

    93/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Extraphrastique :séparation de clauses relatives

    Sm̊aland, which is located to the south-west of Stockholm, iscalled “The Kingdom of Glass”. The reason is that there aresixteen glass manufacturers in this area.Sm̊aland is located to the south-west of Stockholm. It iscalled “The Kingdom of Glass”. The reason is that there aresixteen glass manufacturers in this area.

    Remplacement de conjonction

    Note down the number. Otherwise, you may forget it.Note down the number. If not, you may forget it.

    94/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Extra-clausale :phrases clivées/non clivées :

    It was his best suit that John wore to the dance last night.John wore his best suit to the dance last night.

    changement tête/expansion :

    The conference venue is the building whose roof is red.The conference venue is the building with red roof.

    déplacement de la négation :

    Your application is canceled if you do not reply.Your application is not canceled if you reply.

    Phrases imbriquées ou coordonnées, réordonnancements, etc.

    95/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Syntaxiqueinversion :

    If I had money enough,...Had I money enough,..

    déplacement d’adverbes :

    She can speak English fluently.She can fluently speak English.

    paraphrase de la négation :

    He drank nothing but famous spirits.All he drank were famous spirits.

    ...

    96/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Lexicale :nom/adjectif :

    There’s a risk of receiving a severe wound.There’s a possibility of receiving serious injure.

    verbe/GV :

    Emma burst into tears and he tried to comfort her.Emma cried, and he tried to console her.

    grand GV :

    Real Sociedad snapped a two-game losing streak.Real Sociedad got points for the first time in three games.

    97/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Morpho-syntaxique (Levin, 1993) :passif/actif :

    The riddle is solved by him.He solved the riddle.

    changement de locatif :John smeared paint on the wall.John smeared the wall with paint.

    changement de réciproque :The car collided with the bicycle.The car and the bicycle collided.

    changement de datif :Bill sold a car to Tom.Bill sold Tom a car.

    changement de source :The well gushed oil.Oil gushed from the well.

    transitivité/implication :Janet broke the cup.The cup broke.

    98/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Morpho-syntaxique :construction avec un verbe support, Nom/Verb, Adj/Adv :

    Employment showed a sharp decrease.Employment decreased sharply.

    Adj/Verbe :

    I visited a priest in the old temple.I visited a priest in the olden(ed) temple.

    Adj/Nom :

    I feel drowsy.I have a drowsiness.

    99/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Morpho-syntaxique (alternances structurelles) :déplacement de la tête (GN), Nom/Verbe

    We need an improvement of recycling system.We need an improved recycling system.

    déplacement de la tête (GV), Verbe/Adv, Nom/Verbe

    He hurried to check it.He checked it in a hurry.

    déplacement du quantifieur

    We performed two transactions in this morning.We performed transactions twice in this morning.

    100/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Fujita, 2010)

    Pour plusieurs variations

    besoin de ressources sémantiques (FrameNet, VerbNet...)

    101/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    Classification selon les modifications linguistiques

    Proposer une description linguistique

    plutôt qu’une classification longue, grossièreet incomplète

    2 niveaux

    9 types de paraphrases

    5 classes

    Une paraphrase peut concerner plusieurs types :

    said / toldlexique et syntaxe

    102/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    paraphrase

    syntaxique

    sémantique

    discursive

    morphologique

    lexicale

    antonymescomplémentaires

    converses

    synonymes

    synthétiques/analytiques

    suppressions

    dérivation

    flexion

    103/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    Changements basés sur le lexique :

    substitution avec la même polarité (synonymes) :

    substitutions exactes/approximativesGoogle bought YouTube./Google acquired YouTubeThey were 9./They were around 10.substitutions inducteur/agent induitThe pilot took off despite the stormy weather./The plane tookoff despite the stormy weather.

    substitution avec la polarité opposée (antonymes,complémentaires, converses) :

    antonymie plus la négationI am leaving./I am not staying.compensation par l’antonymie d’autres changementsOnly 20% of the participants arrived on time./Most of theparticipants arrived lateinversion d’argument et substitution conversiveGoogle bought YouTube./YouTube was sold to Google.

    104/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    Changements basés sur le lexique :

    la suppression consiste en substitution d’un segment de textepar rienles suppressions peuvent être lexicales, non-lexicales ousemilexicales :

    I like eating chocolate./I like chocolate.Actually, you shouldn’t be here./You shouldn’t be here

    substitutions synthétiques/analytiques : unités simples par lesunités complexes :

    ajout d’un verbe supportSteven attempted to stop playing Hearts./Steven made anattempt to stop playing Heartsajout de spécificationIdeas is all I need to write an article./A sequence of ideas is allI need to write an article.expressions composéesI prefer wildlife television documentaries./I prefer televisiondocumentaries about wildlife105/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    Changements basés sur la morphologie :

    réorganization syntaxique, alternations de la diathèseFlexion :

    In 1492 Columbus reached America.In 1492 Columbus reaches America.

    Dérivation :

    I know that Olds founded GM.I know about the foundation of GM by Olds.

    106/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    Changements basés sur la syntaxe :

    réorganization syntaxique, alternations de la diathèse

    active/passive :John loves Mary.Mary is loved by John.transitivitéThe laundry sways in the breeze./The breeze makes thelaundry sways.positionsThe section chief filled Japanese sake into the cup./Thesection chief filled the cup with Japanese sake

    107/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    Changements basés sur la sémantique :

    même sens, lexicalisations différentes :

    Bill flew across the ocean.Bill crossed the ocean by plane.The increase of prices accompanies the crise.The prices increase with the crise.Barbara excels at teaching.Barbara teaches well.

    108/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    Changements basés sur le discours :

    changement de la structure de la phrase

    un grand éventail de réorganisations :mots grammaticaux :

    He wanted to eat nothing but apples.All he wanted to eat were apples.

    suppression de la relative :

    Joe wants the blazer which was designed by BMW.Joe wants the blazer designed by BMW.

    segmentation/combinaison de phrases :

    He is willing to leave. This made Gillian upset.His willingness to leave made Gillian upset.

    109/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Vila et al., 2011)

    Typologie relativement simple et opérationnelle

    Pas d’inférences contextuelles

    Typologie linguistique

    110/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    paraphrase

    changement de modalitéchangement d’aspect

    changement de temps

    substitution verbe−préposition/nom

    conversion verbe/adverbe

    conversion verbe/adjectif

    conversion verbe/nom

    substitution de synonymessubstitution d’antonymes

    substitution de converses

    changement de personne

    changement de voix

    substitution de pronom/co−référent

    répétition/ellipse

    variations des mots grammaticaux

    substitution générique/spécifique

    substitution de métaphore

    substitution partie/tout

    implication sémantique

    connaissances externes

    équivalence numérique approximative

    substitution agent/action

    substitution manipulateur/engin ou instrument

    substitution verbe/nom d’agent, de patient ou d’instrument

    111/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    Substitution de synonymes :

    synonymes appropriés au contexte, génitifs (’s/of/of the...),plésionymes,Google bought YouTube./Google acquired YouTube.Chris is slim./Chris is slender./Chris is skinny.

    Substitution d’antonymes :

    antonyme accompagné par la négation ou un autre élément denégationla substitution peut être accompanée par ajout/suppression demots grammaticaux :Pat ate./Pat did not starve.

    Substitution de converses :

    converse, qui inverse les relations entre les constituantsla substitution peut être accompagnée par ajout/suppressionde mots grammaticaux et la restructuration de la phrase :Google bought YouTube./YouTube was sold to Google.

    112/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    Changement de voix :

    voix active / voix passive ou le contrairela substitution peut être accompagnée par ajout/suppressionde mots grammaticaux et la restructuration de la phrasela paraphrase a souvent un sens plus réduit :Pat loves Chris./Chris is loved by Pat.

    Changement de personne :

    personne grammaticalela substitution peut être accompagnée par ajout/suppressionde mots grammaticaux et la restructuration de la phrase :Pat said, “I like football.”/Pat said that he liked football.

    Substitution de pronom/co-référent :

    substitution d’un pronoun par un groupe nominalla paraphrase a souvent un sens plus réduit :Pat likes Chris, because she is smart./Pat likes Chris, becauseChris is smart.

    113/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    Répétition/ellipse :ellipses ou les constructions elliptiquesla paraphrase a souvent un sens plus réduit :Pat can run fast and Chris can run fast, too./Pat can run fastand Chris can, too.

    Variations des mots grammaticaux :changement de mots grammaticaux sans changement de lasémantiquecela implique le remplacement, la suppression ou l’ajout deverbes, de prépositions ou de déterminants :Results of the competition have been declared./Results for thecompetition have been declared.Pat showed a nice demo./Pat’s demo was nice.

    Substitution agent/action :replacement du nom d’agent par le nom d’action et le contrairela substitution peut être accompagnée par ajout/suppressionde mots grammaticaux :I dislike rash drivers./I dislike rash driving.

    114/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    Substitution verbe/nom d’agent, de patient ou d’instrument :

    la substitution peut être accompagnée par ajout/suppressionde mots grammaticaux et la restructuration de la phrasePat teaches Chris./Pat is Chris’s teacher.Pat teaches Chris./Chris is Pat’s student.Pat tiled his bathroom floor./Pat installed tiles on hisbathroom floor.

    Substitution manipulateur/engin ou instrument :

    la substitution peut être accompagnée par ajout/suppressionde mots grammaticaux :The pilot took off despite the stormy weather./The plane tookoff despite the stormy weather.

    115/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    Substitution générique/spécifique :substitution hyperonyme/hyponyme en fait partiesouvent génère des quasi-paraphrases :I dislike rash drivers./I dislike rash motorists.Pat is flying in this weekend./Pat is flying in this Saturday.

    Substitution de métaphore :replacement de noms par sa métaphore, et le contrairela substitution peut être accompagnée par ajout/suppressionde mots grammaticaux :I had to drive through fog today./I had to drive througha wall of fog today.Immigrants have used this network to send cash./Immigrantshave used this network to send stashes of cash.

    Substitution partie/tout :la substitution peut être accompagnée par ajout/suppressionde mots grammaticaux :American airplanes pounded the Taliban defenses./Americanairforce pounded the Taliban defenses.

    116/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    Les substitutions peuvent être accompagnées parajout/suppression de mots grammaticaux et la restructurationde la phrase

    Conversion verbe/nom :

    The police interrogated the suspects./The police subjected thesuspects to an interrogation.The virus spread over two weeks./Two weeks saw a spreadingof the virus.

    Conversion verbe/adjectif :

    Pat loves Chris./Chris is lovable to Pat.

    Conversion verbe/adverbe :

    Pat boasted about his work./Pat spoke boastfully about hiswork.

    Conversion nom/adjectif :

    I’ll fly by the end of June./I’ll fly late June.117/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    Les substitutions peuvent être accompagnées parajout/suppression de mots grammaticaux et la restructurationde la phraseSubstitution verbe-préposition/nom :

    The finalists will play in Giants stadium./Giants stadium willbe the playground for the finalists.

    Changement de temps :peut générer des quasi-paraphrasespeut être sémantiquement moins précis :Pat loved Chris./Pat loves Chris.

    Changement d’aspect :Pat is flying in today./Pat flies in today.

    Changement de modalité :peut générer des quasi-paraphrasespeut être sémantiquement moins précis :Google must buy YouTube./Google bought YouTube.The government wants to boost the economy./Thegovernment hopes to boost the economy.118/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Classifications de la paraphrase(Bhagat & Hovy, 2013)

    Implication sémantique :peut générer des quasi-paraphrases :Google is in talks to buy YouTube./Google bought YouTube.The Marines are fighting the terrorists./The Marines areeliminating the terrorists.

    Équivalence numérique approximative :peut générer des quasi-paraphrases :At least 23 U.S. soldiers were killed in Iraq lastmonth./About 25 U.S. soldiers were killed in Iraq last month.Disneyland is 32 miles from here./Disneyland isaround 30 minutes from here.

    Connaissances externes :peut générer des quasi-paraphrases :We must work hard to win this election./The Democrats mustwork hard to win this election.The government declared victory in Iraq./Bush declared victoryin Iraq.

    119/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Relations impliquées dans la paraphrase

    La relation de paraphrase est établie entre deux séquenceschaque fois qu’un sujet parlant produit ou reconnâıt Ycomme une reformulation paraphrastique de X .

    En fonction de la sensibilité du locuteur et des données :

    équivalenceidentificationapproximationspécification, ajoutsous-spécification/généralisation, suppression...

    120/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Approches linguistiques de la paraphrase

    1 Niveau de langue :

    syntaxique, sémantique, discursif et énonciatif

    2 Taille d’unités couvertes par la paraphrase

    lexicale, sous-phrastique, phrastique

    3 Types de transformations :

    sémantique, syntaxique, lexico-syntaxique

    4 Registre de langue :

    spécialisé, non spécialisésoutenu, parlé...

    5 Langue :

    traductions

    121/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Types de données pour étudier la paraphrase

    Données étudiées :

    doivent être évocateurs ou indicateurs de la paraphrase

    Critères de jugement sur la paraphrase

    122/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Types de données pour étudier la paraphrase

    Intuition du linguiste

    Interrogation de locuteurs

    Exploitation de dictionnaires, thesaurus

    Règles de mise en relation

    Étude de corpus

    123/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Types de données pour étudier la paraphrase

    Intuition du linguisteInterrogation de locuteurs

    Exploitation de dictionnaires, thesaurus...

    Règles de mise en relationÉtude de corpus

    124/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Intuition du linguiste

    Données obtenues suite à une construction théorique

    Introspection : se demander si

    deux phrases sont, ou non, des paraphrasesconstruire des paraphrases d’une phrase de départ

    Critiques :

    données réelles : enquêtes auprès des locuteursconsensus : ... La question est de savoir si ces relations établiespar les linguistes sont, ou non, représentatives des locuteursnatifs. (Prideaux & Baker, 1974)

    125/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Interrogation de locuteurs

    Données obtenues suite à l’étude des cas concrets

    Interrogation des locuteurs :

    existe-t-il une relation de paraphrase ?variation syntaxique

    Il est courant que les personnes interrogées ne s’accordent pasentre elles...

    Difficulté :

    types de questions posées aux locuteursnombre de locuteurs interrogésanalyser les jugements des locuteurs

    acceptabilité et ambigüıtécertains locuteurs sont rigides, d’autres plus laxistes... (Smaby,1971)

    ... on rencontre la diversité des réactions des locuteurs d’unemême langue, on se heurte au caractère irréductiblementsubjectif de ces réactions. (Fuchs, 1982)

    126/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Interrogation de locuteurs

    Questions posées aux locuteurs :

    Procédure analytique :

    interpréter (reconnâıtre) les séquencessont-elles décodées comme paraphrastiques ou non ?logiquecourant générativisteaffirmation/infirmation

    Procédure synthétique

    produire des séquences paraphrasant une séquence donnéerhétoriqueapproches discursivesobtention de nouvelles données

    127/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Interrogation de locuteurs

    Questions posées aux locuteurs :

    Question explicite

    production ou identification de paraphrases avec conservationdu sensintrospectionquestionnement direct

    ces séquences ont-elles le même sens, ou pas ?classez les séquences selon une échelle de plus ou moinsgrande proximité sémantique

    Question implicite

    production ou identification de paraphrases sans avoirconscience de le fairecommentaires d’images, d’une situation formelle...substituabilité :

    pouvez-vous remplacer cette séquence par une autre, dans lecontexte donné, sans changer le sens ?

    128/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Interrogation de locuteurs

    Rôle des locuteurs

    Distinguer ce qui :

    dépend du système langagierrelève des locuteurs

    129/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Exploitation de dictionnaires

    Section synonymie dans les dictionnaires traditionnels

    Ressources électroniques de synonymes récentes :WordNet (Fellbaum, 1998)

    02526085 : achieve, accomplish, attain, reach05793554 : basis, base, cornerstone, foundation, ...

    VerbNetVerbOcean...

    Ressources électroniques avec d’autres relations :CELEX (Burnage, 1990) : relations morphologiques

    anglais, allemand, néerlandais

    130/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relation

    Test de substitution

    Question sous-jacente

    Règles de ré-écriture

    Variation morpho-syntaxique

    Faster

    Compositionnalité

    Analyse morphologique

    131/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relation

    Règles souvent établies manuellement

    plus ou moins génériques

    Orientées sur la théorie, le matériel...

    Orientées sur les types de relations à établir

    132/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationTest de substitution

    Si deux phrases ou syntagmes sont synonymes :

    ils doivent être substituables dans au moins quelques contextessans changer la signification du texte

    133/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationQuestion sous-jacente

    (Milicevic, 2007)

    Si deux phrases sont synonymes :

    étant donné une question sous-jacenteelles doivent y répondre toutes les deux

    Phrases déclaratives1 Baudelaire aimait les chats.2 L’auteur des “ Fleurs du mal ” aimait les chats.3 Google is in talks to buy YouTube.4 Google bought YouTube.5 The Marines are fighting the terrorists.6 The Marines are eliminating the terrorists.

    134/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationRègles de ré-écriture (Harris, 1976)

    Det N1 V Det N2

    Det N2 Vaux Vppe Det Prep N1

    135/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationRègles de ré-écriture (Harris, 1976)

    Det N1 V Det N2

    Det N2 Vaux Vppe Det Prep N1

    Le chat mange la souris

    La souris est mangée par le chat

    136/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationRègles de ré-écriture (Harris, 1976)

    Det N1 V Det N2

    Det N2 Vaux Vppe Det Prep N1

    Le chat mange la souris

    La souris est mangée par le chat

    Il neige en hiver. / En hiver, il neige.

    137/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationVariation morpho-syntaxique

    Variation morpho-syntaxique :

    souvent étudiée en relation avec les terminologies et les termes{sténose aortique, sténose de l’aorte}

    Connaissances requises :

    ressources morphologiquesrègles de transformations spécifiques

    138/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationFaster (Jacquemin, 1999)

    Recherche de termes et de leurs variantes morpho-syntaxiques :

    Analyseur syntaxique robuste

    Reconnaissance en corpus de termes contrôlés

    =⇒ Identification de variantes de termesUn ensemble élaboré de métarègles :

    pour le repérage de différents types de variation

    Grammaire Syntagmatique Généralisée (HPSG) :

    avec unification des structures de traits

    139/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationFaster (Jacquemin, 1999)

    Types de variantes morpho-syntaxiques :

    Variantes syntaxiques :

    mesure de volume et de fluxvariante de coordination de mesure de flux

    Variantes morpho-syntaxiques :

    flux de sève mesurés, mesure quotidiennement le fluxvariantes verbales de mesure de flux

    ⇐= relation morphologique entre mesure/NOM et mesurer/VERVariantes sémantico-syntaxiques :

    évaluation du fluxvariante sémantico-syntaxique de mesure de flux⇐= proximité sémantique entre mesure et évaluation

    140/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationFaster (Jacquemin, 1999)

    Outil d’indexation automatique contrôlée

    Acquisition massive de candidats termes n’est pas son objectifpremier

    Une première liste de termes disponible

    Exploitation de cette liste pour reconnâıtre des variantes determes :

    enrichissement de la liste

    141/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationCompositionnalité (Hamon et al., 1998)

    Relations de synonymie entre termes complexes

    Principe de compositionnalité

    Hypothèse de la propagation compositionnelle de relations desynonymie

    Deux termes complexes sont considérés comme synonymes sileurs composants sont identiques ou synonymes

    Ressources lexicales existantes :

    thesaurus, dictionnaires de langue générale

    142/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationCompositionnalité (Hamon et al., 1998)

    Types de substitutions :

    Variation sur l’expansion :

    les têtes sont identiques et les expansions sontsynonymesaction de protection / action de sauvegarde

    Variation sur la tête :

    les têtes sont synonymes et les expansions sontidentiquescapacité faible / puissance faible

    Variation sur la tête et l’expansion :

    les têtes sont synonymes et les expansions sontsynonymesclassement d’équipement / classification dematériel

    143/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationCompositionnalité (Hamon et al., 1998)

    Relation voir de Le petit Robert

    calibre / qualité, bon / beau

    Relation de synonymie entre les termes complexes

    bon calibre et belle qualité(variation sur la tête et l’expansion)

    Relation pertinente dans le domaine de la médecinecardiovasculaire

    144/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationAnalyse morphologique

    Termes et mots médicaux ont souvent une morphologie richemyocardial, acrodynie, cholecystectomie

    Cause principale de l’opacité sémantique des termes

    Exploiter cette caractéristique pour expliciter les termes

    Recherche automatique de paraphrase au niveaumorphologique

    myocarde/heart muscle

    Objectifs : aide à la lecture, simplification

    Hypothèse : les messages de forum contiennent les élémentsnécessaires

    Les explicitations pourraient être plus faciles que les termes

    145/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationAnalyse morphologique

    Termes/mots médicaux simples :

    anatomie (616 termes),anormalités et pathologies (2 283 termes)procédures (1 271 terms)

    Corpus :

    forum Les diabétiques :839 fils de discussion, 6 982 messages, 624 571 motsforum Diabetes Doctissimo :22 532 fils de discussion, 560 066 messages, 35 059 868 mots

    Ressources linguistiques :

    synonymes (Le Robert)relations associatives (ressources distributionnelles)

    FreDist (Anguiano et al., 2011)Les voisins de Le Monde (Bourigault et al., 2002)Les voisins de Wikipédia

    146/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationAnalyse morphologique

    TreeTagger : étiquetage morpho-syntaxique (Schmid, 1994)est VER :pres êtreantiinflammatoire PRO :POS antiinflammatoire

    FLEMM : lemmatiseur et correcteur morphologique (Namer,2000)

    est VER(pres) :3p :s :pst :ind être :3gantiinflammatoire NOM : :s antiinflammatoire

    DériF : analyseur morpho-semantique (Namer, 2003)

    angioblastique/ADJ[ [ angi N* ] [ blast N* ] ique ADJ ](angioblastique/ADJ, [angi,N*] :blast/N*)Qui est en relation avec cellule embryonnaire et vaisseau

    Reformulation en français :

    angi → artèreblast → cellule embryonnaire

    147/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationAnalyse morphologique

    1 Mapping direct :

    mots français, qui correspondent à la reformulation, sontrecherchéssi une phrase contient tous les mots : la phrase est retenue

    2 Mapping indirect :

    mots français sont enrichis avec les ressources linguistiqueschaque mot et son cluster sont recherchéssi une phrase contient un mot de chaque cluster : la phrase estretenue

    148/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationAnalyse morphologique

    Recherche de paraphrases :

    La présence du terme n’est pas indispensable

    Terms composés uniquement

    GN, GV

    Difficulté liée à la segmentation en phrases

    Liens syntaxiques et sémantiques entre les composants

    149/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationAnalyse morphologique

    Mapping direct :

    dorsalgie : douleur dans le dos

    myélocyte : cellules dans la moelle osseuse

    lombalgie : douleurs dans les reins

    glycohémoglobine : quantité de sucre par litre de sang

    gastralgie : douleurs à l’estomac

    desmorrhexie : rupture des ligaments

    hépatite : inflammation du foie

    ...

    150/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationAnalyse morphologique

    Mapping indirect :

    spondylopathie : les vertèbres ont été touchées

    néphropathie : avoir mal aux reins

    cardialgie : problèmes du coeur

    151/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Règles de mise en relationAnalyse morphologique

    Comparaison entre les méthodes :

    Définitions et gloses sont complémentaires

    Comparaison avec Dérif :corpus : moins exhaustif et moins opaque (les thématiques, lataille... des corpus)Dérif : plus exhaustif et plus opaque (règles très générales pourla génération de gloses)myélocyte

    (Partie de – Type particulier de) cellule en rapport avec le(s)moellecellules dans la moelle osseuse

    desmorrhexierupture (du – liée au) ligamentrupture des ligaments

    glycohémoglobine(Partie de – Type particulier de) hémoglobine en rapport avecle(s) sucrequantité de sucre par litre de sang

    152/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Étude de corpus

    Corpus monolingues

    Corpus monolingues parallèles

    Corpus bilingues parallèles

    Corpus comparables

    153/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Étude de corpus

    Données obtenues suite au dépouillement de corpus

    Données source :

    ouvrages, littérature scientifiquesites webpresses

    Matériel : étude possible de phénomènes différents

    Difficulté :

    détecter et extraire la paraphrase

    154/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Étude de corpusCorpus monolingues

    Corpus tout-venant

    Indicateurs intra-corpus :

    approches distributionnelles

    Marqueurs de paraphrasage :

    définitionsreformulationsdiscursives (genre...)

    Connaissances externes :

    ressources linguistiques et sémantiques

    155/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Étude de corpusApproches distributionnelles

    Issues des travaux de travaux de (Harris, 1968)

    Mots similaires apparaissent dans des contextes similaires

    Approche paradigmatique

    156/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Étude de corpusApproches distributionnelles

    Classes de mots/termes

    Sens des unités lexicales⇐= rapprochement contextuelRelations de dépendance syntaxiqueobjet de, sujet de, etc.

    Indices lexicaux

    Différents types de relations

    Similarité sémantique entre les classes

    large : small, important, major, great, various, main, different,field, newpatient : case, group, child, day, treatment, woman

    157/213 Natalia Grabar

  • Introduction Approches et Classifications Données Notions proches Ailleurs

    Étude de corpusApproches distributionnelles

    (Grefenstette, 1994)

    Typage manuel